Qu’est-ce que les données non structurées ?

Les données non structurées font référence à des informations non filtrées, sans principe d'organisation fixe, et sont souvent appelées « données brutes ». Les fichiers log, XML, JSON, les documents textuels, les images, ainsi que les fichiers vidéo et audio en sont des exemples courants. Les données non structurées font l'objet de recherches et d'analyses pour en extraire des informations utiles. Jusqu’à 80 % des données d’entreprise ne sont pas structurées, ce qui signifie que, pour de nombreuses personnes, il s’agit de la forme la plus visible du Big Data. La taille des données non structurées nécessite d'effectuer des analyses évolutives pour obtenir des informations. Les données non structurées se trouvent dans la plupart des data lakes, en raison de leur faible coût de stockage.

Les données non structurées ne sont pas forcément créatrices de valeur. Le fait d'extraire la valeur cachée de tels fichiers nécessite de disposer de compétences et d'outils solides. Il existe un mythe selon lequel les bases de données relationnelles sont incapables de traiter des données non structurées. L’architecture de données unifiée de Teradata englobe les données non structurées de plusieurs manières. Teradata Database et ses concurrents peuvent stocker et traiter les fichiers XML, JSON et Avro, ainsi que d’autres formes de données non structurées.