Qu’est-ce que la gravité des données ?

La gravité des données naît de l'augmentation de la quantité et du nombre d'utilisations des données au sein d'un référentiel. À un moment donné, le processus de copie ou de migration de ces données devient coûteux en ressources et en argent. Les données ont tendance à attirer des services, des applications et d’autres données au sein du référentiel où elles sont contenues. Les principaux exemples de gravité des données sont les entrepôts de données et les data lakes. Les données de ces systèmes possèdent une force d'inertie. Les volumes de données évolutifs brisent souvent l’infrastructure et les processus existants, ce qui nécessite de trouver des solutions risquées et coûteuses. Ainsi, les meilleures pratiques en matière de conception consistent à déplacer le traitement vers les données, et non l’inverse.

La gravité des données impacte des entrepôts de données contenant des téraoctets et des pétaoctets de données depuis de nombreuses années. C’est l’une des raisons pour lesquelles il est nécessaire de traiter le Big Data de manière parallèle et évolutive. Ce principe s'applique désormais également aux data lakes, qui offrent différents cas d’usage. Teradata aide ses clients à gérer la gravité de leurs données.