Entrepôts de données vs data marts

Infographie

La différence entre les entrepôts de données et les data marts, également appelés magasins de données, réside dans la comparaison entre une base de données qui comporte des données intégrées et des données cloisonnées en silos. Consultez notre infographie pour en savoir plus sur ce qui les différencie et découvrez pourquoi Teradata recommande la mise en place d'un écosystème unifié afin de stocker et d'analyser les données. 

Les entrepôts de données vs les magasins de données

Quelle est la différence entre un entrepôt de données et un data mart ?

Un entrepôt de données est à la fois un modèle de structure et une architecture pour des données partagées et détaillées. Il permet d'envoyer des données depuis des centaines de sources et d’applications concernant n'importe quel sujet vers une plateforme de données, où les données sont intégrées et partagées avec tous les utilisateurs.

Un data mart est un référentiel de données qui se concentre sur un seul domaine. Il s'agit également d'un sous-ensemble d'entrepôt de données qui n'est utilisé que par un nombre restreint d'utilisateurs. Les data marts ne permettent d'accéder qu'à une partie de l'ensemble des données contenues dans un entrepôt de données.  

data warehouse vs data mart comparison infographic

Quelles sont les données auxquelles l'entrepôt de données permet d'accéder, contrairement aux magasins ?

Un seul écosystème d’entrepôt de données, intégré et connecté qui rassemble toutes les données, quel que soit le domaine. Les utilisateurs ont ainsi accès à une seule source de vérité unique.

Un magasin de données par domaine. Cela peut conduire à la formation de silos de données, et chacun d'entre eux n'est utile qu'à un petit groupe d’utilisateurs.

C'est ce qui fait la différence entre 1 000 silos de données et un entrepôt de données comportant les mêmes informations.

Combien de tables de données comportent-ils en moyenne  ?

> 4 000 tables pour un entrepôt de données

< 20 tables pour un data mart

Quelle quantité de données peuvent-ils stocker ?

> 100 Go pour l'entrepôt de données

< 100 Go pour le data mart 

Quelles sont les implications pour les utilisateurs métier et le service informatique ?

Les entrepôts de données rassemblent toutes les données, qui sont nettoyées, gérées, intégrées et gouvernées afin d'obtenir une image complète de l’entreprise.

Les data marts créent des silos, ce qui résulte dans l'augmentation des coûts, de la complexité et des déplacements de données. Les data marts stockent souvent des doublons de données redondantes, ce qui entraîne une « dérive des données », c'est à dire des changements inattendus dans les données qui empêchent les processus de fonctionner.

Les recommandations de Teradata

Teradata préconise de transformer les données pour en faire le principal atout de l'entreprise. Cela nécessite l'élimination des cloisons et des silos, afin d'agréger toutes les données pour pouvoir les analyser.

Teradata recommande d'utiliser une plateforme de données multi-cloud connectée et dédiée à l’analyse de données d’entreprise qui unifie les data lakes, les data marts, les entrepôts de données, l'analyse, les nouvelles sources et les nouveaux types de données. Cette plateforme rend les données accessibles et exploitables, ce qui permet à tous les utilisateurs, quel que soit le département dont ils dépendent, de poser n’importe quelle question à tout moment sur n’importe quelle donnée.