Aperçu
Les avantages et inconvénients d'un environnement sur site ou dans le cloud
Les environnements sur site et dans le cloud possèdent leurs propres inconvénients, mais des solutions hybrides commencent à etre mises en place par de nombreuses entreprises.
De l’analyse sur site à l’analyse dans le cloud
Même dans des secteurs comme celui de la fabrication de semi-conducteurs qui a été relativement lent à adopter une solution cloud pour l’analyse de données, les tendances du cloud remodèlent les architectures de données. La dépendance traditionnelle aux entrepôts de données sur site cède progressivement la place aux infrastructures cloud et aux architectures hybrides, qui combinent les ressources des datacenters d’entreprise sur site avec les services du cloud public.
Selon un article publié en 2021 par Semiconductor Engineeringes, les entreprises se tournent vers l’analyse dans le cloud pour faire face à la croissance exponentielle des volumes de données, ainsi qu'à la complexité croissante des types de données et des opérations le long des chaînes d’approvisionnement. Dans le même temps, les options sur site ne disparaissent pas complètement pour ces entreprises et leurs homologues, en raison de considérations concernant :
- Tarification de la puissance de calcul et du stockage dans le cloud à la demande
- Fiabilité et performances des données pour les connexions cloud
- Sécurité et contrôle des données propriétaires de l’entreprise
Cette situation met en évidence la question plus générale de la comparaison entre les architectures sur site et dans le cloud, ainsi que le moment opportun et les raisons liées à leur adoption. Bien qu'il soit courant de présenter la question comme une situation de type "sur site ou dans le cloud", en réalité, de nombreuses entreprises ont besoin des deux architectures ou peuvent au moins en tirer des avantages.
Les principales différences entre l'analyse sur site et dans le cloud
Un environnement sur site est une configuration à locataire unique, supportée par du matériel spécialisé tel que Teradata IntelliFlex ou l'infrastructure du datacenter existante de l'entreprise. Il est situé sur un site physique, d'où son nom. Les machines virtuelles VMWare peuvent également servir de base à l'exécution d'applications sur site.
Le cloud public est un modèle de service cloud par lequel un fournisseur de cloud partage une combinaison d’infrastructure, de plateformes et d’applications avec plusieurs entreprises sur un réseau. Les ressources du datacenter du fournisseur sont partitionnées par client et chacun d'entre eux doit souscrire un abonnement ou payer pour pouvoir utiliser ces services en fonction de sa consommation.
Un ou plusieurs services de cloud public peuvent être connectés à une plateforme de données à locataire unique qui s'exécute au sein de l’environnement d’un client. La combinaison de ces clouds publics avec une infrastructure sur site donne naissance à un cloud hybride.
Au-delà de ces distinctions de base en matière d’emplacement et de responsabilité de déploiement, le cloud et l'environnement sur site diffèrent de manière plus spécifique :
Coûts
- Sur site : La plupart des coûts sur site proviennent de l’achat, de la gestion et de la maintenance de l’infrastructure de datacenter, qui peut prendre la forme d'un serveur ou d'un entrepôt de données sur site. Les dépenses en capital, en particulier pour le matériel, sont plus conséquentes.
- Cloud : Les coûts du cloud, du moins pour l’entreposage de données, proviennent principalement des abonnements. La capacité du serveur cloud peut être réservée à l’avance auprès du fournisseur de cloud. Les dépenses liées à l'exploitation sont plus importantes.
Performances
- Sur site : Parce qu’elle est physiquement proche des sources de données et des architectures de données d’une entreprise, l’infrastructure locale peut avoir une faible latence, en supposant qu’elle soit bien entretenue, correctement dimensionnée et mise à jour régulièrement.
- Cloud : Les fournisseurs d’infrastructure cloud offrent un accès à des ressources pratiquement illimitées, qui fournissent les performances nécessaires à l’analyse de données avancée lorsqu’elles sont associées à une plateforme de données moderne.
Évolutivité et élasticité
- Sur site : La mise à l’échelle d'un environnement sur site implique l'ajout d'une infrastructure physique ou virtuelle supplémentaire, souvent pour un coût considérable et sans possibilité de faire correspondre étroitement la capacité aux besoins réels (on assiste souvent à des cas de surapprovisionnement).
- Cloud : Les clouds publics facilitent l’évolutivité à mesure que les exigences en matière de charges de travail analytiques évoluent. Les clouds offrent également une élasticité,c’est-à-dire l’adaptabilité rapide d’un tel dimensionnement des ressources pour les charges de travail dynamiques.
Sécurité
- Sur site: La sécurisation d’un datacenter sur site relève de la seule responsabilité de l’entreprise. Cette dernière garde un contrôle total sur les pratiques et les outils de sécurité, avec tous les avantages et les inconvénients qui en découlent.
- Cloud: La sécurité du cloud est une responsabilité partagée entre le fournisseur de services et le client. Le premier supervise les différentes couches de la pile de sécurité en fonction du type de service cloud utilisé (IaaS, SaaS, etc.), le reste étant du ressort du client. La sécurité des données se situe toujours dans cette dernière catégorie.
Fonctionnement
- Sur site : L’entreprise contrôle le fonctionnement de son environnement sur site, ainsi que sa feuille de route à long terme, principalement au niveau du matériel. Elle achète et entretient l’infrastructure pour prendre en charge les niveaux de performance souhaités, les besoins en matière de stockage, les architectures de données spécifiques (entrepôt de données, data lakes, etc.) utilisées, ainsi que toutes les requêtes et tous les chargements de données.
- Cloud : Les fournisseurs de services cloud (CSP) et les éditeurs de logiciels indépendants (ISV) offrent un ensemble de services logiciels en constante évolution pour le stockage, le traitement et la mise à l’échelle des données d’entreprise. Les innovations en matière d’IA et de machine learning fournies dans le cloud, en particulier, sont des capacités importantes pour les charges de travail analytiques avancées et peuvent être combinées avec des offres de services cloud. Dans l’ensemble, le rythme de l’innovation et de la disponibilité est beaucoup plus rapide dans le cloud que sur site.
Les avantages et les inconvénients de l’analyse sur site par rapport à l’analyse dans le cloud
Ces différences clés entre les ressources sur site et dans le cloud ne favorisent pas nécessairement une option par rapport à l’autre. Le choix idéal dépend des exigences spécifiques de l’entreprise et pourrait même résulter en une combinaison des deux.
Même si le cloud reste une solution d'avenir, l’analyse sur site a toujours un rôle à jouer dans certaines situations, par exemple lorsque le cloud ne propose pas une combinaison optimale de coûts et de performances pour une charge de travail donnée, ou lorsque les investissements existants doivent être optimisés. Les avantages et les inconvénients les plus importants à prendre en compte pour décider où exécuter les charges de travail d’analyse sont les suivants :
Avantages sur site
- Performances locales impliquant une faible latence
- Contrôle total de la pile technologique
- Accès physique à l’infrastructure
- Préservation des actifs du datacenter
Inconvénients sur site
- Coûts matériels et amortissement élevés
- Élasticité relativement limitée
- L’entreprise a l’entière responsabilité des failles et des incidents de sécurité
- Accès réduit aux capacités d’analyse de pointe
- Complications liées à la fin du support et au remplacement matériel
Résumé et cas d’usage sur site
Les implémentations d’analyse de données sur site étaient jusqu'ici la norme dans de nombreuses entreprises. Elles s’appuient sur sa combinaison de vitesse, de contrôle et de familiarité avec les outils pour charger et interroger les données métier.
L’analyse sur site peut également être intégrée dans une architecture de cloud hybride qui utilise des ressources de cloud public pour l’éclatement ou pour des utilisations spécifiques telles que la reprise après sinistre. Les charges de travail qui dépendent des performances peuvent être mieux adaptées aux déploiements sur site et dans le cloud hybride qu’aux entrepôts de données dans le cloud uniquement.
Les raisons de migrer loin des architectures sur site incluent les coûts croissants du matériel nécessaire, ainsi que des fonctionnalités obsolètes et des problèles liés à son évolutivité et son élasticité.
À titre d'exemple, Medibank, le fournisseur d’assurance privé australien, qui disposait d'un entrepôt de données vieillissant, a décidé de migrer vers une plateforme de données multi-cloud. L'entreprise est ainsi passé à une plateforme de données déployée sur un cloud public afin de pouvoir accéder aux données et en extraire des informations plus rapidement.
Avantages du cloud
- Evolutivité et élasticité importantes
- Modèle de tarification à la demande
- Le fournisseur est responsable de la disponibilité et de certains aspects de la sécurité
- Un ensemble de fonctionnalités qui se développe rapidement grâce aux innovations permises par l’IA ou le machine learning
Inconvénients du cloud
- Temps de latence excessive pour certaines charges de travail
- Tarification imprévisible en cas de facturation exclusivement à la demande
- Solution peu rentable pour les charges de travail peu variables ou une utilisation constante
- Les architectures hybrides nécessitent une compatibilité et une interopérabilité strictes
Cas d'usage du cloud
Les entrepôts de données cloud, les data lakes et les entrepôts de données sont devenus des options alteratives viables à l’infrastructure sur site. Ils offrent une élasticité supérieure, ainsi qu’un vatse ensemble croissant de capacités d’analyse avancée via le traitement de l’IA et du machine learning.
À mesure que les volumes de données augmentent et que la quantité de sources de données prolifère, les services cloud fournissent les vastes ressources et la flexibilité nécessaires pour permettre aux entrepises de s'adapter. Un rapport de 2021 mené par Seagate et IDC a révélé que la croissance des données d’entreprise devrait être supérieure à 40 % au cours des deux prochaines années, en grande partie grâce à des projets d’analyse de données.
Mais tirer le meilleur parti de l’analyse dans le cloud – et éviter les coûts excessifs liés à la tarification à la demande – nécessite une stratégie cohérente, soutenue par une plateforme de données moderne capable de se connecter à plusieurs clouds et à des ressources sur site selon les besoins. Les principales préoccupations des répondants à l'enquête menée par Seagate et IDC concernent la complexité liée à la gestion de ces différents environnements, qui représente un défi majeur pour les entreprises.
Pour la chaîne de restaurants Brinker, une plateforme multi-cloud connectée offrait la combinaison parfaite entre une faible latence et un accès facile et cohérent aux données qui manquaient à la fois à son environnement existant vieillissant et à son ancien entrepôt de données situé uniquement dans le cloud. L’entreprise a ainsi éliminé les silos et acquis la capacité d’exécuter et de faire évoluer tout type de charge de travail de manière fiable.
Connexion sur site et dans le cloud : considérations relatives au cloud hybride
Le cas de Brinker montre que, même si le débat « solution sur site ou dans le cloud » reste un une comparaison populaire et utile, « la solution sur site et dans le cloud » est très souvent adoptée. Un cloud hybride qui connecte des environnements sur site à un ou plusieurs clouds publics est souvent la solution la plus pratique pour les enreprises qui souhaitent protéger leurs investissements existants, minimiser la latence et avoir accès en permanence aux dernières innovations dans le cloud.
Le concept de gravité des données est l’un des principaux critères de ces environnements de cloud hybride qui s’efforcent de fournir le meilleur des deux mondes à partir des solutions sur site et dans le cloud. La gravité des données est l’idée que de grandes masses croissantes de données attireront inévitablement plus d’applications et de services, qu'il sera plus compliqué de migrer au fil du temps. Le transfert de composants d’un environnement à un autre lors de la mise en place d’un environnement cloud hybride nécessite donc une réflexion approfondie sur les points suivants :
- Les emplacements des clusters de gravité de données et les sources de données qu’ils englobent.
- Les frais de sortie de clouds potentiels associés à la migration de vastes quantités de données dans ces clusters.
- La latence induite par ces migration et si son degré d'acceptabilité pour le cas d’usage prévu.
- Le fait de savoir si les composants d’application d’un environnement fonctionneront dans un autre.
Le cloud hybride implique inévitablement la prise en compte de ces considérations complexes, mais le parcours peut toujours être simplifié grâce à une plateforme de données adaptée.
Comment analyser ses données efficacement sur n'importe quel environnement
Dans le cas de Medibank évoqué précédemment, le fait que Teradata Vantage offrait exactement le même logiciel sur site et dans le cloud a permis de rationaliser son projet de modernisation en matièr d’analyse de données. La migration a été facilement effectuée, sans qu’il soit nécessaire de recoder en profondeur les applications critiques.
Une plateforme de données moderne comme Vantage offre des options de déploiement flexibles qui fournissent les mêmes fonctionnalités avancées sur site ou dans un cloud public. Les fonctionnalités clés incluent l’ingestion de données depuis n’importe quelle source et sous n'importe quel format, une gestion sophistiquée des charges de travail et un accès aux données à l’échelle de l’entreprise en évitant la création de silos. Dans le cloud, elle propose également une tarification mixte (capacité réservée et à la demande, adaptée aux besoins et aux requêtes des clients) afin d’optimiser les coûts.
Qu'une entreprise cherche à migrer ses données sur site vers plusieurs clouds, à les connecter simplement à un seul cloud public ou à opérer un autre modèle de déploiement, Vantage est en mesure de l'aider dans ses démarches.
En savoir plus sur Vantage