Qu’est-ce qu’Apache Hive ?

Apache Hive est une infrastructure d’entrepôt de données open source qui fournit des outils permettant de synthétiser, d'interroger et d’analyser les données. Elle est spécifiquement conçue pour permettre l’analyse d'ensembles de données volumineux stockés dans des fichiers Hadoop et des systèmes de fichiers compatibles, tels qu’Amazon S3. Hive a été initialement développée par des ingénieurs de données chez Facebook en 2008, mais elle est désormais exploitée par de nombreuses autres entreprises.