MapR redéfinit SQL-on-Hadoop avec Apache Drill

MapR Technologies, Inc., la première distribution pour Apache™ Hadoop®, annonce l’ajout d’Apache Drill 0.5 à la distribution MapR incluant Hadoop. En apportant la prochaine génération ANSI SQL à Hadoop, Apache Drill permet une exploration des données en libre-service et instantanée, à travers de multiples sources de données y compris les applications modernes.

Matt Aslett, directeur de recherche, de plateformes de données et d’analyses chez 451 Research souligne : « Les entreprises veulent garantir l’accès aux données stockées dans Hadoop et NoSQL à un ensemble plus large d’utilisateurs ayant déjà des compétences d’analyse SQL ». Il poursuit : « La capacité d’Apache Drill à garantir l’accès aux données dans Hadoop sans avoir besoin de schémas centralisés et aussi aux ensembles de données NoSQL avec des structures de données complexes y compris les champs imbriqués, le différentie des approches traditionnelles par rapport à SQL-on-Hadoop. ».

Apache Drill offre la flexibilité de lancer immédiatement une requête sur des données complexes en format natif comme les données sans schéma, les données imbriquées et les données ayant des schémas rapidement évolutifs avec un minimum d’implication du service informatique. Parce que les requêtes SQL peuvent être lancées directement sur différents formats de fichiers, les données peuvent être explorées immédiatement au fur et à mesure de leur arrivée, en comparaison avec les semaines qui doivent être passées d’habitude à préparer et à gérer les schémas et à installer les tâches ETL. De plus, Apache Drill est compatible avec ANSI SQL afin que les utilisateurs puissent appliquer leurs compétences en matière de SQL et profiter des investissements déjà faits en outils de business intelligence (BI).

John Schroeder, PDG et co-fondateur de MapR Technologies déclare : « La vision et l’innovation apportées au marché par la communauté Apache Drill, annoncent une nouvelle ère de l’exploration de données ». Il ajoute par ailleurs : « L’agilité consistant à lancer une requête sur des données auto-descriptives et la flexibilité du traitement des types de données les plus complexes place la barre très haut en termes d’exploration et de perspicacité des grands volumes de données. Nous sommes très fiers du potentiel de Drill à transformer les entreprises orientées données. »

Les entreprises utilisant Apache Drill bénéficient de :

· Très hautes performances d’analyse de données en format natif y compris les données auto-descriptives comme Parquet, les fichiers JSON et les tables HBase

· Requêtes directes sur les données des tables HBase sans définir et maintenir un schéma parallèle/superposé dans le métastore Hive

· Extensions SQL intuitives pour lancer des requêtes et traiter des données semi-structurées/imbriquées à savoir les données des solutions NoSQL comme par exemple MongoDB

· Requêtes qui combinent simultanément les différentes sources de données Hadoop comme les fichiers, les tables HBase et les tables Hive

Les développeurs et les analystes peuvent profiter des compétences acquises en SQL et en business intelligence pour :
· Réduire les coûts de migration et la courbe d’apprentissage pour les utilisateurs à travers la syntaxe ANSI SQL familière

· Continuer à utiliser les outils analytiques/business intelligence traditionnels comme Excel, Tableau et bien d’autres outils utilisant les pilotes standard ODBC/JDBC

· Activer les requêtes ad-hoc/à faible latence sur les tables Hive existants. Réutiliser les métadonnées Hive, des centaines de formats de fichiers et de fonctions définies par l’utilisateur.

Disponibilité
Apache Drill 0.5 avec la distribution MapR incluant Hadoop est actuellement disponible. Pour voir Drill en action, télécharger le logiciel ou retrouver d’autres informations, rendez-vous ici.

Citations
Piyush Bhargava, ingénieur IT confirmé chez Cisco Systems souligne: « En tant qu’entreprise informatique disposant de milliers d’utilisateurs internes qui connaissent SQL, nous sommes ravis des perspectives offertes par Apache Drill. Il comble une grande lacune dans notre architecture Hadoop, en permettant aux utilisateurs finaux d’explorer les données directement. L’approche de Drill, qui permet d’effectuer des requêtes SQL interactives sans avoir besoin d’extensions à travers une large variété de types de données, est unique. Elle réunit la familiarité de SQL et la souplesse d’Hadoop lors du traitement de grands volumes de données ».

Scott Russman, directeur du développement logiciel chez Solutionary, déclare : « Nous saluons la flexibilité et la performance promises par Drill concernant l’exploration des données ad-hoc. Permettre aux unités d’affaires supplémentaires d’utiliser nos grands ensembles de données Hadoop et corréler nos autres sources de données à travers une seule et unique interface ANSI SQL, constitue un passage incroyablement puissant et nécessitera peu de rééquipement. Cela réduira les besoins de personnalisation d’applications et permettra un partage plus efficace des connaissances au sein de l’entreprise ».

Paul Zolfaghari, président de MicroStrategy Incorporated raconte : « Nous sommes ravis de travailler avec la communauté d’Apache Drill pour intégrer la dernière technologie SQL-on-Hadoop à MicroStrategy Analytics Platform™. Apache Drill offre une alternative intéressante pour les possibilités de connexion de notre plateforme analytique aux applications fonctionnant sous des environnements de données volumineux. MicroStrategy a hâte de tester le projet ».

Dan Jewett, vice président du product management chez Tableau Software souligne: « Drill offre de nouveaux moyens particulièrement efficaces pour lancer des requêtes sur des données stockées dans Hadoop. Nous sommes impatients de voir nos clients profiter de cette technologie dans leurs environnements ».

Amyn Rajan, PDG de Simba Technologies note : « Simba a développé les premiers pilotes ODBC de type entreprise pour Hadoop, NoSQL et les grands volumes de données. Nous sommes ravis de collaborer une nouvelle fois avec MapR pour marquer la prochaine innovation : introduire Drill avec la connectivité ODBC 3.8. Nous partageons avec MapR cet engagement à ouvrir les données Hadoop depuis notre première collaboration il y a 3 ans. Actuellement, la comptabilité de Drill avec les modèles de données sans schémas, la meilleure connectivité et les moyens SQL dynamiques permettent aux entreprises d’optimiser l’exploration des grands volumes de données à travers leurs outils analytiques, qu’ils utilisent Tableau, Excel, Lumira ou toute autre application ».

Autres articles

MapR redéfinit SQL-on-Hadoop avec Apache Drill

Moteur de base de données distribuées ANSI SQL pour l’exploration des données en libre-service et l’analyse JSON

Snowflake vs Hadoop : lequel choisir ?

Les évolutions de Hadoop en 2022

Teradata poursuit ses avancées dans le cloud grâce à l'élargissement de ses offres en analytique cloud et son nouveau partenaire Google Cloud

MapR lance le Programme Clarity à l’intention des clients de Cloudera et de Hortonworks avec une plateforme actualisée et un service d'évaluation des données gratuity

Cloudera et Hortonworks finalisent leur fusion

Snowflake renforce la collaboration cross-cloud pour les données d'entreprise et l'intelligence artificielle - 21/11/2024

Snowflake unifie les données transactionnelles et analytiques avec la disponibilité générale des Hybrid Tables - 21/11/2024

Neo4j dépasse les 200 millions de dollars de chiffre d’affaires et accélère son leadership dans le domaine de la GenAI grâce à sa technologie de graphes - 20/11/2024

Starburst annonce une capacité d’ingestion de données en streaming de 100 Gb/seconde depuis Apache Kafka vers les tables Apache Iceberg - 06/11/2024

Se préparer à l’avenir des moteurs de recherche avec l’approche vectorielle - 22/10/2024