Cloudera, fournisseur de la plate-forme de gestion et d’analyse des données la plus rapide, la plus facile à utiliser et la plus sécurisée reposant sur Apache Hadoop et les nouvelles technologies open source, publie les résultats d’un banc d’essai qui confirment que sa solution de base de données analytique moderne reposant sur Apache Impala (incubating) offre des fonctionnalités sans équivalent pour les charges de travail en mode Cloud natif, tout en étant plus rentable que les autres solutions. Impala offre une évolutivité élastique, une plus grande flexibilité et la capacité de requête directe d’Amazon S3 que n’offrent pas les systèmes traditionnels tels que Redshift. Solution moderne, Impala découple les données et la puissance de calcul pour offrir les mêmes capacités d’analyse SQL hautes performances en mode Cloud natif sur S3 ou sur un large éventail de systèmes de stockage sur site et dans un Cloud. En outre, Impala offre ces fonctionnalités en étant jusqu’à 275 % plus rentable et 10 fois plus performante que la base de données analytique Redshift d’Amazon, ce qui équivaut à une plus grande valeur ajoutée dans une plate-forme ouverte.
À partir des requêtes du banc d’essai standard TPC-DS, Cloudera a comparé Impala s’exécutant dans le Cloud (tant en mode Cloud natif sur S3 que sur des systèmes de stockage EBS locaux) avec Amazon Redshift (qui ne s’exécute que sur son propre système de stockage sur des instances AWS dédiées). Les résultats de ce banc d’essai sont les suivants :
● Impala est plus de 200 % plus rentable et plus de 10 fois plus rapide sur S3 qu’un système Redshift générique.
● Impala est 8 % plus rentable et 90 % plus rapide sur S3 qu’un système Redshift préconfiguré pour des requêtes de reporting fixe spécifiques.
● Impala est 28 à 275 % plus rentable et 42 à 400 % plus rapide sur EBS qu’un système Redshift préconfiguré ou générique.
« Nos clients cherchent de plus en plus à transférer les charges de travail analytiques et de BI vers des environnements Cloud pour tirer parti de la rentabilité de l’évolutivité élastique et d’une plus grande flexibilité. Ils souhaitent toutefois bénéficier des fonctions d’analyse hautes performances et de l’agilité du Big Data auxquelles ils sont habitués sur site », déclare Charles Zedlewski, vice-président, Products, Cloudera. « Impala apporte ces avantages que n’offrent pas les bases de données analytiques sur site traditionnelles dans le Cloud avec une architecture moderne qui assure une agilité sans précédent, où que les données résident. Ce banc d’essai démontre clairement qu’Impala est sans équivalent pour ces charges de travail analytiques et de BI dans le Cloud », ajoute-t-il.
Les entreprises qui cherchent à acquérir davantage de données provenant de nouvelles sources, à adapter activement les modèles en fonction de l’évolution des besoins et à concevoir des solutions de manière itérative pour divers exemples d’utilisation ont besoin d’une base de données analytique moderne conçue pour répondre à ces besoins, sans pénaliser leur productivité. Les systèmes monolithiques traditionnels rigides et peu évolutifs, déployés sur site ou dans un Cloud, ne sont tout simplement pas en mesure de faire face à l’évolution constante des besoins des entreprises. La base de données analytique de Cloudera, alimentée par Impala en tant que moteur SQL interactif, a été conçue spécialement pour introduire les fonctions d’analyse SQL hautes performances dans les systèmes d’analyse Big Data, en offrant une évolutivité élastique pour les déploiements dans le Cloud et sur site, en fonction des besoins.
Impala fonctionne en mode natif avec les données stockées sur un certain nombre de moteurs de stockage, y compris le magasin d’objets Amazon S3, ce qui élimine le besoin de transférer ou de charger des données spécifiquement dans des clusters Impala. Dans le cas des déploiements en mode Cloud, cela se traduit par des économies et des gains d’efficacité, car des clusters transitoires peuvent être déployés selon les besoins pour les charges de travail de reporting et de BI. En outre, avec le système de stockage rentable de S3, de plus grandes quantités de données sont rapidement et facilement disponibles pour l’analyse.
Cloudera s’attache en permanence à améliorer les performances, la simultanéité et l’évolutivité d’Impala. L’entreprise a creusé l’écart de performance entre l’architecture de base de données analytique d’Impala et d’autres solutions pour les charges de travail simples et multi-utilisateurs. La nouvelle version offre des performances 12 fois supérieures à celles des deux versions antérieures sur les charges de travail sécurisées. Cloudera prévoit de continuer à améliorer les fonctionnalités et les performances d’Impala en ajoutant la prise en charge d’autres magasins d’objets dans le Cloud public.
À partir des requêtes du banc d’essai standard TPC-DS, Cloudera a comparé Impala s’exécutant dans le Cloud (tant en mode Cloud natif sur S3 que sur des systèmes de stockage EBS locaux) avec Amazon Redshift (qui ne s’exécute que sur son propre système de stockage sur des instances AWS dédiées). Les résultats de ce banc d’essai sont les suivants :
● Impala est plus de 200 % plus rentable et plus de 10 fois plus rapide sur S3 qu’un système Redshift générique.
● Impala est 8 % plus rentable et 90 % plus rapide sur S3 qu’un système Redshift préconfiguré pour des requêtes de reporting fixe spécifiques.
● Impala est 28 à 275 % plus rentable et 42 à 400 % plus rapide sur EBS qu’un système Redshift préconfiguré ou générique.
« Nos clients cherchent de plus en plus à transférer les charges de travail analytiques et de BI vers des environnements Cloud pour tirer parti de la rentabilité de l’évolutivité élastique et d’une plus grande flexibilité. Ils souhaitent toutefois bénéficier des fonctions d’analyse hautes performances et de l’agilité du Big Data auxquelles ils sont habitués sur site », déclare Charles Zedlewski, vice-président, Products, Cloudera. « Impala apporte ces avantages que n’offrent pas les bases de données analytiques sur site traditionnelles dans le Cloud avec une architecture moderne qui assure une agilité sans précédent, où que les données résident. Ce banc d’essai démontre clairement qu’Impala est sans équivalent pour ces charges de travail analytiques et de BI dans le Cloud », ajoute-t-il.
Les entreprises qui cherchent à acquérir davantage de données provenant de nouvelles sources, à adapter activement les modèles en fonction de l’évolution des besoins et à concevoir des solutions de manière itérative pour divers exemples d’utilisation ont besoin d’une base de données analytique moderne conçue pour répondre à ces besoins, sans pénaliser leur productivité. Les systèmes monolithiques traditionnels rigides et peu évolutifs, déployés sur site ou dans un Cloud, ne sont tout simplement pas en mesure de faire face à l’évolution constante des besoins des entreprises. La base de données analytique de Cloudera, alimentée par Impala en tant que moteur SQL interactif, a été conçue spécialement pour introduire les fonctions d’analyse SQL hautes performances dans les systèmes d’analyse Big Data, en offrant une évolutivité élastique pour les déploiements dans le Cloud et sur site, en fonction des besoins.
Impala fonctionne en mode natif avec les données stockées sur un certain nombre de moteurs de stockage, y compris le magasin d’objets Amazon S3, ce qui élimine le besoin de transférer ou de charger des données spécifiquement dans des clusters Impala. Dans le cas des déploiements en mode Cloud, cela se traduit par des économies et des gains d’efficacité, car des clusters transitoires peuvent être déployés selon les besoins pour les charges de travail de reporting et de BI. En outre, avec le système de stockage rentable de S3, de plus grandes quantités de données sont rapidement et facilement disponibles pour l’analyse.
Cloudera s’attache en permanence à améliorer les performances, la simultanéité et l’évolutivité d’Impala. L’entreprise a creusé l’écart de performance entre l’architecture de base de données analytique d’Impala et d’autres solutions pour les charges de travail simples et multi-utilisateurs. La nouvelle version offre des performances 12 fois supérieures à celles des deux versions antérieures sur les charges de travail sécurisées. Cloudera prévoit de continuer à améliorer les fonctionnalités et les performances d’Impala en ajoutant la prise en charge d’autres magasins d’objets dans le Cloud public.
Autres articles
-
Cloudera s'associe à Snowflake et intègre la gestion des données hybrides basée sur Iceberg
-
Cloudera dévoile sa vision d'un véritable cloud hybride lors d’EVOLVE24 New York
-
Cloudera présente un service d'inférence IA avec microservices NVIDIA NIM pour accélérer le développement et le déploiement de la GenAI
-
Cloudera dévoile une nouvelle suite d'accélérateurs pour les projets de machine learning (AMP)
-
Cloudera renforce la gestion des métadonnées avec un catalogue de données modernisé et l’intégration d’Iceberg REST