L'accélérateur GridGain Data Lake permet d'effectuer des analyses en temps réel à partir de données combinées de Data Lake et de données opérationnelles


Rédigé par Communiqué de GridGain Systems le 15 Juin 2019

L'accélération de Data Lake grâce à la plate-forme GridGain In-Memory Computing offre des performances en temps réel et une évolutivité massive.



Photo by Gláuber Sampaio on Unsplash
GridGain® Systems, fournisseur de solutions informatiques in-memory pour entreprise basées sur Apache® Ignite™, annonce aujourd'hui GridGain Data Lake Accelerator, une solution in-memory pour les entreprises qui ont besoin d'enrichir leurs données opérationnelles avec des données historiques stockées dans les Data Lakes afin d’améliorer l'analyse en temps réel et l'automatisation des décisions. L'accélérateur GridGain Data Lake Accelerator peut être utilisé avec GridGain Enterprise Edition et GridGain Ultimate Edition.

L'accélérateur GridGain Data Lake Accelerator améliore l'accès aux Data Lakes en offrant une intégration bidirectionnelle avec Apache™ Hadoop®. Cette intégration apporte les données historiques dans la même couche informatique in-memory que les données opérationnelles, ce qui permet d'analyser et de calculer en temps réel les données combinées pour piloter les processus métier. Il exploite l'API GridGain Unified et le connecteur natif Apache Spark™ pour alimenter en temps réel le HTAP (traitement hybride transactionnel/analytique) dans lequel les transactions et les analyses sont effectuées sur le même jeu de données opérationnelles.

« Aujourd’hui, de nombreux cas d'utilisation de la transformation numérique et de l'IoT nécessitent une analyse en temps réel par rapport à une combinaison de données de Data Lake et de données opérationnelles », a déclaré Abe Kleinfeld, président et CEO de GridGain. « Le GridGain Data Lake Accelerator répond aux besoins des entreprises qui souhaitent obtenir un aperçu instantané, tirer parti des opportunités à mesure qu’elles se présentent et automatiser la prise de décision ».

« De nombreuses entreprises ont créé des Data Lakes basés sur Hadoop dans le but de consolider les données de sources multiples et de répondre aux besoins de traitement et d'analyse de plusieurs cas d'utilisation, mais ont ensuite eu du mal à générer la valeur attendue», souligne Matt Aslett, vice-président de la Recherche, Données, IA et Analyses chez 451 Research. « En ajoutant une fonctionnalité de calcul in-memory au Data Lake, GridGain permet d’accélérer l’accès aux données historiques et opérationnelles afin de faciliter la prise de décision en temps réel.»

Les cas d'utilisation typiques de Data Lake Accelerator comprennent l'utilisation de données historiques pour enrichir les flux de données en temps réel, le calcul de seuils pour les déclencheurs opérationnels en temps réel à partir des tendances historiques ou l'affichage simultané des données historiques et en temps réel dans des tableaux de bord opérationnels. Par exemple, une entreprise de transport pourrait collecter un flux continu de données à partir de ses moteurs de véhicules. Les données sont ingérées, traitées et analysées, puis stockées dans un Data Lake, et seules les données les plus récentes sont conservées dans la base de données opérationnelle. Lorsqu'une lecture anormale des données en temps réel déclenche une alerte pour un moteur particulier, le système peut analyser les données du moteur pour identifier la cause première du problème. Une infrastructure basée sur une plate-forme in-memory de GridGain, Kafka, Spark et Hadoop, rend cela possible. Apache Kafka transmet les données de streaming en direct à la plate-forme informatique in-memory GridGain et au Data Lake Hadoop. Spark récupère les données nécessaires à partir du Data Lake et les transmet à la plate-forme in-memory. La plate-forme informatique in-memory de GridGain conserve en mémoire l'ensemble de données combinées et exécute des requêtes en temps réel sur celles-ci. Le résultat est une compréhension globale et immédiate des causes de la lecture anormale.

Le GridGain Data Lake Accelerator est disponible pour les éditions GridGain Enterprise et Ultimate. La plate-forme in-memory GridGain, une solution informatique in-memory basée sur Apache Ignite, offre une vitesse in-memory et une évolutivité massive pour les applications gourmandes en données. Elle ne nécessite aucune modification des bases de données existantes et peut être déployé sur site, sur un Cloud public ou privé, ou dans un environnement hybride. GridGain Enterprise Edition inclut des fonctionnalités basées sur Apache Ignite qui facilitent le déploiement, la gestion et la sécurisation de GridGain en tant que grille de données in-memory dans les environnements de production critiques. GridGain Ultimate Edition ajoute toutes les fonctionnalités de sauvegarde et de restauration nécessaires pour prendre en charge GridGain déployé en tant que base de données in-memory dans les environnements de production.



Dans la même rubrique :