Pour une gestion élargie et détaillée des données du data lake (ou lac de données) de Hadoop, Teradata Corp. (NYSE: TDC), leader des plates-formes, applications et services analytiques, annonce la disponibilité de Teradata Loom® 2.4. La solution est un levier majeur de productivité pour les professionnels du traitement analytique des données, puisqu'elle accélère et allège les efforts nécessaires à l'identification et à l'utilisation des données dans le cadre des traitements analytiques avancés.
« Les data lakes hébergent un volume important de données à structure non définie, souvent ingérables, voire inaccessibles » observe Scott Gnau, Président de Teradata Labs. « Teradata Loom offre des fonctionnalités novatrices et puissantes pour optimiser la création de valeur à partir de ces data lakes, grâce à des fonctions automatisées et simples d'utilisation. Ces dernières permettent aux utilisateurs de générer une visibilité rapide sur leur environnement métier. Les projets de traitement analytique du big data s'exécutent désormais en quelques heures, ce qui pouvait prendre jusqu'à plusieurs mois auparavant ».
Teradata Loom offre des fonctions de traçabilité des données et de formatage des données brutes, ainsi que des métadonnées pour les données JSON (Java Script Object Notation), le principal type de données de l'Internet des Objets, des dispositifs mobiles, des capteurs et des navigateurs Web. De plus, Teradata Loom accélère l'exécution des requêtes à l'aide d'une fonction de partition qui permet de mieux organiser les données dans Apache™ Hive. Les formats internationaux de données sont pris en charge, pour simplifier le formatage des dates et des devises.
Selon un récent communiqué de Gartner, dont le lien est disponible ci-dessous, les data lakes présentent des risques, avec notamment l'incapacité de déterminer la qualité des données ou la traçabilité de résultats d'analyse menées par des utilisateurs ayant déjà étudié un ensemble de données présentes dans le lac. Par définition, un lac de données héberge tous types de données, sans application de règles ou de gouvernance. Sans métadonnées descriptives, ni mécanisme pour en assurer la pérennité, un data lake ne présente que peu d'intérêt. Et sans métadonnées, toute utilisation ultérieure de données déjà analysées implique de ré-exécuter les analyses à partir de zéro.
Dépourvues d'un outil intelligent de gestion des données, les organisations peinent à identifier précisément les données pertinentes, leur type, leur format, les contenus et les éléments nécessaires à la préparation des analyses. Il est, d'autre part, quasi-impossible de tenir le rythme des mises à jour fréquentes, précisément parce que tout ajout de nouvelles données implique de ré-exécuter les analyses.
Teradata Loom® Community Edition 2.3 est proposé gratuitement en téléchargement sur http://bit.ly/1DcUGuI. Teradata Loom® 2.4 sera disponible à partir du 31 mars 2015 en abonnement, à un tarif attractif. Ces versions sont et seront disponibles à l'échelle mondiale et en version anglaise.
Teradata Loom est compatible avec les plateformes Hadoop suivantes : Teradata Open Distribution for Hadoop (TDH 1.3 et TDH 2.0, Hortonworks Data Platform (1.3, HDP 2.1 et HDP 2.2), Cloudera Distribution including Apache Hadoop (CDH 5.1 et CDH 5.2), ainsi que MapR Apache Hadoop Distribution (MapR 4.0.2).
Liens pertinents
· Data Sheet: Teradata Loom 2.4 http://bit.ly/1KFU6ui
· Communiqué de presse "Gartner Says Beware of the Data Lake Fallacy", le 28 juillet 2014, http://gtnr.it/1q8Nbia
« Les data lakes hébergent un volume important de données à structure non définie, souvent ingérables, voire inaccessibles » observe Scott Gnau, Président de Teradata Labs. « Teradata Loom offre des fonctionnalités novatrices et puissantes pour optimiser la création de valeur à partir de ces data lakes, grâce à des fonctions automatisées et simples d'utilisation. Ces dernières permettent aux utilisateurs de générer une visibilité rapide sur leur environnement métier. Les projets de traitement analytique du big data s'exécutent désormais en quelques heures, ce qui pouvait prendre jusqu'à plusieurs mois auparavant ».
Teradata Loom offre des fonctions de traçabilité des données et de formatage des données brutes, ainsi que des métadonnées pour les données JSON (Java Script Object Notation), le principal type de données de l'Internet des Objets, des dispositifs mobiles, des capteurs et des navigateurs Web. De plus, Teradata Loom accélère l'exécution des requêtes à l'aide d'une fonction de partition qui permet de mieux organiser les données dans Apache™ Hive. Les formats internationaux de données sont pris en charge, pour simplifier le formatage des dates et des devises.
Selon un récent communiqué de Gartner, dont le lien est disponible ci-dessous, les data lakes présentent des risques, avec notamment l'incapacité de déterminer la qualité des données ou la traçabilité de résultats d'analyse menées par des utilisateurs ayant déjà étudié un ensemble de données présentes dans le lac. Par définition, un lac de données héberge tous types de données, sans application de règles ou de gouvernance. Sans métadonnées descriptives, ni mécanisme pour en assurer la pérennité, un data lake ne présente que peu d'intérêt. Et sans métadonnées, toute utilisation ultérieure de données déjà analysées implique de ré-exécuter les analyses à partir de zéro.
Dépourvues d'un outil intelligent de gestion des données, les organisations peinent à identifier précisément les données pertinentes, leur type, leur format, les contenus et les éléments nécessaires à la préparation des analyses. Il est, d'autre part, quasi-impossible de tenir le rythme des mises à jour fréquentes, précisément parce que tout ajout de nouvelles données implique de ré-exécuter les analyses.
Teradata Loom® Community Edition 2.3 est proposé gratuitement en téléchargement sur http://bit.ly/1DcUGuI. Teradata Loom® 2.4 sera disponible à partir du 31 mars 2015 en abonnement, à un tarif attractif. Ces versions sont et seront disponibles à l'échelle mondiale et en version anglaise.
Teradata Loom est compatible avec les plateformes Hadoop suivantes : Teradata Open Distribution for Hadoop (TDH 1.3 et TDH 2.0, Hortonworks Data Platform (1.3, HDP 2.1 et HDP 2.2), Cloudera Distribution including Apache Hadoop (CDH 5.1 et CDH 5.2), ainsi que MapR Apache Hadoop Distribution (MapR 4.0.2).
Liens pertinents
· Data Sheet: Teradata Loom 2.4 http://bit.ly/1KFU6ui
· Communiqué de presse "Gartner Says Beware of the Data Lake Fallacy", le 28 juillet 2014, http://gtnr.it/1q8Nbia
Autres articles
-
Teradata lance des cas d’usage d’IA générative à démarrage rapide grâce à l’intégration d’Amazon Bedrock
-
Teradata nomme Louis Landry au poste de Chief Technology Officer
-
Teradata AI Unlimited pour Microsoft Fabric est désormais disponible en avant-première via Microsoft Fabric Workload Hub
-
Teradata facilite l’application concrète de l’IA générative et accélère la création de valeur pour les entreprises
-
Teradata propose des capacités d’IA exceptionnelles pour les grandes entreprises et les environnements hybrides en collaboration avec NVIDIA