Teradata révolutionne la conception et le déploiement des data lakes d'entreprise


Rédigé par Communiqué de Teradata le 1 Avril 2016

L'approche éprouvée sur un modèle de conception (Design pattern) de Teradata est prise en charge par les technologies, produits et services, une première dans le secteur



Teradata (NYSE : TDC), le spécialiste de l'analyse big data et des applications marketing, vient d'annoncer une nouvelle approche du déploiement d'un data lake, basée sur un « modèle de conception » (design patterns). Teradata exploite ainsi ses nombreuses années d'expérience dans le conseil et l'optimisation en matière d'écosystème analytique de données et de big data pour aider les clients à concevoir des data lakes et à en tirer profit. La nouvelle approche de modèle de conception constitue une première dans le secteur et positionne Teradata à l'avant-garde de l'aide aux utilisateurs métiers, aux experts en données et aux professionnels de l'informatique désireux de créer des data lakes capables de procurer une véritable valeur ajoutée.

Les entreprises s'intéressent aux fonctionnalités des data lakes pour générer de nouvelles perspectives et opportunités à partir de volumes de données qui explosent. Cependant leurs équipes informatiques souffrent de sérieux handicaps, tels que le manque de bonnes pratiques, la pénurie d'experts en données et même une certaine confusion quant à la définition d'un data lake. En outre, les choix technologiques ne cessent de se multiplier. À titre d'exemple, les data lakes sont généralement considérés comme synonymes de Hadoop, qui constitue certes un excellent choix dans de nombreux cas. Un data lake peut cependant être basé sur diverses technologies telles que Hadoop, NoSQL, Amazon Simple Storage Service (S3), une base de données relationnelle (RDBMS) ou diverses combinaisons de ces derniers. Alors que les technologies jouent un rôle essentiel dans la solution résultante, un data lake efficace nécessite un plan. C'est précisément le rôle que joue le modèle de conception du data lake. Le modèle de conception consiste en une propriété intellectuelle basée sur les meilleures pratiques professionnelles associées à des produits co-développés à partir d'une série de missions clients réussies.
« Teradata a pris une longueur d'avance dans la définition de modèles de mise en œuvre des data lakes », déclaré Tony Baer, analyste senior chez OVUM. « Un data lake est différent d'un magasin de données opérationnelles. L'offre de Teradata découle de son expérience pratique, acquise sur le terrain en aidant les clients à faire face à la nécessité de gérer des données dans des environnements hétérogènes. Avec l'acquisition de Think Big, Teradata s'est doté de précieux modèles de conception IP qui contribueront à réaliser des data lakes transparents. »

En ayant accès à de nouvelles données, telles que des enregistrements de service client, des parcours de navigation, du trafic IP, des informations de consignation et des données de capteurs stockées dans un data lake, les utilisateurs sont en mesure de traiter des cas nécessitant généralement de multiples interprétations simultanées des données à tester les unes par rapport aux autres. Voici deux exemples de cas concrets :

Générer des modèles améliorés de détection de perte de clients par l'extraction du texte des appels au service client, stockés dans le data lake, et l'application de méthodes d'analyse de texte prédictives.
Fournir des analyses de tendances pour des combinaisons de vastes flux de données machine avec des données de consommateurs. Dans le secteur des services publics, par exemple, les data lakes ouvrent la voie à l'exécution concomitante de plusieurs modèles de données pour examiner l'impact de l'installation d'appareils économes en énergie et l'effet différé, quelques mois plus tard, de la réduction de la consommation d'électricité.

« Qui n'a pas entendu parler de déconvenues liées à la mise en œuvre d'un data lake ? C'est ce qui explique notre croissance : nous sommes amenés à intervenir pour aider les entreprises à redresser la situation face à de sérieux et coûteux dysfonctionnement de data lake », confie Ron Bodkin, président de Think Big, une société Teradata. « Nous adaptons notre approche de modèle de conception pour data lake aux spécificités de chaque situation. Et ces modèles et structures de logiciel support constituent des accélérateurs de valeur ajoutée solides et éprouvés. Malheureusement, de nombreuses entreprises tombent encore dans les pièges du big data. Grâce à notre expérience, nous sortons les clients de l'état de crise et aidons les spécialistes métiers, informatique et données à planifier et réaliser des data lakes qui leur permettront de profiter d'une véritable valeur ajoutée pour l'entreprise. »

Depuis sa création, Think Big est et reste indépendant de toute technologie et plate-forme. La société se concentre sur la création d'une valeur ajoutée tangible grâce à des technologies open source comme Apache™ Hadoop®, Apache Spark™ et NoSQL. Un certain nombre de services de modèle de conception pour data lake sont disponibles auprès de Think Big, notamment : Data Lake Foundation, pour les équipes qui démarrent avec un data lake ou recherchent des conseils sur les pratiques recommandées ; Data Lake Architecture, conçu pour les entreprises en quête de pratiques recommandées en matière de data lake et de choix technologiques ; et Data Lake Analytics, qui prend en charge la préparation des données en vue de l'exécution de cycles d'analyse.

Think Big a aidé de nombreux leaders de l'industrie et de l'innovation à établir des data lakes et à concevoir des mises en œuvre Hadoop/big data, notamment dans le cadre de missions chez : HGST (une société Western Digital), l'un des plus importants fournisseurs mondiaux de services financiers, un leader de la fabrication de semi-conducteurs, une grande société de stockage informatique et de gestion de données, un fabricant renommé de vêtements d'athlétisme et un célèbre producteur mondial de boissons gazeuses.

Teradata propose également divers produits et technologies optimisés pour l'utilisation avec des environnements de data lake. Parmi lesquels : Teradata Listener, qui simplifie le streaming de big data vers le data lake grâce à une solution logicielle intelligente et en libre-service ; Teradata Appliance for Hadoop, la solution bon marché de stockage de données ; Presto, qui offre une architecture SQL-on-Hadoop moderne ; et des accélérateurs de data lake basés sur IP, également appelés Pipeline Controller et Buffer Server, dont la conjugaison assure un mouvement efficace des données des serveurs locaux vers Hadoop.



Dans la même rubrique :