Talend profite de l'aubaine Big Data


Rédigé par le 29 Février 2012

A l'occasion de la conférence Strata organisée par O'Reilly à New-York, Talend dévoile aujourd'hui un nouvel arrangement de ses logiciels afin de répondre aux attentes des entreprises qui gèrent de gros volumes de données : Talend… for Big Data



Fabrice BONAN, co-fondateur de Talend
Parler de nouvelle version serait un peu excessif car l'essentiel des composants existaient déjà, mais Talend n'en faisait pas forcément une promotion active et surtout, ils n'étaient pas réunis au sein d'un même produit.
Fidèle à son modèle, Talend dévoile donc aujourd'hui deux versions d'un même produit, une version open source et une version entreprise : Talend Open Source for Big Data, et Talend Enterprise Data Integration for Big Data.

Pour répondre à ce besoin de gestion de gros volumes de données, Talend fait le choix affirmé de Hadoop. Fabrice Bonan, co-fondateur de Talend, souhaite d'ailleurs se rapprocher des "distributions" de Hadoop proposée par des fournisseurs comme Cloudera. L'objectif serait d'intégrer Talend Open Source for Big Data à ces distributions afin de diffuser plus largement la solution.

La version open source propose le support de tous les composants Hadoop intégrés dans Talend. Talend supporte Apache Hive, l'infrastructure Hadoop dédiée à la construction d'entrepôts de données (qui intègre un langage d'interrogation que l'on pourrait décrire comme un SQL pour Hadoop). Du point de vue technique, Talend génère du langage Apache Pig, qui est lui-même une sorte de compilateur qui génère des séquences MapReduce natives à Hadoop.

La version entreprise propose l'ensemble de la version open source à laquelle sont ajoutés des composants essentiellement destinés aux groupes de travail. La version open source se suffit à elle-même pour un développeur indépendant. Mais la version entreprise propose des outils de collaboration et de gestion de projets qui facilitent le développement en équipes. La version entreprise ajoute également des outils d'administration de Talend dans l'environnement Hadoop ainsi que des outils de cadencement des tâches d'exécution.

Au moins deux grandes entreprise américaines sont déjà utilisatrices de Talend for Big Data. Un grand site mondial d'enchères en ligne qui teste la version actuelle et devrait passer prochainement en production; ainsi qu'une grande banque de détail américaines qui passe de la solution AB Initio à celle de Talend



Dans la même rubrique :