Treasure Data combine Hadoop et entrepôt de données chez Amazon


Rédigé par le 24 Juillet 2013

La startup mi-japonaise, mi-californienne, Treasure Data vient d’annoncer avoir lever 5 millions de dollars auprès de Sierra Ventures, pour appuyer le lancement de sa solution hébergée chez Amazon. Cela vient compléter les 2.8 millions de $ levés en novembre 2012.



Dans le schéma que propose Treasure Data pour décrire son architecture (voir ci-dessus), on constate que l’accent est mis sur la collecte et le stockage de données. Une collecte en temps réel pour les applications hébergées sur le web, et une collecte en temps différé pour les applications d’entreprise. En matière de collecte en temps réel, Treasure Data annonce une capacité de 80 milliards de messages intégrés par mois. Ces données sont ensuite stockées dans un entrepôt de données qui combine une base de données en colonnes et un système de fichiers Hadoop. Le travail d’analyse et de restitution est laissé aux outils habituels du marché. Les utilisateurs peuvent interroger la base de données à travers des requêtes SQL (via Pig pour interroger le système de fichiers Hadoop), et l’éditeur travaille sur une solution qui permettrait d’interroger des données non structurées au travers de requêtes SQL également.

Treasure Data s’attaque aux fournisseurs déjà bien implantés de solutions d’entreprise. On pense immédiatement à Teradata, Oracle, IBM, mais également aux distributions Hadoop comme Cloudera et Hortonworks. Plus intriguant, bien qu’hébergé chez Amazon, la solution Treasure Data entre également en compétition avec l’offre RedShift de ce même Amazon. Encore un bel exemple de coopétition technologique. Tout en étant hébergeur d’applications, Amazon a en effet ces derniers mois développé sa propre solution autour de Hadoop. Mais la solution Amazon doit être « fabriquée » à partir des différentes briques proposées par la plateforme, tandis que Treasure Data propose une solution intégrée.

Selon Hiro Yoshikama, co-fondateur et CEO de Treasure Data, cité par GigaOM, l’entreprise n’aurait pas vraiment besoin de cet argent pour se développer. Elle aurait déjà convaincu 80 clients d’utiliser sa plateforme. Cette dernière supporterait déjà 200 000 requêtes par jour portant sur 700 milliards de lignes. Parmi ces clients, il cite Toyota et Salesforce.com. Le duo des deux fondateurs, d’origine japonaise, a su compléter l’équipe de quelques talents. Ainsi, Keith Goldstein, précédemment en charge du développement chez Talend, a rejoint Treasure Data comme VP Business Development. Et le marketing a été confié à Rich Ghiossi, précédemment en charge du marketing chez ParAccel, avant son rachat par Actian. Une équipe expérimentée qui devrait nous conduire à entendre parler de Treasure Data dans les prochaines années sur le marché des solutions hébergées d’entrepôt de données pour entreprises.



Dans la même rubrique :