Google lance avec Trifacta un outil de préparation des données en cloud : Google DataPrep


Rédigé par le 11 Mars 2017

Google intègre les outils de Trifacta à ses propres outils de gestion des données pour proposer sur sa plateforme cloud, un outil complet de préparation des données décisionnelles. Une offre qui pourrait faire de Google un joueur important du domaine des ETL orientés cloud, s’il ouvrait l’outil à des sources de données externes.



La nouvelle offre de Google en matière de préparation des données s’appelle Google DataPrep, et est disponible sur le cloud de Google en version Beta.

Google DataPrep permet à ses utilisateurs d’explorer et de nettoyer des sources de données Google Cloud Storage et BigQuery. La multiplication des sources de données en cloud, en particulier dans le domaine de l’internet des objets, rend indispensable une solution hébergée de préparation et de nettoyage.

Parmi les fonctions mises en avant par Google, on retrouve :
la détection d’anomalies, qui s’appuie sur de l’apprentissage machine pour détecter des schémas, des distributions, et suggérer des modifications au jeu de données
une interface utilisateur simple, sous forme de glisser / déplacer
une intégration transparente avec la plateforme Google Storage

Pour l’instant, Google Cloud DataPrep est en version Beta privée, non facturé. Google annoncera le prix de cette nouvelle solution lorsqu’elle passera en Beta publique. Rien n’a été dévoilé bien entendu des accords entre Trifacta et Google, mais cette opération permettra certainement à Trifacta de se faire connaître auprès de nouveaux clients, et de voir son revenu fortement progresser.



Dans la même rubrique :