Alpine Miner veut démocratiser l’analyse prédictive


Rédigé par le 26 Juillet 2011

Initialement imaginé pour l’environnement Greenplum, la solution développée par Alpine Data Labs s’ouvre à Oracle Exadata à l’occasion de sa version 2.0.



Anderson WONG, CEO de Alpine Data Labs
Le data mining et l’analyse prédictive sont ils réservés aux spécialistes de la statistique et des mathématiques ? Ce n’est en tous cas pas ce que pense Anderson Wong, co-fondateur et directeur général de Alpine Data Labs. Et c’est dans cet esprit de mise à disposition des outils de data mining aux analystes métiers qu’il a créé sa société.
Initialement, le projet a été incubé par Greenplum. L’éditeur cherchait, avant son rachat par EMC, une application « ultime », la « killer app » qui créerait la différence entre la base de données Greenplum et les autres solutions du marché. Avant de prendre son indépendance, Alpine Data Labs a donc tracé sa feuille de route : développer une application d’analyse prédictive qui exploite les capacités des bases de données sur systèmes parallèles et dispose d’un environnement accessible aux utilisateurs métiers.

La première version de Alpine Miner a été lancée en mai 2011, et l’éditeur vient d’annoncer la version 2.0. Une version majeure qui s’ouvre au monde Oracle. Une fois son envol pris, Alpine Data Labs a en effet considéré qu’elle ne pouvait se limiter aux environnements Greenplum/EMC, quitte à limiter l’avantage concurrentiel pour son incubateur originel, et que Alpine Miner devait donc être également disponible sur Oracle. Alpine Miner est donc maintenant disponible pour la base de données open source PostgreSQL et pour Oracle Exadata.

Selon Alpine Data Labs, le marché des outils d’analyse prédictive (essentiellement SAS, IBM SPSS et Kxen) reste organisé pour répondre à la demande des spécialistes de la statistique. Ils fonctionnent sur des systèmes dédiés, imposent de nombreux transferts de données entre la base de données source et ce système dédié à la prédiction, et manqueraient donc de réactivité.

Alpine Data Labs souhaite changer ces règles et proposer :
- un outil qui fonctionne directement dans l’entrepôt de données de l’entreprise et permette donc d’analyser toutes les données, sans perdre du temps et des ressources dans la création d’échantillons, de jeux de données…
- un outil qui exploite ainsi les capacités de calcul parallèle du système qui héberge la base de données
- un outil livré avec des algorithmes prépackagés, et une interface utilisateur graphique pour manipuler les données et les algorithmes. La version 2.0 permet néanmoins aux utilisateurs avancés de bâtir leurs propres modèles d’analyse prédictive.

La facilité d’accès et l’interface utilisateur graphique sont indubitablement un bon point par rapport aux outils traditionnels d’analyse prédictive. Mais réduire l’analyse prédictive à l’utilisation d’un outil, serait faire un raccourci dommageable. Interpréter les résultats obtenus restera nécessaire, et des compétences pointues devront alors être acquises par les analystes métiers.

Pour ses développements futurs, Alpine Data Labs s’intéressera à Hadoop, afin de proposer aux utilisateurs de cet environnement un outil d’analyse prédictive sur les données non structurées.

A découvrir également ci-dessus une "interview" promotionnelle de Anderson WONG où il explique les fondations de Alpine Data Labs.



Dans la même rubrique :