ClearPredictions est un service proposé en cloud, qui va collecter, analyser, modéliser vos données et vous permettre de prédire certains événements, sans avoir besoin de maîtriser en détail l’art de la statistique. Les statisticiens affirmeront qu’il est absurde de faire confiance à la machine sans comprendre comment elle fonctionne; et ils n’ont pas tort. Les non-statisticiens répliqueront que l’on a pas besoin de comprendre le moteur à explosion pour conduire une voiture; et ils n’ont pas tort non plus. Et le débat restera intranchable, jusqu’au prochain article...
Mais pour ClearPredictions, le message est bien de mettre entre les mains de non-spécialistes, un outil simple pour modéliser un jeu de données, et de prédire les comportements de certaines variables. L’outil pourrait aussi être vu comme un apprentissage aux techniques de modélisation, un apprentissage par l’exemple, qui permet au non-statisticien de s’intéresser à ses chiffres.
Mais soyons concrets. Que permet de faire ClearPredictions et comment fonctionne-t-il ?
- Première étape, l’ingestion des données : à partir d’un fichier plat de type CSV ou XLS, vous alimenterez ClearPredictions avec des données constatées. Comme l’explique l’éditeur dans la vidéo ci-dessus, vous collecterez par exemple la liste de vos clients, actuels et passés, avec l’ensemble des données, en colonne, dont vous disposez; y compris bien sur les données dont vous ne pensez pas qu’elles puissent avoir un impact sur le modèle. L’objectif est d’étudier toutes les corrélations possibles.
- Deuxième étape, l’analyse : bien sur, parmi ces données ingérées, doit figurer la donnée cible, celle que l’on souhaite prédire. La phase d’analyse va donc consister à analyser les données qui participent à la détermination de la cible. On va instantanément visualiser la distribution des valeurs de la cible, et les données les plus corrélées. Pour chaque variable, on visualisera l’impact de ces valeurs sur la donnée cible.
- Troisième étape, la modélisation : cette étape de construction du modèle utilise huit algorithmes d’apprentissage machine (régression, arbres de décision, réseau de neurones…). Les huit méthodes sont appliquées et proposées, et un score de pertinence leur est attribué.
- Enfin, dernière étape, appliquer la modélisation à de nouvelles données : une fois l’un des modèles choisi, on télécharge un nouveau jeu de données, correspondant à celles que l’on souhaite prévoir. Évidemment, dans ce jeu de données, la cible n’est pas présente. Le système génère un nouveau fichier, dans lequel il ajoute sa prévision concernant la variable cible, et un coefficient de probabilité.
Fonctionnant en mode hébergé, ClearPredictions en est encore à ses débuts. Vous pouvez le tester gratuitement et vérifier qu’il répond à vos besoins. Par la suite, sous forme d’abonnement, vous pourrez choisir la formule qui dépend de votre usage : à partir de 95$/mois pour deux modèles et 25 000 prédictions et jusqu’à 3 000$/mois pour 50 modèles et 7,5 millions de prédictions.
La semaine prochaine, vous retrouverez dans Decideo une interview de Onno Pistorius, créateur de ClearPredictions.
Mais pour ClearPredictions, le message est bien de mettre entre les mains de non-spécialistes, un outil simple pour modéliser un jeu de données, et de prédire les comportements de certaines variables. L’outil pourrait aussi être vu comme un apprentissage aux techniques de modélisation, un apprentissage par l’exemple, qui permet au non-statisticien de s’intéresser à ses chiffres.
Mais soyons concrets. Que permet de faire ClearPredictions et comment fonctionne-t-il ?
- Première étape, l’ingestion des données : à partir d’un fichier plat de type CSV ou XLS, vous alimenterez ClearPredictions avec des données constatées. Comme l’explique l’éditeur dans la vidéo ci-dessus, vous collecterez par exemple la liste de vos clients, actuels et passés, avec l’ensemble des données, en colonne, dont vous disposez; y compris bien sur les données dont vous ne pensez pas qu’elles puissent avoir un impact sur le modèle. L’objectif est d’étudier toutes les corrélations possibles.
- Deuxième étape, l’analyse : bien sur, parmi ces données ingérées, doit figurer la donnée cible, celle que l’on souhaite prédire. La phase d’analyse va donc consister à analyser les données qui participent à la détermination de la cible. On va instantanément visualiser la distribution des valeurs de la cible, et les données les plus corrélées. Pour chaque variable, on visualisera l’impact de ces valeurs sur la donnée cible.
- Troisième étape, la modélisation : cette étape de construction du modèle utilise huit algorithmes d’apprentissage machine (régression, arbres de décision, réseau de neurones…). Les huit méthodes sont appliquées et proposées, et un score de pertinence leur est attribué.
- Enfin, dernière étape, appliquer la modélisation à de nouvelles données : une fois l’un des modèles choisi, on télécharge un nouveau jeu de données, correspondant à celles que l’on souhaite prévoir. Évidemment, dans ce jeu de données, la cible n’est pas présente. Le système génère un nouveau fichier, dans lequel il ajoute sa prévision concernant la variable cible, et un coefficient de probabilité.
Fonctionnant en mode hébergé, ClearPredictions en est encore à ses débuts. Vous pouvez le tester gratuitement et vérifier qu’il répond à vos besoins. Par la suite, sous forme d’abonnement, vous pourrez choisir la formule qui dépend de votre usage : à partir de 95$/mois pour deux modèles et 25 000 prédictions et jusqu’à 3 000$/mois pour 50 modèles et 7,5 millions de prédictions.
La semaine prochaine, vous retrouverez dans Decideo une interview de Onno Pistorius, créateur de ClearPredictions.