Hélène Ivanoff, Directeur Associé, Complex Systems
Le terme de citoyen, qui évoque la vie civile, accolé à data scientist, peut surprendre. Il renvoie entre autre à l'idée que quelqu'un sans formation spécifique peut faire le travail d'un data scientist.
En effet, le Gartner le définit précisément comme quelqu'un qui construit des modèles utilisant des techniques analytiques avancées, ou des fonctionnalités prédictives ou descriptives, mais dont la fonction initiale se situe en dehors du domaine des statistiques et de l'analytique.
En effet, le Gartner le définit précisément comme quelqu'un qui construit des modèles utilisant des techniques analytiques avancées, ou des fonctionnalités prédictives ou descriptives, mais dont la fonction initiale se situe en dehors du domaine des statistiques et de l'analytique.
40% des tâches de data science bientôt automatisées ?
Le Gartner prédit qu'à l'horizon 2020, 40% des tâches de data science seront automatisées. Pour lui cette automatisation rendra les technologies de data science accessibles à un nouveau profil de data scientists. En pratique ces nouveaux data scientists, sont aujourd'hui des business analystes ou encore des data analystes, qui auront évolué grâce à l'apparition de solutions analytiques plus simples. Toujours selon le Gartner, la clé de la simplicité est l'automatisation des tâches répétitives et manuelles, et qui ne requièrent pas d'expertise approfondie en data science.
Cette tendance ne concerne d'ailleurs pas que la data science mais bien l'ensemble de l'activité humaine. Pour s'en convaincre, il suffit de penser aux automates bancaires, à la génération automatique de nouvelles pour la presse, ou les chatbots qui répondent à nos questions... Bien entendu pas question de remplacer l'humain, mais d'avoir recours à un algorithme bien plus efficace pour les 80% de ses activités simples et répétitives.
Cette tendance ne concerne d'ailleurs pas que la data science mais bien l'ensemble de l'activité humaine. Pour s'en convaincre, il suffit de penser aux automates bancaires, à la génération automatique de nouvelles pour la presse, ou les chatbots qui répondent à nos questions... Bien entendu pas question de remplacer l'humain, mais d'avoir recours à un algorithme bien plus efficace pour les 80% de ses activités simples et répétitives.
L'automatisation de la data science déjà en marche !
A COMPLEX SYSTEMS, nous réfléchissons et travaillons à la simplification des solutions de datamining et data science depuis plus de 15 ans. Dès 2002 la solution DataLab dédiée à l'analyste marketing était une première réponse, qui a su convaincre aussi bien des dataminers que des profils métier.
De notre point de vue, la clé de la simplicité va au-delà de la seule élimination des tâches répétitives. Car la complexité des process de data science concerne, au-delà des traitements de données, la manière d'aborder une problématique métier. En conséquence :
- la simplification passe par la réduction du champ des possibles : une solution de data science générique aura peu de chances d'être simple car elle doit prendre en compte des cas de figures très différents. Le premier enseignement est donc de développer une solution qui répond à une catégorie de problématiques clairement délimitée
- la simplification concerne aussi l'accès au mode de raisonnement data science, ce qui implique de décomposer la réflexion en étapes simples. Et cela suppose une expertise particulière du champ d'application de la solution.
Notre expertise en data science et notre activité reconnue de R&D nous ont aujourd'hui conduits à imaginer KNOWLBOX, qui répond à la prédiction du Gartner, et même la dépasse : KNOWLBOX simplifie l'accès à l'analytique, mais pas seulement en automatisant des tâches répétitives.
KNOWLBOX est en effet d'une part une solution verticale, dédiée aux problématiques marketing, que nous connaissons bien pour avoir réalisé des milliers d'analyses, d'autre part intègre un véritable système expert analytique, qui réduit le besoin de compétences en data science pour utiliser la solution.
La simplification des solutions analytiques via l'automatisation des process offre donc l'accès à la data science à de nouveaux profils, qu'on les qualifie ou non de citoyens. Même si ces nouveaux profils ne remplaceront pas à 100% les data scientists en titre, un objectif de 80% est réaliste, et, comme nous le constatons chaque jour, c'est déjà une révolution pour les entreprises.
De notre point de vue, la clé de la simplicité va au-delà de la seule élimination des tâches répétitives. Car la complexité des process de data science concerne, au-delà des traitements de données, la manière d'aborder une problématique métier. En conséquence :
- la simplification passe par la réduction du champ des possibles : une solution de data science générique aura peu de chances d'être simple car elle doit prendre en compte des cas de figures très différents. Le premier enseignement est donc de développer une solution qui répond à une catégorie de problématiques clairement délimitée
- la simplification concerne aussi l'accès au mode de raisonnement data science, ce qui implique de décomposer la réflexion en étapes simples. Et cela suppose une expertise particulière du champ d'application de la solution.
Notre expertise en data science et notre activité reconnue de R&D nous ont aujourd'hui conduits à imaginer KNOWLBOX, qui répond à la prédiction du Gartner, et même la dépasse : KNOWLBOX simplifie l'accès à l'analytique, mais pas seulement en automatisant des tâches répétitives.
KNOWLBOX est en effet d'une part une solution verticale, dédiée aux problématiques marketing, que nous connaissons bien pour avoir réalisé des milliers d'analyses, d'autre part intègre un véritable système expert analytique, qui réduit le besoin de compétences en data science pour utiliser la solution.
La simplification des solutions analytiques via l'automatisation des process offre donc l'accès à la data science à de nouveaux profils, qu'on les qualifie ou non de citoyens. Même si ces nouveaux profils ne remplaceront pas à 100% les data scientists en titre, un objectif de 80% est réaliste, et, comme nous le constatons chaque jour, c'est déjà une révolution pour les entreprises.