Produire des modèles prédictifs en continu est possible grâce à MLOps


Rédigé par Ludovic Blusseau, Dataiku le 17 Décembre 2020

En ajoutant aux déploiements opérationnels une couche d’apprentissage automatique, ceux-ci évoluent de façon dynamique en fonction des données. Grace à ce concept baptisé MLOps, les entreprises déploient des modèles apprenant mieux adaptés aux besoins des métiers.



Ludovic Blusseau, Directeur du Sales Engineering Europe du Sud chez Dataiku
Historiquement, le développement et la livraison d'applications suit un ensemble d’étapes successives bien établi. Une phase de spécifications, suivie d’une phase de développement, puis une phase de livraison sur un environnement de production. Le comportement de ces applications est donc déterminé durant la phase de spécification/développement en anticipant toutes les possibilités.

De là des méthodes agiles fonctionnant par itération et de façon incrémentale ont été développées, permettant désormais de produire beaucoup plus rapidement des logiciels. Le concept de DevOps est ainsi né. Depuis deux à trois ans, un nouveau concept voit le jour : le MLOps.

MLOps, ou le déploiement opérationnel dynamique

Contraction de Machine Learning et Operations, MLOps est l’association des processus d’apprentissage automatique et du déploiement opérationnel – Machine Learning et DevOps. En d’autres termes MLOps est un procédé qui gère le déploiement opérationnel de modèles de Machine Learning, qui par essence sont fréquemment remis en cause. Ces derniers, alimentés en continu par de grands volumes de données, ne sont plus figés mais dynamiques et évoluent en fonction des données. Il n’existe pas de configurations préétablies, tout le processus de développement est en itération et soumis en permanence au test & learn. Dès lors qu’une dérive est observée, une meilleure version du modèle est redéployée.

Une organisation transverse indispensable à un projet MLOps

Que ce soit pour son développement, sa maintenance en condition opérationnelle et son suivi au cours du temps, un projet MLOps nécessite de mettre en place une organisation transverse. Celle-ci doit se structurer autour d’une équipe constituée d’experts métiers, de data scientists, de spécialistes du déploiement d’applications et de l’IT. Si regrouper des compétences est somme toute assez facile, créer un dialogue et des échanges au sein d’une telle équipe est beaucoup plus complexe. Et pour cause, les compétences et les langages de ces profils sont si divers qu’ils rencontrent bien souvent des difficultés de communication.

Une solution technique et des bonnes pratiques

Cette problématique trouve sa résolution dans la mise en place de bonnes pratiques et dans le déploiement d’une plateforme adaptée aux spécificités du ML. Cet outil est là pour, non seulement développer le projet ML, mais aussi pour en assurer sa mise en production et la gestion de son cycle de vie. Car un tel projet doit sans cesse être ajusté pour maintenir ses performances et le niveau peut rapidement se dégrader si les données ayant servi à son entraînement évoluent. Donc, pour maintenir la précision des prévisions en production, il est impératif de suivre en continu les performances du modèle et de procéder à des ajustements fréquents. Le MLOps n’est efficace que si le modèle est capable d’automatiser l'entraînement et de redéployer de nouveaux modèles pour les adapter au plus près des besoins des métiers.

Encore peu diffusé, le MLOps commence toutefois à se déployer dans quelques entreprises déjà digitalisées et data driven. Cette technologie est particulièrement bien adaptée au secteur de la banque et assurance notamment dans la gestion du risque et des fraudes. Ces modèles apprenants et régulièrement réévalués permettent en effet d’assurer qu'elles repèrent et captent les cas risqués ou frauduleux. Les Retailers sont également friands de ce type de solutions car elles leur permettent de faire des recommandations pertinentes de produits en ligne à leurs clients.

Cette méthodologie est donc bénéfique à plus d’un titre. Non seulement elle réduit les effets de bord dus à des modèles non actualisés mais elle permet aussi de faire des prédictions et prévisions plus justes.



Dans la même rubrique :