Actualités : analyse de données, Business Intelligence, Data Science, Big Data


Le Projet MLflow de Databricks rejoint la Fondation Linux


Rédigé par Communiqué de Databricks le 29 Juin 2020

La première plateforme de machine learning de bout en bout compte plus de 2 millions de téléchargements par mois et plus de 200 contributeurs en seulement 2 ans.



La Fondation Linux, l'organisation à but non lucratif qui favorise l'innovation de masse grâce à l'open source, annonce que MLflow, une plateforme open source de machine learning (ML) créée par Databricks, rejoint la Fondation Linux. Depuis son introduction à la conférence Spark + AI Summit il y a deux ans, MLflow connait un engagement communautaire impressionnant de la part de plus de 200 contributeurs et compte plus de 2 millions de téléchargements par mois, soit un taux de croissance annuel multiplié par 4. La Fondation Linux est un consortium indépendant de tout fournisseur selon un modèle de gouvernance ouvert pour étendre encore davantage l'adoption et les contributions au projet MLflow.

« L'augmentation constante de l'engagement communautaire montre la volonté des équipes data à construire la plateforme de machine learning du futur. Le taux d'adoption démontre la nécessité d'une approche open source pour standardiser le cycle de vie du machine learning, » déclare Michael Dolan, vice-président des programmes stratégiques de la Fondation. « Notre expérience de travail avec les plus grands projets open source au niveau mondial montre qu'un modèle de gouvernance ouvert permet une innovation et une adoption plus rapides grâce à une large contribution de l'industrie et une recherche de consensus ».

Databricks a créé MLflow en réponse au processus compliqué de développement des modèles de ML. Traditionnellement, le processus de conception, formation, réglage, déploiement et gestion des modèles de ML était extrêmement difficile pour les data scientists et les développeurs. Contrairement au développement traditionnel de logiciels qui ne concerne que les versions de code, les modèles ML doivent également suivre les versions des jeux de données, des paramètres des modèles et des algorithmes, ce qui crée un ensemble de variables exponentiellement plus important à suivre et à gérer. En outre, le ML est très itératif et repose sur une étroite collaboration entre les équipes data et les équipes chargées des applications. MLflow permet d'éviter que ce processus ne devienne trop lourd en fournissant une plateforme pour gérer le cycle de développement du ML de bout en bout, de la préparation des données au déploiement en production, en passant par le suivi des expériences, le packaging du code en suites reproductibles, le partage des modèles et la collaboration.

Matei Zaharia, le créateur à l’origine d'Apache Spark et de MLflow, a partagé la nouvelle avec la communauté data lors de sa keynote à la conférence Spark + AI Summit :

« MLflow est devenu le standard open source pour les plateformes de machine learning grâce à la communauté de contributeurs, qui se compose de centaines d'ingénieurs issus de plus d'une centaine d'entreprises. Le machine learning transforme toutes les grandes industries et influence des milliards de décisions dans le retail, la finance et la santé. Notre décision de contribuer à MLflow pour la Fondation Linux est une invitation à la communauté du machine learning à intégrer les bonnes pratiques d'ingénierie ML au sein d’une plate-forme standard ouverte, collaborative et de bout en bout. »

Parmi les organisations présentant leur expérience de MLflow au Spark+ AI Summit, citons : Starbucks, Exxonmobil, T-Mobile et Accenture. De nouvelles fonctionnalités qui continuent à simplifier MLflow et le cycle de vie de ML sont également annoncées aujourd'hui, notamment l'autologging pour des expérimentations, ainsi que de nouvelles fonctionnalités de gestion et de déploiement des modèles dans le registre des modèles MLflow.




Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store