Le Projet MLflow de Databricks rejoint la Fondation Linux

La Fondation Linux, l'organisation à but non lucratif qui favorise l'innovation de masse grâce à l'open source, annonce que MLflow, une plateforme open source de machine learning (ML) créée par Databricks, rejoint la Fondation Linux. Depuis son introduction à la conférence Spark + AI Summit il y a deux ans, MLflow connait un engagement communautaire impressionnant de la part de plus de 200 contributeurs et compte plus de 2 millions de téléchargements par mois, soit un taux de croissance annuel multiplié par 4. La Fondation Linux est un consortium indépendant de tout fournisseur selon un modèle de gouvernance ouvert pour étendre encore davantage l'adoption et les contributions au projet MLflow.

« L'augmentation constante de l'engagement communautaire montre la volonté des équipes data à construire la plateforme de machine learning du futur. Le taux d'adoption démontre la nécessité d'une approche open source pour standardiser le cycle de vie du machine learning, » déclare Michael Dolan, vice-président des programmes stratégiques de la Fondation. « Notre expérience de travail avec les plus grands projets open source au niveau mondial montre qu'un modèle de gouvernance ouvert permet une innovation et une adoption plus rapides grâce à une large contribution de l'industrie et une recherche de consensus ».

Databricks a créé MLflow en réponse au processus compliqué de développement des modèles de ML. Traditionnellement, le processus de conception, formation, réglage, déploiement et gestion des modèles de ML était extrêmement difficile pour les data scientists et les développeurs. Contrairement au développement traditionnel de logiciels qui ne concerne que les versions de code, les modèles ML doivent également suivre les versions des jeux de données, des paramètres des modèles et des algorithmes, ce qui crée un ensemble de variables exponentiellement plus important à suivre et à gérer. En outre, le ML est très itératif et repose sur une étroite collaboration entre les équipes data et les équipes chargées des applications. MLflow permet d'éviter que ce processus ne devienne trop lourd en fournissant une plateforme pour gérer le cycle de développement du ML de bout en bout, de la préparation des données au déploiement en production, en passant par le suivi des expériences, le packaging du code en suites reproductibles, le partage des modèles et la collaboration.

Matei Zaharia, le créateur à l’origine d'Apache Spark et de MLflow, a partagé la nouvelle avec la communauté data lors de sa keynote à la conférence Spark + AI Summit :

« MLflow est devenu le standard open source pour les plateformes de machine learning grâce à la communauté de contributeurs, qui se compose de centaines d'ingénieurs issus de plus d'une centaine d'entreprises. Le machine learning transforme toutes les grandes industries et influence des milliards de décisions dans le retail, la finance et la santé. Notre décision de contribuer à MLflow pour la Fondation Linux est une invitation à la communauté du machine learning à intégrer les bonnes pratiques d'ingénierie ML au sein d’une plate-forme standard ouverte, collaborative et de bout en bout. »

Parmi les organisations présentant leur expérience de MLflow au Spark+ AI Summit, citons : Starbucks, Exxonmobil, T-Mobile et Accenture. De nouvelles fonctionnalités qui continuent à simplifier MLflow et le cycle de vie de ML sont également annoncées aujourd'hui, notamment l'autologging pour des expérimentations, ainsi que de nouvelles fonctionnalités de gestion et de déploiement des modèles dans le registre des modèles MLflow.

Autres articles

Le Projet MLflow de Databricks rejoint la Fondation Linux

La première plateforme de machine learning de bout en bout compte plus de 2 millions de téléchargements par mois et plus de 200 contributeurs en seulement 2 ans.

Celonis s'associe à Databricks pour optimiser une IA d'entreprise qui améliore en continu les opérations

Apache Kafka : 15 ans pour réconcilier la technique et le métier

Starburst étend les data products Iceberg aux environnements on-premises et hybrides

Databricks et OpenAI annoncent un partenariat stratégique pour démocratiser l’IA de dernière génération grâce à Databricks Agent Bricks

Snowflake lance Snowpark Connect pour Apache Spark

Selon une étude de Finextra et Cloudera, 91 % des institutions financières considèrent l’IA hybride comme fortement créatrice de valeur, en faisant la nouvelle norme du secteur - 12/11/2025

Informatica collabore avec Emirates Flight Catering pour mettre en place un service de restauration plus intelligent et axé sur les données - 12/11/2025

Celonis s'associe à Databricks pour optimiser une IA d'entreprise qui améliore en continu les opérations - 12/11/2025

Snowflake annonce de nouvelles innovations pour accélérer le développement d’applications d’IA agentique de niveau entreprise - 12/11/2025

Qualtrics fait évoluer sa gouvernance d’IA pour soutenir l'innovation sur mesure et les retours clients - 12/11/2025