Alibaba DAMO Academy, le programme de recherche mondiale du Groupe Alibaba, annonce une percée majeure dans les capacités automatiques de lecture (machine-reading) des intelligences artificielles. Le modèle de traitement du langage naturel (Natural Language Processing - NLP) d’Alibaba Damo Academy est arrivé en tête du classement GLUE du 3 mars dernier. Le modèle d'Alibaba a également surpassé de manière significative les meilleurs scores obtenus par l’être humain, marquant une étape importante dans le développement de systèmes robustes de compréhension du langage naturel.
Benchmark de référence dans l’industrie, le classement GLUE est considéré comme le premier test à faire passer à un modèle NLP car il permet de déterminer l’efficacité d’un modèle de traitement du langage naturel.
Le modèle NLP de DAMO a déjà été largement déployé dans l'écosystème d'Alibaba afin d'améliorer les capacités AI de ses chatbots dédiés aux services clients et aux outils de recherche des plateformes retail d'Alibaba. Il a aussi permis de réaliser une analyse de données anonymes sur les soins de santé. Le modèle est utilisé pour l’analyse textuelle de dossiers médicaux anonymes et d’enquêtes épidémiologiques faites par une agence du gouvernement américain, le Centers for Disease Control and Prevention (CDC) dans différentes villes de Chine pour lutter contre le COVID-19.
« Déjà implémenté au coeur des différentes activités d'Alibaba au service de millions de clients, le NLP est une technologie primordiale à développer. Elle est devenue essentielle dans la lutte contre le coronavirus COVID-19 », a déclaré Si Luo, responsable de la recherche NLP d’Alibaba DAMO Academy. « Nous sommes ravis de cette nouvelle percée technologique dans le domaine du NLP et nous espérons que notre contribution à l’évolution de cette technologie de pointe pourra aider la communauté pendant cette période difficile. »
Le GLUE, “General Language Understanding Evaluation” est un benchmark d’évaluation et d’analyse des systèmes NLP qui attire les principaux acteurs mondiaux de la recherche en intelligence artificielle tels que Google, Facebook, Microsoft et Standard. Le modèle de machine learning à tâches multiples d’Alibaba, StructBERT, intègre des structures de mots et de phrases. Il donne des résultats empiriques impressionnants sur une variété de tâches « downstream » permettant d’atteindre une note de 90,3 sur le benchmark du test GLUE - surpassant ainsi même les références humaines qui n’atteignent que le score de 87,1. Elle permet également de renforcer les performances de nombreuses applications de compréhension linguistique, telles que l'analyse des sentiments, l'implication textuelle et les questions-réponses.
A noter que n'est pas la première fois que le modèle de machine learning d'Alibaba dépasse les autres. Le 20 juin dernier, le 2019, le modèle d'Alibaba a battu les scores obtenus par des humains lors du Microsoft Machine Reading Comprehension dataset, qui est reconnu comme l’un des tests de compréhension de lecture basé sur l’intelligence artificielle les plus challengeants au monde. En 2018, Alibaba a également obtenu un score supérieur à ceux obtenus par les meilleurs humains dans le cadre du Dataset Stanford Question Answering qui est également l'un des défis les plus populaires en matière de compréhension machine-reading au monde.
Au cours des derniers mois, Alibaba a utilisé ses technologies propriétaires pour aider à contenir le coronavirus. Alibaba DAMO Academy s'est associée à des institutions médicales chinoises pour développer un système qui puisse accélérer le diagnostic et l'analyse du virus.
En février, Alibaba Cloud a mis gratuitement à disposition des institutions de recherche mondiales sa plateforme IA dans le cloud pour accélérer le séquençage des gènes du virus, le criblage des protéines et d'autres types de recherches sur le traitement ou la prévention du virus.
Benchmark de référence dans l’industrie, le classement GLUE est considéré comme le premier test à faire passer à un modèle NLP car il permet de déterminer l’efficacité d’un modèle de traitement du langage naturel.
Le modèle NLP de DAMO a déjà été largement déployé dans l'écosystème d'Alibaba afin d'améliorer les capacités AI de ses chatbots dédiés aux services clients et aux outils de recherche des plateformes retail d'Alibaba. Il a aussi permis de réaliser une analyse de données anonymes sur les soins de santé. Le modèle est utilisé pour l’analyse textuelle de dossiers médicaux anonymes et d’enquêtes épidémiologiques faites par une agence du gouvernement américain, le Centers for Disease Control and Prevention (CDC) dans différentes villes de Chine pour lutter contre le COVID-19.
« Déjà implémenté au coeur des différentes activités d'Alibaba au service de millions de clients, le NLP est une technologie primordiale à développer. Elle est devenue essentielle dans la lutte contre le coronavirus COVID-19 », a déclaré Si Luo, responsable de la recherche NLP d’Alibaba DAMO Academy. « Nous sommes ravis de cette nouvelle percée technologique dans le domaine du NLP et nous espérons que notre contribution à l’évolution de cette technologie de pointe pourra aider la communauté pendant cette période difficile. »
Le GLUE, “General Language Understanding Evaluation” est un benchmark d’évaluation et d’analyse des systèmes NLP qui attire les principaux acteurs mondiaux de la recherche en intelligence artificielle tels que Google, Facebook, Microsoft et Standard. Le modèle de machine learning à tâches multiples d’Alibaba, StructBERT, intègre des structures de mots et de phrases. Il donne des résultats empiriques impressionnants sur une variété de tâches « downstream » permettant d’atteindre une note de 90,3 sur le benchmark du test GLUE - surpassant ainsi même les références humaines qui n’atteignent que le score de 87,1. Elle permet également de renforcer les performances de nombreuses applications de compréhension linguistique, telles que l'analyse des sentiments, l'implication textuelle et les questions-réponses.
A noter que n'est pas la première fois que le modèle de machine learning d'Alibaba dépasse les autres. Le 20 juin dernier, le 2019, le modèle d'Alibaba a battu les scores obtenus par des humains lors du Microsoft Machine Reading Comprehension dataset, qui est reconnu comme l’un des tests de compréhension de lecture basé sur l’intelligence artificielle les plus challengeants au monde. En 2018, Alibaba a également obtenu un score supérieur à ceux obtenus par les meilleurs humains dans le cadre du Dataset Stanford Question Answering qui est également l'un des défis les plus populaires en matière de compréhension machine-reading au monde.
Au cours des derniers mois, Alibaba a utilisé ses technologies propriétaires pour aider à contenir le coronavirus. Alibaba DAMO Academy s'est associée à des institutions médicales chinoises pour développer un système qui puisse accélérer le diagnostic et l'analyse du virus.
En février, Alibaba Cloud a mis gratuitement à disposition des institutions de recherche mondiales sa plateforme IA dans le cloud pour accélérer le séquençage des gènes du virus, le criblage des protéines et d'autres types de recherches sur le traitement ou la prévention du virus.
Autres articles
-
La sécurité de l’IA, une réelle préoccupation pour les entreprises
-
Alibaba Cloud propose une gamme de LLM de tailles variées dotée de fonctionnalités multimodales
-
Qwen-VL et Qwen-VL-Chat, les tous derniers LLM open-source d'Alibaba Cloud
-
Alibaba Cloud s’engage à nouveau aux côtés de de la communauté open source en offrant 7 milliard de paramètres LLM
-
Alibaba Cloud met à jour AnalyticDB avec un moteur de base de données vectoriel