À l’évocation du mot « GPT-3 », on pourrait croire qu’il s’agit d’un nouveau personnage droïde inventé par George Lucas dans son dernier opus de l’univers Star Wars.
S’il n’est pas près de jouer le rôle principal dans la mini-série Obi-Wan Kinobi, diffusée en streaming sur Disney+, GPT-3 compte bien avoir un impact sur le monde, à sa manière.
Car GPT-3 – c’est-à-dire, pour être précis, l’acronyme de Generative Pre-trained Transformer-3 – est un type d’intelligence artificielle (IA) relativement récent qui évolue très rapidement. Il est en passe de devenir la prochaine grande technologie à usage généralisé.
Connue sous le nom d’ « IA fondamentale », cette technologie – dans sa version de base – intègre déjà certaines de nos tâches quotidiennes. C’est le cas des textes prédictifs, par exemple.
Selon The Economist, tandis que près de 80 % de l'ensemble de la recherche sur l’IA est axée sur l’IA fondamentale, l’IA est appelée à s'immiscer dans de nombreuses activités humaines, pour par exemple « coder ou découvrir des médicaments ».
Alors, qu’est-ce que le GPT-3 exactement ? Et quel est le potentiel de l’IA fondamentale ?
Développé par OpenAI, un laboratoire de recherche en intelligence artificielle basé à San Francisco, GPT3 a vu le jour en juillet 2020. Ce modèle de langage de troisième génération – dernier né de la série des modèles GPT – contient jusqu’à 170 milliards de paramètres. En s’appuyant sur le deep learning, GPT3 est capable de produire un texte semblable à celui d’un humain, à tel point qu’il peut être difficile de déterminer s’il a été écrit par un humain ou non.
S’il s’agissait à l’époque du premier modèle d’IA fondamental jamais créé, il a depuis été rejoint par ses « cousins » tels que LaMDA, DALL-E et ERNIE, pour n’en citer que quelques-uns.
Quelques mois après le développement de GPT-3, Microsoft a annoncé l’obtention d’une licence d’utilisation « exclusive » du modèle sous-jacent de GPT-3. Mais aujourd’hui, grâce à l’évolution réussie du modèle et de l’IA fondamentale en tant que concept, le modèle a attiré l’attention d’autres grands acteurs du marché qui ont pris conscience de son potentiel. C’est le cas de Google, qui a lancé PaLM en avril de cette année.
Pourquoi on n’en parle-t-on que maintenant ?
Les progrès substantiels réalisés dans le domaine de l’ingénierie matérielle ont permis d’envisager une utilisation commerciale plus large du modèle de l’IA Fondamentale. Certains ont même suggéré qu’il pourrait s’agir d’une révolution industrielle à part entière. Une révolution dont l’impact serait équivalent à celle du charbon en 1765, du gaz en 1870, de l’électronique et du nucléaire en 1969 et de l’internet et des énergies renouvelables en 2000.
Parce qu’il a la capacité de générer un impact économique de grande ampleur, ce modèle constitue un tournant majeur dans le développement des capacités de l’IA.
Sans compter que ces nouvelles capacités sont en train de devenir accessible à un nombre croissant de personnes et d’organisations. Comme la puissance de traitement des ordinateurs augmente rapidement d’année en année tandis que les coûts de traitement des données diminuent en parallèle (l’IA en tant que telle requiert moins de temps et d’énergie pour exécuter ses analyses de données), elle devient moins chère à exploiter et donc plus accessible.
En somme, en touchant un plus grand nombre de personnes, elle augmente son potentiel. Et comme vous pouvez l'imaginer, la récompense sera d’autant plus grande pour le vainqueur de cette course technologique.
S’il n’est pas près de jouer le rôle principal dans la mini-série Obi-Wan Kinobi, diffusée en streaming sur Disney+, GPT-3 compte bien avoir un impact sur le monde, à sa manière.
Car GPT-3 – c’est-à-dire, pour être précis, l’acronyme de Generative Pre-trained Transformer-3 – est un type d’intelligence artificielle (IA) relativement récent qui évolue très rapidement. Il est en passe de devenir la prochaine grande technologie à usage généralisé.
Connue sous le nom d’ « IA fondamentale », cette technologie – dans sa version de base – intègre déjà certaines de nos tâches quotidiennes. C’est le cas des textes prédictifs, par exemple.
Selon The Economist, tandis que près de 80 % de l'ensemble de la recherche sur l’IA est axée sur l’IA fondamentale, l’IA est appelée à s'immiscer dans de nombreuses activités humaines, pour par exemple « coder ou découvrir des médicaments ».
Alors, qu’est-ce que le GPT-3 exactement ? Et quel est le potentiel de l’IA fondamentale ?
Développé par OpenAI, un laboratoire de recherche en intelligence artificielle basé à San Francisco, GPT3 a vu le jour en juillet 2020. Ce modèle de langage de troisième génération – dernier né de la série des modèles GPT – contient jusqu’à 170 milliards de paramètres. En s’appuyant sur le deep learning, GPT3 est capable de produire un texte semblable à celui d’un humain, à tel point qu’il peut être difficile de déterminer s’il a été écrit par un humain ou non.
S’il s’agissait à l’époque du premier modèle d’IA fondamental jamais créé, il a depuis été rejoint par ses « cousins » tels que LaMDA, DALL-E et ERNIE, pour n’en citer que quelques-uns.
Quelques mois après le développement de GPT-3, Microsoft a annoncé l’obtention d’une licence d’utilisation « exclusive » du modèle sous-jacent de GPT-3. Mais aujourd’hui, grâce à l’évolution réussie du modèle et de l’IA fondamentale en tant que concept, le modèle a attiré l’attention d’autres grands acteurs du marché qui ont pris conscience de son potentiel. C’est le cas de Google, qui a lancé PaLM en avril de cette année.
Pourquoi on n’en parle-t-on que maintenant ?
Les progrès substantiels réalisés dans le domaine de l’ingénierie matérielle ont permis d’envisager une utilisation commerciale plus large du modèle de l’IA Fondamentale. Certains ont même suggéré qu’il pourrait s’agir d’une révolution industrielle à part entière. Une révolution dont l’impact serait équivalent à celle du charbon en 1765, du gaz en 1870, de l’électronique et du nucléaire en 1969 et de l’internet et des énergies renouvelables en 2000.
Parce qu’il a la capacité de générer un impact économique de grande ampleur, ce modèle constitue un tournant majeur dans le développement des capacités de l’IA.
Sans compter que ces nouvelles capacités sont en train de devenir accessible à un nombre croissant de personnes et d’organisations. Comme la puissance de traitement des ordinateurs augmente rapidement d’année en année tandis que les coûts de traitement des données diminuent en parallèle (l’IA en tant que telle requiert moins de temps et d’énergie pour exécuter ses analyses de données), elle devient moins chère à exploiter et donc plus accessible.
En somme, en touchant un plus grand nombre de personnes, elle augmente son potentiel. Et comme vous pouvez l'imaginer, la récompense sera d’autant plus grande pour le vainqueur de cette course technologique.
La controverse n’est jamais loin...
Stuart Dorman, Responsable de l’innovation du Groupe Sabio.
Bien sûr, comme pour tout ce qui a le potentiel de changer le monde, le modèle d’IA fondamentale ne manque pas de susciter des controverses.
Dernièrement (en juin 2022), la question a surgi dans le débat public lorsqu’un ingénieur de Google – qui travaillait sur LaMDA, l’un des cousins de GTP-3 évoqué plus haut – a été mis en congé pour avoir affirmé que l’IA était devenue « sensible ».
Je ne pense pas que nous soyons sur le point d’assister à la transformation d’un robot, ou de toute autre IA, en un « être » sensible capable d’appréhender son environnement, d’avoir des sentiments et d’être « vivant ».
Mais le fait est là : nous approchons du moment où la technologie de l’IA sera si performante qu’il sera impossible pour un humain de distinguer s’il a une conversation avec un robot ou avec un être humain. L’accomplissement du test de Turing vient de faire un pas – voire quelques pas – de plus...
Chez Sabio, nous pensons que l'IA fondamentale a un énorme potentiel pour apporter de la valeur au monde de l’expérience client. Car il serait logique de déployer cette technologie là où des millions de conversations ont lieu chaque jour (que ce soit à travers les interactions de messagerie digitale ou au sein des centres de contact).
Cela permettrait aux entreprises de mettre enfin à profit les quantités énormes de données issues des appels enregistrés et des conversations par chat recueillies depuis de nombreuses années. Ces données pourraient permettre d’entraîner ces nouveaux modèles à générer automatiquement des réponses aux questions plutôt que d’interpréter les intentions des clients et d’y faire correspondre des réponses prédéfinies – ce qui correspond dans les grandes lignes aux usages actuel de l’IA conversationnelle.
L’IA pourrait ainsi passer à la vitesse supérieure, non seulement par le biais de bots vocaux ou de chat, mais aussi avec pour objectif d’améliorer l’expérience des employés. Elle pourrait suggérer la meilleure façon de répondre aux demandes des clients, tout en supprimant ou en réduisant la nécessité de taper sur un clavier, ce qui permettrait de réaliser d’énormes gains de productivité.
C’est un sujet que je compte bien explorer plus en profondeur dans un prochain billet !
Dernièrement (en juin 2022), la question a surgi dans le débat public lorsqu’un ingénieur de Google – qui travaillait sur LaMDA, l’un des cousins de GTP-3 évoqué plus haut – a été mis en congé pour avoir affirmé que l’IA était devenue « sensible ».
Je ne pense pas que nous soyons sur le point d’assister à la transformation d’un robot, ou de toute autre IA, en un « être » sensible capable d’appréhender son environnement, d’avoir des sentiments et d’être « vivant ».
Mais le fait est là : nous approchons du moment où la technologie de l’IA sera si performante qu’il sera impossible pour un humain de distinguer s’il a une conversation avec un robot ou avec un être humain. L’accomplissement du test de Turing vient de faire un pas – voire quelques pas – de plus...
Chez Sabio, nous pensons que l'IA fondamentale a un énorme potentiel pour apporter de la valeur au monde de l’expérience client. Car il serait logique de déployer cette technologie là où des millions de conversations ont lieu chaque jour (que ce soit à travers les interactions de messagerie digitale ou au sein des centres de contact).
Cela permettrait aux entreprises de mettre enfin à profit les quantités énormes de données issues des appels enregistrés et des conversations par chat recueillies depuis de nombreuses années. Ces données pourraient permettre d’entraîner ces nouveaux modèles à générer automatiquement des réponses aux questions plutôt que d’interpréter les intentions des clients et d’y faire correspondre des réponses prédéfinies – ce qui correspond dans les grandes lignes aux usages actuel de l’IA conversationnelle.
L’IA pourrait ainsi passer à la vitesse supérieure, non seulement par le biais de bots vocaux ou de chat, mais aussi avec pour objectif d’améliorer l’expérience des employés. Elle pourrait suggérer la meilleure façon de répondre aux demandes des clients, tout en supprimant ou en réduisant la nécessité de taper sur un clavier, ce qui permettrait de réaliser d’énormes gains de productivité.
C’est un sujet que je compte bien explorer plus en profondeur dans un prochain billet !