L'analyse de données contrôlée par la voix : possible grâce aux assistants intelligents ?


Rédigé par Andy Cotgreave, Tableau le 15 Mai 2017

Désormais, plus aucun constructeur de smartphones ne fait l'impasse sur l'assistance vocale. En effet, après Apple avec Siri, Google avec « Ok Google », Amazon avec Alexa au sein du boitier Echo, et Microsoft avec Cortana, Samsung a également présenté il y a un mois son assistant vocal nommé Bixby avec le lancement du Galaxy S8.



Désormais, nous pouvons écouter notre station de radio préférée en demandant à Alexa de l'activer. Pas besoin de bouton ni de de balayage de la bande FM. Plus tard, nos enfants n'arriveront peut-être pas à imaginer que l'on ait été obligé d'appuyer sur un bouton pour écouter de la musique.

La question est bien de savoir si, grâce à ces assistants vocaux, nous pourrions mieux comprendre nos données. Stephen Few, spécialiste de l'analyse visuelle des données (data sensemaking), a récemment publié un article qui explique pourquoi la programmation neurolinguistique (PNL[1]) n'a pas d'avenir en tant qu'outil de saisie capable d'exploiter complètement le sens des données. Effectivement la PNL n'a guère d'avenir, excepté pour répondre à des questions rudimentaires à propos des données, mais cette situation va être amenée à évoluer. Plus les décisions seront tardives, moins nous parviendrons rapidement à cet objectif.

L'exploration des données au travers d'une discussion ?

Tout d'abord, souvenons-nous de la raison pour laquelle nous explorons les données. Les entreprises souhaitent démocratiser l'accès aux données. En revanche, en tant que personne, nous désirons obtenir des informations pertinentes rapidement. Notre objectif est de créer des interfaces aussi intuitives que possible avec les machines, afin que tout le monde puisse trouver les meilleures informations dans ses propres données, même sans disposer d'une formation approfondie.

Il faudra donc être capable d'utiliser le langage naturel pour « naviguer » au fil des données jusqu'aux informations pointilleuses malgré une complexité des questions. Vidya Setlur, chercheuse en PNL, explique : « Il est rare qu'un unique graphique statique suffise pour répondre aux questions d'une personne. Un vaste ensemble de graphiques est créé et exploré pour répondre aux nouvelles questions posées. La capacité de tout système à répondre intelligemment à des questions itératives sans que l'utilisateur soit nécessairement un statisticien qualifié ou un expert en bases de données constitue un paramètre critique. »

Nous pouvons prendre pour exemple un jeu de données sur des manifestations sismiques. La question « Montrez-moi les principaux tremblements de terre qui ont frappé la France » forme un point d'entrée, qui va sûrement se traduire par la création d'une carte. « Et l'Île-de-France ? » est la suite logique de l'interrogation. Le challenge de la PNL est de garder le même contexte entre ces deux questions - et d'autres - tout en nous permettant de parler naturellement en utilisant ce que les chercheurs en intelligence artificielle appellent la pragmatique du langage.

« Cette approche est pleine de promesses, car elle permet de maintenir le flux », explique Vidya. « Grâce au langage naturel, les utilisateurs ont la possibilité de poser des questions plus facilement qu'en les traduisant en commandes transmises via une interface graphique adaptée. »

Pourquoi ne pas donner la possibilité aux usagers de poser des questions complexes à leurs données en utilisant le langage ?

La technologie de reconnaissance vocale touchera forcément de près les développements de la PNL. Cette technologie affiche les performances requises. Il est plus simple d'utiliser la voix que l'écriture via un clavier, pour écrire des textos par exemple. Dès que la reconnaissance vocale sera suffisamment puissante pour que nous puissions échanger avec des données, je serai le premier à débrancher ma souris et mon clavier.

Désormais, nous passons la majorité de notre temps sur nos téléphones mobiles. Pensez à la façon dont nous interagissons avec un smartphone : pas de souris, un clavier peu pratique et des doigts approximatifs. Cette problématique a été soulevée l'année dernière par Elon Musk lors de conférence Code de Recode : « Nous sommes limités par notre système d'entrée/sortie, surtout au niveau de la sortie. Votre niveau de sortie est extrêmement bas, surtout avec deux pouces qui tapotent comme ils peuvent sur le téléphone. Cette lenteur devient ridicule ». C'est pourquoi le travail ne manque vraiment pas dans le domaine de la synthèse vocale (TTS). À terme, c'est-à-dire quand le langage le permettra, il sera tout à fait possible d'analyser des données sur un téléphone.

Bien sûr, tout n'est pas gagné. La plupart des assistants vocaux oublient chaque question dans la seconde qui suit, de sorte qu'il est difficile d'avoir une conversation solide. L'analyse des données par assistance vocale fonctionne uniquement avec les questions les plus simples. Mais souvenez-vous : il y a à peine cinquante ans, personne n'imaginait qu'un ordinateur serait capable de battre un joueur d'échecs. Les machines parviennent également à surclasser les meilleurs joueurs de Go et ont même raflé la mise au poker, un jeu qui repose essentiellement sur le bluff et l'émotion, ainsi que sur la probabilité pure.

Le domaine de la robotique offre bien d'autres exemples qui permettent de mesurer facilement le travail fourni jusqu'à présent. Les succès comme les échecs tiennent à peu de choses, et s'ils ont encore tendance à tomber facilement, parions que les robots parviendront à courir ou à marquer des buts dans un avenir relativement proche.

Une bonne analyse de données repose sur une bonne exploration. Pour échanger avec mes données, je suis encore obligé de passer par une souris, un clavier et une interface graphique. L'idéal serait d'avoir une discussion fréquente avec les données grâce à ma voix. Certaines des premières étapes de la reconnaissance vocale et de la PNL peuvent sembler absurdes. Pourtant, afin de permettre à tous de poser des questions aussi diverses que complexes, sans qu'il soit nécessaire d'avoir une parfaite maîtrise des interfaces sophistiquées, il nous faudra continuer en ce sens.

[1] en anglais Natural Language Processing — NLP. http://www.pnl-nlp.com



Dans la même rubrique :