Emmanuelle Claeys, Consultante mc2i Groupe
Le commencement
Démarrons en 2012 lorsque des projets ont commencé à voir le jour sur un sujet encore peu connu : l'Opinion Mining. L'idée était de créer un modèle d'analyse basé sur les échanges collectifs « peer to peer » présents dans les réseaux sociaux et les blogs.
L'Opinion Mining peut se définir comme une sous-discipline informatique, à la frontière avec l'analyse linguistique, permettant de répondre aux questions suivantes :
- Quelle est la partie du message exprimant une opinion ?
- Qui est l'auteur ?
- Quelle partie du texte a été commentée ?
Les experts avaient compris que l'explosion des réseaux sociaux permettrait aux internautes de faire entendre leurs avis. Mais le problème n'était finalement pas tant la quantité de données que la façon de les analyser : interpréter le langage humain reste, encore aujourd'hui, un challenge important, tant par la richesse d'une langue que par ses subtilités.
Quel est le support permettant de faire ces analyses ?
Twitter reste le réseau social permettant la meilleure analyse des messages de ses utilisateurs. Les messages sont généralement courts et assez clairs, et le principe de retweetage permet de mesurer l’impact d’une publication. De plus, Twitter met en open source des archives de ses tweets, permettant à des systèmes d’analyses de données de faire rapidement des reporting.
Autre outil d’analyse, Google Trends, issu de Google Labs, permet de connaître la fréquence de recherche d’un terme dans Google, avec la possibilité de visualiser ces données par région et par langue.
Mais alors comment extraire les informations des messages ?
Stefan Gindl et Arno Scharl de la MODUL University de Vienne ont développé une méthodologie d'analyse de textes complexes qui comprend les étapes suivantes :
1. Identifier les termes qui peuvent être ambigus en fonction du sentiment du rédacteur
2. Fournir des informations sur le contexte et l'intégrer dans le processus d'apprentissage automatique.
3. Contribuer à une intelligence artificielle basée sur la logique formelle.
Depuis quelques années, de nombreux scientifiques et sociologues ont fait progresser les logiciels d'Opinion Mining. Il reste néanmoins de nombreux défis encore difficiles à relever, notamment :
- Le filtrage des spams et des doublons ;
- Le développement de l'apprentissage autonome des machines et leur intelligence artificielle ;
- La détection de l'ironie.
Un visuel avec Hedonometer.org
Hedonometer est basé sur les travaux de recherche de Peter Dodds et Chris Danforth de la University of Vermont. Cet outil sélectionne un échantillon des derniers tweets publiés et injecte les mots écrits en anglais dans un système d’analyse qui attribue à chaque message un score de « bonheur » sur la base des mots qu'il contient.
Démarrons en 2012 lorsque des projets ont commencé à voir le jour sur un sujet encore peu connu : l'Opinion Mining. L'idée était de créer un modèle d'analyse basé sur les échanges collectifs « peer to peer » présents dans les réseaux sociaux et les blogs.
L'Opinion Mining peut se définir comme une sous-discipline informatique, à la frontière avec l'analyse linguistique, permettant de répondre aux questions suivantes :
- Quelle est la partie du message exprimant une opinion ?
- Qui est l'auteur ?
- Quelle partie du texte a été commentée ?
Les experts avaient compris que l'explosion des réseaux sociaux permettrait aux internautes de faire entendre leurs avis. Mais le problème n'était finalement pas tant la quantité de données que la façon de les analyser : interpréter le langage humain reste, encore aujourd'hui, un challenge important, tant par la richesse d'une langue que par ses subtilités.
Quel est le support permettant de faire ces analyses ?
Twitter reste le réseau social permettant la meilleure analyse des messages de ses utilisateurs. Les messages sont généralement courts et assez clairs, et le principe de retweetage permet de mesurer l’impact d’une publication. De plus, Twitter met en open source des archives de ses tweets, permettant à des systèmes d’analyses de données de faire rapidement des reporting.
Autre outil d’analyse, Google Trends, issu de Google Labs, permet de connaître la fréquence de recherche d’un terme dans Google, avec la possibilité de visualiser ces données par région et par langue.
Mais alors comment extraire les informations des messages ?
Stefan Gindl et Arno Scharl de la MODUL University de Vienne ont développé une méthodologie d'analyse de textes complexes qui comprend les étapes suivantes :
1. Identifier les termes qui peuvent être ambigus en fonction du sentiment du rédacteur
2. Fournir des informations sur le contexte et l'intégrer dans le processus d'apprentissage automatique.
3. Contribuer à une intelligence artificielle basée sur la logique formelle.
Depuis quelques années, de nombreux scientifiques et sociologues ont fait progresser les logiciels d'Opinion Mining. Il reste néanmoins de nombreux défis encore difficiles à relever, notamment :
- Le filtrage des spams et des doublons ;
- Le développement de l'apprentissage autonome des machines et leur intelligence artificielle ;
- La détection de l'ironie.
Un visuel avec Hedonometer.org
Hedonometer est basé sur les travaux de recherche de Peter Dodds et Chris Danforth de la University of Vermont. Cet outil sélectionne un échantillon des derniers tweets publiés et injecte les mots écrits en anglais dans un système d’analyse qui attribue à chaque message un score de « bonheur » sur la base des mots qu'il contient.
Analyse de Hebdonometer sur l’attentat de Charlie Hebdo (source : hedonometer.org)
L'Opinion Mining : Business et Politique.
L’Opinion Mining permet de mettre en avant la popularité d'un produit, l'impact d'un bad buzz, les conséquences d'une action politique, etc. Des techniques permettent de déterminer la véracité d'un élément d'information en se basant sur la réputation de son émetteur ainsi que le volume d’opinion en désaccord avec cette information.
En conclusion, nous pourrions relancer le débat suivant : les émotions peuvent-elles être calculées ? Chacun pourra se faire son opinion, mais il est certain que nombreux sont ceux qui pensent que oui et ont bien l’intention d’investir dans cette technologie.
Sources
http://davidamerland.com/seo-tips/977-sentiment-analysis-in-semantic-search-find-out-what-others-are-thinking-about-your-brand.html
https://cloud.google.com/prediction/docs/sentiment_analysis
http://www.franceinfo.fr/emission/nouveau-monde/2014-2015/comprendre-l-influence-du-temps-sur-le-moral-grace-twitter-17-11-2014-06-50
L’Opinion Mining permet de mettre en avant la popularité d'un produit, l'impact d'un bad buzz, les conséquences d'une action politique, etc. Des techniques permettent de déterminer la véracité d'un élément d'information en se basant sur la réputation de son émetteur ainsi que le volume d’opinion en désaccord avec cette information.
En conclusion, nous pourrions relancer le débat suivant : les émotions peuvent-elles être calculées ? Chacun pourra se faire son opinion, mais il est certain que nombreux sont ceux qui pensent que oui et ont bien l’intention d’investir dans cette technologie.
Sources
http://davidamerland.com/seo-tips/977-sentiment-analysis-in-semantic-search-find-out-what-others-are-thinking-about-your-brand.html
https://cloud.google.com/prediction/docs/sentiment_analysis
http://www.franceinfo.fr/emission/nouveau-monde/2014-2015/comprendre-l-influence-du-temps-sur-le-moral-grace-twitter-17-11-2014-06-50