Modélisation prédictive : l’oracle des Oscars avait-il raison?


Rédigé par le 4 Mars 2014

100 %... oui, c’en est presque inquiétant… mais Farsite avait prédit exactement les gagnants des principaux Oscars de la soirée 2014. En s’appuyant sur des données structurées et non structurées, Farsite a développé un modèle mathématique qui « prédit » les choix artistiques de l’Académie des Oscars. Info ou intox ?



La fameuse "selfie" de la soirée des Oscars qui a fait "exploser" Twitter
Grand jeu à l'occasion de la cérémonie des Oscars qui s'est déroulée il y a 2 jours à Los Angeles, la prédiction des résultats. Comme dans tout bon film de science fiction, la question est de savoir si la machine est capable de modéliser le comportement humain; et de prédire des résultats que l'on imaginait irrationnels. Quoi de plus subjectif que les choix artistiques d'un jury de professionnels du 7eme art... Plusieurs entreprises se sont attachées à démontrer qu'en réalité leurs choix « artistiques » sont parfaitement prévisibles.

La société ICC avait prédit que :
- Matthew McConaughey remporterait l'Oscar du meilleur acteur pour son rôle dans Dallas Buyers Club… elle avait raison ;
- Alfonso Cuaron remporterait l'Oscar du meilleur réalisateur avec Gravity… elle avait raison ;
- 12 Years a Slave serait récompensé par l'Oscar de la meilleure image… elle avait raison ;
- Jared Leto serait Oscarisé meilleur second rôle masculin dans Dallas Buyers Club… elle avait raison ;
- Cate Blanchett meilleure actrice dans Blue Jasmine… elle avait encore raison;
- Lupita Nyong'o meilleur second rôle féminin dans 12 Years a Slave… elle avait toujours raison.
Cela en devient presque suspect… même pas une petite erreur glissée volontairement dans les prédictions pour les rendre plus crédibles ! Mais non, si l’erreur est humaine, elle n’est pas informatique !

Farsite, la division d’analyse de données de ICC, utilise son propre modèle pour prédire ces récompenses. Il s'appuie sur une base de données cinématographique qui couvre 40 années de l'industrie et de remise des Oscars. Il digère par ailleurs des données en temps réel, collectées par exemple sur les médias sociaux.
Selon Farsite, trois facteurs principaux entrent en ligne de compte pour la prédiction des Oscars : les récompenses déjà obtenues dans la saison, le bruit médiatique et social, et les prix précédents des nominés. « C’est étonnant de constater que les mêmes modèles que nous utilisons dans le domaine de la distribution ou de la santé, peuvent prévoir les gagnants des Oscars avec la même précision », explique Ryan McClarren, Chief Science Officer chez ICC
On notera qu'il n'est pas ici question de qualité artistique mais de données collectées dans la vie réelle et virtuelle. C'est un excellent exemple de la différence entre corrélation et causalité. ICC et ses modèles ne prédisent pas qui devrait remporter un Oscar pour la qualité de son travail, mais quel assemblage de données extérieures peut aboutir aux mêmes résultats que le jury. Le fait d’être « oscarisé » par ICC ne signifie pas que l’on mérite son Oscar mais que l’ensemble des paramètres analysés aboutissent au même résultat que les choix potentiels du jury. Un peu comme le graphique qui vous démontre que les pays où l’on consomme le plus de chocolat totalisent le plus de prix Nobel… Corrélation et non causalité.
Mais cela montre la qualité et la justesse du modèle développé par ICC, et montre également la prévisibilité des choix du jury américain qui se conforme aux tendances, sans les perturber.

La question à laquelle personne n'ose répondre est alors : a-t-on encore besoin du jury, ou ne doit-on pas confier le choix des récompenses à quelques algorithmes ? En tous cas, un tel succès dans la prévision des résultats enlève beaucoup de charme à cette remise de trophées dont on se dit qu'ils ne pourraient finalement être que le fruit du calcul d'un ordinateur... La prochaine fois, regardez plutôt une compétition de curling féminin, vous aurez plus de suspense... Quoique...



Dans la même rubrique :