Au-delà des termes accrocheurs (et vous savez ce que je pense du "big data") c'est à mon avis dans l'ère de la Data Science que nous font entrer les dizaines de millions de dollars annoncés hier pour la collecte, le stockage et l'analyse des données. Le co-fondateur de Parstream, un éditeur spécialisé dans ce domaine, me disait hier au cours d'une présentation que "les données sont le pétrole de demain". Il a parfaitement résumé la situation. Quelques heures plus tard, réunis à Washington, les représentants de six agences gouvernementales égrenaient leurs projets et leur implication dans cette science des données. Ce sont 200 millions de dollars qui sont consacrés à cette initiative qui vise à passer des données à la connaissance. Une expression employée depuis plusieurs décennies dans le petit monde du décisionnel, qu'il est agréable de voir utilisée au plus haut niveau de l'état américain.
Pour Barack OBAMA, il est nécessaire d'avoir une approche où "toutes les mains sont sur le bureau" pour travailler ensemble à la formation des nouvelles générations.
Pour Barack OBAMA, il est nécessaire d'avoir une approche où "toutes les mains sont sur le bureau" pour travailler ensemble à la formation des nouvelles générations.
"modifier la manière dont nous enseignons et dont nous apprenons… accélérer les découvertes en science et en conception…", l'administration Obama se place comme chef de file d'une initiative gouvernementale dans laquelle les finances publiques sont mises à contribution pour 200 millions de dollars. Une initiative présentée comme une locomotive qui lancera la machine et cherche à embarquer l'industrie, les universités et laboratoires de recherche, les associations à but non lucratif. Ainsi l'association Data Without Borders, lancée il y a un an, qui met à disposition des organisations non gouvernementales des moyens humains et techniques pour analyser leurs données, est citée dans le communiqué de la Maison Blanche. Cette initiative et annoncée et gérée par l'OSTP (Office of Science and Technology).
Six agences gouvernementales impliquées
Marcia McNutt, directrice de l'USGS
Au cours de la conférence de lancement, qui a eu lieu à Washington, à l'American Association for the Advancement of Science, sont intervenus des représentants de chacune des six agences gouvernementales impliquées dans le projet.
Premier à s'exprimer, Subra SURESH, directeur de la National Science Foundation qui travaillera par exemple avec le National Institutes of Health pour la mise en ligne des données du projet 1000 Genomes sur le nuage d'Amazon.
Marcia McNutt, directrice de l'USGS a insisté sur la recherche de sens que l'analyse conjointe de gros volumes de données en provenance de sources hétérogènes permet aujourd'hui. L'analyse des mouvements géologiques, des évolutions du climat, de la prévision des tremblements de terre… tout cela est au programme du John Wesley Powell Center for Analysis and Synthesis qui a sélectionné les "projets big data" qui bénéficieront des fonds de cette initiative gouvernementale.
Premier à s'exprimer, Subra SURESH, directeur de la National Science Foundation qui travaillera par exemple avec le National Institutes of Health pour la mise en ligne des données du projet 1000 Genomes sur le nuage d'Amazon.
Marcia McNutt, directrice de l'USGS a insisté sur la recherche de sens que l'analyse conjointe de gros volumes de données en provenance de sources hétérogènes permet aujourd'hui. L'analyse des mouvements géologiques, des évolutions du climat, de la prévision des tremblements de terre… tout cela est au programme du John Wesley Powell Center for Analysis and Synthesis qui a sélectionné les "projets big data" qui bénéficieront des fonds de cette initiative gouvernementale.
La DARPA au coeur des projets militaires de traitement de données
Image DARPA
Mais c'est sans doute la présence autour de la table de la DARPA qui est la plus significative. La DARPA est l'organisme de financement des projets avancés dans le domaine militaire du gouvernement américain. Créée suite à une décision du Président Eisenhower en 1957, la DARPA est par exemple à l'origine du réseau Arpanet qui donnera naissance à l'Internet que nous utilisons aujourd'hui. La DARPA va conduire un projet, présenté par Kaigham Gabriel, son directeur actuel, qui combinera l'analyse de gros volumes de données, des mathématiques appliquées, et des solutions de visualisation graphiques, pour imaginer les outils du combattant de demain. Le projet XDATA est la première brique de cet ensemble de nouvelles techniques. Il vise à mieux collecter et analyser, en temps réel, les volumes importants de données collectées sur un terrain d'opérations. Il cherchera par exemple à compléter les informations collectées pour "remplir les blancs" et tenter de reconstituer les informations manquantes. Le problème de "qualité des données" n'est pas propre à l'entreprise privée ! Et XDATA cherchera également à développer des outils d'interaction homme-machine utilisables sur les terrains d'opérations. Des recherches dont l'histoire nous montre qu'elles profitent par la suite au grand public.
Du Big Data à la Data Science pour les générations futures
Au-delà du choix du terme "big data", cette initiative impulse un mouvement fort qui touchera toute l'économie nord-américaine des données et des outils qui les manipulent. La science des données est en marche; notre génération en verra les développements, mais c'est la formation des générations à venir qui en est l'enjeu principal.
A lire également, deux articles de la presse américaine sur le sujet :
- The New York Times : New U.S. Research Will Aim at Flood of Digital Data
- CNet : Feds launch big data initiative to advance science
A lire également, deux articles de la presse américaine sur le sujet :
- The New York Times : New U.S. Research Will Aim at Flood of Digital Data
- CNet : Feds launch big data initiative to advance science