Le traitement des Big Data : un défi économique et sociétal
L’utilisation de nouvelles technologies numériques par les hommes, les entreprises ou les machines (de l’ordinateur au téléphone portable), en passant par les caméras personnelles ou publiques, les capteurs miniaturisés et bien d’autres objets connectés, a entraîné depuis quelques années une croissance exponentielle de production de données en tout genre.
L’usage et la transformation de ces masses de données reste un défi économique et sociétal, car il trouve des applications dans des domaines aussi variés que les sciences, le marketing, les services client, le développement durable, les transports, la santé ou encore l’éducation, et représente un potentiel de création d’emplois et d’attractivité.
Grâce aux avancées scientifiques récentes dans le domaine des infrastructures informatiques (parallélisation, stockage, nouvelles architectures de bases de données), le traitement de toutes ces données massives, jusqu’à présent inaccessible, est désormais possible.
TeraLab : accompagner les projets de recherche et d’innovation
Avec la création de cette plateforme de services Big Data, l’Institut Mines-Télécom et le GENES (en collaboration avec l’INSEE) souhaitent répondre rapidement aux besoins de projets de recherche, d’innovation et d’enseignement dans ce domaine.
La plateforme comporte des moyens matériels tels qu’une capacité de traitement considérable avec une mémoire vive de plusieurs tera-octets, des corpus de données, des applications et des outils innovants. Elle est assortie de services s’appuyant sur des compétences spécialisées dédiées.
L’utilisation sera facilitée en mode SAAS/PAAS par un catalogue de services et applicatifs fourni par des PME innovantes sélectionnées par concours. Les porteurs de projets disposeront ainsi d’un environnement optimal pour se consacrer au traitement applicatif des données massives, faciliter la production et valider les résultats de recherche pouvant être transférés dans des innovations.
TeraLab sera accessible aux PME, ETI et grands groupes, en dehors de toute exploitation commerciale, à travers des projets collaboratifs ou bilatéraux, pour développer des innovations applicatives et tester des pilotes industriels.

TeraLab : un service à la pointe de la technologie
L’infrastructure de la plateforme TeraLab intègrera des technologies matérielles, logicielles, et des solutions à l’état de l’art pour permettre des traitements batch ou temps réel et le stockage de centaines de téraoctets de volume utile de données.
Les corpus de données seront collectés à partir d’informations publiques anonymes (par exemple OpenStreetMap, Common crawl), d’informations publiées ouvertes (open data). Il pourra y avoir également des données privées, rendues anonymes, fournies par des industriels. Ces ressources seront accessibles en compartiments sécurisés ou ultra-sécurisés grâce à la technologie du CASD (Centre d’Accès Sécurisé distant aux Données).
Les utilisateurs disposeront d’outils et de services de statistiques, d’analyse, de visualisation, mais également d’interfaces utilisateurs ou outils collaboratifs avancés.
La plateforme matérielle, hébergée en France, sera construite de façon itérative. La mise à disposition sera effective dès le premier semestre 2014 pour une sélection de projets dont le suivi permettra de spécifier en détail et d’optimiser cet environnement.
En 2015, et jusqu’en 2018, TeraLab sera accessible de façon généralisée aux acteurs de la recherche, académiques et industriels via des projets collaboratifs de type FUI, Eureka, Horizon 2020, EIT ICT Labs, ITEA, ANR, etc.
« Après les chaires industrielles « Valeurs et politiques des informations personnelles » et « Machine Learning for Big Data », ou, dans le domaine de la formation, le Mastère Spécialisé « Big Data : gestion et analyse des données massives » et le futur Certificat d’études spécialisées « Data Scientist » à Télécom ParisTech, l’Institut Mines-Télécom complète, grâce à TeraLab, sa panoplie d’instruments nécessaires à la recherche, à l’enseignement et à l’innovation dans les Big Data. Cette plateforme va nous permettre d’accélérer significativement le passage à l’échelle de nombreux projets innovants, » déclare Philippe Letellier, directeur de l’innovation de l’Institut.
« Nous sommes enthousiastes à propos de cette association avec l’Institut Mines-Télécom qui entre en synergie avec les compétences du Groupe des Ecoles Nationales d’Economie et de Statistique, qu’il s’agisse des enseignements de la filière Big Data des écoles ENSAE et ENSAI, des laboratoires de recherche du CREST. En particulier, TeraLab renforcera notre avance technologique en matière de sécurité des données grâce à laquelle près de 600 chercheurs français peuvent désormais travailler en toute sécurité sur des données individuelles confidentielles produites par les administrations françaises, » conclut Antoine Frachot, directeur général du GENES.
En savoir + sur TeraLab : www.teralab-datascience.fr
L’utilisation de nouvelles technologies numériques par les hommes, les entreprises ou les machines (de l’ordinateur au téléphone portable), en passant par les caméras personnelles ou publiques, les capteurs miniaturisés et bien d’autres objets connectés, a entraîné depuis quelques années une croissance exponentielle de production de données en tout genre.
L’usage et la transformation de ces masses de données reste un défi économique et sociétal, car il trouve des applications dans des domaines aussi variés que les sciences, le marketing, les services client, le développement durable, les transports, la santé ou encore l’éducation, et représente un potentiel de création d’emplois et d’attractivité.
Grâce aux avancées scientifiques récentes dans le domaine des infrastructures informatiques (parallélisation, stockage, nouvelles architectures de bases de données), le traitement de toutes ces données massives, jusqu’à présent inaccessible, est désormais possible.
TeraLab : accompagner les projets de recherche et d’innovation
Avec la création de cette plateforme de services Big Data, l’Institut Mines-Télécom et le GENES (en collaboration avec l’INSEE) souhaitent répondre rapidement aux besoins de projets de recherche, d’innovation et d’enseignement dans ce domaine.
La plateforme comporte des moyens matériels tels qu’une capacité de traitement considérable avec une mémoire vive de plusieurs tera-octets, des corpus de données, des applications et des outils innovants. Elle est assortie de services s’appuyant sur des compétences spécialisées dédiées.
L’utilisation sera facilitée en mode SAAS/PAAS par un catalogue de services et applicatifs fourni par des PME innovantes sélectionnées par concours. Les porteurs de projets disposeront ainsi d’un environnement optimal pour se consacrer au traitement applicatif des données massives, faciliter la production et valider les résultats de recherche pouvant être transférés dans des innovations.
TeraLab sera accessible aux PME, ETI et grands groupes, en dehors de toute exploitation commerciale, à travers des projets collaboratifs ou bilatéraux, pour développer des innovations applicatives et tester des pilotes industriels.

TeraLab : un service à la pointe de la technologie
L’infrastructure de la plateforme TeraLab intègrera des technologies matérielles, logicielles, et des solutions à l’état de l’art pour permettre des traitements batch ou temps réel et le stockage de centaines de téraoctets de volume utile de données.
Les corpus de données seront collectés à partir d’informations publiques anonymes (par exemple OpenStreetMap, Common crawl), d’informations publiées ouvertes (open data). Il pourra y avoir également des données privées, rendues anonymes, fournies par des industriels. Ces ressources seront accessibles en compartiments sécurisés ou ultra-sécurisés grâce à la technologie du CASD (Centre d’Accès Sécurisé distant aux Données).
Les utilisateurs disposeront d’outils et de services de statistiques, d’analyse, de visualisation, mais également d’interfaces utilisateurs ou outils collaboratifs avancés.
La plateforme matérielle, hébergée en France, sera construite de façon itérative. La mise à disposition sera effective dès le premier semestre 2014 pour une sélection de projets dont le suivi permettra de spécifier en détail et d’optimiser cet environnement.
En 2015, et jusqu’en 2018, TeraLab sera accessible de façon généralisée aux acteurs de la recherche, académiques et industriels via des projets collaboratifs de type FUI, Eureka, Horizon 2020, EIT ICT Labs, ITEA, ANR, etc.
« Après les chaires industrielles « Valeurs et politiques des informations personnelles » et « Machine Learning for Big Data », ou, dans le domaine de la formation, le Mastère Spécialisé « Big Data : gestion et analyse des données massives » et le futur Certificat d’études spécialisées « Data Scientist » à Télécom ParisTech, l’Institut Mines-Télécom complète, grâce à TeraLab, sa panoplie d’instruments nécessaires à la recherche, à l’enseignement et à l’innovation dans les Big Data. Cette plateforme va nous permettre d’accélérer significativement le passage à l’échelle de nombreux projets innovants, » déclare Philippe Letellier, directeur de l’innovation de l’Institut.
« Nous sommes enthousiastes à propos de cette association avec l’Institut Mines-Télécom qui entre en synergie avec les compétences du Groupe des Ecoles Nationales d’Economie et de Statistique, qu’il s’agisse des enseignements de la filière Big Data des écoles ENSAE et ENSAI, des laboratoires de recherche du CREST. En particulier, TeraLab renforcera notre avance technologique en matière de sécurité des données grâce à laquelle près de 600 chercheurs français peuvent désormais travailler en toute sécurité sur des données individuelles confidentielles produites par les administrations françaises, » conclut Antoine Frachot, directeur général du GENES.
En savoir + sur TeraLab : www.teralab-datascience.fr