Le Big Data est sur toutes les lèvres, mais l'enjeu reste bien de donner du sens à ce volume colossal d'informations. Véritable laboratoire de recherche intégré au sein du Groupe CARTEGIE, le développement du BIG DATA LAB s'inscrit dans ce contexte.
"Aujourd'hui, seul un nombre très limité d'acteurs sur le marché fait réellement du Big Data. Au sein du Groupe CARTEGIE, ce sont des milliards de données que nous stockons et traitons depuis plus de 25 ans !", déclare Laurent Hervaud, Data Scientist, un des membres du BIG DATA LAB.
S'affirmer comme un acteur majeur du Big Data français
Le BIG DATA LAB fonctionne selon un dispositif composé de plusieurs phases de recherches, mêlant tests et production. Une fois les tests réussis, l'équipe passe alors en phase de développement final du produit ou du service.
"D'ici deux mois, les nouvelles solutions technologiques, développées et actuellement testées, vont nous permettre de "crawler" (explorer et analyser) l'ensemble des sites web français entreprises et BtoB, d'identifier précisément l'activité de l'entreprise, d'évaluer son activité sur les réseaux sociaux, etc.", précise Emmanuel Granger, Data Scientist, également membre du BIG DATA LAB.
Concrètement, les premières applications vont permettre de quantifier le nombre exact de sites français (entreprises et marques) existants, d'identifier précisément les quelque 150 000 sites français de e-commerce, de recenser plus finement les entreprises françaises qui exportent ou importent, et de proposer une nouvelle nomenclature "activités et produits", beaucoup plus précise que les codes APE de l'INSEE, souvent très vagues et au spectre trop large.
Toutes ces données viendront enrichir l'entrepôt BtoB du Groupe CARTEGIE et permettront non seulement de proposer de nouvelles bases exhaustives et inédites (base des sites e-commerce, base des sociétés pratiquant l'import ou l'export, base des réseaux sociaux des entreprises et des marques…) mais aussi de proposer aux entreprises de nouveaux services ou des outils de décisions performants pour les aider à identifier de réelles opportunités de business ou de veille concurrentielle.
"Machine learning" et "cloud computing" : au coeur du BIG DATA LAB
Pour développer ces solutions Big Data, traiter et stocker efficacement un tel volume de données, les experts du BIG DATA LAB recourent au "machine learning" et au "cloud computing". "Nous avons élaboré des algorithmes qui permettent de réaliser une analyse sémantique complète des sites web entreprises et BtoB et ainsi de les classifier en fonction du vocabulaire utilisé", explique Laurent Hervaud.
"Toutes ces techniques demandent beaucoup d'informations, de gigantesques volumes de stockage et une forte puissance de machines sur des temps courts. Pour plus de flexibilité, nous sommes donc amenés à recourir au "cloud computing" et aux ressources présentes dans le Cloud. Cela nous permet de n'avoir aucune limite dans la puissance du matériel !", précise Emmanuel Granger.
Des recrutements dès début 2016
Le BIG DATA LAB est constitué aujourd'hui d'experts ayant chacun plus de vingt ans d'expérience dans les technologies de la data.
Accompagné dans un premier temps par le CATIE (Centre Aquitain des Technologies de l'Information et Électroniques) qui aide les PME à accélérer le développement de leurs produits innovants, puis renforcé par l'apport d'étudiants du Master MIMSE (Modélisation Ingénierie Mathématique, Statistique et Economique) de l'Université de Bordeaux, le BIG DATA LAB élabore actuellement un programme de partenariat universitaire.
"Outre ce futur partenariat universitaire en cours d'élaboration, l'équipe est amenée à se renforcer par l'arrivée de développeurs et les recrutements de mathématiciens et statisticiens prévus dès 2016", précise Laurent Hervaud.
"Aujourd'hui, seul un nombre très limité d'acteurs sur le marché fait réellement du Big Data. Au sein du Groupe CARTEGIE, ce sont des milliards de données que nous stockons et traitons depuis plus de 25 ans !", déclare Laurent Hervaud, Data Scientist, un des membres du BIG DATA LAB.
S'affirmer comme un acteur majeur du Big Data français
Le BIG DATA LAB fonctionne selon un dispositif composé de plusieurs phases de recherches, mêlant tests et production. Une fois les tests réussis, l'équipe passe alors en phase de développement final du produit ou du service.
"D'ici deux mois, les nouvelles solutions technologiques, développées et actuellement testées, vont nous permettre de "crawler" (explorer et analyser) l'ensemble des sites web français entreprises et BtoB, d'identifier précisément l'activité de l'entreprise, d'évaluer son activité sur les réseaux sociaux, etc.", précise Emmanuel Granger, Data Scientist, également membre du BIG DATA LAB.
Concrètement, les premières applications vont permettre de quantifier le nombre exact de sites français (entreprises et marques) existants, d'identifier précisément les quelque 150 000 sites français de e-commerce, de recenser plus finement les entreprises françaises qui exportent ou importent, et de proposer une nouvelle nomenclature "activités et produits", beaucoup plus précise que les codes APE de l'INSEE, souvent très vagues et au spectre trop large.
Toutes ces données viendront enrichir l'entrepôt BtoB du Groupe CARTEGIE et permettront non seulement de proposer de nouvelles bases exhaustives et inédites (base des sites e-commerce, base des sociétés pratiquant l'import ou l'export, base des réseaux sociaux des entreprises et des marques…) mais aussi de proposer aux entreprises de nouveaux services ou des outils de décisions performants pour les aider à identifier de réelles opportunités de business ou de veille concurrentielle.
"Machine learning" et "cloud computing" : au coeur du BIG DATA LAB
Pour développer ces solutions Big Data, traiter et stocker efficacement un tel volume de données, les experts du BIG DATA LAB recourent au "machine learning" et au "cloud computing". "Nous avons élaboré des algorithmes qui permettent de réaliser une analyse sémantique complète des sites web entreprises et BtoB et ainsi de les classifier en fonction du vocabulaire utilisé", explique Laurent Hervaud.
"Toutes ces techniques demandent beaucoup d'informations, de gigantesques volumes de stockage et une forte puissance de machines sur des temps courts. Pour plus de flexibilité, nous sommes donc amenés à recourir au "cloud computing" et aux ressources présentes dans le Cloud. Cela nous permet de n'avoir aucune limite dans la puissance du matériel !", précise Emmanuel Granger.
Des recrutements dès début 2016
Le BIG DATA LAB est constitué aujourd'hui d'experts ayant chacun plus de vingt ans d'expérience dans les technologies de la data.
Accompagné dans un premier temps par le CATIE (Centre Aquitain des Technologies de l'Information et Électroniques) qui aide les PME à accélérer le développement de leurs produits innovants, puis renforcé par l'apport d'étudiants du Master MIMSE (Modélisation Ingénierie Mathématique, Statistique et Economique) de l'Université de Bordeaux, le BIG DATA LAB élabore actuellement un programme de partenariat universitaire.
"Outre ce futur partenariat universitaire en cours d'élaboration, l'équipe est amenée à se renforcer par l'arrivée de développeurs et les recrutements de mathématiciens et statisticiens prévus dès 2016", précise Laurent Hervaud.
Autres articles
-
Le Groupe CARTEGIE devient le Groupe IDAIA
-
« Sport Business Leads » : le Big Data au secours de la fréquentation des stades !
-
Avec le carroyage appliqué au géomarketing, Cartegie donne désormais une précision inédite et inégalée à la data
-
Base Plus lance son offre « VOTRE DMP » (Data Management Platform)
-
Le Groupe Cartegie dévoile data drive « Smart Active Solution » première solution transformant la donnée marketing en intelligence commerciale