Retour sur le premier Apéro Big Data de Juillet 2013

La première présentation par Romain Chaumais d’Ysance expose les enjeux du big data pour la BI nouvelle génération.

D’abord, Romain présente les différentes formes de Business Intelligence en entreprise. On retrouve la BI exploratoire, d’entreprise et départementale.
La BI exploratoire se concentre sur des sources de données très volumineuses, peu ou pas structurées, collectées, traitées au fil de l’eau. Par contre, la BI d’entreprise se focalise sur des sources de données volumineuses stables, maitrisées et industrialisées. La BI départementale, quant à elle, regroupe les sources de données peu volumineuses, métiers, locales, évolutives et hors DSI.

Les technologies big data révolutionnent les architectures BI traditionnelles et les promesses du big data qui ont été évoquées sont les suivantes : la disponibilité pour tous les utilisateurs métier, l’intégration aux applications décisionnelles existantes, adaptation aux usages à temps réel, élasticité et massivement scale out, plateforme peu couteuse, données non ou peu structurées et structurées ainsi que grande capacité de stockage. Surtout, le big data ne doit pas finir dans un silo métier et être accessible à tous les métiers de l’entreprise.

La deuxième présentation par Bahaaldine Azarmi de Talend met en avant les produits big data de la société.

Bahaaldine explique la vision de Talend à propos du big data. Ce nouveau type de données représente un changement significatif de modèle au niveau de la technologie des entreprises. Celles-ci capturent des trillions d’octets d’informations: le désir de collecter et analyser ces données est toujours plus important.

Puis le conférencier effectue une introduction à Talend Platform for Big Data comprenant notamment des fonctionnalités avancées de collection, de traitement et de qualité de données.
Bahaaldine en vient à réaliser un job collectant des données depuis Google Cloud Storage, pour les transformer dans une plate-forme Hadoop puis charger les résultats dans Google BigQuery.

Une fois récupérées des quantités importantes de données venues du Web, on les enrichit pour les rendre exploitables et porteuses de sens. Et c’est après une connexion de Talend ESB à Google Cloud Storage que les jobs Hive sont générés graphiquement!

Christophe Baroux de Google est le troisième conférencier de la soirée et il présente Google Cloud et Google BigQuery.

Christophe détaille au public l’offre de Google pour le Cloud : Google Cloud Platform. Ce produit rend possible des usages tels que le stockage, la mobilité, les jeux, le computing à performance élevée (High Performance Computing) et big data, le développement et les tests ainsi que le marketing digital.

Le conférencier propose de passer en revue deux outils de Google, dont Google Compute Engine : il s’agit d’un produit en « Infrastructure as a Service » (IaaS) offrant une API RESTful pour la gestion de ressources comme des disques, images et autres instances.
Nous avons aussi pu en savoir plus sur Google BigQuery, permettant une analyse interactive de grandes quantités de données, pour une utilisation avec Google Storage. Il s'agit d'une IaaS qui peut être utilisée en complément de MapReduce.

En termes de chiffres, nous aurons appris que Google trie un téraoctet de données avec 1000 cœurs en 56 secondes grâce à MapR. Et à performance égale pour cette capacité, le Google Cloud, en comparaison à une ferme de serveurs standards, coute $582 pour le premier contre $584000 pour le second.
Toujours quantitativement, Google BigQuery donne la possibilité de requêter 291 millions de lignes en 1,6 secondes.

La quatrième présentation de Loïc Formont de chez QlikTech expose comment est construit une application QlikView Big Data.

L’entreprise a présenté ses solutions pour le big data, comme QlikView Business Discovery, et a mentionné que ces outils sont simples à employer, utilisables dans tous les domaines, permettent la prise de décision ainsi que la collaboration et la mobilité.
Avec Business Discovery, chaque utilisateur peut analyser ses données et y faire des découvertes. Tous peuvent accéder aux données et participer, pour prendre de meilleures décisions.

Ensuite, nous avons pu suivre la construction d'une application QlikView de type big data, s'appuyant sur les données disponibles dans le cluster Hadoop et dans BigQuery.
L’exemple se concentre sur des requêtes pour l’achat d’un billet d’avion et repose sur la recherche associative de QlikView. La démonstration s’est concentrée sur des notions telles que le trafic, les clics, visites, sessions ainsi que les KPI.

Cette soirée centrée autour du big data a couvert plusieurs technologies, dont celles de Google, Talend et QlikView. Pendant les présentations et les discussions de networking, le public aura pu mieux saisir comment certaines technologies apportent une réponse à faible cout, rapide et simple aux analyses big data. Surtout, l’évènement a permis de rassembler des participants souhaitant comprendre concrètement comment mettre en place une plate-forme big data mais aussi échanger sur des enjeux majeurs ainsi que dialoguer à propos de différents projets.

Autres articles

Retour sur le premier Apéro Big Data de Juillet 2013

Informatica ouvre les portes de la gouvernance de données native dans le Cloud, alimentée par l'IA, aux clients de Google Cloud dans le cadre d'un partenariat élargi

Converteo obtient la spécialisation Data Analytics Services de Google Cloud

Qlik lance Qlik Talend Cloud et fournit aux entreprises un socle fiable pour l’IA

Teradata s’associe à Google Cloud pour proposer des offres d’IA de confiance à l’échelle de l’entreprise afin d’accélérer le délai de rentabilité et le ROI

Starburst et Google Distributed Cloud proposent une solution d'analyse des données sécurisée aux entreprises hautement réglementées

AAA DATA & Sales Intelligence by Altares lancent 4AForReach : une solution display inédite pour booster la performance des entreprises dans le secteur de l’automobile grâce à la data - 22/01/2025

Accor rejoint l’alliance technologique inédite scellée par Pernod Ricard et JCDecaux dans la gestion de données - 22/01/2025

Samsara dévoile Samsara Intelligence, son IA conçue pour réinventer les opérations physiques et résoudre les problèmes complexes rencontrés sur le terrain - 22/01/2025

Qlik acquiert Upsolver pour proposer l’ingestion et l’optimisation à faible latence pour Apache Iceberg - 21/01/2025

Starburst nomme Lisa Luscap, experte en marketing des données et des technologies, au poste de Chief Marketing Officer - 21/01/2025