Actualités : analyse de données, Business Intelligence, Data Science, Big Data


Retour sur le premier Apéro Big Data de Juillet 2013


Rédigé par Patrick COFFRE, Talend le 13 Septembre 2013

Ce post propose un retour complet sur le premier « Apéro Big Data » s’étant tenu dans les locaux de Google France le 2 juillet 2013. Les participants, pendant l’évènement, ont découvert comment certaines technologies apportent une réponse simple, rapide et peu coûteuse aux analyses big data.
Plusieurs entreprises étaient partenaires de l’évènement dont Ysance, Talend, Google ainsi que QlikView.
Les sujets évoqués pendant cette soirée ont permis d’en savoir davantage sur les enjeux du big data pour la BI nouvelle génération, la vision de Talend sur le big data, les offres de Google ainsi que l’utilisation de Google BigQuery et la construction d'une application QlikView big data.



La première présentation par Romain Chaumais d’Ysance expose les enjeux du big data pour la BI nouvelle génération.

D’abord, Romain présente les différentes formes de Business Intelligence en entreprise. On retrouve la BI exploratoire, d’entreprise et départementale.
La BI exploratoire se concentre sur des sources de données très volumineuses, peu ou pas structurées, collectées, traitées au fil de l’eau. Par contre, la BI d’entreprise se focalise sur des sources de données volumineuses stables, maitrisées et industrialisées. La BI départementale, quant à elle, regroupe les sources de données peu volumineuses, métiers, locales, évolutives et hors DSI.

Les technologies big data révolutionnent les architectures BI traditionnelles et les promesses du big data qui ont été évoquées sont les suivantes : la disponibilité pour tous les utilisateurs métier, l’intégration aux applications décisionnelles existantes, adaptation aux usages à temps réel, élasticité et massivement scale out, plateforme peu couteuse, données non ou peu structurées et structurées ainsi que grande capacité de stockage. Surtout, le big data ne doit pas finir dans un silo métier et être accessible à tous les métiers de l’entreprise.

La deuxième présentation par Bahaaldine Azarmi de Talend met en avant les produits big data de la société.

Bahaaldine explique la vision de Talend à propos du big data. Ce nouveau type de données représente un changement significatif de modèle au niveau de la technologie des entreprises. Celles-ci capturent des trillions d’octets d’informations: le désir de collecter et analyser ces données est toujours plus important.

Puis le conférencier effectue une introduction à Talend Platform for Big Data comprenant notamment des fonctionnalités avancées de collection, de traitement et de qualité de données.
Bahaaldine en vient à réaliser un job collectant des données depuis Google Cloud Storage, pour les transformer dans une plate-forme Hadoop puis charger les résultats dans Google BigQuery.

Une fois récupérées des quantités importantes de données venues du Web, on les enrichit pour les rendre exploitables et porteuses de sens. Et c’est après une connexion de Talend ESB à Google Cloud Storage que les jobs Hive sont générés graphiquement!

Christophe Baroux de Google est le troisième conférencier de la soirée et il présente Google Cloud et Google BigQuery.

Christophe détaille au public l’offre de Google pour le Cloud : Google Cloud Platform. Ce produit rend possible des usages tels que le stockage, la mobilité, les jeux, le computing à performance élevée (High Performance Computing) et big data, le développement et les tests ainsi que le marketing digital.

Le conférencier propose de passer en revue deux outils de Google, dont Google Compute Engine : il s’agit d’un produit en « Infrastructure as a Service » (IaaS) offrant une API RESTful pour la gestion de ressources comme des disques, images et autres instances.
Nous avons aussi pu en savoir plus sur Google BigQuery, permettant une analyse interactive de grandes quantités de données, pour une utilisation avec Google Storage. Il s'agit d'une IaaS qui peut être utilisée en complément de MapReduce.

En termes de chiffres, nous aurons appris que Google trie un téraoctet de données avec 1000 cœurs en 56 secondes grâce à MapR. Et à performance égale pour cette capacité, le Google Cloud, en comparaison à une ferme de serveurs standards, coute $582 pour le premier contre $584000 pour le second.
Toujours quantitativement, Google BigQuery donne la possibilité de requêter 291 millions de lignes en 1,6 secondes.

La quatrième présentation de Loïc Formont de chez QlikTech expose comment est construit une application QlikView Big Data.

L’entreprise a présenté ses solutions pour le big data, comme QlikView Business Discovery, et a mentionné que ces outils sont simples à employer, utilisables dans tous les domaines, permettent la prise de décision ainsi que la collaboration et la mobilité.
Avec Business Discovery, chaque utilisateur peut analyser ses données et y faire des découvertes. Tous peuvent accéder aux données et participer, pour prendre de meilleures décisions.

Ensuite, nous avons pu suivre la construction d'une application QlikView de type big data, s'appuyant sur les données disponibles dans le cluster Hadoop et dans BigQuery.
L’exemple se concentre sur des requêtes pour l’achat d’un billet d’avion et repose sur la recherche associative de QlikView. La démonstration s’est concentrée sur des notions telles que le trafic, les clics, visites, sessions ainsi que les KPI.

Cette soirée centrée autour du big data a couvert plusieurs technologies, dont celles de Google, Talend et QlikView. Pendant les présentations et les discussions de networking, le public aura pu mieux saisir comment certaines technologies apportent une réponse à faible cout, rapide et simple aux analyses big data. Surtout, l’évènement a permis de rassembler des participants souhaitant comprendre concrètement comment mettre en place une plate-forme big data mais aussi échanger sur des enjeux majeurs ainsi que dialoguer à propos de différents projets.




Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store