Actualités : analyse de données, Business Intelligence, Data Science, Big Data


Ce que vous avez toujours voulu savoir sur le Big Data, sans jamais oser le demander


Rédigé par Jane McConnell, Teradata le 22 Février 2016

Le big data est dans tous les esprits et conversations professionnelles. Mais le terme de big data a fait l’objet de tellement de tentatives de définition que la confusion est souvent au rendez-vous.



Jane McConnell, Consultante Teradata
Jane McConnell, Consultante Teradata
Nombreux sont ceux qui s’interrogent face au big data : un webinar de Gartner fait état d’une étude qui souligne que 15% des personnes interrogées considèrent que la compréhension du big data compte parmi leurs trois défis les plus importants.
Quant à moi, j’ai ma statistique favorite : 9% des organisations qui ont investi dans les projets de big data ont du mal à comprendre ce qu’est… le big data. On ne peut que s’interroger face à cette interrogation : mais dans quoi ces organisations ont-elles réellement investi ?
Voici donc une liste de questions à l’intention de ceux qui s’interrogent sur le big data, sans forcément oser les poser.

Le big data est-il aussi volumineux qu’on le prétend ?
Bien que le nom le suggère, nous utilisons en réalité ce terme pour décrire toute donnée qui, pour une raison ou pour une autre, n’est pas adaptée aux bases de données traditionnellement utilisées ces dernières années dans le cadre d’applications d’analyses et de business intelligence. À titre d’exemple, il s’agit de données qui ne s’intègrent pas dans une base de données relationnelle à des fins de requêtes (les pixels d’une image par exemple), ou qui doivent subir un traitement spécifique avant d’être intégrées avec d’autres données (données chronologiques provenant d’un équipement par exemple).

En quoi consiste ce mouvement actuel autour du big data ?
A: Il s’agit de pouvoir utiliser toutes les données à disposition, qu’il s’agisse d’images, de séquences vidéo, de fichiers audio, de texte en langage naturel, de données provenant de capteurs et bien sûr des données relationnelles classiques. Et ce, quel que soit le volume de ces données, mesuré en mégaoctets ou téraoctets, et qu’il s’agisse de données à un instant donné ou d’un flux permanent de données.

Qu’est-ce qui rend la gestion de ces données si complexe ?
Différents outils IT sont nécessaires pour gérer et requêter ces données, une différence majeure par rapport aux données plus « traditionnelles ». Nous avons beaucoup à apprendre des grands noms de l’Internet,  Yahoo, Google, et autres eBay, les pionniers de nouveaux outils et techniques analytiques. Les données qu’ils utilisent quotidiennement sont très proches de celles que les acteurs du secteur des hydrocarbures ont tant de mal à gérer. Ils interrogent des téraoctets de logs issus de serveurs Web pour mieux comprendre les comportements de leurs clients et prospects et ils utilisent un traitement basé sur le langage naturel, avec notamment une analyse des sentiments et des humeurs identifiés dans le contenu des réseaux sociaux. Enfin, avec la prolifération des objets connectés, notamment ceux qui se portent sur soi comme les coachs de santé de Fitbit ou l’Apple Watch, les données issues de capteurs présentent également un grand intérêt.

Pourquoi devons-nous analyser le big data ?
Et pourquoi ne le ferions-nous pas ? Dans certaines industries comme le pétrole et du gaz, les enjeux sont particulièrement importants. Lorsqu’on sait qu’un forage d’exploration peut coûter jusqu’à plusieurs millions d’euros et que le taux de succès n’est que d’un sur trois, autant prendre des décisions métiers fondées sur les données… plutôt que sur des intuitions.

Le secteur du transport bénéficie également du big data. Les données des capteurs (une des sources du big data) qui surveillent le comportement et les performances des moteurs peuvent être associées aux données de spécifications du moteur, à son historique de maintenance ou encore aux détails des opérations d‘entretien et d’utilisation (en clair toutes les sources de données disponibles traditionnellement). Cette corrélation permet aux opérateurs de prévoir précisément les risques de panne de ce moteur. Pour les opérateurs ferroviaires, les compagnies aériennes ou les acteurs de la logistique, cette approche permet de planifier l’immobilisation d’un moyen de transport à des fins de maintenance préventive, plutôt que d’attendre une panne réelle, au grand dam de passagers ou de destinataires de marchandises.

Ce modèle est-il transposable dans le secteur du pétrole et du gaz ? Si nous associons nos données de capteurs avec des informations spécifiques émanant des puits de forage, d’opérations de maintenance, du contexte géologique ou de conditions extérieures (météo par exemple), il devient possible d’améliorer les politiques de maintenance et les opérations de logistique, permettant ainsi aux entreprises de mieux maîtriser leurs coûts et d’éviter les problématiques fortuites. Voilà qui me semble être une décision métier particulièrement pertinente.




Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store