Actualités : analyse de données, Business Intelligence, Data Science, Big Data


Big Data les pionniers nous montrent la voie


Rédigé par le 8 Octobre 2012

Il y a peu de temps, environ 3 ou 4 ans, si vous vouliez traiter une grande quantité de données textuelles ou de web logs, vous deviez mobiliser de gros serveurs et mettre en œuvre des programmes SQL conséquents, c’est à dire longs à développer et longs à donner leur résultats. Heureusement les demandes étaient peu nombreuses et généralement les volumétries envisagées se mesuraient au plus en téraoctets. Depuis l’e-commerce et les médias sociaux se sont développés, et de nombreuses entreprises voient leurs relations clients et donc leur survie, totalement dépendre de la capacité de leurs moyens informatiques à analyser des web logs et des données textuelles. De plus pour nombre d’entre elles, la volumétrie se compte désormais en centaines de téraoctets voire en pétaoctets comme eBay.



Michel Bruley, Directeur Marketing EMEA de Teradata Aster
Michel Bruley, Directeur Marketing EMEA de Teradata Aster
La plupart des jeunes entreprises du monde du e-commerce ou des médias sociaux n’avaient pas les ressources pour mettre en place les solutions évoquées ci-dessus, dont elles avaient besoin. Leurs experts ont donc cherché d’autres voies et développé de nouvelles solutions plus performantes et moins onéreuses, fondées par exemple sur des systèmes de fichiers distribués (DFS) et des programmes MapReduce. Dans ce contexte la solution open source Hadoop implémentée en Java a eu un grand succès, mais il existe aussi d’autres solutions qui permettent de faire du MapReduce. C’est le cas de la solution nCluster de Teradata Aster qui permet de développer des programmes SQL embarquant des algorithmes MapReduce complexes. Ainsi aujourd’hui les entreprises qui veulent traiter des grands volumes de données textuelles ou de web logs complètent à moindre coût leur système d’information décisionnel avec une plateforme analytique spécialisée.

Certains prédisent la disparition des entrepôts de données d’entreprise tels que nous les connaissons aujourd’hui, d’autant plus que des fournisseurs offrent des solutions cloud. Cela ne sera sans aucun doute pas le cas même à moyen terme, et nous verrons donc les entreprises gérer en parallèle différents systèmes spécialisés internes ou externes. Par contre c’est effectivement la fin de l’entrepôt de données centralisé unique qui gère toutes les données de l’entreprise, que d’ailleurs très peu de sociétés avaient réellement mis en œuvre.

En fait les pionniers nous montrent certainement la voie du futur qui est de faire cohabiter les solutions, les nouvelles pour traiter les données multi-structurées et les traditionnelles pour les données structurées, le tout en mode privé ou en mode cloud public. En effet la majorité des solutions sont maintenant fournies sous trois formes: logiciel uniquement, appliance ou cloud, et les pionniers optent pour des solutions hybrides. Le choix entre ces possibilités doit se faire en fonction des exigences spécifiques à chaque entreprise : exigences de la réglementation, de l’industrie, du métier, des relations avec les clients (vie privée), des compétences disponibles, de la sécurité, de l’impact de la localisation des données, etc.

Une des grandes difficultés à court terme que rencontrent les pionniers vient du manque de compétences en matière de Big Data. En effet l’exploitation de ces dernières relève de ce que l’on appelle la Science des Données, une discipline qui allie les mathématiques, la programmation et le sens des affaires. Pour tirer parti des Big Data il convient donc d’investir dans une équipe ayant ce type de compétences, et de la faire travailler étroitement avec les équipes métiers et informatiques. En effet il est possible de trouver des tendances, des modèles, des segments etc. que l’on ignorait, mais en soi cela ne change rien, il faut transformer ces éléments en opportunités métier et au final en actions concrètes sur le marché. Les experts de la Science des Données savent ouvrir la voie mais ne peuvent pas la parcourir seuls jusqu’au bout.

Parmi les pionniers clients de Teradata on trouve des entreprises de taille très différentes allant de grands groupes genre Wall-Mart, Wells Fargo, Boeing, Apple, avec beaucoup de sociétés liées au web comme eBay, Amazon, Barnes & Nobles, et beaucoup de sociétés beaucoup plus petites comme LinkedIn (1700 personnes), Mzinga (<500), etc. Pour aller plus loin au sujet de Teradata Aster, vous pouvez utilement consulter le lien suivant : http://www.asterdata.com/customers/index.php




Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store