Annoncée il y a quelques années lors d'une conférence européenne à Salzbourg, le barre du Pétaoctet (Po) est largement dépassée. Teradata annonce en effet que cinq de ses clients ont atteint ce chiffre : une société de la grande distribution aurait atteint 2,5 Po, deux banques sont autour de 1,5 Po, un industriel vient quant à lui de franchir la barre symbolique. Ils seraient par ailleurs 35 clients Teradata à dépasser les 100 To de données. Des chiffres impressionnants par leur croissance rapide, mais justifiés par la baisse du coût du stockage. Il y a encore quelques années stocker une information dont on n'était pas sur de la valeur coûtait encore très cher. Aujourd'hui le coût du stockage est si faible qu'il est préférable de conserver beaucoup d'informations même si la majorité ne sera en réalité jamais réellement utilisée.
Teradata a profité de cette occasion pour communiquer quelques chiffres clés qui montrent la progression rapide de ces indicateurs : certaines tables chez des clients pourraient aller jusqu'à 100 milliards de lignes, jusqu'à 3 milliards d'enregistrement chargés par jour, 30 millions de transactions conservées par jour, un million de requêtes en une heure, 10 000 utilisateurs simultanés par jour sur une même base... Des investissements évidemment importants pour les entreprises, mais qui se traduisent dans les chiffres. Sans toutefois citer son nom, Teradata parle d'un client dans le secteur financier qui aurait atteint le retour sur investissement après trois mois et aurait triplé son ROI en un an.
Pour répondre à ce besoin, Teradata propose une nouvelle machine, Teradata Extreme Data Appliance 1550, qui permettrait de gérer jusqu'à 50 Po de données. Son prix s'exprime en To, et monte à 16,5 K$, ce qui fait tout de même 825 millions de dollars si vous envisagez d'atteindre les 50 Po ! La solution comprend la machine, le modèle de données Teradata, des services professionnels liés à sa mise en oeuvre, ainsi que la base de données en version 12 (Etonnant que la version 13 annoncée en même temps ne soit pas proposée). La machine est à base de processeurs quadri-coeurs Intel Xeon et tourne sous Novell Suse Linux
Le futur technologique passe également par des évolutions importantes dans le domaine du matériel de stockage des informations. L'analyse en mémoire vive s'est largement développée pour les modèles de quelques gigaoctets, mais il n'est pas encore envisagé de stocker des pétaoctets en mémoire RAM. Pas encore, mais sans doute après-demain. Le grand public l'ignore encore, mais le prochain des composants d'un ordinateur à disparaître sera sans doute le disque dur. Il commence à être remplacé dans certaines machines portables par des disques SSD, équivalents à de grosses clefs USB. Certains serveurs en sont équipés, Google aurait même passé une commande importante de disques SSD susceptible à elle seule d'impacter les coûts de fabrication de l'ensemble du marché. Pour Teradata, le remplacement des disques durs mécaniques n'est pas à l'ordre du jour, en tous cas pas avant 2011. Mais dès 2009, le constructeur envisage de proposer des machines "sur mesure" équipées de disques SSD comme mémoire de stockage. La vitesse d'accès aux données et d'écriture pourrait être divisée par deux, tout comme la consommation électrique des dits-serveurs. Dans un premier temps, des machines hybrides verront le jour, optimisant le stockage des données sur des supports SSD ou mécaniques en fonction de la fréquence d'accès à ces données.
Cette technologie d'optimisation des supports de stockage est déjà opérationnelle dans ce que Teradata appelle l'Automated Virtual Storage. Disponible dans la version 13 de la base de données Teradata, cette fonction permet à l'entreprise de ne plus se préoccuper de la répartition des données sur les différents supports. Les supports les plus rapides sont automatiquement utilisés pour stocker les données les plus fréquemment recherchées. Un tri automatique par exemple dans la banque, entre les données détaillées utilisées pour l'analyse quotidienne des transactions et les données d'archivage destinées au respect de la réglementation.
Des données qui peuvent maintenant être "géospatiales" et donc rattachées à une position. Les développements conjoints des technologies RFID d'identification d'un objet et GPS de positionnement géographique par satellite, permettent d'imaginer de nouvelles applications où la dimension "où ?" prendra la même importance que la dimension "quand ?" aujourd'hui.
Les clients français se décident peu à peu à partager leur expérience. C'est le cas de Bouygues Telecom qui a détaillé la mise en place de son entrepôt de données d'entreprise. Un data warehouse dans lequel les données clients seront analysées en temps réel, sous les angles marketing, ventes, finance et gestion des fraudes. Une analyse en temps réel qui n'empêchera pas l'utilisation plus traditionnelle de l'entrepôt de données pour la prise de décisions stratégiques. Pour Bouygues Telecom, ce choix d'un entrepôt de données d'entreprise vient consolider et remplacer les précédents data marts métiers.
Carrefour explique également qu'il a choisi la solution Teradata pour l'analyse marketing de ses données. Une solution complète va être mise en oeuvre par les consultants Teradata, comprenant le matériel et la solution logicielle. L'idée pour ces grands distributeurs qui pendant des années n'ont pas cherché à connaître leurs clients et leurs habitudes, est de collecter une information plus nominative et surtout d'analyser les comportements individuels d'achat et de déduire les actions de communication adaptées. La grande distribution souhaite en effet passer du marketing anonyme de masse à une communication plus personnalisée.
La qualité des données, surtout lorsqu'elles se comptent en pétaoctets, est un des sujets majeurs sur lesquels se penchent les nouveaux "data stewards" en charge de sa surveillance. Teradata leur propose un nouveau service "clef en main", mis en oeuvre par ses propres équipes de consultants. Ce processus en six étapes passe par l'identification des risques, la création de règles métiers et le suivi au travers d'un tableau de bord de l'application de ces règles. Ce tableau de bord peut être visualisé dans une application Teradata ou au travers d'un autre outil de reporting du marché. Cette démarche s'appuie sur l'expérience des consultants Teradata dans ce domaine et peut être mise en oeuvre en trois semaines.
Teradata a profité de cette occasion pour communiquer quelques chiffres clés qui montrent la progression rapide de ces indicateurs : certaines tables chez des clients pourraient aller jusqu'à 100 milliards de lignes, jusqu'à 3 milliards d'enregistrement chargés par jour, 30 millions de transactions conservées par jour, un million de requêtes en une heure, 10 000 utilisateurs simultanés par jour sur une même base... Des investissements évidemment importants pour les entreprises, mais qui se traduisent dans les chiffres. Sans toutefois citer son nom, Teradata parle d'un client dans le secteur financier qui aurait atteint le retour sur investissement après trois mois et aurait triplé son ROI en un an.
Pour répondre à ce besoin, Teradata propose une nouvelle machine, Teradata Extreme Data Appliance 1550, qui permettrait de gérer jusqu'à 50 Po de données. Son prix s'exprime en To, et monte à 16,5 K$, ce qui fait tout de même 825 millions de dollars si vous envisagez d'atteindre les 50 Po ! La solution comprend la machine, le modèle de données Teradata, des services professionnels liés à sa mise en oeuvre, ainsi que la base de données en version 12 (Etonnant que la version 13 annoncée en même temps ne soit pas proposée). La machine est à base de processeurs quadri-coeurs Intel Xeon et tourne sous Novell Suse Linux
Le futur technologique passe également par des évolutions importantes dans le domaine du matériel de stockage des informations. L'analyse en mémoire vive s'est largement développée pour les modèles de quelques gigaoctets, mais il n'est pas encore envisagé de stocker des pétaoctets en mémoire RAM. Pas encore, mais sans doute après-demain. Le grand public l'ignore encore, mais le prochain des composants d'un ordinateur à disparaître sera sans doute le disque dur. Il commence à être remplacé dans certaines machines portables par des disques SSD, équivalents à de grosses clefs USB. Certains serveurs en sont équipés, Google aurait même passé une commande importante de disques SSD susceptible à elle seule d'impacter les coûts de fabrication de l'ensemble du marché. Pour Teradata, le remplacement des disques durs mécaniques n'est pas à l'ordre du jour, en tous cas pas avant 2011. Mais dès 2009, le constructeur envisage de proposer des machines "sur mesure" équipées de disques SSD comme mémoire de stockage. La vitesse d'accès aux données et d'écriture pourrait être divisée par deux, tout comme la consommation électrique des dits-serveurs. Dans un premier temps, des machines hybrides verront le jour, optimisant le stockage des données sur des supports SSD ou mécaniques en fonction de la fréquence d'accès à ces données.
Cette technologie d'optimisation des supports de stockage est déjà opérationnelle dans ce que Teradata appelle l'Automated Virtual Storage. Disponible dans la version 13 de la base de données Teradata, cette fonction permet à l'entreprise de ne plus se préoccuper de la répartition des données sur les différents supports. Les supports les plus rapides sont automatiquement utilisés pour stocker les données les plus fréquemment recherchées. Un tri automatique par exemple dans la banque, entre les données détaillées utilisées pour l'analyse quotidienne des transactions et les données d'archivage destinées au respect de la réglementation.
Des données qui peuvent maintenant être "géospatiales" et donc rattachées à une position. Les développements conjoints des technologies RFID d'identification d'un objet et GPS de positionnement géographique par satellite, permettent d'imaginer de nouvelles applications où la dimension "où ?" prendra la même importance que la dimension "quand ?" aujourd'hui.
Les clients français se décident peu à peu à partager leur expérience. C'est le cas de Bouygues Telecom qui a détaillé la mise en place de son entrepôt de données d'entreprise. Un data warehouse dans lequel les données clients seront analysées en temps réel, sous les angles marketing, ventes, finance et gestion des fraudes. Une analyse en temps réel qui n'empêchera pas l'utilisation plus traditionnelle de l'entrepôt de données pour la prise de décisions stratégiques. Pour Bouygues Telecom, ce choix d'un entrepôt de données d'entreprise vient consolider et remplacer les précédents data marts métiers.
Carrefour explique également qu'il a choisi la solution Teradata pour l'analyse marketing de ses données. Une solution complète va être mise en oeuvre par les consultants Teradata, comprenant le matériel et la solution logicielle. L'idée pour ces grands distributeurs qui pendant des années n'ont pas cherché à connaître leurs clients et leurs habitudes, est de collecter une information plus nominative et surtout d'analyser les comportements individuels d'achat et de déduire les actions de communication adaptées. La grande distribution souhaite en effet passer du marketing anonyme de masse à une communication plus personnalisée.
La qualité des données, surtout lorsqu'elles se comptent en pétaoctets, est un des sujets majeurs sur lesquels se penchent les nouveaux "data stewards" en charge de sa surveillance. Teradata leur propose un nouveau service "clef en main", mis en oeuvre par ses propres équipes de consultants. Ce processus en six étapes passe par l'identification des risques, la création de règles métiers et le suivi au travers d'un tableau de bord de l'application de ces règles. Ce tableau de bord peut être visualisé dans une application Teradata ou au travers d'un autre outil de reporting du marché. Cette démarche s'appuie sur l'expérience des consultants Teradata dans ce domaine et peut être mise en oeuvre en trois semaines.
Autres articles
-
Teradata facilite l’application concrète de l’IA générative et accélère la création de valeur pour les entreprises
-
Teradata propose des capacités d’IA exceptionnelles pour les grandes entreprises et les environnements hybrides en collaboration avec NVIDIA
-
Les nouvelles fonctionnalités de ClearScape Analytics maximisent le retour sur investissement en matière d’IA/ML et renforcent la productivité de la data science
-
Teradata nomme Thomas Schröder au poste de vice-président, Europe
-
Teradata et DataRobot s’associent pour accélérer l’innovation dans le domaine de l’IA de confiance