Le centre de recherche de IBM à Almaden - Photo copyright Google 2011
Il y a un an et demi, IBM mettait en place un centre analytique disposant de 1 petaoctet de mémoire de stockage pour analyser à la demande les données de ses clients. Aujourd'hui c'est peu dire que les barrières explosent car IBM Research vient d'a nnoncer la construction d'un volume de stockage unique de 120 petaoctets !
Alors pour battre le record de l'article avec le plus grand nombre de "0", voici quelques éléments de comparaison :
- Vous vous souvenez de votre premier PC dont le lecteur de disquette 5"1/4 permettait de stocker 360 Ko… Et bien 120 petaoctets, c'est 120 000 000 000 000 Ko soit 333 333 333 333 disquettes d'un IBM PC 5150 qui vient de fêter ses 30 ans. Autre élément de comparaison, c'est comme si chacun des 6 000 000 000 d'habitants de la planète disposaient chacun de 20 000 Ko (20 Mo) et les mettaient en commun !
- un disque de 120 petaoctets c'est la possibilité de sauvegarder environ 34 millions de fois les 3,5 millions de caractères que contient la Bible.
… et tout cela dans une seule unité de disque, composée de 200 000 disques traditionnels connectés entre eux. Le record précédent était de l'ordre de 15 petaoctets dans une unité de disque.
A quoi tout cela peut-il servir ? Nous ne le saurons que dans quelques années, mais savions-nous en 1981 à quoi allaient servir quelques années plus tard 1 Go ?
Au-delà du chiffre impressionnant atteint par cette équipe de chercheurs, les problèmes sous-jacents ont été importants à lever. Le nombre de disques présents impose la mise en place de systèmes de sauvegarde permanents et redondants. Dès qu'un disque connait un signe de faiblesse, son contenu est automatiquement recopié sur un système neuf, sans ralentir le calculateur, puis le disque défaillant peut être remplacé manuellement. Si le taux d'erreur augmente pendant la recopie, le système accélère automatiquement l'opération pour ne pas perdre de données. Les concepteurs indiquent que la technologie développée permettrait de disposer d'un système qui ne perdrait aucune donnée pendant un million d'années… sans doute un peu présompteux alors que la disquette a été inventée il y a tout juste 40 ans…
La chaleur dégagée par 200 000 disques dans un même espace a nécessité la mise en place d'un circuit de refroidissement par eau.
Le système de gestion de fichiers utilisé permet de répartir un même fichier sur plusieurs disques et ainsi de lire et d'écrire simultanément sur chaque morceau du même fichier. Ce système GPFS a également en juillet battu un record de lecture de fichiers.
Aux meilleurs spécialistes de l'analyse de données d'imaginer les applications qui tireront profit de ces 120 petaoctets !
Pour suivre l'actualité du centre de recherches d'Almaden : http://www.almaden.ibm.com/
Alors pour battre le record de l'article avec le plus grand nombre de "0", voici quelques éléments de comparaison :
- Vous vous souvenez de votre premier PC dont le lecteur de disquette 5"1/4 permettait de stocker 360 Ko… Et bien 120 petaoctets, c'est 120 000 000 000 000 Ko soit 333 333 333 333 disquettes d'un IBM PC 5150 qui vient de fêter ses 30 ans. Autre élément de comparaison, c'est comme si chacun des 6 000 000 000 d'habitants de la planète disposaient chacun de 20 000 Ko (20 Mo) et les mettaient en commun !
- un disque de 120 petaoctets c'est la possibilité de sauvegarder environ 34 millions de fois les 3,5 millions de caractères que contient la Bible.
… et tout cela dans une seule unité de disque, composée de 200 000 disques traditionnels connectés entre eux. Le record précédent était de l'ordre de 15 petaoctets dans une unité de disque.
A quoi tout cela peut-il servir ? Nous ne le saurons que dans quelques années, mais savions-nous en 1981 à quoi allaient servir quelques années plus tard 1 Go ?
Au-delà du chiffre impressionnant atteint par cette équipe de chercheurs, les problèmes sous-jacents ont été importants à lever. Le nombre de disques présents impose la mise en place de systèmes de sauvegarde permanents et redondants. Dès qu'un disque connait un signe de faiblesse, son contenu est automatiquement recopié sur un système neuf, sans ralentir le calculateur, puis le disque défaillant peut être remplacé manuellement. Si le taux d'erreur augmente pendant la recopie, le système accélère automatiquement l'opération pour ne pas perdre de données. Les concepteurs indiquent que la technologie développée permettrait de disposer d'un système qui ne perdrait aucune donnée pendant un million d'années… sans doute un peu présompteux alors que la disquette a été inventée il y a tout juste 40 ans…
La chaleur dégagée par 200 000 disques dans un même espace a nécessité la mise en place d'un circuit de refroidissement par eau.
Le système de gestion de fichiers utilisé permet de répartir un même fichier sur plusieurs disques et ainsi de lire et d'écrire simultanément sur chaque morceau du même fichier. Ce système GPFS a également en juillet battu un record de lecture de fichiers.
Aux meilleurs spécialistes de l'analyse de données d'imaginer les applications qui tireront profit de ces 120 petaoctets !
Pour suivre l'actualité du centre de recherches d'Almaden : http://www.almaden.ibm.com/
Autres articles
-
IBM choisi comme partenaire officiel de la Scuderia Ferrari HP pour l'engagement des fans et l'analyse des données
-
IBM présente Granite 3.0 : des modèles d'IA performants conçus pour les entreprises
-
L’alliance entre l'innovation d'une start-up et l’industrialisation d’une grande entreprise : IBM met le modèle « Large » de Mistral à disposition sur watsonx
-
Étude IBM : Alors que les dirigeants se précipitent vers l'adoption de l'IA générative des questions relatives aux ressources et à la gouvernance persistent
-
Podcast : IBM se lance à son tour dans le data mesh et les data products