10 000 000 000 de fichiers lus en 43 minutes : IBM divise son précédent record par 37 !

Sur une machine en grappe composée de 10 serveurs dotés chacun de 8 cœurs, IBM a pulvérisé son propre record de manipulation de fichiers. Le record précédent avait été établi en 2007 et avait permis de lire 1 milliard de fichiers en trois heures. Ce sont maintenant 10 milliards de fichiers qui ont été lus en 43 minutes, soit une réduction d’un facteur 37. IBM continue de faire progresser son algorithme de gestion de fichiers (General Parallel File System – GPFS) inventé en 1998. Pas d’impact concret sur nos systèmes décisionnels aujourd’hui bien sur, mais par ces recherches, IBM donne de nouvelles perspectives à la croissance exponentielle des volumes de données à analyser. Les données décisionnelles de demain ne seront plus forcément centralisées dans une base de données unique, mais éparpillées dans une multitude de fichiers qu’il faudra trouver, trier et lire le plus rapidement possible.

Pour en savoir plus sur l’organisation de ce nouveau record, le détail du test et de ses conditions est disponible dans le document en pièce jointe publié par IBM et les quatre chercheurs à l’origine de ce record.

Pour en savoir plus sur la division recherche en charge du stockage chez IBM, consultez : http://www.almaden.ibm.com/storagesystems/

GPFS-Violin-white-paper.pdf (794.2 Ko)

Autres articles

10 000 000 000 de fichiers lus en 43 minutes : IBM divise son précédent record par 37 !

L'industrie automobile en plein changement : 80 % des véhicules seront évolutifs par les mises à jour des logiciels qui le constituent et intégreront de l’intelligence artificielle à l’horizon 2035

IBM choisi comme partenaire officiel de la Scuderia Ferrari HP pour l'engagement des fans et l'analyse des données

IBM présente Granite 3.0 : des modèles d'IA performants conçus pour les entreprises

L’alliance entre l'innovation d'une start-up et l’industrialisation d’une grande entreprise : IBM met le modèle « Large » de Mistral à disposition sur watsonx

Étude IBM : Alors que les dirigeants se précipitent vers l'adoption de l'IA générative des questions relatives aux ressources et à la gouvernance persistent

BNP Paribas signe un partenariat avec Oracle pour renforcer sa stratégie cloud - 09/01/2025

Snowflake renforce la collaboration cross-cloud pour les données d'entreprise et l'intelligence artificielle - 21/11/2024

Snowflake unifie les données transactionnelles et analytiques avec la disponibilité générale des Hybrid Tables - 21/11/2024

Neo4j dépasse les 200 millions de dollars de chiffre d’affaires et accélère son leadership dans le domaine de la GenAI grâce à sa technologie de graphes - 20/11/2024

Starburst annonce une capacité d’ingestion de données en streaming de 100 Gb/seconde depuis Apache Kafka vers les tables Apache Iceberg - 06/11/2024