L'échelle du CERN est stupéfiante. De la taille du grand collisionneur de hadrons - un accélérateur circulaire de particules d'un rayon de 4,3 km - à la vitesse de collision de particules - un milliard de collisions de particules peuvent avoir lieu chaque seconde au sein des détecteurs de l'expérience LHC.
Mais ce sont les données qui sont les plus impressionnantes, les collisions générant 1 pétaoctet (PB) de données par seconde. Même après avoir uniquement filtré les événements intéressants, l'installation nécessite environ 10Po de nouvelles données à stocker pour être analysées chaque mois.
Ces données sont stockées au centre de données du CERN et sont partagées avec un réseau d'environ 170 centres de données à des fins d'analyse, ceci grâce à la grille de calcul mondiale pour le LHC (WLCG). La configuration de stockage actuelle du CERN réside en des mémoires tampons de disques durs comprenant 3 200 JBOD contenant 100 000 disques durs (HDD), pour un total de 350Po.
Les séries de tests LHC doivent perdurer et, à chaque nouvelle exécution, le stockage de données augmente considérablement. Après la mise à niveau, le troisième “Run” du CERN est prévu pour 2021.
Depuis 2014, les disques durs de Toshiba Electronics Europe GmbH sont utilisés par le CERN pour gérer d’énormes volumes de données; trois générations de technologie de disque dur Toshiba lui ont permis d’accroître la capacité dont il a besoin. Mais, comme le dit Eric Bonfillou, Responsable de la planification des installations et des achats au département informatique au CERN cela va continuer : « Les mises à niveau planifiées de la machine LHC nécessiteront une mise à l'échelle des ressources de calcul et de stockage dépassant ce que la technologie actuelle peut offrir. »
Chronologie de la mise à l'échelle par le CERN de son stockage avec Toshiba
2014 - Le CERN achète des disques durs Toshiba
Depuis 2014, le CERN utilise les disques durs de Toshiba. Au cœur des besoins du CERN, les disques durs de niveau serveur, hautement performants, fiables et optimisés pour les plus grandes capacités de stockage. En 2013-2014, le CERN a organisé une phase d’arrêt planifiée pour préparer le Run 2. Au cours de cette période, il a mis à niveau ses systèmes de stockage en ajoutant 24 baies JBOD 4U équipées des disques durs MG03SCA400 de Toshiba.
Avec une capacité de 4To par disque dur, tournant chacun à 7200 tr/min et recevant des données via une interface de 6 Go/s, le CERN a gagné 96To par unité d'extension JBOD. Le délai moyen de défaillance du disque dur (MTTF) était de 1,2 million d’heures, ce qui se traduit par un taux de défaillance annualisé prévu de 0,72%.
2015/2016 - Début du Run 2 du CERN: les besoins en stockage de données ont considérablement augmenté
Avec le lancement du «Run 2» en 2015, le besoin de stockage de données a énormément augmenté. Le CERN ajoute une nouvelle capacité de stockage grâce au nouveau modèle SATA de 6To de Toshiba, le MG04ACA600E. Là encore, installée dans un chargeur frontal JBOD à 24 baies 4U, la capacité de stockage brute totale a été portée à 144To par unité.
Le MTTF de ce modèle a été amélioré à 1,4 million d'heures, donnant un AFR prévu de 0,62%.
2018 - Toshiba lance le modèle à hélium MG07 pour étendre sa capacité à 14To par disque dur
Après 2016, Toshiba a accéléré le développement et l’introduction de nouveaux modèles de disques durs d’entreprise haute capacité afin de répondre aux besoins mondiaux en matière de stockage de données dans le cloud, en lançant deux nouvelles générations de disques durs : le MG05 et le MG06. La série MG06 est devenue disponible avec des capacités allant jusqu'à 10To par disque. Et bien que ce disque soit encore remplie d'air, Toshiba a pu augmenter le MTTF à 2,5 millions d'heures, ce qui se traduit par un AFR de 0,35%, le plus bas du marché actuellement pour les disques durs remplis d'air.
La technologie des disques durs remplis d’air atteint une capacité limite à 7 plateaux (et donc 10To) pour une technologie d'enregistrement magnétique classique (CMR) dans un boitier de 3,5 pouces.
Et bien qu’il soit théoriquement possible d’augmenter ce volume à l’aide de plateaux plus minces, l’air serait un gaz trop lourd, ce qui aurait pour effet de flatter fortement. Il est également possible d’utiliser la technologie SMR (Shingled Magnetic Recording), mais cette opération nécessite un traitement spécial pour éviter de graves problèmes de performances, et est limitée par le besoin de systèmes de fichiers spéciaux adaptés à la complexité de la technologie.
En 2018, la mise à niveau du stockage du CERN a coïncidé avec le lancement de la gamme MG07 de Toshiba, le premier disque dur sur serveur au monde avec une capacité pouvant atteindre 14To. Avec l’achat de la variante à 12To, le CERN a doublé sa capacité par JBOD - à 288To.
Le MG07 augmente la capacité sans changer le format et en utilisant de l'hélium plutôt que de l'air. Cela permet d'utiliser des plateaux plus minces sans les flatteries associées, avec un maximum de neuf par disque.
En utilisant la technologie CMR, le MG07 est adapté à toute charge de travail sans perte de performance associée au SMR. De plus, l'hélium crée moins de friction que l'air, ce qui réduit considérablement l'énergie nécessaire pour faire tourner les plateaux. Grâce à une optimisation précise du moteur tourney broche, la puissance de fonctionnement a été réduite d'un tiers (de c.11W à <7W) pour le modèle à l'hélium de la série MG07.
Le MTTF de la MG07 a considérablement augmenté atteignant 2,5 millions d’heures.
L'augmentation des demandes de capacité de données de Run 3
En 2019, la machine du LHC s'est à nouveau arrêtée pour installer d'autres mises à niveau avant de redémarrer pour le Run 3 en 2021. Une augmentation significative des demandes de stockage est attendue, avec une accélération des données générées.
Comme le dit Eric Bonfillou: « Les produits et l’assistance de Toshiba répondent aux exigences strictes du CERN. Notre infrastructure informatique, en termes de puissance de calcul et de capacité de stockage, a bien répondu aux besoins de l’informatique scientifique en exploitant au maximum les disques durs fiables et de grande capacité de Toshiba. »
Les prochains disques de Toshiba au format 3,5 pouces, offriront au CERN l'accès au stockage 16 To et 18To, ajoutant 432To de nouvelle capacité par JBOD.
« Les produits Toshiba conviennent parfaitement au stockage de centres de données à grande échelle et le déploiement et l'exploitation réussis de trois générations de disques durs d'entreprise Toshiba dans l'environnement informatique complexe du CERN constituent un scénario de référence parfait »,déclare Larry Martinez-Palomo, General Manager of the HDD Business Unit at Toshiba Electronics Europe.
En ce qui concerne les activités de R&D à long terme, Toshiba développe une technologie d’enregistrement magnétique de nouvelle génération qui étendra encore les capacités à plus de 20To par disque dur, tout en maintenant le format de 3,5 pouces.
Martinez-Palomo a ajouté : « Nous sommes convaincus que nos technologies de nouvelle génération de disques durs contribueront à résoudre les futurs problèmes de mise à l'échelle du CERN en termes de capacité de stockage, de budget d'investissement, de consommation d'énergie et de fiabilité. »
Mais ce sont les données qui sont les plus impressionnantes, les collisions générant 1 pétaoctet (PB) de données par seconde. Même après avoir uniquement filtré les événements intéressants, l'installation nécessite environ 10Po de nouvelles données à stocker pour être analysées chaque mois.
Ces données sont stockées au centre de données du CERN et sont partagées avec un réseau d'environ 170 centres de données à des fins d'analyse, ceci grâce à la grille de calcul mondiale pour le LHC (WLCG). La configuration de stockage actuelle du CERN réside en des mémoires tampons de disques durs comprenant 3 200 JBOD contenant 100 000 disques durs (HDD), pour un total de 350Po.
Les séries de tests LHC doivent perdurer et, à chaque nouvelle exécution, le stockage de données augmente considérablement. Après la mise à niveau, le troisième “Run” du CERN est prévu pour 2021.
Depuis 2014, les disques durs de Toshiba Electronics Europe GmbH sont utilisés par le CERN pour gérer d’énormes volumes de données; trois générations de technologie de disque dur Toshiba lui ont permis d’accroître la capacité dont il a besoin. Mais, comme le dit Eric Bonfillou, Responsable de la planification des installations et des achats au département informatique au CERN cela va continuer : « Les mises à niveau planifiées de la machine LHC nécessiteront une mise à l'échelle des ressources de calcul et de stockage dépassant ce que la technologie actuelle peut offrir. »
Chronologie de la mise à l'échelle par le CERN de son stockage avec Toshiba
2014 - Le CERN achète des disques durs Toshiba
Depuis 2014, le CERN utilise les disques durs de Toshiba. Au cœur des besoins du CERN, les disques durs de niveau serveur, hautement performants, fiables et optimisés pour les plus grandes capacités de stockage. En 2013-2014, le CERN a organisé une phase d’arrêt planifiée pour préparer le Run 2. Au cours de cette période, il a mis à niveau ses systèmes de stockage en ajoutant 24 baies JBOD 4U équipées des disques durs MG03SCA400 de Toshiba.
Avec une capacité de 4To par disque dur, tournant chacun à 7200 tr/min et recevant des données via une interface de 6 Go/s, le CERN a gagné 96To par unité d'extension JBOD. Le délai moyen de défaillance du disque dur (MTTF) était de 1,2 million d’heures, ce qui se traduit par un taux de défaillance annualisé prévu de 0,72%.
2015/2016 - Début du Run 2 du CERN: les besoins en stockage de données ont considérablement augmenté
Avec le lancement du «Run 2» en 2015, le besoin de stockage de données a énormément augmenté. Le CERN ajoute une nouvelle capacité de stockage grâce au nouveau modèle SATA de 6To de Toshiba, le MG04ACA600E. Là encore, installée dans un chargeur frontal JBOD à 24 baies 4U, la capacité de stockage brute totale a été portée à 144To par unité.
Le MTTF de ce modèle a été amélioré à 1,4 million d'heures, donnant un AFR prévu de 0,62%.
2018 - Toshiba lance le modèle à hélium MG07 pour étendre sa capacité à 14To par disque dur
Après 2016, Toshiba a accéléré le développement et l’introduction de nouveaux modèles de disques durs d’entreprise haute capacité afin de répondre aux besoins mondiaux en matière de stockage de données dans le cloud, en lançant deux nouvelles générations de disques durs : le MG05 et le MG06. La série MG06 est devenue disponible avec des capacités allant jusqu'à 10To par disque. Et bien que ce disque soit encore remplie d'air, Toshiba a pu augmenter le MTTF à 2,5 millions d'heures, ce qui se traduit par un AFR de 0,35%, le plus bas du marché actuellement pour les disques durs remplis d'air.
La technologie des disques durs remplis d’air atteint une capacité limite à 7 plateaux (et donc 10To) pour une technologie d'enregistrement magnétique classique (CMR) dans un boitier de 3,5 pouces.
Et bien qu’il soit théoriquement possible d’augmenter ce volume à l’aide de plateaux plus minces, l’air serait un gaz trop lourd, ce qui aurait pour effet de flatter fortement. Il est également possible d’utiliser la technologie SMR (Shingled Magnetic Recording), mais cette opération nécessite un traitement spécial pour éviter de graves problèmes de performances, et est limitée par le besoin de systèmes de fichiers spéciaux adaptés à la complexité de la technologie.
En 2018, la mise à niveau du stockage du CERN a coïncidé avec le lancement de la gamme MG07 de Toshiba, le premier disque dur sur serveur au monde avec une capacité pouvant atteindre 14To. Avec l’achat de la variante à 12To, le CERN a doublé sa capacité par JBOD - à 288To.
Le MG07 augmente la capacité sans changer le format et en utilisant de l'hélium plutôt que de l'air. Cela permet d'utiliser des plateaux plus minces sans les flatteries associées, avec un maximum de neuf par disque.
En utilisant la technologie CMR, le MG07 est adapté à toute charge de travail sans perte de performance associée au SMR. De plus, l'hélium crée moins de friction que l'air, ce qui réduit considérablement l'énergie nécessaire pour faire tourner les plateaux. Grâce à une optimisation précise du moteur tourney broche, la puissance de fonctionnement a été réduite d'un tiers (de c.11W à <7W) pour le modèle à l'hélium de la série MG07.
Le MTTF de la MG07 a considérablement augmenté atteignant 2,5 millions d’heures.
L'augmentation des demandes de capacité de données de Run 3
En 2019, la machine du LHC s'est à nouveau arrêtée pour installer d'autres mises à niveau avant de redémarrer pour le Run 3 en 2021. Une augmentation significative des demandes de stockage est attendue, avec une accélération des données générées.
Comme le dit Eric Bonfillou: « Les produits et l’assistance de Toshiba répondent aux exigences strictes du CERN. Notre infrastructure informatique, en termes de puissance de calcul et de capacité de stockage, a bien répondu aux besoins de l’informatique scientifique en exploitant au maximum les disques durs fiables et de grande capacité de Toshiba. »
Les prochains disques de Toshiba au format 3,5 pouces, offriront au CERN l'accès au stockage 16 To et 18To, ajoutant 432To de nouvelle capacité par JBOD.
« Les produits Toshiba conviennent parfaitement au stockage de centres de données à grande échelle et le déploiement et l'exploitation réussis de trois générations de disques durs d'entreprise Toshiba dans l'environnement informatique complexe du CERN constituent un scénario de référence parfait »,déclare Larry Martinez-Palomo, General Manager of the HDD Business Unit at Toshiba Electronics Europe.
En ce qui concerne les activités de R&D à long terme, Toshiba développe une technologie d’enregistrement magnétique de nouvelle génération qui étendra encore les capacités à plus de 20To par disque dur, tout en maintenant le format de 3,5 pouces.
Martinez-Palomo a ajouté : « Nous sommes convaincus que nos technologies de nouvelle génération de disques durs contribueront à résoudre les futurs problèmes de mise à l'échelle du CERN en termes de capacité de stockage, de budget d'investissement, de consommation d'énergie et de fiabilité. »