Discours du Dr Peter Zhou, Vice-président de Huawei et Président de la ligne de produit Stockage de données de Huawei
La taille des clusters utilisés par les modèles d'IA à grande échelle n'a cessé d'augmenter pour atteindre désormais plusieurs dizaines de milliers, voire des centaines de milliers de GPU (processeurs graphiques). Cette augmentation s'est traduite par une multiplication des défaillances de ces clusters et par des interruptions de l'apprentissage des modèles. Le long processus de reprise répétée de la rédaction des données de points de contrôle et de reprise de l'apprentissage entraîne de longues périodes d'inactivité des cartes de traitement, faisant tomber l'utilisation des clusters en deçà de 50 %. Au surplus, d'ici à 2026, la consommation d'électricité des data centers devrait atteindre 2,3 fois celle de 2022 au niveau mondial, ce qui équivaut à la consommation annuelle d'électricité du Japon. Plus de la moitié de l'électricité de ces data centers sera consommée par l'intelligence artificielle.
Huawei entend mettre à profit sa capacité d’innovation pour redéfinir le stockage de données, en se concentrant sur les six axes suivants :
1. Ultraperformance : les solutions de stockage de Huawei affichent une performance 10 fois supérieure à celles des méthodes traditionnelles de stockage. Ce stockage supporte également des débits de plusieurs Pétabits (Pb) par seconde et de 100 millions d'IOPS (Opérations d'entrée/sortie par seconde), ce qui améliore fortement l'efficacité du processus d'IA générative tout entier.
2. Résilience des données : les architectures et technologies innovantes de Huawei affichent une fiabilité de 99,9999 %. Le moteur intégré de détection des ransomwares permet une détection d'une précision de 99,99 %. Enfin, le délai de reprise des points de contrôle au cours de l'apprentissage de l'IA est raccourci à moins d'une minute.
3. Nouveau paradigme de données : récupération rapide des données via un moteur de recherche intelligent, couplée à la technologie RAG (génération augmentée de récupération).
4. Évolutivité : un cluster unique de stockage peut être doté d'une capacité de plusieurs EB (exaoctets) et la puissance de chaque moteur peut être rehaussée d'unités de traitement supplémentaires, qu'il s'agisse de GPU (processeurs graphiques), de DPU (unités de traitement des données) ou de NPU (accélérateurs de réseaux neuronaux) pour le calcul sur un réseau de stockage décentralisé (near-storage computing).
5. Consommation d’énergie : augmentation de l'efficacité énergétique (moins de 1 watt/TB) et la densité du stockage (plus de 1 PB/U).
6. Fabrique de données : les capacités de gestion et de recherche des métadonnées de stockage permettent de disposer de données visibles et gérables au niveau mondial, et favorisent la mobilité des données dont l'efficacité a été multipliée par 10.
La solution ultra-performante OceanStor A800 est la nouvelle concrétisation de cette stratégie. Créée pour l'intelligence artificielle, OceanStor A800 permet d'augmenter de 30 % le taux d'utilisation des clusters d'IA. S'agissant de sa performance, ce système offre des débits quatre fois supérieurs et des IOPS huit fois supérieurs à ceux des autres fabricants. En ce qui concerne l'évolutivité d'OceanStor A800, ce système peut être doté d'une capacité de plusieurs EB et comporter jusqu'à 512 contrôleurs, et peut être équipé d'un maximum de 4 096 cartes graphiques. Du point de vue de l'économie d'espace et d'énergie, ces équipements atteignent une densité de stockage exceptionnelle de 1 PB/U et une efficacité énergétique de 0,7 Watt/TB. Ils offrent également un nouveau paradigme de données avec indice vectoriel, données de tenseurs, et RAG. En termes de résilience des données, la précision de la détection des ransomwares est portée de 99,9 % à 99,99 %. Par ailleurs, la capacité de fabrique de données facilite la gestion du capital données.
En matière de réduction de l’impact environnemental, les SSD de haute capacité lancés récemment par Huawei affichent des capacités 10 fois supérieures pour un disque de même taille. Dotés d'une capacité de 128 TB par disque, ces nouveaux SSD permettent de réduire la consommation d'espace de stockage de 88 % et la consommation d'énergie de 92 % par rapport aux SSD concurrentes pour chaque PB de données stockées.
Pour être « IA-ready », les entreprises doivent être « data-ready ». Le système mondial de gestion d'entrepôts de données omni-Dataverse intégré au DME (moteur de gestion des données) rend le capital de données des entreprises visible, gérable et mobilisable, ce qui leur permet de bénéficier d'une solution solide de data lake pour l'IA.
La taille des clusters utilisés par les modèles d'IA à grande échelle n'a cessé d'augmenter pour atteindre désormais plusieurs dizaines de milliers, voire des centaines de milliers de GPU (processeurs graphiques). Cette augmentation s'est traduite par une multiplication des défaillances de ces clusters et par des interruptions de l'apprentissage des modèles. Le long processus de reprise répétée de la rédaction des données de points de contrôle et de reprise de l'apprentissage entraîne de longues périodes d'inactivité des cartes de traitement, faisant tomber l'utilisation des clusters en deçà de 50 %. Au surplus, d'ici à 2026, la consommation d'électricité des data centers devrait atteindre 2,3 fois celle de 2022 au niveau mondial, ce qui équivaut à la consommation annuelle d'électricité du Japon. Plus de la moitié de l'électricité de ces data centers sera consommée par l'intelligence artificielle.
Huawei entend mettre à profit sa capacité d’innovation pour redéfinir le stockage de données, en se concentrant sur les six axes suivants :
1. Ultraperformance : les solutions de stockage de Huawei affichent une performance 10 fois supérieure à celles des méthodes traditionnelles de stockage. Ce stockage supporte également des débits de plusieurs Pétabits (Pb) par seconde et de 100 millions d'IOPS (Opérations d'entrée/sortie par seconde), ce qui améliore fortement l'efficacité du processus d'IA générative tout entier.
2. Résilience des données : les architectures et technologies innovantes de Huawei affichent une fiabilité de 99,9999 %. Le moteur intégré de détection des ransomwares permet une détection d'une précision de 99,99 %. Enfin, le délai de reprise des points de contrôle au cours de l'apprentissage de l'IA est raccourci à moins d'une minute.
3. Nouveau paradigme de données : récupération rapide des données via un moteur de recherche intelligent, couplée à la technologie RAG (génération augmentée de récupération).
4. Évolutivité : un cluster unique de stockage peut être doté d'une capacité de plusieurs EB (exaoctets) et la puissance de chaque moteur peut être rehaussée d'unités de traitement supplémentaires, qu'il s'agisse de GPU (processeurs graphiques), de DPU (unités de traitement des données) ou de NPU (accélérateurs de réseaux neuronaux) pour le calcul sur un réseau de stockage décentralisé (near-storage computing).
5. Consommation d’énergie : augmentation de l'efficacité énergétique (moins de 1 watt/TB) et la densité du stockage (plus de 1 PB/U).
6. Fabrique de données : les capacités de gestion et de recherche des métadonnées de stockage permettent de disposer de données visibles et gérables au niveau mondial, et favorisent la mobilité des données dont l'efficacité a été multipliée par 10.
La solution ultra-performante OceanStor A800 est la nouvelle concrétisation de cette stratégie. Créée pour l'intelligence artificielle, OceanStor A800 permet d'augmenter de 30 % le taux d'utilisation des clusters d'IA. S'agissant de sa performance, ce système offre des débits quatre fois supérieurs et des IOPS huit fois supérieurs à ceux des autres fabricants. En ce qui concerne l'évolutivité d'OceanStor A800, ce système peut être doté d'une capacité de plusieurs EB et comporter jusqu'à 512 contrôleurs, et peut être équipé d'un maximum de 4 096 cartes graphiques. Du point de vue de l'économie d'espace et d'énergie, ces équipements atteignent une densité de stockage exceptionnelle de 1 PB/U et une efficacité énergétique de 0,7 Watt/TB. Ils offrent également un nouveau paradigme de données avec indice vectoriel, données de tenseurs, et RAG. En termes de résilience des données, la précision de la détection des ransomwares est portée de 99,9 % à 99,99 %. Par ailleurs, la capacité de fabrique de données facilite la gestion du capital données.
En matière de réduction de l’impact environnemental, les SSD de haute capacité lancés récemment par Huawei affichent des capacités 10 fois supérieures pour un disque de même taille. Dotés d'une capacité de 128 TB par disque, ces nouveaux SSD permettent de réduire la consommation d'espace de stockage de 88 % et la consommation d'énergie de 92 % par rapport aux SSD concurrentes pour chaque PB de données stockées.
Pour être « IA-ready », les entreprises doivent être « data-ready ». Le système mondial de gestion d'entrepôts de données omni-Dataverse intégré au DME (moteur de gestion des données) rend le capital de données des entreprises visible, gérable et mobilisable, ce qui leur permet de bénéficier d'une solution solide de data lake pour l'IA.