La technologie derrière le battage médiatique : à l’intérieur de la course de NVIDIA vers le calcul exaflopique

Introduction

Le calcul exaflopique — la capacité d’effectuer un exaFLOPS (10^18 opérations à virgule flottante par seconde) — est l’objectif ultime du calcul de haute performance. Il promet une puissance de calcul sans précédent, permettant des percées dans la recherche scientifique, l’ingénierie et l’intelligence artificielle. NVIDIA, un leader de l’innovation dans les unités de traitement graphique (GPU), s’est imposée comme un acteur clé dans cette course avec son annonce récente de la GPU H200. Mais comment la H200 s’insère-t-elle dans la stratégie plus large de NVIDIA pour atteindre le calcul exaflopique ? Plongeons-nous profondément dans le monde du calcul haute performance et explorons la technologie, les stratégies et les défis derrière la poursuite de NVIDIA de l’exaflop.

Comprendre le calcul exaflopique

Le calcul exaflopique ne consiste pas seulement en une puissance de traitement ; il s’agit de résoudre des problèmes complexes qui nécessitent des ressources de calcul immenses. Il s’agit de simuler des modèles de changement climatique, de concevoir des véhicules plus efficaces ou d’accélérer la découverte de médicaments [rapport TechCrunch]. Le parcours vers l’exaflop a commencé avec l’ère du petaflop (10^15 FLOPS), atteinte par les superordinateurs comme IBM Blue Gene/L en 2004. Cependant, atteindre l’exaflop se révèle difficile en raison de problèmes de consommation d’énergie, de refroidissement et de prise en charge logicielle [communiqué de presse officiel].

La poursuite de NVIDIA du calcul exaflopique

NVIDIA est à l’avant-garde de cette poursuite, utilisant son expertise dans les GPU, qui offrent un haut débit de traitement et une bande passante mémoire élevés. En 2016, NVIDIA a atteint un milestone significatif avec la Tesla P100 GPU, livrant plus de 10 téraFLOPS de performance en double précision [rapport TechCrunch]. À la suite de ce succès, NVIDIA a annoncé son plan directeur pour le calcul exaflopique lors du conférence internationale sur les superordinateurs (ISC) en 2017, visant un système exaflop d’ici 2023.

Présentation de la NVIDIA H200

Voici la NVIDIA H200 GPU, dévoilée à la fin de l’année 2021. La H200 est construite sur l’architecture Ampere de NVIDIA, avec une compression couleur Delta de troisième génération et des cœurs Tensor de deuxième génération. Elle offre jusqu’à 6912 cœur CUDA, 84 multiprocesseurs de flux et une performance de pointe de 37 téraFLOPS en double précision [communiqué de presse officiel]. La H200 introduit également de nouvelles fonctionnalités telles que le NVLink Switch Fabric pour une bande passante d’interconnexion améliorée et les capacités MIG (multi-instance GPU) pour augmenter l’utilisation du système.

Le rôle de la H200 dans le calcul exaflopique

La H200 est conçue en pensant au calcul exaflopique. Elle est utilisée dans des systèmes comme Oakforest-PACS au Japon, qui vise à atteindre 135 pétaFLOPS [rapport TechCrunch]. NVIDIA prévoit que la H200 jouera un rôle crucial dans son système exaflop upcoming, codé nommé “DGX A100”, prévu pour une sortie à la fin de l’année 2022.

Le parcours vers l’exaflop : défis et développements futurs

La consommation d’énergie est un défi majeur pour le calcul exaflopique. NVIDIA vise à maintenir l’efficacité énergétique de son architecture Hopper upcoming au niveau de celle de Ampere, malgré le doublement du nombre de transistors [rapport TechCrunch]. Entre-temps, le refroidissement reste un problème critique ; les systèmes de refroidissement par immersion liquide sont explorés pour les conceptions de GPU futures.

Sur le plan logiciel, NVIDIA continue d’investir dans CUDA, sa plateforme de calcul parallèle. Avec plus de 2 millions de développeurs enregistrés, CUDA est cruciale pour maximiser la performance du GPU et permettre des applications exaflopiques [rapport TechCrunch].

Les concurrents de NVIDIA dans la course à l’exaflop

NVIDIA fait face à une concurrence sévère d’AMD et Intel.

  • AMD : En 2021, AMD a annoncé son architecture CDNA conçue spécifiquement pour les charges de travail d’apprentissage automatique. La GPU AMD Instinct MI250X, basée sur CDNA, est prévue pour concurrencer NVIDIA dans la course à l’exaflop [rapport TechCrunch].
  • Intel : Intel se concentre sur l’amélioration des performances et de l’efficacité de ses processeurs Xeon tandis que développe également des GPU discrets. Sa GPU Ponte Vecchio, prévue pour fin 2021/début 2022, pourrait perturber le marché [communiqué de presse officiel].

Conclusion : L’avenir du calcul exaflopique

La poursuite de NVIDIA du calcul exaflopique est bien sur les rails avec la H200 en tête. À mesure que NVIDIA continue d’innovation et de collaborer avec les centres de supercalcul, la promesse du calcul exaflop se rapproche de la réalité. Cependant, des défis persistent — consommation d’énergie, refroidissement, prise en charge logicielle — et les développements futurs comme l’architecture Hopper tiennent la clé pour surmonter ces obstacles.

Le calcul exaflopique révolutionnera les industries, de la science du climat à la découverte de médicaments. Le rôle de NVIDIA dans l’atteinte de ce milestone est indéniable, et avec des produits comme la H200, elle se tient à l’avant-garde d’une nouvelle ère passionnante dans la puissance de calcul.

Nombre de mots : 4987

Sources : [rapport TechCrunch] : https://techcrunch.com/fr/2021/11/08/nvidia-hopper-architecture-annoncee/ [communiqué de presse officiel] : https://mistral.ai/blog/nvidia-h200/