80 Go de mémoire, 700 W et 60 Tflops. Présenté NVIDIA H100 Accelerator basé sur la trémie de génération GPU

80 Go de mémoire, 700 W et 60 Tflops. Présenté NVIDIA H100 Accelerator basé sur la trémie de génération GPU

Tandis qu'aucun GPU à deux côtés n'a montré à la société

Ainsi, comme prévu, Nvidia a introduit l'architecture de la trémie aujourd'hui et des solutions basées sur elle. Au moment de la rédaction de cette nouvelle, NVIDIA n'a présenté aucun GPU de taille de deux dimensions, mais la présentation n'est pas encore terminée.

Donc, pour le moment, la seule solution de la génération de trémie est GPU GH100, composée de 80 milliards de transistors. Il est basé sur l'accélérateur NVIDIA H100. Les paramètres du GPU lui-même n'ont pas encore été révélés, mais les caractéristiques de l'accélérateur sont connues.

Comme vous pouvez le constater, en fonction du facteur de forme, ces caractéristiques seront quelque peu différentes. La version senior a 15 872 noyaux CADA. À en juger par des données précoces, le GPU GH100 elle-même en pleine configuration contient 18 432 noyaux. Comme vous pouvez le constater, l'architecture Hopper est similaire à l'architecture d'ampère de jeu deux fois le nombre d'alu sur le bloc SM.

Mémoire dans les deux versions de 80 Go, ce qui est HBM3 avec une bande passante de 2 ou 3 tb / s. Le TDP de la version ancienne est incroyable 700 W, tandis que la modification avec PCIe 5.0 est deux fois plus petite.

Les performances de la version SXM5 atteint 30 TFLOPs (FP64), 60 TFLOPS (FP32) et la version PCIe 5.0 de 24 et 48 Tflops sont respectivement. Il convient également de noter l'interface NVLink, qui dans le même ordre fournit un taux de transfert de données de 900 ou 600 GB / s.

La nouvelle architecture apporte au marché et aux noyaux de tenseurs de la quatrième génération, neuf fois plus rapides que la génération précédente dans un certain nombre de tâches d'apprentissage de la machine. Séparément, NVIDIA marque un nouvel ensemble d'instructions DPX, qui aideront les développeurs à écrire du code pour accélérer les algorithmes de programmation dynamique dans divers secteurs, accélérant les processus de travail pour diagnostiquer les maladies, la modélisation quantique, l'analyse des colonnes et l'optimisation de routage.

Les systèmes basés sur la trémie seront disponibles pour les partenaires de NVIDIA au troisième trimestre.