Nvidiaは、6912 CUDA核を持つA100アクセラレータは、13,312のストリームプロセッサを備えた本能MI250よりもはるかに高速であると主張しています。

Nvidiaは、6912 CUDA核を持つA100アクセラレータは、13,312のストリームプロセッサを備えた本能MI250よりもはるかに高速であると主張しています。

よりエネルギー効率が高くなります

Nvidiaは最近、新しいアーキテクチャにH100アクセラレータを導入しましたが、そのようなカードは今年後半に顧客が利用できるようになります。それまでの間、これは起こりませんでした。同社は、現在のA100アクセラレータが最新のAMD Instinct MI250よりもはるかに優れていることを示すことにしました。

そもそも、Nvidia A100には80 GBのメモリが装備されており、19.5 TFLOPS(FP32およびFP64)の生産性が特徴であることを思い出してください。

本能MI250は、二重回路GPUを受け取った世界で最初のもの(MI250Xと一緒に)でした。カードは128 GBのメモリを提供し、パフォーマンスはマトリックスのパフォーマンスについて話す場合、45.3 TFLOPS(FP32およびFP64)または90.5 TFLOPSです。

ご覧のとおり、AMDソリューションの純粋なパフォーマンスは、競合他社の純粋なパフォーマンスの2倍以上です。これは論理的です。これは、TFLOPSのパフォーマンスは単純な式で計算され、核と周波数の数が考慮されるためです。 NVIDIA A100には6912のCUDA核があり、MI250には13,312のストリームプロセッサがありました。

それにもかかわらず、Nvidiaは自分のカードがより速いと主張しています。少なくともLAMMPS、NAMD、OpenMM、Gromacs、Amberなどのデータセンターで人気のある負荷タイプで。

ご覧のとおり、Nvidiaによると、その加速器は10%から90%よりも速いです。 4つのアダプターの構成では、最大差は2倍以上です。そして、このような靭帯のエネルギー効率は、AMDカードのエネルギー効率のほぼ3倍です。

もちろん、アーキテクチャと最適化の違いが膨大であるため、データセンターの専門的なアクセラレータは、ゲームグラフィックカードよりも互いに比較するのがはるかに困難です。いずれにせよ、NVIDIA A100がリストされているタスクのMI250よりも高速であっても、これはまだNVIDIAに非常に適しています