Nvidia는 6912 Cuda Nuclei를 가진 A100 가속기가 13,312 개의 스트림 프로세서를 가진 Instinct MI250보다 훨씬 빠르다고 주장합니다.

Nvidia는 6912 Cuda Nuclei를 가진 A100 가속기가 13,312 개의 스트림 프로세서를 가진 Instinct MI250보다 훨씬 빠르다고 주장합니다.

더 에너지 효율성

NVIDIA는 최근 새로운 아키텍처에서 H100 가속기를 도입했지만 이러한 카드는 하반기에 고객에게 제공 될 것입니다. 그 동안 이런 일이 일어나지 않았을 때, 회사는 현재 A100 가속기가 최신 AMD Instinct MI250보다 훨씬 낫다는 것을 보여 주기로 결정했습니다.

우선 NVIDIA A100에는 80GB의 메모리가 장착되어 있으며 19.5 TFLOPS (FP32 및 FP64)의 생산성이 특징입니다.

본능 MI250은 이중 회로 GPU를 수신 한 세계 최초의 세계 (MI250X와 함께)였습니다. 이 카드는 128GB의 메모리를 제공하며 성능은 매트릭스 성능에 대해 이야기하면 45.3 TFLOPS (FP32 및 FP64) 또는 90.5 TFLOP입니다.

보시다시피 AMD 솔루션의 순수한 성능은 경쟁 업체의 두 배 이상 높습니다. TFLOP의 성능은 간단한 공식으로 계산되므로 핵과 주파수의 수가 고려되기 때문에 이것은 논리적입니다. NVIDIA A100에는 6912 CUDA 핵이 있고 MI250에는 13,312 개의 스트림 프로세서가 있습니다.

그럼에도 불구하고 Nvidia는 카드가 더 빠르다고 주장합니다. 적어도 LAMMP, NAMD, OpenMM, Gromacs 및 Amber와 같은 데이터 센터에 인기있는 부하 유형에서.

보시다시피 Nvidia에 따르면 가속기는 10%에서 90%보다 빠릅니다. 4 개의 어댑터의 구성에서 최대 차이는 2 배 이상입니다. 그러한 인대의 에너지 효율은 AMD 카드의 에너지 효율보다 거의 3 배 높습니다.

물론, 데이터 센터의 전문화 된 가속기는 아키텍처와 최적화의 차이가 때로는 큰 게임 그래픽 카드보다 서로 비교하기가 훨씬 어렵습니다. 어쨌든 NVIDIA A100이 나열된 작업에서만 MI250보다 빠르더라도 NVIDIA에도 여전히 좋습니다.
.