Nvidia는 6912 Cuda Nuclei를 가진 A100 가속기가 13,312 개의 스트림 프로세서를 가진 Instinct MI250보다 훨씬 빠르다고 주장합니다.

더 에너지 효율성
NVIDIA는 최근 새로운 아키텍처에서 H100 가속기를 도입했지만 이러한 카드는 하반기에 고객에게 제공 될 것입니다. 그 동안 이런 일이 일어나지 않았을 때, 회사는 현재 A100 가속기가 최신 AMD Instinct MI250보다 훨씬 낫다는 것을 보여 주기로 결정했습니다.
우선 NVIDIA A100에는 80GB의 메모리가 장착되어 있으며 19.5 TFLOPS (FP32 및 FP64)의 생산성이 특징입니다.
본능 MI250은 이중 회로 GPU를 수신 한 세계 최초의 세계 (MI250X와 함께)였습니다. 이 카드는 128GB의 메모리를 제공하며 성능은 매트릭스 성능에 대해 이야기하면 45.3 TFLOPS (FP32 및 FP64) 또는 90.5 TFLOP입니다.
보시다시피 AMD 솔루션의 순수한 성능은 경쟁 업체의 두 배 이상 높습니다. TFLOP의 성능은 간단한 공식으로 계산되므로 핵과 주파수의 수가 고려되기 때문에 이것은 논리적입니다. NVIDIA A100에는 6912 CUDA 핵이 있고 MI250에는 13,312 개의 스트림 프로세서가 있습니다.
그럼에도 불구하고 Nvidia는 카드가 더 빠르다고 주장합니다. 적어도 LAMMP, NAMD, OpenMM, Gromacs 및 Amber와 같은 데이터 센터에 인기있는 부하 유형에서.
보시다시피 Nvidia에 따르면 가속기는 10%에서 90%보다 빠릅니다. 4 개의 어댑터의 구성에서 최대 차이는 2 배 이상입니다. 그러한 인대의 에너지 효율은 AMD 카드의 에너지 효율보다 거의 3 배 높습니다.
물론, 데이터 센터의 전문화 된 가속기는 아키텍처와 최적화의 차이가 때로는 큰 게임 그래픽 카드보다 서로 비교하기가 훨씬 어렵습니다. 어쨌든 NVIDIA A100이 나열된 작업에서만 MI250보다 빠르더라도 NVIDIA에도 여전히 좋습니다.
.