AWS는 4,000 개의 NVIDIA A100이 포함 된 클라우드 클러스터를 제공합니다.

AWS는 4,000 개의 NVIDIA A100이 포함 된 클라우드 클러스터를 제공합니다.

AWS는 AWS P4d라는 NVIDIA A100 액셀러레이터가 포함 된 차세대 EC2 인스턴스를 도입했습니다. AWS P4d 인스턴스는 NVLink를 통해 연결된 8 개의 Ampere A100 프로세서에서 지원되며 단일 시스템에서 2.5 페타 플롭의 부동 소수점 성능과 320GB의 고 대역폭 GPU 메모리를 제공합니다.

이 외에도 새로운 P4d 인스턴스는 Intel Xeon Scalable Cascade Lake 세대를 기반으로 한 96 개의 vCPU, 총 1.1TB의 시스템 메모리 및 8TB의 NVMe 스토리지를 제공합니다.

AWS에 따르면 새로운 인스턴스는 EFA (Elastic Fabric Adapter)를 사용하는 400Gbps 네트워킹과 NVIDIA GPUDirect RDMA 기술을 지원하는 최초의 인스턴스로 가상화 서버의 CPU 부하를 덜어줍니다. NVIDIA V100 GPU를 사용하는 최신 세대 P3 인스턴스보다 16 배 더 많은 총 네트워크 대역폭.

Amazon은 새로운 P4d 인스턴스가 기계 학습 비용을 최대 60 % 절감하고 딥 러닝 성능을 2.5 배 이상 제공한다고 주장합니다. 새로운 Amazon P4d 인스턴스는 오늘날 점점 더 일반화되고있는 더 크고 복잡한 모델을 교육하는 데 도움이됩니다.

또한 Amazon은 EC2 UltraClusters를 사용하여 P4d 인스턴스를 생성하는 기능도 제공합니다. 최대 처리 능력이 필요한 사용 사례에 맞게 조정 된 EC2 UltraClusters는 다른 클라우드 제공 업체의 두 배인 최대 4,000 A100 GPU 장치로 확장 할 수 있습니다.

요금 측면에서 AWS는 현재 P4d 인스턴스에 대해 하나의 구성 만 제공합니다. 8 개의 NVIDIA A100 GPU, 96 개의 vCPU, 400Gb 연결, 8TB NVMe SSD, 19Gbps ​​EBS 볼륨 및 600Gbps NVSwitch 스위치가있는 p4d.24xlarge 구성의 비용은 시간당 $ 32.77입니다. 1 년 또는 3 년 동안 사본을 예약하면 시간당 비용이 각각 $ 19.22 및 $ 11.57로 떨어집니다.