Geforce RTX 4090은 무엇입니까? 구성 및 매개 변수 GPU AD102에 대한 세부 사항이 있습니다.

Geforce RTX 4090은 무엇입니까? 구성 및 매개 변수 GPU AD102에 대한 세부 사항이 있습니다.

이것은 Ada Lovelace Generation의 최고의 그래픽 프로세서입니다.

Geforce RTX 40은 이미 비디오 카드에 대해 알려져 있으며 점차 점점 더 많은 데이터가 네트워크에 나타납니다. 예를 들어, Geforce RTX 4090은 TDP 600 와트로 인정 받았지만 RTX 4070은 이미 300 와트입니다. 신선한 데이터는 GPU 신제품의 구성에 대해 조명합니다.

따라서 RTX 4090의 기초 역할을하는 GPU AD102에는 12 개의 GPC 블록이 있습니다. 이것은 GA102보다 70% 더 많으며 7 GPC. 각 GPC는 6 개의 TPC 블록과 2 개의 SM 블록으로 구성되며 GA102 구성에 해당합니다.

변경된 것은 FP32 및 INT32 핵의 구성입니다. 각 보조금에는 128 FP32 블록이 포함되지만 총 FP32+INT32 블록의 총 수는 192로 증가합니다. 이는 FP32 블록이 IN32 블록과 동일한 Ascendant를 사용하지 않기 때문입니다. 128 FP32 핵은 64 inte32 핵으로부터 분리된다.

따라서 각 보조금은 128 FP32 블록과 INT32 장치의 64 개, 192 블록만으로 구성됩니다. 각 SM에는 총 512 FP32 모듈과 256 개의 INT32 모듈, 768 개의 모듈 만 있습니다. 그리고 24 개의 SM 모듈 (GPC의 경우 2 개)이 있기 때문에 12,288 개의 FP32 모듈과 6,144 개의 INT32 모듈이 있으며, 이는 일반적인 용어를 말하면 총 18,432 개의 CUDA 핵입니다.

새로운 GPU는 SM 블록의 첫 번째 수준 캐시의 192 KB를 보유하고 있으며, 이는 Ampere 아키텍처보다 50% 더 높습니다. 이것은 AD102에서 L1 캐시의 총 4.5MB입니다. 비교를 위해 GA102는 약 1.8MB에 불과합니다.

두 번째 레벨 캐시는 96MB이며, 이는 이미 GA102보다 16 배 더 높습니다! 실제로 이것은 AMD 카드에 대한 Infinity Cache의 아날로그입니다.

ROP (Rasterization Blocks)의 수도 새로운 아키텍처에서 증가합니다. GPC 블록에는 32 대가 있으며 이것은 현재보다 두 배입니다. GPC 블록의 수가 증가하므로 결과적으로 AD120은 GA102의 112에 대해 384 개의 ROP 블록을 갖습니다. 나머지 4 세대와 제 3 세대 RT 핵은 나머지 사람들로부터보고되었습니다.