반응형

https://videocardz.com/77895/the-new-features-of-nvidia-turing-architecture

 


 

 

튜링(Turing) 의 주요 특징

 

INT32 코어 (부동소수점, 정수명령어 동시 실행)

 

튜링 아키텍처가 새로운 실행 단위(INT32) 를 추가합니다.

이 유닛은 튜링 GPU가 부동소수점, 비 부동소수점 프로세스를 병렬로 실행할 수 있도록 해줍니다.

엔비디아는 이것이 이론적으로 부동소수점 연산을 위해 전체적으로 36%를 추가로 제공해야 한다고 주장합니다.

 

공유된 L1 메모리, 텍스처 캐싱을 위한 새로운 통합 아키텍처 덕분에 병렬 실행이 가능합니다.

엔비디아는 INT32 / FP32 코어 디자인과 새로운 스트리밍 멀티 프로세서의 변화가 'CUDA 코어당 50% 향상된 성능' 을 제공한다고 주장합니다.

 

 

새로운 쉐이딩의 장점

 

◾ 메시 쉐이딩 - 버텍스, 테셀레이션, 기하학 쉐이딩을 위한 새로운 쉐이더 모델 (장면당 더 많은 객체)

◾ VRS(Variable Rate Shading. 가변 레이트 쉐이딩) - 쉐이딩 속도에 대한 개발자 제어 (시각적 이점을 제공하지 않는 쉐이딩에선 제한됩니다)

◾ 텍스처-공간 쉐이딩 - 쉐이딩 결과를 메모리에 저장 (프로세스 공유 작업을 복제할 필요가 없습니다)

◾ MVR(Multi View Rendering. 멀티 뷰 렌더링) - 패스 한 변에 멀티뷰로 파스칼(Pascal) 의 단일 패스 스테리오를 확장합니다.

 

 

튜링 메모리 압축

 

튜링 아키텍처는 새로운 무손실 압축 기술을 제공합니다.

엔비디아는 '최첨단' 파스칼 알고리즘에 대한 추가 개선으로 튜링이 파스칼 대비 50%의 유효 대역폭 증가했다고 엔비디아가 주장합니다.

 

 

비디오와 디스플레이 엔진

 

새로운 비디오 엔진은 DP 1.4a (8K에서 60Hz) 를 지원합니다.

튜링 그래픽카드는 DP, USB-C를 통해 2개의 8K 60Hz를 출력할 수 있으며, 새로운 엔진은 향상된 NVENC 인코더(30Hz 8K에서 H.265 스트림을 인코딩 가능합니다), HEV YUV444 10/12b HDR, H.264 8K, VP9 10/12 HDR을 지원합니다.

 

 

NVLink (2개 까지만)

 

TU102 GPU는 2개의 2세대 x8 NVLink를, TU104 GPU는 1개를 갖고 있습니다.

TU106은 NVLink를 지원하지 않습니다.

불행히도 엔비디아는 튜링의 3Way, 4Way SLI 지원을 끝내기로 결정했습니다.

 

 

엔비디아 TU102 vs TU104 vs TU106

 

엔비디아 지포스 RTX 2070은 새로운 시리즈에서 풀칩을 사용하는 유일한 카드입니다.

이전에 추측된 것처럼, TU104 기반 카드는 아닐겁니다.

엔비디아는 새로운 x70 모델이 실제로 TU106 GPU 기반이라는 것을 확인했습니다.

 

스펙에 맞춰, 튜링 TU102는 TU106의 스펙을 근본적으로 2배로 늘립니다.

TU104는 클러스터당 4개의 TPC를 특징으로 하는 유일한 튜링 칩입니다.

(GPC당 6개 있는 TU102, TU106과는 다르게요)

 

 

TU106이 중간급 칩인가요?

 

엔비디아가 만든 규칙에 따르면 TU106은 중간급 칩이야 합니다.

그러나 주목할 가치는 TU106의 크기가 GP104보다 131mm² 더 크다는 것입니다.

이렇게 해서 엔비디아는 TU100은 TU102로, TU102는 TU104로, TU104는 TU106으로 옮겼습니다.

다이 크기가 고려되는 한, TU106은 하이엔드 칩이 될 수도 있습니다.

 

 

 

튜링 GPU의 블럭 다이어그램

 

아래는 엔비디아의 원래 블럭 다이어그램인 튜링 GPU의 단순화된 버전입니다.

(기본적으로 99% 동일하지만 내것이 보기 더 꼴릴겁니다)

 

반응형

+ Recent posts