반응형

https://www.tomshardware.com/picturestory/715-history-of-nvidia-gpus.html

 

진짜 톰할배 사이트 드럽게 느려터지네

양도 양이지만 요즘따라 관절이 안 좋아서 번역이 좀 더 오래 걸렸네요

 

빠른 이동을 원하시 분들은 아래 부제목 클릭하세요

 

1. NV1 : 엔비디아 시장에 진입하다

2. NV3 : Riva 128

3. NV4 : 폭격하는 꼬맹이

4. NV5 : 또 다른 폭격

5. NV10 : 지포스 Luke를 사용하세요

6. NV11, NV15, NV16 : 지포스 2

7. NV20 : 지포스 3

8. NV2A : 엔비디아와 Xbox

9. NV17 : 지포스 4 ⑴

10. NV25 : 지포스 4 ⑵

11. NV30 : FX 5000 ⑴

12. NV35 : FX 5000 시리즈 ⑵

13. NV40 : 엔비디아 지포스 6800

14. NV43 : 지포스 6600

15. G70 : 지포스 7800 GTX, 지포스 7800 GTX 512

16. G80 : 지포스 8000 시리즈와 테슬라의 탄생

17. G92 : 지포스 9000 시리즈와 테슬라의 개선

18. G92, G92B : 계속되는 지포스 9000 시리즈

19. G92B : 지포스 100 시리즈

20. GT200 : 지포스 200 시리즈와 테슬라 2.0

21. GT215 : 지포스 300 시리즈

22. GF100 : 페르미 아키텍처를 품은 지포스 400

23. GF104, 106, 108 : 페르미 하위 칩들

24. GF110 : 일해라 페르미

25. GK104 : 케플러와 600 시리즈

26. GK110 : 케플러 풀칩

27. GM204 : 맥스웰

28. GP104 : 파스칼

29. GP102 : 1080Ti, TITAN X, TITAN Xp

30. 튜링과 지포스 RTX

 


 

 

1. NV1 : 엔비디아 시장에 진입하다

 

엔비디아는 1993년에 설립되어 첫 제품인 NV1을 위해 개발을 시작했습니다.

개발에 2년이 걸린 NV1은 1995년에 공식 출시되었습니다.

혁신적인 NV1 칩셋은 오디오 프로세싱 하드웨어와 함꼐 2D, 3D 비디오를 모두 처리할 수 있었습니다.

엔비디아는 새턴(Saturn) 게임 콘솔에서 NV1을 사용하기로 한 세가(Sega) 의 결정에 따라 데스크탑 그래픽카드에서 컨트롤러를 사용할 수 있게 해주는 새턴 컨트롤러에 대한 지원을 통합했습니다.

 

NV1의 그래픽 가속기의 가장 중요한 특징은 가장 기본적인 기하학적 기본 요소로써 사각형을 사용한다는 점입니다.

이로 인해 게임 디자이너는 NV1에 대한 지원을 추가하거나, 게임 디자이너를 위한 게임을 설계할 수 있는 어려움을 겪었습니다.

마이크로소프트가 다이렉트X 게임 API의 첫번째 개정판을 발표했을 떄, 이 점은 점점 더 문제가 되었습니다.

이 API는 가장 기본적인 기하학적 기본 구조로 다각형 설계되었습니다.

 

데스크탑 카드는 133MB/s 대역폭으로 일반적인 PCI 인터페이스를 사용했습니다.

카드는 최대 75MHz의 EDO(Extended Data Output) 메모리를 사용하고, 그래픽 가속기는 최대 16비트의 1600 1200 해상도를 사용할 수 있었습니다.

세가 새턴과 데스크탑 시장 판매의 결합 덕분에 엔비디아는 사업을 유지할 수 있었지만, NV1은 그다지 성공하지 못했습니다.

그래픽과 오디오 성능이 좋지 않아 다른 다양한 하드웨어 구성 요소로 인해 다른 그래픽 가속기에 비해 비용이 많이 들었습니다.

 

엔비디아는 NV1의 후속작으로 NV2를 준비했으나, 세가와의 의견 충돌로 인해 드림캐스트(Dreamcast) 콘솔에서 파워 VR(Power VR) 기술을 사용하기로 결정했으며, NV2가 취소되었습니다.

 


 

 

2. NV3 : Riva 128

 

NV3로 알려진 Riva 128은 1997년에 출시되었으며, 상당히 성공적이었습니다.

가장 기본적인 기하학적 기본 요소인 사각형을 활용하여 훨씬 더 일반적인 폴리곤으로 바뀌었습니다.

이로써 게임에서 Riva 128에 대한 지원을 쉽게 추가할 수 있기 되었습니다.

GPU는 또한 혼합된 결과로 폴리곤 텍스쳐 매핑을 사용했습니다.

이로 인해 GPU는 프레임을 더 빨리 렌더링 할 수 있지만, 이미지 품질은 떨어졌습니다.

 

GPU는 두 버전이 존재하는데, Riva 128과 Riva 128ZX가 있습니다.

Riva 128ZX 그래픽 가속기는 엔비디아가 RAMDAC(Random Access Memory Digital to Analog Converter) 클럭을 높일 수 있도록 고품질의 큰 칩을 사용했습니다.

두 모델 모두 129 비트 버스를 통해 액세스되는 100MHz 클럭의 SDRAM 메모리를 사용하여 GPU에 1.6GB/s의 대역폭을 제공합니다.

반면에 Riva 128에는 4MB가, Riva 128ZX에는 8MB VRAM이 탑재되었습니다.

또한 Riva 128은 206MHz인데 Riva 128ZX는 250MHz 입니다.

 

이 GPU에는 2D, 3D 그래픽 가속 기능을 모두 갖고 있었기에 상당히 인기가 있었습니다.

하지만 엔비디아의 주요 경쟁 업체인 3DFX의 제품보다는 아래입니다.

 


 

 

3. NV4 : 폭격하는 꼬맹이

 

1998년에 엔비디아는 가장 폭발적인 카드인 Riva TNT (코드 네임 NV4) 를 선보였습니다.

NV3가 그랬듯이, NV4도 2D, 3D 그래픽을 렌더링 할 수 있었습니다.

엔비디아는 32비트 트루컬러를 지원하여 VRAM을 16MB SDRAM으로 확장하고 성능을 향상시킴으로써 NV3보다 향상되었습니다.

AGP 슬릇이 점점 인기를 얻고 있었지만, 상당수의 시스템에는 슬릇이 없기 때문에 엔비디아는 NV4를 주로 PCI 그래픽 가속기로 판매하고, 적은 수만 AGP 그래픽 가속기로 판매했습니다.

Riva TNT부터 엔비디아는 호환성과 성능을 향상시키기 위해 드라이버를 정기적으로 업데이트 하고, 이를 위해 많은 노력을 기울였습니다.

 

NV4가 출시되었을 때, 3DFX의 Voodoo2는 성능왕 이라는 타이틀을 가졌지만, 상대적으로 비싸고 16비트 컬러로 제한되었습니다.

Voodoo2는 별도의 2D 그래픽카드가 필요하기 때문에 지출이 훨씬 많습니다.

별도의 2D 그래픽카드가 필요했던 것은 1990년대 일반적이었지만, Riva TNT가 2D, 3D 그래픽을 모두 처리할 수 있었기 떄문에 Voodoo2보다 훨씬 저렴한 예산으로 카드를 구입할 수 있었습니다.

 

엔비디아는 Voodoo2에서 성능왕 타이틀을 가져오기 위해 125MHz Riva TNT를 출시할 계획이었지만, 그래픽카드가 아닌 보일러가 되서 안정적이지 않았습니다.

대신 엔비디아는 VRAM을 90MHz에서 110MHz로 오버클럭해서 의도적으로 Riva TNT를 Voodoo2보다 느리게 만들었습니다.

Riva TNT는 여전히 훌륭한 성능을 자랑했으며, 엔비디아의 뎃네이터(Detonator) 드라이버 출시 이후 성능으 크게 향상되어 더욱 경쟁력을 갖게 되었습니다.

 

전체적으로 Riva TNT는 성능과 기능면에서 성공적이었습니다.

엔비디아의 드라이버 지원 증가로 인해 고객 유지에 도움이 되었지만, 1990년대 누구나 드라이버를 다루는 악몽이 무엇인지 말해주는 예시가 되었습니다.

 


 

 

4. NV5 : 또 다른 폭격

 

1999년에 엔비디아는 Riva TNT2 (코드 네임 NV5) 를 사용하여 성능왕이라는 타이틀을 위한 또 하나의 발판을 마련했습니다.

Riva TNT2는 원래 Riva TNT와 구조적으로 비슷했지만, 향상된 렌더링 엔진 덕분에 동클럭에서 이전 모델보다 약 10~17% 더 빠르게 처리할 수 있었습니다.

엔비디아는 또한 카드에 더 많은 대역폭을 제공하는 AGP 4X 슬릇에 대한 지원을 추가했으며, VRAM의 양을 32MB로 두배로 늘렸습니다.

아마도 가장 중요한 개선점은 250nm로의 전환이었고, 이는 엔비디아가 Riva TNT2를 175MHz까지 끌어올리도록 허용했습니다.

 

Riva TNT2의 주요 경쟁자는 3DFX의 Voodoo3입니다.

이 두 제품은 성능이나 기능 측면에서 명백한 승자가 아닌 수년간 서로 줘팼습니다.

 


 

 

5. NV10 : 지포스 Luke를 사용하세요

 

1999년 말에 엔비디아는 지포스 256 (코드 네임 NV 10) 을 발표했습니다.

지포스 256 이전에는 본질적으로 모든 그래픽카드를 '그래픽 가속기' 또는 단순히 '그래픽카드'로 불렀지만, 엔비디아는 지포스 256을 'GPU'라고 불렀습니다.

엔비디아는 하드웨어 T&L(Transform and Lighting) 프로세싱을 포함하여 GPU가 일반적으로 CPU로 이전한 계산을 수행할 수 있게 해주는 이 새로운 기능을 여러가지 패키지로 제공합니다.

T&L 엔진은 이 작업을 위해 특별히 고안된 고정 하드웨어라서 처리량은 550MHz의 하이엔드 펜티엄 Ⅲ 프로세서보다 약 5배 빨랐습니다.

 

이 디자인은 Riva TNT2와 달리 2개가 아닌 4개의 픽셀 파이프 라인을 포함하고 있다는 점에서 다릅니다.

Riva TNT2의 클럭 속도와 일치할 수 없었지만, 추가 파이프라인으로 인해 이전보다 약 50% 빠른 속도로 수행할 수 있었습니다.

GPU는 엔비디아 최초의 32~64MB DDR SDRAM이 탑재되어 성능 향상에 기여를 했습니다.

GPU 트랜지스터는 220nm로 줄었고, 코어 자체는 120MHz로 작동했으며 VRAM은 150~166MHz로 작동했습니다.

 

지포스 256은 엔비디아에 처음으로 포함된 비디오 가속 하드웨어를 지원했지만, MPEG-2 컨텐츠의 모션 가속에 한정되었습니다.

 


 

 

6. NV11, NV15, NV16 : 지포스2

 

엔비디아는 NV10 지포스 256의 후속으로 지포스2를 냈습니다.

지포스2 아키텍처는 이전 모델과 비슷하지만, 엔비디아는 180nm 트랜지스터로 다이를 더욱 축소함으로써 각 픽셀 파이프라인에 부착된 TMU를 두배로 늘릴 수 있었습니다.

지포스2 아키텍처는 이전 모델과 비슷했지만, 엔비디아는 180nm 트랜지스터로 다이를 더욱 축소함으로써 각 픽셀 파이프라인에 있는 TMU를 두배로 늘릴 수 있게 되었습니다.

엔비디아는 지포스2 브랜드 카드 안에 NV11, NV15, NV16 이라는 3가지 코어를 사용했습니다.

이 모든 코어는 동일한 아키텍처를 사용했지만, NV11에는 단 두개의 픽셀 파이프라인이 포함되어 있는 반면, NV15, NV16 코어에는 4개가 있고, NV16은 NV15보다 클럭이 높습니다.

 

지포스2는 다중 모니터 구성을 지원하는 엔비디아 최초의 제품이었습니다.

지포스2 GPU는 SDR, DDR 메모리와 함꼐 사용할 수 있었습니다.

 


 

 

7. NV20 : 지포스 3

 

2001년에 지포스3 (코드 네임 NV20) 은 엔비디아의 첫번쨰 다이렉트X 8 호환 카드로 출시되었습니다.

코어는 150nm에서 제조된 6000만개의 트랜지스터가 있으며, 최대 250MHz까지 끌어올릴 수 있습니다.

엔비디아는 Z버퍼를 업축하고, 메모리의 제한된 대역폭에 대한 전반적인 요청을 줄이기 위해 'LMA'(Lightspeed Memory Architecture) 라는 새로운 메모리 서브 시스템을 지포스3에 선보였습니다.

또한 Quincunx 이라는 특수 알고리즘을 사용하여 FSAA를 가속화하도록 설계했습니다.

전반적인 성능을 지포스2보다 좋았지만, GPU의 복잡성으로 인해 제작 비용이 상당히 비쌌고, 비교 대상으로 고가 태그를 붙였습니다.

 


 

 

8. NV2A : 엔비디아와 Xbox

 

엔비디아는 2001년 마이크로소프트의 오리지널 Xbox의 핵심 구성 요소로써 홈 콘솔 시장에서 다시한번 자아를 성찰하게 됩니다.

Xbox는 그 당시의 현대 PC에서 볼 수 있는 하드웨어와 거의 동일한 하드웨어를 사용했으며, 엔비디아가 설계한 GPU는 지포스3을 기반으로 한 커스텀 모델이었습니다.

NV20 GPU와 마찬가지로 Xbox 내부의 NV2A에는 각각 2개의 TMU가 있는 4개의 픽셀 파이프라인이 포함되어 있습니다.

엔비디아는 Xbox의 오디오 하드웨어인 MCPX(사운드스톰. SoundStorm) 을 만들었습니다.

 


 

 

9. NV17 : 지포스 4 ⑴

 

엔비디아는 2002년에 다른 아키텍처를 기반으로 여러 GPU를 도입하는 작업을 시작했습니다.

이 모든것은 지포스4로 브랜드 되었습니다.

지포스4 스택의 로우엔드에는 기본적으로 150nm 트랜지스터를 사용하여 수축되었으며, 250~300MHz의 NV11 지포스2 다이였던 NV17이 있습니다.

엔비디아가 모바일, 데스크탑 시장 모두에 적용할 수 있는 합리적인 가격의 제품이었던 NV20과 비교했을 때 획기적으로 단순한 설계였습니다.

 

엔비디아는 나중에 NV17의 개선판을 NV18, NV19로 불렀으며 이들을 발표했습니다.

NV18은 AGP 8X로 업그레이드 된 버스를 특징으로 하며, NV19는 기본적으로 x16 링크를 지원하는 PCIe 브릿지가 있는 NV18 칩이었습니다.

이 칩의 VRAM DDR 메모리는 166~667MHz로 작동했습니다.

 


 

 

10. NV25 : 지포스 4 ⑵

 

엔비디아는 시장의 하반기를 차지하는 NV17과 함께 하이엔드를 지원하는 NV25를 출시했습니다.

NV25는 지포스3의 아키텍처 개선으로 개발되었으며, 4개의 픽셀 파이프라인, 8개의 TMU, 4개의 ROP가 있는 동일한 리소스를 기본적으로 갖고 있습니다.

그러나 NV25는 버텍스 쉐이더가 두배나 많았고 (1에서 2로 증가), 업데이트 된 LMA-Ⅱ 시스템을 특징으로 했습니다.

전반적으로 NV25에는 6300개의 트랜지스터가 있으며 지포스3보다 300만개 더 많습니다.

지포스4 NV25는 225~300MHz로 작동했으며, 지포스3보다 클럭면에서 우위였습니다.

128MB VRAM DDR 메모리는 500~650MHz에서 작동했습니다.

 

다이렉트X 7 타이틀의 NV25 벤치마크는 지포스3 대비 약 10% 정도 향상되었습니다.

그러나 버텍스 쉐이더를 활용한 다이렉트X 8 게임은 NV25의 성능 향상을 38%까지 끌어 올렸습니다.

 

엔비디아는 나중에 NV28이라는 NV25의 개선된 칩을 출시했습니다.

마지막 슬라이드에서 언급한 NV18과 비슷하게, NV28은 AGP 8X를 지원한다는 점에서 NV25와 달랐습니다.

 


 

 

11. NV30 : FX 5000 ⑴

 

2002년 게임 업계는 수년간 가장 많이 사용되고, 영향력 있는 게임 API중 하나인 마이크로소프트의 다이렉트X 9 API를 환영했습니다.

ATI와 엔비디아는 모두 다이렉트X 9호환 하드웨어를 개발하기 위해 노력했으며, 이는 새로운 GPU가 픽셀 쉐이더 2.0을 지원해야 한다는 것을 의미했습니다.

ATI가 엔비디아보다 먼저 2002년 8월에 최초의 다이렉트X 9 지원 카드를 출시했지만, 2002년 말 엔비디아는 FX 5000 시리즈를 출시했습니다.

 

엔비디아는 ATI보다 다이렉트X 9 카드를 늦게 출시했지만, 엔비디아가 게임 개발자를 유치하기 위해 사용했던 몇가지 추가 기능이 있습니다.

주요 차이점은 엔비디아의 자체 개정판인 픽셀 쉐이더 2.0A의 사용이었습니다.

픽셀 쉐이더 2.0A는 무제한 종속 텍스처, 멸령 슬릇 수의 급격한 증가, 명령어 예측 하드웨어, 고급 그레디언트 효과 지원과 같은 마이크로소프트의 픽셀 쉐이더 2.0보다 향상된 여러가지 기능을 제공합니다.

기본적으로 픽셀 쉐이더 2.0A에는 마이크로소프트의 픽셀 쉐이더 3.0에 포함될 몇가지 개선사항이 포함되어 있습니다.

 

130nm 트랜지스터를 사용하여 제작된 NV30은 400~500MHz로 작동하며, 800~1000MHz로 작동하는 128비트 버스를 통해 128MB, 256MB DDR2 VRAM에 액세스 할 수 있습니다.

NV30 자체는 2개의 버텍스 쉐이더, 8개의 TMU, 4개의 ROP가 있는 4단계 파이프라인 디자인을 계속 사용했습니다.

엔비디아는 4개의 픽셀 파이프라인과 단 하나의 버텍스 쉐이더, 4개의 TMU, 4개의 ROP가 있는 로우엔드 버전을 만들어 더 저렴한 DDR VRAM을 사용할 수 있었습니다.

 


 

 

12. NV35 : FX 5000 시리즈 ⑵

 

NV30은 원래 FX 5000 시리즈 플래그십이었지만, 불과 몇달 후 엔비디아는 버텍스 쉐이더가 추가된 더 빠른 모델을 출시했으며, 더 넓은 256 비트 버스를 통해 연결된 DDR3 VRAM을 사용할 수 있었습니다.

 

FX 5000 시리즈는 ATI의 경쟁 GPU에 비해 성능이 떨어졌기 떄문에 진보된 기능이 많았음에도 산업폐기물이란 욕을 먹었습니다.

또한 35번 타는 보일러로 발열도 상당해서 GPU가 비정상적으로 뜨거워져 OEM 제조업체가 커다란 쿨러가 있는 FX 5000 시리즈를 판매했습니다.

 


 

 

13. NV40 : 엔비디아 지포스 6800

 

FX 5000 시리즈 출시 1년 만에 엔비디아는 6000 시리즈를 출시했습니다.

지포스 6800 울트라는 NV40 기반 엔비디아의 플래그십입니다.

2억 2000만 개의 트랜지스터, 16개의 슈퍼 스칼라 파이프라인 (각각 하나의 픽셀쉐이더, TMU, ROP 포함), 6개의 버텍스 쉐이더, 픽셀 쉐이더 3.0 지원, 32비트 부동소수점 정밀도를 가진 NV40은 NV30보다 더 많은 리소스를 처리할 수 있습니다.

또한 256비트 버스를 통해 최대 512MB의 GDDR3을 지원하기 때문에 이전 GPU보다 메모리와 메모리 성능이 크게 향상되었습니다.

이 GPU는 FX 5000 시리즈와 동일한 130nm으로 제조되었습니다.

 

6000 시리즈는 일부 게임에서 FX 5950 울트라보다 2배 빨랐으며, 대부분의 게임에서 50% 더 빨랐습니다.

동시에 전성비도 향상되었습니다.

 


 

 

14. NV43 : 지포스 6600

 

엔비디아가 GPU 시장의 하이엔드 시장에서의 입지를 확보하자, 새로운 미들레인지 그래픽 칩을 생산하는데 관심을 돌렸습니다.

이 GPU는 엔비디아 지포스 6600 개조 버전이었으며, NV40의 실행 리소스중 절반이 필수적입니다.

더 좁은 128비트 버스로 하향되었습니다.

그러나 NV43은 110nm 공정 트랜지스터를 사용하여 축소됨으로써 한가지 중요한 이점을 갖고 있습니다.

감소된 리소스로 인해 NV43은 상대적으로 저렴하게 생산되었으며, 새로운 제조 기술은 지포스 6600에 비해 전력 소모를 줄이고, 클럭 속도를 약 20% 향상시켰습니다.

 


 

 

15. G70 : 지포스 7800 GTX, 지포스 7800 GTX 512

 

새로운 GPU 코드네임 G70을 사용하는 지포스 7800 GTX은 지포스 6800을 뒤이어 성공했습니다.

NV43과 동일한 110nm 기술을 기반으로 하는 G70은 24개의 TMU, 8개의 버텍스 쉐이더, 16개의 ROP를 가진 총 24개의 픽셀 파이프라인을 포함하고 있습니다.

GPU는 246비트 버스를 통해 최대 600MHz (1.2GHz DDR) 로 작동하는 최대 256MB GDDR3에 액세스 할 수 있습니다.

코어는 430MHz로 작동했습니다.

 

지포스 7800 GTX는 당분간 아주 강력했지만, 엔비디아는 지포스 7800 GTX 512를 출시한 직후 여러가지를 개선했습니다.

이 카드로 엔비디아는 코어의 레이아웃을 수정하고, 새로운 쿨러 디자인으로 전환하여 클럭을 최대 550MHz까지 끌어 올렸습니다.

또한 레이턴시를 줄이고 버스 폭을 512 비트로 늘리며 메모리 클럭을 최대 850MHz (1.7GHz DDR) 로 올림으로써 메모리 컨트롤러를 향상시켰습니다.

메모리 용량도 512MB로 증가한건 덤이고요.

 


 

 

16. G80 : 지포스 8000 시리즈와 테슬라의 탄생

 

엔비디아는 자사 최초의 통합 쉐이더 디자인인 지포스 8000 시리즈로 테슬라 마이크로 아키텍처를 발표했습니다.

지포스 8000, 지포스 9000, 지포스 100, 지포스 200, 지포스 300 시리즈 GPU에 사용되었기 때문에 테슬라는 엔비디아에서 가장 오래 사용된 아키텍처중 하나가 되었습니다.

 

지포스 8000 시리즈의 주력 제품은 8800 GTX로 80nm에서 제조된 엔비디아의 G80 GPU로 6억 8100만개 이상의 트랜지스터를 탑재했습니다.

통합 쉐이더 아키텍처 덕분에 8800 GTX와 나머지 8000 시리즈는 마이크로소프트의 새로운 다이렉트X 10 API, 픽셀 쉐이더 4.0을 완벽하게 지원합니다.

8800 GTX는 575MHz로 작동하며, 128개의 쉐이더가 있으며 384비트 버스를 통해 768MB의 GDDR3 VRAM과 통신합니다.

또한 엔비디아는 TMU를 최대 64개로 늘리고, ROP를 24개로 늘렸습니다.

이러한 향상된 기능으로 인해 지포스 8800 GTX는 이전의 고해상도 테스트에서 2배 이상 빠른 성능을 보였습니다.

 

수율이 향상되면서 엔비디아는 8800 GTX를 8800 울트라로 대체했습니다.

두 그래픽카드가 동일한 G80 코어를 사용하지만, 8800 울트라는 612MHz의 클럭이여서 8800 GTX보다 더 좋습니다.

 


 

 

17. G92 : 지포스 9000 시리즈와 테슬라의 개선

 

엔비디아는 지포스 9000 시리즈 제품에서 테슬라 아키텍처를 계속 써왔지만, 몇가지 개선을 했습니다.

G92 코어의 플래그십인 지포스 9000 시리즈는 본질적으로 G80의 축소형이었습니다.

엔비디아는 65nm에서 G92를 생산함으로써 전제 전력소비를 줄이면서 600~675MHz의 클럭을 기록할 수 있었습니다.

 

개선된 전성비와 줄어들은 발열 덕분에 엔비디아는 9000 시르즈의 주력 제품으로 지포스 9800 GX2라는 듀얼 G92 GPU를 출시했습니다.

이것은 힘이 부족했던 G80에서는 상상조차 할 수 없던 일이었습니다.

테스트에서 안티 앨리어싱을 끄면 9800 GX2는 8800 울트라보다 평균 29~41% 가량 뛰어났습니다.

그러나 안티 앨리어싱을 켜면 9800GX2의 성능은 VRAM 제한으로 인해 13%로 줄어듭니다.

9800 GX2의 각 GX2는 512MB의 GDDR3에 액세스 할 수 있었고, 8800 울트라는 768MB VRAM을 갖고 있었습니다.

카드는 8800 울트라보다 훨씬 비쌌으며, 판매에 어려움을 겪었습니다.

 


 

 

18. G92, G92B : 계속되는 지포스 9000 시리즈

 

엔비디아는 나중에 G92 코어를 냈으며 칩은 675MHz, 512MB의 GDDR3 VRAM을 가진 지포스 9800 GTX를 냈습니다.

이 9800 GTX는 클럭 속도가 높아서 8800 울트라보다 약간 빨랐지만, 제한된 VRAM 용량으로 인해 문제가 또 발생했습니다.

결국 엔비디아는 새로운 55nm로 제조된 코드네임 G92B를 사용해서 지포스 9800 GTX+ 를 냈습니다.

이로인해 엔비디아는 칩의 클럭을 최대 738MHz로 올렸지만, 9800 GTX+에서 개선된 가장 중요한 것은 1GB의 VRAM입니다.

 


 

 

19. G92B : 지포스 100 시리즈

 

엔비디아는 9000 시리즈 단종될 때 쯤 OEM용으로 지포스 1000 시리즈를 출시했습니다.

개인 구매자는 소매 업체에서 직접 100 시리즈 카드를 구입할 수 없었습니다.

모든 100 시리즈 GPU는 클럭과 카드 디자인만 약간 변경한 9000 시리즈의 리브랜드 제품이었습니다.

 


 

 

20. GT200 : 지포스 200 시리즈와 테슬라 2.0

 

엔비디아는 2008년에 테슬라 아키텍처를 개선한 GT200 코어를 발표했습니다.

아키텍처에 대한 변경으로 향상된 스케줄러, 명령어 세트, 더 넓은 메모리 인터페이스, 변경된 코어 비율이 이에 해당합니다.

G92에는 16개의 EU, 8개의 TMU가 있는 8개의 텍스처 프로세서 클러스터(Texture Processor Clusters. TPC) 가 있었지만, GT200은 각각 24개의 EU, 8개의 TMU가 있는 10개의 TPC를 사용했습니다.

엔비디아는 또한 GT200칩의 ROP를 G92의 16개에서 32개로 두배 늘렸습니다.

메모리 버스는 256비트에서 512비트 연결로 GDDR3 메모리 풀로 확장되었습니다.

 

엔비디아는 GT200 기반의 지포스 GTX 280을 출시했으며, 이는 리소스 증가로 인해 지포스 9800 GTX+보다 더 빠른 성능을 보입니다.

지포스 9800 GX2보다 모든면에서 뛰어날 수는 없지만, 9800 GX2는 전기를 더 먹고, 메모리가 적기 떄문에 GTX 280은 좋은 그래픽카드로 인식되었습니다.

2009년에 2개의 GT200을 사용한 지포스 GTX 295를 출시하면서 200 시리즈의 시장 지위가 더욱 확고해졌습니다.

 


 

 

21. GT215 : 지포스 300 시리즈

 

지포스 300 시리즈는 엔비디아의 두번쨰 OEM 전용 카드 라인업이었습니다.

지포스 200 시리즈의 중/저가형 GPU로만 구성되었습니다.

모든 지포스 300 시리즈 데스크탑 GPU는 40nm 공정을 사용하며 테슬라 2.0 아키텍처를 기반으로 합니다.

 


 

 

22. GF100 : 페르미 아키텍처를 품은 지포스 400

 

테슬라와 지포스 8000, 9000, 100, 200, 300 시리즈는 엔비디아의 페르미 아키텍처와 지포스 400 시리즈가 뒤를 이었습니다.

지금까지 생산된 가장 큰 페르미 칩은 4개의 GPC를 포함하는 GF100 입니다.

각 GPC에는 32개의 CUDA코어, 4개의 TMU, 3개의 ROP와 폴리모프(PolyMorph) 엔진이 포함된 4개의 스트리밍 멀티 프로세서가 있습니다.

풀칩인 GF100에는 총 512개의 CUDA코어, 64개의 TMU, 48개의 ROP, 16개의 폴리모프 엔진과 함꼐 제공됩니다.

 

그러나 페르미의 플래그십인 지포스 GTX 480은 480개의 CUDA 코어, 60개의 TMU, 48개의 ROP, 15개의 폴리모프만을 지원합니다.

GF100 칩의 크기는 529mm² 에 달합니다.

이로 인해 완벽벽한 샘플을 생산하기가 어려워졌고, 엔비디아는 약간 문제가 있는 컷칩을 사용하게 되었습니다.

지포스 GTX 480은 너무 뜨거워서 480번 타는 보일러라는 별명도 만들어졌습니다.

엔비디아와 이사회 파트너는 일반적으로 GTX 480에서도 열세인 솔루션을 사용했으며, 그래픽카드는 최근 몇년 동안 가장 까다로운 GPU중 하나로 명성을 얻었습니다.

 


 

 

23. GF104, 106, 108 : 페르미 하위 칩들

 

엔비디아는 생산 비용을 줄이고 페르미 GPU의 수율을 높이기 위해 SM의 수를 재배치했습니다.

GF104의 내부의 8개의 SM, GF106 내부의 4개의 SM은 각각 48개의 CUDA 코어, 4개의 TMU, 4개의 ROP를 포함합니다.

이것은 SM이 적기 때문에 전체 다이 크기를 줄였습니다.

그것들은 또한 쉐이더 성능을 어느정도 감소시켰지만, 그럼에도 불구하고 이러한 코어는 경쟁력 있습니다.

이 핵심 구성을 통해 GF104를 탑재한 지포스 GTX 460은 11개의 SM이 활성화된 GF100를 탑재한 지포스 RTX 465와 비슷하게 작동할 수 있었습니다.

 

엔비디아가 GF108을 만들때에는 각 SM의 리소스 수를 다시 변경했습니다.

GF108은 48개의 CUDA코어, 4개의 TMU, 2개의 ROP가 각각 포함된 SM이 2개 있습니다.

 


 

 

24. GF110 : 일해라 페르미

 

엔비디아는 페르미 아키텍처를 계속 사용해서 지포스 500 시리즈를 만들었지만, 트랜지스터 단위로 각 GPU를 재배치함으로써 디자인을 개선했습니다.
이 재배치의 근본적인 개념은 GPU의 성능에 덜 중요한 부분에서 느린 트랜지스터를 사용하고, 성능에 크게 영향을 미치는 주요 영역에서 빠른 트랜지스터를 효율적으로 사용하는 것입니다.

이는 전력 소비를 줄이고, 클럭을 올리는 효과가 있습니다.

 

지포스 500 시리즈의 플래그십인 GTX 580은 GF110 칩을 사용했습니다.

앞서 언급한 트랜지스터 재배치 외에도 엔비디아는 FP16, Z-Cull 효율성을 향상시켰습니다.

이러한 변경으로 인해 GF10에서 16개의 SM을 모두 살릴 수 있었고, GTX 580은 GTX 480보다 상당히 빠른 속도를 냈습니다.

 


 

 

25. GK104 : 케플러와 600 시리즈

 

케플러 아키텍처 기반 GK104를 탑재한 GTX 680은 GTX 580의 뒤를 이어 성공했습니다.

이것은 트랜지스터가 28nm로 제조되면서 GK104가 GF110 보다 훨씬 효율적이기 떄문에 그런것입니다.

GK104를 GF110과 비교하면 TMU는 2배에, CUDA는 3배에 달합니다.

리소스의 증가로 인해 3배만큼 향상되진 않았지만, 게임에 따라서 10~30% 가량 향상되었습니다.

전반적인 효율성이 더욱 높아졌습니다.

 


 

 

26. GK110 : 케플러 풀칩

 

지포스 700 시리즈에 대한 엔비디아의 계획은 본질적으로 더 큰 케플러 다이를 도입하는 것입니다.

GK110은 슈퍼컴퓨터 내부 계산 작업을 위해서 완벽했습니다.

이 크고 아름다운 GPU에는 2880개의 CUDA 코어, 240개의 TMU가 있습니다.

처음에는 GTX TITAN에 도입되었는데, 하나의 SMX를 비활성화해서 2688 CUDA 코어, 224 TMU, 6GB의 VRAM을 가졌습니다.

그러나 TITAN은 1000 USD라는 프리미엄 가격으로 판매되고, 소량만 판매되었습니다.

나중에 3GB의 VRAM을 가진 다소 저렴한 GTX 780으로 재도입되었습니다.

 

후에 엔비디아는 GTX 780Ti를 출시했으며, GK110칩을 사용했는데 2880개의 CUDA 코어, 240개의 TMU가 모두 사용됩니다.

 


 

 

27. GM204 : 맥스웰

 

엔비디아는 효율성에 중점을 둔 맥스웰 아키텍처를 2014년에 발표했습니다.

초기엔 플래그십인 GM204는 지포스 GTX 980에 탑재되었습니다.

케플러와 맥스웰의 주요 차이점은 메모리 하위 시스템입니다.

GM204는 더 좁은 256 비트 버스를 갖고 있지만, 엔비디아는 강력한 메모리 압축 알고리즘을 구혀낳여 사용 가능한 대역폭을 더 많이 활용했습니다.

또한 GM204는 더 좁은 메모리 인터페이스의 영향을 줄여주는 커다란 2MB의 L2$도 사용합니다.

 

GM204에는 2048개의 CUDA 코어, 128개의 TMU, 64개의 ROP, 16개의 폴리모프 엔진이 있습니다.

GTX 780Ti에 비해 리소스가 감소했기 때문에 GM204는 GTX 780Ti보다 부분적으로 빨랐습니다.

GTX 780Ti보다 6% 높은 성능을 보였고, 전력 소비도 약 33% 감소했습니다.

 

엔비디아는 GM200을 탑재한 GTX 980Ti를 출시했습니다.

GM200은 2816개의 CUDA 코어를 가진 리소스가 풍부해진 GM204로 보면 됩니다.

GM204보다 성능은 올릴 수 있었지만, 그다지 효율적이진 않았습니다.

 


 

 

28. GP104 : 파스칼

 

파스칼 아키텍처는 맥스웰을 이어 받아 엔비디아가 새로운 16nm FinFET으로 제조한 칩입니다.

이를 통해 아키텍처 효율성을 높이고, 클럭을 높일 수 있었습니다.

지포스 GTX 1080에 사용된 314mm² GP104에는 무려 72억 개의 트랜지스터가 있습니다.

GTX 1080은 2560 CUDA 코어, 160개의 TMU, 64개의 ROP, 20개의 폴리모프 엔진으로 GTX 980Ti보다 훨씬 빨랐습니다.

 

엔비디아는 파스칼 기반으로 4개의 서로 다른 GPU를 만들었습니다.

GTX 1080과 마찬가지로 GTX 1070은 하이엔드 게임을 목표로, GTX 1060은 메인스트림을 목표로, GTX 1050, GTX 1050Ti는 엔트리 시장을 맡았습니다.

 


 

 

29. GP102 : 1080Ti, TITAN X, TITAN Xp

 

엔비디아는 GP102를 출시하면서 10 시리즈의 성능을 더욱 높였습니다.

이 칩은 352 비트 메모리 인터페이스를 가진 3840 CUDA 코어를 특징으로 하며 마찬가지로 16nm 공정에서 생산됩니다.

처음으로 TITAN X에 3548 CUDA 코어와 1531MHz로 작동하는 부분적으로 비활성화된 칩을 넣었습니다.

10Gbps에서 작동하는 12GB GDDR5X VRAM이 장착되었으며 최대 TDP는 250W입니다.

 

GP102는 나중에 소비자 시장에 지포스 GTX 1080Ti로 출시되었습니다.

이 그래픽카드는 부분적으로 비활성화된 부분이 있는 등 TITAN X와 동일한 수의 CUDA 코어를 사용합니다.

그러나 TITAN X보다 더 높은 부스트 클럭인 1582MHz를 자랑하며, 12GB의 GDDR5X VRAM은 11Gb/s에서 보다 높은 속도를 자랑합니다.

 

수율이 개선되면서 엔비디아는 비활성화 된게 없는 GP102를 탑재한 TITAN Xp라는 새로운 GPU를 출시했습니다.

이것은 CUDA를 3840개 까지 끌어 올립니다.

TITAN Xp는 11.4Gb/s 속도의 12GB GDDR5X VRAM이 있습니다.

이 카드는 GTX 1080Ti와 동일한 클럭이지만, CUDA 코어가 더 많아 연산에 더 유리합니다.

 


 

 

30. 튜링과 지포스 RTX

 

다시한번, 엔비디아는 튜링 아키텍처로 방향을 돌렸습니다.

레이 트레이싱(RTX), AI에 대한 전용 하드웨어 추가(텐서코어) 는 처음으로 게임 세계에 실시간 레이 트레이싱을 제공합니다.

게임에서 사실적인 조명, 반사 효과와 렌더링 기술의 비약적인 도약을 두고 엔비디아의 CEO인 젠슨 황(Jensen Huang) 은 그래픽 업계의 정점이라고 부릅니다.

 

엔비디아는 처음엔 튜링을 새로운 전문가용 쿼드로 카드를 발표했지만, 다음주에는 게임에 초점을 둔 지포스 RTX 2070, 2080, 2080Ti 카드를 발표했습니다.

초기 초점은 레이 트레이싱과 AI 보조 슈퍼 샘플링에 관한 것이었지만, 엔비디아는 RTX 2080이 전세대 GTX 1080에 비해 35~125%의 성능 향상을 제공할 것이라고 약속했습니다.

GTX 1080Ti의 출시 가격은 699 USD인데 RTX 2080Ti 파운더스 에디션의 MSRP는 1199 USD입니다.

 

튜링 기반 RTX 카드는 게임에 대해 몇가지 새로운 기술을 추가했습니다.

USB-C 기반 버추얼링크(VirtualLink) 커넥터는 차세대 VR 헤드셋을 겨냥하고, NVLink 커넥터는 SLU를 PCIe 병목 현상을 피하는 다중 카드 설정을 위한 상호 연결로 대체합니다.

NVLink는 가격 인상과도 관련있습니다.

엔비디아는 필요한 브릿지 커넥터가 10 시리즈 카드용으로 설계된 고대역폭 SLI 브릿지의 40 USD보다 비싼 79 USD가 들것이라고 합니다.

 


 

TMU(s) - Texture Mapping Unit(s)

ROP(s) - Render Output Unit(s)

SM - Streaming Multiprocessors

반응형

+ Recent posts