중간에 써둔게 좀 날아가서 더 오래 걸리네요..
혹시.. 크가놈의 저주?
1. 4004와 시작한 인텔
인텔이 처음 판매한 마이크로 프로세서는 1971년에 출시한 4비트 4004입니다.
이것은 3개의 다른 마이크로 칩은 4001 ROM, 4002 RAM, 4003 시프트 레지스터와 함께 작동하도록 설계되었습니다.
4004 자체는 계산을 수행하는 반면, 다른 구성 요소는 프로세서 기능을 만드는 일에 집중했습니다.
4004는 주로 계산기와 비슷한 장치에 사용되었으며 이는 컴퓨터를 위한 것이 아닙니다.
최대 클럭은 740KHz입니다.
4004의 후속은 4040이라 알려진 비슷한 프로세서가 이어 받았습니다.
이 프로세서는 본질적으로 확장된 명령어 세트와 높은 성능으로 4004의 변형입니다.
2. 8008과 8080
4004는 마이크로 프로세서 영역에서 인텔이라는 이름을 만들었고, 이런 상황을 이용하기 위해 인텔은 새로운 8비트 프로세서 라인을 발표했습니다.
8008은 1972년에, 8080은 1974년에, 1975년에는 8085가 출시되었습니다.
8008이 인텔에서 처음 생상된 8비트 프로세서였지만, 이전 모델이나 후속 모델인 8080만큼 눈에 띄진 않았습니다.
8비트 통채로 데이터를 처리할 수 있는 능력 덕분에 4004보다는 빠르지만, 보수적으로 클럭이 200~800KHz로 작동했으며 8008의 성능은 많은 시스템 개발자를 끌어 모으지 못했습니다.
8008은 10μm 트랜지스터 기술을 사용했습니다.
인텔 8080은 훨씬 성공적이었습니다.
이 제품은 새로운 명령어를 추가하고 6μm 트랜지스터로 전환함으로써 8008의 설계를 확장했습니다.
이로 인해 인텔은 클럭을 두배 이상 향상했으며 1974년 최고 성능의 8080 칩은 2MHz로 작동했습니다.
8080은 많은 장치에 사용되어 최근에 만들어진 마이크로소프트와 같은 여러 소프트웨어 개발자가 인텔 프로세서용 소프트웨어에 집중할 수 있도록 해줍니다.
결국 8086이 출시되었을 때 이 소프트웨어와의 하위 호환성을 위해 8080과 소스를 호환 가능하게 만들었습니다.
결과적으로 8080과 핵심 하드웨어 요소가 모든 x86 기반 프로세서 내부에 존재하게 되었으며, 8080 소프트웨어는 기술적으로 여전히 모든 x86 프로세서에서 실행될 수 있습니다.
8085는 본질적으로 8080보다 더 저렴하고 클럭을 조절한 버전이지만, 영향력이 적었음에도 불구하고 성공했습니다.
3. 8086 : x86의 시작
인텔의 첫 16비트 프로세서는 8086으로 이전 제품에 비해 성능을 크게 향상시키는데 도움이 되었습니다.
가성비의 8088보다 클럭이 높을뿐더러 16비트 외부 데이터 버스와 6바이트 프리페치 캐시가 있습니다.
또한 16비트 작업을 실행할 수 있습니다. (당시 대부분의 소프트웨어는 8비트 프로세서용으로 설계되었지만요)
주소 버스는 20비트로 확장되어 8086이 최대 1MB의 RAM을 사용할 수 있게 해줘 성능을 향상시켰습니다.
8086은 또한 첫 x86 프로세서가 되었으며, x86 ISA의 첫번째 개정판을 사용했습니다.
8086 이후로 AMD, 인텔에서 만든 거의 모든 프로세서의 기반이 되었습니다.
인텔은 또한 같은시기에 8088을 생산했습니다.
이 프로세서는 8086을 기반으로 하지만, 데이터 라인이 반토막이고 4바이트 프리페치 캐시가 있습니다.
좁은 버스는 명령 전달 속도가 느린 등 인텔 실행 장치와 병목이 발생하면서 균형이 깨졌습니다.
여전히 최대 1MB의 RAM을 사용할 수 있으며 이전 프로세서보다 높은 클럭에서 실행되었습니다.
그러나 여전히 8086보다는 느렸습니다.
4. 80186과 80188
인텔은 8086을 몇가지 다른 프로세서와 함께 사용했으며, 모두 비슷한 16비트 아키텍처를 사용했습니다.
그 초석은 임베디드 애플리케이션을 목표로 한 80186입니다.
이를 용이하게 하기 위해 인텔은 클럭 생성기, 인터럽트 컨트롤러, 타이머를 포함해 메인보드에 일반적으로 있는 여러가지 하드웨어를 CPU로 통합했습니다.
이로인해 특정 명령은 80186은 8086과 동클럭인데도 더 빠르게 작동되었습니다.
물론 인텔은 자연스럽게 CPU의 클럭을 오랫동안 올려서 성능을 더욱 향상시켰습니다.
가성비의 80188은 마찬가지로 프로세서에 통합된 여러 하드웨어를 포함하고 있습니다.
그러나 8088과 마찬가지로 데이터 베이스는 반토막입니다.
5. 80286 : 더 많은 메모리, 더 높은 성능
80286은 80186과 같은 년도에 출시되었으며, 주소 버스를 24비트로 확장해 프로새서가 최대 16MB의 RAM을 사용할 수 있게 해줬습니다.
6. iAPX 432
iAPX 432는 인텔이 x86 포트폴리오에서 완전히 다른 방식을 선호하는 첫시도였습니다.
인텔은 iAPX 432가 다른 제품보다 몇배는 더 빠를거라 예상했습니다.
그러나 이 프로세서는 몇몇 주요 설계 문제로 인해 결국 망했습니다.
x86 프로세서는 비교적 복잡하지만, iAPX 432는 CISC를 신세계로 끌어 올렸습니다.
하드웨어 설계가 너무 크기 때문에 인텔은 2개의 별도의 다이를 만들어야 했습니다.
또한 이 프로세서는 데이터 사용량이 쓸데없이 많아 적은양의 대역폭을 사용해도 성능이 떨어졌습니다.
iAPX 432는 8080, 8086보다 좋은 성능을 보였으나, 새로운 x86제품에 뒤쳐지고 없어졌습니다.
7. i960 : 인텔의 첫 RISC
인텔은 1984년에 처음으로 RISC 프로세서를 만들었습니다.
이 제품은 보안 임베디드 솔루션으로 의도되었기 때문에 회사의 x86 프로세서와 직접적인 경쟁자로 설계되지 않았습니다.
내부적으로 버클리(Berkeley) RISC 디자인 개념을 사용하는 32비트 슈퍼 스칼라 아키텍처입니다.
최초의 i960은 비교적 느린 모델로 10MHz로 가장 느렸지만, 수년강 개량을 통해 100MHz까지 올릴 수 있는 더 미세한 공정으로 만들어졌습니다.
4GB의 보호 메모리도 지원했습니다.
i960은 군사용으로도 사용되고 비즈니스용으로도 널리 사용되었습니다.
8. 80386 : x86이 32비트로 전환되다
인텔 최초의 32비트 x86 프로세서는 1985년에 출시된 80386입니다.
이 프로세서의 주요 장점중 하나는 32비트 주소 버스였기 떄문에 최대 4GB의 시스템 RAM을 지원할 수 있었습니다.
그 당시에는 어떤것보다도 빨랐지만, RAM 제한은 종종 이전의 x86 이나 경쟁 프로세서의 성능을 낮췄습니다.
최신 CPU와는 달리 80386이 출시된 시점에서 RAM은 성능 향상으로 전환되었습니다.
인텔은 또한 두 시스템이 동일한 양의 RAM을 사용하는 경우 80286보다 높은 성능을 구현하는데 도움이 되는 몇가지 아키텍처 기능을 향상했습니다.
또한 가상 모드 처리를 지원하여 멀티태스킹 지원을 향상시켰습니다.
하위 라인으로 라인업을 분할하기 위해 인텔은 80386SX도 소개했습니다.
이 프로세서는 80386과 비슷하게 32비트 아키텍처를 사용했지만, 비용 절감을 위해 데이터 버스는 16비트로 반토막냈습니다.
9. i860
1989년에 인텔은 x86 프로세서에서 벗어나려 노력했습니다.
I860으로 알려진 새로운 RISC CPU를 만들었습니다.
i960과는 달리 이 CPU는 데스크탑 시장에서 경쟁할 수 있는 고성능 모델로 설계되었지만, 설계에 문제가 있었습니다.
가장 큰 문제는 소프트웨어가 처음 생성될 때 실생해야 할 순서대로 명령을 배치하기 위해 프로세서의 성능이 컴파일러 전체의 의존한다는 점입니다.
덕분에 인텔은 다이 크기를 줄이고 i860의 전반적인 복잡성을 낮출 수 있었지만, 프로그램을 컴파일 할 때 처음부터 끝까지 모든 명령을 올바르게 나열하는 것은 불가능입니다.
이 문제를 CPU가 해결하려 하는 동안에는 작동이 멈췄습니다.
10. 80486 : FPU 통합
인텔의 80486은 성능 측면에서 또 하나의 중요한 도약이었습니다.
성공의 비결은 구성 요소를 CPU에 보다 긴밀하게 통합하는 것이었습니다.
80486은 L1 캐시를 포함하는 최초의 x86 CPU 입니다.
초기 80486 모델에는 8KB가 있었으며 1,000nm(1μm) 공정으로 만들어졌습니다.
그러나 설계가 600nm로 미세화 됨에 따라 L1 캐시 용량은 두배인 16KB로 늘었습니다.
인텔은 또한 FPU(Functional Processing Unit) 를 CPU에 통합했는데, 이전까지는 별도의 FPU를 따로 뒀습니다.
이러한 것을 메인 프로세서로 내장함으로써 두 프로세서 사이의 레이턴시는 엄청나게 줄었습니다.
80486은 대역폭을 높이기 위해 더 빠른 FSB 인터페이스를 사용했으며, 코어는 IPC를 높이기 위해 노오력을 했습니다.
이러한 변경으로 인해 80486의 성능은 크게 향상되었으며, 하이엔드 모델이었던 80386보다 몇배는 빨라졌습니다.
최초의 80486 프로세서는 50MHz였고, 개선된 600nm 프로세서를 사용한 최신 모델은 100MHz까지 올랐습니다.
가성비 유저를 대상으로 인텔은 FPU가 비활성화된 80486SX를 출시했습니다.
11. P5 : 첫번째 펜티엄
펜티엄은 1993년에 80x86 네이밍을 따르지 않는 최초의 인텔 x86 프로세서입니다.
내부적으로 펜티엄은 인텔 최초의 x86 슈퍼스칼라 디자인인 P5 아키텍처를 사용했습니다.
펜티엄은 모든 측면에서 80486보다 빨랐으며, 그 이유는 실질적으로 향상된 FPU 덕분입니다.
오리지널 펜티엄의 FPU는 80486의 것보다 10배 이상 빠릅니다.
이는 인텔이 펜티엄 MMX를 발표한 이후에 더 중요한 특징이 되었습니다.
이 프로세서는 펜티엄과 구조적으로 동일했지만, 성능을 대폭 향상시킬 수 있는 인텔의 새로운 MMX SIMD 명령어를 지원했습니다.
인텔은 펜티엄 프로세서의 L1 캐시의 양을 80486에 비해 늘렸습니다.
초기 펜티엄에는 16KB가 있었지만, 펜티엄 MMX에는 32KB가 있습니다.
당연히 이 프로세서는 고클럭으로 작동되었습니다.
첫번째 펜티엄은 800nm 공정을 사용해서 고작 60MHz 왔지만, 후속작은 250nm 공정으로 전환되어서 최대 300MHz까지 작동합니다.
12. P6 : 펜티엄 PRO
인텔은 펜티엄 P6 아키텍처를 기반으로 한 펜티엄 PRO로 빠르게 뒤를 이을 계획이었지만, 기술적인 문제가 있었습니다.
펜티엄 PRO는 비순차적(OoO. Out of Order) 설계 덕분에 32비트 연산에서 펜티엄보다 빨랐습니다.
마이크로 아키텍처 명령어를 디코딩 하는 내부 아키텍처가 크게 재설계되어 범용 실행 유닛에서 실행되었습니다.
또한 추가 디코딩 하드웨어로 인해 상당히 확장된 14단계 파이프라인을 사용했습니다.
첫번째 펜티엄 PRO 프로세서가 서버 시장을 목표로 할때 인텔은 주소 버스를 다시 36비트로 확장하고, PAE 기술을 추가하여 최대 64GB RAM을 사용할 수 있게 되었습니다.
이것은 평균적인 유저들보다 훨씬 많았지만, 더 많은 RAM을 지원할 수 있다는 것이 인텔 서버 고객의 핵심이었습니다.
프로세서의 캐시 구조도 바뀌었습니다.
L1 캐시는 명령어용과 데이터용으로 분할된 8KB 캐시로 제한되었습니다.
인텔은 펜티엄 MMX에 비해 적은 16KB를 보상하기 위해 CPU 패키지에 별도의 칩에 있는 256KB와 1MB의 L2 캐시를 뒀습니다.
이것은 BSB(Back Side Bus) 를 통해 CPU에 연결됩니다.
인텔은 처음에 펜티엄 PRO를 소비자에게 보급할 계획이었지만, 서버용으로 제한했습니다.
펜티엄 PRO에는 몇가지 혁신적인 기능이 있지만, 성능면에서 펜티엄과 펜티엄 MMX와의 경쟁이 치열합니다.
구형 펜티엄 제품은 모두 16비트 운영체제에서 상당히 빠르며, 당시에는 16비트 소프트웨어도 많았습니다.
또한 이 프로세서는 MMX 명령어 세트에 대한 지원이 부족하여 펜티엄 MMX가 MMX 최적화 소프트웨어에서 펜티엄 PRO보다 성능이 뛰어났습니다.
펜티엄 PRO는 소비자 시장에서 기회를 얻었을지 모르지만, L2 캐시를 포함하는 별도의 칩으로 인해 생산하기 상당히 비쌌습니다.
가장 빠른 펜티엄 PRO 프로세서는 200MHz로 작동했으며, 350~500nm 공정으로 제작되었습니다.
13. P6 : 펜티엄 Ⅱ
인텔은 P6 아키텍처를 포기하지 않고 대신 펜티엄 Ⅱ를 출시한 1997년까지 기다렸습니다.
펜티엄 Ⅱ는 펜티엄 PRO와 거의 모든 단점을 개선한 제품입니다.
기본 아키텍처는 펜티엄 PRO와 비슷했으나, 14단계 파이프라인을 계속 사용하여 IPC를 개선하기 위해 코어를 몇가지 향상시켰습니다.
L1 캐시는 16KB는 데이터용, 16KB는 명령용으로 배치했습니다.
인텔은 생산 비용을 줄이기 위해 더 큰 실리콘 패키지에 장착된 더 저렴한 캐시칩으로 옮겼습니다.
이는 펜티엄 Ⅱ를 저렴하게 만드는 효과적인 방법이었지만, 이러한 메모리 모듈은 CPU의 최고 속도로 작동할 수 없었습니다.
대신에 L2 캐시는 절반의 빈도로 실행되었고, 이러한 초기 프로세서에서는 성능을 향상시키는데 충분했습니다.
인텔은 또한 MMX 명령어 세트에 대한 지원을 추가했습니다.
클라매스(Klamath) 와 데슈츠(Deschutes) 라는 코드네임의 펜티엄 Ⅱ 내부에서 사용된 CPU 코어는 서버용 제온(Xeon), 펜티엄 Ⅱ 오버드라이브 제품으로 판매되었습니다.
최고 성능 모델에는 512KB의 L2 캐시가 있었으며, 450MHz로 작동되었습니다.
14. P6 : 펜티엄 Ⅲ와 1GHz 싸움
인텔은 펜티엄 Ⅱ에 넷버스트(Netburst) 아키텍처 기반의 프로세서를 추가할 계획이었으나, 아직 준비가 되지 않았습니다.
대신, 인텔은 P6 아키텍처를 펜티엄 Ⅲ에 재사용했습니다.
'카트마이'(Katmai) 라는 코드네임의 첫번째 프로세서는 CPU 속도의 절반으로 저품질의 L2 캐시를 포함한 슬릇형 카트리지를 사용한다는 점에서 펜티엄 Ⅱ와 비슷합니다.
기본 아키텍처는 14단계 파이프라인이 여러 부분과 함께 융햡되어 10단계로 단축되어 다른 중요한 변화를 가져왔습니다.
업데이트 된 파이프라인과 클럭 상승 덕분에 첫번째 펜티엄 Ⅲ 프로세서는 일반적으로 펜티엄 Ⅱ보다 성능이 더 높았습니다.
카트마이는 250nm 공정으로 생산되었습니다.
그러나 인텔은 180nm 공정으로 미세화 한 후 펜티엄 Ⅲ의 성능을 크게 높일 수 있었습니다.
코드네임 '코퍼마인'(Coppermine) 이라는 업데이트 된 버전은 L2 캐시를 CPU로 내장시키고 용량을 절반으로 줄였습니다. (최대 256KB)
인텔의 코퍼마인은 AMD의 애슬론(Athlon) 과의 1GHz 싸움에서 순조로웠습니다.
인텔은 1.13GHz 모델을 만드려 했으나, 톰스하드웨어(Tom's Hardware) 의 톰 파브스트(Tom Pabst) 박사가 조사한 결과 불안정하다는 것을 알게 되었습니다.
이로인해 1GHz 모델이 가장 빠른 코퍼마인 기반 펜티엄 Ⅲ로 남게 되었습니다.
마지막 펜티엄 Ⅲ는 '투알라틴'(Tualatin) 입니다.
공정을 130nm로 미세화하여 1.4GHz의 고클럭을 달성했습니다.
또한 L2 캐시를 다시 512KB로 향상시켜 성능을 다소 향상시켰습니다.
15. P5, P6 : 셀러론과 제온
인텔은 펜티엄 Ⅱ 출시와 함께 자사의 셀러론(Celeron) 과 제온 제품군도 발표했습니다.
이 제품들은 펜티엄 Ⅱ나 펜티엄 Ⅲ와 같은 코어를 사용했지만, 캐시양은 달랐습니다.
펜티엄 Ⅱ 기반 최초의 셀러론 브랜드 프로세서는 L2 캐시가 없었기 때문에 성능이 거지같았습니다.
나중에 펜티엄 Ⅲ 기반 모델에 비해 절반의 L2 캐시를 갖게 되었습니다.
그 결과 셀러론 프로세서는 128KB L2 캐시가 있는 코퍼마인 코어를 사용했습니다.
나중에는 투알라틴 기반 모델에선 256KB로 늘렸습니다.
이 반토막 캐시 전략은 코퍼마인-128, 투알라틴-256으로 알려졌습니다.
인텔은 펜티엄 Ⅲ와 비슷한 클럭으로 팔아서 성능이 뛰어나며 AMD의 듀론(Duron) 프로세서와의 경쟁에서 유리하게 만들었습니다.
마이크로소프트는 XBox 게임 콘솔에 사용될 CPU로 733MHz로 작동하는 코퍼마인-128 셀러론 프로세서 중 하나를 사용했습니다.
첫 제온 프로세서도 비슷했지만, 더 많은 L2 캐시가 있었습니다.
펜티엄 Ⅱ 기반 제온 프로세서는 펜티엄 Ⅱ CPU와 동일한 512KB를 시작으로 고급형은 최대 2MB까지 갖게 되었습니다.
16. 넷버스트 : 소개
인텔의 넷버스트(Netburst) 아키텍처와 펜티엄 4에 대해 알아보기 전에 명령이 코어를 통해 이동하는 과정을 설명하는 깊은 파이프라인의 배경을 아는 것이 중요합니다.
파이프라인 단계는 종종 여러작업을 수행하지만 때론 단일 기능에 집중되기도 합니다.
새로운 하드웨어를 추가하거나 한 단계를 여러 단계로 나눠서 실행 파이프라인을 깊게 할 수 있습니다.
하드웨어를 제거하거나 여러 단계의 구성 요소를 단일 단계로 결합하여 프로세서의 파이프라인을 얕게 할 수 있습니다.
파이프라인 깊이는 레이턴시, IP, 클럭, 아키텍처 처리량 요구 사항에 직접적인 영향을 줍니다.
깊은 파이프라인은 대개 더 많은 양의 대역폭을 필요로하지만, 파이프라인에 데이터가 적절하게 공급되면 파이프라인의 각 단계는 계속 바쁘게 일할겁니다.
더 깊은 파이프라인을 가진 프로세서는 일반적으로 더 높은 클럭에서 작동합니다.
트레이드 오프(trade off) 프로세서 내부에서 흐르는 데이터가 특정 클럭 주기동안 각 단계에서 멈춰야 하기 때문에 프로세서 내부에서 상당히 높은 레이턴시가 발생합니다.
깊은 파이프라인을 사용하는 프로세서는 IPC도 낮아지는 경향이 있어 성능을 높이기 위해 클럭을 높입니다.
수년에 걸쳐 두가지 철학을 구현한 프로세서가 성공적으로 입증되었습니다.
어느 접근법도 문제가 없습니다.
17. 넷버스트 : 펜티엄 4 윌라멧과 노스우드
2000년에 인텔의 넷버스트 아키텍처가 마침내 준비되었으며 펜티엄 4로 생산되었습니다.
이 조합은 향후 6년간 인텔의 최상급 CPU를 갖게 해줍니다.
첫번째는 넷버스트와 펜티엄 4를 처름 2년동안 가진 '윌라멧'(Willamette) 으로 불렸습니다.
그러나 이 시기는 인텔에게 좋지 않은때였고, 펜티엄 Ⅲ보다 성능이 좋지 않았습니다.
넷버스트는 상당히 높은 클럭을 가졌고, 윌라멧은 2GHz를 달성했지만 1.4GHz의 펜티엄 Ⅲ보다 일부 작업에서 더 느렸습니다.
AMD의 애슬론(Athlon) 프로세서는 이 기간동안 좋은 성과를 거뒀습니다.
윌라멧의 문제점은 인텔이 파이프라인을 20단계로 깊게 하고, 2GHz이상으로 더 높은 클럭을 계획했지만 전력 소모와 발열 문제로 인해 목표를 달성할 수 없었습니다.
3.2GHz로 높이고 L2 캐시를 두배인 256KB에서 512KB로 늘린 '노스우드'(Northwood) 로 불린 인텔의 130nm 공정으로 개선되었습니다.
넷버스트의 전력 소모와 발열 문제는 계속되었습니다.
그럼에도 불구하고 노스우드는 현저히 향상된 성능을 보였으며 AMD와의 경쟁이 치열했습니다.
하이엔드 모델에는 인텔이 하이퍼스레딩(Hyper Threading) 기술을 도입하여 멀티태스킹을 강조한 환경에서 자원 활용도를 올렸습니다.
하이퍼스레딩은 현재의 코어 i7 프로세서와 마찬가지로 노스우드에 도움이 되지 못했지만, 성능은 약간 올랐습니다.
윌라멧과 노스우드 역시 셀러론과 제온 브랜드 CPU를 출시했습니다.
전세대 셀러론과 제온 기반 제품과 마찬가지로 인텔은 성능을 구별하기 위해 L2 캐시 크기를 늘리거나 줄였습니다.
18. P6 : 펜티엄 M
넷버스트는 고성능 아키텍처로 전력이 부족한 모바일 시스템으로 이동이 어려웠습니다.
대신 2003년에 인텔은 노트북 전용으로 설계된 최초의 아키텍처를 개발했습니다.
펜티엄 M은 P6 아키텍처를 기반으로 하지만, 파이프라인은 12~14단계입니다.
이것은 인텔의 첫번째 가변 파이프라인이기도 합니다.
즉, 명령에 필요한 정보가 이미 캐시에 있는 경우 12단계만 이동한 경우 명령을 실행할 수 있습니다.
그렇지 않은 경우에는 데이터를 불러오기 위해 2단계를 더 거쳤습니다.
이 프로세서중 첫번째 프로세서는 130mm 공정으로 제조되었으며 1MB의 L2 캐시가 있습니다.
24.5W의 전력만 소모하면서 1.8GHz를 달성했습니다.
'도선'(Dothan) 으로 알려진 개선판이 2004년에 출시되어 90nm 공정으로 제조되었습니다.
이를 통해 인텔은 L2 캐시를 2MB로 늘렸으며, 몇가지 핵심 향상 기능과 함께 IPC를 상당한 수준으로 향상시킬 수 있었습니다.
또한 CPU는 2.27GHz까지 높였으며 전력은 27W 소모로 약간 늘었습니다.
펜티엄 M 아키텍처는 인텔의 아톰(Atom) 프로세서 라인으로 대체되기 전에는 스틸리(Stealey) A100 모바일 CPU로 사용되었습니다.
19. 넷버스트 : 프레스캇
노스우드는 2002년부터 2004년까지 넷버스트 아키텍처를 이끌었으며, 그 후 인텔은 프레스캇에 수많은 기능을 추가했습니다.
인텔은 90nm 공정을 이용하여 L2 캐시를 1MB로 늘렸습니다.
또한 인텔은 처음으로 노스우드 기반 CPU에 보다 빠른 DDR2 RAM과 빠른 쿼드 펌핑 FSB를 지원하는 새로운 LGA 775 인터페이스를 발표했습니다.
이러한 변화는 프레스캇이 노스우드를 넘어 훨씬 더 넓은 대역폭을 갖게 해줬습니다.
동시에 프레스캇은 인텔 최초의 64비트 x86 프로세서로 더 많은 RAM을 사용할 수 있고, 64비트로도 작동합니다.
프레스캇은 인텔 넷버스트 기반 프로세서 제품군에서는 왕으로 여겨졌지만, 대신에 폭망했습니다.
인텔은 다시 실행 파이프라인을 31단계까지 확장했습니다.
더 깊은 파이프라인을 상쇄할 수 있을 정도로 고클럭을 원했지만, 3.8GHz까지만 올라갔습니다.
프레스캇은 전기 난로와 같았으며 전기먹는 하마입니다.
인텔은 이 문제를 해결하기 위해 90nm로 줄였지만, 늘어난 트랜지스터 밀도는 쿨링을 더 어렵게 만들었습니다.
고클럭을 달성할 수 없었기 때문에 프레스캇의 성능을 높일 수 없었습니다.
향상된 기능과 추가 캐시가 있음에도 프레스캇은 특정 클럭에서는 노스우드와 비슷했습니다.
같은 시기에 AMD의 K8 프로세서는 더 작은 공정을 사용해서 더 높은 클럭을 뽑을 수 있었습니다.
이 짧은 기간동안에 데스크탑 CPU 시장을 지배했습니다.
20. 넷버스트 : 펜티엄 D
2005년에 처음으로 소비자용 듀얼코어 프로세서를 생산하기로 시작했습니다.
AMD는 이미 듀얼코어 애슬론 64를 발표했으나, 아직 이용할 수는 없었습니다.
인텔은 2개의 프레스캇 다이가 있는 MCM(Multi Core Module) 을 사용하여 AMD를 상대할 수 있었습니다.
인텔은 듀얼코어 프로세서를 펜티엄 D라 불렀으며 첫 모델의 코드네임은 '스미스필드'(Smithfield) 입니다.
그러나 펜티엄 D는 프레스캇의 문제와 똑같은 문제에 직면하면서 욕을 먹었습니다.
2개의 넷버스트 기반 다이의 열과 전력 소모는 클럭을 최대 3.2GHz로 제한시켰습니다.
그리고 이 아키텍처는 대역폭 제한이 있기 때문에 스미스필드의 IPC는 처리량이 2개 코어로 따로 분할됨에 따라 어려움을 겪었습니다.
구성은 특별한 것도 없었습니다.
하나의 다이로 구성된 AMD의 듀얼코어 CPU가 더 특별한 대접을 받았습니다.
스미스핃드의 후속작인 프레슬러(Presler) 는 65nm로 미세화 되었습니다.
이것은 MCM으로 구성된 두개의 시더밀(Ceder Mill) 다이를 포함하고 있었습니다.
이를 통해 프로세서의 발열과 전력 소모를 줄여 클럭을 3.8GHz까지 달성하게 해줬습니다.
프레슬러는 두가지의 주요 스테핑이 있습니다.
첫번째는 더 높은 125W TDP를 가졌지만, 후기형은 95W로 떨어졌습니다.
다이 크기도 작아져서 인텔은 L2 캐시를 2배로 늘린 각 다이마다 2MB를 탑재했습니다.
일부 매니아들의 제품은 CPU가 하이퍼스레딩 기능이 있어 4개 스레드를 동시에 처리할 수 있습니다.
모든 펜티엄 D 프로세서는 64비트 소프트웨어를 지원하며 4GB 이상의 RAM을 사용할 수 있습니다.
21. 코어 : 코어 2 듀오
인텔은 결국 넷버스트 아키텍처를 버리고 대신 P6 기반의 펜티엄 M 설계를 지원합니다.
회사는 P6가 여전히 실행 가능하고 효율적이고 좋은 성능을 낼 수 있다고 깨달았습니다.
아키텍처를 코어부터 재작업했습니다.
펜티엄 M과 마찬가지로 프레스캇의 31 단계의 파이프라인보다 적은 12~14단계 파이프라인을 사용했습니다.
코어는 확장성이 뛰어났으여 5W의 모바일 시스템에서부터 130W의 고급 서버 시스템에 이르기까지 많은 곳에 공급했습니다.
인텔은 이들을 '코어 2 듀오' 또는 '코어 2 쿼드' 제품으로 판매했습니다만, 코어 솔로, 셀러론, 펜티엄, 제온 브랜드의 CPU에서도 판매되었습니다.
다이에는 2개의 CPU 코어가 있었으며, 쿼드코어 디자인은 MCM 구조로 2개의 듀얼코어 다이를 사용했습니다.
반대로 싱글코어 버전은 코어 하나가 비활성화 된 상태입니다.
L2 캐시는 512KB에서 12MB까지 아주 다양합니다.
코어 아키텍처의 개선으로 인텔은 다시 AMD와 경쟁할 수 있게 되었습니다.
PC 시장은 여전히 경쟁력있는 고성능 프로세서로 가득찬 황금기에 들어갔습니다.
22. 본넬 : 실버손과 다이아몬드빌
코어 2 아키텍처는 다양한 장치에 사용되었지만 인텔은 초저예산, 휴대용 시장을 위해 저렴한 제품을 생산해야 했습니다.
이로 인해 인텔은 아톰을 만들었습니다.
아톰은 26mm² 의 다이를 사용했으며 코어 2의 초기 다이에 비하면 ¼ 수준입니다.
인텔은 아톰 본넬 아키텍처를 완벽하게 처음부터 설계한 것은 아니지만, 대신 펜티엄 P5 시절로 되돌아 간 기반을 사용한겁니다.
이는 P5가 인텔의 마지막 순차적 실행 아키텍처 때문입니다.
비순차척 실행은 성능에 매우 도움이 되지만 꽤나 많은 전력을 소모하고 넓은 다이를 요구합니다.
인텔의 목표를 위해서는 비순차적 실행은 당시에 실용적이지 않았습니다.
최초의 아톰인 '실버손'(Silverthorne) 의 TDP는 3W 입니다.
이로 인해 코어 2가 사용되지 못한 영역도 사용되었습니다.
실버손의 IPC는 낮았지만 2.13GHz까지 작동할 수 있었습니다.
또한 512KB의 L2 캐시도 있습니다.
적당한 클럭과 L2 캐시는 낮은 IPC를 채우는데 별로 도움이 되지 못했지만, 실버손은 여전히 비교적 저렴한 가격으로 보급형 성능을 냈습니다.
실버손의 클럭을 1.67GHz로 줄인 64비트 지원 버전인 다이아몬드빌은 64비트 프로그램의 성능을 향상시켰습니다.
23. 네할렘 : 첫 코어 i7
경쟁이 치열한 프로세서 시장에서 인텔은 오래 놀고 있을 여유는 없었습니다.
그래서, 네할렘(Nehalem) 을 만들기 위해 코어 아키텍처를 수정했습니다.
캐시 컨트롤러가 재설계되었으며, L2 캐시는 코어당 256KB로 낮아졌습니다.
하지만 인텔은 모든 코어에 4~12MB의 L3 캐시를 공유하기 때문에 성능이 저하되지 않았습니다.
네할렘을 기반으로 하는 CPU는 1~4개의 코어를 포함하여 45nm 공정을 사용하여 제조되었습니다.
인텔은 CPU와 나머지 시스템간의 연결을 재작업했습니다.
1980년대 이후로 사용된 유물인 FSB는 마침내 끝났고, 하이엔드 시스템에서 인텔의 퀵패스 인터커넥트(QPI. QuickPath Interconnect) 로, 다른곳은 DMI로 대체되었습니다.
이를 통해 메모리 컨트롤러(DDR3를 지원하도록 업데이트 되었습니다), PCIe 컨트롤러를 CPU로 옮겼습니다.
이러한 변화는 레이턴시가 엄청나게 줄어들고 대역폭을 크게 증가시켰습니다.
다시한번 인텔은 프로세서의 파이프라인을 20~24단계로 늘렸습니다.
그러나 클럭은 높아지지 않았고 네할렘은 코어와 비슷한 클럭으로 작동했습니다.
또한 네할렘은 인텔 최초의 터보 부스트 프로세서입니다.
네할렘 프로세서의 기본 클럭은 3.33GHz였지만, 이 신기술 덕분에 단시간에 3.6GHz에서 작동할 수 있었습니다.
네할렘이 코어 아키텍처보다 중요한 마지막 장점은 하이퍼스레딩이 재적용된 것입니다.
이 기능과 여러가지 향상된 기능 덕분에 네할렘은 무거운 작업에서 코어 2 프로세서보다 최대 2배 빠른 성능을 보였습니다.
인텔은 셀러론, 펜티엄, 코어 i3, 코어 i5, 코어 i7, 제온 브랜드로 네할렘 CPU를 판매했습니다.
24. 본넬 : 파인뷰와 시더뷰
2009년 인텔은 본넬(Bonnell) 아키텍처 기반의 아톰 브랜드 다이 2종류를 출시했습니다.
첫번째 제품은 '파인뷰'(Pineview) 로 알려져있으며 45nm 공정을 사용합니다.
그래픽, 메모리 컨트롤러를 포함하여 메인보드 칩셋 내부에서 전통적으로 쓰인 여러 구성요소를 통합하여 다이아몬드빌보다 좋은 성능을 보였습니다.
이는 전력 소모를 줄이고 발열을 낮추는 효과도 있었습니다.
듀얼코어 모델은 MCM 구성으로 2개의 파인뷰 코어를 사용했습니다.
25. 웨스트미어 : 그래픽이 CPU에 들어가다
인텔은 네할렘의 32nm 버전인 '웨스트미어'(Westmere) 를 만들었습니다.
기본 아키텍처는 거의 변경되지 않았지만, 인텔은 작아진 다이 크기를 이용해 CPU 내부에 추가 구성 요소를 넣었습니다.
4개의 코어만 있던것에서 최대 10개의 코어까지 늘렸습니다.
또한 30MB의 공유 L3도 있습니다.
웨스트미어 기반 코어 i3, i5, i7 프로세서의 그래픽은 메인스트림 HD 그래픽스인 GMA 4500과 비슷하지만, 2개의 추가 EU가 있다는 점만 다릅니다.
클럭은 저전력 모바일 시스템에서 166MHz로, 데스크탑 SKU에서는 900MHz 사이로 거의 동일하게 유지되었습니다.
32nm CPU 다이와 45nm 그래픽 다이가 하나의 칩에 완벽하게 통합되진 않았지만, 두 구성 요소 모두 CPU 패키지에 패치되었습니다.
이것은 그래픽 내부의 메모리 컨트롤러와 CPU 사이의 레이턴시를 줄이는 효과가 있었습니다.
전반적인 성능이 50% 이상 향상되었지만, API 지원은 GMA, HD 그래픽스 구현을 크게 바꾸진 못했습니다.
26. 샌디브릿지
샌디브릿지(Sandy Bridge) 를 통해 인텔은 7년만에 가장 큰 성과를 이뤘습니다.
파이프라인은 14~19단계로 줄었습니다.
샌디브릿지는 마이크로옵 캐시가 이미 캐시된 경우 5단계를 줄이도록 활성화된 1,500개의 디코딩 된 마이크로옵을 보유할 수 있는 마이크로옵 캐시를 구현했습니다.
위와 같지 않다면, 명령은 19단계를 거쳐야 합니다.
또한 이 프로세서는 고성능 DDR3에 대한 지원이 있어 여러 가지 개선 사항을 제공합니다.
더 많은 구성 요소가 CPU에 통합되었습니다.
웨스트미어와 같이 CPU 패키지에 2개의 다이가 있던것이 하나의 다이로 옮겨졌습니다.
다양한 하위 시스템은 높은 대역폭의 트랜잭션을 가능하게 하는 내부 링 버스로 연결되었습니다.
인텔은 통합 내장그래픽 엔진을 다시 업데이트 했습니다.
이 회사는 모든 CPU 모델에 있는 하나의 HD 그래픽스 대신 3가지 버전을 만들었습니다.
상급 제품은 12개의 EU가 있으며 1.35GHz에서 작동하는 HD 그래픽스 3000 입니다.
또한 인텔의 퀵 싱크(Quick Sync) 트랜스 코딩 엔진과 같은 추가 기능도 있습니다.
중급 제품에 들어가는 HD 그래픽스 2000은 EU가 6개로 감소된 것을 제외하고는 차이가 없습니다.
최하위급 HD 그래픽스 제품에는 EU가 똑같이 6개지만 추가 기능은 빠져있습니다.
27. 본넬 : 시더뷰
2011년에 인텔은 파인뷰에 사용된 것과 같은 본넬 아키텍처를 기반으로 하는 새로운 아톰을 만들었습니다.
IPC를 개선하기 위한 약간의 핵심 개선 사항이 있었지만, 실제로는 거의 변경되지 않았습니다.
시더뷰(Cedarview) 의 주 장점은 저전력에서 최대 2.13GHz의 클럭을 가능하게 하는 32nm 공정의 힘입니다.
향상된 DDR3 메모리 컨트롤러 덕분에 더 높은 RAM을 지원할 수 있게 되었습니다.
28. 아이비브릿지
인텔은 샌디브릿지의 후속으로 아이비브릿지(Ivy Bridge) 를 회사의 '틱톡'(Tick-Tock) 전략에 따라 '틱' 버전으로 출시했습니다.
아이비브릿지의 IPC는 샌디브릿지보다 약간 좋아졌지만, 다른 개선된 장점들도 있습니다.
아이비브릿지의 가장 큰 장점은 바로 전성비입니다.
이 아키텍처는 CPU의 전력 소비를 크게 줄인 22nm 3D FinFET 공정으로 제작되었습니다.
메인스트림 샌디브릿지 코어 i7 프로세서가 95W의 TDP를 갖는 반면, 동급인 아이비브릿지는 77W입니다.
이건 모바일에서 특히 더 중요했으며, 인텔이 35W TDP의 낮은 쿼드코어 모바일 아이비브릿지 CPU를 출시할 수 있었습니다.
이전에는, 인텔의 쿼드코어 모바일 CPU는 모두 45W 이상이었습니다.
29. 하스웰
메트로놈처럼 인텔은 아이비브릿지 출시 1년 후 하스웰(Haswell) 아키텍처를 출시했습니다.
하스웰은 혁명적인 것보다는 다시한번 발전에 뛰어들었습니다.
샌디브릿지, 아이비브릿지와 경쟁하고 있는 AMD 프로세서는 하이엔드에서 경쟁이 되지 못했기 때문에 인텔은 성능을 너무 높일 필요성을 느끼지 못했습니다.
하스웰은 전반적으로 아이비브릿지보다 약 10% 빠릅니다.
아이비브릿지와 마찬가지로 하스웰의 장점은 전성비와 내장 그래픽입니다.
하스웰은 FIVR(Fully Integrated Voltage Regulator. 통합 전압 조절 장치) 을 프로세서에 통합하여 CPU 가 전력 소비를 보다 효율적으로 관리하게끔 설계했습니다.
FIVR로 CPU가 더 많은 열을 내지만, 하스웰 플랫폼의 성능은 더 향상되었습니다.
AMD APU를 완전히 찍어 누르기 위해 인텔은 최상급 하스웰 내장그래픽에 최대 40개의 EU를 넣었습니다.
또한 인텔은 성능이 크게 향상된 128MB L4 eDRAM 캐시를 넣어 가장 빠른 그래픽 엔진에 접근할 수 있는 사용 가능한 대역폭을 늘리려 했습니다/
30. 본넬 : 실버몬트
2014년에 인텔은 본넬 아키텍처를 대폭 수정해서 실버몬트(Silvermont) 를 만들었습니다.
가장 큰 변화중 하나는 바순차적 실행으로 변경된 것입니다.
또 다른 변화는 하이퍼스레딩이 없어진겁니다.
본넬 아키텍처가 출시했을 때, 많은 사람들은 비순차적 실행이 너무 많은 다이를 차지하고, 아톰 CPU에 너무 많은 전력을 소모한다 느꼈습니다.
그러나 2014년까지 공정은 엄청나게 줄어들었고, 인텔이 아톰에 비순차적 실행 기능을 넣을 수 있을 정도로 전력 소모를 상당히 줄였습니다.
또한 인텔은 실버몬트의 파이프라인을 수정해서 적중 실패의 영향을 최소화했습니다.
이러한 변화가 여러 개선 사항과 중첩되서 시더뷰에 비애 IPC는 50% 이상 향상되었습니다.
실버몬트의 성능을 더욱 높이기 위해 인텔은 최대 쿼드코어 CPU를 포함하는 SKU를 만들었습니다.
또한 동일한 내장그래픽도 사용되었습니다.
31. 브로드웰
인텔의 차세대 프로세서 아키텍처는 브로드웰(Broadwell) 로 알려졌습니다.
모바일용으로 설계 된 이 제품은 2014년 후반에 출시되었으며, 14nm 공정을 사용합니다.
첫 브로드웰 기반 제품은 코어 M이라 불렀으며 3~6W TDP로 작동하는 하이퍼스레딩이 적용된 듀얼코어 프로세서입니다.
다른 브로드웰 프로세서는 시간이 지나면서 세대 교체가 되었지만, 데스크탑 시장에서는 그렇지 못했습니다.
몇개의 데스크탑용 제품이 2015년 중반에 출시되었습니다.
하지만, 그들의 출시는 별 반응 없었습니다.
그러나 최상급 SKU에는 인텔 CPU중 가장 빠른 내장그래픽이 있었습니다.
여기에는 8개의 EU가 6개씩, 그러니까 총 48개가 있습니다.
또한 내장그래픽은 128MB L4 eDRAM 캐시에 접근 가능하기 떄문에 일반적으로 직면한 그래픽 대역폭 문제를 해결하는데 도움이 됩니다.
게임 테스트에서 AMD의 가장 빠른 APU보다 성능으 뛰어나며, 최신 게임에서 프레임을 적당히 제공할 수 있다는 것 이상을 입증했습니다.
32. 본넬 : 에어몬트
인텔은 14nm 팹을 가동하면서 이러한 공정으로 제작된 새로운 아톰 칩을 개발하는 것을 주저하지 않았습니다.
이 CPU 다이는 실버몬트의 축소판인 '에어몬트'(Airmont) 로 불렀습니다.
IPC 향상은 없었지만 다이 크기가 줄어들면서 전세대보다 더 좋아졌습니다.
14nm 공정으로 개선되어 발열이 줄어들어 CPU가 더 오랫동안 터보 부스트 클럭을 유지할 수 있게 해줬습니다.
에어몬트의 내장그래픽은 실버몬트보다 크게 향상되었습니다.
다이에는 24개의 EU가 있지만, 에어몬트 기반 제품에는 12~16개만 활성화 되었습니다.
에어몬트 기반 모델은 모두 24개의 EU가 있지만, 앞으로도 풀칩은 볼 수 없을겁니다.
이 여분의 8개 EU는 에어몬트의 수율을 향상시키이 위해 존재합니다.
칩의 많은 부분이 문제가 있어 여전히 문제가 있기 때문입니다.
그래픽 아키텍처 역시 인텔의 8세대 브로드웰로 업그레이드 되어 EU의 성능을 향상시켜줍니다.
에어몬트 제품은 체리트레일(Cherry Trail), 브라스웰(Braswell) 이라는 이름으로 팔렸습니다.
가장 빠른 에에몬트 기반 아톰 CPU는 기본 클럭 1.6GHz, 터보 클럭 2.4GHz를 자랑하는 쿼드코어 N3700 입니다.
또한 듀얼채널 DDR3L 메모리 컨트롤러와 최대 16개의 EU가 700MHz로 작동합니다.
33. 스카이레이크
2015년에 브로드웰이 데스크탑 시장에 처음 등장한 후 얼마 뒤에 인텔은 브로드웰을 스카이레이크(Skylake) 아키텍처로 대체했습니다.
스카이레이크 기반 CPU가 인텔에서 가장 빨랐지만, 스카이레이크를 따르는 플랫폼의 변경도 틀림없이 중요합니다.
스카이레이크는 DDR4 메모리를 사용하는 최초의 컨슈머용 CPU로써 DDR3보다 전성비가 높으며 처리량도 더 빠릅니다.
스카이레이크 플랫폼은 또한 새로운 DMI 인터페이스, 업그레이드 된 PCIe 컨트롤러, 훨씬 다양한 연결 장치 지원과 같은 많은 개선 사항을 갖고 있습니다.
당연하게도 스카이레이크는 더 나은 내장그래픽을 제공했습니다.
최상급 모델은 인텔 아이리스 프로 그래픽스 580으로 알려졌으며, 몇몇 스카이레이크 R CPU에 탑재되었습니다.
아이리스 프로 그래픽스 580 엔진은 72개의 EU가 있으며, 128MB의 L4 eDRAM이 있습니다.
다른 대다수의 스카이레이크 칩에는 브로드웰과 비슷한 24개의 EU가 있는 HD 그래픽스가 탑재되었습니다.
34. 카비레이크
카비레이크(Kaby Lake) 를 시작으로, 인텔은 틱톡 전략을 끝내고, 새로운 틱톡톡 전략을 냈습니다.
이것을 PAO(Process-Architecture-Optimize) 로 불렀습니다.
이로인해 인텔은 단일 제조 공정에서 새 공정을 개발하기 까지 필요한 시간을 늘렸습니다.
또한 주 아키텍처 변경 주기도 늘어났습니다.
그러니까 카비레이크는 본질적으로 인텔의 스카이레이크 아키텍처의 최적화 버전입니다.
여전히 14nm지만, 인텔은 14nm+ 라고 불리는 공정을 활용하여 전성비를 개선하기 위해 다양한 조정을 했습니다.
아키텍처 자체는 거의 바뀌지 않았지만, DDR4-2400 RAM을 지원하게 해줬습니다.
카비레이크는 인코딩, 디코딩을 위한 향상된 코덱을 특징으로 하는 HD 그래픽스 630 엔진을 탑재해 4K 비디오 재생을 지원합니다.
35. 커피레이크
인텔은 커피레이크(Coffee Lake) 의 코어 i3, i5, i7 프로세서의 코어수를 2개 추가했습니다.
이는 2006년에 코어 2 쿼드를 출시한 이후 인텔의 코어수가 가장 많이 증가한 것입니다.
코어 i5는 이제 헥사코어이며 하이퍼스레딩은 없습니다.
커피레이크 기반 코어 i7도 헥사코어지만, 하이퍼스레딩이 있습니다.
기본 아키텍처는 카비레이크에서 바뀌지 않았지만, 작업을 공유하는 코어가 늘어나면서 멀티코어 프로그램의 성능이 올랐습니다.
커피레이크의 코어 i3 프로세서는 하이퍼스레딩이 없지만, 듀얼코어에서 쿼드코어로 증가해 i3는 절대적으로 더 많은 전력을 요구했습니다.
본질적으로 커피레이크 i3는 카비레이크 i5 만큼 강력하며, 스카이레이크 i5 보다는 잠재적으로 빠릅니다.
36. 위스키레이크와 엠버레이크
인텔의 늦어진 10nm 공정은 캐논레이크(Cannon Lake) 프로세서의 소형화로 인해 늦어졌기 때문에 세대간 격차를 메꾸기 위해 14nm++ 위스키레이크(Whiskey Lake) 와 14nm 엠버레이크(Amber Lake) 프로세서를 노트북용으로 개발했습니다.
새로운 15W U 시리즈 위스키레이크 모델은 전세대 모바일 칩과 동일한 8세대 코어 '카비레이크 R' 제품 스택에 장착되며, 이는 전세대와 동일한 코어와 스레드가 제공됩니다.
그리고 5W 엠버레이크 모델은 주로 팬리스 랩탑, 컨버터블에 탑재되는 7세대 Y 칩을 이어 받을겁니다.
위스키레이크의 새로운 주 기능중 하나는 컨슈머 CPU에서 발견되는 멜트다운(Meltdown), L1TF에 대한 하드웨어 기반의 첫번째 수정판이라는 것입니다.
위스키레이크와 엠버레이크 프로세서는 모두 전세대 CPU와 동일한 기본 카비레이크 아키텍처를 기반으로 하며, 몇가지 최적화가 있습니다.
첫번째로 싱글 코어 부스트 클럭은 전제품보다 크게 상승했습니다. (코어 i7 8565U 의 경우 최대 4.6GHz)
물론 CPU의 최고 클럭 유지 시간은 기기의 쿨링 성능에 달려 있습니다.