반응형

https://www.chiphell.com/thread-1926186-1-1.html


이전까지의 루머와 별 다를건 없습니다만

몇몇개는 새로운? 정보고 결정적으로 마지막게 제일 신경 쓰입니다만 아쉽게도 코어수 관련 루머는 없습니다




출처


1. IPC 상승은 예상치를 초과했습니다.

2. 메모리 레이턴시 개선에 중점을 뒀습니다.

3. AVX의 성능을 향상시켰습니다. (AVX 512는 지원되지 않는것 같습니다)

4. 7nm 클럭 프리뷰. (ES 클럭이 예상보다 높습니다)

5. 클럭 스테핑이 더 개선되었습니다. (PBO, XFR이 더 개선되었습니다)

6. 라이젠이 PCIe 4.0 지원 여부는 불확실합니다.

7. ...원 모어 띵(One More Thing) (레이 트레이싱??)

반응형
반응형

https://www.tomshardware.com/news/intel-cascade-lake-xeon-ap-e-2100,38017.html


내로남불

https://gigglehd.com/gg/hard/1404293




인텔은 최대 48코어를 제공하는 12채널 DDR4 메모리를 지원하는 새로운 제온 캐스케이드레이크(Cascade Lake) AP(Advanced Performance. 고성능) 프로세서 제품군을 포함하여 미발표된 슈퍼컴퓨터 2018 전시회를 앞두고 몇가지 발표를 했습니다.


인텔은 이 새로운 라입업의 데이터센터 칩을 MCP(Multi Chip Package) 아키텍처로 설계했는데 이는 AMD의 스레드리퍼, EPYC 프로세서와 같은 프로세서 구성입니다.

이로써 인텔은 32코어 EPYC 데이터센터 프로세서를 통해 AMD의 핵심 집약적 이점에 대한 해답을 얻게 되었습니다.

인텔은 보급형 서버용 제온 E 2100 프로세서의 새로운 라인업을 발표했습니다.



인텔 제온 캐스케이드레이크 AP


캐스케이드레이크 AP 제품군은 인텔의 데이터센터 프로세서 설계에 근본적인 변화를 가져왔지만, 켄츠필드(Kentsfield) 프로세서와 철학적으로 유사한 접근 방식을 가집니다.

이 새로운 프로세서 제품군은 칩당 최대 48코어를 제공하며 듀얼 소켓 서버에서 최대 96코어 DDR4 메모리 24개를 사용할 수 있는 12채널 DDR4 메모리를 지원합니다.

인텔은 프로세서가 하이퍼스레딩(Hyper Threading) 기능이 있는지에 대해선 언급하지 않았습니다.


인텔은 이 프로세서가 HPC, AI, IAAS 작업 부하에 최고 성능을 제공한다고 주장합니다.

또한 이 프로세서는 대부분의 메모리 채널을 제공하므로 모든 데이터센터 프로세서의 최고 메모리 대역폭에 도달할 수 있습니다.

성능 밀도, 높은 메모리 용량, 광대한 메모리 처리량은 HPC 사용자에게 좋은 성능을 제공합니다.



빠른 리프레시로 제온 캐스케이드레이크 SP 시리즈가 곧 출시될 예정입니다.

인텔은 이 모델에 대한 구체적인 내용을 발표하지는 않았지만, 새로운 프로세서가 인텔 제온 스케일러블(Scalable) 프로세서와 동일한 기본 설계를 갖게 될겁니다.

즉, 캐스케이드레이크는 기존 코어 모델과 동일한 코어 수(최대 28 코어), 캐시 용량, I/O 조정을 거친 14nm 리프레시입니다.


이 새로운 캐스케이드레이크 SP 모델이 올해 출시될 예정이며, 인텔은 더 많은 코어/스레드를 가진 AMD의 32코어 EPYC 프로세서와 경쟁할겁니다.

또한 AMD는 7nm EPYC 프로세서가 더 많은 코어를 제공할 것이며, 내년 초에 출하를 위해 선적될 것이라고 강조합니다.


인텔은 2020년에 나올 아이스레이크(Ice Lake) 데이터센터 프로세서를 기다리고 있기 때문에 공정, 성능 리더십 모두를 AMD에 제공함으로써 잠재적으로 1029년을 기다리게 할것이며, 따라서 이국적인 캐스케이드레이크 AP 프로세서가 출시되었습니다.


인텔은 새로운 캐스케이드레이크 AP 프로세서가 아래와 같은 벤치마크에서 AMD EPYC 7601을 능가한다고 주장합니다.

(인텔은 공개적으로 사용 가능한 AMD 테스트 결과를 사용했습니다.)


- 린팩(Linpack) 에서 인텔 제온 스케일러블 8180 프로세서 대비 1.21배 빠름, AMD EPYC 7601 프로세서 대비 3.4배 빠름.

- 스트림 트라이어드(Stream Triad) 에서 인텔 제온 스케일러블 8180 프로세서 대비 1.83배 빠름, AMD EPYC 7601 프로세서 대비 1.3배 빠름.

[역자 주 : 위에서 나온 린팩은 오버클럭 안정화 할떄 주로 사용하는 링스(LinX) 와 같습니다]


또한 인텔은 이 프로세서가 출시 당시의 제온 스케일러블 8180 보다 AI/딥러닝 부분에서 최대 17배 더 우수하다고 주장합니다.



다이를 풀칠하다


SP 모델의 모든 아키텍처 개선이 새로운 캐스케이드레이크 AP 모델에 적용될 것으로 기대합니다.

그러나 MCP 디자인을 추가한 것은 인텔이 최근 다중 칩 아키텍처가 그 진로의 일부라고 지적하면서도 과거의 AMD의 멀티 칩 EPYC 설계에 관해 발표한 내용에 비추어 놀랍습니다.


인텔은 EPYC 설계가 '4개의 데스크탑 다이를 풀칠한 것' 으로 말한걸로 유명합니다.

(이것 관련해서는 AMD의 경우 인피니티패브릭(Infinity Fabric) 인 '글루 로직' 이라는 기술적 용어를 언급했습니다)

인텔은 AMD의 멀티 칩 접근 방식이 일관되지 않은 성능을 제공한다고 비난합니다.

(다른 문제들 중에서도 더더욱 그렇습니다)



AMD의 접근법과 AMD의 차이점은 묻자 인텔 대변인은 회사가 멀티 칩 디자인에 '반대' 하지 않는다고 답했습니다.

대신 SoC로 이미 취한 경로에서 가치를 봅니다.

또한 인텔은 자사의 설계가 AMD의 인피니티패브릭 기반 아키텍처(위의 사진) 보다 우수하다고 주장합니다.


인텔은 AMD의 접근 방식이 불규칙한 성능 변동을 언급하지만 설계가 동일한 편심에서 벗어나지 않을것이라 자중합니다.

인텔은 패키지 내부 다이와 다이 사이에 UPI(Ultra Path Interconnect) 인터페이스를 사용하고 있습니다.

이 프로토콜 확장성은 뛰어난데, 인텔은 이미 최대 8소켓 서버 프로세서간 통신에 이 인터페이스를 사용하므로 성숙한 스케줄링, 절전 알고리즘과 함께 복잡한 토폴리지를 위한 적절한 조정 기능을 제공합니다.



UPI는 이미 인텔의 제온 스케일러블 XCC(eXtreme Core Count) 다이에도 있습니다.

각 다이에는 다른 소켓에 있는 프로세서(그리고 연결된 메모리) 와의 통신을 위한 3개의 UPI가 있습니다.

2개의 소켓 서버에 있는 다른 프로세서에 대한 연결을 위해 다른 2개의 UPI 연결을 자유롭게 두면서 동일한 프로세서 패키지내의 다이 사이의 통신을 위해 3번째 기존 UPI 포트를 사용하는 것이 합리적일겁니다.


인텔은 NUMA(Non Uniform Memory Access), 일부 고급 SNC(Sub NUMA Clustering) 유형을 사용하여 각각의 AP 프로세서 내부에 있는 서로 다른 리소스 풀을 분리할 가능성이 높습니다.

듀얼 소켓 서버 내에서 쿼드(또는 그 이상) 소켓 토폴리지로 생각해보십시오.


인텔은 캐스케이드레이크 AP 모델이 제온 프로세서의 8소켓 확장성에 비해 2개의 소켓으로 확장될 것이므로 인텔이 기존의 XCC 다이를 멀티 칩 디자인으로 정교하게 조정했다고 가정하는 것은 논리적입니다.

각 캐스케이드레이크 AP 칩은 12채널 메모리를 사용하기 때문에 2개의 6채널 XCC 다이를 단일 패키지로 결합하는데 적합합니다.


그러나 인텔은 이 칩에 2개의 다이가 있으며, 캐스케이드레이크 AP 모델은 최대 48 코어가 있다는 것까지만 확인했습니다.

이는 회사가 완전히 새로운 다이, 열 제한을 맞춘 28코어 XCC가 4개를 탑재할 수도 있음을 의미합니다.

인텔은 다이 사이에 열 팽창/수축으로 인해 다이 사이에 EMIB(Embedded Multi Die Interconnect Bridge) 연결을 사용하지 않고 상호 연결에 대한 추가 정보를 제공하지 않았음을 밝혀냈습니다.


인텔은 이 프로세서에 새로운 소켓의 필요 여부 등 구체적인 세부 사항은 공개하지 않았습니다.

(LGA 5903 소켓으로 나올거라는 루머도 있습니다)

인텔은 28코어 SP 모델과 48코어 AP 플래그십 코어 수 차이를 뛰어 넘는 여러 SKU를 출시할 것으로 기대합니다.


우리는 인텔이 자사의 '성능 리더십' 제품에 대한 프리미엄을 부과하는 것을 반대하지 않는다는 사실을 알고 있으며, 현재의 28코어 제온 이 단일 프로세서에 권장 고객 가격을 10,000 USD로 책정했다면, 이는 아주 비쌀겁니다.

인텔은 아직 가격을 공개하지 않았지만, 인텔은 새로운 프로세서가 2019년의 '첫번째 부품' 에서 제공될 것이라고 밝혔습니다.



인텔 제온 E 2100 시리즈


인텔은 제온 E 2100 시리즈 프로세서도 발표했습니다.

이 프로세서는 워크스테이션을 위해 올해 초 발표한 제온 E 프로세서와 동일한 기본 디자인을 갖고 있지만, 인텔은 보급형 서버를 위한 새로운 추가 기능을 설계했습니다.

따라서 중소 규모 비즈니스에도 적합합니다.

인텔은 또한 마이크로소프트와 IBM과 같은 클라우드 서비스 제공 업체가 클라우드 데이터 보안을 위해 사용하는 최신 SGX 기술에 대한 지원을 추가했습니다.






인텔은 자사의 커피레이크(Coffee Lake) 프로세서와 동일한 설계로 새로운 프로세서를 개발했으며 4코어 / 4스레드를 6 코어 / 12스레드로 끌어올린 SKU와, 제온 E 모델에서는 40개의 PCIe 3.0도 지원합니다.

인텔은 사용자에게 공개된 16레인과 24개의 사용 가능한 레인을 제공하는 C246 워크스테이션 시리즈 칩셋에 연결되는 4개의 DMI 3.0 레인으로 레인을 분할합니다.


이 프로세서는 LGA 1551 소켓에 장착되며 듀얼 채널 메모리 컨트롤러가 있어 최대 128GB의 DDR4 ECC 메모리를 지원합니다.

(워크스테이션 모델은 2배의 용량을 지원합니다)

E 2124를 제외한 모든 인텔의 새로운 E 2100 모델에는 'G' 라는 것이 붙는데, 이는 UHD 그래픽스 P630 엔진이 탑재됨을 의히합니다.

TDP의 범위는 71~95W입니다.


제온 E 2100 시리즈 프로세서는 오늘부터 이용하실 수 있습니다.

반응형
반응형

https://www.chiphell.com/thread-1925093-1-1.html




1. Zen 2 아키텍처에 대해 설명할겁니다.

2. 7nm EPYC 2와 7nm 라이젠 3를 보일겁니다. (벤치마크가 나올수도 있습니다?)

3. 7nm 베가(Vega) 전시, RX 590 전시할겁니다. [역자 주 : 이 부분은 번역이 잘 안됩니다]

4. 나비(Navi) 관련된 언급이 있습니다.


사진 출처


5. ...그리고 원 모어 띵(One More Thing)

반응형
반응형

https://www.techpowerup.com/249151/amds-zen-2-could-be-revealed-on-november-6th-next-horizon-event-scheduled




AMD 투자자 관계(Investor Relations) 는 11월 6일 'Next Horizon' 이벤트를 개최할 예정이며, 어떤 제품이 발표될 지에 대한 확인은 없지만, 이벤트 이름만으로 AMD의 Zen 2 아키텍처로 예상됩니다.

회사는 방금 전날 임원들이 '업계 최고의 7nm 공정 기술에 대한 데이터센터로 특별히 설계된 AMD 제품, 기술 혁신에 대해 논의할 것' 이라고 설명했습니다.

AMD는 라이젠과 Zen 프로세서에 대한 자세한 내용으로 마지막 'Horizon' 이벤트에서 발표했으므로 돌아오는 이벤트가 차세대 아키텍처에 관해 완벽히 설명할 수 있을 것으로 보입니다.

7nm 공정 기술에 중점을 두면 아마 AMD가 새로운 베가(Vega) 그래픽에 관해 언급할 것이지만, 데이터센터가 먼저 출시되면 소비자용은 좀 더 기다려야 할겁니다.



출처 : 오버클럭3D(Overclock3D)

반응형
반응형

https://www.techpowerup.com/249060/amd-radeon-rx-590-built-on-12nm-finfet-process-benchmarked-in-final-fantasy-xv




하드웨어Luxx(HardwareLuxx) 의 안드레아스 실링(Andreas Schilling) 이 찍은 사진 덕분에 AMD의 라데온 RX 590이 12nm FinFET 공정을 사용할 것으로 확인되었습니다.

RX 590을 위한 14nm에서 12mnm FinFET으로의 변화는 더 높은 클럭과 더 나은 전성비를 가져왔습니다.

즉, 라데온 RX 570, 580에 사용된 것과 동일한 폴라리스(Polaris) 아키텍처를 기반으로 한다는 점을 감안할 떄 제품 스택과 관련하여 AMD 가격에 어떤 영향을 미치는지 파악해야 합니다.

보상으로 기존 제품들의 가격이 하락할까요, 아니면 RX 590이 더 비쌀까요?

AMD가 이미 중국에서 RX 580 2048SP 버전으로 혼란을 일으켰기에 이 시점에서 무엇이든 진행되어야 합니다.



파이널판타지 15(Final Fantasy XV) 가 RX 590에 대한 결과로 업데이트 됨에 따라 성능에 대한 아이디어를 얻었습니다.

2560 1440 해상도 테스트에서 성능은 RX 580 대비 약 10% 올랐습니다.

3840 2160 해상도에선 약 10~15% 향상을 보입니다.

성능이 향상된 RX 590은 지포스 GTX 1060 6GB을 누를 수 있게 되었습니다.

RX 580은 언제든 가까이에 있었지만, AMD의 최신 폴라리스 제품은 이러한 격차를 없애고 적어도 레퍼런스 카드를 비교할 때 항상 경쟁 제품보다 우위에 있는 타이틀에서 더 경쟁력 있다는 사실을 알아두세요.



별도의 오버클럭을 통해 AMD의 RX 580은 약 5~10%의 성능 향상을 보일 수 있습니다.

이는 추측이지만, 이론적으로 성능 측면에서 RX 590과 아주 비슷합니다.

그러나 오버클럭이 보장되지 않으므로 이를 염두해두면 12nm FinFET 공정으로 개선하면 추가 오버클럭 헤드룸의 가능성으로 성능이 향상됩니다.

이렇게하면 RX 590이 RX 570, 580보다 성능 이점을 더 높일 수 있습니다.

시간이 지나면 상황이 어떻게 달라지는지 알 수 있지만 적어도 사용자는 현재 RX 580 그래픽카드보다 평균 10% 더 높은 성능을 제공하는 RX 590을 기대할만 합니다.



출처 : 트위터, 파이널 판타지 15 벤치마크, 비디오카드즈(Videocardz)

반응형
반응형

https://www.techpowerup.com/249039/intel-to-outsource-entry-level-cpu-and-chipset-fabrication-to-tsmc




인텔은 수요가 공급을 훨씬 능가하는 제조 위기에 있으며, 코어, 제온 브랜드의 프로세서를 중심으로 14nm 제품을 제조하기 위해 모든 실리콘 제조 설비를 가동하고 있습니다.

인텔은 9월 초부터 TSMC와 같은 타사 파운드리를 찾고 칩셋 제조에 관한 보고서를 청취했습니다.

우리는 TSMC가 아톰(Atom), 셀러론(Celeron), 펜티엄(Pentium) 실버 SoC와 같은 브랜드로 엔트리 레벨 인텔 프로세서를 제조하고 인텔 팹에 소켓을 남겨둘 것이라는 확인을 받았습니다.

디지타임즈(DigiTimes) 는 타사 파운드리를 TSMC로 정하진 않았지만 현재 인텔의 요구 사항을 충족하는 유일한 회사는 TSMC 뿐입니다.



출처 : 디지타임즈

반응형
반응형

https://www.techpowerup.com/249097/amd-zen-2-gnu-compiler-patch-published-exposes-new-instruction-sets




11월 기능 금지 데드라인이 빠르게 다가옴에 따라 GNU 툴 체인 개발자들은 이제 GCC(GNU Compiler Collection) 9.0 에 마지막 기능을 추가하고 있습니다.

그 데드라인을 앞두고 AMD는 'znver2' 타겟을 추가하고 GCC에 Zen 2 지원을 추가한 첫번째 기본 패치를 발표했습니다.

이 패치는 znver1과 동일한 비영 테이블과 스케출러 데이터를 사용하지만, AMD의 차세대 CPU에는 CLWB(Cache Line Write Back), RDPID(Read Processor ID), WBNOINVD(Write Back and Do Not Invalidate Cache) 와 같은 3가지 명령어가 포함되어 있습니다.

 

이 3가지 명령어는 현재 코드를 파헤치면서 지금까지 발견된 유일한 명령어입니다.

이것을 고려하면 19년에 나올 GCC 9.1 안정된 업데이트가 Zen 2를 지원하는지 확인하면서 점프 지점으로 간주될 수 있는 첫번째 패치가 있습니다.

나중에 더 많은 최적화와 지침이 구현될 수도 있습니다.

AMD는 아직 스케출러 비용 테이블을 업데이트 하지 않았기 때문에 확장성에 따라 Zen 2에 대한 모든 것을 공개하고 싶지 않을 수도 있습니다.

적어도 7nm EPYC 2 프로세서가 19년에 출시될 때 까지는 AMD가 안전하다고 말할 수 있습니다.



출처 : 퍼라닉스(Phoronix)

반응형
반응형

https://www.techpowerup.com/249083/crucial-expands-server-memory-portfolio-with-first-32gb-nvdimm-offering




메모리, 저장장치 업그레이드를 위한 세계 최고의 소비자 브랜드인 마이크론 테크놀러지(Micron Technology) 의 크루셜(Crucial) 은 오늘 시스템 정전과 값비싼 다운타임의 경우에도 기업이 중요한 데이터를 보존할 수 있도록 지원하는 새로운 32GB NVDIMM(Non Volatile DIMM. 비휘발성 DIMM) 을 발표했습니다.

크루셜 NVDIMM은 2933MT/s  에서 작동하며 서버에 필요한 NVDIMM의 양을 줄이면서 강력하고 지속적인 메모리 성능을 제공합니다.


급변하는 비즈니스 환경에서 영업, 고객 만족도는 밀리초(ms) 단위로 결정됩니다.

중요한 NVDIMM은 메모릴르 모듈 내 NAND와 융합하여 데이터 트랜잭션이 균형을 유지할 때 데이터 지속성에 즉각적인 접근을 제공함으로써 조직에 이점을 제공합니다.

시스템 전력 손실이 발생할 경우 NVDIMM은 백업 전원인 울트라 캐퍼시터(Ultra Capacitator) 의 도움으로 DRAM 데어터를 NAND로 백업합니다.

중요한 NVDIMM은 최신 2.5인치 드라이브 베이, HHHL PCIe AgigA Tech PowerGEM 울트라 캐퍼시트와 호환되므로 백업이 완료될 때 까지 정전시 최대 4개의 NVDIMM에 지속적으로 전원을 공급할 수 있습니다.



최신 크루셜 NVDIMM을 사용하면 서버를 보유하고 있는 입/출력 병목 현상을 제고하고 까다로운 서버 응용 프로그램의 성능을 향상시킬 수 있습니다.

오늘날의 애플리케이션은 보다 빠른 백업, 복원 시간을 지속적으로 요구하므로 크루셜 NVDIMM은 대형 데이터 분석, 관계형 데이터베이스, 스토리지 가전 제품, 가상 데스크탑 인프라, 메모리 내 데이터베이스와 같은 서버 애플리케이션에 이상적입니다.


마이크론 소비자 제품 그룹의 VP이자 GM인 테레사 켈리(Teresa Kelley) 는 이렇게 말했습니다.

"끊임없이 증가하는 데이터세트로 인해 애플리케이션 성능이 저하되면 회사가 해당 데이터에 접근할 수 있는 능력이 크게 떨어질 수도 있습니다.

우리의 새로운 NVDIMM은 대용량 영구 메모리 솔루션으로써 시스템 설계자가 데이터에 즉시 접근하여 메모리 성능을 극대화하고 서버를 최대한 활용할 수 있게 해줍니다."

 

크루셜 NVDIMM은 최대 32GB의 모듈 밀도와 최대 2933MT/s 의 속도로 OEM 서버, 보증과 호환되며 릴라이언스 프로그램(Reliance Programme) [2]의 지원을 받습니다.

모듈, 호환 울트라 캐퍼시터는 일부 글로벌 유통 업체를 통해 구입할 수 있습니다.

모든 크루셜 메모리는 제한적으로 평생 보증해줍니다.



제품 주요 특징 :


• 크루셜 제품 포트폴리오에서 처음으로 32GB NVDIMM 서버 메모리 제공

• 강력하고 지속적인 서버 메모리 성능 제공

• 극한의 서버 표준으로 테스트된 100% 구성 요소, 모듈

• JEDED 표준 인터페이스로 최대 2933MT/s 시스템 메모리 속도

• OEM 서버, OEM 보증과 호환 가능

반응형
반응형

https://www.techpowerup.com/249077/nvidia-confirms-issues-cropping-up-with-turing-based-cards-its-not-a-broad-issue




엔비디아의 튜링(Turing) 기반 아키텍처 그래픽카드 사용자들이 문제를 해결하기 위해 다양한 포럼 사이트(자체 TPU 포함하여) 에서 논의를 했습니다.

문제에 대한 인식이 높아짐에 따라 증가하는 보고서는 증상이 다르지만 비슷한 결과들이 있습니다.

디지털 트렌드(Digital Trends) 에서 보고한 바와 같이 '충돌, 검은 화면, 블루스크린 이슈, 비싼 산업 폐기물, 완전히 뒤져버린 카드' 들이 있습니다.


물론 당시 정보 출처에 대한 문제가 너무 커서 이 문제가 모든 종류의 하드웨어에서 발생할 수 있는 일반적인 게시 문제와 실패를 넘어서는지 여부를 제대로 파악하지 못했습니다.

동일한 사용자가 여러 포럼에서 게시할 수 있다는 사실은 문제의 심각성 측정을 그만두게 만듭니다.

하지만 지금 엔비디아는 이 문제가 있다 인정하는 성명서를 발표했습니다.



앤비디아가 제작한 여러 제조업체의 카드와 AIB 카드 모두에서 문제가 발생하는데, 이 카드는 제조업체의 문제가 아니라 아키텍처나 제조 배치의 문제(아직 확인된 것은 아닙니다) 의 문제로 보입니다.

카드 RMA를 받은 다음 동일한 운명을 맞이한 한두개의 교체품을 받은 사용자에 대한 여러 보고서가 있지만, 이것이 배치 문제였기를 바랍니다.

이 문제는 RTX 2080 모델의 보고서에도 영향을 미치지만 플래그십 제품인 RTX 2080Ti 의 소유자에게 가장 큰 영향을 미칠것으로 보입니다.



엔비디아는 이 문제를 인정하면서도 관련성을 제한합니다.

이에 대해 톰스하드웨어(Tom's Hardware) 는 '광범위하지 않으며 이 문제의 영향을 받는 사용자는 늘지 않을것이다' 라고 합니다.

이어서 '우리는 항상 그렇듯이 각 사용자와 개별적으로 작업을 하고 있습니다.' 라고 합니다.

우리는 기다리고 보러 왔는데 1,000 USD 이상을 소비하는 플래그십 그래픽카드가 사용자에게 적합하지 않으면 RTX 20 시리즈의 판매량을 늘리는데는 아무런 도움이 되지도 않습니다.


출처 : GeeksULTD, 톰스하드웨어, 지포스 포럼 1, 지포스 포럼 2, 포보스(Forbes), 테크파워업(TechPowerup) 포럼

반응형
반응형

https://www.techpowerup.com/249108/amd-could-solve-memory-bottlenecks-of-its-mcm-cpus-by-disintegrating-the-northbridge




AMD는 최대 4개의 8코어 다이의 MCM(Multi Chip Module) 인 EPYC 엔터프라이즈 프로세서를 통해 데이터센터 시장에서 경쟁력을 되찾았습니다.

각 다이는 2채널 DDR4 메모리를 제어하는 자체 통합 노스브릿지(NorthBridge) 와 32레인 PCIe 3.0 루트 컴플렉스를 갖고 있습니다.

더 많은 코어를 활용할 수 있을 뿐만 아니라 메모리 대역폭을 많이 사용하는 응용 프로그램에서는 지역화되지 않은 메모리에 대한 이런 접근 방식이 설계 병목 현상을 일으킵니다.

라이젠 스레드리퍼 WX 제품군은 메모리 병목 현상이 많은 영상 인코딩 벤치마크에서 입출력에 직접 접근하지 않고 다이가 메모리 대역폭이 부족해지면서 성능 저하가 나타나는 이러한 병목 현상을 강조합니다.

이 문제에 대한 AMD의 해결방법은 비활성화된 노스브릿지(메모리 컨트롤러, PCIe 루트 컴플렉스가 있는 다이의 일부) 를 사용하여 CPU 다이를 설계하는 것입니다.

이 솔루션은 곧 출시될 코드 네임 '로마'(Rome) 인 2세대 EPYC 프로세서에서 구현될 수 있습니다.


'Zen 2' 세대를 통해 AMD는 통합 노스브릿지가 완전히 비활성화 될 수 있는 CPU 다이를 개발할 수 있습니다.

(스레드리퍼 WX 프로세서의 '컴퓨트 다이'(Conpute Die) 와 마찬가지로, 인피니티패브릭(InfinityFabric) 에 전적으로 의존하는 메모리/PCIe 접근은 없습니다.)

이 다이는 더 넓은 인피니티패브릭 인터페이스를 통해 '시스템 컨트롤러' 라는 외부 다이와 통신합니다.

AMD의 차세대 MCM은 '베가(Vega) 10'이나 '피지'(Fiji) GPU와 처럼 실리콘 인터포저 구성이 될 수도 있습니다.

인터포저는 MCM에서 다이 사이의 고밀도 미세 배선을 용이하게 하는 실리콘 다이입니다.

이 폭발적인 추측과 더 많은 것들은 블록 다이어그램은 싱가포르의 은퇴한 엔지니어인 @chiakokhua 가 내놓은겁니다.



시스템 컨트롤러 다이는 전체 프로세서의 타운 스퀘어 역할을 하며 최대 2TB의 ECC 메모리를 처리할 수 있는 단일 8채널 DDR4 메모리 컨트롤러를 갖고 있습니다.

현재의 EPYC 프로세서와는 달리, 이 인터페이스는 인텔의 기능과 매우 비슷합니다.

또한 시스템 컨트롤러는 PCIe 4.0 96배속 루트 컴플렉스를 특징으로 하며 16 배속 대역폭의 그래픽카드를 최대 6개, 8배속 대역폭의 그래픽카드를 최대 12개까지 장착 가능합니다.

또한 다이는 더 많은 PCIe 레인 외에도 SATA, USB, 기타 레거시 저대역폭 I/O 인터페이스를 제공하는 서버 컨트롤러 허브(Server Controller Hub) 로 알려진 사우스브릿지(SouthBrigde) 를 통합합니다.

더 많은 연결성을 제공하는 플랫폼이 외부 '칩셋' 이었을 수도 있습니다.



은퇴한 엔지니어는 AMD가 소켓 AM4 제품을 시스템 컨트롤러 다이를 공유하는 두 CPU 다이의 MCM으로 설계할 수 있다고 추측했습니다만, 그러나 주의해서 봐야 할 필요가 있습니다.

클라이언트 부문의 기업에 비해 웨이퍼가 적은 마진을 갖고 AMD가 통합형 노스브릿지를 사용할 수 없는 단일 다이 제품을 만들고자 한다면 클라이언트 부문의 경우 마진이 거의 없다는 점을 감안하면 이는 불가능에 가깝습니다.

하지만 AMD가 500 USD 쯤에서 판매할 수 있는 '고수익' SKU용 2다이 MCM의 가능성이 없진 않습니다.

이 경우 시스템 컨트롤러 다이는 더 적은 수의 인피니티패브릿 링크, 2채널 메모리 I/O, 32레인 PCIe 4.0 루트를 제공합니다.



AMD는 18년에 '로마' MCM을 선보일 예정입니다.


출처 : 은퇴한 기술자가

반응형

+ Recent posts