반응형

https://www.techpowerup.com/248560/amd-zen-does-support-fma4-just-not-exposed

 


 

AMD는 'Zen' CPU 마이크로아키텍처를 사용하여 종이에 FMA4 명령어 세트에 대한 지원을 없앴습니다.

FMA3 지원은 유지한 채 말입니다.

레벨1테크(Level1Techs) 는 'Zen' CPU가 명령어 세트가 운영체제에 보이지 않아도 FMA4 명령어를 지원한다는 사실을 발견했습니다.

FMA(Fused Multiply Add) 는 선형 대수를 계산하는 효율적인 방법입니다.

FMA3, FMA4는 SSE3, SSE4와 달리 명령어 세트를 생성하는 것이 아니라, 오히려 숫자는 명령어당 피연산자수를 나타냅니다.

AMD는 2012년에 FX 시리즈로, 인텔은 2013년에 '하스웰'(Haswell) 부터 FMA3 지원을 추가했습니다.

 

AMD가 'Zen' 으로 FMA4를 가린 정확한 이유는 알려지지 않았지만, AMD의 FMA4 효율성이 높더라도(33% 더 많은 처리량임에도 불구하고) 문제가 있다 생각하는 개발자도 있습니다.

인텔의 FMA3 채택으로 인해 더 많은 인기를 얻었으며, 따라서 수년간 안정적이었습니다.

레벨1테크는 OpenBLAS FMA4 테스트 프로그램을 사용하여 'Zen' 프로세서에 FMA4 명령을 제공하면 '잘못된 명령어' 오류가 반환되는 것이 아니라, 프로세서가 계속해서 작업을 완료한다는 것을 확인했습니다.

이것은 FMA4가 CPUID 비트로 보여지지 않기 때문에 흥미로우며, 운영체제는 프로세서가 명령을 지원할지 모릅니다.

선형 대수학의 경우 FMA4는 단정밀도와 배정밀도 모두에서 AVX보다 더 효율적임이 입증되었습니다.

 

 

출처 : 레벨1테크(유튜브), 아그너(Agner) 의 CPU 블로그

반응형

+ Recent posts