본문 바로가기
IT/Hardware/CPU/MB

[ADFS 12] 2012년 로드맵을 갱신한 AMD

by 에비뉴엘 2012. 6. 29.
반응형
●APU화를 진행시키는 AMD의 프로세서 전략 
 서버 프로세서는, CPU에 GPU 코어를 통합한 APU(Accelerated Processing Unit)로 향한다.

 AMD는 미 베르뷰로 현지시간 6월 11일~14일에 개최한 동사의 기술 컨퍼런스 「AMD Fusion Developer Summit(AFDS)」로, 향후의 동사의 프로세서  로드맵 를 분명히 했다.큰 범위는, 금년(2012년) 2월의 어널리스트를 위한 컨퍼런스 「Financial Analyst Day 2012」로 밝혀진 내용과 같지만, 몇개인가 중요한 업데이트가 더해지고 있다.

 우선, Analyst Day로 설명된 「써드파티의 IP의 혼잡」과「명령 세트에 대해서 플렉시블하게 된다」일의 시작으로서 ARM의 Cortex-A5 CPU 코어의 혼잡이 밝혀졌다.이것은, ARM의 시큐러티 솔루션인 「TrustZone」을 채용하기 (위해)때문이다.메인의 x86 CPU 코어를 보좌하는 시큐러티용 마이크로 콘트롤러로서 Cortex-A5를 사용한다.AMD의 Mark Papermaster씨(Senior Vice President and Chief Technology Officer)는, ARM과의 파트너십으로 업계에 넓게 제공되고 있는 시큐러티 기술을 사용하는 것으로, 플랫폼을 또 있어로 시큐러티를 사용하는 어플리케이션의 개발이 용이하게 된다고 설명했다.

ARM의 TrustZone 기술과 Cortex-A5코어를 도입 

 

 다음에, 2월의 Analyst Day시에는 공백이었던 2013년의 서버 CPU에 대해서, 28nm프로세스의 CPU와 APU가 투입되는 것이 밝혀졌다. 서버에서는 첫 APU가 되지만, 2013년의 단계에서는, 멀티 소켓에 최적화된 상위의 서버는, 여전히 GPU 코어를 가지지 않는 CPU가 된다. AMD는 Fusion 구상을 시작한 당초부터, APU를 HPC까지 포함한 고급 지향의 서버 영역에 반입하는 플랜을 말해 왔지만, 그것은, 아직 멀었다.

 

 「Bobcat(밥캣)」계의 로 파워 CPU 코어에서는, 내년(2013년) 투입되는 제2세대의 「Jaguar(재규어)」의 후에, 2세대의 신코어가 설계 단계에 들어가 있는 것이 밝혀졌다.제3세대 코어에서는 3 W이하를, 제4세대 코어에서는 2 W이하를 목표로 한다고 한다.또, 편입 전용으로, 테일러 메이드의 APU를 제공할 뜻이 있는 일도 분명히 했다.이 외 , 디스크리트 GPU에서는, 「Tahiti(Radeon HD 7900)」를 1 GHz로 동작시켰다고 보여지는 4 TFLOPS의 GPU 「FirePro W9000」가 소개되었다.



●2013년의 서버는 마이너 체인지 
 아래의 슬라이드는, AFDS로 발표된 서버 CPU의 로드맵.지금까지 공백이었던 내년(2013년)의 제품으로서 새롭게 CPU 제품과 APU 제품이 더해졌다.2013년의 세대부터는 서버 CPU의 소켓도 일신 된다고 한다.

서버  로드맵 .
신플랫폼에 CPU와 APU

 데이터 센터의 마켓 추이

 
 우선, 금년(2012년)의 서버 CPU에서 보면, 금년 후반에, 전라인 업이 세대 교체해, 새로운 파일드라이버 베이스의 코어로 바뀐다. 하이엔드 16 코어 제품은, 현재의 「Interlagos(인테르라고스)」로부터, 「Abu Dhabi(아부다비)」로 바뀐다.MCM(Multi-Chip Module)로 2칩을 원 패키지에 납입하는 구조에 변화가 없다고 추정된다.서버를 위한 CPU에서는 이 외 , 2 소켓까지의 「Valencia(발렌시아)」가 「Seoul(서울)」에, 1소켓까지의 「Zurich(취리히)」가 「Delhi(델리)」로 이행 한다.각각 소켓도 계승한다.

 서버 CPU의 금년(2012년)의 이행은, 제조 프로세스가 32nm SOI 프로세스인 채로, CPU 코어 자체도, 「Bulldozer(bulldozer)」라고 거의 아키텍쳐가 변하지 않는 「Piledriver(파일 드라이버)」에 옮겨질 뿐(만큼)이므로, 마이너 체인지다.다만, Piledriver 코어는, 클락 방식으로 「Resonant Clock」을 채용하고 있어 클락의 전력 효율이 제1세대의 Bulldozer보다 큰폭으로 향상하고 있다. Resonant Clock은 실용화가 막 시작한 새로운 기술이다.



 2013년에는, AMD의 Bulldozer계 CPU 코어는 다음의 「Steamroller(스팀 롤러)」코어가 된다.Steamroller 코어는 Bulldozer 아키텍쳐의 제3세대로, 28 nm프로세스로 제조된다.즉, Steamroller가 Bulldozer의 프로세스 기술의 변환기가 된다. 




Steamroller는 제3세대 모듈러 코어



●28nm프로세스로 증가하는 트랜지스터를 GPU 코어에 
 
AMD는 금년(2012년) 3월에, GLOBALFOUNDRIES와의 계약을 개정, AMD가 보유하고 있던 GLOBALFOUNDRIES의 주식을 처분하는 대신에, 메인스트림 APU를 GLOBALFOUNDRIES로 제조하는 독점 계약을 실시했다.그 때문에, 현재의 AMD는, 어느 제품에서도, GLOBALFOUNDRIES 이외의 TSMC등의 파운드리로 제조할 수 있게 되었다.AMD는, 28nm프로세스는 파운드리의 선택이 가능하다고 설명하고 있다.

 무엇보다, 현실적으로는, CPU 제품은 프로세스에의 최적화가 필요하고, 거기에는 상당한 엔지니어링 노력이 필요하기 위해, 간단하게 Fab을 옮기는 것은 어렵다.특정의 제품은, 특정의 Fab으로 제조하게 될 것이다.예외는, IBM를 중심으로 한 얼라이언스 Common Platform으로, GLOBALFOUNDRIES를 포함한 Common Platform 참가의 Fab의 사이에서는, 비교적 이행이 용이하다.


Intel, AMD, 파운드리의 프로세스  로드맵 


 
 28nm에 이행 하는 AMD이지만, 28nm프로세스에서는 벌크가 될 가능성이 지극히 높고, 그 경우는, 32nm SOI 프로세스에 대해서 퍼포먼스면에서의 이점은 없는지, 있어도 지극히 적다.그 때문에, 스팀롤러세대의 이점은, 트랜지스터 집적도가 올라, 보다 많은 코어를 실리는 것이 될 뿐일 가능성이 높다.

실제, AMD의 슬라이드에서도, 스팀롤러에 대해서는 병렬성이 오르는(=코어수가 증가한다)로 밖에 쓰여지지 않았다.덧붙여서 제4세대의 「Excavator(에크스카베이타)」는, 20nm프로세스가 될 것으로 예상되어 그 경우는 트랜지스터 퍼포먼스의 향상이 기대된다. 그것을 반영해인가, Excavator에서는 퍼포먼스의 향상이 구가해지고 있다.

 28nm프로세스에서는, 32nm SOI에 대해서, 보다 많은 트랜지스터를 쌓을 수 있다.그 때문에, 8코어(4 모듈) 이상의 구성의 다이에, GPU 코어를 싣는 여유가 생겨 온다.현재의 32nm Bulldozer/Piledriver계 프로세서로의, 8코어 CPU인 Orochi(오로치)와 4 코어 CPU+GPU 코어의 Trinity(트리니티)의 다이를 비교한 것이 아래의 그림이다.


Trinity(왼쪽)와 Orochi의 다이 레이아웃

 
 28 nm프로세스로 70%에 쉬링크 한다면, 현재의 die size를 유지한 채로, Bulldozer 아키텍쳐의 8코어의 다이에, Trinity 클래스인가 그 이상의 GPU 코어를 통합할 수 있을 것 같다. 덧붙여서, 현재의 AMD CPU/APU의 die size는, 서버 전용이 300평방 mm클래스, 메인 스트림 APU가 200평방 mm클래스, 밸류 APU가 100평방 mm이하가 되고 있다.


AMD CPU 다이사이즈 이행도


●APU가 침투해 가는 AMD  로드맵  
 이번 AFDS로의 업데이트를 반영한 AMD의 CPU 전체의 이행도는 아래와 같이 된다.눈에 띄는 것은, 서버 CPU에까지 APU가 먹혀든 것으로, AMD  로드맵  전체로의 APU의 비율이 높아진 것.톱 엔드의 서버 CPU는, 아직 디스크리트에 머물고 있지만, Papermaster씨는 HPC등의 시장용의 제품도 APU로 이행해 가는 것은 자연스러운 형편이라고 설명했다.그 경우는, 현재의 G34 소켓과 같이, 최대로 x16의 HyperTransport를 4 링크 낼 수 있는 APU가 등장할지도 모른다.


AMD CPU 전체의 이행도


G34 소켓 16 코어 Opteron의 HyperTransport 링크

 
 메인 스트림 APU는, 내년(2013년)에는 「Kaveri(카버리)」로 이행한다.Kaveri는, Steamroller 코어를 4코어까지와 현재의 최신 GPU 코어인 GCN(Graphics Core Next)를 탑재한다.이 세대로, APU 전체의 컴퓨터퍼포먼스는, 마침내 1 TFLOPS의 레인지에 도달할 전망이다.또, Kaveri에서는, CPU 코어와 GPU 코어의 메모리공유도 실현되고 AMD가 내거는 새로운프로그래밍 체제인 「HSA(Heterogeneous System Architecture)」의 하드웨어측의 토대가 갖추어지기 시작한다.그 때문에, Kaveri에서는, 아래의 현재의 Trinity 아키텍쳐란, 내부의 버스 구조가 크게 바뀐다고 추측된다. 현재의 Trinity에서는, Llano와 같게, GPU 코어로부터 DRAM 콘트롤러에의 버스가, 빨강으로 나타난 것처럼 크고 2 계통에 헤어져 있다.

트리니티 아키텍쳐

 
●4세대에 걸치는 AMD의 로 파워코어의  로드맵  
 
AFDS로 AMD가 나타내 보인 로우파워 코어의  로드맵은 아래의 슬라이드와 같이 되어 있다.AMD는 로우파워 코어는 프로세스 기술마다 쇄신 한다고 보여진다.
현재의 40nm프로세스 세대가 Bobcat로, 다음의 28nm세대가 Jaguar, 28nm나 20nm인가 아직 모르는 다음의 세대에 서브 3W의 APU를 실현하는 코어가 등장한다고 추측된다.AMD는, coprocessor로서 ARM의 Cortex-A5를 도입하지만, 메인의 범용 CPU 코어는, 현재의 로드맵 에서는 x86계를 계속한다. 제4세대에 2 W이하의 APU를 실현할 수 있는 레인지까지 전력을 떨어뜨릴 계획이다. 전력만을 취하면, ARM 베이스의 어플리케이션 프로세서와 충분히 싸울 수 있는 레인지에 들어간다.



 실제의 APU 제품에서는, 2013년에 28nm프로세스의 Jaguar 베이스의 「Kabini(카비니)」가 등장한다.GPU 코어도 Kaveri와 같은 GCN(Graphics Core Next)가 된다.게다가 Bobcat에서는 사우스 브릿지 칩에 해당되는 FCH가 부속되어 있지만, Kabini에서는 이것이 APU에 구슬려져 원칩 솔루션이 된다.

 AMD의 프로세스 기술과 아키텍쳐의 관계는 다음의 그림과 같이 된다.Llano(라노)에서는, GPU 코어와 CPU 코어의 어느쪽이나 1세대 낡은 아키텍쳐가 통합되었다.그러나, 현재는 CPU 코어에 대해서는 APU에의 통합으로 시간차이는 없지 않기는 커녕, APU가 선행하고 있다.

 
AMD CPU/GPU 아키텍쳐 로드맵

 
 AMD 프로세서의 이행을 프로세스 기술별로 보면 아래의 그림과 같이 된다.현재의 AMD의 CPU 제품은, GLOBALFOUNDRIES의 32nm SOI 프로세스와 TSMC의 40 nm벌크 프로세스에 2분화 되고 있다.실제로는, 이것에 GPU가 사용하는 TSMC 28 nm벌크 프로세스가 더해진다.그러나, 내년(2013년)이 되면, 프로세스는 28 nm벌크로 수렴해 간다.다만, 파운드리는 병렬할 가능성은 있다.


AMD의 제조공정별 CPU/APU 로드맵


 
●기업 전략을 전환하고 있는 AMD 
 AMD는 2월의 Analyst Day로, 큰 전략 전환을 발표했다. 한마디로 말하면 탈PC 또는 PC업계적인 제품 개발로, 「컨슈머(consumer)화(Consumerization)」, 「클라우드(Cloud)」, 「컨버전스(Convergence)」의 3개의 C를 큰 기둥으로서 내걸었다.컨슈머(consumer) 전용의 모바일 기기, 클라우드을 지지하는 web 서버, 그리고 가전과 컴퓨터의 기술의 수렴(Convergence」를 위한 편입 제품에 주력 한다고 하는 의미다.그리고, 그 때문에(위해), 지금까지와 같은 PC형의 제품 개발의 모델을 변경하려고 하고 있다.

 구체적으로는, 우선, 자사 IP 뿐만이 아니라, 타사의 IP를 구슬린다.ISA(CPU의 명령 세트 아키텍쳐) 회전을 플렉시블하게 대응한다.보다 단기간에 마켓에 투입할 수 있는 SoC 솔루션을 확립한다.

 그 실례가, 이번 발표된 ARM의 마이크로 콘트롤러의 통합이었다.그리고, AMD는 향후는, 고객의 요구에 응한, 다양한 IP를 구슬린 테일러 APU의 제조에도 향해 간다.AMD는 지금까지, x86계 CPU와 같은 범용품(양이 나오는 ASSP)과 ASSP(특정용도전용 표준 제품)를 주로 다루어 왔다.그것을, 통상의 반도체 메이커와 같은 스타일로 바꾸어 간다.
반응형

댓글