소니 플스4의 CPU코어는 왜 AMD 재규어를 탑재했을까?소니 플스4의 CPU코어는 왜 AMD 재규어를 탑재했을까?

Posted at 2013.02.26 02:15 | Posted in IT/Hardware/Etc

SCE는 Jaguar를 선택한 것은 아니게 Jaguar 밖에 선택할 수 없었다


 왜, 소니・컴퓨터 엔터테인먼트(SCE)는 「PlayStation 4(플스4)」의 CPU에 「Jaguar(재규어)」코어를 선택했는가? 

AMD의 CPU 코어 가운데, 하이퍼포먼스의 코어가 아니고, 저소비 전력의 코어를 선택한 것은 왜인가?


 주의 깊게 AMD의 로드맵을 바라보면, 그 이유는 일목 요연하다. SCE는 Jaguar를 선택한 것은 아니고, Jaguar 밖에 선택할 수 없었던 것이다. 

그것은, 칩을 제조하는 반도체파운더리의 선택사항이 한정되어 있어 그리고 파운더리에 의해서 실리는 CPU 코어의 선택사항이 한정되어 버려 있기 때문이다.



소니의 원래 계획은 재규어코어가 아니라 불도저 3세대코어인 스팀롤러의 탑재였다.



플스4 하드웨어 발전방향


 

2008년

 플스4 최초구상

 2009년

플스4 계획2

2011년 

플스4 초기 개발자킷

2012년 

플스4 스펙상향

2013년 

플스4 최종스펙(공식)

 CPU

Cell B.Engine 발전형

 인텔 라라비

 AMD 2.8Ghz 라노 4코어 

AMD 3.2Ghz 스팀롤러 4코어 

AMD 1.8Ghz 재규어 8코어

 RAM

 

 

 4GB

4GB 

8GB GDDR5 통합

 GPU

 엔비디아 CUDA 플랫폼

인텔 라라비 

 AMD Radeon HD 7670

프로세서 480개

코어 800Mhz

128bit 메모리대역폭

DirectX 11.1


AMD Radeon 7900코어

코어 800Mhz 

연산력 1.84 TFlops

DirectX 11.1지원

18Computing Units


AMD Radeon 7900코어

프로세서 1152개

코어 800Mhz 

256bit 메모리대역폭

연산력 1.84 TFlops

DirectX 11.1지원

 스토리지

 

 

 


HDD or SSD

광학 

드라이브 

블루레이 

 블루레이

 블루레이

 블루레이

블루레이 6배속 

 네트워크

 

 

 

 ?

유선 10/100/1000Mbps

무선  IEEE 802.11 b/g/n

 A/V

 Cell B.E의 불확실한 미래와 

엔비디아의 CUDA개발언어 강요

DirectX 11 기술탑재에

소극적인 자세 등


검토단계에서 취소

라라비는 

인텔이 만든 Cell BE버전임

하지만 CPU중심의 구조와 

취약한 3D성능

생각보다 낮은 정수연산 성능

프로그래밍 하드웨어레벨에 따른 게임개발의 편차로어려움

심각하게 높은 TDP 300W

  인텔이 라라비프로젝트 취소

x86플랫폼은 

게임개발이 쉽고

콘솔과 컴퓨터간의 

게임이식이 간편하여 

개발자들이 선호


AMD는 CPU,GPU의 

통합솔루션제공으로 

단가가 저렴함 

글로벌파운더리와 TSMC의 

제조공정이행 연기로

AMD의 스팀롤러와 카버리가 2013년말로 연기되어 취소


콘솔에 28nm를 탑재하기위해선

현재 유일한 

재규어 4코어 엔트리CPU를 탑재

성능이 낮은걸 극복하기위해

8코어로 커스텀하여 

멀티쓰레드방식 최적화

Bluetooth® 2.1 (EDR)

USB 3.0

HDMI

Analog-AV out

Digital Output (optical) 

 가격

 

 

 

$429

$529 

 출시일

 

 

 

 2013 하반기

 2013년 크리스마스시즌



구체적으로 말하면, 당초, AMD 설계의 칩은 28nm프로세스로 제조하려고 해 TSMC 파운더리로 한정되어 버렸다. 2011년 후반부터 2012년의 초 단계에서, 28nm칩의 제조 여유가 있었던건 TSMC 뿐이었다고, 어느 반도체 업계 관계자는 말한다.SCE의 칩의 양산을 행하는 2013년에, GLOBALFOUNDRIES측은 28nm로, 어느 정도 큰 제조 캐파시티를 확보하는 목표가 있던것이라고 말하지만 파운더리의 로드맵에서에서 명확하지않았다. 그 때문에, SCE에는 2013년말에 PS4를 출시하기쯤해서는 선택사항으로서 TSMC 밖에 없었다. 그리고, 이 시점에서, TSMC의 28nm를 탑재하는 AMD CPU 코어는 Jaguar 밖에 없었다. 실은, 이러한 이유로, PS4의 CPU 코어는 Jaguar가 되었던 것이다. (AMD 파일드라이버 32nm, 트리니티 32nm..그 중 28nm를 처음 도입한게 재규어 CPU코어)


SCE는 원래 Bulldozer (불도저) 계의 하이엔드CPU 코어의 3세대 28nm 버전 "Steamroller (스팀롤러)"에서 PS4를 만들 계획이었다고 볼 수있다. 원래, SCE가 AMD에 설계를 의뢰 한 것은 그 이전에  인텔에서 진행하고 있었다 라라비를 탑재한 플스4를 만들 계획이 있었기 때문이다. 그렇게 생각하면, SCE의 원래의 목적은 AMD의 고성능 코어에 있었을 것이다.


 하지만 PS4를 28nm 공정으로 2013년 결정 단계에서 SCE는 대안이 없어졌다. 2013년에는 28nm의 Steamroller가 늦어졌기 때문이다. 따라서 SCE는 파운더리를 TSMC로 바꾸고 CPU 코어를 Jaguar로 바꾼 것으로 보인다.



2개의 파운다리의 사이에 흔들리는 AMD

 이러한 스토리를 알 수 있는 것은, 반도체 파운더리측의 제조능력이나 AMD와의 관계의 상황이 명백하기 때문이다.AMD는 현재, 하이퍼포먼스 CPU와 APU(Accelerated Processing Unit)를 GLOBALFOUNDRIES의 32nm SOI 프로세스로 제조하고 있다. 32nm의 하이퍼포먼스 코어는 「Piledriver(파일드라이버)」다.

그 한편, 저소비 전력 APU를, TSMC의 40nm프로세스로 제조하고 있다. 40nm의 저소비 전력 코어가 「Bobcat(밥캣)」이다.


 이 중, 저소비 전력 APU측은 TSMC의 28nm프로세스의 「Kabini(카비니)」로 이행한다.CPU 코어는 28nm의 Jaguar가 된다. 그에 대하고, 퍼포먼스 APU는, 32nm인 채 「Richland(리치랜드)」로 이행 한다.CPU 코어는 32nm의 Piledriver인 채다. 원래의 예정에서는, 퍼포먼스 CPU는 2013년에는 GLOBALFOUNDRIES의 28nm 벌크로 제조하는 「Kaveri(카버리)」로 이행 해, CPU 코어도 28nm의 Steamroller(스팀롤러)에 대신할 예정이었다. 그것이, 32nm로 후퇴해 버렸다.무엇이 일어나고 있는 것인가.


이러한 징조는 2012년 2월에 행해진 AMD의 어널리스트를 위한 컨퍼런스 「Financial Analyst Day 2012」로, AMD가 28nm프로세스에서는 파운더리를 선택할 수 있도록 한다고 설명하기 시작했을 때부터 있었다.2012년 3월에, AMD는 GLOBALFOUNDRIES와의 계약을 개정해, AMD가 GLOBALFOUNDRIES의 주식을 손놓는 대신에, GLOBALFOUNDRIES가 AMD의 CPU나 APU의 일부를 독점적으로 생산공급할 권리를 포기시켰다. 이것에 의해서, AMD는 파운다리를 자유롭게 선택할 수 있게 되었다.


 실제로는, 2012년 가을무렵부터, AMD가 28nm프로세스의 제품을 GLOBALFOUNDRIES로부터 TSMC에 옮기려 하고 있다고 하는 정보가 흐르고 있었다.GLOBALFOUNDRIES의 28nm의 공정 이행지연과 거기에 따르는 제조능력에 대해서, AMD가 문제가 있다고 보았던 것이 원인이었다고 한다.



SCE가 설계에 들어갈 단계에서는 읽을 수 없었던 제조 캐파시티

 현재의 AMD는, 다른 파운더리간에 제품 제조를 이관시키기 쉽게 하고, 리스크를 분산하려고 하고 있을 가능성이 높다.이만큼 프로세스 기술이 복잡하게 되면, 어느 파운더리에서도, 문제는 일어날 수 있는부터다. 그러나, 현재는 과도기이며, 장래를 알 수 없다. Steamroller(스팀롤러)도 GLOBALFOUNDRIES로부터 TSMC로 옮길 가능성이 있지만, 아직 어떻게 되는지 모른다.


 원래, Bobcat계의 저소비 전력코어와 Bulldozer계의 하이 퍼포먼스 코어에는, 결정적인 차이가 있다. 그것은, 저소비 전력코어는 이식이 비교적 용이한 부분이 많은 설계이고, 하이 퍼포먼스 코어는 이식이 귀찮은 커스텀 회로를 다용한 설계인 것이다. 그 때문에, Steamroller를 TSMC에 가져오려면 , 그 역보다 꽤 시간이 걸린다.그 때문에, 2013년은 AMD 설계를 베이스로 한 칩에 있어서, 28nm의 퍼포먼스 코어가 부재의 해가 되어 버리고 있다.


 이 상황에 빠지기 직전의 단계에서, SCE는 AMD와 개발한 PS4 칩을 28nm로 제조 위탁하려고 하고 있었다. 28nm프로세스는, 그래픽스의 퍼포먼스, 저전력 등의 면으로부터 필수의 조건이었다고 볼 수 있다.원래, SCE는 플스3에서「Cell Broadband Engine(Cell B.E. )」를 90 nm→65 nm→45 nm와 축소이행하고, 32nm프로세스판은 설계하지 않았다. 32/28nm세대에 다음의 플랫폼이라고 하는 계획으로 있었다고 보여진다.


 거기서 SCE는, AMD와 파운다리의 문제에 직면해 버렸다.아마, SCE가 GLOBALFOUNDRIES라고 교섭한 결과, 충분한 캐파시티를 잡히지 않을 가능성이 나왔다고 추측된다.구체적인 (일)것은 모르지만, 시작시의 게임기의 팁은 약간 대나뭇결이므로, 모바일과 비교해서 수량이 적어도 어느 정도의 캐파가 필요하다.또, PS4의 수요를 끝까지 읽을 수 없는 SCE로서는, 예상중에서 큰 숫자를 낼 가능성도 있다.


 실제로는, 그러한 교섭은 제조에 들어가는 것보다 꽤 전에 행해지고 있어 그 시점에서의 예측으로 제조능력 가능하지않을지를 몰랐기 때문에, 칩의 설계에 들어갈 수 없었다고 볼 수 있다.어쨌든 현상을 보는 한, SCE는 GLOBALFOUNDRIES에서는 제조할 수 없다고 하는 결론을 냈다고 추측된다. 본가의 AMD의 퍼포먼스 CPU와 같은 상황이 된 것이다.


 한편, 28nm의 볼륨에 관해서는 TSMC는 GLOBALFOUNDRIES보다  처음 생산 실시하고 있다고 반도체 업계 관계자는 말하고 있다. TSMC라면 2013년에는, 어느 정도의 캐파시티를 확보할 수 있는 상태에 있다.더 정확하게 말하면, GLOBALFOUNDRIES보다 전에 제조능력을 예상할 수 있었다. 그 때문에, SCE는 TSMC 측에 PS4칩의 제조를 위탁했다고 추측된다.실은, SCE와 TSMC의 관계는 이것이 처음이 아니고, SCE는 별도인 칩도 TSMC에 위탁하고 있어, TSMC와의 교제에도 익숙해져 있다.


SCE의 반도체 전략의 차이와 반도체 산업의 큰 변화

 결과론으로부터 말하면, PS4의 플랜의 도중에 있던 라라비의 플랜이 만약 그대로 진행되고 있으면, 인텔의 생산기술적으로는, 그것이 제일 안심할 수 있는 코스였을 것이다.또, 퍼포먼스적으로도 아키텍쳐적으로도 재미있는 머신이 되었을지도 모르다. Larrabee의 소프트웨어 렌더러라고 하는 구상은 그 나름대로 혁신적이었다. 

그러나, Intel의 Larrabee 전략은 휘청거리고 있고 신용을 하지 못하고, 또, 비밀주의로 생각했던 대로가 되지 않는 인텔과의 교섭 자체가, 꽤 어려웠다고 추측된다.


 SCE 자체는, 인텔에 대해서 어느 정도 적극적이었다고 한다. 원래, SCE는 게임기의 칩을 개발하는 것으로, 게임 시장의 발전과 함께 짜는 반도체 파트너를 스텝업 하고 갈 계획이었다고 한다.초대 플스1에서는 LSI Logic과 파트너, 플스2에서는 도시바, 플스3에서는 IBM, 도시바와 연합을 짰다.이 코스를 보면, 그 연장에는 인텔이 있었다고 해도 이상하지 않다.


 PLAYSTATION 3(플스3)때, SCE를 대표이사 사장겸그룹 CEO로서 인솔하고 있던 쿠타라기 켄씨는, 게임기용 칩으로 소니를 논리칩의 IDM(Integrated Device Manufacturer:수직통합형 디바이스 메이커)로서 성공시키려는 플랜을 세웠다. 결과적으로, 그 플랜은 PS3의 부진이나, 반도체의 프로세스 개발비의 급등등에서 무너져 버렸다. 현재 상태로서는, 첨단 프로세스로 살아 남고 있는 반도체 메이커는 한 줌 밖에 없고, 소니도 쿠타라기 전략에 어떠했는지는 모르지만, 가능성은 있었다.


 그러나, 결과적으로 SCE는, 현재는 파운더리에 의지하지 않을 수 없게 되고 있어 그 때문에(위해), 프로세스 개발 경쟁의 대폭풍우로 흔들리는 파운더리의 사정에, 좌우되고 있다.PS4의 스펙은, 바야흐로, 그러한 파운더리 업계사정으로 좌우되고 정해졌다고 추측된다.


AMD 재규어CPU의 이점도 많다

 단지, 재규어 CPU가 된 것 자체는, 그만큼 성능이없는 것도 아니다. 원래계획이었던 AMD 하이엔드CPU 스팀롤러(Steamroller)와 비교하면, 동작클럭과 퍼포먼스에서는 불리하지만.그러나, 전력효율에서는 이점이 있어, 스몰코어(3.08평방 mm)이기 위해 실코어수도 8코어와 늘릴 수 있었다. 코어가 작은 이유의 하나는 고밀도인 9트럭 라이브러리를 다용하고 있기 때문에도 있다.


 성능이 읽기 쉬운 실CPU 코어가 다수 있는 것 자체는, 취급하기 쉬운 것을 의미한다. 또, 전력 효율로 이점이 있는 것은, 미세화해도 전력 밀도에 여유가 있는 것을 의미하기 위해(때문에), 발열의 면에서 말하면 원리적으로는 미세화하기 쉽다. 게다가, 조합하고 그래픽코어가 GCN아키텍쳐(Graphics Core Next) 계이므로, CPU로부터 GPU로 오프 로드를 하면 AMD의 저소비 전력 코어는 파운더리의 이식이 하기 쉬운 설계가 되고 있기 때문에, 만약, 이 앞의 프로세스로 문제가 발생했을 경우에서도, 다른 파운더리로 옮길수가 있다.이것은 꽤 중요한 요소다.


 다행스럽게도, 재규어는 전세대의 밥캣과 비교하면, SIMD(Single Instruction, Multiple Data) 부동 소수점 연산을 중심으로 퍼포먼스 업을 도모하고 있다. 

또, 재규어CPU는 처음부터 공유 L2캐쉬로 멀티코어를 전제로 한 설계가 되어 있어 연산 파이프라인단수도 깊어지고 있어 1.8 GHz 이상을 달성하고 있다.





1세대 밥캣과 2세대 재규어 스펙비교


 

 1세대 밥캣 아키텍쳐

 2세대 재규어 아키텍쳐

 제조공정

 TSMC 40nm 벌크

 TSMC 28nm 벌크

 코어갯수

 2

 4

 L2 캐쉬

 1MB

 2MB

 코어사이즈

 4.9 mm2

 3.9mm2

 코어연산수

 159,900

 194,490

 연산폭

 2-wide

 2-wide

 물리주소

 36bit

 40bit

 L1 명령캐쉬

 32KB, 2-way 64B line

 32KB, 2-way 64B line

 L2 데이터캐쉬

 32KB, 8-way 64B line

 32KB, 8-way 64B line

 명령 대역폭

 8Byte/cycle, Write Combine

 16Byte/cycle, Write Combine

 FPU대역폭

 64bit

 128bit

 EX 스케쥴러

 16 엔트리

 20 엔트리

 AGU 스케쥴러

 8 엔트리

 12 엔트리


1세대 밥캣 아키텍쳐는 넷북에 주로쓰이는 E-350 E-450 (자카테)에 쓰인다.

2세대 재규어 아키텍쳐는 카비니CPU에 채택되었다.


플스4의 재규어는 8코어 커스텀코어이기 때문에 성능은 더 높다.

데스크탑 재규어 4코어사진



저작자 표시 비영리 변경 금지
신고
  1. 라라비는 CELL BE와는 전혀 무관한 물건입니다. CELL/BE는 엄격하게 말해서 기존 PS2의 EE를 확장해서 PPC 버전으로 만든것에 가깝고, 라라비는 P54C를 여러개 모아서 쉐이더로 활용해서 GPGPU를 만들고자 했던 시도죠. 그리고 GPU 부분 말인데 7900 타히티 코어가 아니라 7800 핏케언 코어 아니었던가요.

Name __

Password __

Link (Your Website)

Comment

SECRET | 비밀글로 남기기

free counters