SCE는 Jaguar를 선택한 것은 아니게 Jaguar 밖에 선택할 수 없었다
왜, 소니・컴퓨터 엔터테인먼트(SCE)는 「PlayStation 4(플스4)」의 CPU에 「Jaguar(재규어)」코어를 선택했는가?
AMD의 CPU 코어 가운데, 하이퍼포먼스의 코어가 아니고, 저소비 전력의 코어를 선택한 것은 왜인가?
주의 깊게 AMD의 로드맵을 바라보면, 그 이유는 일목 요연하다. SCE는 Jaguar를 선택한 것은 아니고, Jaguar 밖에 선택할 수 없었던 것이다.
그것은, 칩을 제조하는 반도체파운더리의 선택사항이 한정되어 있어 그리고 파운더리에 의해서 실리는 CPU 코어의 선택사항이 한정되어 버려 있기 때문이다.
소니의 원래 계획은 재규어코어가 아니라 불도저 3세대코어인 스팀롤러의 탑재였다.
플스4 하드웨어 발전방향
|
2008년 플스4 최초구상 | 2009년 플스4 계획2 | 2011년 플스4 초기 개발자킷 | 2012년 플스4 스펙상향 |
2013년 플스4 최종스펙(공식) |
CPU |
Cell B.Engine 발전형 | 인텔 라라비 | AMD 2.8Ghz 라노 4코어 | AMD 3.2Ghz 스팀롤러 4코어 |
AMD 1.8Ghz 재규어 8코어 |
RAM |
|
| 4GB | 4GB | 8GB GDDR5 통합 |
GPU |
엔비디아 CUDA 플랫폼 | 인텔 라라비 | AMD Radeon HD 7670 프로세서 480개 코어 800Mhz 128bit 메모리대역폭 DirectX 11.1 | AMD Radeon 7900코어 코어 800Mhz 연산력 1.84 TFlops DirectX 11.1지원 18Computing Units | AMD Radeon 7900코어 프로세서 1152개 코어 800Mhz 256bit 메모리대역폭 연산력 1.84 TFlops DirectX 11.1지원 |
스토리지 |
|
|
| HDD or SSD |
|
광학 드라이브 |
블루레이 | 블루레이 | 블루레이 | 블루레이 |
블루레이 6배속 |
네트워크 |
|
|
| ? |
유선 10/100/1000Mbps 무선 IEEE 802.11 b/g/n |
A/V |
Cell B.E의 불확실한 미래와 엔비디아의 CUDA개발언어 강요 DirectX 11 기술탑재에 소극적인 자세 등 검토단계에서 취소 | 라라비는 인텔이 만든 Cell BE버전임 하지만 CPU중심의 구조와 취약한 3D성능 생각보다 낮은 정수연산 성능 프로그래밍 하드웨어레벨에 따른 게임개발의 편차로어려움 심각하게 높은 TDP 300W 인텔이 라라비프로젝트 취소 | x86플랫폼은 게임개발이 쉽고 콘솔과 컴퓨터간의 게임이식이 간편하여 개발자들이 선호 AMD는 CPU,GPU의 통합솔루션제공으로 단가가 저렴함 | 글로벌파운더리와 TSMC의 제조공정이행 연기로 AMD의 스팀롤러와 카버리가 2013년말로 연기되어 취소 콘솔에 28nm를 탑재하기위해선 현재 유일한 재규어 4코어 엔트리CPU를 탑재 성능이 낮은걸 극복하기위해 8코어로 커스텀하여 멀티쓰레드방식 최적화 |
Bluetooth® 2.1 (EDR) USB 3.0 HDMI Analog-AV out Digital Output (optical) |
가격 |
|
|
| $429 $529 |
? |
출시일 |
|
|
| 2013 하반기 | 2013년 크리스마스시즌 |
구체적으로 말하면, 당초, AMD 설계의 칩은 28nm프로세스로 제조하려고 해 TSMC 파운더리로 한정되어 버렸다. 2011년 후반부터 2012년의 초 단계에서, 28nm칩의 제조 여유가 있었던건 TSMC 뿐이었다고, 어느 반도체 업계 관계자는 말한다.SCE의 칩의 양산을 행하는 2013년에, GLOBALFOUNDRIES측은 28nm로, 어느 정도 큰 제조 캐파시티를 확보하는 목표가 있던것이라고 말하지만 파운더리의 로드맵에서에서 명확하지않았다. 그 때문에, SCE에는 2013년말에 PS4를 출시하기쯤해서는 선택사항으로서 TSMC 밖에 없었다. 그리고, 이 시점에서, TSMC의 28nm를 탑재하는 AMD CPU 코어는 Jaguar 밖에 없었다. 실은, 이러한 이유로, PS4의 CPU 코어는 Jaguar가 되었던 것이다. (AMD 파일드라이버 32nm, 트리니티 32nm..그 중 28nm를 처음 도입한게 재규어 CPU코어)
SCE는 원래 Bulldozer (불도저) 계의 하이엔드CPU 코어의 3세대 28nm 버전 "Steamroller (스팀롤러)"에서 PS4를 만들 계획이었다고 볼 수있다. 원래, SCE가 AMD에 설계를 의뢰 한 것은 그 이전에 인텔에서 진행하고 있었다 라라비를 탑재한 플스4를 만들 계획이 있었기 때문이다. 그렇게 생각하면, SCE의 원래의 목적은 AMD의 고성능 코어에 있었을 것이다.
하지만 PS4를 28nm 공정으로 2013년 결정 단계에서 SCE는 대안이 없어졌다. 2013년에는 28nm의 Steamroller가 늦어졌기 때문이다. 따라서 SCE는 파운더리를 TSMC로 바꾸고 CPU 코어를 Jaguar로 바꾼 것으로 보인다.
2개의 파운다리의 사이에 흔들리는 AMD
이러한 스토리를 알 수 있는 것은, 반도체 파운더리측의 제조능력이나 AMD와의 관계의 상황이 명백하기 때문이다.AMD는 현재, 하이퍼포먼스 CPU와 APU(Accelerated Processing Unit)를 GLOBALFOUNDRIES의 32nm SOI 프로세스로 제조하고 있다. 32nm의 하이퍼포먼스 코어는 「Piledriver(파일드라이버)」다.
그 한편, 저소비 전력 APU를, TSMC의 40nm프로세스로 제조하고 있다. 40nm의 저소비 전력 코어가 「Bobcat(밥캣)」이다.
이 중, 저소비 전력 APU측은 TSMC의 28nm프로세스의 「Kabini(카비니)」로 이행한다.CPU 코어는 28nm의 Jaguar가 된다. 그에 대하고, 퍼포먼스 APU는, 32nm인 채 「Richland(리치랜드)」로 이행 한다.CPU 코어는 32nm의 Piledriver인 채다. 원래의 예정에서는, 퍼포먼스 CPU는 2013년에는 GLOBALFOUNDRIES의 28nm 벌크로 제조하는 「Kaveri(카버리)」로 이행 해, CPU 코어도 28nm의 Steamroller(스팀롤러)에 대신할 예정이었다. 그것이, 32nm로 후퇴해 버렸다.무엇이 일어나고 있는 것인가.
이러한 징조는 2012년 2월에 행해진 AMD의 어널리스트를 위한 컨퍼런스 「Financial Analyst Day 2012」로, AMD가 28nm프로세스에서는 파운더리를 선택할 수 있도록 한다고 설명하기 시작했을 때부터 있었다.2012년 3월에, AMD는 GLOBALFOUNDRIES와의 계약을 개정해, AMD가 GLOBALFOUNDRIES의 주식을 손놓는 대신에, GLOBALFOUNDRIES가 AMD의 CPU나 APU의 일부를 독점적으로 생산공급할 권리를 포기시켰다. 이것에 의해서, AMD는 파운다리를 자유롭게 선택할 수 있게 되었다.
실제로는, 2012년 가을무렵부터, AMD가 28nm프로세스의 제품을 GLOBALFOUNDRIES로부터 TSMC에 옮기려 하고 있다고 하는 정보가 흐르고 있었다.GLOBALFOUNDRIES의 28nm의 공정 이행지연과 거기에 따르는 제조능력에 대해서, AMD가 문제가 있다고 보았던 것이 원인이었다고 한다.
SCE가 설계에 들어갈 단계에서는 읽을 수 없었던 제조 캐파시티
현재의 AMD는, 다른 파운더리간에 제품 제조를 이관시키기 쉽게 하고, 리스크를 분산하려고 하고 있을 가능성이 높다.이만큼 프로세스 기술이 복잡하게 되면, 어느 파운더리에서도, 문제는 일어날 수 있는부터다. 그러나, 현재는 과도기이며, 장래를 알 수 없다. Steamroller(스팀롤러)도 GLOBALFOUNDRIES로부터 TSMC로 옮길 가능성이 있지만, 아직 어떻게 되는지 모른다.
원래, Bobcat계의 저소비 전력코어와 Bulldozer계의 하이 퍼포먼스 코어에는, 결정적인 차이가 있다. 그것은, 저소비 전력코어는 이식이 비교적 용이한 부분이 많은 설계이고, 하이 퍼포먼스 코어는 이식이 귀찮은 커스텀 회로를 다용한 설계인 것이다. 그 때문에, Steamroller를 TSMC에 가져오려면 , 그 역보다 꽤 시간이 걸린다.그 때문에, 2013년은 AMD 설계를 베이스로 한 칩에 있어서, 28nm의 퍼포먼스 코어가 부재의 해가 되어 버리고 있다.
이 상황에 빠지기 직전의 단계에서, SCE는 AMD와 개발한 PS4 칩을 28nm로 제조 위탁하려고 하고 있었다. 28nm프로세스는, 그래픽스의 퍼포먼스, 저전력 등의 면으로부터 필수의 조건이었다고 볼 수 있다.원래, SCE는 플스3에서「Cell Broadband Engine(Cell B.E. )」를 90 nm→65 nm→45 nm와 축소이행하고, 32nm프로세스판은 설계하지 않았다. 32/28nm세대에 다음의 플랫폼이라고 하는 계획으로 있었다고 보여진다.
거기서 SCE는, AMD와 파운다리의 문제에 직면해 버렸다.아마, SCE가 GLOBALFOUNDRIES라고 교섭한 결과, 충분한 캐파시티를 잡히지 않을 가능성이 나왔다고 추측된다.구체적인 (일)것은 모르지만, 시작시의 게임기의 팁은 약간 대나뭇결이므로, 모바일과 비교해서 수량이 적어도 어느 정도의 캐파가 필요하다.또, PS4의 수요를 끝까지 읽을 수 없는 SCE로서는, 예상중에서 큰 숫자를 낼 가능성도 있다.
실제로는, 그러한 교섭은 제조에 들어가는 것보다 꽤 전에 행해지고 있어 그 시점에서의 예측으로 제조능력 가능하지않을지를 몰랐기 때문에, 칩의 설계에 들어갈 수 없었다고 볼 수 있다.어쨌든 현상을 보는 한, SCE는 GLOBALFOUNDRIES에서는 제조할 수 없다고 하는 결론을 냈다고 추측된다. 본가의 AMD의 퍼포먼스 CPU와 같은 상황이 된 것이다.
한편, 28nm의 볼륨에 관해서는 TSMC는 GLOBALFOUNDRIES보다 처음 생산 실시하고 있다고 반도체 업계 관계자는 말하고 있다. TSMC라면 2013년에는, 어느 정도의 캐파시티를 확보할 수 있는 상태에 있다.더 정확하게 말하면, GLOBALFOUNDRIES보다 전에 제조능력을 예상할 수 있었다. 그 때문에, SCE는 TSMC 측에 PS4칩의 제조를 위탁했다고 추측된다.실은, SCE와 TSMC의 관계는 이것이 처음이 아니고, SCE는 별도인 칩도 TSMC에 위탁하고 있어, TSMC와의 교제에도 익숙해져 있다.
SCE의 반도체 전략의 차이와 반도체 산업의 큰 변화
결과론으로부터 말하면, PS4의 플랜의 도중에 있던 라라비의 플랜이 만약 그대로 진행되고 있으면, 인텔의 생산기술적으로는, 그것이 제일 안심할 수 있는 코스였을 것이다.또, 퍼포먼스적으로도 아키텍쳐적으로도 재미있는 머신이 되었을지도 모르다. Larrabee의 소프트웨어 렌더러라고 하는 구상은 그 나름대로 혁신적이었다.
그러나, Intel의 Larrabee 전략은 휘청거리고 있고 신용을 하지 못하고, 또, 비밀주의로 생각했던 대로가 되지 않는 인텔과의 교섭 자체가, 꽤 어려웠다고 추측된다.
SCE 자체는, 인텔에 대해서 어느 정도 적극적이었다고 한다. 원래, SCE는 게임기의 칩을 개발하는 것으로, 게임 시장의 발전과 함께 짜는 반도체 파트너를 스텝업 하고 갈 계획이었다고 한다.초대 플스1에서는 LSI Logic과 파트너, 플스2에서는 도시바, 플스3에서는 IBM, 도시바와 연합을 짰다.이 코스를 보면, 그 연장에는 인텔이 있었다고 해도 이상하지 않다.
PLAYSTATION 3(플스3)때, SCE를 대표이사 사장겸그룹 CEO로서 인솔하고 있던 쿠타라기 켄씨는, 게임기용 칩으로 소니를 논리칩의 IDM(Integrated Device Manufacturer:수직통합형 디바이스 메이커)로서 성공시키려는 플랜을 세웠다. 결과적으로, 그 플랜은 PS3의 부진이나, 반도체의 프로세스 개발비의 급등등에서 무너져 버렸다. 현재 상태로서는, 첨단 프로세스로 살아 남고 있는 반도체 메이커는 한 줌 밖에 없고, 소니도 쿠타라기 전략에 어떠했는지는 모르지만, 가능성은 있었다.
그러나, 결과적으로 SCE는, 현재는 파운더리에 의지하지 않을 수 없게 되고 있어 그 때문에(위해), 프로세스 개발 경쟁의 대폭풍우로 흔들리는 파운더리의 사정에, 좌우되고 있다.PS4의 스펙은, 바야흐로, 그러한 파운더리 업계사정으로 좌우되고 정해졌다고 추측된다.
AMD 재규어CPU의 이점도 많다
단지, 재규어 CPU가 된 것 자체는, 그만큼 성능이없는 것도 아니다. 원래계획이었던 AMD 하이엔드CPU 스팀롤러(Steamroller)와 비교하면, 동작클럭과 퍼포먼스에서는 불리하지만.그러나, 전력효율에서는 이점이 있어, 스몰코어(3.08평방 mm)이기 위해 실코어수도 8코어와 늘릴 수 있었다. 코어가 작은 이유의 하나는 고밀도인 9트럭 라이브러리를 다용하고 있기 때문에도 있다.
성능이 읽기 쉬운 실CPU 코어가 다수 있는 것 자체는, 취급하기 쉬운 것을 의미한다. 또, 전력 효율로 이점이 있는 것은, 미세화해도 전력 밀도에 여유가 있는 것을 의미하기 위해(때문에), 발열의 면에서 말하면 원리적으로는 미세화하기 쉽다. 게다가, 조합하고 그래픽코어가 GCN아키텍쳐(Graphics Core Next) 계이므로, CPU로부터 GPU로 오프 로드를 하면 AMD의 저소비 전력 코어는 파운더리의 이식이 하기 쉬운 설계가 되고 있기 때문에, 만약, 이 앞의 프로세스로 문제가 발생했을 경우에서도, 다른 파운더리로 옮길수가 있다.이것은 꽤 중요한 요소다.
다행스럽게도, 재규어는 전세대의 밥캣과 비교하면, SIMD(Single Instruction, Multiple Data) 부동 소수점 연산을 중심으로 퍼포먼스 업을 도모하고 있다.
또, 재규어CPU는 처음부터 공유 L2캐쉬로 멀티코어를 전제로 한 설계가 되어 있어 연산 파이프라인단수도 깊어지고 있어 1.8 GHz 이상을 달성하고 있다.
1세대 밥캣과 2세대 재규어 스펙비교
|
1세대 밥캣 아키텍쳐 |
2세대 재규어 아키텍쳐 |
제조공정 |
TSMC 40nm 벌크 |
TSMC 28nm 벌크 |
코어갯수 |
2 |
4 |
L2 캐쉬 |
1MB |
2MB |
코어사이즈 |
4.9 mm2 |
3.9mm2 |
코어연산수 |
159,900 |
194,490 |
연산폭 |
2-wide |
2-wide |
물리주소 |
36bit |
40bit |
L1 명령캐쉬 |
32KB, 2-way 64B line |
32KB, 2-way 64B line |
L2 데이터캐쉬 |
32KB, 8-way 64B line |
32KB, 8-way 64B line |
명령 대역폭 |
8Byte/cycle, Write Combine |
16Byte/cycle, Write Combine |
FPU대역폭 |
64bit |
128bit |
EX 스케쥴러 |
16 엔트리 |
20 엔트리 |
AGU 스케쥴러 |
8 엔트리 |
12 엔트리 |
1세대 밥캣 아키텍쳐는 넷북에 주로쓰이는 E-350 E-450 (자카테)에 쓰인다.
2세대 재규어 아키텍쳐는 카비니CPU에 채택되었다.
플스4의 재규어는 8코어 커스텀코어이기 때문에 성능은 더 높다.
데스크탑 재규어 4코어사진
'IT/Hardware > Etc' 카테고리의 다른 글
인터넷 공유기 구라안테나 사건 심층분석 (0) | 2013.04.14 |
---|---|
로지텍 게이밍마우스 키보드 2013년 신제품출시 (4) | 2013.03.20 |
플스4 개발자에게 물어본 비하인드 스토리 (4) | 2013.02.27 |
소니 플스4는 플스4.1 플스4.2로 진화한다. (2) | 2013.02.27 |
소니 플스4는 왜 AMD 아키텍쳐를 사용했는가? (0) | 2013.02.26 |
차세대 콘솔게임기 플레이스테이션4 뉴욕에서 발표 (0) | 2013.02.26 |
인텔 차세대 802.11ac 무선랜카드 2013년 3분기 출시 (0) | 2013.01.04 |
레이저 3세대 데스에더2013 리뷰 (3) | 2012.12.30 |
도시바 스마트폰,태블릿용 CMOS 센서 개발 (0) | 2012.12.30 |
도시바 블랙박스,CCTV용 CMOS센서 시장진출 (0) | 2012.12.30 |
댓글