인텔 6세대CPU 스카이레이크 개발 비하인드 스토리
▲Intel 부사장 겸 클라이언트 개발 사업부 사업 부장 샤로밋토 와이스 씨
인텔이 IFA 기간 동안 발표한 스카이레이크 6세대 Core 프로세서는 14nm 프로세스 세대의 새로운 마이크로 아키텍처를 채용한 제품으로 주목을 받고있다.
CPU의 내부 실행 효율이 개선되고 있으며, GPU가 9세대 (Gen9)의 GPU로 진화 새로 GT4는 72EU 실행 엔진을 가진 모델이 추가되어 있으며, GT3 이상은 모든 eDRAM 이 탑재되게되어있는 점이 큰 진화 포인트가된다.
Intel 부사장 겸 클라이언트 개발 사업부 사업 부장의 샤로밋토 와이스 씨는 "스카이레이크의 개발은 4년전부터 시작했다. 당시에는 U/H/S를 생각하고 개발했지만, 그 시장의 요구에서 4.5W의 Y프로세서를 추가하기로했다 "며 Skylake의 개발 과정에서 약간의 궤도 변경을 행한 것을 밝혔다. 와이즈에 따르면 당초 성능위주의 설계보다 크게 변경되어 전력과 성능의 균형을 잡는 방향으로 돌아섰다고 밝혔다.
또한 와이즈부사장은 4세대 하스웰에는 있었고 6세대 스카이레이크에서는 채용되지 않는 FIVR (Fully Integrated Voltage Regulator)에 대해 "성능사이의 균형에 떨어 뜨린 미래 성능과 양립 할 수있게 되면 다시 채용하고 싶다"며 미래세대의 CPU 에서 FIVR를 탑재 할 가능성이 있다고 시사했다.
스카이레이크 개발 초기에는 태블릿CPU는 계획에 없었다.
▲Skylake의 개발이 시작된 당시 Y 프로세서의 요구는 없었다
Intel이 발표 한 Skylake에는 4종류가 준비되어있다. 그것이 Y프로세서 (Core M, 태블릿CPU), U 프로세서 (울트라씬 노트북), H프로세서 (고성능 그래픽을 탑재한 CPU, 주로 풀 사이즈 노트북 PC), S프로세서 (데스크탑)의 4 종류이다.
Skylake의 특징은 하나의 CPU 아키텍처를 바탕으로 4.5W의 Y 프로세서 (Core m)에서 91W가 될 S 프로세서까지 커버 할 수 것이다.
언뜻 보면 Broadwell 시대와 같은 보일지도 모르지만, Broadwell 시대에는 S 프로세서가없고, H 프로세서까지로되어 있었다. 그러나 마케팅의 필요에서 급히 Broadwell-C (원래 Broadwell-K)라는 제품이 올해 (2015 년) 6 월의 COMPUTEX TAIPEI에서 추가 된 이는 H 프로세서의 다이에서 파생 된 제품으로 있어 데스크탑 용 S 프로세서로 전용으로 만들어진 것은 아니다.
와이즈에 따르면 Skylake 개발이 시작된 4년 전 당시에는 사실 Y 프로세서의 계획은 없었다고한다. "Skylake을 개발 한 당초 Ultrabook 용 U 데스크탑 용 S 고성능 그래픽 용 H의 3 가지 제품군의 계획이 있었다. 실제로 프로젝트를 실행하고있는 경우 4.5W로 고성능 제품이 갖고 싶다고 하는 요구가 나왔다. 거기서, 고성능 및 저전력 모두를 양립시키는 설계 변경했다. 이것은 팀에 큰 변화였다 "고 설명한다. 4년 전이라고 말하면, 2011 년이되지만 아직 Ultrabook 계획이 말씀하기 시작했을 무렵, 즉 그 당시에는 Core 프로세서를 이용하여 태블릿을 만든다는 생각은 없었다가 된다.
사실, Intel이 Y 프로세서의 계획을 OEM 업체에 전달 시작한 것은 2012년에 들어서부터 첫 제품이 2013년 CES에서 발표 된 제3세대 Core 프로세서 (개발 코드 명 : 아이비브릿지)의 Y 프로세서에서 TDP는 13W, SDP에서 7W라는 제품이었다. 그 후, 제4 세대 Core 프로세서 (개발 코드 명 : 하스웰)는 TDP에서 11.5W, SDP 4.5W라는 제품이었다. 어떤 제품도 TDP에서 상상으로 원래는 15W의 U 프로세서를 기반으로하여 선별 품으로 만들어진 가능성이 높다. 실제로 Intel은 때때로 이런 방법을 사용하고 있으며, 옛날에는 모바일 Pentium III 시대의 ULV (Ultra Low Voltage) 버전이 그 수법으로 만들어져 있었다.
이에 대해 Haswell의 미세화 판이되는 Broadwell에서는 미세화 버전면서도 실제로는 꽤 손이 담겨 있기 때문에 더 낮은 TDP가 실현 가능하게되었다. Core M에서 TDP 4.5W에서 작동하는 것이 가능하게되어있다. 이것이 설계부터 태블릿PC를 생각한 진정한 Y 프로세서이며, 실제 OEM 메이커로부터도 얇고 가벼운 새로운 MacBook과 같은 노트북 PC 및 2-in-1 장치 등이 등장하고있다.
이상이 Y 프로세서의 역사이지만 그 Y 프로세서가 OEM 메이커에 통지되기 시작한 것이 2012년이라는 것이된다 그래서 아마 그 근처에 큰 설계 변경, 즉 TDP 4.5W를 타겟으로 한 디자인이 의식되기 시작 한 것이다.
고성능에 저전력을 실현할 수 있었던 비밀은 세밀한 전력 제어
그 설계 변경시 또는 그 이전부터 있었는지는 불분명하지만, Skylake에 탑재 된 절전 기능은 매우 강력하다. 와이즈는 "Skylake의 설계에서 가장 힘들었던 것은 성능과 전력의 균형이다. 트랜지스터를 늘리면 성능은 올라가지만, 동시에 전력도 늘어난다. 그래서 수많은 절전 기술을 이용하여 성능을 저하 않고 절전을 실현하고있다. 예를 들면, 세밀한 전력 제어, SpeedShift Technology 디지털 PLL 등이 그 예 될 것 "이라고 말했다 수많은 절전 기술이 Skylake가 성능을 희생하지 않고 전력을 실현할 수있는 큰 이유라고했다.
세밀한 전력 제어는 "하나의 큰 방에 하나의 큰 에어컨에 차게하려고하면 매우 효율이 나쁘다. 그러나 각 방에 분리 에어컨에 차게하면 효율이 좋다. 세밀한 컨트롤은 그 위에 또한 사람이 방만을 차게하는 생각 트랜지스터 중 정말 필요한 부분 만 이동하고 그렇지 않으면 해제한다.이를 통해 효율적인 제어를한다 '는 것. 즉, 기존의 CPU 등은 아일랜드 당 (예를 들어 CPU 코어 라든지 GPU거나, 메모리 컨트롤러 당)에 온, 오프를 세밀하게 제어 있었지만, 그것을 더욱 추진해 트랜지스터 단위로 꽤 부지런히하고 있다는 것이다 .
또한 Speed Shift Technology는 이전의 기사에서도 언급 된 바와 같이, 제4세대 Core 프로세서 (하스웰) / 5 세대 Core 프로세서 (브로드웰) 세대에서는 C 스테이트 (ACPI에 규정되어있는 CPU의 유휴 상태 의 것)라는 전력 절감에 초점이 맞춰져 있었지만, 6세대 스카이레이크에서는 P 상태 (ACPI에 규정되어있는 CPU가 활성화 될 때의 상태의 것)을 절감 할 수있다. Speed Shift Technology는 기존의 SpeedStep Technology에 대한 대안 기술로 기존에는 OS 측이 컨트롤하고 있던 P 상태의 전력 관리 기능을 CPU에 내장 된 PCU (Power Control Unit), 즉 하드웨어가 직접 관리 한다는 것이다. 이로 인해 CPU의 부하에 따라 더 섬세한 처리가 가능하게되므로 고급 P 스테이트에서의 전력 관리가 가능하게되는 것이다. 또한 PLL은 디지털로되어있어 낮은 전력 소모뿐만 아니라 아날로그 PLL와 같은 주파수를 생성하는 것이 가능하다.
이러한 연구에 의해, Skylake는 이전 세대가 될 Broadwell을 웃도는 성능을 실현하면서 동일한 TDP의 디자인을 제공하지만, 실제 평균 소비 전력은 낮아지고있다.
FIVR은 제거했지만 미래 사용은 부정하지 않는다.
반면 희생해야 것도 있었다. Skylake는 Haswell / Broadwell에 탑재되어 있던 FIVR (통합 전압 레귤레이터, Fully Integrated Voltage Regulator)는 탑재되어 있지 않다. FIVR는 CPU 음대에 탑재되어있는 VR (전압 변환기)에서 CPU의 각 부분 (CPU, GPU, 시스템 에이전트 메모리 컨트롤러 등)의 공급 전압을 FIVR 변환하여 공급한다. 이에 따라 메인 보드 쪽의 CPU에 전압 변환기를 없앨 수 있으며, 세부적으로 CPU 각부에 공급하는 전압을 조정할 수 있기 때문에 시스템 전체의 소비 전력을 줄일 수있다.
이 FIVR이 Skylake에는 탑재되지 않은 이유는 "Skylake 디자인을함에있어서 FIVR가 절전인 것은 알고 있었지만, 제거하면 성능면에서는 효과가 있다고 판단했다. 따라서 우리는 VR을 CPU 밖으로 내기로 결정했다. 미래에 FIVR과 성능을 양립 할 수있는 때가되면 검토하고 싶다고 생각하지만, 지금은 아니다 "고 말했다. 반대로 말하면, FIVR를 사용하지 않고도 절전을 실현할 수있는 자신감이 있었기 때문에 정해진 것이다.
단, FIVR가 아닌 메인보드 측에서 VR을 구현함으로써 메인보드 제조사측에서 다양한 연구가 할 수있는 OEM 업체는 회사별 기술발휘의 기회라는 것이다.
예를 들어, 오버클러킹 등은 FIVR에 비하면 마더 보드 측에서 컨트롤 할 수있는 매개 변수가 늘어나기 때문에 더 많은 기능을 더하는 등 OEM 업체 측의 노력으로 가능하게된다. 이 점은 차별화 포인트가 없어 고통 받고 있던 메인보드 제조사들에게 희소식이다.
또한 미래에 FIVR을 다시 채용하는 것을 부정하지 않았다. 즉, 미래의 CPU는 다시 FIVR을 채용 할 계획이 있기 때문이라고 생각된다. OEM 메이커 관계자의 정보에 의하면, Intel은 내년에 실질적 Skylake Refresh되는 Kabylake(스카이레이크 사골) 내후년에 10nm 프로세스 룰 미세화 된 Cannonlake(캐논레이크) 더 그 앞에 10nm 세대의 새로운 아키텍처 판이되는 Icelake(아이스레이크) 계획 있다. Intel은이 Icelake 세대에서 다시 FIVR을 채용 할 예정이라고한다.
이 Icelake(아이스레이크)는 미국 오레곤 힐 스보로에서 개발된 CPU이다. Intel의 CPU 개발팀은 여러 가지팀이 존재하는데, 힐 스보와 이스라엘 하이파 팀이 번갈아 새로운 아키텍처 제품을 개발하고있다.
Sandy Bridge (샌디브릿지, 2011년 2세대 Core 프로세서) / Ivy Bridge (아이비브릿지, 2012년 제3세대 Core 프로세서)는 이스라엘 하이파 팀이 설계를 하였고
FIVR를 사용하던 Haswell (하스웰 2013년 제4세대 Core 프로세서) / Broadwell (브로드웰, 2015년 제5세대 Core 프로세서)는 힐스 버러 팀이 설계하고 이번 인터뷰 한 와이즈가 이끄는 하이파 팀은 FIVR을 이용하지 않은 Skylake(스카이레이크)과 그 후속 제품 (Kabylake과 Cannonlake)를 개발하고있다. 그것은 힐스 버러 개발 제품에 돌아 가기 Icelake는 다시 FIVR된다는 것은 어떤 우연 일까? 2017년에 등장할 아이스레이크부터 다시 이스라엘팀이 맡게된다는 것이다.
▲Skylake 패키지, VR은 CPU에 내장되어 있지 않고 메인 보드에 있다.
CPU 성능은 2.5 배, GPU 성능은 30배로 향상한 이유는 무엇인가?
마지막으로 개인적으로 신경이 쓰이고 있었던 이야기를 들어 왔기 때문에 그것을 소개하여 정리하고 싶다.
IFA 개막 전에 열린 Intel의 기자 회견 에서 Intel 부사장 겸 클라이언트 컴퓨팅 사업 본부 본부장 인 커크 스코겐 씨는 "2010년의 제품에 비해 CPU 성능이 2.5 배, 그래픽 성능 에 이르러서는 30배의 생산성 증가하고있다. 반면 소비 전력이 절감된 것으로, 배터리 구동 시간은 3배가되고있다. 현재 5년 전에 구입 한 PC는 전세계에서 10억대 있다고되어 그들을 사서 바꿀 수있는 좋은시기가됐다 "고 교체시임을 어필했다.
이것을보고 '어라」라고 생각한 사람은 아닐까. CPU는 2.5 배 밖에되어 있지 않은데, GPU는 30 배가되고있는 것이라고. 실은 것 같은 것이다 지난 몇 년 Intel의 CPU의 성능은 극적으로 크지 않았다. 5년간 2.5 배라면 매년 동일한 비율로 성능이 향상된다고 가정하면 연평균 약 1.2 배가된다. 그에 비해 GPU는 30배이기 때문에 연평균 약 2배가된다. 그래도 2세대 샌디브릿지에서 놀라운 성능향상을 보여줬던것에 비해 실망감을 안겨줬던 3세대 아이비브릿지, 4세대 하스웰, 5세대브로드웰에 비해 6세대 스카이레이크에서 보여준 성능향상은 만족할만하다고 할 수 있다.
전체적으로 이해할려면 Intel이 IDF에서 공개 한 Intel의 5 년간의 그래픽의 진화에 대한 2 개의 슬라이드를 보면 일목요연하다.
▲인텔 내장그래픽의 진화의 변천사
▲32나노 2세대 샌디브릿지부터 14나노 5세대 브로드웰까지 다이구조 비교
공정이 발달하지만 CPU가 차지하는 면적보다 그래픽이 차지하는 면적이 급격하게 증가하고 있다.
Intel이 2010 년에 출시 한 Core 프로세서 (실질적으로 제 1 세대, Arrandale / Clarkdale)에서 Iron Lake는 GPU를 온 패키지에 탑재하고있다. 이것이 43GFLOPS에서 Skylake의 내장 GPU (Gen9)는 1,152GFLOPS이므로 약 26 배가된다. 그러나 Skylake이 숫자는 최상위 모델 Iris 대신 Intel HD Graphics 530의 결과이므로 Iris으로하면 약 30 배에 달하는 것이다.
두 번째 슬라이드에서 알 수 있듯이 GPU의 비율은 세대가 진행됨에 따라 커질 뿐이다. 예를 들어, Sandy Bridge는 12EU이었다 연산기는 최신 Skylake는 표준 등급이되는 GT2에서도 24EU와 배가되고있다. 또한 Haswell 세대에서는 GT3가 도입 된 쿼드 코어 + GT3 (40EU)의 조합은 GPU가 다이의 절반 가까이를 차지하게되어 있고, Broadwell 세대 쿼드 코어 + GT3 (48EU), Skylake 세대에서는 더 GT4 (72EU ) 수 있었으므로, 그 비율은 높아지고있다. 그에 반해 CPU는 계속 듀얼 코어 혹은 쿼드 코어 인 채다.
솔직한 의문으로 이것을 와이즈에 돌직구로 물어보았다. 와이즈는 "Intel에있어서 Sandy Bridge는 최초의 GPU 통합 CPU했다 .GPU 성능에 관해서는 아직 충분하지 않았다. 좀더 GPU 성능을한다는 목소리가 많이 있으며, 세대마다 GPU의 성능을 우선적으로 강화해왔다. 게다가 대해 CPU 코어성능은 경쟁사 AMD와 비교해봐도 충분히 성능에 자신이 있어기에 내장그래픽쪽으로 진화 좋다고 판단했다 "고 말했다.
간단하게 말하면, CPU에 관해서는 유일한 경쟁업체인 AMD의 그것과 비교하여 충분한 기술적,성능적인 우위에 있었기에 특별히 강화할 필요가 없다고 판단했지만, GPU에 관해서는 AMD의 내장 GPU뿐만 아니라 AMD, NVIDIA의 단일 GPU를 포함하여 성능을 능가할 필요가있었기에 인텔의 설계자들은 무엇보다 우선적으로 내장그래픽의 성능향상에 몰두한 결과라는 것이다. 따라서 CPU는 2.5 배 밖에 증가하지 않지만, GPU는 30 배의 성능 향상이 되어버린 상황이다.
하이엔드 사용자로서 좀 더 CPU의 성능발전도 일어나게 내장그래픽을 빼버리고 그 자리에 CPU 코어를 점차 늘려버린다던지 이렇게 설계를 해주면 기쁩니다. 라고 생각하지만, 앞으로는 절전시대에 회사의 방향이 어쩔 수 없는 것일지도 모른다.
어떻게든 현재 이스라엘의 하이파 디자인팀이 설계중인 새로운 마이크로 아키텍처 (7nm 세대의 새로운 마이크로 아키텍처 2018년출시)가 그런 가능성을 보여줬으면 하고 끝마칩니다.