본문 바로가기
IT/Hardware/CPU/MB

HD4000으로 내장그래픽을 강화한 인텔 아이비브릿지

by 에비뉴엘 2012. 4. 20.
반응형


●GPU코어를 강화한 아이비브릿지 

 Intel이 2012년 상반기에 투입하는 「Ivy Bridge(아이비 브릿지)」는, 기본적으로는 현재의 Sandy Bridge(샌디 브릿지)를 32nm에서 22 nm에 축소한 버젼이다.
Intel은, 현재, 「Tick Tock(틱 톡)」모델로 신CPU를 투입하고 있어, 2년 정동[ 반도체 프로세스 기술을 혁신(Tick), 그 중간의 2년쯤 CPU 마이크로 아키텍쳐를 쇄신(Tock) 하고 있다.Ivy Bridge는 Tick에 해당된다.

 그러나, 샌프란시스코에서 개최되고 있는 Intel Developer Forum(IDF)의 키노트 스피치로, Intel의 Mooly Eden씨(VP, General Manager PC Client Group, Intel)는, Ivy Bridge는 단순한 미세화판은 아니고 「Tick+」라고 설명했다.미세화했던 것 뿐만 아니라, 새로운요소가 더해진 칩이 Ivy Bridge다.

 그럼, Ivy Bridge에서는, 무엇이 강화되었는가.크게 확장된 것은, GPU 코어라고 한다.

 Intel은, Sandy Bridge의 GPU 코어를 큰폭으로 확장해, 그래픽스 기능과 미디어 프로세싱 기능의 강화와 범용 컴퓨팅 기능의 부가를 행했다.Ivy Bridge는, 그 흐름을 한층 더 추진해 DirectX 11에 대응하는 것과 동시에, 보다 범용성이 높고 미디어 처리 성능의 높은 코어로 하고 있다.Intel의 마케팅 토크에서는, Intel이 CPU로의 범용 처리를 높이는 헤테로지니아스(Heterogeneous:이종 혼합) 컴퓨팅에 적극성은 명확하게 느껴지지 않지만, GPU 코어의 아키텍쳐를 보면, 적극적인 자세가 보인다.

 Intel은 IDF로, Ivy Bridge의 동작 데모는 물론, Ivy Bridge 베이스의 Ultrabook이나, Ivy Bridge의 다이 사진등도 공개했다.현재 공개되고 있는 Ivy Bridge는, 4 CPU 코어의 버젼으로, 4 코어판 Sandy Bridge 같이 GPU 코어나 PCI Express, LL캐쉬(Last Level Cache), 링버스등을 갖춘다.


●샌디브릿지 다이와 아이비브릿지를 비교하면 
 
 아래의 그림은, Ivy Bridge와 Sandy Bridge의 다이를 비교한 것이다.왼쪽이 Ivy Bridge, 오른쪽이 Sandy Bridge가 되고 있다.Intel은 Ivy Bridge의 다이 사진은 정확한 것은 아니다고 하고 있지만, 각 유닛의 사이즈 비교로는 된다고 생각할 수 있다.정확한 die size는 아직 모르기 때문에, Sandy Bridge와 Ivy Bridge로, CPU 코어의 사이즈가 거의 같게 되도록(듯이) 확대해 늘어놓고 있다.실제로는 22 nm의 Ivy Bridge가 아득하게 다이가 작을 것이다.


Ivy Bridge와 Sandy Bridge의 다이 레이아웃 비교 

 CPU 코어와 LL캐쉬 어레이의 부분은, Ivy Bridge와 Sandy Bridge로, 거의 쌍둥이와 같이 비슷하다. 코어 내부의 레이아웃도 닮고 있는 것처럼 보인다.CPU 코어에 대해서는, 거의 Tick 모델인 것을 상상할 수 있다.다만, 잘 보면 Ivy Bridge가, 약간 CPU 코어가 크고, 캐쉬 에리어가 상대적으로 약간 작은 것처럼 보인다.

 현재는, 캐쉬 SRAM 에리어는 쉬링크 하기 쉽지만, 논리 부분은 쉬링크 하기 어려운 경향이 있다.Intel의 3D트랜지스터 프로세스에서도, 그 경향이 있을 지도 모르다.덧붙여서, 3D트랜지스터는 채널 구성을 바꿀 수 있지만, 캐쉬 SRAM는 싱글 채널(싱글 Fin), 논리 부분은 멀티 채널을 다용한 구성이 되고 있다고 한다.멀티 채널화로 스위칭 성능을 높이고 있기 때문이다.

싱글과 멀티채널의 3D트랜지스터 

 
 Sandy Bridge에서는 다이의 하단에 배치되어 있던 DRAM 인터페이스 패드는 다이의 우측에 이동되었다. I/O패드를 모두 외주에 늘어놓는 방식으로부터 바뀐 것처럼 보인다.그 때문에, Sandy Bridge에서는 다이상에 불필요한 데드스페이스가 있던 것이, Ivy Bridge는 아니게 되어, 보다 컴팩트한 설계가 되고 있다.

 Ivy Bridge와 Sandy Bridge를 비교하면, 누구라도 깨닫는 것은 커진 GPU 코어다. Sandy Bridge의 트랜지스터 카운트는 9억 9,500만으로, Ivy Bridge는 14억 8,000만으로 되어 있다.3D트랜지스터화에서도 트랜지스터 카운트의 세는 방법이 변함없다(Fin의 수는 아니다)로 하면, 50%도 증가한 트랜지스터의 상당수는 GPU 코어에 소비된 것이라고 추측된다. 비율적으로는, Sandy Bridge의 2배 가까운 GPU 코어 사이즈가 되고 있다.

 또, Ivy Bridge의 GPU 코어를 잘 보면, 같은 코어가 2개 좌우에 늘어놓아서 배치되어 있는 것처럼 보인다.이것은, GPU 코어의 사이즈를 반으로 한 삭감한 저가형버전을 파생시키기 쉽게 설계하고 있기 때문에라고 추정된다.Sandy Bridge에서도 아래의 그림과 같이 CPU 코어와 GPU 코어를 삭감할 수 있게 되어 있었다.


샌디브릿지 4코어 2코어 다이어그램


 Sandy Bridge의 GPU 코어는, 12개의 EU(execution unit)로 구성되어 있지만, Ivy Bridge는 기능확장에 의한 EU의 대형화를 공제해도, 적어도 16개의 EU를 가진다고 추정된다.그 경우는 8개의 EU씩 그룹화 되고 있을 것이다.


●기본적인 구성은 샌디브릿지와 닮아 있는 아이비브릿지 
 
 다이의 구성이 닮고 있기 때문에 당연하지만, CPU 전체의 구성도 Sandy Bridge와 Ivy Bridge로 닮고 있다.아래의 슬라이드는 IDF로의 Ivy Bridge로의 변함없는 부분을 설명하는 슬라이드로, 기본적인 부분은 거의 그대로 있는 것을 알 수 있다.CPU도, 아래의 Sandy Bridge의 코어 블럭도로부터 거의 변화가 없는 것이라고 생각된다.


Sandy Bridge의 구성 




Sandy Bridge의 블록 다이어그램 


 다음의 2개의 슬라이드는 Ivy Bridge로의 Sandy Bridge와의 차이점으로, 여기에 나타나고 있는 대로, GPU 코어의 기능과 CPU 코어로의 약간의 명령 확장과 IPC(Instruction-per-Clock)의 개선, 랜덤 넘버 생성 유닛의 내장이나, 전력 제어의 확장(컨피규러블 TDP의 서포트 등), 저전압판의 DDR3L 메모리의 서포트나 3 디스플레이에의 동시 출력의 서포트등이 더해졌다.

 

Ivy Bridge와 Sandy Bridge의 차이

 
 DDR3L 메모리는 종래의 DDR3의 1.5 V에서 1.35 V로, 코어와 인터페이스의 전압을 떨어뜨린 저전압판이다.실제로는 저전압 동작의 선별품이 된다.DDR3L에 대해서는, AMD는 적극적이었지만, Intel은 미온적이었다. Ivy Bridge로부터 서포트한다. LPDDR3는 DDR3L와는 별종의 메모리로, 이쪽은 2013년의 Haswell으로부터의 서포트가 될 전망이다.

●일반적인 테셀레이션 파이프라인의 실장 
 
 GPU 코어의 확장점은 다방면에 건너고 있다.물리적인 확장 부분의 양이라고 하는 의미에서는, GPU 코어가 Ivy Bridge 중(안)에서 가장 크게 바뀐 부분이다.그래픽스 기능면에서는 물론 DirectX 11의 서포트가 제일 크다. DirectX 11 서포트의 하드웨어상의 테셀레이션 파이프라인도 실장되었다. GPU 범용 컴퓨팅의 부분의 기능의 겉(표)는, 실제로는 Sandy Bridge 세대부터 실장되고 있는 기능이 대부분이지만, 큰 확장으로서 쓰기캐쉬가 GPU내에 실장되었다.


DirectX 11의 서포트

 
 Intel의 GPU의 그림은 처리의 흐름이 횡방향이 되어 있다. 이것을, 일반적인 GPU의 블럭도와 같이, 그래픽스 파이프라인에 따라서 위로부터 흐름을 알 수 있는 그림에 일으킨 것이 아래의 그림이다.그림중의 캐쉬의 접속 관계 등은 일부 추정이 들어가 있다.



아이비브릿지 그래픽스 파이프라인의 흐름 


 Intel의 GPU 코어 블록으로, Shader가 되고 있는 것은, 실제로 프로세싱을 행하는 유닛은 아니다. 쉐이더프로세싱은, 모두하의 EU(execution unit)로 행해진다.EU에를 제어하거나 데이터를 어셈블(assemble)하기 위한 유닛이, Intel의 그림에서는 Shader와 표기되고 있다.표기는 다르지만, NVIDIA나 AMD( 구ATI)의 GPU에서도 같은 유닛이 있어, 기본적인 구조는 공통되고 있다.

 위의 그림을 보면, Ivy Bridge로의 DirectX 11 서포트는, 매우 일반적인 실장이 되어 있는 것을 잘 안다.DirectX 11 파이프라인에서는, 테셀레이션 스테이지군으로서 다각형을 분할하는 테셀레이타의 전에 프레임을 처리를 행하는 「Hull Shader」, 뒤로 포스트테셀레이션을 위한 「Domain Shader」를 배치하고 있다.하드웨어적인 실태로서는, AMD와 NVIDIA의 어느쪽이나, 1대의 비행기능의 테셀레이타를 하드웨어 실장해, 전후의 쉐이더는, 쉐이더프로세서군군으로 소프트웨어 실장하고 있다. Intel도 이것은 같이로, 테셀레이타만을 고정 기능 유닛으로서 실장하고 있다.그림에 있는 Hull Shader와 Domain Shader는, 모두 그 제어를 위한 유닛이다.

●캐쉬계층이 바뀐 Ivy Bridge의 GPU 코어 
 
Intel의 GPU 파이프라인은, Sandy Bridge까지 전통적인 GPU의, 읽기만 가능한 라인과  쓰기만 가능한 부린된 버스 구조를 취해 왔다. texture이나 정점은 각각, 외부 메모리로부터 프로세서로 「메모리→캐쉬→프로세서 코어」라고 할 뿐 향의 버스로 읽힌다.그 반대로, 처리가 끝난 픽셀은, 프로세서로부터 메모리에의 하행 방향의 데이터 패스로 써내진다.캐쉬도 이와 같이 분리되고 있어 texture 캐쉬는 리드온리-, 렌터딩캐쉬는 픽셀 오퍼레이션 유닛으로부터  읽고 쓰기할 수 있는 구조가 되고 있었다.

 Intel은, 아이비브릿지에서는, 이러한 상하로 분리된 버스와 메모리 계층에 가세하고, 다시쓰기가능한 캐쉬를 더했다. 또, 로컬메모리도 서포트한다고 되어 있지만, 이것은 구체적인 실장이 어떻게 되어 있는지, 아직 모른다. 메모리 계층은, GPU의 다음의 중요한 열쇠로, Intel이 거기에도 손을 대기 시작한 것을 알 수 있다. 덧붙여서, LL캐쉬는 Sandy Bridge 세대부터 CPU와 GPU의 공용으로, GPU 에리어를 잡을 수 있다.또, 캐쉬 레벨로의 CPU와 GPU의 데이터 교환도 가능하다.



1줄요약
아이비브릿지는 샌디브릿지에 비해 CPU성능향상은 미약하나 내장그래픽에서 70%의 발전이 예상된다. 


반응형

댓글