영국 Imagination Technologies는, PowerVR의 차세대 시리즈 「PowerVR Series6(Rogue, 로그)」를 개발, OEM에 제공해 왔다. 아키텍쳐를 일신한 PowerVR 6 계열은, 내년(2013년)부터 실제의 제품에 등장하기 시작한다. 내년의 아이폰5s이나 아이패드5, 각사의 스마트 폰이나 타블렛은, Rogue 아키텍쳐의 GPU를 탑재하고 있을 가능성이 있다.
Rogue의 목적은, 반도체 기술이나 메모리 기술의 진화를 이용하고, 모바일 GPU의 퍼포먼스를 수백 GFLOPS의 레인지에 늘리는 것.눈에 띄는 것은, 대규모 GPU 구성에 최적화한 것, GPU의 퍼포먼스/전력/다이 면적의 효율을 끌어올리는 것, 텍스쳐를 도배한 그래픽게임에 최적화하는 것 등.성능을 올릴 뿐만 아니라, 새로운 모바일 SoC(System on a Chip)나 그래픽스 기술의 트랜드에 따르는 아키텍쳐를 뽑는다.
Imagination Technologies의 GPU 코어는, PowerVR Series 5로부터, 멀티 코어 대응이 된 PowerVR Series5XT로 진화해 왔다.PowerVR의 연산 유닛의 구성은, 2~3년전까지는 4~8개의 ALU(Arithmetic Logic Unit)가 주류였던 것이, 현재, 톱 엔드는 128 ALU에까지 부풀어 오르고 있다.모바일 SoC 중(안)에서는, CPU 코어가 증가하는 이상의 페이스로, GPU 코어의 연산 유닛이 급확대하고 있다.
PowerVR 로드맵
PowerVR Series6(Rogue)는, 이러한 흐름을 받아 개발된 신아키텍쳐 코어로, 보다 대규모이고 파워풀한 코어를 목표로 하고 있다.Rogue계에서는, 벌써 제1세대의 PowerVR G6x00계로서 G6400/G6200가 발표되고 있지만, 게다가 11월에는 제2세대의 PowerVR G6x30계의 G6630/G6430/G6230의 3 계열이 발표되었다.
Rogue 세대의 명명 규칙은, 최초의 숫자의 6이 아키텍쳐, 다음의 숫자가 쉐이더 클러스터 구성, 그 다음이 세대를 나타낸다고 보여진다.PowerVR Series5계에서는 말미의 1자리수가 서포트 API의 차이등을 나타내고 있었지만, Rogue 세대로는 어떻게 되는지 모른다.
PowerVR Series5계라는 명명 규칙의 큰 차이는, 종래는 프로세서 구성의 차이가 코어수의 차이이기 위해, 명칭의 말미에 MP2 등 멀티 프로세서수로 나타내 보이고 있던 것이, 이번은 3자리수째에 클러스터 구성의 차이로서 나타내 보이게 된 것이다.이 명명 규칙의 차이는, 아키텍쳐의 근간의 차이를 나타내고 있다.자세한 것은 후술 한다.
덧붙여서, Imagination Technologies도 소프트 매크로로 GPU 코어를 제공하고 있기 때문에, 동사가 코어를 발표하고 나서, 실제로 SoC에 짜넣어져 등장하기까지 타임 러그가 있다.통상, 1년 이상 걸린다.Rogue의 경우는, 아키텍쳐 개발을 2010년에 발표해, 코어의 제공이 시작된 것을 금년(2012년) 1월에 발표하고 있다.즉 등장은 2013년의 전망이다.
반도체 및 메모리 기술의 진보에 맞춘 아키텍처의 진화
현재 알려진 Rogue의 큰 특징은 PowerVR이 세대 PC 그래픽에 크게 접근하는 것을 보여주고있다.
(1) GPU 코어의 구성을 바꾸고, 대규모 프로세서 구성을 쉽게 취할 수 있도록했다.
(2) GPU 코어 내부의 명령 제어를 크게 변경하여보다 다이 면적 및 전력 당 성능을 끌어 올리려하고있다.
(3) 텍스처 파이프를 프로세서와 동기화 한 확장 가능한 구성하고 텍스처를 많이한다 "트렌디"그래픽에 대응할 수 있도록하고있다.
(4) DirectX 10 이후의 최신 API에 대한 지원도 담당 (종래는 일부만).
그리고 이러한 특징은 반도체 및 메모리 기술의 발전과 연결하고있다. 첫째, 프로세스의 미세화에 의해 트랜지스터의 예산이 증가하므로 더 많은 연산 유닛을 싣는 것이 가능하게된다. PowerVR Series6는 28nm 공정 이상을 대상으로하고있다.
하지만 사용할 수있는 트랜지스터 수는 증가해도, 소비 전력의 제약은 상대적으로 바짝하므로 성능 / 전력을 향상시키지 않으면 안된다. 한편, 모바일 메모리는 2년에 2배의 속도로 대역폭의 급속한 진화를 계속하고있다. 메모리 대역은 이전만큼 제약이되지 않으므로, 텍스처로드의 양의 팽창도 대응이 가능하게되었다. 그 결과, 쉐이더 성능과 텍스처의 다용가 필요한 그래픽을 지원하기 쉬워진다.
기존의 PowerVR 아키텍처는 최대 16 ~ 32 ALU에서 1 개의 GPU 코어를 구성했다. 대규모 구성하려면, GPU 코어 자체를 복수 정렬 멀티 코어 구성을 채택하고있다. 아래는 PowerVR SGX544 추정되는 다이어그램 그림에서 중앙의 블루 원주 군이 연산 유닛 (ALU)이다. SGX544는 4 파이프 구성되어있다.
PowerVR SGX 54x MP4 구조
PowerVR Series5 계열은 코어 당 연산 유닛의 수는 4 ALU 정도의 소규모 구성에서 그림 4 파이프 16 ALU 구성과 최신 PowerVR SGX 554는 8 파이프 32 ALU 구성까지 확대 해왔다. 하드웨어 작업 스케줄러 인 'Coarse Grain Scheduler (CGS)'가 각 ALU를 제어한다. 그리고 iPad와 iPhone과 같은 하이 엔드 모바일 장치에서 코어를 여러 싣고, 각 코어가 화면의 다른 부분을 렌더링함으로써 멀티 코어 동작을 수행한다.
클러스터 구성된 Rogue의 GPU 코어
PowerVR Series6에서는, 이 구성을 근저로부터 재검토했다.현재의 PowerVR Series5XT에서는, 1개의 GPU 코어에, Coarse Grain Scheduler(CGS)로 제어되는 프로세서 클러스터가 1개의 구성이 되고 있다.그러나, PowerVR Series6에서는, 1개의 GPU 코어안에, CGS로 제어되는 프로세서 클러스터를 복수개 실을 수 있다고 한다.그 때문에, GPU 코어를 복수개 늘어놓지 않아도, GPU 코어안의 클러스터를 늘리는 것으로, 연산 프로세서수를 늘리는 것이 가능하게 되었다.
즉, 지금까지는 작은 ALU 구성을 주목적으로 설계된 GPU 코어를, 멀티 코어 구성으로 무리하게, 대규모 ALU 구성으로 확대해 왔다.그러나, PowerVR Series6에서는, GPU 코어 자체의 설계가, 대규모 ALU 구성을 전제로 해서 만들어지게 된다.구체적으로는, 현재 발표되고 있는 코어 가운데, G6200와 G6230는 2 클러스터 구성의 코어, G6400와 G6430가 4 클러스터 구성의 코어, G6630가 6 클러스터 구성의 코어가 되고 있다
아래는 추정되는 블럭도다.6 클러스터의 PowerVR G6630의 예를 나타내고 있다.PowerVR Series5에서는, 클러스터는 「Universal Scalable Shader Engine (USSE)」라고 불리고 있었지만, PowerVR Series6에서는 「USC(Unified Shading Cluster)」라고 불린다.클러스터와 texture 유닛을 묶은 코어가 「Unified Shading Cluster Array (USCA)」다.각 클러스터가 16 ALU의 구성이라고 하면, PowerVR G6630는 합계 96 ALU의 구성이 된다.
PowerVR G6630의 블록 다이어그램
또, PowerVR Series6도 멀티 코어 구성으로 하는 것으로, 한층 더 대규모 GPU 구성을 뽑는 것이 가능하다고 예측된다.덧붙여서, ST-Ericsson은 PowerVR Series6를 실은 최초의 모바일 SoC가 된다고 보여지는 「Nova A9600」를 개발하고 있다.Nova A9600는 PowerVR G6400를 싣고 있다고 추측되지만, 연산 퍼포먼스는 210 GFLOPS에 이르면 아나운스 하고 있다.G6400가 64 ALU 구성이라고 하면, 통상의 모바일 GPU의 동작 주파수에서는 이 성능을 달성할 수 없기 때문에, Nova A9600는 PowerVR G6400의 멀티 코어 구성일 가능성이 높다.
PC용 그래픽카드와 닮은 PowerVR Series6
Imagination Technologies의 PowerVR Series6는, GPU 코어 아키텍쳐가 멀티 클러스터 구성으로 바뀌었다.GPU 코어의 구성을 바꾸는 것으로, 보다 많은 ALU를 실은 대형 코어로 향한다.Imagination Technologies는 지금까지, 다양한 SoC의 요구에 응하기 위해서, 코어 자체의 구성을 유연하게 변경할 수 있는 점을 중시해 왔다.코어 당의 파이프수는, 로앤드의 PowerVR SGX520에서는 싱글 구성이다.그러나, PowerVR Series6에서는, 일정 규모의 구성에 포커스 한 것처럼 보인다.
또, PowerVR Series6의 클러스터 방식은, 코어를 복제하는 종래의 방식과 비교하면, 헛일을 생략하는 것으로 다이 효율이 오르는 것을 의미한다.이 구성의 변경만으로도, 같은 다이 면적에, 보다 많은 프로세서를 쌓는 것이 가능하게 된다.또, 복수 클러스터를 걸치는 하드웨어 스케쥴러가, 프로세서에 대한 태스크의 할당을 행하기 위해, 스케줄링의 효율도 향상한다.
덧붙여서, 이러한 아키텍쳐는, 실제로는 PC를 위한 GPU에서는, 이전부터 일반적이었다.PC를 위한 GPU는, 내부를 클러스터화하고, 클러스터 구성의 증감으로, 로앤드로부터 고급 지향까지를 만들어 나누어 왔다.PowerVR Series6의 아키텍쳐는, 그것과 같은 것을 하고 있다.
또, GPU 구성 뿐만이 아니라, Imagination Technologies는 GPU 코어안의 스렛드의 스케줄링에 대해서도, PC를 위한 GPU적인 수법을 도입했다.현재의, 극단적으로 작은 분기 입도(픽셀 또는 정점 단위)로부터, 일정한 입도를 가지는 컨트롤 flow control으로 변경한다고 보여진다.이 변경도, GPU 코어의 퍼포먼스/다이 면적/전력을 높이기 위해서 중요하다.
'Moblie > Etc' 카테고리의 다른 글
3DMARK 안드로이드 스마트폰 그래픽성능 테스트 (0) | 2013.04.03 |
---|---|
2012년 세계 모바일AP 시장점유율 (0) | 2013.03.13 |
[MWC2013] 퀄컴 스냅드래곤800 스냅드래곤600 스펙공개 (0) | 2013.03.01 |
[MWC2013] 파이어폭스(FireFox) OS 정식 발표 (0) | 2013.02.28 |
소니, 세계최초 신개념 CMOS 적층형 Exmor RS 센서 발표 #2 (0) | 2013.02.13 |
[CES2013] 퀄컴 스냅드래곤 라인업 개편 (0) | 2013.01.09 |
[CES2013] 엔비디아 테그라4, 쉴드 게임기 발표 (0) | 2013.01.07 |
JDI 타블렛용 10.1인치 LCD패널 공개 (0) | 2012.10.30 |
JDI 5인치 풀HD 스마트폰 패널 양산발표 (0) | 2012.10.25 |
MS 윈도우RT 탑재한 서피스 스펙 및 가격을 공개 (0) | 2012.10.19 |
댓글