NVIDIA Tegra칩의 목적NVIDIA Tegra칩의 목적

Posted at 2009. 5. 15. 18:02 | Posted in IT/Hardware/Graphics

 

 




● 휴대폰을 위해 프로세서를 리브랜딩

 NVIDIA의 휴대용 디바이스를 위한 SoC(System on a Chip)「Tegra」패밀리가 의미하는 것은 무엇인가.
그것은, 휴대용 디바이스를 위한 미디어 프로세서 전략의 재스타트와 타겟시장의 확장이다. NVIDIA는, COMPUTEX로의 Tegra 패밀리 발표시에, Intel의「Atom(Silverthorne/Diamondville)」시장을 타겟으로 정했다.

 즉, 메인스트림 노트PC보다 작고, 스마트폰보다 큰, 모바일 디바이스를 노린다. Intel가 말하는「MID(Mobile Internet Devices)」시장이다. NVIDIA는 종래, 휴대용 디바이스를 위한 제품으로 하는 스마트 폰 등 고기능 휴대 전화 시장에 자리잡고 있었다. 그러나, Tegra에서는, 위로 약간 넓혀 컴퓨터 기기의 시장에 진입한다. 그 때문에, NVIDIA에서는 MID 전용의「Tegra 600/650」을, 「Complete Computer on a Chip」라고 부르고 있다. 즉, 휴대전화 전용의 어플리케이션 프로세서를 통합했을 뿐의 SoC가 아니고, 컴퓨터로서 충분히 사용할 수 있는 고기능의 컴퓨터라고 강조하고 있다. 물론, 실태는 SoC다.

 원래, NVIDIA는 휴대기기용 GPU 코어의 개발에서는, 라이벌의 ATI Technologies(현AMD)의「Imageon」에 크게 뒤쳐지고있었다. 그래서 2003년에 휴대 기기용의 GPU 벤더 MediaQ사를 매수, 「GoForce」브랜드의 휴대 기기용 미디어 프로세서의 전개를 시작했다. MediaQ 제품을 리브랜드 하는 것과 동시에, MediaQ 시대에 개발을 스타트한「GoForce 4000/3000」을 런치. 그 후, NVIDIA 시대에 개발을 스타트한 저전력 3D GPU 코어「AR10」을 실은「GoForce 3D 4500/4800」을 투입. 또, AR10의 라이센스 비즈니스도 출발시켰다.

 매수에 의해, 휴대 기기용 미디어 프로세서라고 하는 신시장에, 단번에 참가한 NVIDIA는, 당초, 동사의 새로운 GPU로서 화려하게 GoForce를 밀어 냈다. 그러나, 최근에는, 신제품을 릴리스 해도, 최초의 무렵 정도 일반용으로 야단 법석으로 밝히는 것은 삼가하고 있었다. 이번 Tegra 패밀리라도, 스마트 폰 전용의 Tegra APX 2500은, 벌써 APX 2500이라고 하는 명칭으로 금년(2008년) 2월에 Mobile World Congress로 발표하고 있어 휴대 전화 업계에서는 화제가 되고 있었다. 그러나, 이번, MID 전용의「Tegra 6 xx」패밀리를 발표할 때까지는, 일반용에는 대대적으로 밝히지 않았다.

 이러한 움직임은, NVIDIA가, 휴대 기기용 제품의, 제품과 전략, 마케팅을 재검토라고 있었기 때문에일지도 모른다. 신전략에서는, 분명하게 타겟이 퍼져, NVIDIA는 동사의 미디어 프로세서를 보다 파워풀하게 하고, 보다 폭넓은 시장에 투입해 가려 하고 있다.

 덧붙여서, NVIDIA가 시야에 넣는 것은, 스마트 폰과 휴대 인터넷 디바이스 만이 아니다. NVIDIA는, 재작년(2006년)에, iPod에 SoC를 제공하고 있던 것으로 알려진 PortalPlayer를 매수하고 있다. 휴대 미디어 플레이어 시장에도 정신을 쏟기 위해라고 생각할 수 있다.




● 어플리케이션 프로세서의 통합

 제품면에서 보면, Tegra 패밀리의 포인트는 CPU 코어를 통합한 SoC화. 이것은, NVIDIA가 GoForce를 런칭시킨 당초부터 언급하고 있던 것으로, 노선 변경에서도 아무것도 아니다. 원래, CPU 코어를 포함한 SoC 제품 자체는 작년(2007년) 2월에「GoForce 6100」(으)로서 발표하고 있다. 또, SoC화 자체, 휴대 전화 등 휴대 디바이스를 타겟으로 한 미디어 프로세서에서는 당연한 방향이라고 말할 수 있다.

 옛 전통적인 휴대 전화는, 신호 처리용의「전용선 접속 시스템 프로세서」라고, 제어 태스크용의「마이크로 콘트롤러」을 싣고 있었다. 그러나, 휴대 전화가 진화하는 것에 따라, 마이크로 콘트롤러를, OS나 각종 어플리케이션 소프트를 달리게 하기 위해서 충분한 성능 기능을 갖춘「어플리케이션 프로세서」로 발전시켜 왔다. 거기에, 제3의 프로세서로서 미디어 프로세서가 들어가게 되어, 파티쇼닝의 문제가 발생해 왔다.

 즉, 전용선 접속 시스템부+어플리케이션 프로세서의 칩과 미디어 프로세서 칩의 구성인가, 그렇지 않으면, 전용선 접속 시스템 팁과 어플리케이션 프로세서+미디어 프로세서의 통합 칩의 구성일까하고 말하는 선택이 된다. 예를 들면, 제1세대 iPhone의 경우, Infineon제의 전용선 접속 시스템 프로세서 칩과 Samsung제의 어플리케이션 프로세서 SoC를 탑재. SoC에, 그래픽스 프로세서인 PowerVR MBX 코어(Imagination Technologies)는, 어플리케이션 프로세서 코어 ARM1176(620 MHz)가 통합되었다.

 Tegra도 이것과 같은 방향의 통합으로, 요즘의 트렌드를 취한다. Tegra는 어플리케이션 프로세서 ARM 11 코어를 최고 800 MHz(Tegra 650) 보다 파워풀한 처리가 필요한 고기능 디바이스도 시야에 넣었다. iPhone라는 비교로 말하면, iPhone와 동레벨 이상의 어플리케이션 프로세서 성능으로, 보다 고도의 그래픽스 기능을 제공할 수 있는 SoC라고 하는 컨셉이다.



● 휴대폰을 위한 NVIDIA GPU의 생각

 Tegra의 중요한 1가지는, 신세대 GPU 코어의 탑재. Tegra의 그래픽스 코어는, AR10로부터의 흐름의 종래의 GoForce 코어와는 다르다고 한다. 데스크탑 GPU로 말하면 DX9 상당한 기능을 갖추는, 크게 확장된 GPU 코어다. NVIDIA는, Tegra의 이미지도에 GeForce 코어와 일부러 나타내 보이고 있다.

 API로서는 풀 프로그래머블의 OpenGL ES 2.0을 서포트해, GeForce 8800(G80)으로 같은 고정밀도 anti-aliasing「CSAA(Coverage Sampling Antialiasing)」을 내장한다. PC를 위한 GPU에 비유한다면, GoForce로부터 Tegra에의 이행은, DirectX 8 GPU로부터 DirectX 9 GPU에의 점프에 가깝다. 본격적인 쉐이더프로세서를 탑재한 것이 Tegra 패밀리다. 제조 프로세스를 65nm프로세스에 진화시킨 것으로, 기능을 단번에 확장했다.

 무엇보다, NVIDIA의 휴대 디바이스를 위한 3D GPU에서는, 당초부터 쉐이더프로세서를 탑재하는 것이 컨셉이었다. 고정 기능으로 내장하는 것보다, 프로그래머블인 내장에 들르고 있던 것이, NVIDIA의 휴대폰을 위한 3D그래픽스 코어의 특징이다.

 예를 들면, 최초의 AR10 코어에서는, “저소비 전력화를 위해서” 탑재했다고 설명하고 있었다. 일반적으로, 프로그래머블 하드웨어가, 고정 기능 하드웨어보다, 소비 전력 당의 처리 효율이 나쁘다. 그러나, GoForce 3D에서는, 쉐이더를 사용하는 것으로 소비 전력을 절감 한다.


 

그 이유는 아래 2가지 이유이다.

GPU를 쉐이더프로세서 중심으로 만들면, 3D그래픽스 파이프 자체의 트랜지스터 규모를 축소해 저소비 전력화할 수 있다. 또, 쉐이더프로세사를 3D그래픽스 이외에 다용도에 사용하는 것으로, 시스템 전체의 소비 전력을 줄일 수 있다. 즉, 컴팩트하게 설계한 프로그래머블인 미디어 프로세서를 다용도에 활용하는 것으로, 전력 효율을 높인다고 하는 생각이다. 실제, AR10 코어의 규모는 600만 트랜지스터로, 고정 하드웨어 실장의 GPU가 200 스테이지 구성인데 비하여, AR10 코어는 50 스테이지와 파이프라인 스테이지도1/4에 삭감되고 있었다. 게다가 트랜지스터와 회로설계 레벨로 전력 절약 기능을 더한 결과, 퍼포먼스 당의 전력 효율은, 그 시점의 PC를 위한 GPU의 15배나 높아졌다. 전통적 GPU가 당시 100 Mpixel/sec 당 750 mW를 소비하고 있던 것에 대하고, AR10 코어는 75 Mpixel/sec에 대해서 35 mW정도 밖에 소비하지 않았다.

 이번 코어도, 기능은 크게 확장되었지만, 전력 효율의 높이는 유지되고 있다. 이름이야말로 GeForce 코어이지만, 실제로는 모바일 전용으로 재설계되고 있다고 추측된다.

 다만, AR10의 무렵의 구상과 비교와 특정용도전용 하드웨어의 비중이 높아지고 있는 것처럼 보인다. Tegra 패밀리는 강력한 비디오 프로세서를 탑재하고 있어, 720p H.264 비디오의 디코드& 인코드를 지원하는것으로, 일묭 오버킬(overkill)로 보이는 기능을 갖추고 있다.





● ARM와 x86의 양아키텍쳐가 서로 괴롭힌다

 비교적 고성능인 ARM 어플리케이션 프로세서와 리프레쉬 한 GPU 코어와 비디오 엔진을 실은 NVIDIA의 SoC Tegra 패밀리. 이 신전략을 둘러싼 축은 3개 있다.

첫번째는, 「ARM인가 x86인가」.
CPU 아키텍쳐를 둘러싼 축으로, 편입 CPU와 PC계 CPU의 어느 쪽이 휴대 기기를 차지하는지가 포인트가 된다. 

두번째는, 「미디어 프로세서인가 어플리케이션 프로세서인가」.
x86 뿐만이 아니라 ARM도 포함한 범용 CPU 코어에 대해서, 미디어 프로세서가 도전하는 축이다. 범용 코어와 어플리케이션 특화형의 코어의 어느 쪽이 중요한가가 포인트가 된다.

세번째는, 「Tegra GPU 코어인가 PowerVR 코어인가」.
미디어 프로세서 코어를 둘러싼 축으로, 휴대 기기에의 편입으로 넓게 사용되고 있는 PowerVR계 뿐만이 아니라, AMD의 Imageon 코어나 다른 미디어 프로세서 코어와도 NVIDIA는 겨루게 된다.

 PC측면에서 보면 CPU는 압도적으로 x86 아키텍쳐가 주류인데 반해  , 저전력 세계에서 보면, 편입 RISC 프로세서 코어가 시장을 지배하고 있다. 그 중에서도 ARM계열이 견고하게 토대를 굳히고 있다. x86는 그 하이엔드시장에서에 갉아 먹어 다하기 시작했던 바로 직후로, 정말로 고기능 모바일 디바이스 전체에 침투할 수 있을지 어떨지 아직 회의적인 눈으로 보여지고 있는 상황이다.

 IP벤더가 코어를 허가하는 모델의 ARM 코어는, 많은 반도체 벤더에 채용되고 있어 특히 저전력 디바이스 전용의 시스템 LSI에의 인테그레이션이 많다. 휴대 기기의 벤더로부터 하면, ARM 아키텍쳐라면 다양한 선택이 있어, 하드웨어로의 차별화가 용이해진다. NVIDIA의 Tegra도, 그 선택의 하나다.

  신세대의 x86 편입 CPU는, Intel이 제공을 시작했던 바로 직후로, SoC(System on a Chip)의 전개도 아직 시작되지 않았다. Intel의 지금의 어프로치는, PC형의 표준품을 제공하는 모델로, 편입 업계에 피트하고 있다고는 말하기 어렵다. Intel는, SoC화와 다양화의 필요를 인식하고 있다고 설명하지만, 현재는 되어 있지 않다.

 PC업계측에서 보면, Intel이 x86가 휴대 디바이스 시장에 쳐들어가고 있는 것처럼 보인다. 그러나, CPU 업계를 전체로부터 바라보면, 부푸는 휴대 기기나 짜넣어 기기의 시장을 배경으로, 융성하는 편입 RISC 프로세서에 대해서, x86가 방어전을 하고 있도록(듯이)도 보인다. CPU의 출하 개수로 보면, 휴대 전화 시장의 대부분을 누르는 ARM의 물량은, x86 CPU에 필적한다.

 Intel가 주장하는 Web 액세스로의 x86의 소프트웨어 자산의 유용성도, 만약, ARM가 휴대 Web 액세스 디바이스의 어플리케이션 프로세서의 위치를 굳혀 버리면 요동해 버린다. ARM가 Web 액세스로의 소프트웨어 생태계를 확립해 버리면, Web 회전으로의 소프트웨어 자산을 저축해 버리기 때문이다. 그러니까, Intel는 기선을 억제하고, 이 시장을 누를 필요가 있다.






● 어플리케이션 프로세서와 미디어 프로세서의 싸움

 미디어 프로세서나 어플리케이션 프로세서인가, 이것은, 휴대 기기용 미디어 프로세서의 등장시부터의 중요한 포인트다. 휴대 기기의 멀티미디어화에, 프로세서 벤더는 크게 나누어 2가지 측면으로 대응하려고 해 왔다.
하나는, NVIDIA가 목표로 하고 있듯이, 범용성의 높은 데이터 병렬 프로세서 코어에 고정 기능 유닛등을 더한 미디어 처리 전용 프로세서로 대응하는 방법. 다른 하나는, 범용의 어플리케이션 프로세서 자체를 강화하는 것으로 대응하는 방법.

 실제로는, 이 2개의 방법은 믹스 있어, 명확하게 분류 하는 것이 어려운 경우도 있다. NVIDIA 자신도, Tegra 패밀리안의 스마트 폰을 위한 제품 Tegra APX를“어플리케이션 프로세서”라고 부르고 있다. 그러나, Tegra 패밀리는 ARM를 싣고 있다고는 말할 수 있어 미디어 프로세서 노선이며, 어플리케이션 프로세서라고 호칭하고 있는 것은, 미디어 프로세서에 대한 저항감을 완화시키기 위해라고 추측된다.

 한편, Intel의 Silverthorne(Atom)는 어플리케이션 프로세서(=범용 CPU)를 강화하는 노선이다. 이 방향에서는, Silverthorne의 MMX/SSE3나 ARM의 NEON/VFP와 같이, CPU 측에 SIMD(Single Instruction, Multiple Data) 연산 유닛을 갖추는 것으로, 범용 CPU 중(안)에서의 미디어 처리를 고속화하고 있다. Tegra가 실장하는 ARM 아키텍쳐에도, 「Cortex-A8」과 같이 강화판 어플리케이션 프로세서가 있어, 그 축에서는 NVIDIA의 노선과 대립한다.

 다만, Intel의 Silverthorne도, 3D그래픽스에 PowerVR SGX, 비디오 프로세싱에 PowerVR VXD 코어를 칩 세트 측에 내장하는 형태로 사용하고 있다. 반드시, 모두를 범용 CPU 코어로 처리한다고 하는 발상은 아니다. Intel의 구상으로서는, 유연한 프로그램성이 필요한 처리는 Silverthorne 코어측이라고 하는 판단같다. 미묘한 것은 AMD로, AMD는 저소비 전력의 CPU 코어「Bobcat(밥캣)」을 개발하고 있어, Tegra와 경합 하는 Imageon계에도 장래는 x86 코어를 탑재하려고 하고 있다. 그러나, Imageon은 쉐이더프로세서로 발전시킬 생각이다.

 고성능 어플리케이션 프로세서로의 미디어 프로세서의 이점은, 소비 전력과 퍼포먼스다. 같은 처리를 시킨다면, 프로세서 코어의 제어 부분이 가볍고, 퍼포먼스/전력의 효율이 높은 미디어 프로세서가 전력과 퍼포먼스로 쭉 유리하게 된다. 다만, 프로그램성이나 소프트웨어 자산으로는, 어플리케이션 프로세서가 유리하게 되는 경우가 많다. PC의 세계에서, CPU와 GPU의 사이에 시작된 싸움이, 여기에서도 전개되고 있다.

● NVIDIA의 강함을 살릴 수 있는 시장을 노리는 Tegra 전략

 미디어 프로세서의 사이에서의 경합도 있다. 휴대 기기용 미디어 프로세서 시장은, 아직, 전국시대에 가까워, PC그래픽스와 같이 몇 회사에 수습되기 전의 단계에 있다. 원래, 어떤 아키텍쳐가 적합한지도, 아직, 결정되어 있지 않다. PowerVR 아키텍쳐가 이 시장에서 비교적 강한 것은, PowerVR가 채용하는 타일링 아키텍쳐가, 필요한 메모리 대역과 메모리량을 줄이는 효과가 있기 위해, 메모리의 제약의 강한 휴대 기기에 향하고 있기 때문이다.

 이러한 다양한 축을 생각하면, NVIDIA의 Tegra 전략이 보여 온다.

 Tegra의 강점은, 범용적인 어플리케이션을 달리게 하는데 충분한 레벨의 어플리케이션 프로세서와 PC그래픽스의 경험을 살린 강력한 미디어 프로세서의 편성에 있다. 그 강점을 제일 살릴 수 있는 부분은, 비교적 화면 해상도가 크고, 미디어 처리가 많은 디바이스다. 어플리케이션 프로세서만의 솔루션과 비교와 미디어 플레이때의 전력 소비나 퍼포먼스로 우위에 세운다. 또, 다른 미디어 프로세서에 대해서도, 고도의 그래픽스가 필요한 시장에서는, NVIDIA가 우위에 서기 쉽다.  MID나 미디어 플레이어등을 시야에 넣는 것은 당연이 된다.

 PC아키텍쳐로부터 아래로 전개하는 Intel의 Atom에 대해서, 휴대폰 전용 짜넣어 아키텍쳐로부터 위로 NVIDIA는 전개하려고 하고 있다. 이것도, x86 CPU 코어보다 작고 저전력 절약의 ARM CPU 코어의 덕분이다. 그리고, 편입 RISC와 Intel x86가 서로 괴롭히는 경계인 MID로, ARM 진영이 우세하게 되면, NVIDIA도 자연과 밀물을 탈 수 있다.




 

 

Name __

Password __

Link (Your Website)

Comment

SECRET | 비밀글로 남기기

free counters