AMD, DX11 2세대 Radeon HD6870 발표 총정리AMD, DX11 2세대 Radeon HD6870 발표 총정리

Posted at 2010. 10. 22. 13:09 | Posted in IT/Hardware/Graphics


마침내, DX11 2세대「Northern Islands」(노던아일랜드) 시대의 개막이다.

 2010년 10월 22일 11:01분, AMD는, 제2세대의 DirectX 11 대응 GPU 시리즈가 되는「Radeon HD 6000」(※정확하게는「AMD Radeon HD 6000」) 시리즈를 발표했다. AMD 브랜드를 씌운 첫 Radeon다.
 AMD는, 2010년 제 4/4분기중에, ATI Radeon HD 5800 시리즈 후속이 되는 Cayman(케이만), 최고하이엔드의 Cayman를 2기탑재한「Antilles」(안티레스)을 투입한다, 먼저 출시된것은 ATI Radeon HD 5700 후속이되는 Barts(바츠)「Radeon HD 6800」이다.

 대만에서 개최된 사전 기술 설명회「Northern Islands Architecture Deep Dive」(이하, Deep Dive)의 내용을 중심으로, Radeon HD 6800 시리즈로 확장된 아키텍쳐의 포인트를 요약해 전해 싶다.



모델넘버와는 다른 포지션에,라이벌은 GeForce GTX 460


Radeon HD6870, HD6850 레퍼런스 카드
 

이번 발표된 Radeon HD 6800 시리즈의 제품은 2 모델, 「Radeon HD 6870」(이하, HD 6870)과「Radeon HD 6850」(이하, HD 6850)이다.
탑재 카드는, 정식 발표와 동시에 각 파트너로부터 출하 개시가 된다.



●Radeon HD 6870

쉐이더프로세서:1120개
텍스쳐 유닛수:56개
코어 클럭:900MHz
메모리 클럭:4200 MHz (실클락 1.05 GHz)
그래픽 메모리:GDDR5 256 bit, 용량 1 GB
ROP:32개
디스플레이 인터페이스:DVI-I×2(Dual-Link, Single Link 각 1), Mini DisplayPort×2, HDMI×1
전원 공급:6 핀×2
최대 소비전력:151W
아이들 소비 전력:19W
소비자가:239 달러



●Radeon HD 6850

쉐이더프로세서수:960기
텍스쳐 유닛수:48기
코어 클럭:775MHz
메모리 클럭:4000MHz 상당(실클락 1 GHz)
그래픽 메모리:GDDR5 256 bit, 용량 1 GB
ROP:32개
디스플레이 인터페이스:DVI-I×2(Dual-Link, Single Link 각 1), Mini DisplayPort×2, HDMI×1
전원 공급:6 핀×1
최대 소비전력:127W
아이들 소비전력:19W
소비자가:199 달러




Radeon HD 6870에서는, 트리플 디스플레이(5760×1080 픽셀) 환경에 있어서의 퍼포먼스도 소개되고 있다.수치는 최대 frame rate같다



 그런데, 이 2 모델은, 모델 넘버로는, 「ATI Radeon HD 5870」(와)과「ATI Radeon HD 5850」의 후계에게 생각되지만, 실은 그렇지 않다. 주목하고 싶은 것은, 양모델의 자료로 나타나고 있는 비교 대상이, HD 6870은 그래픽 메모리 1GB는「GeForce GTX 460」(이하, GTX 460 1 GB), HD 6850이 그래픽 메모리 768 MB판 GTX 460(이하, GTX 460 768 MB)이 되어 있는 점이다.

주요 게임 타이틀을 앞에 둔 3D성능 비교.HD 6870은 GTX 460 1GB에 대해서, HD 6850은 GTX 460 768 MB에 대해서 각각 30%이상 높은 벤치마크 스코아를 나타낸다고 한다

 이 서 위치는 HD 6800의 제품 기획에 크게 관련되고 있으므로, 그것을 관련되어 소개하자.

 Deep Dive에서는, 동사에서 그래픽스 제품을 통괄하는 Matt Skynner 부사장이 등장 해, 「Northern Islands 시리즈의 개발에 임해서는, 게이머가 무엇을 바라고 있을까를 제일로 생각했다」라고 어필했다.
 이것은, Radeon HD 6000 시리즈가, 2010년 3월에 개최된「Game Developers Conference 2010」로, 동사가 매니페스트(공약)로서 내건「게이머 제일 주의」(Gamers First)에 준거한 것인 것을 나타내는 것이다.


게이머들이 바라는 요구. 이것들을 제품에 포함시킨 것이 HD 6800이다고 한다

 여기서 동사가 조사한 결과안에, 「하이엔드를 추구하는 매니아들은, 최신 기술이나 퍼포먼스의 추구에 타협을 허락하지 않는다. 그러나 한편,보다 염가의 ATI Radeon HD 5800 시리즈 클래스의 제품을 요구하는, 코스트 퍼포먼스 중시의 게이머의 층이 있다」라고 하는 것이 있었다.

 거기서 AMD는 ATI Radeon HD 5800의 후계로서「Barts」와「Cayman」(케이만)이라고 하는 두 개의 GPU 코어를 준비. Barts 탑재 제품은, 코스트 퍼포먼스 중시의 게이머층으로 향한 제품으로서 150 달러~250 달러의 시장에 투입하기로 했다.이것이, HD 6870으로 HD 6850이라고 하는 것이다.



발표 시점에 있어서의 Radeon HD 6000 시리즈의 제품 전략.
Radeon HD 5800 시리즈의 후계로서 2개의 GPU 코어를 준비.코스트 퍼포먼스 중시의 유저에게 Barts, 성능을 중시의 유저에게 Cayman를 향한다


 Skynner씨는, 각 제품의 시장가격에 대한 언급은 피했지만, Deep Dive에 참가하고 있던 파트너 관계자는「발매 당초는 HD6870이 239달러, HD6850이 199달러가 될 것이다」라고 설명하고 있다.




역대 Radeon 시리즈의, 가격대비 연산성능(GFLOPS치)의 향상.
HD 6870에서는 코스트 퍼포먼스가 한층 더 향상한다.
한마디로 HD6870은 가성비가 짱임


 그리고, HD 6870의 개요의 슬라이드에 기재된 연산 처리 성능도, 이러한 서 위치를 나타내는 것이다.HD 6870은 최대 2TFLOPS의 연산 처리 성능을 갖추지만, 이것은 HD 5850의 2.09TFLOPS와 거의 동격으로, 최대 2.72 TFLOPS의 HD5870에는 미치지 않은 것이다.

 또, HD 6870으로 HD 5850의 비교라고 하는 점에서는, 소비 전력에도 주목하고 싶다. 최대치는 같은 151W면서, 아이들시의 소비전력은 HD 5850의 27W에서 19W로 줄어들었다. 19 W라고 하는 수치는 HD 6850도 같지만, 이것은 HD 6800으로, 보다 전력 절약 기능이 강화된 것을 나타내 보이는 것이다.


이번 발표된 Radeon HD 6000 시리즈에의 제품 이행 계획.

 
또한 Deep Dive에서는, 11월의 제3주에 Cayman 코어의「Radeon HD 6970」「Radeon HD 6950」의 2 모델이 출시되어 2010년 제 4/4분기중에는 플래그쉽모델이 되는, Cayman×2기구성의「Antilles」「AMD Radeon 6990」을 투입할 계획도 있다.
  현행 제품에 관해서는, ATI Radeon HD 5970 및 HD 5800 시리즈에 대해서는 단종하지만, ATI Radeon HD 5700 시리즈는, 매장 가격을 인하해 계속 판매한다.



HD 5800의 성능을 유지하면서 다이사이즈와 소비 전력을 줄인 설

 HD 6000 시리즈에 공통되는 특징과 HD 6800의 아키텍쳐에 대해 알아보자.
 HD 6000 시리즈의 특징에 관해서는, Deep Dive로 Skynner씨가, Radeon HD 6000 시리즈에 탑재되는 3개의 기술에 대해 소개하고 있어, 이것이 기본적인 특징으로 여겨진다.




Radeon HD 6000 시리즈의 기능 강화의 포인트를 나타내는"3개의 Eye".「EyeDefinition」, 「Eyefinity」, 「EyeSpeed」

 이 3개의 기술이란, 
보다 리얼한 그래픽스 표현을 실현하는「EyeDefinition」, 
보다 사용하기 쉽게 된 제2세대의「Eyefinity」, 
그리고, 한층 더 강화된 비디오 재생 품질과 병렬 컴퓨팅에 의한 멀티미디어 처리・재생 기술「EyeSpeed」이다.


EyeDefinition의 개요.
HD 6000 시리즈에 있어서의, 그래픽스면에서의 성능과 화질의 향상을 표현하는 키워드같다

 EyeDefinition란, DirectX 11에 있어서의, 성능이나 이미지 품질 강화를 나타내는 것이다.
테셀레이션 처리의 효율화나, 안티얼라이징 제거(AA)와 이등방성필터링(AF)의 기능 강화에 의한 이미지 품질의 향상이 완수해지는 것과 동시에, 
아키텍쳐의 최적화에 의해서 게임이나 DirectCompute 성능도 향상한다고 한다.


제2세대 Eyefinity의 개요.DisplayPort와 HDMI가 최신 버젼에 대응해, 
한층 더 HD 6800 시리즈 레퍼런스 카드로는, miniDisplayPort×2기를 시작으로 하는 5개의 디스플레이 출력을 갖춘다




EyeSpeed의 개요.

EyeSpeed는,"비주얼 가속화 기능"으로서 GPU 컴퓨팅과 비디오 재생에 관한 기능을 정리한 호칭이다.
DirectCompute 11이나 OpenCL를 사용한 GPU 컴퓨팅과 Blu-ray 3D대응한 새로운 비디오 재생 지원 엔진「UVD3.0」(Unified Video Decoder 3.0)의 탑재에 의해, 
풍부한 멀티미디어 처리가 가능하게 된다.



 다음에, HD 6800의 아키텍쳐에 대해 소개하자.
 HD 6800의 설계 목표는, 「ATI Radeon HD 5800 시리즈의 성능을, 저렴하면서 저소비 전력으로 실현되는 것」이라고 여겨졌다.이것을 달성하기 위해선, 아키텍쳐의 최적화를 도모해, HD 5800 시리즈와 동등의 성능을 보다 작은 die size로 실현.die size의 축소에 의해, 가격 근처의 성능을 향상시키는 것과 동시에, 카드의 소비 전력을 150 W이하와 성능을 떨어뜨리지 않고 소비 전력을 억제하는 것에 성공했다고 한다(HD 5870은 188 W, 5850은 170 W).

「보다 염가로, 150 W이하의 소비 전력으로 Radeon HD 5800 시리즈의 퍼포먼스와 기능을 실현한다」라고 하는 Barts 코어의 설계 목표.
이것을 달성할 수 있도록 , 아키텍쳐의 최적화를 도모했다




 Deep Dive에서는, AMD로 그래픽스 제품 담당 CTO를 담당하는 Eric Demers씨가, Radeon HD 6800 시리즈의 아키텍쳐를 해설.「17억 트랜지스터를 집적해, die size는 255평방 밀리와 Radeon HD 5800 시리즈와 비교해 25%작은 반도체 사이즈면서, 최적화로 동등 이상의 퍼포먼스를 실현했다」라고 말했다.
 또, 테셀레이션 처리의 효율화등에 의해, 지오메트리스루풋도, Radeon HD 5850의 1초 당 7억 2500만 다각형으로부터, 9억 다각형에 향상하고 있다.


Radeon HD 6800에 있어서의, 아키텍쳐 개량의 개요.die size 근처의 성능 강화가 맨 먼저로 거론되고 있다




Radeon HD 5850으로 HD 6870의 사양 비교도

트랜지스터 카운트를 21.5억개에서 17억개에 줄이면서, die size도 334평방 mm로부터 255평방 mm로 축소했지만, 지오메트리스루풋 성능은 1초 당 7.25억 다각형에서 9억 다각형으로 향상 3DMark Vantage의 Extreme 스코아는 X7403로부터 X7730로 향상되었다.



내부 구조에서는 Dispatch Processor와 테셀레이타 강화가 핵심



Radeon HD 6870의 블록 다이어그램.
HD 5800 시리즈의 것과 비교하면, 「Ultra-Threaded Dispatch Processor」이 2기본으로 되어 있는 점이 큰 차이다


 Deep Dive에서는, HD 6800의 내부 구조에 대해서도 소개되었다.이번 공개된 블록 다이어그램으로부터 확인할 수 있는 특이점은, 「Ultra-Threaded Dispatch Processor」이 2기가 되어, SIMD Engine(SIMD 엔진) 클러스터(미니 GPU라고도 부를 수 있는 것.NVIDIA GPU에서는「Graphics Processing Cluster」에 상당한다) 마다 독립한 점일 것이다.이것은, 2기의 래스터라이저를 보다 효율 좋게 사용하기 위한 변경이라고 생각된다.


 덧붙여 여기서「SIMD Engine」(SIMD 엔진)라는 말이 나왔지만, 이 용어와 합하고, Radeon 시리즈의 아키텍쳐에 대해 확인해 두고 싶다.그렇다고 하는 것도, AMD의 공개한 블록 다이어그램이 올바르다고 한다면, Radeon HD 6800 시리즈의 기본적인 구성 자체는, ATI Radeon HD 5800 시리즈로 같다고 추측할 수 있기 때문이다.

 SIMD Engine이란, Radeon 시리즈에 , 통합형 쉐이더(Unified Shader) 유닛의 역할을 수행하는것이다.
 최소의 연산 유닛인「Stream Processor」(스트림 프로세서.이하 SP) 5개는, ATI Radeon HD 5800 시리즈에 대하고,"4 SP+1 빅 SP+1 분기 유닛"(※빅 SP란, 통상의 SP보다 복잡한 연산이 가능한 SP)이라고 하는 편성으로「Thread Processor」(스렛드프로세서)이 된다.
 일전에 근거해 SP수를 계산해 보면, HD 6870은 SIMD Engine를 14기탑재하기 위해(때문에), 「5(SP)×16(Thread Processor)×14(SIMD Engine)=1120 SP」가 된다.HD 6850은 SIMD Engine 12기로, 「5×16×12=960 SP」이다.

 각 SIMD Engine 근처의 texture 유닛은 4기로, HD 5800 시리즈와 다르지 않다.그 때문에, SIMD 엔진수의 적은 Radeon HD 6870에서는 56기로 HD 5800 시리즈에 비해 적게 되고 있어(HD 5870이 80기, HD 5850은 72기), 이 점으로 성능 저하의 가능성이 있다. 다만, SIMD Engine의 메모리 주위--4기의 64 bit 듀얼채널메모리인터페이스와 L2캐쉬 구성, 그리고 ROP수는, HD 5800 시리즈와 동등하다.

 그런데, HD 6800으로의 아키텍쳐의 변경점에 이야기를 되돌리자.Ultra-Threaded Dispatch Processor에, 테셀레이타가 제7세대로 진화한 점이다.스렛드관리와 버퍼링 기능(내장 버퍼 사이즈)을 강화해, HD 5870에 비해 최고 2배의 테셀레이션 성능을 실현한다고 한다.



AMD의 GPU의 테셀레이션유닛트의 변천.
제7세대의 테셀레이션유닛트에서는, 현행의 Radeon HD 5000 시리즈에 비해 최대로 2배의 테셀레이션 성능을 실현한다


HD6870와 HD 5870에 있어서의, 테셀레이션성능의 비교. 5~10구간의 성능이 특히 높다


 테셀레이션의 이야기가 나왔더니, 조금 사족이 되지만, Deep Dive로 Demers씨가「현행의 테셀레이션에 대응한 게임이나 benchmark test는, 래스터라이저에의 부하가 너무 높다」라고 지적하고 있었으므로, 소개해 두고 싶다.
 동씨에 의하면「현재의 테스트에서는, 테셀레이션에 의해 다각형을 너무 세세하게 분할해서.이 상태에서는, 래스터라이저의 처리 효율이 떨어지고, 같은 픽셀에 대해서 반복해 쉐이더패스 묘사하는「Overshading」상태가 되어, 처리에 다대한 헛됨이 발생한다. 게임이나 벤치마크의 설계에서는, 1 다각형 당 16 픽셀 이상으로 두는 것으로, 이미지 품질과 성능을 함께 높은 레벨로 유지할 수 있다」라고 한다.


「적절한 다각형 분할에 의한 테셀레이션 처리에 의해서, 처음 이미지 품질과 성능을 적절히 유지할 수 있다」(Demers씨)


HD 6800으로의 이미지 품질의 강화점.
Morphological Anti-Aliansing와 이등방성 필터링의 화질 개선이 이뤄졌다


 HD 6800 시리즈에서는, 이미지 품질의 향상에도 큰폭으로 메스를 넣을 수 있었다.
새로운 anti-aliasing 모드로서「Morphological Anti-Aliansing」을 서포트하는 것 외에 이등방성필터링 품질의 향상을 도모되고 있다.여기도 아키텍쳐상의 개량점의 토픽이다.

 Morphological Anti-Aliansing는, DirectCompute에 의한 포스트프로세싱 처리에 의해서, 보다 매끈한 AA처리를 고속으로 실시할 수 있도록 한다고 하는 기술이다.
 우선은 종래의 하드웨어 처리에 의한 AA결과를 묘화 해, DirectCompute로 보다 바람직한 엣지의 형상을 검출・연산해, 그 결과에 맞추어 엣지의 톤을 조정한다고 하는, 규모의 큰 테크닉이다.이 기능은, DirectCompute를 이용하면 실장할 수 있기 위해, 기존의 DirectX 9나 10. x세대의 어플리케이션에 대해서도 적용할 수 있다고 한다.


Morphological Anti-Aliasing의 해설.
DirectCompute에 의한 포스트프로세싱에 의해서 고품질인 anti-aliasing 처리를 실현한다






Morphological Anti-Aliasing의 처리 순서의 개념.
하드웨어 처리된 anti-aliasing 결과에 대해서, 포스트프로세싱으로 엣지를 검출.보다 바람직한 엣지 형상을 계산해, 거기에 맞추어 엣지의 톤을 조정한다.

 또, 이등방성 필터링도 알고리즘의 개량으로의 품질을 향상.
복잡한 texture도 보다 충실히 재현할 수 있게 되는 것 외에 texture 필터링의 품질을 Catalyst Control Center로부터 조정할 수 있도록 하는 등, 
유저 인터페이스의 개량도 베풀어진다고 한다.



HD 6800 시리즈로 아키텍쳐의 정리



Barts의 수수께끼 과연 SIMD 엔진의 구조는?

 그런데, 여기까지 소개해 온 HD 6800의 아키텍쳐이지만, 필자가 각방면으로 취재했는데, 실은 내부 구조에 대한 수수께끼가 나와 있다.

 필자가 복수의 AMD 파트너 관계자에게 취재했는데, 「 정보가 진실하다면, Barts 코어에는 16기의 SIMD 엔진이 탑재되고 있는데 수율을 문제로 이중에 2기 또는 4기를 막아둔것이다.」라고 하는 지적을 얻을 수 있었던 것이다.
 Barts 코어가 Radeon HD 6870의 스펙 그대로의 구성이면, HD 5800으로부터의 아키텍쳐 확장으로 25%의 반도체 쉬링크를 실현할 수 있어도 이상하지 않다.그러나, 사용되지 않은 SIMD 엔진이 존재하는 것이 되면, 다이사이즈가 너무 작은게 아닐까?

 또, Skynner씨와 Demers씨도 신경이 쓰이는 발언을 남기고 있다.두사람은 함께 HD 6800을「HPC 용도를 타겟으로 한 코어가 아니고, 게이머나 열광자 전용으로 아키텍쳐를 최적화한 제품이다」(Skynner씨) 로 자리매김하고 있어 Demers씨는 게다가「Barts로 배정도 연산은 서포트하지 않지만, Cayman에서는 보다 뛰어난 배정도 연산 기능을 실현할 것이다」라고 분명히 하는 것과 동시에, Barts에서는 SIMD Engine의 구성이 재검토되어 Cypress(=ATI Radeon HD 5800 시리즈)로 최대 5 명령 발효(이었)였던 것이, Barts로 최대 4 명령 발효가 된 것도 시사되고 있다.이것에 의해, Radeon HD 6800 시리즈는, 보다 고클락으로 동작하기 쉬운 구조가 되어, 코어수근처의 퍼포먼스(단정도 연산 성능)를 향상시킬 수 있던 것 같다.

 유감스럽지만, 이번 기술 설명회에서, 이것들 SIMD 유닛의 자세한 것은 밝혀지지 않았기 때문에, ATI Radeon HD 2000 시리즈에서 4세대에 걸쳐서 계속 되어 온, 4기의 32 bit 부동 소수점 연산 유닛에, 보다 복잡한 처리가 가능한"스페셜"인 32 bit 부동 소수점 유닛을 더한, 5 SP에 의한 SIMD 유닛이라고 하는 구조 그 자체로 변경이 더해졌는지 어떠했는지는 확인할 수 없었다.



Name __

Password __

Link (Your Website)

Comment

SECRET | 비밀글로 남기기

free counters