32nm 공정 취소로 바뀐 AMD의 GPU 전략32nm 공정 취소로 바뀐 AMD의 GPU 전략

Posted at 2010. 11. 19. 21:19 | Posted in IT/Hardware/Graphics

●다이의 대형화로 Radeon의 제품 구성이 바뀐다 
 
AMD 는, 11월에 투입하는 신제품 GPU「Radeon HD 6900(Cayman:케이만)」로부터, GPU의 내부 아키텍쳐를 바꾼다. GPU 아키텍쳐가 바뀌는 것은, Radeon HD 2900(R600) 이래로 처음이다다. 같은「Northern Islands(노던아일랜드)」패밀리라도, 메인스트림 GPU의 Radeon HD 6800(Barts)은, 종래 아키텍쳐이므로, AMD GPU는 상위와 하위에서 아키텍쳐가 다르게 된다.

  최상위제품만 신아키텍쳐로 바뀌는 것은, 이전의 GPU에서는 일반적인 제품 전략이었다.그러나, AMD가 이 전략을 선택하는 점에는 약간의 의문점이 있다. 왜냐하면, AMD는 Radeon HD 3800(RV670) 이후는, 신아키텍쳐를 위에서 아래까지 단기간으로 투입하는 신전략으로 전환했다고 설명하고 있었기 때문이다. 실제, 과거 3세대는, 같은 패밀리로 최상위GPU만이 다른 아키텍쳐인 케이스는 없었다. 아키텍쳐의 균일성이, 같은 GPU 패밀리로 유지되고 있었다.


  실은, 이 전략 변경에는 명백한 이유가 있다.그것은, 과거 3세대, AMD가 GPU의 핵인 프로세서의 구조 자체를 변경하지 않았던 것이다. 세대가 바뀌어도 위기인 프로세서 코어의 아키텍쳐는 거의 동일하게 유지하고 있기 때문에, AMD는 GPU의 세대 교대를 부드럽게 진행할 수 있었다.같은 기간에, NVIDIA는 프로세서 코어의 아키텍쳐의 완전 쇄신(GF100)을 1회, 부분 개량을 2회(GT200/GF104) 행하고 있다.AMD의 패밀리 전개 전략의 배경에는, 아키텍쳐를 완전히 바꾸지않는 전략이었다.

  그러나, Cayman에서는, 이 전략을 바꾸어 아키텍쳐를 변경한다. Cayman는, AMD가 Radeon HD 2900 이래, 처음으로 프로세서 코어의 내부 아키텍쳐를 일정 이상의 규모로 변경하는 GPU이다.그 위험부담 때문에, AMD는 GPU 패밀리 전개의 전략도 바꾸고, 최상위제품만 다른 아키텍쳐를 바꿨다.

  또, AMD는 GPU die size의 전략도 변경해야 하게 되었다. Radeon HD 3800이후, AMD는 NVIDIA와 같은 거대 다이의 GPU를 만드는 것을 그만두었다. 최대 사이즈의 다이는 퍼포먼스 GPU 클래스에 세우고, 하이엔드GPU는 듀얼칩 구성으로 하는 전략을 취했다. 그러나, Radeon HD 5870(Cypress) 이상의 die size가 된다고 추정되는 Cayman에서는, 이 전략도 수정된다.

 AMD 에 의하면, Northern Islands는 원래 32nm프로세스로 제조될 예정이었다고 한다. 현행의 40nm프로세스로부터 32nm에 쉬링크 하면, 아키텍쳐를 변경하고 트랜지스터 카운트가 증가했다고 해도, die size의 비대화는 억제된다.그러나, TSMC가 GPU 전용의 범용 프로세스로 32nm를 캔슬해, 40nm에서 2년에 28nm로 이행 할 계획으로 전환했기 때문에, 전략이 크게 바뀌었다. AMD는 Cayman에서는, 다이를 크게 할 수 밖에 없다.

 Cayman 의 die size는 어느 정도 아키텍쳐에 의해서 바뀌지만, Radeon HD 2900이 400평방 mm이었던 일을 생각하면, 400평방 mm클래스에서 만나도 이상하지는 않다. 다이가 커지면, 퍼포먼스도 오르기 때문에, Cayman는 하이엔드 GPU의 위치설정이다. Cayman의 제품번호는 Radeon HD 6900 접수대에서, 900이라고 하는 세 자리수 숫자는 하이엔드 GPU의 것이다.즉, Cayman는 AMD에 있어서 오래간만의 싱글다이로의 하이엔드GPU가 된다.Cayman의 듀얼 다이판인「Antilles(안틸레스)」은, 한층 더 높은는 위치설정이 되어, 「Radeon HD 6990」(이)라고 한층 더 오른 제품번호를 가진다.


● 소형화와 고속화를 도모한 Radeon HD 6800의 설계 
  전의 기사로 설명한 대로, 현재 알고 있는 힌트로부터에서도, Cayman에서는 큰 개혁이 행해지는 것은 확실하다.그러나, 이러한 아키텍쳐상에서 보이는 개량 뿐만이 아니라, AMD는 보다 보이기 어려운 부분에서도 GPU의 개량을 계속해 행하고 있다.

  예를 들면, AMD는 지난 주 발표된 Radeon HD 6800의 설계에 대하고, 다이를 작고 효율적 한편 고클락으로 하기 위해서, 설계상에서 개량을 더했다고 말한다. AMD의 Eric Demers씨(GPG Chief Technology Officer, AMD)는, 다음과 같이 설명한다.

"6800에서는 SIMD (core)의 수를 감소했을뿐만 아니라, 디자인에 여러 가지 변화도 행하고 그 결과 아키텍처는 더 효율적입니다 트랜지스터 수를 더 줄일 수 있었다. 칩도 작아졌다. 예를 들면, I/O 블록을 최적화하여 이전보다 크기를 작게 한 지금까지의 제품과 동일한 공정 기술이지만, 그대로 동일한 디자인을 사용하고 있지 않는 대부분의 블록을 다시 디자인했다"

  재설계의 성과로서 가장 중요한 요소는, 고클럭화일 것이다.고클럭화는, 프로세서 뿐만이 아니라, ROP(Rendering Output Pipeline), 래스터라이저라고 하는 고정 기능도 포함해 모든 유닛에 적용하고 있다. 이것들 고정 기능 블록은, 지금까지 고속화의 보틀넥이 되기 쉬웠다. 각 블록은, 속도가 오르지 않았던 것도 있지만, 최고 2배까지 고속화된 것도 있다. 전체로 보면,20%만큼 고속화했다」.

 Radeon HD 6800은, 설계적으로는 종래의 Evergreen의 블록을 가져다 쓴건 아니다. 대부분의 블록을 다시 새롭게 설계하는 것으로 , 다이의 축소와 클럭향상을 도모하고 있다. Demers씨가 지적한듯이, I/O블록은 미세화로 쉬링크 하기 어렵기 때문에, 다이 면적을 먹기 쉽상이다. 거기를 작게 하는 것은, 칩의 소형화에 효과가 있다.실제, Radeon HD 6800은, Radeon HD 5870과 비교하면, 프로세서수야말로 70%로 줄였지만, 다른 블록은 거의 변하지 않는 구성인데, 다이는 약76%(334평방 mm→255평방 mm)에 축소하고 있다. I/O부분을 쉬링크 할 수 없으면, 이만큼의 축소는 있을 수 없다. 이러한 설계는, Cayman에서도 공통이라고 추정된다.

  또, 임계경로를 세세하게 나누면, 고정 기능 블록도 어느 정도 고클럭화를 도모할 수 있다. 다만, AMD는 GPU 전체로, 여전히 스탠다드 셀 베이스의 설계를 행하고 있다고 보여진다. 그러나 NVIDIA는, GPU의 프로세서 코어의 부분을 스탠다드 셀이 아니고, 커스텀 설계로 하는 것으로보다 고속화를 이루어 있다. 그러나, NVIDIA가 40nm프로세스로 고생한 원인의 하나는, 커스텀 설계에 있었다고 보여지기 때문에, AMD와 NVIDIA의 어느 쪽의 선택이 좋은가를 판단하는 것은 어렵다.


●3 단계로 제어하는 Radeon HD 6800의 파워플레이
 Radeon HD 6800은, 전력 절약기능에서도 충실한다. 전력 절약은, 칩의 각 블록에 공급하는 클럭을 정지하는 것으로, 액티브 전류를 줄여서 실현되고 있다.AMD의 Eric Demers씨는, 3층의 클록게이팅 기구를 갖추고 있다고 설명한다.

  「6800 칩은 3 레벨의 클록게이팅을 행하고 있다.가장 로레벨인 것이, 각 유닛 블록마다 행하는 자동적인 셧다운. 이것이, 로우클럭게이팅이다. 그, 상위에 클럭트리마다 클럭을 정지시키는 미디움클럭게이팅이 있다. 최상위에서는, 팁 단위로 클럭을 제어한다.

  로컬로부터 설명하자. 6800의 SIMD 코어는, 오토매틱의 클럭게이팅 기구를 갖추고 있다.만약, 어느 SIMD 코어가, 아이들 상태로 일하지 않으면, 그 코어는 자동적으로 차단하고 클럭을 멈춘다.예를 들면, 부하의 가벼운 처리로, SIMD 코어가 1개 밖에 움직이지 않은 듯한 경우는, 다른 SIMD 코어를 모두 자동적으로 차단해, 전력이 현저하게 줄어든다.

  당사의 GPU에서는 피크TDP와 아이들시의 소비 전력이 공개되고 있다.그러나, 실제로는 그 사이에는, SIMD의 차단에 의해, 얼마든지의 전력 스테이트가 있다.6800에서는, 블록 단위의 파워게이팅은 할 수 없다. 그러나, 저소비 전력 스테이트로 이행하는 것만으로, 전력을 꽤 억제할 수 있다. 칩이 아이들 상태때의 리크 전류(Leakage)는 8~12 W에 지나지 않는다(=리크 전류는 적다).그러니까, SIMD 코어를 1개 클록게이팅하면, 그 블록의 전력은 매우 작게 누를 수 있다.

  그러나, SIMD 코어의 클럭을 멈추었을 경우도, 상위의 클럭트리에는 클럭이 공급되고 있다.그것을 포함해 정지시키는 것이 미디엄클록게이팅이다.이것은, GPU에 탑재된 전력 관리 유닛이 제어한다.전력 관리 유닛의 실태는 작은 마이크로 콘트롤러(MCU)로, 전력 상태를 항상 감시하고 있다.그 유닛이, 쉐이더어레이가 별로 동작하는건 아니라고 판단하면, 그러한 유닛에 관련하는 모든 클럭트리를 정지시킨다. 클럭트리는 10~20% 것 전력을 먹고 있으므로, 트리 단위로 셧다운 하면, 보다 전력을 삭감할 수 있다.

 마지막으로, 칩의 모든 클럭을 정지시키든가, 혹은 완전하게 칩을 셧다운 한다. 이 경우 스테이트를 메모리에 옮길 필요가 있다.이 3개의 오퍼레이팅 모드로, 전력 절약 제어를 행하고 있다」.

 Radeon HD 6800은, 섬세하고 계층적인 클럭게이팅에 의해서, 실시간으로 전력을 제어하고 있는 것을 알 수 있다.이러한 제어는, 보다 진행된 형태로 Cayman에서도 실장되고 있다고 추정된다.다만, NVIDIA의 Fermi계 GPU는, AMD의 SIMD 코어에 해당되는「SM(Streaming Multiprocessor)」단위로 파워게이팅을 행할 수 있다.클럭게이팅에서는 리크 전류는 컷 할 수 없지만, 전력 공급 자체를 정지하는 파워게이팅에서는 리크 전류도 완전하게 컷 할 수 있다.그것과 비교하면 6800은, 약간 얌전한 어프로치다. Cayman더 유닛 단위의 파워게이팅을 실장할지 기대가 된다.
  1. 비밀댓글입니다

Name __

Password __

Link (Your Website)

Comment

SECRET | 비밀글로 남기기

free counters