와트당 성능을 2배로 높인 케플러 GeForce GTX 680와트당 성능을 2배로 높인 케플러 GeForce GTX 680

Posted at 2012. 3. 23. 13:35 | Posted in IT/Hardware/Graphics


엔비디아는, 지금까지  케플러「Kepler」의 코드네임으로 불려 온 신아키텍쳐 채용의 GPU 「GeForce 600」시리즈를 발표했다.

 기본적인 아키텍쳐는 전생대의 「Fermi」를 답습하면서도, 철저하게 효율을 재검토해 재설계를 행했다. 이것에 의해, 와트 근처의 성능은 GeForce 500 시리즈의 2배에 향상했다고 하고 있다.

 효율 개선의 수법으로서 제어 논리의 수를 반감시켰다.500 시리즈에서는, 32기의 SP를 1SM(Streaming Processor)이라고 하는 단위로 정리해 1SM에 대해 1기의 제어 논리를 할당할 수 있고 있었다. GTX 580에서는 16SM, 즉 16기의 제어 논리가 탑재되고 있었지만, GTX 680에서는 8기본으로 반감시키는 것으로, 소비 전력을 억제했다. 감소한 만큼에 대해서는, 스케줄링 처리를 소프트웨어(CPU)에 인수시키는 것으로, 성능의 저하를 막고 있다.
또, 제어 논리와 함께, 지오메트리엔진의 수도 반감하고 있지만, 클럭을 2배로 해, 그 외의 개선을 베푼 PolyMorph 2.0으로 하는 것으로, 전생대보다 성능을 2배로 끌어올리고 있다 .덧붙여서, 600 시리즈에서는, 192SP를 한덩어리로 한 구성이 되어 있어, 이것을 SMX라고 호칭하고 있다.

 또, 프로세스 룰이 40nm에서 28nm로 미세화한 것의 기여도 크고, GTX 680의 SP클럭은, GTX 580의 1,544 MHz에서 1,006 MHz로, 70%정도로 내리고 있지만, SP수는 GTX 580의 512기본으로 대해, GTX 680은 1,536 SP와 3배가 되고 있어 클럭의 저하를 SP수의 증가로 보충해, 절대 성능도 향상시키고 있다.그 한편, TDP는 GTX 580의 244 W로부터, 195 W로 크게 삭감해, die size도 520평방 mm로부터 294평방 mm로 하는 등, 칩의 규모는 종래의 하이 미들 클래스에 머무르고 있다. 덧붙여 GTX 580에서는, SP클럭(쉐이더 클럭)이 그래픽스 클럭의 2배가 되고 있었지만, GTX 680에서는, 비동기구조는 없어져, 동기화 즉, 쉐이더클럭도같은 클럭으로 동작한다.

 
GeForce GTX 580에서는 32SP와 1제어 논리로 1SM을 구성



 
 GeForce GTX 680에서는 192 코어와 1 제어 논리로 1 SMX를 구성





 8SMX로 1,536 SP를 탑재한다


 
SM의 블록 다이어그램


 GPU 전체의 블록 다이어그램


 다이 사진


 
 메모리에 대해서는, 인터페이스가 384bit에서 256bit가 되었지만, 클럭이 4GHz에서 6GHz로 상승했기 때문에, 메모리대역폭은 192 GB/sec과 같은 성능이 되어 있다.다만, 캐쉬는 배속화 되고 있다.

 이것들에 의해, 이론 성능치는 GTX 580의 1,581 GFLOPS에서 3,090 GFLOPS가 되었다. 또, EPIC GAMES가 개발한 「SAMARITAN」라고 하는 데모에 있고, GTX 580에서는 3장가 필요했던 것이, GTX 680에서는 1장로 동작 당하게 되었다고 한다.

 다만 이것은, 이른바 GPU 성능이 동조건으로 3배가 되었다는 것이 아니고, 안티 얼라이징에 관련되는 부분이 크다. 2011년에 GTX 580으로 데모를 행했을 때는 MSAA(Multi Sample Anti Aliasing)를 이용했지만, GTX 680에서는, MSAA보다 6배 비교적 고가 빠른 처리가 가능한 FXAA(Fast Approximate Anti Aliasing)를 이용하고 있다.일반적인 게임에 있어서의 성능은, Radeon HD 7970에 대해서 1~4할 정도 높다고 하고 있다.


SAMARITAN의 데모에 GTX 580이 3매 필요했 던 것, GTX 680은 1장으로 동작 당한다 



Radeon HD 7970과의 성능 비교 
 


Radeon HD 7970과의 성능 비교 



Radeon HD 7970과의 와트당 성능의 비교

 
 기능면에서는, 요즈음의 CPU와 같은 부스트 기능을 도입했다.소비 전력, GPU의 온도/부하, 메모리 부하등을 감시해, TDP에 여유가 있는 경우는, GPU의 클럭을 리얼타임에 최대한 끌어올린다.구체적으로는, GTX 680의 베이스 클럭은 1,006 MHz이지만, Boost 클락은 1,058 MHz가 되어 있다. 다만 이것은, 1,058 MHz로 한계점 도달이 아니고, 부하 나름으로는 1,100 MHz 정도까지 오른다. 또, 오버 클락 모델도 준비된다.

소비 전력이 낮은 경우, TDP의 범위에서 GPU 클락을 끌어올린다 오버 클락 모델이라면 최대 1,200 MHz나 가능

 
 에일리어징 제거에 대해서는, FXAA 뿐만이 아니라, 새롭게 독자 개발한 TXAA에도 대응한다.TXAA의 기술 자세한 것은 공개되어 있지 않지만, TXAA 1이라고 하는 모드에서는, 8 x MSAA 이상의 화질을 2 x MSAA 정도의 부하로 실현될 수 있다고 한다.게다가 전후의 프레임을 참조하는 TXAA 2에서는, 8~16 x MSAA 상당한 화질을 4 x MASS의 부하로 실현 가능하게 하고 있다.TXAA에 대해서는, 벌써 대기업 게임 디벨로퍼가 대응을 표명하고 있다.


MSAA와 TXAA의 부하와 화질의 관계 



AA없음 



8x MSAA 



TXAA
 동적 VSync라고 하는 기능도 실장되었다. 종래, VSync를 유효하게 하면, 화면을 횡방향에 빵 시켰을 때 발생하는, 화면상하에서의 묘화의 차이가 없어지지만, frame rate이 60 fps를 유지할 수 없으면 30 fps, 15 fps로 단번에 떨어진다고 하는 문제가 있었다. 이것에 대해서, 동적 VSync를 이용하면, 60 fps를 자른 순간에 VSync가 오프가 되기 위해, frame rate의 침체가 완만하게 되어, 60 fps로 돌아오면, VSync도 자동적으로 온으로 돌아온다.
 


종래의 VSync 온 상태에서는, frame rate이 60fps를 자르면, 30 fps까지 단번에 떨어지고 있었다 

 동적 VSync에서는, 60 fps를 자르면 VSync를 일시적으로 자르는 것으로, 완만하게 frame rate이 내린다
 
 
 GTX 680의 주된 사양은 아래 표대로.두께는 2슬롯이지만, 팬의 소재나, 히트 파이프, 히트 싱크의 형상을 개량하는 것으로, 소음 레벨은 46 dBA로 동사제 고급 지향 GPU라고 해도 와도 저소음이 되어 있다고 한다. 전원은 6 핀×2.인터페이스는, 새롭게 PCI Express 3.0에 대응했다. 미국에서의 발매 가격은 499 달러.




디스플레이 인터페이스는 듀얼 링크 DVI×2, HDMI 1.4 a, DisplayPort 1.2의 4계통. 지금까지 3화면 입체시의 「3D Vision Surround」에는 2장의 비디오 카드가 필요했지만, DVI×2로 HDMI(어댑터로 DVI에 변환)의 3개를 사용하고, 1장을로 3화면 입체시가 가능하게 되었다. 게다가 이 상태로부터 DisplayPort 경유의 2D표시도 가능하고, 3 화면에서 입체시 하면서, 이제(벌써) 1 화면에서 게임의 정보를 얻거나 채팅하거나라고 하는 사용법이 가능하게 되었다. 또, HDMI 경유로 3,840×2,160해상도의 4 K출력에도 대응한다.


3D Vision Surround+1 디스플레이가 가능 


4K출력에도 대응


GeForce 600 M시리즈 노트북PC용 케플러모델이 준비되지만 일부는 기존의 페르미코어의 리네이밍이 섞여있다.


페르미계열(리네이밍)                      케플러 계열  
GeForce GTX 675M                        GeForce GTX 660M 
GeForce GTX 670M                        GeForce GT 650M
GeForce GT 640M LE                     GeForce GT 640M 
GeForce GT 635M                          GeForce GT 640M LE
GeForce GT 630M 
GeForce GT 620M 

덧붙혀 GeForce GT 640M LE 모델은 혼용되어 제품이 출시되니 구입시 소비자의 주의가 요구된다.
 

  GeForce GTX 675M GeForce GTX 670M GeForce GTX 660M
GPU and Process 40nm GF114 40nm GF114 28nm GK107
CUDA Cores 384 336 Up to 384
GPU Clock 620MHz 598MHz 835MHz
Shader Clock 1240MHz 1196MHz -
Memory Eff. Clock 3GHz 3GHz 4GHz
Memory Bus 256-bit 192-bit 128-bit
Memory Bandwidth 96GB/s 72GB/s 64GB/s
Memory Up to 2GB GDDR5 Up to 3GB GDDR5 Up to 2GB GDDR5


  GeForce GT 650M GeForce GT 640M GeForce GT 640M LE
GPU and Process 28nm GK107 28nm GK107 28nm GK107 40nm GF108
CUDA Cores Up to 384 Up to 384 Up to 384 96
GPU Clock 850MHz 625MHz 500MHz 762MHz
Shader Clock - - - 1524MHz
Memory Bus 128-bit 128-bit 128-bit 128-bit
Memory Bandwidth Up to 64GB/s Up to 64GB/s Up to 28.8GB/s Up to 50.2GB/s
Memory Up to 2GB DDR3
or GDDR5
Up to 2GB DDR3
or GDDR5
Up to 2GB DDR3 Up to 2GB DDR3
or GDDR5


  GeForce GT 635M GeForce GT 630M GeForce GT 620M
GPU and Process 40nm GF116 28nm GF117/40nm GF108 28nm GF117
CUDA Cores 96/144 96 96
GPU Clock 675MHz 800MHz 625MHz
Shader Clock 1350MHz 1600MHz 1250MHz
Memory Bus 192-bit 128-bit 128-bit
Memory Up to 2GB DDR3/GDDR5 Up to 2GB DDR3 Up to 1GB DDR3

Name __

Password __

Link (Your Website)

Comment

SECRET | 비밀글로 남기기

free counters