본문 바로가기
IT/Hardware/Graphics

내년에 등장하는 차세대 메모리 HBM2

by 에비뉴엘 2015. 9. 4.
반응형

GPU 메모리는 내년 (2016 년)의 HBM2에서 1TB / sec로

 


GPU의 메모리 대역이 급속도로 오르고있다. 

작년 (2014년)의 하이엔드 GPU는 300GB/sec의 대역이었던 것이 올해 (2015년)는 "Radeon R9 FURY (Fiji)"에서 메모리 대역폭은 512GB/sec에 올라 내년 (2016 년)에는 AMD와 NVIDIA의 모두 1TB/sec의 메모리 대역에 돌입 할 전망이다. 2017년 이후에도 메모리 대역의 확장이 예상되고 있으며, GPU 메모리 대역은 급증한다.



▲HBM1과 HBM2의 차이



 메모리 대역폭이 확장되는 가장 큰 이유는 물론 하이엔드 GPU의 메모리가 "HBM (High Bandwidth Memory) '로 전환하기 때문이다. 무엇보다, 300GB/sec 대의 메모리 대역의 GDDR5와 비교하면 현재 Fiji의 HBM1의 512GB/sec는 그만큼 거대한 점프가 아니다. 그러나 내년 HBM2의 1TB/sec되면, 1년에 2배이므로 격차는 크다.



▲메모리 버스폭 로드맵 


 HBM1 규격과 HBM2 규격은 각각 시장에 나오는시기가 불과 1년 조금 인접해있는 것이 격차를 낳고있다. 또한 HBM1 대해 HBM2에서는 전송 속도가 2배가 될뿐만 아니라 다양한 기능과 ECC 버전 추가 등이 더해져 풍부한 제조업체도 여러군데가 된다. JEDEC에서 HBM의 표준화를 주도한 AMD의 Joe Macri 씨 (CVP and Product CTO, AMD)는 그 경위를 다음과 같이 설명한다.


 "HBM1과 HBM2의 규격화는 병행하여 진행되었다. 그래서 HBM2도 이렇게 빨리 규격화 된 것은 첫 번째 HBM1이 신속하게 시장에 진출하기 위해 한정된 기술을 채용했다. 이에 대해 , HBM1을 기반으로 규격화된 HBM2은 최신 DRAM 기술을 기반으로하고있다. "


 결과적으로 HBM1 투입되고 나서 2년 이내에 다음 HBM2가 몰려온다. 

HBM2의 이점이 크기 때문에 HBM계 메모리의 채용은 HBM2에서 제조하는 회사가 많다고 한다. 예를 들어, NVIDIA는 내년 HBM2 타이밍에서 HBM계 메모리를 채용한다.



▲HBM2을 채용하는 엔비디아의 파스칼

l

 NVIDIA의 Jen-Hsun Huang (젠슨 황) 씨 (Co-founder, President and CEO)는 HBM에 대해 6 월 COMPUTEX시에 다음과 같이 말하고있다.


 "나는 차세대 GPU 'Pascal (파스칼)"에 광대역 메모리를 채용하는 것을 밝혔다. 우리는 가까운 장래에 (HBM형) 스택 3D 메모리를 사용할 수 있다고 생각하고있다. 그러나 현재 비용은 여전히​​ 높고 공급도 매우 제한되어있다. 내 의견으로는 이런 종류의 메모리는 아직 사용하려면 조금은 너무 일찍보고있다. 하지만 곧 우리가 사용해야 할 때가 올 것이다. 그 때가되면 스택 메모리의 이점을 누릴 수 있다고 생각하고있다. "


 HBM의 높은 비용 요소의 하나는 현재의 HBM에 필수가되고있다 TSV 접속기. TSV 인터 저는 실리콘 기반에서 TSV 홀을 뚫어 연결 한 트랜지스터를 형성하지 않는 칩과 같은 것이다. 이 접속기에 GPU와 HBM을 배치하여 배선하고 있기 때문에 비용이 든다. 또한 HBM의 규격으로, 결국 최하층에 로직 칩이 필요할 수도 비용 요인이다.








 그러나 TSV 인터 포저는 보급이 진행되면 비용이 감소한다고 Macri 씨는 설명한다. 따라서 비용 절감은 보급을 기다리고 있다는 측면도있다. 엔비디아 황씨가 말하는 비용의 타​​이밍은 TSV 인터 포저의 비용도 포함되어있는 것으로 보인다. 이것은 보급이 시작되면 비용도 낮아 더욱 사용하기 쉬워진다는 긍정적 나선이 일을 의미하고있다. 무엇보다, 그래도 TSV 인터 포저는 비용 요인이기 때문에 TSV 인터 포저를 사용하지 HBM의 솔루션도 연구되고는있다.



HBM1과 HBM2에서 다른 규격화 과정

 

AMD와 NVIDIA의 HBM 대한 시간 차이는 이러한 비용과 양산 볼륨 등의 문제 외에, 규격화 과정도 관계하고있다. HBM은 AMD가 개발 당초부터 깊이 관련되어 있었다 규격이기 때문이다. 이것은 AMD와 JEDEC의 것이 관계가 깊은 것이 영향을주고있다. Macri 씨는 다음과 같이 말한다.


 "HBM1과 HBM2 모두 JEDEC 표준이다. 그러나 HBM1는 AMD와 SK hynix의 2개 표준에 가까웠다. 반면 HBM2은"전체 JEDEC 표준 "에서 더 많은 기업의 지원을 얻고있다. 따라서 HBM2이 더 널리 사용되게 될 것이다.


 이것은 HBM 특유의 것이 아니라, JEDEC에서 표준화의 전형적인 길이다. 새로운 규격은 먼저 소수의 파트너에 의한 내부 작업 시작하고 그 사양이 JEDEC 표준으로 찬동을 얻고 더 많은 기업의 참여를 얻는다. 후반 단계에서 NVIDIA 등의 기업도 참가하고 온다. 모두가 케이크의 몫을 얻으려고 온거야 (웃음). 이것이 "JEDEC 과정"이다. "


 AMD에 따르면, HBM의 규격화는 원래 AMD와 SK하이닉스의 공동 작업으로 시작했고 그 사양이 그대로 HBM1 되었다. 그 후, 표준의 책정에 많은 기업이 참여하고 확장 된 것이 HBM2에서 이곳은 SK하이닉스뿐만 아니라 삼성전자 등도 생산한다. 이러한 경위를 거쳐 때문에 HBM1는 처음부터 참여던 AMD 아니면 인터페이스 설계 등의 시간을 생각하면 어렵다. 이런 배경을 감안할 때 현 단계에서 AMD만 HBM을 채용 할 수 있었던 이유도 명확해진다.


 반대로 말하면, AMD는 규격 책정을 추진해 채용하지 않을 수없는 사정이있을 것 같다. HBM1는 말하자면 HBM 규격의 조주 단계로 내년 HBM2에서 꽃 피는 것으로 예상된다. HBM계 메모리의 비용이 낮아 보급 여부를 알아보기엔 내년 이후라는 것이된다.



▲삼성전자는 HBM2을 더 넓은 시장을 타겟으로 한다.


메모리 용량이 4배 ~ 8배로 증가하는 HBM2

 

HBM2 세대의 장점 중 하나는 메모리 용량도있다. HBM1에서 제품화되고있는 것은 SK하이닉스것으로, 1개의 다이는 2G-bit 용량. 이것을 4Hi (4스택)에서 4개의 다이를 거듭하는 것으로, 1GB (8G-bit) 단위로하고있다. 따라서 라데온 피지처럼 4스택을 사용해도 메모리 용량은 4GB 밖에되지 않는다.



▲HBM 메모리 스택 구성


 반면 HBM2는 8G-bit 다이가 등장한다. 따라서 4Hi 스택의 메모리 용량은 4GB된다. 또한 HBM2에서는 최대 8개의 다이를 거듭 8Hi 스택도 규격화되어​​있다. 

따라서 HBM2의 8G-bit 다이 8Hi라면 1스택이 최대 8GB에 이른다.


 덧붙여서, HBM 규격은 HBM2도 4스택이 기본으로되어 있으며, 8스택의 경우는 2순위 구성된다. 즉, 4Hi도 8Hi에도 DRAM 칩 자체는 변하지 않는다. 따라서 실제로하려고 생각하면 HBM1도 8Hi 할 수있다. 실제로 AMD의 Fiji 예상에서는 2 개의 4Hi 패키지를 조합 한 의사적인 8Hi 구성한다는 보도도 있었다. Macri 씨는 다음과 같이 말한다.


 "HBM1이라도하려고 생각하면 8스택은 가능하지만, 나는 어떤 기업도 HBM2의 8스택을 기다릴 것이다. 


 TSV에 의한 스택의 적층 수는 그것을 제한하는 기본적인 요인은 아니다. 원리적으로는 얼마든지 스택있다. 물론 막힌 다이가 모두 작동해야하기 때문에 제조 비용은 문제가되지만, 비용이 허락하면 가능하다.


 따라서 8스택의 끝은 16스택도 기술적으로 가능하다. 그것은 아마 HBM2 다음 HBM3 세대가되자 있겠지만 가능성은있다. "


 16Hi라면 1 스택의 메모리 용량은 16GB된다. 메모리를 원하는 HPC (High Performance Computing) 등의 솔루션은 미래 환영 될 가능성은있다. 무엇보다, 스택해야 할 것은 대당 용량이 제한되는 경우이다.


 "DRAM 칩 자체의 비트 밀도도 올라 간다. 따라서 다이를 적층하지 않아도 HBM 모듈의 용량은 오른다. 그래서 적층 수는 DRAM의 비트 밀도의 상승과의 균형이 될 것이다. 물론 DRAM 비트 밀도도 과제가 많아 향후 다양한 연구가 필요하다 "(Macri 씨).


 DRAM의 비트 밀도를 높이는 비용과 적층하는 비용. 그 어느 쪽이 비싸게 하느냐에 따라 상황이 달라진다.



▲SK하이닉스의 HBM 로드맵


두 개의 서로 다른 계층의 ECC 기술

 

NVIDIA가 HBM1을 채용하지 않았던 이유 중 하나는 첫 번째 HBM1 제품에는 ECC가 부족한 경우도있다. HPC 및 서버에서 ECC가 필요로되는데, 첫 번째 HBM은 제공하지 못한다. 따라서 NVIDIA는 HBM에서 ECC를 적극적으로 추진했다.




▲1세대 HBM1 다이

 

HBM2 세대에서는 옵션으로 ECC 기능이 제공된다. 무엇보다, JEDEC도 원래 HBM에 ECC가 필요하다는 인식은 있었지만, HBM1는 시장 출시를 서둘렀다 위해 Non-ECC 버전 밖에 준비하지 않았다는 경위가 있다고 Macri 씨는 말한다.


 "우리는 첫 번째 세대의 HBM은 ECC는 구현하지 않았다. 시장 출시를 서두르고 때문이다.하지만 2세대 HBM2에는 ECC가 참가한다.


 HBM에 ECC의 구현은 매우 표준적인 형태가된다. 일정한 입도마다 ECC 코드를 생성한다. 표준 구현이므로 ECC 버전의 HBM은 일반 HBM보다 각 채널의 인터페이스가보다 널리된다. 전통적인 ECC 버전 DIMM과 같다.


 HBM2 우리가 더한 ECC가 전통적인 구현 인은 HPC (High Performance Computing) 및 서버 응용 프로그램에서 ECC 요구를 타겟으로하고 있기 때문이다. 이러한 시장은 지금까지도 전통적인 ECC를 사용하여왔다. ECC는 HBM2 규격의 주문형 옵션이며, 소비자는 비 ECC 버전을 제공한다. "


 HBM2의 ECC 버전은 기존의 ECC DIMM과 마찬가지로 각 채널마다 ECC 비트를 부가하는 형태를 취하고있다. 그런 의미에서 DIMM이 HBM 스택되었다만으로 시스템 측에서 본 모양은 변하지 않는다. 그러나 현재 JEDEC과 DRAM 업계는 다른 형태의 ECC도 연구하고 있다고한다. DRAM 내부에서 자동으로 ECC를 실시하는,보다 범용적인 인터 널 배열 ECC이다.


 "JEDEC에서는 전통적인 ECC는 다른 유형의 ECC에 대해서도 논의하고있다. 미래에는 (소비자 버전도 포함하여) 모든 DRAM이 반드시 ECC를 필요로하게된다고 생각하고 있기 때문이다 .DRAM의 비트 셀을 지속적으로 축소하고 유지하기 위해 어떤 종류의 인터 널 ECC가 필요한 .DRAM 어레이는 점점 안정하지 않고, 게임 그래픽에서도 안정된 메모리 어레이가 필요한 날이 올 것 "(Macri 씨).


 DRAM 셀 미세화의 한계를 넘는 위해서는 향후 인터 널 배열 ECC를 추가 방향임을 알 수있다. DRAM 셀은 미세화의 한계에 가까워지고있어 오류 레이트가 점점 높아지고 있기 때문이다. 그러나 그것은 HBM의 ECC 구현과는 다른 계층의 이야기로 진전되고있는 것을 알 수있다.


HBM후에도 GDDR5의 후계 메모리도 등장 할 가능성이 높아

 

HBM의 등장으로 그래픽 메모리 GDDR5는 죽음을 향해 달라가 시장은 결국 HBM계 메모리에 옮겨 가는지?  GDDR5는 스택형이 아닌 후속 메모리 규격은 이미 등장하지 않는 것인가? 사실, 거기에 여전히 물음표가있다. JEDEC에서 HBM과 GDDR의 두 계통을 담당하는 Macri 씨는 다음과 같이 설명하고있다.


 "그래픽 메모리의 동향은 흥미롭다. 물론, 디스크리트 GPU 시장에서는 HBM 계 메모리로의 전환은 진행하지만 GDDR5 후속 메모리도 이름이 어떻게 될지는 모르겠지만 1세대는 지속될 가능성이있다 .


 즉, HBM과 같은 스택형 메모리와 병행하여 GDDR5와 같은 비 스택의 개별 그래픽 메모리가 다른 세대 따를지도 모른다. 그랬다 (비 스택 형) 메모리가 2세대 지속될 것으로는 생각되지 않지만 나중에 1세대는있을 것 같다. 물론, 동향은 수요에 달려있다.


 사실, GDDR5 후계가되는 메모리도 일부 개발하고있어 GDDR5보다 뛰어난 메모리를 제공 할 수있다. 기술적으로 할 수있는 일이 아직도있다. 1세대는 스택 계 메모리와 비 스택 계 메모리가 병존 할지도 모른다. 그러나 장기적으로 보면 개별 GPU의 메모리 길은 HBM계 메모리로 향하고 있다고 생각 "


 현재는 AMD조차 GPU 라인업의 메모리를 모두 HBM계에 대체 할 수 있지 않다. HBM계 메모리가 미드 레인지에서 메인 스트림 GPU에 와서는 HBM과 TSV 인터 포저의 비용이 순조로 떨어졌다해도, 잠시 걸린다. 단기간에 HBM로부터하는 것은 무리가있을 것 같다. 따라서 GDDR5 후속 메모리 규격이 등장하고 병존하는 방향으로 향하고있다.




▲방향성이 다른 JEDEC의 각 메모리 

DDR3, GDDR5, WIDE I/O, HBM




▲HBM과 DDR3, GDDR5 기술적 차이





반응형

댓글