본문 바로가기
Moblie/Etc

ARM, 2015년까지 로드맵을 공개

by 에비뉴엘 2012. 4. 20.
반응형


● 2015 년까지 헤테로지니어스컴퓨팅을 완성


 ARM은 미국 캘리포니아주 스탠포드에서 개최된 칩 컨퍼런스 "Hot Chips 23"의 기조 연설에서 이 회사의 기술 방향을 제시했다. 앞으로도 빠른 속도로 새로운 아키텍처 새로운 CPU 코어와 GPU 코어를 투입 가고 CPU 코어와 GPU 코어 등 사이에 처리를  헤테로지니어스컴퓨팅을 완성으로 향한다. 2015 년까지, CPU 코어와 GPU 코어 사이의 메모리 일관성을 가지고 프로그래밍을 쉽게하는 소프트웨어 계층을 정돈한다.

 간단히 말하면, ARM도 AMD 등이 행하고있는 것과 같은 것을하려고하고있다. AMD는 2013 년까지 APU (Accelerated Processing Unit)에서 CPU와 GPU의 코히렌시을 가지고 가기 때문에 1 ~ 2 년 차이로 거의 같은 노선을 가려고하고있다. 그에 따라 CPU 코어와 GPU 코어와 버스를 진화 로드맵이다. 


ARM의 로드맵



대부분의 스마트폰에 쓰이는 ARM Cortex-A9
갤럭시3 CPU도  Cortex-A9 아키텍쳐이다.


 ARM에 따르면 2013 년까지 장치는 4코어 혹은 그 이상의 차세대 ARM CPU 코어 "Cortex-A15 (Eagle)"과 차세대 GPU 코어 "Mali-T604"를 탑재하게되면 ARM 설명한다 . Cortex-A15은 3명령 디코드의 Out-of-Order 실행 파이프라인의 CPU 코어, Mali-T604은 통합 쉐이더 아키텍처에서 OpenCL을 지원하는 차세대 GPU 코어이다. Segars 씨는 2013 년 하이 엔드 장치 "슈퍼 폰 '은 노트 PC를 대체만의 퍼포먼스 영역에 달할 것으로 설명한다.


2013년에 등장하는 "슈퍼폰"

 
 이 세대는 ARM은 여러 CPU 클러스터 (각 클러스터는 최대 4CPU 코어 바인딩) 사이에서도 풀코히렌시을 취할 수 있도록한다. 이것은 ARM의 SoC 버스 아키텍처 "AMBA 4 ACE"에서 새롭게 도입되는 "CoreLink CCI-400"상호 실현된다. 한편, GPU 코어와 다른 서브코어 사이에서 I/O 일관성을 가질 수 있도록한다. 또한, Mali-T604 아키텍처는 GPU 코어에서 여러 쉐이더 프로세서 코어 간의 캐시 일관성도 유지된다. 그러나 이 세대는 CPU 코어와 GPU 코어 사이의 일관성은 아직 가지고 가지 않는다.


Mali-T604 아키텍처
쿼드GPU 구조이다.



Cortex-A15의 확장성

 
 2015년 장치는 Cortex-A15의 차세대되는 새로운 CPU 코어와 Mali-T604의 후속 세대의 GPU 코어의 조합되면 ARM 본다. 이 세대는 CPU 코어와 GPU 코어 및 기타 코어간에 풀코히런시가 유지된다. 또한 헤테로지니어스 구성으로 소프트웨어 개발을 용이하게하기위한 프로그래밍 모델을 정비하고 간다고한다.

 ARM은 GPU 코어는 매년 새로운 코어를 투입한 로드맵을 발표하고있다. CPU에 대해서도 명확하게하지 않았다 Cortex-A15의 대상 아키텍처는 2015 년까지 시장에 등장하는 것이 밝혀졌다. 즉, 2 ~ 3 년에 새로운 CPU 아키텍처를 투입하고가는 걸음을 계속하는 것이 명료하게되었다. 덧붙여서, NVIDIA도 ARM 코어의 개발에 있어서는 미래의 ARM 아키텍처를 기반으로한다고 설명하고있다.



Mali 시리즈의 로드맵

 
Cortex-A15 블록 다이어그램 



● AMD의 컨퍼런스에 대한 설명과 밀접하게 연결 
 
 ARM이 헤테로지니어로 향한다고 선언은 ARM의 지난해 (2010 년)까지의 전개에서 보면 갑자기 보인다. 그러나 ARM은 올해 (2011 년)에 들어서는 헤테로지니어스컴퓨팅을 강조하기 시작했고, Hot Chips에서 연설도 그 흐름에있다. 실제로 Hot Chips의 연설은 ARM이 2 개월 전에 AMD의 기술 컨퍼런스 "AMD Fusion Developer Summit (AFDS)"에서 행한 연설 벌 것으로 보인다. ARM은 AFDS에서 왜 이기종 컴퓨팅에 가야 있는지 설명했다. 이번에는 그 부분은 간단한 설명 날려 이기종 화의 단계를 설명했다. 이 2 개의 연설을 연결하면, ARM의 의도가 명확하게 보인다.


 그 요인은 미세화한 CMOS 프로세스 확장이 어려워지고 버린 것이 있고, Hot Chips도 Segars 씨가 아래 슬라이드에서 "매 세대 새로운 요소가 더해지고있다"고 지적하고있다. 40nm 공정까지 왜곡 실리콘, 32nm 전후에서 High-k 게이트 절연막, 그리고 노출은 더블 패터닝에 더불어 트리플 패터닝 (EUV를 연기하기 위해)까지 부상하고있다. 그러나 노출이 어떻게든되어도 전원 전압을 낮추는 것이 어려운 (문턱 전압을 내릴 수없는) 때문에 전력 절감이 어렵다. 따라서 종래대로, 미세화로 다이 더 많은 기능을 싣고가는 것이 어려워지고있다.

 
프로세스 노광 기술의 진화

 
 예를 들어, 아래 그림과 같이 45nm에서 22nm로 마이 그레이션 코어 크기가 4 분의 1이되었다고해도, 동작 주파수를 1.6 배로 늘리면 코어 당 전력 소모량은 동일하게된다. 따라서 무어의 법칙 같은 다이 크기에 4배의 트랜지스터를 올릴 수에 관계없이 동일한 전력 범위는 4 분의 1 크기의 핵심 부분 밖에 사용할 수 없게된다.
나머지 부분은 실제로는 사용할 수없는 다크 실리콘되어 버린다고한다. Davies 씨는 약간의 숫자 차이가있어, 이것이 반도체 업계의 공통 인식이라고 설명했다.

 이것은 미세화하여 동일한 다이 크기에 기능을 늘려 성능을 높일 수 어려워지는 것을 의미한다. 지금까지의 접근 방식을 계속한다면 작은 다이 칩 밖에 만들 수 없게되어 버린다. 상황은 프로세스 세대마다 더욱 악화되어 간다. 11nm되면 45nm에 비해 코어 크기는 16 분의 1이되어, 주파수는 2.4 배 올릴 수있다. 하지만 코어 당 전력은 0.6 배 밖에 떨어지지 않기 때문에 10 % 밖에 다이를 사용할 수 없게된다. 또한 일정한 전력 다이가 소형화할 전력 밀도의 상승을 의미하고, 전력 밀도가 올라가면 폐열이 어려워진다는 문제를 일으킨다.



프로세스 규칙 진화에 의한 수축

 
수축 효과


● 헤테로지니어스컴퓨팅화의 필요성에 재촉하는 ARM 
 
 다크 실리콘의 문제점은 무어의 법칙 칩에 올려지는 트랜지스터가 증가해도 그것을 동시에 사용할 수 없다는 점이다. 역으로 말하면 동시에 사용하지 않는 아키텍처를 가지고 가면, 다크 실리콘 문제는 해결할 수있다. 또한 싣는 프로세서보다 전력 효율이 높은 것으로하면 전력 문제를 비출 수있다. ARM의 Segars 씨는이 문제를 해결하려면 "다른 방식"이 필요하다고 설명한다. 그것이 헤테로지니어스라고한다.

 AMD의 Davies 씨는 접근 방법은 매우 한정되어있어, 그것은 멀티코어 / 매니코어화로 도메인 프로세서를 혼재하는헤테로지니어스컴퓨팅화라고 설명했다.

 1 개의 CPU 코어를 자꾸자꾸 복잡하고 큰 코어로 발전 시켜도 CPU 코어의 소비 전력이 증가하고, 칩 전력을 올려 버린다. CPU 코어의 성능은 코어의 다이 면적의 증가 비율의 제곱근 분 밖에 오르지 않기 때문이다. CPU 코어의 규모는 일정하게 멈추고 코어를 다수 싣는 쪽이 전력 효율은 높아진다.


코어 수를 늘리는 방법

 
 또한 도메인 프로세서로 오프로드하면, 한층 더 전력 효율이 오른다. 여기서 말하고있는 도메인 프로세서는 널리 GPU, 비디오 프로세서, 기타 특정 용도 유닛도 포함한다. ARM은 개별 컴퓨팅을 해당 작업을 가장 효율적으로 할 수있는 장소 (= 프로세서와 고정 기능 유닛)에서 실행해야한다고 설명한다.

 ARM은 "컴퓨팅을 가장 효율적인 위치에서 실행"을 위해 가장 중요하다 요소는 시스템 레벨의 통합이라고 볼 수있다. Hot Chips의 키노트 스피치에서 ARM의 Simon Segars 씨가 보여준 로드맵은 바로 그 점을 보여주고있다. CPU 코어와 GPU 코어와 다른 코어간에 메모리 일관성을 유지 동일한 페이지 테이블을 사용할 수있게되면, 데이터의 교환이 간단하게된다. 그러면 CPU에서 작은 작업에도 다른 코어로 오프로드 쉬워진다. 데이터를 이동하지 않아도 때문에 전력 효율도 높아진다.

 이러한 배경에서 ARM은 헤테로지니어스컴퓨팅으로 크게 방향을 전환할려고 하고있다. 모바일, 전력 효율, PC 이상으로 절실한,
그래서 ARM은 컴퓨팅을 가능한 한 효율적인 프로세서 / 유닛으로 실행시킬 필요를 느끼고있는것이다.
반응형

댓글