멀티코어 보급형 프로세서 Cortex-A5 아키텍쳐란 무엇인가?멀티코어 보급형 프로세서 Cortex-A5 아키텍쳐란 무엇인가?

Posted at 2012. 6. 29. 21:01 | Posted in Moblie/Etc


ARM Forum 2009 "에서 Cortex-A 시리즈의 새로운 ARM 코어"Cortex-A5 "(개발 코드명 : Sparrow)의 내용이 공표되었다. 英ARM의 프로세서 사업부의 마케팅 담당 부사장으로 근무 Eric Schorn (에릭 숀) 씨가 오전 특별 강연과 오후 일반 강연 모두에서 개요를 설명했다. 본 보고서는 ARM Forum 전날 기자 회견에서 숀 씨가 설명한 내용과 10 월 미국에서 개최된 강연회 겸 전시회 "ARM techcon3"의 내용을 포함하여 Cortex-A5의 개요를 전달한다.

● Cortex-A5는 AP프로세서의 저가형 저소비 버전 
 Cortex-A 시리즈는 애플리케이션 처리를위한 CPU 코어로, 지금까지 ARM은 " Cortex-A8 "며" Cortex-A9 '을 발표해왔다.
Cortex-A8은 싱글 코어로 높은 성능을 추구한 CPU 코어
Cortex-A9 멀티코어 확장에 따른 성능 범위 확대와 상대적으로 낮은 소비전력의 양립을 목표로 한 CPU 코어라고 평가된다.
Cortex-A5는 멀티코어 확장을 통해 성능의 선택 영역을 확장하면서 연산 성능 당 소비 전력을 더욱 낮춘 CPU 코어이다.

멀티 코어 확장은 Cortex-A9와 거의 같은 방식이며, Cortex-A9에서 개발한 멀티 코어를위한 소프트웨어는 거의 그대로 Cortex-A5에 유용할 수있다.
Cortex-A9 는 고급품종, Cortex-A5를 보급형 품종으로 자리매김할 수있다.

 Cortex-A5가 태어난 배경에는 기존 애플리케이션 프로세서 ARM 코어인 "ARM1176"와 "ARM926"에 비하면, Cortex-A8과 Cortex-A9 프로세서는 소비전력 당의 컴퓨팅 성능 (DMIPS / mW)가 낮은 수있다. Cortex-A8과 Cortex-A9 프로세서는 동작 주파수 당 연산 성능 (DMIPS / MHz)은 비싸지만 성능을 추구했기 때문에 소비 전력이 크다는 약점을 안고 말았다. 따라서 ARM1176 및 ARM926 사용자는 Cortex-A8과 Cortex-A9에서 마이그레이션 경로로 적합하지 않다고 생각하는 사람들이 존재한다. 그래서 DMIPS / mW를 높였다 Cortex-A5를 새로 개발하고 ARM1176 및 ARM926에서 마이그레이션을 용이하게했다.


ARM 코어의 제품 전개 Cortex-A9 및 Cortex-A5 개요. 


Cortex-A9 및 Cortex-A5 개요. 
최대 쿼드코어구조가 가능

소비 전력 당의 컴퓨팅 성능 (DMIPS / mW)과 연산 성능 (DMIPS). 
기존의 애플 리케이션 프로세서 (ARM1176 및 ARM926)이 최신 애플 리케이션 프로세서 (Cortex-A8 및 Cortex-A9)보다 DMIPS / mW이 높다.

 
● 엄청난 DMIPS / mW 높이 
 
 Cortex-A5의 개발 목표는 소비 전력을 ARM926 더 내리면서, 연산 성능은 ARM1176과 동등 이상을 달성한다는 것이다. 실리콘 면적은 ARM926 수준을 노린다.
실제로 실현할 수있는 Cortex-A5 코어는 동작 주파수 당 연산 성능 (DMIPS / MHz 값)이 1.5DMIPS/MHz이며, ARM1176의 1.2DMIPS/MHz, ARM926의 1.1DMIPS/MHz보다 훨씬 높다. 동작 주파수는 대만 TSMC의 40nm LP (낮은 누설 버전) 프로세스에서 500MHz, 40nm G (표준 버전) 과정에서 1GHz에 도달하고있다. 동작 주파수가 500MHz라고 750DMIPS의 연산 성능을 달성할 수있게된다.


Cortex-A5의 개발 목표



Cortex-A5와 ARM1176, ARM926 비교

Cortex-A5와 ARM1176, ARM926 비교 

 동작 주파수 당 소비 전력 (mW / MHz)의 구체적인 값은 ARM Forum에서 설명이 없었지만, ARMtechcon 슬라이드로 Cortex-A5의 시작 결과가 공표되어 있었기 때문에, ARM 홈페이지에 게재되어 있는 ARM926 및 ARM1176의 값을 함께 비교 해보자. Cortex-A5의 mW / MHz는 40nm LP 프로세스의 프로토 타입 (16KB/16KB 캐시 있음)에서 0.12mW/MHz ~ 0.13mW/MHz, ARM926는 90nm 공정의 실리콘 면적 우선 코어 (8KB/8KB 캐시 있음) 0.14mW / MHz, ARM1176는 90nm 공정의 실리콘 면적 우선 코어 (16KB/16KB 캐시 있음)에서 0.25mW/MHz이다. 프로세스의 차이는 있지만, Cortex-A5는 상당히 낮은 mW / MHz를 달성할 수있다는 것을 알 수있다.

 실리콘 면적도 ARMtechcon 슬라이드로 Cortex-A5에 대한 자세한 값이 공표되어 있었다. 마찬가지로 비교해 보자. 40nm LP 프로세스의 Cortex-A5 실리콘 면적은 논리 부분이 0.27 평방 mm, RAM 부 (주로 L1 캐시, 16KB/16KB)이 0.26 평방 mm, 전체 0.53 평방 mm가된다. Cortex-A5 코어에서도 옵션 멀티미디어 엔진 "NEON"부동 소수점 유닛 (FPU)를 추가하면 같은 프로세스에서 논리 부분이 0.42 평방 mm, RAM 부분이 0.26 평방 mm, 전체 0.68 평방 mm와 된다.

 ARM 홈페이지에 게재되는 데이터라고 ARM926의 실리콘 면적은 90nm 공정의 실리콘 면적 우선 코어 (8KB/8KB 캐시 있음)에서 0.85 평방 mm, ARM1176 실리콘 면적은 90nm 공정의 실리콘 면적 우선 코어 (16KB / 16KB 캐시 있음)에서 1.6 평방 mm로되어있다. 90nm 공정과 40nm 공정은 단순 계산으로 실리콘 면적에 5 배 차이가 생기므로, 90nm 공정으로 1.6 평방 mm의 ARM1176를 단순하게 40nm 공정으로 축소하면 0.32 평방 mm가된다. Cortex-A5의 0.53 평방 mm와 비교하면, 실리콘 면적이 작다고 단언 의문이 남는다.

 또한 ARMtechcon에서 발표된 Cortex-A5의 시작 결과에 놀란 것은 전력 당 연산 성능 (DMIPS / mW 값)이다. 옵션 (NEON와 FPU)이 핵심으로 12DMIPS/mW 옵션없이 코어 13DMIPS/mW을 달성하고있다. 이것은 상당히 높은 수치이다. 참고 Cortex-A9 프로세서는 4.66DMIPS/mW (65nm G 공정), ARM1176는 4.8DMIPS/mW (90nm 프로세스), ARM926는 7.8DMIPS/mW (90nm 프로세스)이다. 현상에서 공표하는 성능 수치를 보면 한은, Cortex-A5의 DMIPS / mW 값은 월등히 뛰어나다.



TSMC의 40 nm LP프로세스에 의한 Cortex-A5코어(16 KB/16 KB캐쉬 있어)의 시작 결과.동작 주파수는 485 MHz


이쪽은 멀티미디어 엔진 「NEON」라고 부동 소수점 연산 유닛(FPU)을 더하고 있다.동작 주파수는 453 MHz


 
● 단일 명령 발행, 인 오더 실행 8단계 파이프라인 
 
Cortex-A5 코어는 사용자가 보면 Cortex-A9 코어와 마찬가지로 유효하다. 하지만 그 내용이다 마이크로 아키텍처는 A5와 A9에서 확실히 다르다.

Cortex-A5 코어는 단일명령발행하는 인 오더 실행에서 작동하는 8단계 파이프라인을 갖추었다.
Cortex-A9 코어는 아웃 오브 오더 실행 및 다중 명령 동시 발행을 채용하고있어,
 
둘 차이에서는 상당한 성능 차이가 발생한다. 컴퓨터로 비교하자면 넷북의 아톰과 최신 i5프로세서정도 되겠다.

숀 씨는 강연 후 질의 응답에서 "Cortex-A5 코어는 의도적으로 일부 성능 향상 기술을 분리했다"고 설명했다.

 Cortex-A9 코어보다는 낮지만, ARM1176보다 높은 성능을 Cortex-A5 코어를 실현할 수있는 것은 틀림없는 것 같다. EEMBC 벤치 마크에서 ARM1176에 비해 평균 15 % 정도 높은 값을 표시하고 있었다. 메모리 액세스 성능도 ARM1176보다 훨씬 높은 성능을 달성할 수있다. 동일한 클럭 사이클 수를 ARM1176의 3배 용량의 데이터에 액세스할 수 강연에 나와 있었다.



Cortex-A5코어의 파이프라인

 

ARM1176과 Cortex-A5의 벤치마크 결과.ARM1176을 기준에, Cortex-A5로 벤치마크치가 향상한 비율을 나타냈다

ARM1176과 Cortex-A5, Cortex-A9의 메모리엑세스 성능

Cortex-A5에 의한 멀티 코어 구성의 블럭도.
Cortex-A9와 거의 같은 멀티 코어 구성이다


 Cortex-A5의 라이센스는 2009년 4분기부터 시작, 
2010 년에는 실리콘 칩 샘플이 시작될 예정이다. 



프로세서 벤더의 개발이 순조롭게 진행되면 2011 년에는 Cortex-A5 코어를 내장한 프로세서의 양산이 시작된다.

 Cortex-A5 코어의 미래에 대해 9 일 기자 회견에서 숀 씨는 "ARM9 250 이상 라이센스 수와 ARM11 70 개 이상의 라이센스가 Cortex-A5 코어의 시장 기회를 의미한다"고 이야기했다 . ARM9과 ARM11은 응용 프로그램 처리를위한뿐만 아니라 실시간 처리를위한 핵심이 존재한다. ARM9과 ARM11의 모든 라이센스가 Cortex-A5로 전환하는 시나리오에는 조금 무리가 있지만, Cortex-A5 코어는 Cortex-A9 및 Cortex-A8 이상의 라이센스 수를 ARM이 기대하고있는 것이 알 수 있었다. 

 

Name __

Password __

Link (Your Website)

Comment

SECRET | 비밀글로 남기기

free counters