SSD 수명의 문제점과 해결방안SSD 수명의 문제점과 해결방안

Posted at 2012. 9. 9. 10:02 | Posted in IT/Hardware/Storage


플래시 메모리 응용 제품에는 SSD와 USB 메모리, SD 카드, 내장 스토리지 등이 존재하는데, Flash Memory Summit에서는 특히 SSD 응용에 관한 논의가 활발하다. 그것도 클라이언트 SSD보다 엔터프라이즈 SSD에 대한 관심이 이상하게 높다. 즉, 플래시 메모리의 응용 분야에서 최첨단을 달리고있는 것이 엔터프라이즈 SSD 인 것이다.

 엔터프라이즈 SSD가 주목받는 배경에는, 기업용 스토리지 시장이 빠르게 성장하고있어 향후에도 성장할 것으로 예측되고있는 것이있다. 그것도 서버와 대를 이루는 기존의 스토리지가 아닌 네트워크의 반대편에있는 클라우드 데이터 센터 스토리지 용도에서 큰 성장이 기대되고있다.

 기업용 스토리지, 입출력 속도 (IOPS)와 지연 시간 (대기 시간), 기억 용량의 차이에 따라 여러 계층 (Tier : 티어)으로 나누어 져있다. IOPS가 가장 높고, 대기 시간이 가장 짧은 최고 성능의 계층이 "티아 0"이다. 엔터프라이즈 SSD가 등장하기 전에는, 15,000 rpm 등 고회전 형의 엔터프라이즈 HDD가 티아 0을 맡아왔다.

● 클라이언트 SSD에서도 엔터프라이즈 HDD보다 고성능 
 
 이 티아 0 계층에서 SSD는 압도적 인 성능 차이로 HDD에서 시장을 빼앗아 시작했다. 하이 엔드 엔터프라이즈 SSD는 물론, 저가형 클라이언트 SSD에서도 엔터프라이즈 HDD에 이길 것이다. Flash Memory Summit의 강연에서는, 15,000 rpm의 SAS HDD와 클라이언트 SSD (MLC 타입의 NAND 플래시 메모리를 사용)를 비교하여 SSD는 평균 대기 시간이 6.5 분의 1로 감소하는 동시에 IOPS가 21 배 증가한다는 벤치 마크 결과가 나와 있었다.

 그래서 비싼 엔터프라이즈 SSD 대신 저렴한 클라이언트 SSD를 기업에 도입하는 사례가 발생하고, 경우에 따라서는 심각한 문제를 초래하고있다.

 예를 들어 클라이언트 SSD를 4 대 정도 도입하고 기업 HDD4대로 대체하자. 하나는 C 드라이브에 OS를 포함, 3 대는 D 드라이브 (RAID 5)에서 로그 파일의 저장에 사용한다. 소규모 데이터 센터에서 이러한 변경을 수행하면 입출력 성능은 크게 높이고 스토리지가 차지하는 부피는 변하지 않는다. 미래의 부하 증가에 충분한 준비가 된 것 같다.

15,000 rpm의 SAS HDD와 클라이언트 SSD (MLC 타입의 NAND 플래시 메모리를 사용)의 벤치 마크 결과. 
SSD 업체 인 Smart Storage Systems의 강연 슬라이드



● 클라이언트 SSD에 대한 오해 
 
 그런데 , 1년을 경과해 이 SSD 도입은 파탄한다.SSD의 한계수명이 다해 버리기 때문이다 보다 엄밀하게는, SSD가 내장 MLC 타입의 NAND 플래시 메모리의 수명이 다되어 버린다. NAND 플래시 메모리의 사용자에게는 상식이지만, SSD를 도입하는 사용자에게는 상식이 아니다. HDD는 "수명 (Endurance )"라는 개념은 존재하지 않기 때문이다.


SSD에는 어느 타입의 NAND 플래시가 가장 적합할까?


 미국의 시장 조사 회사가 SSD의 구입 층을 조사한 결과에 따르면, SSD는 어떤 타입의 NAND 플래시가 가장 적합한 지와의 질문에 "모른다"를 선택한 사람의 비율은 39.5 %로 최대 다수를 차지하고있다. 덧붙여서, 고성능과 긴 수명에서 SLC 타입이 최적의 답변은 34.8 %, 저가에서 MLC 타입이 최적의 답변이 24.9 %이다.

 이 조사 결과에서 SSD 구매 층의 약 40 %는 SLC 타입과 MLC 타입의 구별이 없다는 것을 알 수있다. 시장 가격이 낮은 것은 물론 MLC 타입의 SSD이므로,이 그룹의 대다수는 MLC 타입의 SSD를 구입하는 것이다.

 MLC 타입의 NAND 플래시 메모리를 탑재 한 클라이언트 SSD를 데이터 센터에 도입하면 어떻게 될까. 데이터 센터의 서버는 다양한 유형의 애플리케이션을 처리한다. 문제가되는 것은 응용 프로그램에서 읽기 (출력)와 쓰기 (입력)의 비율이 다른 것으로, 데이터 센터 서버는 24 시간 365 일 논스톱으로 가동하는 것이다. 클라이언트 SSD는 기본적으로 논스톱으로 가동을 상정하고 있지 않다. 따라서 사용하는 응용 프로그램에 따라 상당히 짧은 기간에 SSD의 수명이 다되어 버린다.

240GB 클라이언트 SSD를 데이터 센터의 애플리케이션에 사용되는 수명. 

 
 Flash Memory Summit에서 SSD 업체가 제시 한 것은 다음과 같은 추정이다. 앞의 4 대 구성의 240GB 클라이언트 SSD에서 애플리케이션 별의 수명을 계산 한 결과 다. Web 서버의 경우는 읽기가 95 %, 쓰기가 5 %에​​서 읽기가 주체이다. SSD의 수명은 1.6 년. 쓰기의 비율이 5 %에​​ 불과에도 드라이브의 수명은 1.6 년이며, 이것은 애플리케이션은 수명이 상당히 긴 부류에 들어간다. 다음 Exchange 서버의 경우이다. 읽기의 비율이 67 %, 쓰기의 비율이 33 %로, 수명은 0.3 년에 불과하다. 4 개월도없는 것이다. 최악은 SQL 로깅, 100 % 쓰기 작업이다. 무려 0.08 년, 불과 1 개월 만에 수명으로 인한 SSD 사망, 교체가 필요하다.

●MTBF 100만 시간의 새빨간 거짓말
 
 이 수명은 일례이며, 케이스 바이 케이스로 길어 지거나 짧아 지거나한다. 그보다 문제는 "클라이언트 SSD의 대부분은 제품 사양으로 수명을 명기하지 않는"것이다. 클라이언트 SSD의 반복 기록 수명은 사용자에게 보이지 않는 것이다. 즉, 사용법에 따라서는 매우 짧은 기간에 제품의 수명이 다되었을 버리는 것을 의미한다.

 그러면 클라이언트 SSD 제품 사양에 종종 나타나는 "평균 고장 간격 (MTBF)이 100 만 시간"의 표기는 어떻게 해석하면 좋은 것일까. 100 만 시간이라고하면, 100 년 이상으로 환산하면 길이이다. 즉 평균적으로 100 년간 고장 나지 않는 것이다.

 그 같다. 100 년간 고장하지 않는다. 또는 평균 100 년에 한 번 고장. MTBF 100 만 시간과 그 의미에 맞다. 그러나 MTBF는 신뢰성 공학 용어로 "우발적 고장 기간"에만 통용되는 지표이다. 즉, SSD가 제대로 작동하고있는 기간에만 통용되는 지표 다. SSD의 반복 기록 수명이 다 시작 기간, 신뢰성 공학 용어로 "마모 고장 기간"이라고 기간은 MTBF는 더 이상 통하지 않는다.

●엔터프라이즈 SSD가 규정하는 SSD수명 

클라이언트 SSD (소비자 SSD)와 엔터프라이즈 SSD(기업용 SSD)의 차이
 
 클라이언트 SSD와 엔터프라이즈 SSD는 상정하고있는 용도가 근본적으로 다르​​다. 클라이언트 SSD는 하루 중 몇 시간 만 가동하고 기록 데이터의 양이 전체 드라이브에 비하면 작은 비율이다. 스마트 폰과 미디어 태블릿, 소비자 용 노트북 PC 등이 클라이언트 SSD의 적용 영역이다.

 이에 대해 엔터프라이즈 SSD는 24 시간 365 일 논스톱으로 가동한다. 응용 프로그램은 1 일 사이에 하나의 드라이브 전체를 여러 번 바꿔 버리는 엄청난 데이터를 기록. OLTP (온라인 트랜잭션 처리) 및 Exchange 서버, Web 서버, 로깅, 데이터웨어 하우스 등의 애플리케이션에서 스토리지의 역할을한다.

 그리고 무엇보다, 엔터프라이즈 SSD 제품 사양에는 다시 수명이 명기되어있다. "PBW (Peta Byte Write)"라는 지표로, 얼마나 많은 데이터 양을 누적으로 쓸 수 있는지를 나타낸다. 예 1PBW하다면, 1PB (1,000 TB)의 데이터를 누적으로 쓸. 도시바가 2012년 8월에 발표 한 엔터프라이즈 SSD 신​​제품 "PX02AMF020"의 사양이 다만 1PBW에서 "총 다시 데이터 양"이라고 표기되어있다. "PX02AMF020"저장 용량은 200GB (0.2TB)이므로 전체 드라이브를 5,000 번 정도 다시 받게된다.

● 엔터프라이즈 SSD전용의 NAND 플래시

 NAND 플래시 메모리 타입의 재기록 횟수와 비용의 차이. 

 
 SSD의 반복 기록 수명과 비용을 크게 좌우하는 것은 NAND 플래시 메모리이다. SSD가 탑재하는 NAND 플래시 메모리는 크게 나누면 SLC, MLC, eMLC의 3 가지 유형이 존재한다.

 SLC NAND 플래시는 1 개의 메모리 셀에 1bit를 기억하는 타입이며, 다시 수명이 길다. 실리콘 다이에서 쓸 수있는 횟수는 10 만회에 달한다. 그러나 저장 용량 당 가격은 3 가지 유형 중에서 가장 높다. MLC 타입의 약 3 배이다.

 MLC NAND 플래시는 1 개의 메모리 셀에 2bit (혹은 그 이상)을 기억하는 타입이며, 물리적으로 SLC 타입과 동일한 실리콘 다이에서 2배의 저장 용량을 제공한다. 실제 가격차는 더 크게, SLC 타입의 3분의 1정도된다. 그러나 다시 수명은 SLC 타입에 비해 크게 짧다. 재기록 횟수는 3,000 번 밖에 없다.

 MLC 타입을 엔터프라이즈 SSD에 사용하는 것은 매우 어렵다는 얘기로 개발 된 것이 eMLC 타입이다. MLC 타입 쓸 수있는 횟수를 3만회로 향상 시켰다 NAND 플래시 저장 용량 당 가격은 MLC 타입의 1.3 배로 그리 높지 않다. 비용과 수명의 밸런스가 좋은에서 엔터프라이즈 SSD에 상당히 보급하고있다.

eMLC는 Enterprise MLC라는 뜻이다. 

● 컨트롤러 기술로 다시 수명을 연장 

 


NAND 플래시 메모리의 종류와 응용 프로그램. 

 
엔터프라이즈 SSD에 실리 NAND 플래시의 유형을 응용 프로그램에서 구분하면 쓰기 주체의 응용 프로그램이 SLC 타입, 읽고 쓰기가 혼합 된 응용 프로그램이 eMLC 타입 읽기 주체의 응용 프로그램이 MLC 타입이다.
 
 단가를 생각하면, SLC 타입의 SSD와 eMLC 타입의 SSD에는, 아직 상당한 벽이 있다.거기서 SSD 벤더는, MLC 타입 혹은 eMLC 타입을 베이스로, NAND 플래시 기술과 콘트롤러 기술을 조합해 개발하는 것으로, 지금까지 SLC 타입이 커버하고 있던 영역을 저비용의 MLC 타입 SSD로 옮겨놓으려 하고 있다.

 예를 들면 SSD 벤더의 Smart Storage Systems는 「EE:Endurance Enhanced」라고 부르는 기술에 의해서 쓰기가능 회수가 4만회를 넘는 NAND 플래시를 개발하고 있다.SSD 벤더의 STEC도, 같은 기술을 개발중이다.MLC 타입에 장기 수명화 기술을 도입하는 것으로, eMLC 타입 SSD의 3배를 넘는 총개서 용량을 실현한다.

 엔터프라이즈 SSD는 등장하기 시작했을 무렵, MLC 타입의 적용은 곤란하다고 되고 있었다.SLC 타입의 NAND 플래쉬 메모리만이 엔터프라이즈 용도에 사용할 수 있다고 생각되고 있었다.그것이 콘트롤러 기술의 개발과 eMLC 타입의 개발에 의해, 현재는 엔터프라이즈 SSD에 MLC 타입과 eMLC 타입을 탑재하는 것이 당연하게 되어 있다.그것은 코스트 저감의 요구에 계속 부응해 온 결과에서도 있다.향후의 SSD에서는, 콘트롤러 기술이 더욱 더 중요하게 된다.


 

Name __

Password __

Link (Your Website)

Comment

SECRET | 비밀글로 남기기

free counters