2010년 2월 20일 토요일

클라우드 컴퓨팅 - 대규모 컴퓨터 운영기술이 열쇠를 쥐고 있다.

 클라우드 컴퓨팅에서 사용되고 있는 컴퓨터의 고장율은 어느 정도일까? 클라우드 컴퓨팅에서 사용되고 있는 개개의 컴퓨터는 서버 제조사가 경쟁을 벌이고 있는 고가의 최상위 머신이 아니다. 아마존의 CTO가 공개한 기술 문서에는 크든 작든 고장은 빈번하게 발생하고 있다고 한다.

 

 또한 구글의 엔지니어링 부문 부사장인 '리카이푸(李開復)'는 2008년4월에 열린 컨퍼런스 'WWW2008'에서 다음과 같이 언급하고 있다.

 "20000대의 서버가 있다고 하면 하루 평균 110대가 고장난다."

이는 구글이 보유하고 있는 서버가 가령 100만대라고 가정할 경우, 하드웨어 장애든 소프트웨어 장애든 적절하게 작동하지 않는 서버가 하루 평균 5,500대나 되는 계산이 나온다.

 

 이 정도의 서버 장애를 수동으로 검출해서 신속하게 대처하기란 당연히 불가능하며, 여기서 중요한 것은 시스템 운용 관리의 자동화다. 대규모 시스템을 매일 안정적으로 운용해 나가는 것은 서비스 제공자에게 있어서 생명줄과 같다.

 

 웹 2.0의 제창자인 '팀 오라일리(Tim O'reilly)'의 유명한 논문 'What is Web 2.0'에서 다음과 같이 언급하고 있다.

 "구글은 시스템 관리, 네트워크 그리고 부하 분산에 관한 기술을 아마도 검색 알고리즘 그 자체 보다도 엄중하게 관리하고 있을 것이다. 이것은 경쟁 업체에 대한 자사의 비용 우위성이 주로 이러한 프로세스를 자동화함으로써 이뤄지고 있기 때문이다."

 

 또한 구글에 한하지 않더러도 클라우드 컴퓨팅 서비스 제공자는 대단히 고도의 시스템 운용 관리기술을 보유하고 있어야 한다. 전 세계에 걸쳐 수백만의 사용자에 대해 24시간 365일 안정된 서비스를 제공하기 위해서는 축적된 운영 노하우가 중요할 수 밖에 없다.

 

관련글: [책 소개] 클라우드의 충격 

댓글 없음:

댓글 쓰기