CIOCISOCIOCISO인터뷰
신개념 DR, 구축비용 절반 이하로 줄여DR과 백업의 융합을 이끈 박경구 미래에셋생명 IT지원본부장
홍상수 기자  |  sshong@ciociso.com
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
[0호] 승인 2016.04.14  
트위터 페이스북 미투데이 요즘 네이버 구글 msn

 

   
▲ 박경구 미래에셋생명 IT지원본부장

 

신개념 DR, 구축비용 절반 이하로 줄여

DR과 백업의 융합을 이끈 박경구 미래에셋생명 IT지원본부장

 

미래에셋생명은 지난해 백업과 DR(Disaster Recovery, 재해복구)시스템을 고도화하면서 RPO(Recovery Point Objective)와 RTO(Recovery Time Objective)를 획기적으로 개선하면서도 구축 비용을 기존 방식 대비 50% 이하로 대폭 줄일 수 있었다. 종전 Tape 백업과 DR 방식이 아닌 백업과 DR을 융합하고 가상화 기술을 접목한 새로운 시도를 통해서였다. 박경구 미래에셋생명 IT지원본부장은 이 프로젝트를 고안하고 성공적으로 이끈 주역이다. 그와의 인터뷰를 소개한다.

DR, 재해 대비를 위한 필수 조건. 그러나..

DR이란 주전산센터가 지진, 홍수, 화재 등 자연재해에 의해 제 기능을 수행하지 못하게 됐을 때를 대비한 백업센터와 백업시스템을 말한다. 사실 제2금융권 중 상당수는 제대로 DR시스템을 갖추지 못하고 있다. 인프라가 교체되는 5~6년 동안 실제로 한 번도 사용되지 않는다는 생각이 저변에 깔려있고, 설마 하는 생각에 DR시스템에 많은 비용을 선뜻 투자하지 못했다. 그러나 감독기관에서는 소비자 보호를 위해 DR을 강제화 하고 있어, 대부분의 금융기관은 관련법에서 저촉되지 않을 정도의 구색 맞추기 식으로 DR시스템을 운영해왔다.

이런 상황에서 2014년 4월 삼성SDS 화재사고가 발생했다. 전산센터 화재로 삼성카드 일부 체크카드와 현금서비스, 인터넷전화 서비스 등이 먹통이 되어, 고객들은 상당기간 불편을 겪어야 했다. 우리나라 최고 수준의 DR과 주전산센터를 갖추고 있는 삼성그룹에서 이런 사고가 발생하자 감독기관은 물론 CIO, CEO까지 DR에 관심을 갖기 시작했다.

박 본부장은 “IT의존도가 높은 금융기관에서 주센터가 무너졌을 때 DR이 없다면, 기업 이미지가 훼손될 뿐 아니라, 막대한 금전적 손해로 이어진다”며 “DR과 백업을 융합시켜 최소비용으로 업무연속성을 담보할 수 있는 방식을 고안했다”고 말했다.

 

   
▲ 박경구 미래에셋생명 IT지원본부장

 

Q : DR과 백업의 융합이란 어떤 의미인가?

금융기관은 데이터와 어플리케이션 등을 만일의 사태를 대비하여, 백업/소산 하고 있으며, DR상황을 대비해 실시간으로 DR센터로 데이터를 복제도 하고 있다. 금융감독규정에 명시되어 있으며, 감독기관은 정기적으로 이러한 백업과 DR시스템을 점검하고 있다.

그러나 전통적 백업방식은 맹점이 있다. 점점 늘어만 가는 데이터를 24시간 내에 받아내야 하기 때문에 고성능 LTO드라이브로 지속적으로 교체하며 확장하고, 때로는 고가의 VTL까지 동원해보지만, 늘어가는 데이터를 감당하기엔 역부족이다. 소산은 또 어떤가? 24시간이 걸려 백업받은 데이터가 익일 소산지에 도착하면, 이미 30시간이상 경과한 데이터가 내화금고에 보관되고 있는 것이다. 이 백업데이터로 복구를 해야 하는가, 아니, 해도 되는가? 금융권에서 30시간 이전 데이터는 의미가 없다.

DR은 그나마 백업에 비하면 다소 나은 편이긴 하지만 이쪽도 문제가 있다. 대부분 스토리지 기반의 실시간 혹은 Near-Zero 비동기 복제기술을 사용해 DR센터로 데이터를 복제하고 있다. 거의 모든 거래정보를 복구 가능한 백업 데이터를 확보하고 있다는 의미이다. 그렇다면, 복제되는 메인 스토리지를 사용하지 않거나 인터널 디스크를 사용하는 소규모 시스템은 여전히 앞서 언급한 많은 문제점을 갖고 있는 백업 복구를 통하여, 다소 시간이 걸리고(BAD RTO) 오래된 데이터로라도(BAD RPO) DR을 구동 시킬 수밖에 없다. 동기화 관점에서 데이터는 그나마 쉬운 문제이지만, 수시로 변하는 기업 어플리케이션이나 환경설정까지 동기화 시키는 부분은 훨씬 복잡하고 어려운 문제이다.

물론 고가의 LTO, VTL, 백업전용 네트워크 기반에 스토리지 백업 소산환경을 갖추고, 주센터와 동일한 수준의 DR센터에 동기화관리를 위한 인력까지 둔다면 웬만한 문제를 해결할 수 있겠지만, 그런 엄청난 비용을 선뜻 투자할 수 있는 회사는 잠깐의 전산장애에도 민감한 은행, 증권사가 아닌 보험사에선 그리 많지 않을 것이다. 업종 따라 위험의 크기가 다르고, 그에 따라 지출할 수 있는 여력이 다르기 때문이다.

10여년 전만해도 전산 장애 시 수작업으로 업무연속성을 최소한 유지할 수 있는 대안 등을 갖고 있기도 했지만, 요즘은 IT가 알아서 백업과 DR을 구축해서 업무 연속성을 확보해 주기를 바라고 있다.

위험의 크기는 달라도 업무 연속성을 확보해야한다는 요구는 동일하다는데 보험사 CIO들의 딜레마가 있다. (관련 규정에 RTO가 은행, 증권사 등은 3시간, 보험사는 24시간으로 명시되어 있지만, 실은 전환 가능하냐 아니냐의 문제지 3시간 24시간이 IT입장에서는 큰 차이는 없다. 이 시간의 차이는 보험회사가 은행, 증권 등의 여타 금융사만큼의 재해복구 및 백업에 많은 비용 투자를 어렵게 만드는 요인이기도 하다)

이런점 때문에 사업목표를 ‘백업과 DR을 잘 정비하는 것’에서 ‘백업과 DR기술의 장점을 적절히 활용하여 최소의 비용으로 업무연속성을 확보 하는 것’으로 패러다임을 전환하였다. 잘 정의된 백업도 아니며 잘 구축된 DR도 아닐진 모르지만 둘 간의 기술을 혼합 적용하여 최소비용으로 업무 연속성을 확보하는 것!‘ 이것이 백업이 DR이고 DR이 백업이 되는 ‘백업과 DR의 융합’이다.
 

Q : DR솔루션이 백업 역할을 수행하도록 어떻게 보완했는지?

“대부분의 DR솔루션은 동기 혹은 비동기식으로 스토리지 혹은 데이터 블록단위의 복제를 하게 된다. 백업과 소산의 역할을 훌륭히 수행하고 있지만, 백업의 고유 기능중 하나인 과거 특정 시점의 데이터를 유지시킬 수 없다. 그러나 일부 DR솔루션(EMC의 리커버리 포인트)은 저널기능을 통해 1~2주간 어느 시점으로도 갈수 있는 시점복원 기능을 제공한다.(스토리지 복제라는 유사 기술을 기반으로한 DR솔루션도 있고 백업 솔루션도 있다.) 1년, 2년 특정시점의 영구보존이 필요한 경우를 제외하면 훌륭한 백업역할을 수행하고 있는 것이다.

구형 백업장비를 활용 영구보존용 백업만 추가로 받아주면 된다. 한 달에 한 벌만 받아도 되니 속도 빠른 신형 LTO가 필요 없어지는 것이다.

OS 및 어플리케이션 영역은 제일 손이 많이 가는 부분 중 하나이다. 인터널디스크에서 미드레인지 스토리지로 이관해야 한다. 미래에셋생명은 이미 스토리지 기반의 서버 가상화 비율이 높기 때문에 그렇게 많은 작업이 필요하지는 않았다. 이러한 구성은 많은 기존 DR의 환경설정 오류를 해결해 준다. 백업처럼 환경설정 뿐 아니라, IP까지도 운영계와 동일하게 복제되기 때문에 네트워크 라우팅만 틀어 주게 되면 주센터가 DR센터로 순간 이동하는 것처럼 동작하게 된다. 재해시 시점은 재해 선포시점으로(Zero RPO), 복구는 2시간 이내(제1금융권 RTO수준)에 가능하다.

 

   
 

Q : 전사 DR체계를 만들려면 비용이 어마 어마 할 것 같은데, 비용절감 포인트는?

“일단 고가의 백업 하드웨어 등을 더 이상 구매할 필요가 없다. Tape을 행랑으로 나르는 소산역시 하지 않는다.

반면, 네트워크 비용이 급격하게 증가할 것 같지만, 일부 DR솔루션(EMC의 리커버리 포인트)들은 1/10까지 압축전송을 하기 때문에 기존 DB동기화를 위해 사용하고 있는 네트워크 증설 없이 수용이 가능하다. LTO 구입비 등 백업에 투자하여야 하는 금액을 DR솔루션 및 스토리지 구매로 전환하고, 추가해야 하는 서버는 주센터의 개발, 검증시스템을 이관하여 Shared pool 형태로 구성하면 된다. 평상시에는 개발 및 검증용으로 사용하고 재해 시에는 DR로 자원을 활용하게 구성하면, 추가로 구매해야할 서버가 최소화되며, 많은 비중을 차지하는 S/W 라이센스를 DR용으로 따로 구입하지 않아도 된다.

이 외에도 On Demand 개념을 적절히 활용하여 H/W를 설계하면 재해복구에 필요한 용량을 모두 구입하지 않고도 재해 시 필요한 용량을 단기간 내 확보 가능하게 구성할 수 있다.

이런 개념으로 지난해 9월부터 3개월간 백업 및 DR고도화 프로젝트를 수행하여 과거 11개의 주요 업무시스템 DR에서 43개의 전사 시스템으로 DR을 확대 구축했다. 지난해 12월에는 콜센터를 포함한 대대적인 전사 DR훈련을 성공적으로 완료했다. 이 프로젝트를 통해 전통적인 DR구축방식 대비 30억에 가까운 비용절감효과를 거뒀다.

미래에셋생명은 전사 망분리가 적용되는 2016년 전사 VDI 장애를 가정한 재해복구 모의 훈련을 계획하고 이에 따른 준비도 진행 중이다.

 

Q : 인프라운영 전문가가 아닌 걸로 아는데?

“개발자를 거쳐 SA(Software Architect)를 했으니 인프라운영 전문가는 아니다.” 현재 국내 많은 보험사가 핵심적으로 사용하고 있는 상품시스템(Rule Based Product Factory)을 직접 설계하여 상품/Rule 전문가로 더 많이 알려져 있다. 2006년 미래에셋생명 차세대 시스템 구축 시 상품규칙 컨설턴트로 참여한 인연으로 2008년 미래에셋생명 입사 후 개발팀장. 기획팀장, 운영팀장을 두루 거쳐 현재는 IT지원본부장을 맡고 있다.

DR 고도화 사업을 하게 된 이유는 운영팀장 시절 초기에 크고 작은 장애가 스트레스였다. 1~2년 고생해서 장애를 어느 정도 해결하고 나니 재해가 걱정됐다. 그저 요행을 바라는 안일한 성격의 소유자가 아니다보니 발 뻗고 편하게 잘 자려고 이사업을 시작하게 되었고, 완료한 지금은 해외 천재지변 뉴스도 편히 볼 수 있게 되었다.

 

 

< 저작권자 © CIOCISO 무단전재 및 재배포금지 >
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 미투데이 요즘 네이버 구글 msn 뒤로가기 위로가기
이 기사에 대한 댓글 이야기 (0)
자동등록방지용 코드를 입력하세요!   
확인
- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
이 기사에 대한 댓글 이야기 (0)
최근인기기사
1
CIOCISO매거진 주최 제2회 IT 로드쇼 / 나주
2
interview ∣ 김상철 텔스트라코리아 지사장
3
Cover story ∣ AIA생명 김대일 부사장(운영본부장)
4
interview ∣ 송상엽 한컴시큐어 이사, 사이버시큐리티 사업1팀
5
interview ∣ 임종혁 에이치투오시스템테크놀로지(H2O) 대표이사
6
interview ∣ 구자동 케이사인 부사장
7
interview ∣ 박대성 라임라이트네트웍스코리아 지사장
8
interview ∣ 김계관 그리드원 대표이사
9
Cover story ∣ 강민석 흥국생명 IT실 상무
10
제15차 CISO컨퍼런스
신문사소개기사제보광고문의불편신고개인정보취급방침청소년보호정책이메일무단수집거부
121-220 서울시 마포구 합정동 354-18 삼성전기 빌딩 별관3층  |  대표전화 : 02-2632-7561  |  상호명 : (주)씨미디어그룹
사업자등록번호 : 107-81-57633  |  대표자명 : 김영춘  |  통신판매업신고번호 : 제2008-서울마포-01059호  |  인터넷신문 등록번호 : 서울, 아03158
등록연월일: 2014년 5월 16일  |  제호: CIOCISO  |   발행·편집인: 김영춘  |   청소년보호책임자: 김영춘
Copyright © 2012 CIOCISO. All rights reserved. mail to webmaster@ciociso.com