2024.04.19 (금)

  • 구름많음속초14.0℃
  • 구름많음19.1℃
  • 구름많음철원19.2℃
  • 구름많음동두천17.7℃
  • 흐림파주15.2℃
  • 구름많음대관령12.4℃
  • 구름많음춘천21.2℃
  • 흐림백령도12.0℃
  • 황사북강릉13.5℃
  • 구름많음강릉15.4℃
  • 구름많음동해14.3℃
  • 흐림서울18.2℃
  • 흐림인천14.7℃
  • 흐림원주20.8℃
  • 황사울릉도16.1℃
  • 구름많음수원16.5℃
  • 흐림영월18.9℃
  • 구름많음충주19.1℃
  • 구름많음서산15.8℃
  • 흐림울진16.2℃
  • 구름많음청주21.3℃
  • 구름많음대전20.5℃
  • 구름많음추풍령18.7℃
  • 구름많음안동21.3℃
  • 구름많음상주22.6℃
  • 흐림포항23.4℃
  • 흐림군산15.4℃
  • 구름조금대구23.4℃
  • 구름많음전주19.5℃
  • 황사울산17.9℃
  • 황사창원17.5℃
  • 구름많음광주21.5℃
  • 황사부산16.9℃
  • 구름많음통영15.8℃
  • 구름많음목포18.7℃
  • 구름많음여수17.3℃
  • 흐림흑산도14.1℃
  • 구름많음완도15.6℃
  • 구름많음고창16.3℃
  • 구름많음순천16.3℃
  • 구름많음홍성(예)17.6℃
  • 구름많음19.0℃
  • 황사제주17.9℃
  • 흐림고산16.5℃
  • 구름많음성산17.0℃
  • 황사서귀포17.8℃
  • 구름많음진주18.7℃
  • 흐림강화12.8℃
  • 흐림양평20.2℃
  • 구름많음이천19.5℃
  • 구름많음인제19.1℃
  • 구름많음홍천20.2℃
  • 흐림태백14.6℃
  • 흐림정선군18.8℃
  • 흐림제천17.0℃
  • 구름많음보은18.5℃
  • 구름많음천안18.5℃
  • 흐림보령14.1℃
  • 흐림부여17.1℃
  • 구름많음금산18.9℃
  • 구름조금19.7℃
  • 흐림부안16.2℃
  • 흐림임실18.9℃
  • 흐림정읍17.7℃
  • 구름많음남원19.7℃
  • 구름많음장수15.7℃
  • 구름많음고창군16.0℃
  • 구름많음영광군17.2℃
  • 구름많음김해시18.3℃
  • 구름많음순창군19.5℃
  • 구름많음북창원19.7℃
  • 구름조금양산시18.9℃
  • 구름많음보성군17.1℃
  • 구름많음강진군17.8℃
  • 구름많음장흥15.7℃
  • 구름많음해남15.7℃
  • 구름많음고흥15.6℃
  • 흐림의령군20.6℃
  • 구름많음함양군18.8℃
  • 구름많음광양시19.2℃
  • 흐림진도군16.2℃
  • 흐림봉화16.9℃
  • 구름많음영주20.1℃
  • 구름많음문경19.4℃
  • 구름많음청송군16.9℃
  • 구름많음영덕16.9℃
  • 구름많음의성18.3℃
  • 구름조금구미20.0℃
  • 구름많음영천23.0℃
  • 구름많음경주시20.9℃
  • 흐림거창19.3℃
  • 흐림합천21.4℃
  • 구름많음밀양20.8℃
  • 구름많음산청19.2℃
  • 구름많음거제18.2℃
  • 구름많음남해17.6℃
  • 구름많음17.6℃
기상청 제공
Risk-free 데이터센터, 효율성과 즉시성 두 마리 토끼 잡아야
  • 해당된 기사를 공유합니다

NEWS

Risk-free 데이터센터, 효율성과 즉시성 두 마리 토끼 잡아야

31차 CIO 컨퍼런스

31차 CIO 컨퍼런스 

 
Risk-free 데이터센터, 효율성과 즉시성 두 마리 토끼 잡아야 
 
 
   
 
 
가상화가 본격화되면서 국내 데이터센터는 점점 고도화되고 있지만 복잡성이 증가하면서 이에 대한 ‘리스크 관리’가 화두로 떠오르고 있다. 신규 서비스와 시장의 변화에 따라 시스템 애러 및 재해 발생시 이에 대한 대응책의 약화, 보안 취약성이 증가하고 있는 것이다. 이번 31차 CIO컨퍼런스에서는 ‘Risk-free 데이터센터 이렇게 구축하자’라는 주제로 장애 요인에 대한 취약점 분석 및 자동화, 고도화, 재해복구 방법론을 통해 이를 극복하는 방안에 대해 논의했다.    
 
방창완 편집국장 bang@ciociso.com  
 
플래시메모리 적용으로 운영비용 85% 절감 
 
   
▲ SBCK최민식과장
 
SBCK 최민식 과장은 ‘Flash Memory in Data Center’라는 주제를 통해 플래시 메모리를 이용한 업무의 효율화에 대해 강조했다. 최근 데이터 센터는 지속적 응답과 고속 프로세스를 요구하는 애플리케이션 때문에 플래시 메모리를 업무에 적용하고 있다는 것이다. 
 
제이디닷컴의 경우, 데이터센터에 퓨전아이오의 카드타입 플래시 메모리를 적용함에 따라 기존에 10대의 서버로 운영했던 것을 서버 한 대로 업무에 필요한 인프라를 완성했다. 기존 업무를 위한 서버와 외장 스토리지가 불필요해 랙 공간을 절감했으며, 전력비용을 절감하는 효과를 봤다. 3~5배의 성능 향상과 애플리케이션 성능 및 응답속도가 눈에 띄게 개선됐다. 
 
플래시메모리는 기존의 SSD에 비해 여러 채널을 동시에 사용할 정도로 많은 대역폭을 확보하고 있으며 가속이 가능하다. 5배 이상의 성능개선 효과와 매출 극대화, 데이터센터 운영비용을 절감하는 효과를 봤다고 설명했다. 하드 디스크에 퓨전아이오메모리를 장착해 액티브-액티브 방식으로 사용한 결과 운영비용을 85% 절감하고 있다.   
 
SBCK는 전 세계 최대 가입자를 보유하고 있는 인터넷통신회사로 현재 국내에서 퓨전아이오의 총판 역할을 담당하고 있다. 
 
서버운영자동화로 재난에 신속히 대처  
 
   
▲ 투비즈테크놀로지 이주흥상무
 
투비즈테크놀로지 이주흥 상무는 재난에 따른 재해복구의 중요성에 대해 강조했다. 그는 재해복구시스템은 일종의 보험을 드는 것과 같다며, 보험은 문제가 발생했을 때 이를 대비하기 위한 것으로 평소의 건강을 체크하는 것과 같다고 설명했다. 
 
그는 재난은 여러 종류가 있을 수 있다고 말했다. 일반적인 재난도 있지만 오해나 실수 및 시스템 오작동에 의한 사고는 재난에 버금가는 손실을 줄 수 있다는 것이다. 시스템도 보통 3~5년 주기로 교체하기 마련이다. 노후에 따른 위험 증가. 시스템이 발전하면서 변경되는 부분, 설계의 문제, 칩 자체의 문제 등 소소하긴 하지만 그것 때문에 불편할 수도 있으며 때에 따라서는 일주일 이상 밤을 새는 경우도 있다는 것이다.  
 
그는 현 수준에서는 대응이라면 훈련과 매뉴얼이 있지만, 이는 현실적인 대응이 되기 어렵다는 것이다. 실제 시스템 전체를 내려 재기동이 제대로 되는지 살펴볼 필요가 있다는 것. 하지만 오작동을 우려해 이런 검증은 이뤄지지 않고 있다. 농협의 경우, 서버가 기본적으로 1,500대가 있지만 2000대, 때로는 3000대 이르는 곳도 있다. 이를 매뉴얼과 반복훈련으로 감당할 수 없는 만큼 표준화와 자동화를 통해 해결해 가야한다고 강조했다.  
 
이주흥 상무는 운영 프로세스를 표준화하고 자동화하면 관리가 정확하며, 안정성에 대한 확보가 가능하다고 말했다. 신속한 정상처리가 가능한 만큼 서버운영 프로세스 자동화와 표준화는  중요하다는 것이다. 그는 수작업에는 한계가 있는 만큼 표준화를 통해 자동화를 진행하면 시간도 절약되고 재난에 용이하게 대처할 수 있다고 설명했다.  
 
실제 서버 자동화 프로세스는 전체 시스템에서 어떤 OS와 서비스가 이뤄지는지 이를 파악하고 연관관계를 분석해 이를 시스템에 등록하게 된다. 표준화와 함께 공통 부분화가 이뤄지며 승인을 걸쳐 실행을 하게 된다. 실행은 대시보드를 통해 즉시 파악할 수 있다. 서버 자동화에 앞서 표준화가 중요한 것은 OS와 DB, WAS 등이 담당자에 따라 업무 프로세스가 다를 수 있기 때문에 이를 표준화 해야만 인수인계나 담당자 부재시 신속하게 대처할 수 있다. 
 
실행에 앞서 적용 테스트도 중요하다는 것. 보통 서버에 대해 담당자가 알고 있는 것과 실제는 다를 수 있다는 것이다. 따라서 전체 서버에 대한 시뮬레이션 테스트가 필요하다는 것이다. 
 
심플 아키텍처로 데이터센터 효율화 
 
   
▲ 시스코 안혁수석부장
 
시스코시스템즈코리아의 안혁 수석부장은 ‘클라우드 환경을 위한 정책기반 데이터센터 네트워크’에 대해 설명했다. 그는 최근 데이터센터의 화두는 가상화와 클라우드 서비스라며, 하드웨어를 줄여 저 전력 환경을 구성함에 따라 비용을 절감할 수 있다는 것이다. 또한 준비된 서비스를 요구사항에 신속하게 반영할 수 있다.  
 
스마트폰에서 실행되는 게임 앱을 개발하는 회사의 경우, 최근 게임 순환속도가 빠르게 때문에 수명이 6개월 정도인 경우가 많으며, 카카오톡을 통해 1위에 등극하더라도 유지는 1~2주여서, 가상화를 이용해 서비스를 신속하게 진행하고 유지할 필요가 있다. 그만큼 가상화가 중요하지만 생각처럼 반영이 쉽지 않다는 것이다.  
 
기존의 데이터센터에는 서버와 스토리지를 위한 네트워크 환경에서 랜이 존재하기 마련이다. 일부 SAN 영역인 FC가 존재한다. 걸림돌은 기존의 수직적 계층적 구조에서 문제가 발생한다는 것이다. 랜과 SAN은 매번 커뮤니케이션이 이뤄져야 하지만 이것이 쉽지 않다는 것. 전달 내용은 같지만 서로의 언어가 틀리기 때문에 협업이 어렵다는 것이다. 
 
결국 사일로 형태의 가상화가 존재하기 마련이며, 관리에 어려움도 따르고 복잡성이 증가함에 따라 가상화 및 클라우드 환경과는 방향이 맞지 않는다는 것이다. 보통 랙위에 관리용 스위치,  이더넷스위치, SAN스위치를 배치하는데 이러다 보면 케이블도 복잡해지고, 새로운 디자인 구성에 대한 필요성과 함께 관리 포인트도 늘어나기 마련이다.  
 
랜과 SAN이 서로 분리되어 있어 개별적인 관리가 이뤄지고 있는 만큼 이것은 2군데에 대해 투자하고 있는 것과 마찬가지라는 것. 그래서 탄생한 것이 두 영역을 모두 수용할 수 있는  FCoE이다. 모든 스토리지 및 서버 기업들이 FCoE에 투자하는 이유는 데이터센터 아키텍처를  단순하고 깔끔하게 구성할 수 있도록 해주기 때문이다. 
 
시스코의 블레이드 서버도 FCoE를 지원한다는 것이 그의 설명이다. 심플하면서 공기 순환흐름을 원활하게 해준다는 것. 팬을 많이 돌릴 필요가 없어 전력 및 비용절감 효과를 가져다준다는 것이다. 데이터센터에 x86서버를 활용할 때도 시스코의 UCS가 이를 단순화 시켜준다고 그는 강조했다. 물리적 서버와 가상화 환경 통합을 자연스럽게 할 수 있도록 해주며 비용 및 관리 부분도 손쉽게 해결해 준다.  
 
1차로 VDI 프로젝트를 진행한 울산현대중공업은 2차로 시스코의 아키텍처를 새롭게 수용했다. 도입 이후 간단한 형태로 랜과 SAN을 통합하는 아키텍처를 구성한 것. 상면공간을 75% 이상 감소시켰으며 서버도 25% 절감함에 따라 운영관리 부분도 90% 감소시키는 결과를 낳았다. 
 
x86서버 환경에서 데이터 유실없이 백업 및 복구 완성
 
   
▲ 델소프트웨어 최정근부장
 
‘서비스 복구 신뢰성 확보방안’이라는 주제로 발표한 델소프트웨어의 최정근 부장은 비즈니스 연속성을 강조했다. 비즈니스 연속성은 기업의 수익과 직결되기 때문에 그만큼 중요하다는 것이다. 하지만 위험 요소는 많다. 자연재해로 센터가 무너질 수 있으며 애플리케이션 장애로 서비스가 중단될 수 있다. 
 
사람의 실수도 발생할 수 있다. 기업에서는 이런 이유로 베인 데이터센터외에 백업센터를 구축하고 이중화를 진행하며 백업에 있어서 1,2,3차 백업까지 진행한다. 하지만 이런 백업에는 한계가 따르기 마련이라는 것. 보통 이중화를 하면 동일한 스팩과 플랫폼이 요구되지만 이런 환경을 구현하려해도 거리의 제한이 따른다. 스토리지의 경우 원거리 구축은 바로 고비용으로 이어진다. 
 
그렇다고 테이프 백업은 느릴뿐 아니라 복구도 어렵다. 최근 모 회사의 데이터센터 화재로 서비스가 중단됐을 때 서비스가 중단된 이유는 백업센터를 구축하지 않았기 때문이라는 것이다. 투자를 미룬 결과가 재앙을 불러왔다는 것이다. 비용을 최소화하면서 서비스를 실행할 수 있는 최적의 솔루션을 찾아야하는 것은 당연한 이치이다.   
 
비용도 비용이지만 제대로 된 복구가 가장 중요 요소가 되고 있다. 최정근 부장은 서비스 복구시 신뢰성을 확보하는 방안에 대해 강조했다. 그는 복구가 실패하게 되면 서비스가 중단되는 만큼 복구를 하더라도 서비스 품질의 중요성을 강조했다. 최정근 부장은 델의 솔루션 컨셉은 신뢰성이라며, 확실한 복구를 위해 델의 셰어플렉스가 이를 수행할 수 있다고 강조했다.
 
셰어플렉스는 x86서버 기반 백업 및 복구 솔루션으로 백업시 동일한 플랫폼을 그대로 구성하는 것이 아니라 별도의 버추얼 머신에 옮기는 환경을 구성한다. 이는 인프라 비용을 최소화하기 위해서다. DB복제시 유실을 최소화해 바로 서비스가 될 수 있도록 복구가 이뤄진다. 
 
최정근 부장은 델의 앱에슈어(AppAssure)는 백업 시간을 단축하는데 유용하게 활용되고 있다고 강조했다. 앱에슈어는 5분 간격으로 이미지 백업이 이뤄지며 중복 데이터를 제거해 백업시간을 최소화 시켜준다는 것이다. 가상 및 물리적인 환경에서 x86서버를 사용하는 경우라면 이기종에 상관없이 복구가 가능하다. 또한 백업된 데이터에 대한 검증을 통해 데이터가 제대로 복구가 되고 돌아가는지 체크해준다. 
 
재해복구 상시점검 위한 솔루션 중요 
 
   
▲ 시만텍코리아 박철현이사
 
시만텍코리아의 박철현 이사는 ‘재해복구의 상시점검 방안’에 대해 설명했다. 그는 누구나 재해복구에 대해서 이야기는 하고 있지만, 막상 일이 벌어졌을 때 ‘실행에 대한 확신이 있는가’에 대해 의문점을 제시했다. 운영환경은 계속 변화하고 있으며 물리적 변화와 함께 소프트웨어의 변화는 계속 일어난다는 것이다. 이런 환경에서 재해복구가 잘 반영이 될지 의문이 생길 수 밖에 없다는 것.  
 
그는 사실 ROI가 가장 안나오는 분야가 재해복구센터라고 말했다. 투자는 하지만 제대로 써먹지는 못하고 있는 것이 현실이기 때문이다. 그래서 비용효율을 위해 근거리에 액티브 형태의 복구센터를 두고 활용하는 경우가 있다는 것이다.  
 
대형병원의 경우, 액티브로 활용하고 있다고 그는 전했다. 비용 효율성과 비즈니스 연속성을 위한 근거리 개념이 실제 효과를 보고 있다는 것. 금융권에서는 제3센터에 대한 논의가 이뤄지고 있다고 그는 전했다. 국내 기업 중 일부 업무에 대해서 아마존의 DR(재해복구)서비스도 받고 있다는 것. 박철현 이사는 어떤 방법이 정답이라는 것보다는 회사의 예산과 투자여력을 감안할 때 적합한 방법론을 찾고 활용할 수 있도록 관리돼야하는 것이 중요하다고 지적했다. 
 
하지만 관리가 쉽지만은 않다. 전산센터가 하드웨어와 소프트웨어로 복잡하게 얽혀있기 때문에 변경이 이뤄졌을 때 재해복구센터에는 리스크가 발생할 수 있다. 문제 발생시 이를 찾아내는 것도 어렵다는 것. 이런 환경에서 박철현 이사는 효율적인 방법론으로 재해복구센터 전환시 취약점을 찾아내는 솔루션에 대해 강조했다. 
 
에이전트 리스 방식은 시스템에 대한 부하 없이 문제점을 찾고 리포팅을 해주며 조치사항을  알려준다는 것이다. 정보 수집후 문제점을 찾아내는 방식이다. 보통의 문제점은 스토리지 복제가 누락되는 경우가 많다는 것. 데이터를 빼먹거나, 서버 증설이후 백업이 단절 된 경우가 있다는 것이다. 이럴 경우 데이터의 취약점을 찾고 가용성의 취약점과 업무별로 SLA가 다를 수 있기 때문에 이를 파악해 낸다. 
 
시만텍코리아의 재해복구 상시점검 절차는 메인센터와 재해복구센터간의 정합성을 맞춰서 필요할 때 동일 서비스가 가능한지 점검해준다. 취약성을 분석하고, 주기적으로 점검이 이뤄지며, 취약점을 자동으로 찾아내 준다는 것. 또한 담당자에게 정보를 제공해 이에 대한 조치 및 결과에 대한 피드백을 전달해 준다. 박철현 이사는 재해복구는 정합성이 중요하며 인프라 비용을 줄이기 위해서는 관리하고 상시 점검할 수 있는 솔루션이 중요하다고 강조했다. 
 
본사와 지점간 복구와 백업의 운영 효율성 모색   
 
   
▲ 리버베드코리아 유병수부장
 
리버베드코리아의 유병수 부장은 ‘인텔리전스 환경의 재해복구와 백업’에 대해 설명했다. 그는 비즈니스 업무 환경이 변화하면서 데이터의 중요성은 더욱 커지고 있다고 강조했다. 하지만 데이터는 계속 증가하고 복잡해지고 있다는 것. 
 
유부장은 이런 데이터 보호를 위한 효율적인 방법론으로 브랜치 오피스가 많은 기업의 경우, 중앙에 집중화된 관리를 통해 수고와 비용을 줄일 수 있는 방법에 대해 소개했다. 콜센터 업무가 많은 경우, 성능장애에 대한 이슈가 생기기 마련이다. 네트워크 트래픽 유동량을 파악해야 하지만 브랜치 오피스를 간소화 할 필요가 있다는 것. 주기적으로 데이터를 보호하고 백업해야하는 지사의 수가 많을수록 이는 데이터 센터의 복잡성을 가중시키는 원인이 되고 있다는 것이다. 
 
유병수 부장은 지사에서 데이터보호에 대한 필요성을 없애는 방법을 모색할 필요가 있다고 말했다. 메인 센터에서 데이터를 저장 할 때 TCO를 절감할 수 있을 뿐만 아니라 장애시 애플리케이션을 손쉽게 복구할 수 있다는 것이다. 보통 WAN(원거리통신망) 장애가 있을 때 업무 필요성 때문에 지사에 서버와 스토리지를 설치하는 경우가 있다. 
 
하지만 이는 하드웨어 비용 발생과 함께 주기적인 백업으로 인한 관리의 어려움이 따른다. 유부장은 리버베드의 ‘스틸퓨전’은 메인 데이터센터에서 가상화를 통해 이를 지사와 연결하고, 원본 스토리지는 메인센터에서 관리하는 방법을 취하자고 제안했다. 데이터가 중앙에서 관리되기 때문에 성능에 대한 이슈가 발생하지 않는다는 것. 이것이 새로운 형태의 브랜치 오피스 아키텍처 개념이라는 것이다.   
 
그는 스마트폰을 분실하게 되면 새로운 스마트폰을 개통하고, 앱은 다시 다운을 받으면 되며, 이메일 데이터는 본사에서 다시 받고 실행하는 개념으로 이해하면 된다고 설명했다. 동영상과 같은 파일은 주기적으로 백업을 했다면 활용할 수 있다는 것. 지사의 인프라가 이런 식으로 운영된다면 훨씬 스마트한 백업 및 재해복구 환경을 구현할 수 있다고 강조했다.  
 
지점에서 장애가 발생하더라고 보통은 복구하는데 24시간이 걸리기 마련이지만, 자사의 경우는 15분 만에 지사의 업무환경을 복구할 수 있다는 것이다. 직접적인 효과는 데이터를 센터에서 집중 관리하기 때문에 보안이 강화되고, 백업이 필요 없으며 하드웨어와 소프트웨어에 대한 비용도 없앨 수 있다는 것이 유부장의 설명이다.