2024.05.18 (토)

? Operation now in progress (115)
n
기상청 제공
GM사례, 통합된 데이터로 비즈니스 가치를 창출한다
  • 해당된 기사를 공유합니다

COLUMN

GM사례, 통합된 데이터로 비즈니스 가치를 창출한다

현장리포트/Teradata Partners 2014 둘째날

현장리포트/Teradata Partners 2014 둘째날 

 
GM사례, 통합된 데이터로 비즈니스 가치를 창출한다 
 
장동인 부사장, 한국 테라데이타
 
 
   
▲ 장동인 한국테라데이타 부사장
 
<미국 테네시 내쉬빌> 오늘은 고객사 사례 위주로 둘러 봤다. 가장 주목을 끈 것은 GM 사례였다. 알다시피 GM은 원래 2009년에 파산을 했었다. 그러다가 다시 시작해서 2010년에 주식시장 재상장에 성공했다. 
 
현재 전 세계 120개국, 20만명의 직원이 있으며 11개 브랜드로 자동차를 생산하는 공장이 168개가 있다. 이런 거대한 회사의 IT는 대체적으로 분산된 구조로 운영될 수 밖에 없다. 기존에는 200여개 이상의 분산된 데이터 마트가 있었고, 4만여개의 애플리케이션간 데이터 인터페이스가 존재할 정도로 복잡한 구조로 되어 있고, 정보를 통합 하는데 필요한 인력도 많이 들어갔으며 각 현업 부서별로 IT를 운영해왔다(shadow IT operation).   
 
랜디 모트 GM CIO은 신속하고 통합된 정보를 제공하는 것이 GM이 혁신을 하는 최선의 길이라고 믿었다. 그 결과 GM은 3년에 걸쳐서 완전히 새로운 통합된 정보계 시스템을  구축했으며, 위의 문제점들을 해결했다. 특히 기존에 EDW(엔터프라이즈 데이터웨어하우스)와 하둡 및 디스커버리 플랫폼을 같이 통합한 최신의 아키텍처로 구성했다.  
 
(참조: 랜디모트 GM CIO 스토리)  http://www.automotiveit.com/under-mott-gms-it-transformation-moves-forward/news/id-009216 
 
데이터 수집과 저장에 초점을 맞추다
GM은 새로운 EDW 비전에 대해  “글로벌하게 통합된 데이터를 리포팅하고 분석하고 탐색함으로써 비즈니스 가치를 창출” 하는데 있다고 선언했다. 당연한 이야기이지만 현실로 들어가면 그렇게 쉽게 달성할 수 있는 목표가 아니다. 
 
이를 위해서 GM은 다음과 같은 중요한 원칙들을 내걸었다. 앞으로 기존 EDW 체계를 차세대 수준으로 업그레이드하려는 국내 CIO들을 위해서 좀더 자세하게 설명하도록 하겠다.
 
● 전세계 GM에 있는 고급 데이터, 안정되고 통합된 단 하나의 EDW를 만든다.
● 가장 최신의, 유연하고, 빠르고, 고도의 확장성이 있으며, 고가용성의 분석환경을 만든다.
● 정형, 비정형, 복합 데이터등을 포함하는 모든 데이터가 담긴 데이터는 가공하지 않은 원천 데이터 수준(atomic level)으로 보관하며, 이에 대한 분석과 탐색을 통해 신속한 비즈니스 의사결정을 한다.
● 여러 개의 사업본부를 독립적으로 관리할 수 있는 멀티테넌트(multi-tenant) 환경에 구현된 표준화된 복수개의 현업 분석툴들을 사용해서 현업 스스로 데이터를 분석하고 리포팅을 한다. 
● 기업의 중역들로부터 전폭적인 지원을 받는 능동적인 데이터 거버넌스와 관리정책을 통해서 데이터의 품질을 높인다.
● 정보 접근은 유연한 보안 프레임워크를 통해서 통제되고 안전하게 보호되도록 한다. 
 
GM은 이런 원칙에 의거해서 시스템을 구축했다. 다음은 GM의 새로운 EDW 아키텍처이다. 자료를 따로 받지 못해서 부족한데로 촬영을 했다. 독자 여러분들의 양해를 바란다.
 
 
   
 
<사진설명> Core GM EDW architecture; 발표자 Brett Vermette (GM EDW 담당 디렉터)
 
여기서 기존의 EDW에서는 없던 부분이 다양한 형태의 데이터를 받아들이고 처리하는 플랫폼이 많아졌다는 점이다. 특히 국내 독자들에는 생소한 데이터 레이크(data lake)라는 부분이 있는데,  이것은 데이터의 수집을 빠르게 하고 데이터의 통합 효율을 높이기 위해서 도입된 솔루션이다.  
 
데이터 레이크는 초고속, 초대용량으로 발생하는 데이터를 일단 수용하는데 초점을 맞췄다. 하둡은 관계형 데이터베이스와는 달리 데이터의 형태가 미리 정해진 스키마가 필요 없기 때문에 발생하는 데이터를 바로 수용할 수 있다.  매일 3테라바이트의 데이터가 데이터 레이크로 저장된다. 이 데이터 중에서 1테라바이트의 데이터만 통합된 코어로 들어가게 되고, 이중에서 매일 500 기가바이트가 분석 시스템과 디스커버리 시스템으로 들어가게 된다. 
 
현업에서 직접 데이터를 가공하고 분석한다 
지난번 이베이 사례를 통해서 본 것과 같이 분석과 탐색의 차이점을 분명히 하고, 이 둘을 따로 시스템을 구축한 점이 특이하다. 그리고 10,000명의 동시 접속자들이 이 시스템을 사용할 수 있도록 했다. 소비(consumption) 부분은 용어가 좀 생소한데, 각 현업들이 자신들이 원하는 분석툴로 자신들의 데이터를 직접 가공 분석하는 것을 말한다. 
 
GM의 새로운 EDW 아키텍처에서 대단하다고 느끼는 것은 EDW를 구성하는 핵심 플랫폼을 이중화한 것이다. 이것은 현업 부서와의 시스템 서비스 계약(SLA) 때문에 두 개의 데이터 센터에 이중화를 했다고 한다.
 
   
 
 
사실 기존의 운영계 시스템을 이중화하는 것이 일반적인 일이지만, EDW를 이중화했다는 것은 거의 처음이 아닌가 싶을 정도로 생소한 것이었다. 이는 GM에 있어서 데이터 분석과 탐색이 얼마나 중요한가를 역으로 반증한 결과가 아닌가 한다. 
 
GM의 사례를 지켜보면서 자신감이 넘치고 있다는 것을 느낄 수 있었다. 자신들이 과거 3년간 고민하고 해왔던 일들을 상세한 아키텍처와 함께 자신 있게 발표한 점이다. 또 한가지는 나이가 50대가 넘은 분들이 하둡 기술에 대해서 아무렇지 않게 발표하고 있다는 점이다.
 
이것은 이번 GM 사례뿐만 아니라 전체 세션을 통해서 보여지는 공통된 모습이다. 이분들은 나이가 들어도 새로운 기술이 꼭 필요하다면 적극적으로 배우고 활용하려는 의지가 있는 것 같다.  
 
GM 하나의 세션만으로도 필자의 지적인 호기심을 채우기에 충분했지만, 이어서 발표한 볼보 자동차 세션 또한 가치있는 발표였다. 이것은 다음번에 이야기하기로 하겠다. 멋진 GM 세션으로 인해 오늘은 아주 행복한 하루였다.