2024.05.20 (월)

  • 흐림속초15.2℃
  • 흐림16.2℃
  • 흐림철원16.6℃
  • 흐림동두천18.2℃
  • 흐림파주18.7℃
  • 흐림대관령13.8℃
  • 흐림춘천16.3℃
  • 구름많음백령도16.6℃
  • 비북강릉14.5℃
  • 흐림강릉15.2℃
  • 흐림동해15.5℃
  • 구름많음서울19.7℃
  • 구름조금인천19.1℃
  • 흐림원주17.7℃
  • 구름조금울릉도18.1℃
  • 흐림수원18.5℃
  • 흐림영월16.1℃
  • 흐림충주16.8℃
  • 흐림서산18.2℃
  • 흐림울진16.1℃
  • 흐림청주17.7℃
  • 흐림대전17.6℃
  • 흐림추풍령16.1℃
  • 흐림안동16.6℃
  • 흐림상주18.7℃
  • 맑음포항22.9℃
  • 구름많음군산19.1℃
  • 맑음대구22.7℃
  • 구름많음전주20.3℃
  • 맑음울산23.3℃
  • 구름조금창원25.0℃
  • 맑음광주19.9℃
  • 맑음부산23.7℃
  • 구름조금통영22.6℃
  • 구름조금목포19.3℃
  • 맑음여수21.9℃
  • 구름조금흑산도21.8℃
  • 맑음완도24.3℃
  • 구름조금고창
  • 맑음순천21.8℃
  • 흐림홍성(예)17.7℃
  • 흐림15.8℃
  • 구름많음제주23.4℃
  • 구름많음고산20.7℃
  • 구름많음성산22.7℃
  • 구름많음서귀포22.2℃
  • 맑음진주21.3℃
  • 구름많음강화17.8℃
  • 흐림양평16.5℃
  • 흐림이천19.3℃
  • 흐림인제15.4℃
  • 흐림홍천15.0℃
  • 흐림태백14.6℃
  • 흐림정선군14.4℃
  • 흐림제천14.5℃
  • 흐림보은16.1℃
  • 흐림천안16.1℃
  • 구름조금보령20.3℃
  • 구름많음부여16.7℃
  • 구름많음금산17.8℃
  • 흐림16.7℃
  • 구름많음부안18.9℃
  • 구름조금임실19.0℃
  • 구름많음정읍20.0℃
  • 구름조금남원19.3℃
  • 구름조금장수18.6℃
  • 구름조금고창군20.2℃
  • 구름조금영광군20.2℃
  • 맑음김해시23.8℃
  • 맑음순창군19.0℃
  • 맑음북창원24.4℃
  • 맑음양산시23.1℃
  • 맑음보성군23.6℃
  • 맑음강진군21.9℃
  • 맑음장흥21.5℃
  • 구름조금해남21.0℃
  • 맑음고흥23.7℃
  • 맑음의령군22.5℃
  • 구름조금함양군21.4℃
  • 맑음광양시22.9℃
  • 맑음진도군21.3℃
  • 흐림봉화14.1℃
  • 흐림영주15.2℃
  • 흐림문경18.4℃
  • 흐림청송군17.1℃
  • 흐림영덕16.8℃
  • 구름많음의성21.0℃
  • 구름많음구미20.6℃
  • 맑음영천21.7℃
  • 구름조금경주시22.9℃
  • 구름조금거창18.6℃
  • 맑음합천21.8℃
  • 맑음밀양21.9℃
  • 구름조금산청20.5℃
  • 맑음거제23.0℃
  • 맑음남해21.3℃
  • 맑음22.7℃
기상청 제공
미디어젠, 2023 NIA 초거대 AI 모델 학습용 데이터 구축 사업 선정
  • 해당된 기사를 공유합니다

NEWS

미디어젠, 2023 NIA 초거대 AI 모델 학습용 데이터 구축 사업 선정

2023년_NIA_초거대_AI_데이터_구축_착수보.jpg

 

미디어젠 컨소시엄이 최근 인공지능(AI) 산업계의 이슈로 떠오른 ‘초거대 AI 모델(LLM)’을 위한 AI 데이터 구축 사업을 수주했다고 8월 29일 밝혔다.


미디어젠 컨소시엄은 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 ‘2023년도 인공지능 학습용 데이터 구축 사업’의 초거대 AI 모델을 위한 AI 학습용 데이터 구축 사업자로 최종 선정됐다. 이에 따라 헬스케어 분야에 대해 약 2억 어절 이상의 초거대 규모 생성형 AI 챗봇의 질의응답 데이터를 구축한다. 본 사업은 AI 최신 기술인 초거대 AI 언어모델 및 응용서비스 개발에 필수적인 대량의 말뭉치 데이터를 구축하는 것으로, 실제 일반인 및 의료진의 질의응답 데이터, 전문 의료 서적 데이터, 증강 데이터 등으로 구성된다.


미디어젠 컨소시엄은 미디어젠, 메트릭스, 비디, 위뉴, 메인 등 5개 전문 기업으로 구성돼 있다. 주관기관인 미디어젠은 초거대 AI 모델을 개발하고, AI 학습용 데이터 구축의 설계 및 품질 관리 전반을 관장한다. 크라우드 워커 전문 플랫폼 운용사인 메트릭스와 AI 소프트웨어 플랫폼 전문 기업인 비디는 다년간 AI 학습용 데이터 구축 사업에 참여해 AI 데이터 구축 프로세스에 따른 양질의 데이터를 구축한 경험을 보유하고 있다.


특히 참여기관 중 의료 전문 기업인 위뉴와 메인은 최근 생성형 AI 모델의 최대 약점이라고 불리는 데이터 환각(할루시네이션) 효과를 최소화하기 위한 실제 의료진 데이터의 수집 및 검수 역할을 담당할 예정으로, 초거대 AI 모델의 유용성을 크게 높일 수 있을 것으로 기대된다. 위뉴는 국립암센터, 네이버 하이퍼클로바X, 일산 백병원 등과 질의응답형 헬스케어 전문 지식 서비스 협약을 맺고 있으며, 메인은 원주 세브란스병원 등과 진단 정보 및 의료 데이터 정제 서비스를 진행하고 있다.


이번 데이터 구축 사업에서 초거대 AI 훈련용 데이터가 구축되면 생성형 AI 모델 기반 챗봇을 통해 손쉽게 헬스케어 분야에 대한 지식 정보를 얻을 수 있으며, 의료진이 직접 작성한 데이터를 활용해 질의응답의 내용적 불확실성을 최소화할 수 있을 것으로 기대된다.


사업을 총괄하고 있는 미디어젠의 송민규 상무는 “생성형 AI 챗봇에 대한 일반의 기대가 매우 큰 상황에서 초거대 AI 모델을 위한 대규모 데이터 구축 사업자로 선정된 것에 대해 매우 기쁘게 생각한다”며 “실생활에 밀접한 도움을 줄 수 있는 헬스케어 분야에서 AI 데이터의 환각 현상을 최소화하기 위한 노력을 아끼지 않을 예정”이라고 밝혔다.


초거대 AI 모델 학습을 위한 헬스케어 질의응답 데이터 구축은 올해 연말까지 진행되며, 구축이 완료된 후에는 한국지능정보사회진흥원(NIA)에서 운영하는 ‘AI-Hub’를 통해 모든 데이터가 일반에 공개될 예정이다.

관련기사