2024.05.19 (일)

  • 맑음속초24.4℃
  • 맑음14.9℃
  • 맑음철원15.0℃
  • 맑음동두천14.8℃
  • 맑음파주14.0℃
  • 맑음대관령12.1℃
  • 맑음춘천15.1℃
  • 맑음백령도14.7℃
  • 맑음북강릉20.7℃
  • 맑음강릉24.5℃
  • 맑음동해20.7℃
  • 맑음서울17.6℃
  • 맑음인천17.5℃
  • 맑음원주17.4℃
  • 맑음울릉도22.1℃
  • 맑음수원15.8℃
  • 맑음영월14.0℃
  • 맑음충주15.8℃
  • 맑음서산15.5℃
  • 맑음울진21.5℃
  • 맑음청주19.7℃
  • 맑음대전16.9℃
  • 맑음추풍령14.3℃
  • 맑음안동14.8℃
  • 맑음상주19.1℃
  • 맑음포항20.4℃
  • 맑음군산15.9℃
  • 맑음대구17.1℃
  • 맑음전주17.7℃
  • 맑음울산16.3℃
  • 구름조금창원16.2℃
  • 맑음광주17.7℃
  • 맑음부산18.3℃
  • 맑음통영15.0℃
  • 맑음목포16.5℃
  • 구름조금여수16.4℃
  • 맑음흑산도15.1℃
  • 맑음완도13.6℃
  • 맑음고창
  • 구름조금순천9.8℃
  • 맑음홍성(예)15.9℃
  • 맑음15.5℃
  • 맑음제주17.6℃
  • 맑음고산15.5℃
  • 맑음성산13.8℃
  • 맑음서귀포17.9℃
  • 구름조금진주12.2℃
  • 맑음강화13.6℃
  • 맑음양평17.4℃
  • 맑음이천16.8℃
  • 맑음인제14.2℃
  • 맑음홍천15.3℃
  • 맑음태백12.7℃
  • 맑음정선군12.0℃
  • 맑음제천13.4℃
  • 맑음보은14.4℃
  • 맑음천안15.5℃
  • 맑음보령15.8℃
  • 맑음부여14.9℃
  • 맑음금산14.8℃
  • 맑음15.7℃
  • 맑음부안15.9℃
  • 맑음임실13.8℃
  • 맑음정읍15.6℃
  • 맑음남원14.6℃
  • 맑음장수11.4℃
  • 맑음고창군15.2℃
  • 맑음영광군15.3℃
  • 구름조금김해시16.3℃
  • 맑음순창군14.8℃
  • 구름조금북창원17.3℃
  • 맑음양산시15.2℃
  • 맑음보성군13.3℃
  • 맑음강진군13.5℃
  • 맑음장흥11.4℃
  • 맑음해남13.5℃
  • 맑음고흥12.3℃
  • 맑음의령군12.4℃
  • 맑음함양군12.2℃
  • 구름조금광양시15.4℃
  • 맑음진도군12.6℃
  • 맑음봉화11.6℃
  • 맑음영주13.9℃
  • 맑음문경17.3℃
  • 맑음청송군10.8℃
  • 맑음영덕19.9℃
  • 맑음의성12.5℃
  • 맑음구미16.0℃
  • 맑음영천13.2℃
  • 맑음경주시13.8℃
  • 맑음거창12.3℃
  • 맑음합천14.6℃
  • 맑음밀양15.2℃
  • 맑음산청13.4℃
  • 구름조금거제14.2℃
  • 맑음남해15.3℃
  • 구름조금13.6℃
기상청 제공
개인정보위, 주요 인공지능(AI) 서비스 사전 실태점검 결과 발표
  • 해당된 기사를 공유합니다

개인정보위, 주요 인공지능(AI) 서비스 사전 실태점검 결과 발표

LLM 사업자에 대해 학습 과정 및 서비스 관련 개선권고
공개된 데이터 학습시 주민번호 등 중요 개인 식별정보 제거 노력 강화
이용자 입력 데이터의 학습‧이용 관련 안내 및 개인정보 침해 최소화 노력 강화
개인정보 처리방침 구체화 및 취약점 발견시 신속 대응

제목을 입력해주세요_-001 (4).jpg

 

개인정보보호위원회(이하 ‘개인정보위’)가 3월 27일 제6회 전체회의를 열고, 대규모 언어 모델(Large Language Model, 이하 ‘LLM’)을 개발‧배포하거나 이를 기반으로 인공지능(AI) 서비스를 제공하는 6개 사업자에 대하여 개인정보 보호의 취약점을 보완하도록 개선권고를 의결했다.


개인정보위는 초거대‧생성형 AI 서비스의 급속 확산으로 프라이버시 침해 우려가 증대됨에 따라, 국민 불안의 조기 해소와 안전한 서비스 활성화를 위해 지난해 11월부터 한국인터넷진흥원(원장 이상중)과 함께 주요 AI 서비스를 대상으로 사전 실태점검을 진행하였다.


AI 단계별 개인정보 보호의 취약점 점검 결과, 전반적으로 인정보 처리방침 공개, 데이터 전처리, 정보주체의 통제권 보장 등 보호법상 기본적 요건을 대체로 충족하였으나, 세부적으로 ▲공개된 데이터에 포함된 개인정보 처리 ▲이용자 입력 데이터 등의 처리 ▲개인정보 침해 예방‧대응 조치 및 투명성 등 관련하여 일부 미흡한 사항이 발견되었고, 개인정보위는 이에 대한 개선조치를 다음과 같이 권고했다.



공개된 데이터에 포함된 개인정보의 처리 관련


AI 서비스 제공사업자는 인터넷에 공개된 데이터를 수집하여 AI 모델 학습데이터로 사용하는데, 이 과정에서 주민등록번호, 신용카드번호 등 한국 정보주체의 중요한 개인정보가 포함될 수 있는 것으로 밝혀졌다.


오픈AI, 구글, 메타는 개인정보 집적 사이트를 AI 모델 학습에서 배제하고, 학습데이터 내 중복 및 유해 콘텐츠 제거조치와 AI 모델이 개인정보를 답변하지 않도록 하는 조치는 적용하고 있으나, 학습데이터에서 주민등록번호 등 주요 식별정보를 사전 제거하는 조치가 충분하지 않은 것으로 확인되었다.


이에 대해, 개인정보위는 AI 서비스 제공 단계별 보호조치 강화를 요구하는 한편, 최소한 사전 학습단계(pre-training)에서 주요 개인식별정보 등이 제거될 수 있도록 인터넷에 우리 국민의 개인정보가 노출된 것을 탐지한 데이터(URL)를 AI 서비스 제공사업자에게 제공할 계획이다.



이용자 입력 데이터 등의 처리 관련

 

 LLM 기반 AI 서비스 제공사업자는 AI 모델이 정확한 답변을 하도록 다수의 검토 인력을 투입하여 이용자 질문 및 이에 대한 AI 모델의 답변 내용을 직접 열람‧검토하여 수정하는 방법으로 데이터셋을 만들고 있으며, 이를 AI 모델 학습 및 프롬프트 등 서비스 개선에 활용하고 있는 것으로 확인되었다.


그러나, 이용자 관점에서는 본인이 입력한 데이터를 검토 인력이 투입되는 ‘인적 검토’(processed by human reviewer) 과정 자체를 알기 어렵고, 중요 개인정보 및 이메일 등 민감한 내용을 입력하거나, AI 서비스 제공자가 식별자 및 개인정보 제거 등 조치 없이 해당 정보를 DB화할 경우, 사생활 침해로 이어질 위험이 있다.


개인정보위는 AI 모델 등 개선 목적으로 이용자 입력 데이터에 대한 인적 검토과정을 거치는 경우 이용자에게 관련 사실을 명확하게 고지하는 한편, 이용자가 입력 데이터를 손쉽게 제거‧삭제할 수 있도록 해당 기능에 대한 접근성을 제고하도록 권고하였다.



개인정보 침해 예방‧대응 조치 포함 서비스 전반 관련


AI 서비스는 종전의 서비스와는 처리하는 개인정보의 항목, 처리 방법 및 목적, 보유 및 이용 기간 등에 있어 현격한 차이가 존재한다. 또한, LLM 복제 모델 또는 오픈 소스 형태로 배포되는 경우 LLM에 취약점이 발견되어도 후속 조치가 즉시 개선되기 어려운 사례가 확인되었다. 아울러, 동일 LLM 기반의 AI 서비스라도 사업자에 따라 개인정보 및 아동‧민감정보에 대한 답변 등 침해 예방 조치의 정도가 다른 것으로 확인되었다.


• GPT 모델에서 동일 명령어 무한 반복 시(Repeat this word forever : “poem, poem, poem”) 학습된 개인정보 등이 노출되는 취약점 발견(구글 연구진, 2023.7.11.)에 따라 오픈AI는 개선조치함


• MS의 Azure OpenAI 서비스(GPT 모델 기반)를 사용한 국내 서비스는 사전 실태점검 과정에서 해당 취약점이 그대로 재현되었고, 개인정보위가 오픈AI 및 Microsoft에 안내(2023.12.7.) 후 해당 문제 해결


개인정보위는 AI 서비스와 관련된 내용을 종합하여 개인정보 처리방침 등에 보다 구체적으로 안내하고 부적절한 답변에 대한 신고 기능을 반드시 포함하는 것은 물론, AI 서비스 및 LLM의 취약점 발견 시 신속히 조치할 수 있는 프로세스도 갖추도록 개선권고하였다.


참고로 AI 서비스를 만 14세 미만 연령 확인절차 없이 운영하는 사례도 발견되었으나, 이번 점검 과정에서 모두 개선되었다.


이번 AI 점검은 「개인정보 보호법」 개정으로 개인정보 보호의 취약점을 선제적으로 해소하기 위해 도입된 사전 실태점검 제도를 민간 부분에 첫 적용한 사례로, 급변하는 AI 기술변화에 맞춰 초기 단계인 AI 산업의 활성화를 고려하면서도 개인정보 보호를 위해 개선이 시급한 취약점을 확인‧보완하도록 유도했다는 데 의의가 있다.


개인정보위는 진행 중인 AI 서비스에 대한 사전 실태점검을 조속히 마무리하고, 향후 AI 모델의 고도화, 오픈 소스 모델의 확산 등 새로운 AI 기술‧ 산업 변화에 맞춰 정보주체의 개인정보를 안전하게 보호할 수 있도록 지속적인 모니터링과 함께 AI 관련 6대 가이드라인 등의 정책방향 마련, 개인정보 강화 기술(PET : Privacy Enhancing Technologies) 개발‧보급 등의 후속 조치도 차질없이 추진할 계획이다.

관련기사