한국형 AI 모델 '속속'…갈 길 바쁜 '데이터 주권' 강화

김윤경

yoon@kpinews.kr | 2025-07-04 17:45:36

한국어 이해하고 한국 문화·역사 담은 한국형 AI
주요 목표는 민감 정보 보호하는 데이터 주권 강화
과제 첩첩…데이터 확보 어렵고 법률 정비 시급
신속한 정책·실행 필수…"공공 선행 소비도 해법"

한국형 AI(인공지능) 모델들이 속속 모습을 드러내고 있다. 하지만 이들이 주요 기치로 내건 '데이터 주권 강화'는 갈 길이 멀다. 해결 과제가 산적해 정부의 신속한 대책 마련이 요구된다.

▲ 한국형 AI를 형상화한 이미지. [빙 이미지 크리에이터]

4일 관련업계에 따르면 LG AI연구원을 비롯해 SK텔레콤과 KT, 네이버, 카카오, 코난테크놀로지, 솔트룩스, 뤼튼테크놀로지 등 다수 기업들이 한국적 정서를 담은 AI 모델들을 선보이고 있다.

SK텔레콤이 전날 오픈소스 커뮤니티를 통해 '에이닷 엑스 4.0' 모델을 공개한데 이어 KT도 이날 '믿음 2.0' 미니와 베이스 모델을 오픈소스로 배포했다. 한국어를 잘 이해하고 한국 문화와 정서를 반영했다는 게 강점이다.

지난 2월 추론 특화 모델 '엑사원 딥'을 공개했던 LG AI연구원은 통합형 추론 모델인 '엑사원 4.0'을 개발 중이다. 자연어 처리는 기본이고 전문 용어와 긴 한국어까지 이해 가능할 것으로 기대된다. 이르면 이달 중 시장에 공개될 예정이다.

네이버는 지난 4월 경량 모델 '하이퍼클로바X 시드', 지난 달에는 추론형 AI 모델 '하이퍼클로바X 씽크' 개발을 완료했다. 카카오는 지난 5월부터 AI 에이전트 '카나나'에 대한 비공개 베타 테스트를 진행 중이다. 두 모델 모두 '최고의 한국어 이해 능력'을 자랑하며 연내 네이버와 카카오 서비스에 적용된다.

▲ 에이닷 엑스 4.0의 학습을 진행한 슈퍼 컴퓨터 '타이탄' [SK텔레콤 제공]

한국형 AI 모델들의 지향점은 데이터 주권 강화. 기업들은 한국형 AI 개발의 주요 이유로 데이터의 '안전 보장'과 '유출 방지'를 꼽는다. KT 오승필 기술혁신부문장은 전날 진행한 온라인 브리핑에서 "AI 모델을 개발하며 제일 중요하게 생각한 게 데이터 주권 강화"라며 "고객 데이터를 안전하게 보호하고자 다각도로 노력 중"이라고 말했다.

데이터 주권이 중요한 건 개인정보 보호와 산업 경쟁력, 국가 안보에 필수적이기 때문이다. 데이터 주권을 실현하면 국경을 넘나드는 데이터들을 국가나 지역 법률과 규정에 따르게 하고 기업들에게는 데이터 관리와 보호 책임을 부여해 민감 데이터를 보호할 수 있다. 미국과 유럽, 중국, 일본 등 각국이 관련 법률 제정과 정책 추진, 국제 협력에 활발히 나서는 배경이다.

해결 과제는 첩첩이다. 당장 데이터 수집부터 어렵다. 저작권 규정이 명확치 않아 AI 학습에 필요한 양질의 데이터를 구하기 쉽지 않고 표준화와 품질 관리 문제로 데이터 활용 가치도 제한적이다.

AI 업계 한 관계자는 "고성능 GPU(그래픽처리장치) 확보 못지 않게 대규모 데이터 확보가 무척 어렵다"며 "공개된 데이터가 많지 않아 AI 학습에 어려움이 크다"고 토로했다. 그는 "정부 주도 독자 AI 파운데이션 모델 추진에 공감하며 기업들도 참여를 준비하고 있다"며 "서둘러 정부가 실행에 나서주면 좋겠다"고 말했다.

AI 기본법과 데이터 관련 법률 정비도 시급하다. 현행 법만으로는 글로벌 데이터 주권 경쟁에 제약이 많아 가이드라인 제정부터 서둘러야 한다. 글로벌 AI 및 플랫폼 기업들이 수집하는 다량의 데이터들이 무단 유출되지 않도록 정부는 안전 대책을 조속히 마련해야 한다.

한 자율주행 전문가는 "중국 자율주행 기업들의 한국 시장 침투와 주행 데이터 수집이 현실화됐는데도 정부 대응과 해법은 아직 안 나오는 것 같다"고 안타까워 했다.

구글과 애플의 고정밀 지도 데이터 국외 반출 허가 요청 등 글로벌 빅테크의 공습에 정부가 명확하게 대응 못하는 점도 문제. 정부는 구글과 애플이 요청한 1대5000 축척 지도 데이터 반출을 허용하지 않았지만 한미간 통상 마찰을 우려해 결정을 유보한 채 신중한 입장을 취하고 있다.

새 정부는 국가 안보 강화와 자국민의 데이터 보호를 핵심 국정 과제로 설정하며 데이터 주권 강화에 나서고 있다. 100조 규모의 AI 투자를 추진하고 전국 단위의 AI 데이터센터 클러스터(단위체) 건설을 추진 중이다. '소버린(자주적) AI' 주창자인 하정우 대통령실 AI 정책수석 임명과 LG AI연구원장 출신인 배경훈 과학기술정보통신부 장관 후보자 지명도 이를 뒷받침한다.

관건은 속도. 신속한 정책 결정과 실행이 없으면 기업들이 경쟁력을 확보하기 어렵고 데이터 주권 강화와 시장 대응도 어려워지기 때문이다.

AI기업 한 고위 임원은 "연구 개발 투자비는 늘지만 AI 매출은 한참 못 미쳐 어려움이 가중된다"며 "정부와 공공에서 시장의 마중물로 AI 부문 발주를 확대해 주면 좋겠다"고 제안했다. 그는 "정부가 빠르게 움직이면 행정 효율성 증대와 대민 서비스의 질적 향상, 공공서비스 혁신도 기대할 수 있다"고 설명했다.

AI 및 자율주행 전문가는 "정부가 개인정보 보호 가이드라인을 빨리 제정하면 좋겠다"며 "소버린 AI, 한국형 엔진만 집중하다가 본질인 데이터 주권 확보에 도달 못하는 오류를 범하지 않아야 한다"고 지적했다.

KPI뉴스 / 김윤경 IT전문기자 yoon@kpinews.kr

한국형 AI 모델 '속속'…갈 길 바쁜 '데이터 주권' 강화

WEEKLY HOT