[노성열의 AI경제] AI 3대 강국?…의욕 못 따라가는 현실
KPI뉴스
go@kpinews.kr | 2025-07-24 11:25:39
인공지능(AI) 학습의 재료가 되는 저작물(著作物) 이용에 대해 미국이 최근 '공정 이용(fair use)' 법리를 앞세워 성큼 앞서가고 있어 우리나라 AI 경쟁력 강화에 큰 함의를 던져주고 있다. 공정 이용이란 저작권의 개인적 권리보다 다수를 위한 공익성이 더 커 무상 이용을 허용한다는 뜻이다. 한국은 판결문과 전자 의료기록 등 공공 데이터의 경우 개인정보 보호(프라이버시)를 앞세워 공개 범위를 제한하고, 민간 데이터도 적정 저작권료를 지급하는 방향으로 운용하고 있다. AI의 대량 데이터 학습 과정에서 공공의 이익을 우선할지, 개인권리를 보호할지의 관점 차이다.
저작권은 지식재산권(IP·Intellectual Property) 중 텍스트, 이미지, 소리 등 창작자의 독창적인 저작물 아이디어를 보호하기 위해 일정기간 독점적 지위를 인정해주는 권리를 말한다. 주로 기업에서 연구개발(R&D) 기술 및 공정의 개량 등 산업적 발명·발견과 영업 노하우를 보호하는 특허·실용실안·상표권·영업비밀과 같은 산업재산권과 달리, 문화예술 창작자의 생계유지 및 창작의욕 고취를 위해 타인이 함부로 모방하지 못하도록 원작자의 권리를 보장해준 것이다. 근대 인쇄술 발명 후 활자 서적에서 비롯된 저작권 체계는 그림, 음악 등 다른 창작물로 확대 적용되었다. 20세기 들어 다국적 카피라이트(copyright) 관리회사가 막대한 수익을 작가 대신 관리하는 공룡들의 글로벌 생태계로 확대 발전한 상태다.
저작권이 최근 다시 조명받기 시작한 것은 인공지능의 출현 이후다. AI가 본격적으로 현실세계에 보급된 다음, 특히 대형언어모델(LLM) 같은 생성형 AI 등장 후 AI 모델 학습에 필요한 저작물을 허락 없이 무단 활용하는데 대해 저작권자와 빅테크 간 갈등이 커지고 있다. 가장 대표적인 것이 뉴욕타임스, 위싱턴포스트 등 유력 신문사의 인쇄 기사와 유명 저자들의 출판 서적을 LLM 학습 재료로 무단 사용한데 대한 소송 사태이다. 이에 오픈AI, 구글 등 빅테크는 양질의 학습재료를 확보하기 위해 적정 사용료를 지급하는 저작권 이용 계약을 잇따라 맺고 있다. 그런데 미국 법원이 최근 대량의 도서 학습에 대해 빅테크의 책임을 면제한 판결을 내려 논란을 키우고 있다.
2023년 8월 베스트셀러 소설가 3인은 "앤트로픽(미국 AI개발기업)이 저작권을 무시하고 수백만 권의 책을 무단 복제 및 디지털화해 자사 LLM '클로드'의 학습에 이용했다"고 소송을 냈다. 2년이 흐른 2025년 6월 24일 캘리포니아 북부 연방법원은 "출판된 저작물을 인공지능 훈련 데이터로 사용하는 것은 미국 저작권법상 '공정 이용'에 해당한다"는 판결을 내렸다. 윌리엄 앨섭 판사는 "AI가 원본 저작물의 표현을 복제·재판매하지 않고, 변형적(transformative)·혁신적으로 이용할 뿐"이라고 판시했다. 마치 어떤 책을 읽고 이에 영감을 받아 작가가 새로운 책을 쓰듯 원본을 베낀 게 아니라, 변행해 새로운 저작을 했다는 것이다. 판사는 또, 합법적으로 구매한 도서 및 스캔본을 디지털화해서 내부 데이터셋을 구축해 학습용으로 쓰는 것도 '공정 이용'으로 인정했다. 다만, 인터넷 등에서 불법적으로 다운받은 '해적판(pirated copy)' 도서를 영구 저장·관리하는 것은 '공정 이용'이 아니며, 별도로 손해배상 책임이 있다고 판단했다.
이에 대해 저작권자 단체는 "저작권의 기본 원칙과 창작자 보호에 심각한 침해"라며, AI 시대에 맞는 저작권 법제도의 개정 필요성을 주장했다. 이번 판결로 AI 학습용 데이터의 투명성, 저작권자 보상, 공정 이용 범위 규정 등을 둘러싸고 새로운 사회적 논의가 촉진될 전망이다. 논란의 핵심은 작가의 책이나 영화사 영상, 언론사 기사 등을 생성형 AI 훈련용 데이터로 사용하는 행위를 '원 저작물을 감상하거나 복제하기 위한 것이 아니라 통계적 데이터를 추출하기 위한 고도의 변형적 이용이고, 혁신적 기술 개발을 위해 꼭 필요한 공익적 이용'으로 볼 수 있는가 하는 점이다.
법원뿐 아니다. 미국 행정부도 공정 이용이 기본입장이다. 미국 상무부는 최근 의회에서 확정된 '크고 아름다운 하나의 법안(One Big Beautiful Bill)'을 통해 각 주나 지방정부에서 10년 동안 AI 규제를 금지하는 AI 현대화 조항, 이른바 'AI 모라토리엄' 법안까지 마련했다. 상무부가 오는 2035년까지 AI 솔루션 관련 IT 시스템 현대화를 위해 5억 달러의 예산을 확보하고, AI를 규제하는 주나 지방 정부는 지원 대상에서 제외한다는 내용이다. 이 법안은 혁신 기술 분야에서 중국 등 경쟁국에게 미국의 AI 헤게모니를 넘겨주지 않겠다는 강력한 의지를 잘 보여주고 있다.
이에 비해 우리나라는 어떤가. 이재명 정부는 AI 3대 강국을 국정 목표로 정하고 AI 미래 기획 수석을 신설해 하정우 네이버 클라우드 AI혁신센터장을 임명했다. 과학기술정보통신부 장관에도 배경훈 LG AI연구원장을 앉혔다. 산업계의 현실 감각을 정책에 반영하겠다는 의도로 풀이된다. 그러나 지금까지 현실은 의욕을 따라오지 못하고 있다. AI 학습 데이터 이용에 대한 면책 조항(TDM, Text Data Mining)을 포함한 저작권법 개정안은 당사자 간 합의를 이루지 못하고 있다. TDM은 AI가 텍스트 형태의 비정형 데이터를 분석해 그 안에서 유용한 정보를 추출하는 기술이다. 인터넷, SNS, 뉴스, 이메일, 논문 등 다양한 소스에서 생성된 방대한 텍스트 데이터를 처리해 패턴을 발견하고, 의사결정에 활용할 수 있는 인사이트를 제공한다.
자연어처리(NLP)와 머신러닝을 바탕으로 AI가 제공하는 기술의 결과물은 기업 경영, 여론 및 감성 분석, 정보 검색 등 여러 분야에서 광범위하게 활용된다. 또 공공기관의 데이터 공개 범위도 매우 좁다. 한국 법원의 판결문 공개율은 한 자릿수에 머물다가 언론의 강력한 비판에 따라 최근 30~35%까지 올라왔으나 모든 법원에서 전문 공개가 원칙인 미국에 비해 여전히 미흡하다. 또 병원의 의사 진단서, 환자 병력 등 전자의료기록(EMR) 역시 개인정보 보호를 이유로 매우 제한된 범위에서 제공되고 있어 바이오벤처 기업들이 혁신적 의료기기나 소프트웨어를 개발할 때 훈련용 데이터 부족으로 어려움을 겪고 있다. 한국처럼 병원과 의료보험 기록이 수십 년 간 전산으로 잘 관리된 나라는 드물다. 세계적인 AI 바이오헬스 기업을 낳을만한 원천환경에서 경직된 제도로 인해 발목이 잡힌 형국이다.
미국이 옳은지, 한국이 맞는지 정답은 없다. 하지만 우리나라가 미국보다 훨씬 좁게 데이터 활용을 제한하는 현 상황이 계속된다면 챗GPT, 클로드 같은 AI 파운데이션 모델의 한국 버전 출현은 기대하기 어렵게 된다. AI수석은 주권(sovereign) AI를 말하며 글로벌 빅테크에 포획되지 않는 한국만의 독자 생태계 구축이 안보와 산업에 긴요하다고 강조해왔다. 솔로몬의 지혜, 아니 단군의 홍익인간 이념을 되살려야 할 시점이다.
[ⓒ KPI뉴스. 무단전재-재배포 금지]