네이버 웨일, 외국인 한국어 음성 연구해 언어교육 데이터 만든다

김해욱 / 2022-04-01 10:49:39
NIA '인공지능 학습용 데이터 구축 지원사업' 참여
'엔에스데블 컨소시엄' 구성사로 언어교육용 데이터셋 구축 계획
네이버 웨일이 외국인들의 한국어 음성을 연구해 언어교육용 데이터셋을 만든다. 네이버 웨일은 '엔에스데블' 컨소시엄 참여사로 과학기술정보통신부와 NIA한국지능정보사회진흥원이 '데이터 댐' 프로젝트의 일환으로 진행하는 '인공지능 학습용 데이터 구축 지원사업'에 참여한다고 1일 밝혔다.

엔에스데블 컨소시엄은 네이버△나라지식정보 △넥타르소프트 △서강대학교 △서울대학교 △성균관대학교 △엔에스데블 △테리뉴 △한국음성학회 등으로 구성됐으며 언어교육용 데이터셋 구축을 위해 외국인이 발음하는 한국어 음성 데이터를 수집 및 가공하는 역할을 맡았다.

▲ 네이버 웨일 CI. [네이버 웨일 제공]

네이버 웨일은 올해 11월30일까지 4000시간 분량의 발음 데이터를 확보하고 인공지능 학습에 적합한 형식으로 다듬겠다는 계획이다. 이 과정을 통해 생성될 데이터셋은 향후 국내에서 한국어 교육평가 솔루션들이 개발되는 과정에 활용될 것으로 기대되고 있다.

네이버 관계자는 "세계적으로 한국어 교육에 대한 인기가 높아지는 상황에서, 효과적인 교육 솔루션 개발에 도움을 주는 데이터셋을 만들겠다는 취지를 갖고 각 사가 힘을 모았다"며 "외국인의 발음체계를 고려한 맞춤형 교육자료가 부족한 점을 고려해 계획을 수립하게 됐다"고 사업 참여 배경을 설명했다.

외국인의 한국어 발음을 녹음하는 기기는 네이버 웨일의 '웨일북'을 이용할 예정이다.

김효 네이버 웨일 책임리더는 "그간 웨일이 연구·개발해 온 기술력을 인정받아 국내 인공지능 기술의 역량증진과 경쟁력 강화를 위한 사업에 참여할 수 있어 기쁘다"며 "분야를 가리지 않고 다양한 환경에 적용될 수 있는 범용성을 갖춘 웨일의 웹 기술력을 바탕으로 활용처의 폭을 넓혀 나갈 것"이라고 말했다.

KPI뉴스 / 김해욱 기자 hwk1990@kpinews.kr

[ⓒ KPI뉴스. 무단전재-재배포 금지]

김해욱

김해욱

SNS