카카오엔터프라이즈 자연어처리 AI, 한국어 기계독해 평가 1위

김해욱 / 2022-03-23 17:11:34
기존 1위 모델보다 1.7배 처리 속도 향상 평가
카카오 I 커넥트센터에 기술 적용 예정
카카오엔터프라이즈의 자연어처리 AI(인공지능) 모델인 '리틀버드-라지'(LittleBird-large)가 한국어 기계독해 데이터셋 '코쿼드 2.0'(KorQuAD) 성능 평가에서 1위에 올랐다.

코쿼드 2.0은 지난 2019년 LG CNS가 제작해 외부에 개방한 대규모 한국어 질의응답 데이터셋(특정 작업을 위해 데이터를 관련성 있게 모아놓은 것)이다. 지난 2018년 12월에 '코쿼드 1.0'이 오픈소스로 공개된 이후 더 많은 분량의 문서를 빠르게 처리하는 기술과 함께 리스트와 표 등이 포함된 HTML 문서의 이해를 필요하게 하는 등 난이도가 올라갔다.

평가는 데이터셋에서 추출한 내용 중에서 질문이 제시되며, AI 모델이 정확한 답을 찾아내는 방식으로 이뤄진다.

▲ 카카오엔터프라이즈 AI(인공지능) 대화 모델 이미지 [카카오엔터프라이즈 웹사이트 캡처]

23일 카카오엔터프라이즈에 따르면 AI 모델 리틀버드-라지는 정확도에서 90.22점을 얻으며 1위에 올랐고, 처리 속도 또한 지난해 1위 모델보다 1.7배 빠른 수치를 기록했다. 실용성을 강조하며 개발한 '리틀버스-베이스(LittleBird-base)' 모델은 정확도 88.57점으로 6위를 기록했다.

카카오엔터프라이즈 측은 AI 모델을 지속적으로 고도화시켜 검색, 챗봇은 물론 '카카오 i 커넥트 센터'에 적용한다는 계획이다. 카카오 i 커넥트 센터에 기술을 적용하면 AI 상담사가 해당 기계독해 모델을 통한 지식 검색 시스템을 활용해 고객의 질의나 요청에 대해 한층 정확한 답변을 제공할 수 있다.

최동진 카카오엔터프라이즈 AI 랩앤서비스(Lab&Service)장은 "기계독해는 문서를 단순히 이해하는 것을 넘어 분석, 추론을 통해 최적화된 답을 제공하는 기술로, AI를 활용한 서비스를 고도화하는데 직접적인 영향을 끼친다"며 "앞으로도 자연어처리와 비전, 음성 등 다양한 영역에서 연구 역량을 강화해 나갈 것"이라고 밝혔다.

KPI뉴스 / 김해욱 기자 hwk1990@kpinews.kr

[ⓒ KPI뉴스. 무단전재-재배포 금지]

김해욱

김해욱

SNS