LG, 사람처럼 이미지 이해하고 설명하는 AI 키운다

김윤경 IT전문기자 / 2023-01-31 16:55:39
서울대 AI연구원·셔터스톡과 'LG 글로벌 AI 챌린지' 개최 LG가 이미지를 이해하고 설명하는 인공지능(AI)을 키운다.

LG는 전 세계 AI 연구자를 대상으로 'LG 글로벌 AI 챌린지'를 개최하고 시각과 언어 분야 AI 기술 융합을 추진한다고 31일 밝혔다.

이번 대회는 LG AI연구원과 '엑사원(EXAONE)'을 공동 연구 중인 '서울대학교 AI대학원', 이미지 캡셔닝 AI의 상용화 서비스를 공동으로 준비 중인 '셔터스톡'과 함께 진행한다.

대회 기간은 2월 1일부터 4월 말까지다. 온라인으로 진행한다.

▲ 초거대 AI의 이미지 캡셔닝 과정 [LG 제공]

'LG 글로벌 AI 챌린지'는 '제로샷 이미지 캡셔닝(Zero-Shot Image Captioning)'을 주제로 AI가 처음 본 이미지를 얼마나 정확하게 이해하고 설명하는지를 평가한다.

제로샷 이미지 캡셔닝은 AI가 처음 본 사물이나, 동물, 풍경 등이 포함돼 있는 이미지를 보고 사람처럼 이해하고 유추한 후 결과를 문자로 설명하는 기술이다.

LG AI연구원은 이 기술이 고도화되면 이미지 인식 AI 기술의 정확성과 공정성이 향상돼 사람들의 실생활에도 직접적 도움을 줄 수 있다고 본다.

AI가 의학 전문 데이터를 추가 학습할 경우 의학 영상을 분석하는 '의학 전문가 AI'로 활약할 수 있다는 설명이다.

▲ LG의 초거대 멀티모달 AI 엑사원이 생성한 캡션 예시 [LG제공]

LG는 제로샷 이미지 캡셔닝이 이미지를 텍스트로 표현하고, 텍스트를 이미지로 시각화하는 초거대 멀티모달 AI '엑사원(EXAONE)'의 기술 개발 생태계에도 크게 기여할 것으로 기대하고 있다.

이경무 서울대 AI대학원 석좌교수는 "이미지 캡셔닝은 영상에 나오는 객체들의 관계부터 상황과 문맥까지 이해해 인간의 언어로 표현하고 설명하게 하는 것으로 AI가 인간의 지능에 얼마나 가까워졌는지 보여주는 하나의 척도"라고 설명했다.

KPI뉴스 / 김윤경 기자 yoon@kpinews.kr

[ⓒ KPI뉴스. 무단전재-재배포 금지]

김윤경 IT전문기자

김윤경 IT전문기자

SNS