LG, 사람처럼 이미지 설명하는 '캡셔닝 AI' 글로벌 첫 공개
김윤경 IT전문기자
yoon@kpinews.kr | 2023-06-19 18:22:17
처음 보는 이미지도 자연어로 설명하는 AI
LG 계열사들, 글로벌 AI 인재 확보도 진행
LG가 인공지능(AI)의 이미지를 설명하는 '캡셔닝 AI'를 글로벌 무대에서 첫 공개했다.
LG는 LG AI연구원이 18일(현지시간) 캐나다 밴쿠버에서 열리는 세계 최대 컴퓨터 비전 학회 'CVPR(Computer Vision and Pattern Recognition, 컴퓨터 비전 및 패턴 인식) 2023'에서 '캡셔닝 AI(Captioning AI)'를 처음 공개했다고 19일 밝혔다.
'캡셔닝 AI'는 처음 보는 이미지까지 자연어로 설명할 수 있는 인공지능으로 '생성형 AI'의 이미지 검색에 활용하는 문장이나 키워드 등의 메타 데이터를 생성한다. 앞으로 이미지 검색 시장에 지대한 변화를 가져올 주요 항목으로 평가된다.
LG AI연구원은 AI에 '제로샷 이미지 캡셔닝(Zero-shot Image Captioning)' 기술을 적용, 인간처럼 이전의 경험과 지식을 활용해 처음 보는 이미지도 이해하고 설명할 수 있도록 했다.
'제로샷 이미지 캡셔닝'은 AI가 기존에 학습한 대량의 이미지와 텍스트 데이터를 기반으로 배경, 인물, 행동 등 이미지 상의 다양한 요소와 특징을 인식하고 그 관계를 이해하고 설명할 수 있도록 하는 기술이다.
이 기술은 평균적으로 5개 문장과 10개의 키워드를 10초 내에 생성, 대량의 이미지를 관리하는 기업들의 업무 효율성과 생산성을 높일 수 있다.
LG AI연구원은 데이터 학습부터 서비스 개발까지 셔터스톡(Shutterstock)과 협업하며 완성도를 높였다.
세잘 아민(Sejal Amin) 셔터스톡 CTO는 "캡셔닝 AI는 고객들이 반복적인 작업보다 좀 더 본질적이고 창의적인 일에 집중할 수 있도록 돕는 AI가 될 것"이라고 강조했다.
LG AI연구원은 학회 기간 중 LG 부스를 방문한 연구자들을 대상으로 '캡셔닝 AI' 서비스를 시연할 계획이다.
LG 계열사들, 글로벌 AI 인재 확보 작업도 진행
LG는 22일까지 진행하는 학회 기간 중 AI연구원·LG전자·LG이노텍·LG에너지솔루션·LG유플러스 등 주요 계열사 5곳이 공동으로 학회에 참가, 각 사의 최신 AI 기술을 시연하고 글로벌 우수 인재 확보에 나설 예정이다.
19일에는 학회에 참가한 석·박사 학생들을 대상으로 네트워킹 행사인 'LG AI Day'를 진행하고 20일부터 3일 간 LG 각 계열사의 AI 연구 인력과 채용 담당자들이 LG 통합 부스에서 각 사의 최신 AI 기술 시연과 채용 상담을 진행한다.
KPI뉴스 / 김윤경 기자 yoon@kpinews.kr
[ⓒ KPI뉴스. 무단전재-재배포 금지]