• 구독신청
  • My스크랩
  • 지면신문
FNTIMES 대한민국 최고 금융 경제지
ad

"10초에 문장 5개 생성"…LG, 그림 설명하는 '캡셔닝 AI' 공개

정은경 기자

ek7869@fntimes.com

기사입력 : 2023-06-19 11:09

CVPR서 '캡셔닝 AI' 첫 공개
"글로벌 고객사 10곳서 얼리 액세스 진행 중"

이미지 상의 다양한 요소와 특징을 인식해 설명글과 키워드를 생성하는 캡셔닝 AI(Captioning AI). 사진 제공=LG

이미지 상의 다양한 요소와 특징을 인식해 설명글과 키워드를 생성하는 캡셔닝 AI(Captioning AI). 사진 제공=LG

이미지 확대보기
[한국금융신문=정은경 기자] LG AI연구원이 처음 본 이미지도 스스로 인식해 설명하는 '캡셔닝 AI'를 처음 공개했다.

lG AI연구원은 18일(현지시간) 캐나다 밴쿠버에서 진행 중인 세계 최대 컴퓨터 비전 학회 ‘CVPR(컴퓨터 비전 및 패턴 인식) 2023’에서 ‘캡셔닝 AI’를 공개했다.

LG AI연구원이 처음 공개한 ‘생성형 AI’ 상용화 서비스 ‘캡셔닝 AI’는 ‘인간처럼 처음 보는 이미지까지 자연어로 설명할 수 있는 AI’다. 이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등 메타 데이터를 생성한다.

LG AI연구원은 AI가 인간처럼 처음 보는 물체나 장면에 대해서도 이전의 경험과 지식을 활용해 이해하고 설명할 수 있도록 ‘제로샷 이미지 캡셔닝’ 기술을 적용했다. 이 기술은 AI가 기존에 학습한 대량의 이미지와 텍스트 데이터를 기반으로 배경, 인물, 행동 등 이미지 상의 다양한 요소와 특징을 인식하고, 그 관계를 이해하고 설명할 수 있게 한다.

‘캡셔닝 AI’는 대량의 이미지를 관리해야 하는 기업들의 업무 효율성과 생산성을 높일 수 있다. ‘캡셔닝 AI’는 문장이나 단어의 길이와 개수에 따라 다르지만, 평균적으로 5개 문장과 10개의 키워드를 10초 내에 생성한다. 이미지 범위를 1만 장으로 확장하면 2일 이내에 작업을 끝낼 수 있어 빠른 시간 내에 맞춤형 이미지 검색·관리 시스템 구축이 가능하다.

LG AI연구원은 셔터스톡과의 긴밀한 협력으로 '캡셔닝 AI'가 탄생했다고 밝혔다.

셔터스톡은 이미지와 영상 등 시각 콘텐츠가 매일 수십만 개 이상 새롭게 추가되는 세계 최대 플랫폼 기업으로 콘텐츠를 분석하고 처리하는 경험이 풍부한 전문가들이 포진해 있다.

LG AI연구원은 이미지 분류와 검색에 활용하기 적합한 문장의 길이나 표현 방법 등 이미지 캡셔닝에 관한 방대한 노하우를 가지고 있는 셔터스톡과 데이터 학습부터 서비스 개발까지 함께해 완성도를 높였다.

특히 LG AI연구원과 셔터스톡은 실용적이면서도 신뢰할 수 있는 AI 모델 개발을 위해 학습 데이터의 편향성·선정성 등 AI 윤리 검증을 진행하고, 저작권 투명성도 확보했다.

세잘 아민 셔터스톡 CTO(최고기술책임자)는 “현재 글로벌 고객사 10곳을 대상으로 ‘얼리 액세스(앞서 해보기) 프로그램’을 진행하며 캡셔닝 AI 기술을 발전시켜 나가고 있다”며, “캡셔닝 AI는 고객들이 반복적인 작업보다 좀 더 본질적이고 창의적인 일에 집중할 수 있도록 돕는 AI가 될 것”이라고 강조했다.

LG AI연구원은 학회 기간 중 LG 부스를 방문한 연구자들을 대상으로 ‘캡셔닝 AI’ 서비스를 시연할 계획이다.

캡셔닝 AI의 기반 기술 ‘제로샷 이미지 캡셔닝’ 주제로 워크숍 개최

18일 진행한 워크숍에서 이홍락 LG AI연구원 CSAI가 캡셔닝 AI에 적용한 제로샷 이미지 캡셔닝 기술에 대해 설명하고 있다. 사진 제공=LG

18일 진행한 워크숍에서 이홍락 LG AI연구원 CSAI가 캡셔닝 AI에 적용한 제로샷 이미지 캡셔닝 기술에 대해 설명하고 있다. 사진 제공=LG

이미지 확대보기
LG AI연구원은 이날 ‘캡셔닝 AI’의 기반 기술인 ‘제로샷 이미지 캡셔닝’을 주제로 서울대 AI대학원, 셔터스톡과 함께 워크숍도 진행했다.

이경무 서울대 석좌교수의 개회사로 시작한 워크숍에는 LG AI연구원의 최고 AI 사이언티스트(CSAI)인 이홍락 미시간대 교수를 비롯해 코르델리아 슈미드(프랑스 국립 컴퓨터 과학 연구소 연구 책임자 겸 구글 리서치 연구원), 잭 헤셀(앨런 인공지능 연구소 연구원), 하미드 팔랑기(마이크로소프트 리서치 수석연구원 겸 워싱턴대 교수), 애나 로르바흐(Anna Rohrbach, UC버클리 연구원) 등 이미지 캡셔닝 분야의 세계적인 전문가들이 참여했다. 이들은 최신 연구 동향과 미래 전망, 그리고 AI 윤리 등 기술이 사회에 미치는 영향에 관해 심도 있는 논의를 진행했다.

이번 워크숍에서는 상반기에 진행한 ‘LG 글로벌 AI 챌린지’ 시상식도 열렸다.

자체 개발한 AI 모델의 이미지 이해 능력을 평가하는 대회인 ‘LG 글로벌 AI 챌린지’에는 총 142개 연구팀이 참여했다. 챌린지 1, 2위를 차지한 난징과기대, 카이스트(KAIST) 소속 참가자들은 워크숍에서 연구 성과를 발표하기도 했다.

김승환 LG AI연구원 비전랩장은 “이번 워크숍은 첫 번째 상용화 서비스인 ‘캡셔닝 AI’ 발표와 연계되어 있어 더욱 의미가 깊다”며, “이미지 캡셔닝 분야의 글로벌 연구 리더십을 확보하기 위해 다양한 파트너들과 유기적인 협력체계를 구축해 새로운 평가 지표 개발과 신기술 연구를 계속 추진할 계획”이라고 말했다.

LG전자·이노텍·엔솔·유플 등 LG 주요 계열사 5곳 공동으로 학회 참가

LG AI연구원은 22일까지 진행하는 학회 기간 중 LG전자, LG이노텍, LG에너지솔루션, LG유플러스 등 LG의 주요 계열사와 함께 글로벌 AI 우수 인재 확보에 나선다.

이를 위해 19일에는 학회에 참가한 석·박사 학생들을 대상으로 네트워킹 행사인 ‘LG AI Day’를 진행한다. 20일부터 3일 간 LG 각 계열사의 AI 연구 인력과 채용 담당자들이 LG 통합 부스에서 각 사의 최신 AI 기술 시연과 채용 상담을 진행한다.

정은경 기자 ek7869@fntimes.com

데일리 금융경제뉴스 FNTIMES - 저작권법에 의거 상업적 목적의 무단 전재, 복사, 배포 금지
Copyright ⓒ 한국금융신문 & FNTIMES.com

기자의 기사 더보기 전체보기

가장 핫한 경제 소식! 한국금융신문의 ‘추천뉴스’를 받아보세요~

산업 다른 기사

1 네이버 검색창 바뀌었다...대화형 검색 ‘AI탭’ 정식 출시 네이버가 대화형 인공지능(AI) 검색 서비스 ‘AI탭’을 전체 이용자 대상으로 정식 출시했다. 정식 버전에는 네이버 지도와 실시간 예약 기능이 고도화됐으며, 5000만 명의 대규모 트래픽을 안정적으로 처리할 수 있는 대화형 검색 최적화 차세대 모델이 탑재됐다.네이버(대표 최수연)는 대화형 검색 서비스 AI탭을 정식 출시하고 AI 검색 경험을 전면 확대한다고 26일 밝혔다.AI탭은 질의응답을 넘어 쇼핑, 잠소 탐색, 예약 등 행동까지 연결하는 에이전틱 검색 서비스다. 네이버 앱 검색홈인 ‘그린닷’에 적용된다. 오는 7월부터는 AI 브리핑 하단의 대화창에서도 AI탭으로 진입해 탐색을 이어갈 수 있다.네이버에 따르면 AI탭은 지난 4월 네이 2 한컴 김연수, ‘소버린 OS’ 승부수…300억 실탄 쥐고 영토 확장 한컴이 자체 거대언어모델(LLM) 개발 경쟁 대신, 기업용 AI(인공지능) 에이전트와 업무 시스템을 연결하는 플랫폼 전략에 속도를 내고 있다. 글로벌 빅테크가 AI에 막대한 자본을 투입하고도 수익화에 어려움을 겪는 가운데, 한컴은 에이전틱 OS(운영체제)를 앞세워 업무 자동화와 데이터 통제 영역에서 차별화를 노린다는 구상이다.LLM 경쟁 대신 ‘OS 통제권’ 선점26일 IT(정보기술) 업계에 따르면 최근 김연수 한컴 대표는 사명을 36년 만에 한글과컴퓨터에서 한컴으로 변경하고, ‘소버린 에이전틱 OS(운영체제)’ 기업으로의 전환을 선언했다.김연수 대표가 소개한 에이전틱 OS는 사용자의 업무 패턴을 학습한 AI 에이전트가 24시간 업무를 3 AI·데이터센터 특수 잡는다…명노현 LS 부회장 “북미서 글로벌 전력·에너지 패권 잡을 것” 명노현 ㈜LS 부회장이 북미 전력 인프라 시장을 정조준하며 대대적인 현장 경영 행보에 나섰다. 명노현 부회장은 향후 5년간 총 30억 달러를 투입하는 현지 생산 기지들을 직접 점검하며, AI 데이터센터 증설과 노후 전력망 교체 수요가 맞물린 북미 시장을 선점하겠다는 포부를 밝혔다.한미 안보포럼 참석 및 현지화 전략 고도화LS그룹 지주회사인 LS는 명노현 부회장이 지난 17일부터 약 열흘간 미국과 멕시코 주요 사업장을 방문하며 북미 전력 인프라 사업 전략을 점검했다고 26일 밝혔다.명노현 부회장은 미국 도착 직후인 18일, 워싱턴 D.C.에서 열린 ‘한미 전략산업 및 안보포럼’에 참석하며 공식 일정을 시작했다. 이 자리에는 심윤찬
ad
ad

한국금융 포럼 사이버관

더보기

FT카드뉴스

더보기
[그래픽 뉴스] 퇴근 후 주차했는데 수익 발생? V2G의 정체
[그래픽 뉴스] “전쟁 신호를 읽는 가장 이상한 방법, 피자 주문량”
[그래픽 뉴스] 트럼프의 ‘타코 한 입’에 흔들린 시장의 비밀
[그래픽 뉴스] 청년정책 5년 계획, 무엇이 달라지나?
[카드뉴스] KT&G, ‘CDP’ 기후변화·수자원 관리 부문 우수기업 선정

FT도서

더보기