• 구독신청
  • My스크랩
  • 지면신문
FNTIMES 대한민국 최고 금융 경제지
ad

“한국어에 최적화”…카카오, 멀티모달 언어모델 2종 성능 공개

정채윤 기자

chaeyun@fntimes.com

기사입력 : 2025-12-12 10:54

텍스트・음성・이미지 동시 이해・답변…지시이행 능력 개선
‘카나나-2’ 연내 개발 계획, 상호작용하는 AI 구현에 주력

카나나-o 멀티모달 벤치마크 성능 비교. / 사진=카카오

카나나-o 멀티모달 벤치마크 성능 비교. / 사진=카카오

이미지 확대보기
[한국금융신문 정채윤 기자] 카카오가 사람처럼 보고 듣고 말하면서 한국어와 한국 문화를 가장 잘 이해하는 데 초점을 둔 최신 멀티모달(Multinodal) 인공지능(AI) 기술 연구 성과를 공개했다.

카카오(대표이사 정신아닫기정신아기사 모아보기)는 12일 테크블로그를 통해 한국적 맥락 이해에 최적화된 통합 멀티모달 언어모델 ‘카나나(Kanana)-o’와 멀티모달 임베딩 모델 ‘카나나-v-임베딩(Kanana-v-embedding)’ 개발 과정과 성능을 발표했다.

멀티모달은 텍스트와 음성, 이미지 등 다양한 형태의 정보를 동시에 이해하고 처리·답변할 수 있는 능력이나 기술을 말한다.

먼저 ‘카나나-o’는 텍스트와 음성, 이미지를 동시에 이해하고 실시간으로 답변하는 통합 멀티모달 언어모델이다. 글로벌 모델 대비 한국어 맥락 이해에서 압도적 성능을 보유하고, 사람처럼 자연스럽고 풍부한 표현력을 갖췄다는 것이 카카오 설명이다. 지난 5월 처음 공개된 뒤 이번에 지시 이행 능력이 개선됐다.

카카오는 기존 멀티모달 모델들이 텍스트 입력 시 강점을 보이지만 음성 대화 시에는 답변이 다소 단순해지고 추론 능력이 떨어진다는 한계에 주목했다.

이를 보완하기 위해 카나나-o의 지시 이행 능력을 고도화해 사용자의 숨은 의도와 복잡한 요구사항까지 파악할 수 있도록 개선했다고 전했다.

이와 함께 단순 질의응답을 넘어 요약, 감정·의도 해석, 오류 수정, 형식 변환, 번역 등 다양한 과업을 수행할 수 있게 성능을 끌어올렸다고 설명했다.

또한 고품질 음성 데이터와 직접 선호 최적화 기술을 적용해 억양과 감정, 호흡 등을 정교하게 학습시켰다.

카카오는 벤치마크(성능 검증) 평가 결과 카나나-o가 영어 음성 성능에서 GPT-4o와 유사한 수준을, 한국어 음성 인식·합성, 감정 인식 능력에서는 월등히 높은 수준을 기록했다고 밝혔다.

카나나-v-임베딩 멀티모달 벤치마크 성능 비교. / 사진=카카오

카나나-v-임베딩 멀티모달 벤치마크 성능 비교. / 사진=카카오

이미지 확대보기
카나나-o와 함께 공개된 카나나-v-임베딩은 이미지 기반 검색의 핵심 기술로, 텍스트와 이미지를 동시에 이해해 처리할 수 있는 한국형 멀티모달 모델이다. 텍스트로 이미지를 검색하거나, 사용자가 선택한 이미지와 관련된 정보를 검색하고, 이미지가 포함된 문서 검색 등을 지원한다.

실제 서비스 적용을 목표로 개발된 이 모델은 한국어와 한국 문화에 대한 이해도가 높아 ‘경복궁’, ‘붕어빵’ 같은 고유명사 이미지도 찾아준다.

현재 카나나-v-임베딩 모델은 카카오 내부에서 광고 소재의 유사도를 분석·심사하는 시스템에 적용 중이다. 향후 비디오나 음성으로 범위를 확대해 더욱 다양한 서비스에도 적용할 계획이다.

김병학 카카오 카나나 성과리더는카카오의 자체 AI 모델 카나나는 단순한 정보 나열 수준을 넘어, 사용자의 감정을 이해하며 친숙하고 자연스럽게 대화하는 AI 있도록 한국적 맥락의 이해와 표현력을 높여가고자 한다실제 서비스 환경을 통해 사용자들의 일상 AI 기술 경험을 만들어 나가고, 사람처럼 상호작용 있는 AI 구현에 주력해 이라고 말했다.

정채윤 한국금융신문 기자 chaeyun@fntimes.com

데일리 금융경제뉴스 FNTIMES - 저작권법에 의거 상업적 목적의 무단 전재, 복사, 배포 금지
Copyright ⓒ 한국금융신문 & FNTIMES.com

가장 핫한 경제 소식! 한국금융신문의 ‘추천뉴스’를 받아보세요~

산업 다른 기사

1 삼성전자 SK하이닉스, CFO 위에 사장급 재무 사령관 왜 삼성전자와 SK하이닉스에는 최고재무책임자(CFO) 상위에 전사적 권한을 가진 사장급 ‘전략·재무 사령탑’이 전진 배치됐다. 수백조 원 단위의 천문학적인 투자 결단과 지정학적 공급망 위기 대응이 요구되는 AI 반도체 패러다임 속에서, 단순 비용 통제를 넘어선 최고위급 컨트롤타워를 통해 리더십을 일원화하고 속도전에 나서겠다는 전략이다.삼성전자는 지난해 12월 조직 개편을 통해 '경영지원실' 명칭을 '경영지원담당'으로 변경했다. 이 조직을 이끌고 있는 CFO 박순철 부사장의 직책도 경영지원실장에서 경영지원담당으로 변경됐다. 경영지원 조직 산하에서 미래 신사업을 발굴하는 역할을 하는 기획팀에 힘을 실어주기 위한 개편이라는 2 ‘기술통’ 이석희 SK온 대표 사임…이용욱 단독대표 체제 SK온의 기술 경쟁력을 책임지던 이석희 각자 대표가 일신상의 이유로 사임했다. 이석희 대표가 사임하면서 SK온은 전략통 이용욱 단독 대표 체제로 전환됐다.배터리 업계가 전고체 배터리 등 미래 기술력 경쟁이 치열해지는 만큼 향후 기술 리더 공백을 어떻게 메울지 관심이 쏠린다.SK온 기술통 이석희 각자 대표 퇴장29일 업계에 따르면 이석희 대표는 전날 임직원 메시지를 통해 본인의 사의 사실을 전한 것으로 알려졌다.이석희 대표는 “저는 5월을 끝으로 SK온 최고경영자(CEO)로서 소임을 마무리하고자 한다"며 "이차전지 산업의 중심에서 SK온 구성원들과 함께할 수 있었던 건 큰 영광이었다"고 전했다.이어 "지난해 말부터 CEO로서 막중 3 ‘IP 가공 장인’ 넷마블, ‘일곱 개의 대죄’ 신구 타이틀 쌍끌이 넷마블의 IP(지적재산권) 가공 능력이 다시 한번 입증되고 있다. 바로 인기 IP ‘일곱 개의 대죄’를 활용한 간판 모바일 RPG ‘일곱 개의 대죄: 그랜드 크로스’가 7주년 업데이트로 역주행에 성공했으며, 올해 3월 출시한 ‘일곱 개의 대죄:Origin’도 눈에 띄는 성과를 거두면서다.업계에서는 이를 두고 넷마블의 원작 IP에 대한 이해 능력과 이용자 친화 서비스 운영의 시너지라고 평가한다.‘칠대죄:그랜드 크로스’, 7주년 업데이트로 日 역주행모바일인덱스에 따르면 ‘일곱 개의 대죄:그랜드 크로스’는 지난 21일 진행된 7주년 업데이트 이후 일본 애플 앱스토어(iOS) 매출 4위에 올랐다.일곱 개의 대죄:그랜드 크로스는 지난 2019년 한
ad
ad

한국금융 포럼 사이버관

더보기

FT카드뉴스

더보기
[그래픽 뉴스] 퇴근 후 주차했는데 수익 발생? V2G의 정체
[그래픽 뉴스] “전쟁 신호를 읽는 가장 이상한 방법, 피자 주문량”
[그래픽 뉴스] 트럼프의 ‘타코 한 입’에 흔들린 시장의 비밀
[그래픽 뉴스] 청년정책 5년 계획, 무엇이 달라지나?
[카드뉴스] KT&G, ‘CDP’ 기후변화·수자원 관리 부문 우수기업 선정

FT도서

더보기