• 구독신청
  • My스크랩
  • 지면신문
FNTIMES 대한민국 최고 금융 경제지
ad

카카오, 카나나 경량 모델 ‘Kanana Nano’ 오픈소스 공개

김재훈 기자

rlqm93@fntimes.com

기사입력 : 2025-02-27 12:53

‘Kanana 테크니컬 리포트’ 통해 자체 AI 모델 연구 발표
유사 모델 대비 50% 이상 절감해 ‘효율’-‘성능’ 동시 구현
향후 지속적인 모델 고도화 계획, AI 기술 경쟁력 강화 예정

카나나 언어모델 특징. / 사진=카카오

카나나 언어모델 특징. / 사진=카카오

이미지 확대보기
[한국금융신문 김재훈 기자] 카카오가 자체 AI 모델 ‘카나나(Kanana)’을 기반으로 기술력 검증과 생태계 확장에 나선다.

카카오(대표이사 정신아닫기정신아기사 모아보기)는 27일 자체 개발 언어모델 Kanana의 연구 성과를 담은 테크니컬 리포트를 아카이브(ArXiv)에 공개하고, 언어모델 라인업 중 국내 AI 생태계 활성화를 위해 ‘Kanana Nano 2.1B’ 모델을 오픈소스로 깃허브(GitHub)에 배포했다.

테크니컬 리포트는 매개변수와 학습 방법, 학습 데이터 등 세부 사항을 담아낸 AI 논문이다. 카카오는 이번 리포트에 다양한 사이즈에 이르는 카나나 언어모델 전체의 Pre-training부터 Post-training까지 전 과정을 자세히 담았다. 카나나 모델의 구조, 학습 전략, 그리고 글로벌 벤치마크에서의 성과도 확인할 수 있다.

오픈소스로 공개한 Kanana Nano 2.1B는 연구자와 개발자가 활용하기 적절한 크기의 모델이자 온디바이스(On-device) 환경에서도 활용 가능한 고성능의 경량 모델이다. 비교적 작은 규모임에도 유사한 크기의 글로벌 모델에 견줄 만한 성능을 자랑한다. 지난달 카카오 공식 테크블로그를 통해 공개한 바와 같이, 한국어와 영어 처리 능력에서 뛰어난 결과를 보여준다.

카카오는 이번 오픈소스 공개를 통해 AI 기술의 접근성을 높인다. 또 연구자와 개발자들이 해당 모델을 토대로 다양한 응용을 시도할 수 있도록 모델의 업데이트를 지속 지원할 계획이다.

또한 카카오는 지난해 말 학습을 완료한 초거대 언어모델 ‘Kanana Flag’도 소개했다. 이로서 카카오는 작년 10월 개발자 컨퍼런스 ‘if(kakaoAI)2024’에서 공개한‘카나나 언어모델’의 전체 라인업(Kanana Flag, Essence, Nano)을 모두 구축하게 됐다.

Kanana Flag는 글로벌 최고 수준의 한국어·영어 성능을 달성한 모델이다. 한국어 성능을 평가하는 ‘LogicKor’, ‘KMMLU’ 벤치마크에서 타 모델을 압도하는 처리 능력을 입증했다. 영어 성능을 평가하는 ‘MT-bench’, ‘MMLU’ 벤치마크에서는 경쟁 모델과 유사한 성과를 기록했다.

또한, 학습 자원 최적화를 통해 유사 사이즈의 모델 대비 50% 이상 비용을 절감하며, SOTA(State-of-the-Art) 수준의 효율성과 성능을 동시에 구현했다.

카카오는 대규모 언어모델의 학습 효율을 극대화하고자 ▲Staged pre-training ▲Pruning(모델 구성 요소를 가지치기해 중요 요소만 남기는 기법) ▲Distillation(큰 모델의 지식을 더 작은 모델로 전달하는 증류 기법) ▲DUS(Depth Upscaling, 깊이 업스케일링) 등 혁신적 학습 기법을 적용했다.

이를 통해 경량 모델 Kanana Nano 2.1B부터 초거대 모델 ‘Kanana Flag 32.5B’까지 다양한 사이즈의 고성능 모델을 효율적으로 개발, 글로벌 유사 크기 모델 대비 절반 이하의 학습 비용을 실현했다.

카카오는 향후 카나나 모델에 강화 학습(Reinforcement Learning)과 연속 학습(Continual Learning) 기반의 최신 기술을 접목해 추론, 수학,코딩 능력을 강화하고, 정렬(Alignment) 기술을 고도화해 사용자 요청의 수행 정확도를 높일 계획이다. 이를 통해 일상에 실질적인 가치를 더하는 기술로 자리잡을 수 있도록 기술 경쟁력을 강화해 갈 예정이다.

김병학 카카오 카나나 성과리더는 “모델 최적화와 경량화 기술을 바탕으로 라마, 젬마 등 글로벌 AI 모델과 견줄 수 있는 고성능의 자체 언어모델 라인업을 효율적으로 확보하게 됐다”며 “이번 경량 모델 오픈소스 공개를 통해 국내 AI 생태계 활성화에 기여할 수 있을 것으로 기대한다”고 말했다.

아울러 “앞으로도 효율과 성능 중심의 실용적이고 안전한 AI 모델을 개발해가며, 지속적 기술 혁신을 통해 AI 경쟁력을 강화해 갈 계획”이라고 덧붙였다.

김재훈 한국금융신문 기자 rlqm93@fntimes.com

데일리 금융경제뉴스 FNTIMES - 저작권법에 의거 상업적 목적의 무단 전재, 복사, 배포 금지
Copyright ⓒ 한국금융신문 & FNTIMES.com

가장 핫한 경제 소식! 한국금융신문의 ‘추천뉴스’를 받아보세요~

산업 다른 기사

1 네이버클라우드, 엔비디아와 글로벌 AI 팩토리 구축 네이버클라우드(대표 김유원)가 엔비디아와 단순한 칩 공급망 관계를 넘어, 글로벌 인공지능(AI) 생태계를 함께 구축하는 긴밀한 관계로 발전하고 있다. 양사는 인프라부터 모델과 서비스를 아우르는 풀스택 AI 역량을 기반으로 ‘글로벌 AI 팩토리’ 구축 사업을 본격 추진할 계획이다.김유원 네이버클라우드 대표는 2일 대만에서 열린 엔비디아 클라우드 파트너 서밋(NCP Summit)을 통해 치열한 AI 인프라 경쟁 속에서 양사의 리더십을 공고히 한다는 계획을 공유했다. 김 대표는 “네이버클라우드는 AI 인프라부터 서비스까지 풀스택 기술 역량을 갖고 있어 에너지와 칩, 인프라와 모델, 애플리케이션을 포함하는 엔비디아의 AI 팩토리 플랫폼 2 ‘서브컬처 확장’ 엔씨, ‘아스트라에 오라티오’ PV 오픈 엔씨(공동대표 김택진, 박병무)가 서브컬처 기대작 ‘아스트라 오라티오’의 첫 플레이 영상을 공개하며 본격적인 이용자 마음 잡기에 나선다. 엔씨가 추진하는 장르 다변화, IP(지적재산권) 확대 대표 주자인 만큼 향후 흥행 여부에 관심이 쏠린다.엔씨는 2일 신작 서브컬처 RPG ‘아스트라에 오라티오(개발사 디나미스 원)’의 신규 티저 PV를 공개했다.국내 서브컬처 전문 개발사 디나미스 원에서 개발 중인 아스트라에 오라티오는 마법과 행정 테마의 신전기(新伝奇) 서브컬처 RPG다. 지난 5월 12일 주요 캐릭터와 세계관 설정을 공개했다.특히 박병무 엔씨 공동대표가 추진하는 슈팅/서브컬처 등 신규 IP 전략의 핵심 타이틀이다. 이를 통해 3 업스테이지 바라기들...KT, 카카오, SK네트웍스 국내 대표 인공지능(AI) 스타트업 업스테이지가 상장 후 기업가치로 최대 5조 원의 청사진을 제시했다. 이에 따라 이 회사에 베팅한 대기업 3사(KT·카카오·SK네트웍스)의 지분 방정식이 투자은행(IB) 업계의 최대 화두로 부각되고 있다.2일 정보기술(IT) 및 IB 업계에 따르면, 카카오가 포털 ‘다음(DAUM)’을 업스테이지에 넘기는 거래와 관련해 최근 공정거래위원회의 최종 기업결합 승인이 확정됐다. 업스테이지는 네이버에서 AI 개발 조직을 이끌었던 김성훈 대표가 2020년 설립한 회사다. 자체 개발한 거대언어모델(LLM) ‘솔라(Solar)’를 통해 금융, 법률, 제조 등 기업간거래(B2B) 시장에서 독보적인 커스텀 기술력을 입증해 왔다.다만
ad
ad

한국금융 포럼 사이버관

더보기

FT카드뉴스

더보기
[그래픽 뉴스] 퇴근 후 주차했는데 수익 발생? V2G의 정체
[그래픽 뉴스] “전쟁 신호를 읽는 가장 이상한 방법, 피자 주문량”
[그래픽 뉴스] 트럼프의 ‘타코 한 입’에 흔들린 시장의 비밀
[그래픽 뉴스] 청년정책 5년 계획, 무엇이 달라지나?
[카드뉴스] KT&G, ‘CDP’ 기후변화·수자원 관리 부문 우수기업 선정

FT도서

더보기