• 구독신청
  • My스크랩
  • 지면신문
FNTIMES 대한민국 최고 금융 경제지
ad

업스테이지 김성훈, 중국 AI 도용 논란에 반박…“프롬 스크래치 관련 허위 사실 강력 대응”

정채윤 기자

chaeyun@

기사입력 : 2026-01-02 17:20

2일 강남역 오피스서 ‘솔라 오픈’ 현장검증회 실시
모델 학습 로그와 체크포인트 등 주요 데이터 공개

  • kakao share
  • facebook share
  • telegram share
  • twitter share
  • clipboard copy
김성훈 업스테이지 대표가 솔라 오픈 현장 검증회에서 설명하고 있다. /사진=업스테이지

김성훈 업스테이지 대표가 솔라 오픈 현장 검증회에서 설명하고 있다. /사진=업스테이지

이미지 확대보기
[한국금융신문 정채윤 기자] 김성훈 업스테이지 대표는 회사가 중국 인공지능(AI) 모델을 도용했다는 논란이 일자 즉각 사실이 아니라고 반박했다.

김 대표는 2일 강남오피스에서 업계 및 정부 관계자 70여 명 대상의 현장 설명을 통해 “솔라 오픈이 중국 모델을 복사해 미세 조장한 결과물이라는 주장은 사실이 아니다”라며 사과를 촉구했다.

앞서 고석현 사이오닉AI 최고경영자(CEO)는 전날(1일) 소셜미디어(SNS)에 업스테이지의 AI 모델 ‘솔라 오픈’이 중국 기업 지푸AI의 ‘GLM-4.5-에어’에서 파생됐다는 게시글을 올렸다.

고 대표는 해당 게시글에서 “국민 세금이 투입된 프로젝트에서 중국 모델을 복사해 미세 조정한 결과물로 추정되는 모델이 제출된 건 상당히 큰 유감이다”라고 밝혀 화제를 모았다.

이에 김 대표는 “의견을 주고 받는 건강한 토론은 환영하나 이와 같은 허위 사실을 단정적으로 전달하는 행위는 AI3강을 향해 최선을 다하고 있는 업스테이지와 정부 노력의 의미를 심각하게 훼손하는 것”이라며 이날 솔라 오픈 모델 학습 로그와 체크포인트 등 개발 관련 주요 데이터를 모두 공개했다.

김 대표는 공개 검증에서 “일부에서 제기한 ‘LayerNorm’ 유사성을 근거로 타 모델의 가중치를 재사용했다는 주장은 통계적 착시에 불과하다”고 설명했다. 해당 구간은 모델 전체의 약 0.0004%에 불과한 미세 영역으로, 오히려 솔라 오픈의 99.9996%가 타 모델과 완전히 상이함을 보여주는 역설적 지표라는 설명이다.

또한 LayerNorm 유사성 판단에 사용된 ‘코사인 유사도’ 역시 적절한 비교 기준이 아니라고 강조했다. 김 대표는 “코사인 유사도는 벡터의 방향만 비교하는 단순 지표로, 통상 언어모델들의 LayerNorm은 비슷한 구조와 특성을 공유하기 때문에 독립적인 모델 간 유사도가 높은 값으로 나오는 것이 오히려 자연스러운 현상”이라고 반박했다.

업스테이지 솔라 오픈 현장 검증회. /사진=업스테이지

업스테이지 솔라 오픈 현장 검증회. /사진=업스테이지

이미지 확대보기
이에 업스테이지는 더 정확한 비교를 위해 정규화를 통한 모델 특성을 반영하는 ‘피어슨 상관계수’로 재분석한 결과, 솔라 오픈과 타 모델 간 패턴이 전혀 일치하지 않는다고 증명했다.

솔라 오픈이 타 모델의 토크나이저를 그대로 사용했다는 주장 역시 사실과 다르다고 말했다. 김 대표는 “해당 모델의 어휘수는 약 15만 개, 솔라 오픈은 19만 6000개이며, 실제 공통 어휘는 약 8만 개(41%)에 불과하다”며 “동일 계열 토크나이저라면 일반적으로 70% 이상 어휘가 중복되므로, 이는 솔라 오픈이 독자적으로 구축한 별개의 토크나이저임을 입증하는 정량적 근거”라고 설명했다.

이외에도 특정 모델과 구조·코드가 유사하다는 지적과 특정 모델의 소스코드를 가져와 라이선스를 조작했다는 의혹에 대해서도 사실과 다르다고 강조했다.

김 대표는 “업스테이지를 포함한 주요 오픈소스 LLM 개발사들은 학습용 코드를 외부에 공개하지 않는다”며 “공개된 모델 카드나 구조 설명을 참고해 연구 방향의 아이디어를 얻는 것은 가능하지만, 접근 자체가 불가능한 학습 코드를 재사용해 모델을 개발한다는 주장은 기술적으로 성립할 수 없다”고 반박했다.

이어 “업스테이지는 더 많은 개발자들이 솔라 오픈을 쉽게 써볼 수 있도록 인퍼런스 코드를 공개했으며, 이 과정에서 서빙 호환성을 높이기 위해 허깅페이스의 공개 오픈소스 코드베이스 일부를 활용했다”며 “이는 누구나 사용할 수 있는 ‘아파치 2.0(Apache 2.0)’ 라이선스에 따라 통상적으로 사용되는 것으로, 해당 라이선스 출처를 정확히 표기하기 위해 문구를 업데이트한 것”이라고 설명했다.

김 대표는 “앞으로도 업스테이지는 투명한 기술 공개를 바탕으로 글로벌 최고 수준의 기술력을 증명하고 국내 AI 생태계 확장에 힘쓰겠다”고 밝혔다.

정채윤 한국금융신문 기자 chaeyun@fntimes.com

가장 핫한 경제 소식! 한국금융신문의 ‘추천뉴스’를 받아보세요~

데일리 금융경제뉴스 FNTIMES - 저작권법에 의거 상업적 목적의 무단 전재, 복사, 배포 금지
Copyright ⓒ 한국금융신문 & FNTIMES.com

오늘의 뉴스

ad
ad
ad

한국금융 포럼 사이버관

더보기

FT카드뉴스

더보기
[카드뉴스] KT&G, 제조 부문 명장 선발, 기술 리더 중심 본원적 경쟁력 강화
[카드뉴스] KT&G ‘Global Jr. Committee’, 조직문화 혁신 방안 제언
대내외에서 ESG 경영 성과를 인정받은 KT&G
국어문화원연합회, 578돌 한글날 맞이 '재미있는 우리말 가게 이름 찾기' 공모전 열어
[카드뉴스] 국립생태원과 함께 환경보호 활동 강화하는 KT&G

FT도서

더보기
ad