Cjournal
Cjournal
기업과산업  전자·전기·정보통신

KT 자체개발 AI모델 '믿:음 2.0' 오픈소스 공개, 한국적 데이터로 신뢰성 향상

조승리 기자 csr@businesspost.co.kr 2025-07-03 09:49:53
확대 축소
공유하기
페이스북 공유하기 X 공유하기 네이버 공유하기 카카오톡 공유하기 유튜브 공유하기 url 공유하기 인쇄하기

[비즈니스포스트] KT는 자체 개발한 언어모델(LLM) ‘믿:음 2.0’의 오픈소스를 인공지능(AI) 개발자 플랫폼 허깅페이스를 통해 공개할 예정이라고 3일 밝혔다. 

이 오픈소스는 기업과 개인, 공공 누구나 상업적으로 활용할 수 있도록 제약 없이 개방된다.
 
KT 자체개발 AI모델 '믿:음 2.0' 오픈소스 공개, 한국적 데이터로 신뢰성 향상
▲ KT가 '한국적 AI'의 철학을 담아 자체 개발한 언어모델 '믿:음 2.0'의 오픈소스를 AI 개발자 플랫폼 허깅페이스를 통해 공개할 예정이라고 3일 밝혔다. 사진은 KT 기술혁신부문 연구원들이 서초구 KT 우면연구센터에서 믿:음 2.0을 테스트하고 있는 모습. < KT >

믿:음은 사전 학습부터 자체적으로 만든 한국적 독자 AI 모델이다. 2023년 믿:음 1.0 버전의 스탠다드, 프리미엄 2종을 출시한 이래 KT AI 고객센터, 지니TV, AI 전화, 100번 고객센터 등에 활용해 왔다.

이번에 선보이는 믿:음 모델은 △115억 파라미터 규모의 ‘믿:음 2.0 베이스’ △23억 파라미터 규모의 ‘믿:음 2.0 미니’ 2종으로 모두 한국어와 영어를 지원한다. 

믿:음 2.0 베이스는 범용 서비스에 적합한 모델이다. 믿:음 2.0 미니는 베이스 모델에서 증류한 지식을 학습한 소형 모델이다. 

KT는 국내 교육용 도서와 문학 작품 등의 발간물, 법률 및 특허 문서, 각종 사전 등 다양한 산업·공공·문화 영역에서 한국 특화 데이터를 확보해 믿:음 2.0 학습에 활용했다.

이외에도 한국어의 구조와 언어학적 특성을 반영한 토크나이저를 자체 개발하고, 필터링으로 줄어든 데이터 규모는 데이터 합성 방법론을 적용해 보완했다. 

고려대학교 민족문화연구원과의 산학 협력을 통해 한국적 AI로서 믿:음 2.0의 학술적 신뢰도도 확보했다고 회사 측은 설명했다.

AI의 윤리성 및 신뢰성을 높이기 위해 국내외 정책과 가이드라인을 기반으로 전문가들과 함께 만든 ‘AI 영향 평가 체계’를 적용했다.

KT는 마이크로소프트(MS)와의 협업으로 GPT-4에 한국적 사고를 추가 학습시키는 방식의 모델도 순차적으로 공개한다.

신동훈 KT 생성형 AI 랩장은 “믿:음 2.0은 일반적 생성능력을 갖추면서도 한국의 문화와 언어를 깊이 이해하도록 고도화된 AI 모델”이라며 “이는 KT가 국내 사용자들에게 고성능 한국적 AI 모델에 대한 새로운 대안을 제시하는 한편 글로벌 경쟁력을 갖추게 될 중요한 발판이 될 것”이라고 말했다. 조승리 기자

최신기사

석유 2차 최고가격제 시행, 휘발유 1934원·경유 1923원·등유 1530원
OECD 올해 G20 물가상승률 4% 전망, 한국 경제성장률 2.1%서 1.7%로 하향
정부 복제약 가격 16% 인하키로, 제약업계 "수익 악화·R&D 투자 감소 우려"
롯데케미칼 대산공장 물적분할 후 '대산석화' 신설, 이후 현대케미칼과 합병
대한항공 앞으로 13년간 보잉 항공기 103대 도입 결정, 모두 54조 규모
[오늘의 주목주] '반도체 투심 위축' SK스퀘어 주가 7%대 하락, 코스닥 코오롱티슈..
농협금융 1조 규모 상생성장펀드 조성, 이찬우 "국가 성장 정책 뒷받침"
[현장] 일본 JCB 한국인 일본 여행객 공략, "일본 체험 제공' "매월 유니버설 5..
[채널Who] 처벌은 끝이 아닌 '교화'의 시작, 이재명 정부는 13세의 나이보다 그 ..
CPU 수요 증가에 기판주 수혜, 삼성전기 대덕전자 LG이노텍 기대감 인다
Cjournal

댓글 (0)

  • - 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
  • - 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 댓글은 관련 법률에 의해 제재를 받을 수 있습니다.
  • - 타인에게 불쾌감을 주는 욕설 등 비하하는 단어가 내용에 포함되거나 인신공격성 글은 관리자의 판단에 의해 삭제 합니다.