Cjournal
Cjournal
기업과산업  전자·전기·정보통신

KT 자체개발 AI모델 '믿:음 2.0' 오픈소스 공개, 한국적 데이터로 신뢰성 향상

조승리 기자 csr@businesspost.co.kr 2025-07-03 09:49:53
확대 축소
공유하기
페이스북 공유하기 X 공유하기 네이버 공유하기 카카오톡 공유하기 유튜브 공유하기 url 공유하기 인쇄하기

[비즈니스포스트] KT는 자체 개발한 언어모델(LLM) ‘믿:음 2.0’의 오픈소스를 인공지능(AI) 개발자 플랫폼 허깅페이스를 통해 공개할 예정이라고 3일 밝혔다. 

이 오픈소스는 기업과 개인, 공공 누구나 상업적으로 활용할 수 있도록 제약 없이 개방된다.
 
KT 자체개발 AI모델 '믿:음 2.0' 오픈소스 공개, 한국적 데이터로 신뢰성 향상
▲ KT가 '한국적 AI'의 철학을 담아 자체 개발한 언어모델 '믿:음 2.0'의 오픈소스를 AI 개발자 플랫폼 허깅페이스를 통해 공개할 예정이라고 3일 밝혔다. 사진은 KT 기술혁신부문 연구원들이 서초구 KT 우면연구센터에서 믿:음 2.0을 테스트하고 있는 모습. < KT >

믿:음은 사전 학습부터 자체적으로 만든 한국적 독자 AI 모델이다. 2023년 믿:음 1.0 버전의 스탠다드, 프리미엄 2종을 출시한 이래 KT AI 고객센터, 지니TV, AI 전화, 100번 고객센터 등에 활용해 왔다.

이번에 선보이는 믿:음 모델은 △115억 파라미터 규모의 ‘믿:음 2.0 베이스’ △23억 파라미터 규모의 ‘믿:음 2.0 미니’ 2종으로 모두 한국어와 영어를 지원한다. 

믿:음 2.0 베이스는 범용 서비스에 적합한 모델이다. 믿:음 2.0 미니는 베이스 모델에서 증류한 지식을 학습한 소형 모델이다. 

KT는 국내 교육용 도서와 문학 작품 등의 발간물, 법률 및 특허 문서, 각종 사전 등 다양한 산업·공공·문화 영역에서 한국 특화 데이터를 확보해 믿:음 2.0 학습에 활용했다.

이외에도 한국어의 구조와 언어학적 특성을 반영한 토크나이저를 자체 개발하고, 필터링으로 줄어든 데이터 규모는 데이터 합성 방법론을 적용해 보완했다. 

고려대학교 민족문화연구원과의 산학 협력을 통해 한국적 AI로서 믿:음 2.0의 학술적 신뢰도도 확보했다고 회사 측은 설명했다.

AI의 윤리성 및 신뢰성을 높이기 위해 국내외 정책과 가이드라인을 기반으로 전문가들과 함께 만든 ‘AI 영향 평가 체계’를 적용했다.

KT는 마이크로소프트(MS)와의 협업으로 GPT-4에 한국적 사고를 추가 학습시키는 방식의 모델도 순차적으로 공개한다.

신동훈 KT 생성형 AI 랩장은 “믿:음 2.0은 일반적 생성능력을 갖추면서도 한국의 문화와 언어를 깊이 이해하도록 고도화된 AI 모델”이라며 “이는 KT가 국내 사용자들에게 고성능 한국적 AI 모델에 대한 새로운 대안을 제시하는 한편 글로벌 경쟁력을 갖추게 될 중요한 발판이 될 것”이라고 말했다. 조승리 기자

최신기사

최태원 엔비디아 젠슨황과 실리콘밸리서 '치맥 회동', SK하이닉스 HBM 동맹 강화 기대
개인정보분쟁조정위 쿠팡 개인정보 유출 집단분쟁조정 착수, "실질적 피해 구제 노력"
삼성증권 2025년 순이익 사상 첫 1조 돌파, 국내외 주식 수수료 대폭 증가 
에쓰오일 사우디와 폴리에틸렌 5조5천억 수출 계약, 샤힌프로젝트 판로 확보
[오늘의 주목주] '역대 최대 실적' 미래에셋증권 주가 11%대 상승, 코스닥 삼천당제..
외교장관 조현 "미국 무역대표부 대표, 비관세장벽 개선 없으면 관세 인상하겠다 말해"
[9일 오!정말] 국힘 안상훈 "중국 공산당과 북한 노동당에서 보던 숙청 정치"
코스피 기관·외국인 매수세에 5290선 상승, 원/달러 환율 1460.3원 마감
LG디스플레이, 중국 난징법인 차량용 LCD 모듈사업 1천억에 매각
비트코인 1억478만 원대 상승, 미국 금리 인하 기대감에 투자심리 개선 조짐
Cjournal

댓글 (0)

  • - 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
  • - 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 댓글은 관련 법률에 의해 제재를 받을 수 있습니다.
  • - 타인에게 불쾌감을 주는 욕설 등 비하하는 단어가 내용에 포함되거나 인신공격성 글은 관리자의 판단에 의해 삭제 합니다.