Cjournal
Cjournal
기업과산업  인터넷·게임·콘텐츠

카카오, 한국어 기반 AI 언어모델 성능평가 데이터셋 오픈소스 공개

정희경 기자 huiky@businesspost.co.kr 2024-09-27 11:41:17
확대 축소
공유하기
페이스북 공유하기 X 공유하기 네이버 공유하기 카카오톡 공유하기 유튜브 공유하기 url 공유하기 인쇄하기

[비즈니스포스트] 카카오가 인공지능(AI) 언어모델의 함수호출(Function Call) 성능을 평가할 수 있는 한국어 데이터셋을 구축하고 지난 23일 오픈소스로 공개했다고 27일 밝혔다. 

함수호출은 AI 언어모델이 자체적으로 수행할 수 없는 동작을 지시하거나, 사전에 학습하지 않은 정보를 실시간 정보를 받아올 수 있도록 언어모델과 API 등의 외부 도구를 연결하는 기술을 뜻한다. 
 
카카오, 한국어 기반 AI 언어모델 성능평가 데이터셋 오픈소스 공개
▲ 카카오가 인공지능(AI) 언어모델의 함수호출을 평가할 수 있는 한국어 데이터셋을 구축하고 오픈소스로 공개했다고 27일 밝혔다.

언어모델이 가진 한계를 해결해 새로운 기능으로 확장할 수 있는 기능으로, 언어모델 기반 서비스 구현에 필수적이다. 예를 들어 모델에 함수호출을 활용해 지도 등의 특정 API를 연결하면 실시간 도로정보를 호출해 답변할 수 있다.  

카카오는 이번에 한국어 대화 환경에서 성능을 다면 평가할 수 있는 '펑션챗-벤치(FunctionChat-Bench)' 데이터셋을 구축했다. 카카오에 따르면 국내 정보기술(IT) 기업이 한국어 기반 관련 데이터셋을 구축한 것은 이번이 처음이다.

이 데이터셋은 함수호출 전후에 요구되는 적절한 상호작용 메시지 생성능력까지 평가 영역으로 포함한다. 

카카오 데이터셋을 오픈소스 커뮤니티 깃허브(GitHub)에 공개했으며, 앞으로 해당 데이터셋의 규모를 늘리고 영어 버전을 추가하는 등 사용성을 지속적으로 확장하기로 했다. 정희경 기자

최신기사

롯데마트 설 앞두고 '해피 토이저러스 데이' 진행, 최대 40% 할인
빗썸 '비트코인 오지급 사고' 보상 순차 지급, 자산 정합성 100% 확보
금융위 설 명절 자금난 해소 지원, 소상공인ᐧ중소기업에 95조 공급
공정위 DB그룹 창업회장 김준기 검찰 고발, DB 소속 재단·회사 은폐 적발
고려아연 아크에너지, 호주 NSW 주정부와 10년 에너지 서비스 계약 체결
우리은행, 외화예금 원화로 바꾸면 90% 환율 우대
농협은행 포용금융으로 대전환 선언, 강태영 "농협의 뿌리이자 존재 이유"
조국 "13일까지 답변 없으면 합당 없던 일로", 민주당 "조속히 결정"
CJ제일제당, 동계올림픽 개최지 밀라노서 '비비고 부스' 열어
빅터 차 석좌교수 "'안보는 미국 경제는 중국'은 옛말, G7·호주와 연대해야"
Cjournal

댓글 (0)

  • - 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
  • - 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 댓글은 관련 법률에 의해 제재를 받을 수 있습니다.
  • - 타인에게 불쾌감을 주는 욕설 등 비하하는 단어가 내용에 포함되거나 인신공격성 글은 관리자의 판단에 의해 삭제 합니다.