Cjournal
Cjournal
기업과산업  인터넷·게임·콘텐츠

카카오, 한국어 기반 AI 언어모델 성능평가 데이터셋 오픈소스 공개

정희경 기자 huiky@businesspost.co.kr 2024-09-27 11:41:17
확대 축소
공유하기
페이스북 공유하기 X 공유하기 네이버 공유하기 카카오톡 공유하기 유튜브 공유하기 url 공유하기 인쇄하기

[비즈니스포스트] 카카오가 인공지능(AI) 언어모델의 함수호출(Function Call) 성능을 평가할 수 있는 한국어 데이터셋을 구축하고 지난 23일 오픈소스로 공개했다고 27일 밝혔다. 

함수호출은 AI 언어모델이 자체적으로 수행할 수 없는 동작을 지시하거나, 사전에 학습하지 않은 정보를 실시간 정보를 받아올 수 있도록 언어모델과 API 등의 외부 도구를 연결하는 기술을 뜻한다. 
 
카카오, 한국어 기반 AI 언어모델 성능평가 데이터셋 오픈소스 공개
▲ 카카오가 인공지능(AI) 언어모델의 함수호출을 평가할 수 있는 한국어 데이터셋을 구축하고 오픈소스로 공개했다고 27일 밝혔다.

언어모델이 가진 한계를 해결해 새로운 기능으로 확장할 수 있는 기능으로, 언어모델 기반 서비스 구현에 필수적이다. 예를 들어 모델에 함수호출을 활용해 지도 등의 특정 API를 연결하면 실시간 도로정보를 호출해 답변할 수 있다.  

카카오는 이번에 한국어 대화 환경에서 성능을 다면 평가할 수 있는 '펑션챗-벤치(FunctionChat-Bench)' 데이터셋을 구축했다. 카카오에 따르면 국내 정보기술(IT) 기업이 한국어 기반 관련 데이터셋을 구축한 것은 이번이 처음이다.

이 데이터셋은 함수호출 전후에 요구되는 적절한 상호작용 메시지 생성능력까지 평가 영역으로 포함한다. 

카카오 데이터셋을 오픈소스 커뮤니티 깃허브(GitHub)에 공개했으며, 앞으로 해당 데이터셋의 규모를 늘리고 영어 버전을 추가하는 등 사용성을 지속적으로 확장하기로 했다. 정희경 기자

최신기사

[여론조사꽃] 2026년 지방선거 지지도, '여당' 60.8% vs '야당' 31.4%
[여론조사꽃] 이재명 국힘 출신 인사 발탁, '바람직함' 66.1% vs '잘못됨' 2..
샤오미 전기차 성과에 올해 출하량 목표 34% 높여, 내년 해외 진출도 노려
45개 그룹 총수 주식재산 1년 새 35조 증가, 삼성 이재용 14조 늘어
[여론조사꽃] 이재명 지지율 71.2%로 2.2%p 상승, 70세 이상 62.9% 긍정
중국 전기차 가격 출혈경쟁 올해도 지속 예고, "연말 판매 부진에 재고 밀어내야" 
베네수엘라 사태가 비트코인 시세 방어능력 증명, 10만 달러로 반등 청신호
[여론조사꽃] 정당지지도 민주당 56.6% 국힘 24.1%, 격차 5.5%p 커져 
Sh수협은행장 신학기 신년사, "생산적 금융 강화" "수협자산운용과 시너지"
정부 "베네수엘라 사태 금융시장 영향 제한적" "향후 동향 면밀히 살피겠다"
Cjournal

댓글 (0)

  • - 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
  • - 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 댓글은 관련 법률에 의해 제재를 받을 수 있습니다.
  • - 타인에게 불쾌감을 주는 욕설 등 비하하는 단어가 내용에 포함되거나 인신공격성 글은 관리자의 판단에 의해 삭제 합니다.