HUFFPOST
HUFFPOST
기업과산업  인터넷·게임·콘텐츠

카카오, 한국어 기반 AI 언어모델 성능평가 데이터셋 오픈소스 공개

정희경 기자 huiky@businesspost.co.kr 2024-09-27 11:41:17
확대 축소
공유하기
페이스북 공유하기 X 공유하기 네이버 공유하기 카카오톡 공유하기 유튜브 공유하기 url 공유하기 인쇄하기

[비즈니스포스트] 카카오가 인공지능(AI) 언어모델의 함수호출(Function Call) 성능을 평가할 수 있는 한국어 데이터셋을 구축하고 지난 23일 오픈소스로 공개했다고 27일 밝혔다. 

함수호출은 AI 언어모델이 자체적으로 수행할 수 없는 동작을 지시하거나, 사전에 학습하지 않은 정보를 실시간 정보를 받아올 수 있도록 언어모델과 API 등의 외부 도구를 연결하는 기술을 뜻한다. 
 
카카오, 한국어 기반 AI 언어모델 성능평가 데이터셋 오픈소스 공개
▲ 카카오가 인공지능(AI) 언어모델의 함수호출을 평가할 수 있는 한국어 데이터셋을 구축하고 오픈소스로 공개했다고 27일 밝혔다.

언어모델이 가진 한계를 해결해 새로운 기능으로 확장할 수 있는 기능으로, 언어모델 기반 서비스 구현에 필수적이다. 예를 들어 모델에 함수호출을 활용해 지도 등의 특정 API를 연결하면 실시간 도로정보를 호출해 답변할 수 있다.  

카카오는 이번에 한국어 대화 환경에서 성능을 다면 평가할 수 있는 '펑션챗-벤치(FunctionChat-Bench)' 데이터셋을 구축했다. 카카오에 따르면 국내 정보기술(IT) 기업이 한국어 기반 관련 데이터셋을 구축한 것은 이번이 처음이다.

이 데이터셋은 함수호출 전후에 요구되는 적절한 상호작용 메시지 생성능력까지 평가 영역으로 포함한다. 

카카오 데이터셋을 오픈소스 커뮤니티 깃허브(GitHub)에 공개했으며, 앞으로 해당 데이터셋의 규모를 늘리고 영어 버전을 추가하는 등 사용성을 지속적으로 확장하기로 했다. 정희경 기자

최신기사

HLB제약 1200억 규모 주주배정 유상증자 추진, 향남 신공장 건설에 투입
이재명 "초과이윤 국민배당은 가짜뉴스", 국힘 "결국 청년부채, 김용범 경질하라"
금융위 홍콩 ELS 제재 결론 못내, 금감원에 사실관계·법리 재검토 요구
22대 국회 후반기 국회의장단 윤곽, '의장' 후보 조정식 '부의장' 후보 남인순·박덕흠
[오늘의 주목주] '아틀라스 기대감' 현대모비스 18%대 올라, 코스피 7840선 역대..
[13일 오!정말] 국힘 양향자 "논점 이탈, 본질호도, 짜증 대폭발"
대한항공 아시아나항공 흡수합병 결의, 합병비율 '1대 0.2736432'
'선크림 강자' 한국콜마 성수기 눈앞, '유니버셜 선케어'로 고객사 글로벌 진출 돕는다
[오늘Who] 농심 조용철 신라면 40주년 맞아 내놓은 포부, "건면·볶음면으로 글로벌..
반도체주 이어 움직이는 로봇주, '아틀라스' 내세운 현대차 기대감 이어진다
KoreaWho

댓글 (0)

  • - 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
  • - 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 댓글은 관련 법률에 의해 제재를 받을 수 있습니다.
  • - 타인에게 불쾌감을 주는 욕설 등 비하하는 단어가 내용에 포함되거나 인신공격성 글은 관리자의 판단에 의해 삭제 합니다.