HUFFPOST
HUFFPOST
기업과산업  인터넷·게임·콘텐츠

카카오, 한국어 기반 AI 언어모델 성능평가 데이터셋 오픈소스 공개

정희경 기자 huiky@businesspost.co.kr 2024-09-27 11:41:17
확대 축소
공유하기
페이스북 공유하기 X 공유하기 네이버 공유하기 카카오톡 공유하기 유튜브 공유하기 url 공유하기 인쇄하기

[비즈니스포스트] 카카오가 인공지능(AI) 언어모델의 함수호출(Function Call) 성능을 평가할 수 있는 한국어 데이터셋을 구축하고 지난 23일 오픈소스로 공개했다고 27일 밝혔다. 

함수호출은 AI 언어모델이 자체적으로 수행할 수 없는 동작을 지시하거나, 사전에 학습하지 않은 정보를 실시간 정보를 받아올 수 있도록 언어모델과 API 등의 외부 도구를 연결하는 기술을 뜻한다. 
 
카카오, 한국어 기반 AI 언어모델 성능평가 데이터셋 오픈소스 공개
▲ 카카오가 인공지능(AI) 언어모델의 함수호출을 평가할 수 있는 한국어 데이터셋을 구축하고 오픈소스로 공개했다고 27일 밝혔다.

언어모델이 가진 한계를 해결해 새로운 기능으로 확장할 수 있는 기능으로, 언어모델 기반 서비스 구현에 필수적이다. 예를 들어 모델에 함수호출을 활용해 지도 등의 특정 API를 연결하면 실시간 도로정보를 호출해 답변할 수 있다.  

카카오는 이번에 한국어 대화 환경에서 성능을 다면 평가할 수 있는 '펑션챗-벤치(FunctionChat-Bench)' 데이터셋을 구축했다. 카카오에 따르면 국내 정보기술(IT) 기업이 한국어 기반 관련 데이터셋을 구축한 것은 이번이 처음이다.

이 데이터셋은 함수호출 전후에 요구되는 적절한 상호작용 메시지 생성능력까지 평가 영역으로 포함한다. 

카카오 데이터셋을 오픈소스 커뮤니티 깃허브(GitHub)에 공개했으며, 앞으로 해당 데이터셋의 규모를 늘리고 영어 버전을 추가하는 등 사용성을 지속적으로 확장하기로 했다. 정희경 기자

최신기사

'삼성전자 끝내 총파업 가나' 법원 가처분 판결 주목, 전영현 피해 최소화 대책 시급해져
쿠팡플레이 '스포츠패스' 가격 인상, 쿠팡 와우멤버십 '미끼'에서 '독자 수익원'으로 ..
중국 AI 반도체 성과에 미국 협상카드 불안, 트럼프 시진핑 정상회담 변수로
키움증권 "CJ제일제당 수익성 반등 본격화할 것, 바이오 부문 판매량 증가"
한국투자 "달바글로벌 목표주가 상향, 브랜드 인지도 높아져 마케팅 효율 개선"
헌재기후소송단 탄소중립법 개정 촉구, 헌재서 국회로 자전거 배달 퍼포먼스
최태원·노소영 재산분할 파기환송심 첫 조정 시작, 노소영만 출석
옥스팜 '2026 트레일워커' 개최, 국내에서만 13억 넘게 모금
스텔란티스 지프 하이브리드 배터리 결함에 미국서 피소, "삼성SDI 제조"
KT&G 전자담배 해외 진출 '아태·유라시아' 조준, 방경만 해외궐련 훈풍에 올라탄다
KoreaWho

댓글 (0)

  • - 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
  • - 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 댓글은 관련 법률에 의해 제재를 받을 수 있습니다.
  • - 타인에게 불쾌감을 주는 욕설 등 비하하는 단어가 내용에 포함되거나 인신공격성 글은 관리자의 판단에 의해 삭제 합니다.