Cjournal
Cjournal
기업과산업  인터넷·게임·콘텐츠

카카오, 한국어 기반 AI 언어모델 성능평가 데이터셋 오픈소스 공개

정희경 기자 huiky@businesspost.co.kr 2024-09-27 11:41:17
확대 축소
공유하기
페이스북 공유하기 X 공유하기 네이버 공유하기 카카오톡 공유하기 유튜브 공유하기 url 공유하기 인쇄하기

[비즈니스포스트] 카카오가 인공지능(AI) 언어모델의 함수호출(Function Call) 성능을 평가할 수 있는 한국어 데이터셋을 구축하고 지난 23일 오픈소스로 공개했다고 27일 밝혔다. 

함수호출은 AI 언어모델이 자체적으로 수행할 수 없는 동작을 지시하거나, 사전에 학습하지 않은 정보를 실시간 정보를 받아올 수 있도록 언어모델과 API 등의 외부 도구를 연결하는 기술을 뜻한다. 
 
카카오, 한국어 기반 AI 언어모델 성능평가 데이터셋 오픈소스 공개
▲ 카카오가 인공지능(AI) 언어모델의 함수호출을 평가할 수 있는 한국어 데이터셋을 구축하고 오픈소스로 공개했다고 27일 밝혔다.

언어모델이 가진 한계를 해결해 새로운 기능으로 확장할 수 있는 기능으로, 언어모델 기반 서비스 구현에 필수적이다. 예를 들어 모델에 함수호출을 활용해 지도 등의 특정 API를 연결하면 실시간 도로정보를 호출해 답변할 수 있다.  

카카오는 이번에 한국어 대화 환경에서 성능을 다면 평가할 수 있는 '펑션챗-벤치(FunctionChat-Bench)' 데이터셋을 구축했다. 카카오에 따르면 국내 정보기술(IT) 기업이 한국어 기반 관련 데이터셋을 구축한 것은 이번이 처음이다.

이 데이터셋은 함수호출 전후에 요구되는 적절한 상호작용 메시지 생성능력까지 평가 영역으로 포함한다. 

카카오 데이터셋을 오픈소스 커뮤니티 깃허브(GitHub)에 공개했으며, 앞으로 해당 데이터셋의 규모를 늘리고 영어 버전을 추가하는 등 사용성을 지속적으로 확장하기로 했다. 정희경 기자

최신기사

현대모비스 지배구조 글로벌 기준 가는 길, '1세대 거버넌스 연구원' 김화진 선임사외이..
기아 이동수단 넘어서려는 전략, 조화순 선임사외이사 선임으로 '디지털 거버넌스' 강화
현대차 왜 선임사외이사로 심달훈 선임했나, 국세청 출신으로 조세 관세 리스크 대응에 방점
[채널Who] 김유신 OCI도 반도체 슈퍼사이클 올라탄다, 국내 유일 반도체용 폴리실리..
OCI홀딩스 지주사 전환요건 유예로 한숨 돌려, '최연소 여성임원' 대표 이수미 능력 ..
OCI홀딩스 '트럼프 정책 불확실성' 너무 크다, 이우현 AI 시대 태양광 사업 확장 ..
이우현 길 닦은 OCI 반도체 소재와 원료 사업, 김유신 반도체 슈퍼사이클 타고 수확하나
쿠팡 고객 4500여 명 규모의 개인정보 노출 사고 발생, 관계당국에 신고
네이버 이해진, 사우디 방문해 디지털 화폐ᐧ데이터센터 협력 방안 논의
[현장] 잠실 롯데타운 '크리스마스 마켓' 가보니, 놀거리 먹거리 즐비한 축제
Cjournal

댓글 (0)

  • - 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
  • - 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 댓글은 관련 법률에 의해 제재를 받을 수 있습니다.
  • - 타인에게 불쾌감을 주는 욕설 등 비하하는 단어가 내용에 포함되거나 인신공격성 글은 관리자의 판단에 의해 삭제 합니다.