KT는 AI원팀의 산학연 공동연구를 통해 인공지능기술 4종을 개발했으며 이를 KT의 인공지능사업에 적용한다고 14일 밝혔다.
▲ KT 로고.
AI원팀은 2021년 1월 무빙 픽처, 딥러닝 음성합성기술 등 인공지능기술 4종을 공개한 데 이어 2번째로 연구개발성과를 공개했다.
이번에 개발한 인공지능기술은 △로봇 실내 공간지능기술 △로봇 소셜 인터랙션(Social Interaction)기술 △보이스 클로닝(Voice Cloning)기술 △한국어 E2E(엔드투엔드) 음성인식 트랜스퍼 러닝(Transfer learning)기술 등이다.
로봇 실내 공간지능기술은 KT와 명현 카이스트 교수팀이 함께 개발했다.
로봇이 실내공간에서 사람이나 사물 등 객체의 종류와 위치를 인식해 3D 지도를 생성하고 실시간 지도 업데이트가 이뤄지는 기술이다.
AI원팀은 이 기술을 실내 자율주행에 접목하는 연구를 지속하기로 했으며 향후 KT의 실내 자율주행로봇에 적용해 정밀도를 높인다는 계획을 세웠다.
로봇 소셜 인터랙션기술은 KT와 윤성의 KAIST 교수팀이 공동으로 개발했다.
사용자의 얼굴 및 행동을 인식한 후 로봇이 수행할 행동을 추천하는 알고리즘을 구현했다. KT 로봇은 향후 이와 같은 개별 알고리즘을 연결해 로봇의 개인화된 상호작용을 구현할 계획이다.
보이스 클로닝기술은 KT와 김회린 카이스트 교수진이 함께 연구했다.
이 기술은 개인화 TTS(음성합성)서비스의 핵심기술로 목소리 복원 알고리즘이 탑재돼 인공지능이 개인 목소리 샘플을 딥러닝으로 학습한 뒤 맞춤형 목소리를 제공한다. 기존 기술보다 비용을 4분의 1 수준으로 줄이면서도 인식속도는 10배 가량 높아졌다.
KT는 이 기술을 기가지니, AI통화비서, AI로봇, AI교육 등에 도입해 '맞춤형 개인화 TTS서비스'를 상용화하기로 했다.
한국어 E2E 음성인식 트랜스퍼 러닝기술은 KT와 장준혁 한양대 교수가 공동 개발했다.
한국어 음성인식 성능을 높이면서도 학습에 필요한 데이터를 줄였다.
기존 음성인식모델을 재사용해 학습에 필요한 데이터를 줄였고 기존 딥러닝 음성인식모델보다 인식률이 13.7% 높아졌다.
KT는 이 기술을 활용해 KT의 AI 서비스를 고도화할 수 있을 것으로 기대하고 있다.
AI원팀은 2020년 2월 출범해 KT, 현대중공업그룹, LG전자, 한국투자증권, 동원그룹, 우리은행, 한진, 카이스트, 한양대, 한국전자통신연구원(ETRI) 등 10여 개의 산학연 기관과 기업이 참여하고 있다.
송재호 KT AI/DX융합사업부문장 부사장은 "AI 연구 전문성을 보유한 대학과 산업을 이끌고 있는 기업의 산학 연구는 인공지능 경쟁력을 강화하는 길이다"며 "올해도 AI원팀에서 연구기관, 기업, 스타트업 사이 협력을 통해 시너지를 내고 인공지능부문 국가경쟁력을 높이도록 최선을 다하겠다"고 말했다. 최영찬 기자