인공지능(AI) 아나운서 개발기
AI 아나운서디지털 휴먼Text To SpeechSpeech To FaceAI PLUS 2020
AI 요약
Beta이 글은 이스트소프트와 줌인터넷이 협력하여 개발한 AI 아나운서 기술의 개발 과정을 소개합니다. AI PLUS 2020 컨퍼런스에서 공개된 가상 축전 영상 제작에 활용된 이 기술은 디지털 휴먼 연구의 일환으로 시작되었습니다.
3개월의 짧은 기간 안에 프로토타입 완성을 목표로, 방송국은 영상 데이터를, 줌인터넷은 서비스 노하우를, 이스트소프트는 디지털 휴먼 기술을 담당했습니다. 국내외 벤치마킹 결과, 뉴스 아나운서 영역에서는 아직 고품질의 디지털 휴먼 기술 적용 사례가 드물었으며, 유튜브에서 AI 아나운서 기술이 선보여진 사례들을 참고했습니다.
AI 아나운서 구현을 위해 Text To Speech(TTS)와 Speech To Face(STF) 기술을 활용했으며, TTS로 텍스트를 음성으로 변환하고 이 음성 정보를 바탕으로 얼굴 영상을 생성하는 방식으로 설계되었습니다.
이 글이 궁금하신가요?
원문 블로그에서 전체 내용을 확인해 보세요
원문 읽으러 가기

