[Oh!덕후] AI 음성 기술, 어디까지 왔을까
OSEN 임재형 기자
발행 2019.07.18 19: 05

 AI(인공지능)가 인간의 음성을 완벽하게 이해하는 날이 올 수 있을까. 아직까지 AI는 대화에서 나타나는 ‘감정’ ‘목소리 톤’ ‘현장 분위기’ 등 복합적인 요소를 고려하기 어렵다. 꾸준히 노력해야 하는 분야지만 엔씨소프트는 AI 기술 발전을 위한 ‘도전정신’을 끝까지 드러냈다. 
18일 엔씨소프트는 경기도 성남시 판교 엔씨소프트 R&D센터에서 ‘NC AI 미디어 토크’를 진행했다. 특히 이번 자리는 지난 4일 손정의 소프트뱅크 회장이 김택진 엔씨소프트 대표와 만찬 회동을 가지면서 주목도가 더욱 높아졌다. 지난 2011년부터 AI를 핵심기술로 선정하고 R&D 조직을 구성한 엔씨소프트는 AI센터, NLP센터 산하 5개의 랩(Lab)을 운영하고 있는 AI 선도 기업이다.
AI 관련 연구 결과를 공유하는 자리 답게 콘텐츠는 다양한 분야에서 적용되고 있었다. 지난 4월 선보인 AI 기반 야구 정보 서비스 ‘PAIGE(페이지)’는 야구 콘텐츠를 생성・요약・편집해 유저가 원하는 야구 정보를 제공하는 앱이다. 경기 데이터와 하이라이트, WE차트(실시간 승률 변화) 등 다양한 콘텐츠로 무장했다.

Q&A에 임하고 있는 이재준 엔씨소프트 AI 센터장(왼쪽).

개발 분야에선 반복적인 수작업을 줄일 수 있는 ‘의사결정기술’ ‘콘텐츠 자동 생성 기술’을 연구했고, 지난 2018년 9월엔 e스포츠 대회 ‘블소 토너먼트 2018 월드 챔피언십’ 결선 현장에서 ‘블소 비무 AI이벤트 매치’를 선보였다. ‘비무 AI’는 세계 최고 선수들과 팽팽한 접전을 보여주며 인상적인 데뷔전을 치렀다.
행동 데이터를 분석해 결과를 도출하는 부문은 이제 최고 수준에 이르렀다. 그러나 다양한 무기를 쥐고 있는 AI라도 약점은 있었다. ‘난관’인 음성 인식 분야다.
음성 인식에 대한 약점은 재치있는 질문에서 드러났다. 한 매체 기자는 “인간의 음성을 AI가 인식해 자동으로 받아적는 서비스가 있으면 좋겠다. 그러면 일의 효율이 높아질것 같다”고 질의하자, 이재준 엔씨소프트 AI 센터장은 “상당히 어려운 기술이다”며 고민이 깊은 표정을 지었다.
이재준 센터장은 “음성 인식이 딥 러닝 덕분에 많이 발전했지만, 아직 사람의 자연스러운 대화를 받아 텍스트로 바꾸는 것은 굉장이 어렵다”며 “질의-응답이 예측되지 않는 상황에서 사람과 다르게 AI의 순발력은 매우 떨어진다. 대화 상황을 이해하지 못하는 탓이 크다”고 밝혔다. 
리니지M에 적용될 계획인 '보이스 커맨드' 기술.
이재준 센터장의 답변은 앞선 발표에서 공개됐던 ‘보이스 커맨드’와 이어졌다. 리니지M과 연계된 영상과에서 소개된 ‘보이스 커맨드’는 목소리만으로 캐릭터의 행동을 지시하는 프로그램이다. 이재준 센터장은 ‘보이스 커맨드’에 대해 “쉬워보이는 기술이지만 올해 안에 모든 작업을 완료하기는 어렵다”면서 “단계적으로 개발을 해나가겠다. 간단한 명령어를 말하면, 캐릭터가 이를 인식하고 수행할 수 있는 것이 첫 단계다”고 전했다.
어려운 길이 예상되지만 이재준 센터장의 개발 의지는 확고했다. 이재준 센터장은 “음성 기술의 발전을 위해 계속해서 도전을 하고 있다”며 “우리도 육성을 받아적는 AI를 꿈꾸고 있다. 언젠가는 그런 기술들이 등장할 수 있게 봐주셨으면 좋겠다”고 말했다. /lisco@osen.co.kr

Copyright ⓒ OSEN. All rights reserved. 무단 전재 및 재배포 금지