2018년 5월 16일, Smart Speaker Value Chain: Platform(Google/Amazon) & Technology momentum, Humax Smart Device 개발팀 박성흠 책임

최근 개최된 개발자 컨퍼런스 ‘구글I/O 2018’에서 피차이 최고경영자는 사람의 목소리를 정교하게 합성하는 기술, 디스플레이가 달린 AI스피커 등에 대한 소개를 하며 딥러닝을 통해 AI가 고도화 됨에 따라 사용자들의 편의가 높아질 것이라 말했다. 특히 ‘Google Duplex’라는 서비스가 이슈가 되었는데, AI가 사람처럼 자연스러운 발성과 톤으로 미용실 직원과 대화하며 예약했고, 통화를 한 상대방은 AI인 것을 인식하지 못했다. 기존 정형화 된 값만 인식하는 룰 베이스의 대화형 엔진과는 차원이 다르다. 우리나라에 출시된 기가지니, 누구, 클로바와 같은 AI 스피커는 NLP(Natural Language Processing) Engine이 문법위주로 구성되어 정해놓은 Intent에 도달하는 정확도를 높이고 있다면, 구글 어시스턴트는 정의되지 않은 Intent를 AI 스스로 정의해가며 반응하는 기술로 볼 수 있다.

AI 스피커는 버튼을 누르고 명령하는 근거리 음성인식(Near Field)에서 Voice Trigger 후 명령하는 원거리 음성인식(Far-Field)으로 발전되었다. 원거리 음성인식은 ‘Pre-Processing – Local VR – VA Platform / Service / Solution’의 단계로 구성되어 작동하는데, 휴맥스는 Pre-Processing 단계에 해당하는 Far-Field MIC 솔루션을 보유하고 있다. 원거리 잡음을 없애주는 Beam Forming & Ambient Noise Canceling 기술과 그 중 사람의 목소리만을 엔진으로 전달하는 Acoustic Echo Canceling 기술이 해당된다. 이 기술을 활용해 다양한 회사들과의 협업으로 새로운 서비스를 출시할 예정이다. 어떠한 기술이든 그 기술의 완성도에 따라 사용자의 만족도 결정될 것이기에 minimum value position을 찾는것이 중요하다.