캡제미니의 자회사인 캠브리지 컨설턴트와 소비재 및 자동차 브랜드를 지원하는 세계 최고 오디오 플랫폼 기업인 DSP 컨셉(DSP Concepts)은 오늘 오디오 음성 혁신을 위한 협약 체결 소식을 발표했다. 본 협약이 체결됨에 따라 앞으로 캠브리지 컨설턴트는 빠르게 성장하고 있는 DSP 컨셉 생태계에서 딥 러닝 기반 오디오 제품 개발을 위한 전문성과 기술을 수많은 오디오 브랜드 기업들에게 제공할 수 있을 것으로 기대된다. 이로서 DSP 컨셉의 고객들은 각 상품별 차별화된 기능을 구축하고 확장 적용하는데 필요한 전략적 카운셀링 서비스와 수 십 년의 노하우가 축적된 통합 시스템 관련 전문성을 누릴 수 있고, 캠브리지 컨설턴트는 오디오 위버 플랫폼(Audio Weaver Platform)을 사용할 수 있게 되었다. 캠브리지 컨설턴트는 오디오 위버 플랫폼에 자체 개발한 VAD (음성활동감지:Voice Activity Detector) IP를 추가하여 캠브리지 컨설턴트 고객사들을 위한 혁신적 제품 및 서비스 개발을 가속화 할 전망이다.
캠브리지 컨설턴트는 고객사들이AI 오디오 및 영상 분야 혁신을 만들어 낼 수 있도록 지원하고 있다.
마이클 마이아(Michael Maia) DSP 컨셉의 마케팅 부사장은 “캠브리지 컨설턴트는 다양한 산업분야에서 독보적인 명성을 가진 기업으로서, 업계 브랜드 기업들의 최첨단 제품 생산과 인간 인터페이스 설계를 성공적으로 지원한 사례를 통해 이미 검증된 기업이다. 캠브리지 컨설턴트와의 협업을 통해 오디오 위버 (Audio Weaver)플랫폼 지원 제품 생산자들에게 캠브리지 컨설턴트의 기술 전략과 개발 전문성을 제공할 수 있게 되어 기쁘고, 이를 통해 우리 고객들이 혁신을 가속화하고 제품 출시 기간을 앞당길 수 있게 될 것으로 기대된다.”라고 말했다. 마이클 마이아(Michael Maia) DSP 컨셉의 마케팅 부사장은 “캠브리지 컨설턴트는 다양한 산업분야에서 독보적인 명성을 가진 기업으로서, 업계 브랜드 기업들의 최첨단 제품 생산과 인간 인터페이스 설계를 성공적으로 지원한 사례를 통해 이미 검증된 기업이다. 캠브리지 컨설턴트와의 협업을 통해 오디오 위버 (Audio Weaver)플랫폼 지원 제품 생산자들에게 캠브리지 컨설턴트의 기술 전략과 개발 전문성을 제공할 수 있게 되어 기쁘고, 이를 통해 우리 고객들이 혁신을 가속화하고 제품 출시 기간을 앞당길 수 있게 될 것으로 기대된다.”라고 말했다.
캠브리지 컨설턴트는 DSP 컨셉 생태계에서 활용할 수 있는 공학과 혁신 전문성까지 그 영역을 확대하기 위해 제품 생산자들이 복잡하고 혁신적인 오디오, 시그널 처리 및 머신 러닝 기능을 구축 및 적용할 수 있도록 확대 지원할 예정이다.
다양한 분야에서 60년 이상 경험을 쌓아온 캠브리지 컨설턴트는 약 수백억 달러 상당의 블루투스 오디오 시장에 갓 출시된 CMOS 블루투스 칩에서부터 캠브리지 컨설턴트의 초저전력 오디오 응용프로그램을 기반으로 한 디지털 시그널 처리 코어인 사파이어(Sapphyre)에 이르기까지 다수의 최첨단 오디오 기술을 개발했다.
캠브리지 컨설턴트는 독보적이면서도 시장을 선도하는 기술 개발에는 “표준 플러스(Standard Plus)” 방법을 적용하고 동시에 무선 AV, 사운드 빔포밍, 웨이크온워드(wake-on-word), 에코제거(echo cancellation), 머신러닝, 딥러닝 및 음성 인식 관련 신기술을 적용하는 등 기존의 틀을 벗어난 새로운 오디오 상품 설계를 추진하고 있다.
캠브리지 컨설턴트의 로버트 탠(Robert Tan) 시그널 처리 및 AI 부서장은 “오디오 위버는 플랫폼 추상화 설계와 플랫폼 독립적 최적화가 모두 가능한 임베디드 오디오 개발을 지원하는 놀라운 플랫폼이다. 특히 오디오 위버는 생산 지연을 최소화하고 시장 출시를 앞당기는데 중요한 오디오 튜닝 상태를 실시간 자동 모니터링 할 수 있다. 즉, 제품 개발자들은 매출을 좌우하는 차별화 기능에 초점을 맞출 수 있으며, 이는 우리가 자사의 상품 서비스 개발 역량을 통해 제공할 수 있는 가장 최고의 가치라고 생각한다.”고 말했다.
두 기업의 파트너십의 최초 성과로서, 캠브리지 컨설턴트는 오디오 위버 플랫폼에서 활용할 수 있는 VAD(음성활동감지) 기술을 개발하였다. VAD는 오디오 위버 플랫폼 상에서 상시 가동/상시 가용한 음성 지원 상품(가정용 포함 기타 상품)와 통합할 수 있다.
캠브리지 컨설턴트의 시그널 처리 및 AI 부서에서는 첫번째 결과물을 시연하기 위해 DSP컨셉과 긴밀히 협업하고 있다. 이에 따라 기존에 널리 활용되고 있는WebRTC VAD와 오프라인 적용이 가능하고 강력하면서도 유연한 VAD를 기반으로 한 맞춤형 모듈을 선보일 예정이다. 캠브리지 컨설턴트는 이미 동일한 기술을 활용하여 세계에서 전력 소비량이 가장 적은 VAD 설계인 에카우테즈(Ecoutez)를 시연한 바 있다. 에카우테즈의 필요전력은 11µW로, 이는 현대식 보청기 필요전력의 100분의 1 수준에 불과하다.
오디오 위버용 WebRTC VAD는 단일 맞춤형 모듈 블록으로 활용 가능하여, 직관적인 인터페이스를 통해 드래그하여 오디오 워크플로우으로 옮길 수 있다. 개별 인풋 블록 별로 0 또는 0이 아닌 숫자값으로 비음성 또는 음성 유무를 표시한다. 또한 10,20, 또는 30ms 블록크기의 플로트 인풋 데이터와 8 kHz 오디오 샘플을 수용하기 때문에 특정 적용 사례별 필요에 따라 정확도와 반응력을 낮출 수 있다. WebRTC VAD는 또한 배경 소음을 좀 더 미세하게 제어할 수 있는 실시간 민감도 제어 기능을 지원한다.
오디오 위버는 이미 GVA(구글음성 어시스턴트), 알렉사 음성 서비스(AVS)에 최적화된 웨이크 워드(일명 깨우기 단어) 엔진을 다수 보유하고 있으며, 캠브리지 컨설턴트의 WebRTC VAD는 특히 클라우드 서비스로 구동되지 않는 음성 지원 상품에 적용할 수 있도록 추가되었다. GVA 및 AVS 기계용으로 구축된 웨이크 워드 엔진와 같이 WebRTC VAD는 시끄럽고 혼잡한 환경 속에서 고성능 음성 제어 기능을 사용할 수 있도록 소음을 제거하는 DSP 컨셉의 고유연 오디오 프론트 엔드와 결합 가능하다.
- audio
- software