音频前端和唤醒词检测:Alexa参考设计中的关键注意事项万博投注网址

文章:Majeed Ahmad

以下是开发者在选择围绕Alexa语音服务设计的硬件和软件开发工具包时需要审查的内容。万博投注网址

设计工程师可以使用硬件模块和软件服务,将Alexa语音服务(AVS)集成到智能家居,汽车和可穿戴设备中;这将基于云的Alexa经验从便携式扬声器到智能设备到车载信息娱乐的产品。开发人员可以将Alexa集成到基于语音的产品中,并编写一个配套应用程序将产品转换为连接的应用程序。

由于亚马逊将原始Alexa设备带到2014年市场,亚马逊网络服务(AWS)以及几个芯片制造商已经推出了参考设计,帮助工程师通过提供预先构建和预先测试的设计来实现亚马逊的语音识别技术和AVS接口。万博投注网址

因此,如果您的公司没有大量的工程师从事硬件和软件开发,那么参考设计可以简化基于alexa设计的简单且经济有效的自然语言理解和语音界面的开发。万博投注网址否则,高质量音频处理的集成使得语音设备的开发变得冗长而复杂。

基于AVS的语音应用的参考设计的照片 图1基于avs的语音应用万博投注网址的参考设计是为了将亚马逊的语音识别技术无缝集成到语音控制设备中。来源:STMicroelectronics.

后字检测

这一切都以强大的唤醒词引擎(WWE)开头,在系统采用任何操作之前侦听关键字“Alexa”。有一个基于云的唤醒词验证,验证了上下文,并确保用户真正想要Alexa。这里,参考设计的语音捕获部分通过在现实世界中执行音频捕获来增强“Alexa”唤醒词检测。因此,设计师甚至可以中断嘈杂的环境。

借用Cirrus Logic的示例语音捕捉开发套件对于亚马逊AVS应用程序;它提供了具有经过验证的硬件和软件组件的声学调整。即使使用用户距离设备几米,套件即使在静音和嘈杂的环境中也可以提高“Alexa”唤醒词检测。它确实通过抑制噪声和其他实际干扰来实现更准确和可靠的语音交互。

注释了远场AVS参考设计的照片 图2远场AVS参考设计针对的是智能扬声器和其他声控智能家居设备。来源:卷云逻辑

如上所示,套件包括带有双麦克风阵列的语音捕捉板,Raspberry PI 3(RPI3),扬声器和使用所需固件的MicroSD卡,用于即时生产力。控制控制台简化了各种RPI3应用程序的操作,并提供了用户友好的界面以执行声学调谐和诊断功能。

语音捕捉板的特点Cirrus逻辑CS47L24SMART CODEC,CS7250B数字MEMS麦克风和用于语音控制的声隙算法,噪声抑制和回声消除。在这里,智能编解码器集成了Hi-Fi DAC,立体声耳机放大器和单声道扬声器放大器,以减少董事会房地产和材料账单(BOM)。

其次,MEMS麦克风具有超低噪声底面和103 dB的宽动态范围,确保在具有挑战性的噪声条件下精确的语音捕获。最后,SoundClear算法会屏蔽干扰Alexa唤醒词的噪声。

这允许套件在现实世界的条件下有效地执行“Alexa”唤醒检测和音频捕获,即使在嘈杂环境中的中等距离中,使用户能够可靠地中断大声音乐或Alexa响应播放。

音频前端

基于AVS的设计中的基本硬件包括多个麦克风和音频前端(AFE),可确保在安静和嘈杂的环境中的“Alexa”唤醒词检测。这使得音频前端成为任何AVS参考设计的关键构建块。

音频前端拾取用户的声音,放大它,减少背景噪音,并将其发送到云端。这很难做到,因此,使用开发套件是创建音频前端的好方法。

takeTalkTo,DSP概念的音频前端与AVS合格的集成语音处理;它已经为STMicroelectronics的启动AWS IOT核心参考设计基于该芯片制造商的STM32 mcu。TalkTo音频前端具有降噪、回声抵消和基于先进波束形成的信号处理功能,用于远场音频检测。它是通过音频织布工具,这是一个帮助开发人员优化AVS设计的免费工具。万博投注网址

单片机语音解决方案框图 图3包括音频前端处理,本地唤醒检测,通信接口和包括RAM和闪光的内存内容的单芯片解决方案可降低BOM成本并简化布局。来源:STMicroelectronics.

ST的36×65-mm板将Wi-Fi模块与STM32H743单片机结合在一起,STM32H743单片机将音频前端处理、本地唤醒字检测、通信接口和内存集成在一块芯片上。参考设计硬件还包括一个音频子板作为一个单独的模块,以进一步简化开发和原型。

子板包括FDA903D音频编解码器、用户led和按钮,以及两个MP23DB01HP MEMS麦克风,间距为36毫米,用于尺寸限制的设计。万博投注网址这也使得开发者可以加入一个隐私模式来关闭麦克风,这样一个红色的LED就可以告诉用户Alexa听不到语音命令。

远场语音识别

其他芯片制造商也加入进来,提供了整合了亚马逊远场语音识别技术的参考设计。万博投注网址例如,NXP推出了一个参考平台,声称即使在播放吵闹的音乐时,它也能识别来自房间另一边的用户的请求。

NXP为亚马逊Alexa设计的参考平台包括7个麦克风阵列设计、音频处理算法和波束形成技术。它将亚马逊的远场语音识别技术与NXP的i.MX应用处理器集成,旨在简化语音控制设备的创建。

Alexa等语音功能的设计改变了用户万博投注网址与智能设备的交互方式,从烤面包机到炊具,从恒温器到百叶窗。在这里,参考板和语音捕捉套件为各种支持alexa的产品提供了最快的市场路线,同时确保即使在嘈杂的环境中也能高度准确的唤醒信号触发和指令解释。

我们正处于语音设备革命的初期,这些应用程序的多样性意味着预先设计和预先测试的参考板和套件可能会发挥重要作用。在将语音产品更快推向市场、绕过其设计复杂性方面,它们的作用将至关重要。

本文最初发表于edn.

Majeed Ahmad.他是EDN的主编,报道电子设计行业已有20多年。

相关文章:

留下你的评论