芯片简化了云服务语音检测算法的集成

文章作者:Majeed Ahmad

一种用于语音设计的新芯片提供了一个API,简化了将语音捕获万博投注网址算法集成到不同的云服务中。

在设计智能扬声器和其他支持语音的设备(如可穿戴设备和可听设备)时,开发者的主要挑战是让麦克风准确、有效地检测“Alexa”和“Hey谷歌”等唤醒词,以便在云端进行处理。

当DSP集团推出声控芯片系统(SoC)时,DBM10经济日报向该公司智能语音芯片产品经理约西·布罗什提出了这个问题。双核soc基于DSP和神经网络(NN)加速器,为电池驱动设备(如可听设备、可穿戴设备、真正的无线立体声(TWS)耳机和智能家居遥控器)的语音和传感器处理进行了优化。

DBM10芯片框图 图1用于语音智能产品的DBM10芯片声称具有平台方法,并提供全面的软件框架支持。来源:DSP集团

布罗什说,像亚马逊网络服务(AWS)这样的云平台对在芯片上配置寄存器不感兴趣。相反,这些云服务专注于语音算法如何有效地检测唤醒词。布罗什说:“他们希望算法能够检测唤醒词,而不需要工程师花费大量时间研究和配置芯片上的寄存器。”

因此,DSP集团开发了一个API,使得语音检测算法更容易集成到云服务中。“在某种程度上,云服务提供商的语音算法成了芯片的黑盒子,”他补充说。

通常的做法是,设备制造商发布带有麦克风设置的软件代码,并告诉算法提供商如何将算法集成到麦克风驱动程序中。以DSP集团的DBM10芯片为例,采用语音固件进行音频捕获,使语音捕获算法的集成高效、简单。

DSP集团一直与十几家云计算公司紧密合作,包括阿里巴巴、亚马逊、百度、谷歌和三星,同时将他们的语音算法移植到DSP的芯片上。据布罗什说,该公司还在某些情况下提供完整的软件套件。

至于该芯片为系统设计师提供简单部署路径的能力,Brosh表示,该公司对运行在DBM10语音接口芯片上的软件的支持一直提供到生产水平;“系统工程师不需要写一行代码。”

这就是为什么DSP集团称其DBM10芯片是一个完整的解决方案。SoC为音频算法以及感知AI算法进行了优化,采用了通用DSP和神经网络处理器nNetLite.此外,DSP Group还提供了运行在Wi-Fi芯片上的其他驱动程序,用于与DBM10芯片通信。

SoC还具有跨平台工具链,支持所有常用的人工智能(AI)和机器学习(ML)框架,以简化算法部署。工程师可以开发、训练和测试算法;接下来,他们可以将其保存为标准格式,工具链将使用它并创建一个图像下载到SoC中。

nNetLite编译器的图表 图2nNetLite编译器允许从任何框架到DBM10 SoC的任何AI/ML模型的快速优化、修剪和部署。来源:DSP集团

SoC的尺寸很小,只有4毫米2进入非常小的设备,比如智能手表。同样地,在SoC的神经网络nNetLite引擎上运行的始终打开的唤醒字算法只消耗微瓦。

本文最初发表于经济日报

马吉德艾哈迈德他是EDN的主编,报道电子设计行业已有20多年。

相关文章:

留下你的评论