|
在设计智能扬声器和其他可启用语音的设备(例如可穿戴设备和可听设备)时,开发人员的主要挑战是使麦克风准确有效地检测唤醒词(例如“ Alexa”和“ Hey Google”)以在云中进行处理。
当DSP Group推出其语音支持的片上系统(SoC)DBM10时,EDN将此问题转交给了该公司SmartVoice芯片的产品经理Yosi Brosh。基于DSP和神经网络(NN)加速器的双核SoC经过优化,可在可听设备,可穿戴设备,真正的无线立体声(TWS)耳机和智能家居遥控器等电池供电设备中进行语音和传感器处理。
图1用于语音支持的智能产品的DBM10芯片声称具有一种平台方法,并具有全面的软件框架支持。资料来源:DSP集团
Brosh说,像Amazon Web Services(AWS)这样的云平台对在芯片上配置寄存器不感兴趣。相反,这些云服务专注于语音算法如何有效检测唤醒词。Brosh说:“他们希望算法能够检测唤醒词,而无需工程师花费大量时间来研究和配置芯片上的寄存器。”
因此,DSP Group开发了一种API,可以使语音检测算法轻松集成到云服务中。他补充说:“在某种程度上,来自云服务提供商的语音算法成为了该芯片的黑匣子。”
常见的做法是设备制造商发布带有麦克风设置的软件代码,并告诉算法提供商如何将算法集成到麦克风驱动程序中。对于DSP Group的DBM10芯片,它使用语音固件捕获音频,并使语音捕获算法的集成高效而简单。
DSP Group与包括阿里巴巴,亚马逊,百度,谷歌和三星在内的十几家云计算公司紧密合作,同时将语音算法移植到其芯片上。据Brosh称,在某些情况下,该公司还将提供完整的软件套件。
关于该芯片为系统设计人员提供方便的部署途径的能力,Brosh说,该公司对DBM10语音接口芯片上运行的软件的支持一直提供到生产级别。“系统工程师无需编写任何代码。”
这就是DSP Group称其DBM10芯片为完整解决方案的原因。SoC针对音频算法以及使用通用DSP和称为nNetLite的神经网络处理器的感应AI算法进行了优化。此外,DSP Group提供了在Wi-Fi芯片上运行的其他驱动程序,用于与DBM10芯片进行通信。
SoC还具有跨平台工具链,该工具链支持所有常用的人工智能(AI)和机器学习(ML)框架,以简化算法部署。工程师可以开发,训练和测试算法;接下来,他们可以将其保存为标准格式,工具链将对其进行保存并创建映像以下载到SoC中。
图2 nNetLite编译器允许将任何AI / ML模型从任何框架快速优化,修剪和部署到DBM10 SoC。资料来源:DSP集团
SoC的外形尺寸仅为4 mm 2,可插入诸如智能手表之类的超小型设备。同样,在SoC的神经网络nNetLite引擎上运行的永远在线唤醒字算法仅消耗微瓦。
|
|