0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音控制不是魔术,而是设计

efwedfd 来源:efwedfd 作者:efwedfd 2022-07-14 16:10 次阅读

由于硬件和软件的进化突破,语音用户界面或各种尺寸和价格点的支持 VUI 的产品现在都可以推向市场。与直到今天定义语音控制体验的“对着麦克风说话并等待”模型不同,新系统现在可以以最终用户谨慎甚至不可见的方式嵌入到产品中,并具有即时响应时间,而不是“ t 体验云延迟。

在评估智能扬声器和云的语音控制替代方案时,产品开发人员面临着新的机遇和挑战。开发人员必须考虑尺寸和位置,因为高度微型化的设备被嵌入到家具和电器中。将语音应用程序与边缘机器学习相结合对于让产品随着时间的推移变得更加智能是必要的。同时,设备也越来越依赖电池供电,需要开发人员进行工程设计以实现最佳能源管理。最后,开发人员必须考虑用户对功能的期望。对于消费者来说,精心设计的语音控制感觉无处不在,能够听到角落和穿墙的声音。所有这些以及更多内容汇集了在构建支持 VUI 的产品时必须考虑的几个设计元素。

语音控制 2.0 更自由的方面之一是可以自由地说出语音命令,而无需附近的智能扬声器。集成在智能家居设备中的语音可以使整个家庭成为一个可听区域,在识别唤醒词或其他可定义的声音时随时可用。专门的硬件和软件用于产生准确的远场音频捕获。

设计技巧

为了在远场环境中有效地捕捉声音,一些英国威廉希尔公司网站 开始发挥作用,包括:端口方向:声学端口是可以在没有物理障碍的情况下接受音频信号的地方。端口的位置(顶部或底部)由单个设备的外形尺寸决定。为了简化设计,声学端口通常位于麦克风附近,如下所示。但是,端口孔应与扬声器和其他声学噪声源(例如电机放大器)足够远,以最大限度地减少麦克风输入处的不需要的信号。

pYYBAGLOlHGAf4-SAADGbhu2oQE285.png

pYYBAGLOlHGAf4-SAADGbhu2oQE285.png

图 1. 顶部和底部加载声学端口配置的横截面(来源:Knowles)

麦克风阵列和波束成形:使用多个麦克风称为“阵列”。在任何给定时刻,麦克风阵列都会同时听到来自各个方向的声音。除了口头命令外,他们还会听到家中的其他声音和动作。通过一种称为波束成形的威廉希尔官方网站 ,可以对麦克风阵列进行编程,以选择性地捕获来自一个方向的声音,同时拒绝来自其他方向的声音。波束成形算法的最终结果是选择性地调谐出来自所需方向的信号以外的信号。波束成形是数字信号处理链中的第一步。

数字信号处理 (DSP) 算法:DSP 是任何语音控制系统的基石。这就是想要的音频信息的意义——捕捉它、聚焦它、净化它、放大它——这样音素就可以发出文字、命令和噪音,而不会破坏这个过程。DSP 几乎用于语音交互的所有阶段,从音频捕获和语音增强到语音处理。

poYBAGLOlHeABH1RAAD6ke5lWrg712.png

poYBAGLOlHeABH1RAAD6ke5lWrg712.png

图 2. 远场语音拾取(来源:Jerry Lu)

以便利为设计理念

除了针对功能进行设计之外,支持 VUI 的设备还需要针对便利性和可用性进行设计。唤醒词的两个主要设计考虑围绕能源管理和处理能力。由于 VUI 必须始终处于“侦听”模式以等待唤醒词,因此电池供电的 VUI 和 VCD 必须设计用于极低的能量消耗以及立即唤醒。此外,设备在过滤掉不需要的声音的同时区分想要的语音命令的能力需要不可忽视的处理能力,这需要准确性和即时性。包含强大音频边缘处理器的产品现在可以提供计算能力和低功耗、低延迟操作,从而实现即时用户体验。

即使在今天的早期阶段,语音控制的爆炸式增长也充分证明了智能家居中语音控制的市场机会。智能家居的支柱任务,包括安全、能源管理、娱乐和高级安全,都通过语音控制变得更简单、更容易访问。语音最终可以作为整个智能家居的统一控制器,从房子的任何房间发出命令……如果它们的设计考虑到用户并利用语音控制威廉希尔官方网站 的重大进步。

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 设计方法
    +关注

    关注

    0

    文章

    12

    浏览量

    9115
  • 语音控制
    +关注

    关注

    5

    文章

    483

    浏览量

    28261
收藏 人收藏

    评论

    相关推荐

    ADS7841发送控制字节0x97的时候,ADOUT引脚不是一直保持低电平,而是会发送0x07呢?

    为什么我在用ADS7841,发送控制字节0x97的时候,ADOUT引脚不是一直保持低电平,而是会发送0x07呢?
    发表于 12-30 06:54

    请问TMP117的出厂温度校准不是线性校准的而是分档校准的吗?

    买了5个TMP117AI芯片,在高低温箱做温度精度实验,发现TMP117测量-10度时温度会从-11.99度跳变到-8.2度,测量零度的时候也会,我想请问TMP117的出厂温度校准不是线性校准的而是分档校准的吗?
    发表于 11-29 12:07

    ADS1293空采或者拔掉心电导联线的时候,不是直线而是杂波?

    我们的产品在检验时遇到这样一个问题,用生物信号器给信号的时候波形正常无杂波,但是为什么空采或者拔掉心电导联线的时候,不是直线而是杂波?
    发表于 11-29 07:35

    智能语音开关:离线控制,守护隐私的新选择

    智能家居依赖网络,智能音箱成入口。但隐私泄露成问题,离线智能产品应运而生。九芯电子采用NRK3502离线语音芯片,实现精准语音控制,守护用户隐私,操作便捷安全。
    的头像 发表于 11-22 13:37 218次阅读
    智能<b class='flag-5'>语音</b>开关:离线<b class='flag-5'>控制</b>,守护隐私的新选择

    基于语音识别威廉希尔官方网站 的智能家居控制系统

    语音识别的智能控制系统是智能家居的重要组成部分,相比传统的遥控或触控方式,基于语音识别控制的智能家居系统通过人机语音交互的方式,实现对家居
    的头像 发表于 11-19 17:25 578次阅读
    基于<b class='flag-5'>语音</b>识别威廉希尔官方网站
的智能家居<b class='flag-5'>控制</b>系统

    为什么Gain=1对应的默认值不是16位二进制补码的中间数而是最小数?

    十进制的-32768,7FFFh为十进制的32767;分别对应最大码和最小码,为什么Gain=1对应的默认值不是16位二进制补码的中间数而是最小数?
    发表于 11-18 08:12

    用“说”智能控制灯具开关语音识别芯片NRK3603

    用“说”智能控制灯具开关是一种基于语音识别威廉希尔官方网站 的智能家居设备,它通过内置的语音识别芯片,利用离线识别算法,将用户的语音指令实现对灯具的控制
    的头像 发表于 09-07 09:26 378次阅读
    用“说”智能<b class='flag-5'>控制</b>灯具开关<b class='flag-5'>语音</b>识别芯片NRK3603

    什么是语音降噪?

    语音降噪就像一位威廉希尔官方网站 “魔术师”,它能够帮助我们从杂乱的背景噪音中提取出我们真正关心的声音。想象一下,你正在嘈杂的宿舍里和家人视频通话,宿舍里传来了各种各样的声音,这时语音降噪就能帮你过滤掉这些杂音,让对方听到你清晰的声音。
    的头像 发表于 07-09 16:27 1005次阅读
    什么是<b class='flag-5'>语音</b>降噪?

    离线语音控制威廉希尔官方网站 特点

    离线语音控制通过结合高性能的音频前端处理算法和本地AI模型实现了高效的语音识别和控制能力,不依赖于互联网连接,同时具备灵活的应用扩展性。这种解决方案为各种智能设备提供了稳定、高效和多语
    的头像 发表于 06-26 18:12 502次阅读
    离线<b class='flag-5'>语音</b><b class='flag-5'>控制</b>威廉希尔官方网站
特点

    语音控制模块_雷龙发展

      1,串口   uart串口控制模式,即异步传送收发器,通过其完成语音控制。 []()   图中,GND表示单片机系统电源的参考地,TXD是串行发送引脚,RXD是串行接收引脚。发送uart将来
    发表于 06-14 17:18

    基于ASR-PRO离线语音芯片,DIY一个可转动的语音控制的月球音响灯

    功能介绍 1、支持语音控制月球灯的底座旋转、3Wled灯片的亮灭。 2、外挂蓝牙音频模块,手机连接蓝牙即可播放音乐。 配置介绍 1、ASR-PRO离线语音模块(核心板) 2、蓝牙音频接受模块
    发表于 05-20 14:45

    MCU配对简化了语音控制接口设计

    意法半导体将其STM32微控制器(MCU)硬件和软件与Sensory的语音控制威廉希尔官方网站 相结合,以简化可穿戴设备、物联网(IoT)和智能家居应用中基于语音的用户界面的开发。 虽然Sensor
    的头像 发表于 05-06 16:21 2118次阅读

    stm32f0怎么不使用语音IC做合成语音

    我这边板子就一个功放电路,要求不使用语音IC做语音,我听别人说去了解MP3这一方面,但我只找到MCU软解码,但我怎么不了解,不清楚怎么做成自己的语音,要的是语音
    发表于 04-25 06:00

    为什么单片机I/O口驱动MOS管时,不是直接驱动,而是经过三极管

    为什么单片机I/O口驱动MOS管时,不是直接驱动,而是经过三极管 单片机I/O口驱动MOS管时,通常会通过三极管进行中间驱动,而不是直接驱动。这是因为三极管可以提供更好的电流放大和电压放大能力,以及
    的头像 发表于 01-16 11:14 3377次阅读