0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音识别芯片的语音识别系统是如何构成的?

jf_07350686 来源:jf_07350686 作者:jf_07350686 2022-12-29 17:18 次阅读

语言识别模块对中、大词汇量的语音识别系统特别重要。当分类发生错误时可以根据语言学模型、语法结构、语义学进行判断纠正,特别是一些同音字则必须通过上下文结构才能确定词义。语言学理论包括语义结构、语法规则、语言的数学描述模型等有关方面。目前比较成功的语言模型通常是采用统计语法的语言模型与基于规则语法结构命令语言模型。语法结构可以限定不同词之间的相互连接关系,减少了识别系统的搜索空间,这有利于提高系统的识别。

一个完整的基于统计的语音识别系统可大致分为三部分:

(1)语音信号预处理与特征提取;

(2)声学模型与模式匹配;

(3)语言模型与语言处理 选择识别单元是语音识别研究的第一步。语音识别单元有单词(句)、音节和音素三种,具体选择哪一种,由具体的研究任务决定。

单词(句)单元广泛应用于中小词汇语音识别系统,但不适合大词汇系统,原因在于模型库太庞大,训练模型任务繁重,模型匹配算法复杂,难以满足实时性要求。

音节单元多见于汉语语音识别,主要因为汉语是单音节结构的语言,而英语是多音节,并且汉语虽然有大约1300个音节,但若不考虑声调,约有408个无调音节,数量相对较少。因此,对于中、大词汇量汉语语音识别系统来说,以音节为识别单元基本是可行的。

音素单元以前多见于英语语音识别的研究中,但目前中、大词汇量汉语语音识别系统也在越来越多地采用。原因在于汉语音节仅由声母(包括零声母有22个)和韵母(共有28个)构成,且声韵母声学特性相差很大。实际应用中常把声母依后续韵母的不同而构成细化声母,这样虽然增加了模型数目,但提高了易混淆音节的区分能力。由于协同发音的影响,音素单元不稳定,所以如何获得稳定的音素单元,还有待研究。

语音识别一个根本的问题是合理的选用特征。特征参数提取的目的是对语音信号进行分析处理,去掉与语音识别无关的冗余信息,获得影响语音识别的重要信息,同时对语音信号进行压缩。在实际应用中,语音信号的压缩率介于10-100之间。语音信号包含了大量各种不同的信息,提取哪些信息,用哪种方式提取,需要综合考虑各方面的因素,如成本,性能,响应时间,计算量等。非特定人语音识别系统一般侧重提取反映语义的特征参数,尽量去除说话人的个人信息;而特定人语音识别系统则希望在提取反映语义的特征参数的同时,尽量也包含说话人的个人信息。

线性预测(LP)分析威廉希尔官方网站 是目前应用广泛的特征参数提取威廉希尔官方网站 ,许多成功的应用系统都采用基于LP威廉希尔官方网站 提取的倒谱参数。但线性预测模型是纯数学模型,没有考虑人类听觉系统对语音的处理特点。

也有研究者尝试把小波分析威廉希尔官方网站 应用于特征提取,但目前性能难以与上述威廉希尔官方网站 相比,有待进一步研究。 声学模型通常是将获取的语音特征使用训练算法进行训练后产生。在识别时将输入的语音特征同声学模型(模式)进行匹配与比较,得到最佳的识别结果。

声学模型是识别系统的底层模型,并且是语音识别系统中最关键的一部分。声学模型的目的是提供一种有效的方法计算语音的特征矢量序列和每个发音模板之间的距离。声学模型的设计和语言发音特点密切相关。声学模型单元大小(字发音模型、半音节模型或音素模型)对语音训练数据量大小、系统识别率,以及灵活性有较大的影响。必须根据不同语言的特点、识别系统词汇量的大小决定识别单元的大小。

以汉语为例:

汉语按音素的发音特征分类分为辅音、单元音、复元音、复鼻尾音四种,按音节结构分类为声母和韵母。并且由音素构成声母或韵母。有时,将含有声调的韵母称为调母。由单个调母或由声母与调母拼音成为音节。汉语的一个音节就是汉语一个字的音,即音节字。由音节字构成词,最后再由词构成句子。

汉语声母共有22个,其中包括零声母,韵母共有38个。按音素分类,汉语辅音共有22个,单元音13个,复元音13个,复鼻尾音16个。

目前常用的声学模型基元为声韵母、音节或词,根据实现目的不同来选取不同的基元。汉语加上语气词共有412个音节,包括轻音字,共有1282个有调音节字,所以当在小词汇表孤立词语音识别时常选用词作为基元,在大词汇表语音识别时常采用音节或声韵母建模,而在连续语音识别时,由于协同发音的影响,常采用声韵母建模。

基于统计的语音识别模块常用的就是HMM模型λ(N,M,π,A,B),涉及到HMM模型的相关理论包括模型的结构选取、模型的初始化、模型参数的重估以及相应的识别算法等。 语言模块包括由识别语音命令构成的语法网络或由统计方法构成的语言模型,语言处理可以进行语法、语义分析。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏

    评论

    相关推荐

    基于语音识别的智能会议系统具备哪些交互功能

    标贝科技专注智能语音交互领域多年,在语音识别语音合成领域有着多项大型企业合作案例,标贝与多个智能会议系统厂商合作,成功将
    的头像 发表于 12-20 10:35 88次阅读

    NRK3502系列芯片 | 制氧机离线语音识别方案

    NRK3502芯片制氧机离线语音识别方案制氧机离线语音识别方案是基于NRK3502蓝牙双模智能语音
    的头像 发表于 12-04 01:02 129次阅读
    NRK3502系列<b class='flag-5'>芯片</b> | 制氧机离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b>方案

    语音识别威廉希尔官方网站 的应用与发展

    语音识别威廉希尔官方网站 的发展可以追溯到20世纪50年代,但直到近年来,随着计算能力的提升和机器学习威廉希尔官方网站 的进步,这项威廉希尔官方网站 才真正成熟并广泛应用于各个领域。语音识别威廉希尔官方网站 的应用不仅提高了工作效率,也极大
    的头像 发表于 11-26 09:20 452次阅读

    ASR语音识别威廉希尔官方网站 应用

    ASR(Automatic Speech Recognition)语音识别威廉希尔官方网站 ,是计算机科学与人工智能领域的重要突破,能将人类语音转换为文本,广泛应用于智能家居、医疗、交通等多个领域。以下是对ASR
    的头像 发表于 11-18 15:12 638次阅读

    离线语音识别芯片,让您的产品“听懂会说”

    ;内置NPU、浮点运算单元。依托于九芯电子在语音识别威廉希尔官方网站 上的积累和算法的不断优化和创新,将本地识别算法与芯片架构深度融合,为客户提供Turnkey
    的头像 发表于 11-17 01:01 204次阅读
    离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b><b class='flag-5'>芯片</b>,让您的产品“听懂会说”

    物联网系统智能控制产品的语音识别方案_离线语音识别芯片分析

    01 物联网系统中为什么要使用离线语音识别芯片 物联网系统中使用离线语音
    的头像 发表于 09-26 17:56 603次阅读
    物联网<b class='flag-5'>系统</b>智能控制产品的<b class='flag-5'>语音</b><b class='flag-5'>识别</b>方案_离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b><b class='flag-5'>芯片</b>分析

    WTK6900FC语音识别模块

    语音识别
    WT-深圳唯创知音电子有限公司
    发布于 :2024年09月25日 17:35:07

    智能玩具用离线语音识别芯片有什么优势

    语音识别系统,应用场景相对单一。典型应用:智能家电、语音遥控器、智能玩具、车载声控、智能家居等当离线语音识别
    的头像 发表于 09-20 10:00 288次阅读
    智能玩具用离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b><b class='flag-5'>芯片</b>有什么优势

    唯创知音WT2605C用在离在线语音识别方案# #语音芯片 #语音识别 #唯创知音

    语音识别
    WT-深圳唯创知音电子有限公司
    发布于 :2024年09月12日 17:24:28

    什么是离线语音识别芯片?与在线语音识别的区别

    离线语音识别芯片适用于智能家电等,特点为小词汇量、低成本、安全性高、响应快,无需联网。在线语音识别功能更广泛、
    的头像 发表于 07-22 11:33 406次阅读

    语音识别和自然语言处理的区别和联系

    Recognition) 1. 定义 语音识别,又称为自动语音识别(Automatic Speech Recognition, ASR),是指将人类的
    的头像 发表于 07-05 10:09 1754次阅读

    车载语音识别系统语音数据采集标注案例

    车载语音识别系统是指利用机器学习算法实现的一种自然语言处理威廉希尔官方网站 ,载语音识别系统通过辨别声音的语调、语速和音量,将所听到的语音转化成可读取的语
    的头像 发表于 06-19 15:52 362次阅读
    车载<b class='flag-5'>语音</b><b class='flag-5'>识别系统</b><b class='flag-5'>语音</b>数据采集标注案例

    车载语音识别系统语音数据采集标注案例

    车载语音识别系统是指利用机器学习算法实现的一种自然语言处理威廉希尔官方网站 ,载语音识别系统通过辨别声音的语调、语速和音量,将所听到的语音转化成可读取的语
    的头像 发表于 06-19 15:49 515次阅读

    同样的语音识别芯片,告诉你,我们厉害在哪里?

    语音识别芯片
    WT-深圳唯创知音电子有限公司
    发布于 :2024年05月30日 17:04:58

    WTK6900H语音识别芯片用于智能马桶语音控制上

    语音识别芯片
    WT-深圳唯创知音电子有限公司
    发布于 :2024年04月18日 16:48:16