一种AI智能语音识别系统及其应用设备的制作方法


一种ai智能语音识别系统及其应用设备
技术领域
1.本发明属于语音识别设备技术领域,具体为一种ai智能语音识别系统及其应用设备。


背景技术:



2.语音识别是让机器识别和理解说话人语音信号内容的新兴学科,目的是将语音信号转变为文本字符或者命令的智能技术,利用计算机理解讲话人的语义内容,使其听懂人类的语音,从而判断说话人的意图,是一种非常自然和有效的人机交流方式。
3.现有技术中,语音识别首先要对采集的语音信号进行预处理,然后利用相关的语音信号处理方法计算语音的声学参数,提取相应的特征参数,最后根据提取的特征参数进行语音识别。但是在预处理时,带有噪声的语音流信号很难得到很好的语音识别,虽然使用滤波器等一系列降噪方法,但是识别效果依然不能让人满意。


技术实现要素:



4.针对现有技术的不足,本发明提供了一种ai智能语音识别系统及其应用设备,以解决上述背景技术中提出的问题。
5.为实现上述目的,本发明提供如下技术方案:一种ai智能语音识别系统,包括声音传感器、语音预处理模块、语音生成模块、语音识别单元,由微处理器对上述组成结构进行电性连接并进行操作控制,所述微处理器中内置有知识库,所述知识库用于存储和更新关键词语列表;
6.所述声音传感器,用于支持系统前端信号处理,接收语音流信号;
7.所述语音预处理模块,用于将语音流信号生成样本,并将语音样本分布转换成纯净语音;
8.所述语音生成模块,用于判定语音流信号是否来自纯净训练集,并提取区分性特征,组成训练框架提升系统噪声识别的鲁棒性;
9.所述语音识别单元,用于对语音流信号进行语义分析,并输出语音识别结果;
10.所述微处理器,用于对语音识别系统的整个识别过程进行下发识别指令并反馈识别结果。
11.进一步优化本技术方案,所述语音识别单元中内置有寄存器,并包括频谱分析模块、特征提取模块以及语音识别处理模块,上述模块包括以下具体工作内容:
12.所述频谱分析模块,用于对来自声音传感器的语音流电压信号进行频谱过滤和分析;
13.所述特征提取模块,用于提取语音信号中的特征参数;
14.所述语音识别处理模块,用于分析来自声音传感器的语音语义和语音内容,并输出识别结果。
15.进一步优化本技术方案,所述寄存器用于检测来自声音传感器的数据信息的开始
时间以及结束时间,所述寄存器并将位于开始时间和结束时间内的持续数据信息存储下来。
16.进一步优化本技术方案,所述语音识别处理模块内置有hmm模型,hmm模型对接收的非特定人语音进行识别。
17.进一步优化本技术方案,所述hmm模型对接收的非特定人语音进行识别时,根据存储在知识库中的拼音串进行动态编辑识别列表,并基于关键词语列表对非特定人语音识别。
18.进一步优化本技术方案,所述关键词语列表中的数据支持添加和删除,根据系统服务的业务场景支持定制业务话术以及关键词语优化。
19.进一步优化本技术方案,所述特征提取模块对hmm模型中的观察向量进行特征提取时,特征提取模块采用mfcc、lpcc、短时能量、过零率以及基音频率的特征参数提取。
20.一种计算机可读存储介质,所述计算机可读存储介质上存储有识别程序,所述识别程序被微处理器执行时实现如上述的ai智能语音识别系统的识别操作。
21.一种ai智能语音识别系统的应用设备,所述ai智能语音识别系统的应用设备包括微处理器及存储在所述微处理器上并可在所述微处理器上运行的识别程序,所述识别程序被所述微处理器执行时实现如上述的ai智能语音识别系统的识别操作。
22.与现有技术相比,本发明提供了一种ai智能语音识别系统及其应用设备,具备以下有益效果:
23.该ai智能语音识别系统及其应用设备,通过设置语音预处理模块,将带有噪声的语音样本分布转换成纯净语音,后续识别中通过提取区分性特征,组成人工智能的训练框架,通过对抗训练的方式,将语音样本最大限度的转换为纯净语音,从而提升系统噪声识别的鲁棒性。
附图说明
24.图1为本发明提出的一种ai智能语音识别系统的结构示意图;
25.图2为本发明提出的一种ai智能语音识别系统中语音识别单元的结构示意图。
具体实施方式
26.下面将结合本发明的实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
27.实施例一:
28.请参阅图1,一种ai智能语音识别系统,包括声音传感器、语音预处理模块、语音生成模块、语音识别单元,由微处理器对上述组成结构进行电性连接并进行操作控制,所述微处理器中内置有知识库,所述知识库用于存储和更新关键词语列表;
29.所述声音传感器,可以选用市面上的麦克风,用于支持系统前端信号处理,接收语音流信号;
30.所述语音预处理模块,用于将语音流信号生成样本,并将语音样本分布转换成纯
净语音;
31.所述语音生成模块,用于判定语音流信号是否来自纯净训练集,并提取区分性特征,组成训练框架提升系统噪声识别的鲁棒性;
32.将带有噪声的语音样本分布转换成纯净语音,后续识别中通过提取区分性特征,组成人工智能的训练框架,通过对抗训练的方式,将语音样本最大限度的转换为纯净语音。
33.所述语音识别单元,用于对语音流信号进行语义分析,并输出语音识别结果;
34.所述微处理器,用于对语音识别系统的整个识别过程进行下发识别指令并反馈识别结果。
35.请参阅图2,具体的,所述语音识别单元中内置有寄存器,并包括频谱分析模块、特征提取模块以及语音识别处理模块,上述模块包括以下具体工作内容:
36.所述频谱分析模块,用于对来自声音传感器的语音流电压信号进行频谱过滤和分析;
37.所述特征提取模块,用于提取语音信号中的特征参数;
38.所述语音识别处理模块,用于分析来自声音传感器的语音语义和语音内容,并输出识别结果。
39.具体的,所述寄存器用于检测来自声音传感器的数据信息的开始时间以及结束时间,所述寄存器并将位于开始时间和结束时间内的持续数据信息存储下来。
40.具体的,所述语音识别处理模块内置有hmm模型,即隐马尔可夫法模型,hmm模型方法现已成为语音识别的主流技术,目前大多数大词汇量以及连续语音的非特定人语音识别系统都是基于hmm模型的识别技术,hmm模型对接收的非特定人语音进行识别。
41.具体的,所述hmm模型对接收的非特定人语音进行识别时,根据存储在知识库中的拼音串进行动态编辑识别列表,并基于关键词语列表对非特定人语音识别。
42.具体的,所述特征提取模块对hmm模型中的观察向量进行特征提取时,特征提取模块采用lpcc、短时能量、过零率以及基音频率的特征参数提取。
43.实施例二:
44.一种ai智能语音识别系统,包括声音传感器、语音预处理模块、语音生成模块、语音识别单元,由微处理器对上述组成结构进行电性连接并进行操作控制,所述微处理器中内置有知识库,所述知识库用于存储和更新关键词语列表;
45.所述声音传感器,可以选用市面上的麦克风,用于支持系统前端信号处理,接收语音流信号;
46.所述语音预处理模块,用于将语音流信号生成样本,并将语音样本分布转换成纯净语音;
47.所述语音生成模块,用于判定语音流信号是否来自纯净训练集,并提取区分性特征,组成训练框架提升系统噪声识别的鲁棒性;
48.将带有噪声的语音样本分布转换成纯净语音,后续识别中通过提取区分性特征,组成人工智能的训练框架,通过对抗训练的方式,将语音样本最大限度的转换为纯净语音。
49.所述语音识别单元,用于对语音流信号进行语义分析,并输出语音识别结果;
50.所述微处理器,用于对语音识别系统的整个识别过程进行下发识别指令并反馈识别结果。
51.具体的,所述语音识别单元中内置有寄存器,并包括频谱分析模块、特征提取模块以及语音识别处理模块,上述模块包括以下具体工作内容:
52.所述频谱分析模块,用于对来自声音传感器的语音流电压信号进行频谱过滤和分析;
53.所述特征提取模块,用于提取语音信号中的特征参数;
54.所述语音识别处理模块,用于分析来自声音传感器的语音语义和语音内容,并输出识别结果。
55.具体的,所述寄存器用于检测来自声音传感器的数据信息的开始时间以及结束时间,所述寄存器并将位于开始时间和结束时间内的持续数据信息存储下来。
56.具体的,所述语音识别处理模块内置有hmm模型,即隐马尔可夫法模型,hmm模型方法现已成为语音识别的主流技术,目前大多数大词汇量以及连续语音的非特定人语音识别系统都是基于hmm模型的识别技术,hmm模型对接收的非特定人语音进行识别。
57.具体的,所述hmm模型对接收的非特定人语音进行识别时,根据存储在知识库中的拼音串进行动态编辑识别列表,并基于关键词语列表对非特定人语音识别。
58.具体的,所述关键词语列表中的数据支持添加和删除,根据系统服务的业务场景支持定制业务话术以及关键词语优化。
59.具体的,所述特征提取模块对hmm模型中的观察向量进行特征提取时,特征提取模块采用mfcc的特征参数提取。
60.实施例三:
61.采用实施例一中所述的ai智能语音识别系统,选用一种计算机可读存储介质,所述计算机可读存储介质上存储有识别程序,所述识别程序被微处理器执行时实现如实施例一中所述的ai智能语音识别系统的识别操作。
62.实施例四:
63.采用实施例一中所述的ai智能语音识别系统,选用一种ai智能语音识别系统的应用设备,所述ai智能语音识别系统的应用设备包括微处理器及存储在所述微处理器上并可在所述微处理器上运行的识别程序,所述识别程序被所述微处理器执行时实现如实施例一中所述的ai智能语音识别系统的识别操作。
64.本发明的有益效果是:该ai智能语音识别系统及其应用设备,通过设置语音预处理模块,将带有噪声的语音样本分布转换成纯净语音,后续识别中通过提取区分性特征,组成人工智能的训练框架,通过对抗训练的方式,将语音样本最大限度的转换为纯净语音,从而提升系统噪声识别的鲁棒性。
65.在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
66.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以
理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

技术特征:


1.一种ai智能语音识别系统,其特征在于,包括声音传感器、语音预处理模块、语音生成模块、语音识别单元,由微处理器对上述组成结构进行电性连接并进行操作控制,所述微处理器中内置有知识库,所述知识库用于存储和更新关键词语列表;所述声音传感器,用于支持系统前端信号处理,接收语音流信号;所述语音预处理模块,用于将语音流信号生成样本,并将语音样本分布转换成纯净语音;所述语音生成模块,用于判定语音流信号是否来自纯净训练集,并提取区分性特征,组成训练框架提升系统噪声识别的鲁棒性;所述语音识别单元,用于对语音流信号进行语义分析,并输出语音识别结果;所述微处理器,用于对语音识别系统的整个识别过程进行下发识别指令并反馈识别结果。2.根据权利要求1所述的一种ai智能语音识别系统,其特征在于,所述语音识别单元中内置有寄存器,并包括频谱分析模块、特征提取模块以及语音识别处理模块,上述模块包括以下具体工作内容:所述频谱分析模块,用于对来自声音传感器的语音流电压信号进行频谱过滤和分析;所述特征提取模块,用于提取语音信号中的特征参数;所述语音识别处理模块,用于分析来自声音传感器的语音语义和语音内容,并输出识别结果。3.根据权利要求2所述的一种ai智能语音识别系统,其特征在于,所述寄存器用于检测来自声音传感器的数据信息的开始时间以及结束时间,所述寄存器并将位于开始时间和结束时间内的持续数据信息存储下来。4.根据权利要求2所述的一种ai智能语音识别系统,其特征在于,所述语音识别处理模块内置有hmm模型,hmm模型对接收的非特定人语音进行识别。5.根据权利要求4所述的一种ai智能语音识别系统,其特征在于,所述hmm模型对接收的非特定人语音进行识别时,根据存储在知识库中的拼音串进行动态编辑识别列表,并基于关键词语列表对非特定人语音识别。6.根据权利要求5所述的一种ai智能语音识别系统,其特征在于,所述关键词语列表中的数据支持添加和删除,根据系统服务的业务场景支持定制业务话术以及关键词语优化。7.根据权利要求2所述的一种ai智能语音识别系统,其特征在于,所述特征提取模块对hmm模型中的观察向量进行特征提取时,特征提取模块采用mfcc、lpcc、短时能量、过零率以及基音频率的特征参数提取。8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有识别程序,所述识别程序被微处理器执行时实现如权利要求1至7中任一项所述的ai智能语音识别系统的识别操作。9.一种ai智能语音识别系统的应用设备,其特征在于,所述ai智能语音识别系统的应用设备包括微处理器及存储在所述微处理器上并可在所述微处理器上运行的识别程序,所述识别程序被所述微处理器执行时实现如权利要求1至7中任一项所述的ai智能语音识别系统的识别操作。

技术总结


本发明公开了一种AI智能语音识别系统及其应用设备,属于语音识别设备技术领域,包括声音传感器、语音预处理模块、语音生成模块、语音识别单元,由微处理器对上述组成结构进行电性连接并进行操作控制,所述微处理器中内置有知识库,所述知识库用于存储和更新关键词语列表,所述语音识别单元中内置有寄存器,并包括频谱分析模块、特征提取模块以及语音识别处理模块。该AI智能语音识别系统及其应用设备,通过设置语音预处理模块,将带有噪声的语音样本分布转换成纯净语音,后续识别中通过提取区分性特征,组成人工智能的训练框架,通过对抗训练的方式,将语音样本最大限度的转换为纯净语音,从而提升系统噪声识别的鲁棒性。从而提升系统噪声识别的鲁棒性。


技术研发人员:

孙涛

受保护的技术使用者:

零壹人工智能科技研究院(南京)有限公司

技术研发日:

2021.04.22

技术公布日:

2022/10/24

本文发布于:2024-09-23 01:29:18,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/23083.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:语音   所述   模块   特征
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议