一种基于AI语音智能控制的液晶电视的制作方法


一种基于ai语音智能控制的液晶电视
技术领域
1.本发明属于智能语音控制技术领域,尤其涉及一种基于ai语音智能控制的液晶电视。


背景技术:



2.ai语音,即智能语音技术,以语音识别技术为开端,是实现人机语言的通信,包括语音识别技术(asr)和语音合成技术(tts)。语音识别是近几年来发展最快的技术之一,随着数据处理技术的进步以及深度学习技术的不断发展,语音识别技术得到了质的飞跃,已广泛运用于智能手机、语音智能交互等各个领域。现在ai语音的识别方案很多,但是对其识别的结果不大理想,有时不执行,有时执行的不对,导致用户的体验感很差。
3.现有技术一,cn113870825a一种可自动合成音频的ai语音系统,公开了一种可自动合成音频的ai语音系统,包括外接语音系统、文案导入系统、数据交互系统、需求设定系统、音频合成系统和语音监测系统,所述外接语音系统的输出端与文案导入系统的输入端连接,所述文案导入系统的输出端均与外接语音系统、数据交互系统和需求设定系统的输入端连接。但是方案的功能单一,不利于提高客户的体验感。
4.现有技术二cn111800657a一种基于gaia+ai语音控制的智能电视多语种识别系统,本发明公开了一种基于gaia ai语音控制的智能电视多语种识别系统,属于语音控制领域,本发明公开的一种基于gaia ai语音控制的智能电视多语种识别系统,包括用于接收语音信号的遥控器、以及语音信号识别处理的控制系统,所述控制系统设置有第一语种存储模块,所述控制系统优先按照所述第一语种存储模块中的语种比对:所述控制系统提取语音输入时电视界面的信息,以优先比对在该界面下使用概率最大的关键词。直接选择第一语种存储模块中的语种库进行识别校对,同时根据所在界面信息进行相关关键词校对。但是未考虑环境噪音对液晶电视指令执行的影响,让用户的指令不能更加准确的到达液晶电视处理器。
5.通过上述分析,现有技术存在的问题及缺陷为:现有技术的液晶电视语音的识别不准确,造成液晶电视指令执行有误,客户体验度差。


技术实现要素:



6.针对现有技术存在的问题,本发明提供了一种基于ai语音智能控制的液晶电视。
7.本发明是这样实现的,一种基于ai语音智能控制的液晶电视,包括:
8.语音数据采集模块,用于采集语音,进行降噪预处理后得到ai语音信号;
9.语音信号判别模块,用于对语音数据采集模块处理的ai语音信号与预存储的语音特征信息库中的ai语音信号相对比;
10.语音结果处理模块,用于接收语音数据采集模块处理的ai语音信号,获取ai语音信号的时长;
11.指令执行操作模块,用于将语音结果处理模块的语音结果转换为串行命令符的控
制指令,并发送至液晶电视的处理器,并对比预设的控制指令表,根据指令作出相应的控制动作。
12.进一步,所述语音数据采集模块,对ai语音信号进行回音消除、去混响、语音提取和增强处理;
13.所述语音信号判别模块,若比对成功,则进行下一步操作,若比对不成功,则将语音数据采集模块处理的ai语音信号存储至语音特征信息库,存储后返回语音数据采集模块进行处理;
14.所述语音结果处理模块,若时长低于预设时长,将ai语音信号作为输入数据输入到lstm模型计算得到ai语音信号的语音结果。
15.进一步,所述语音数据采集模块包括:
16.语音信号降噪子模块,用于从语音数据采集模块采集的语音获得背景噪声的参考信号,进行噪声消除,检测是否存在目标语音信号;根据经过控制的自适应滤波系数,对目标语音信号进行自适应滤波处理;
17.回音消除子模块,包括滤波电路、分压电路以及隔直流电路,通过所述隔直流电路对自适应滤波处理的标语音信号进行隔直流处理,通过分压电路对隔直流处理后的音频信号进行分压处理,通过滤波电路对分压处理后的音频信号进行滤波处理;
18.去混响子模块,采用去混响模型,去混响模型包括:复数卷积神经网络cnn层,用于对所述输入目标语音信号中各帧信号的复数部分进行特征提取,得到各帧目标语音信号所述复数部分的音频特征,其中,所述音频特征用于指示目标语音信号相位和信号幅度;
19.语音提取子模块,用于提取经过上述处理过的目标语音信号;
20.增强子模块,用于自适应波束形成器权值,对目标语音信号的原始数据进行波束形成,得到增强的单通道目标语音时频谱,得到的数据进行反傅里叶变换,用叠接相加法重建增强后的目标语音时域信号。
21.进一步,所述去混响模型具体包括:
22.复数卷积神经网络cnn层,用于对各帧目标语音信号所述复数部分的音频特征进行复数转实数处理得到各帧目标语音信号的实数音频特征;根据各帧目标语音信号的实数音频特征,以及对应相邻帧目标语音信号的所述实数音频特征,预测得到各帧目标语音信号的第一irm表征;
23.循环神经网络rnn层,用于根据每一帧目标语音信号的所述第一irm表征,以及对应时序在先的各帧目标语音信号的所述第一irm表征,预测得到各帧目标语音信号的第二irm表征;
24.输出层,用于根据各帧目标语音信号的第二irm表征,映射得到所述n路语音信号中每一路语音信号的第m个子带信号所对应的irm。
25.进一步,所述语音信号判别模块还包括:
26.语音参数匹配子模块,用于在语音速率调整的过程,在语音参数集中查与用户选择的语音信号的风格相匹配的语音参数,并根据所述语音参数播放语音,处理对话应答;
27.语音参数分析子模块,用于实时分析通话对象的语音参数与所述语音参数的差异值;
28.差异值对比子模块,用于将差异值与预设阈值进行比较;若所述差异值超过所述
预设阈值,获取与编码策略mcs索引值,根据预设的调整策略并基于所述mcs索引值动态调整语音速率。
29.进一步,所述语音信号判别模块的对语音数据采集模块处理的ai语音信号与预存储的语音特征信息库中的ai语音信号相对比具体包括:
30.信号特征计算子模块,用于计算时域,频域和倒谱域指标反映语音信号的信号特征;
31.关键词序列形成子模块,用于通过在语音识别后进行文本词频统计进而形成关键词序列反映语音信号的内容特征;
32.信息接收子模块,用于当接收到时域,频域和倒谱域查看指令时,获取所述查看指令对应的操作信息,根据所述操作信息从预存储的语音特征信息库中选择目标时域,频域和倒谱域,根据所述时域,频域和倒谱域从所述预存储的语音特征信息库中选择;
33.信息对比结果子模块,用于根据所述时域,频域和倒谱域的对比结果,确定对比结果;
34.多级融合判决子模块,用于建立基于信号和语义的多特征判决规则来进行多级融合判决,从而识别是否存在预存储的语音特征信息库。
35.进一步,所述语音结果处理模块的lstm模型计算过程:
36.语义编码和特征向量计算子模块,用于计算注意力分布概率的语义编码和特征向量。
37.进一步,所述计算注意力分布概率的语义编码和特征向量,语义编码是通过注意力概率权重与历史输入节点的隐藏层状态乘积的累加得到;最终的语义编码是将含有历史节点的注意力概率分布的语义编码和总体向量作为传统lstm模块的输入,然后最后节点的隐藏层状态值就是最终的特征向量,为语音数据的语音结果。
38.进一步,所述语音特征信息库还包括:
39.语音特征参数训练子模块,用于预先将语音特征参数进行训练,经过深度学习生成多种场景并存储到语音特征信息库中;
40.语音特征信息匹配子模块,用于当实时提取的语音特征参数形成特征矢量序列后,与语音特征信息库中的场景进行匹配,并生成识别结果;
41.音量大小调节子模块,用于根据识别结果,液晶电视执行不同对应的音量调节指令,自动控制音量大小的调节;
42.音量执行子模块,用于当用户发出主动调节音量大小的语音时,判断用户是调大当前液晶电视音量还是调小当前电视音量,当为调大时则控制液晶电视音量大小调大一预设值,当为调小时则控制液晶电视音量大小调小一预设值。
43.进一步,所述指令执行操作模块用于将语音结果处理模块的语音结果转换为串行命令符的控制指令还包括:若扫描到未执行的语音结果任务,判断当前是否仍处于闲时时段,若当前已不处于所述闲时时段,则退出闲时合成扫描进程,等待下一个闲时时段自动触发扫描进程;当前处于所述闲时时段,则与预存储的语音特征信息库相对比,若比对成功,则进行下一步操作,若比对不成功,则将语音数据采集模块处理的ai语音信号存储至语音特征信息库,存储后返回语音数据采集模块进行处理。
44.进一步,所述语音数据采集模块还包括:异常行为防控模块,用于对不属于液晶电
视能够执行指令的判断,若不属于液晶电视能够执行的指令,则不进行语音数据采集;若属于液晶电视能够执行的指令,则进行语音数据采集;
45.对要输入的语音是否属于所述液晶电视能够执行指令的判断包括:
46.8.1智能分析和记录的语音信息,基于存储的行为异常以及分析后的语音信息进行识别;
47.8.2以及根据分析后的语音信息与存储的风险识别信息进行匹配,并生成匹配结果,根据匹配结果生成对应的等级;
48.8.3根据分析后的语音信息与存储的等级识别信息进行匹配,并生成结果信息,根据结果信息生成相应的客户等级以及判断是否存在液晶电视能够执行指令行为。
49.结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明对采集的语音信号进行了降噪、回音消除、去混响、语音提取和增强等处理,提高了语音信号的清晰度、真实度和准确度,让液晶电视能够准确的执行语音的指令,为操作者提供便利和便捷。本发明通过ai语音信号与预存储的语音特征信息库相对比,一定程度上提高液晶电视操作的安全性和稳定性。本发明采用对语音市场进行处理能够提高短时语音的识别精度,提高用户的体验度。本发明采用的语音结果转换为串行命令符的控制指令,提高了液晶电视处理器对语音结果执行的准确度,确保液晶电视按照语音的相关指令进行操作,对提高用户体验度有很大的帮助。
50.本发明的语音信号降噪模块从语音数据采集模块采集的语音获得背景噪声的参考信号,进行噪声消除,消除了环境噪音对液晶电视指令的影响,让用户的指令更加准确的到达液晶电视处理器。本发明的回音消除、去混响、语音提取和增强等处理使得目标语音信号消除了回音、混响,并对目标语音信号进行了提取和增强,对于提高用户感受度有很大的帮助。
51.本发明的方法不仅具有有效性,而且具有工程适用价值;有助于确保ai语音控制的安全。本发明实现了更加简便、准确且节约人力成本的语音对比方法。
52.本发明利用闲时时段对未执行的语音结果任务进行扫描,不仅可以有效利用闲时扫描未执行的语音结果任务,提高了语音服务的利用率,还可以减少ai外呼通话过程中合成ai语料的时间,从而提高ai语音的处理效率。
53.本发明旨在提高语音数据采集模块的工作效率和准确性,形成自动化的甄别处置流程。对于提高液晶电视的用户的体验度有很大的帮助,也利于节约资源。
附图说明
54.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
55.图1是本发明实施例提供的基于ai语音智能控制的液晶电视的结构示意图。
56.图2是本发明实施例提供的语音数据采集模块的结构示意图。
57.图3是本发明实施例提供的语音信号判别模块的结构示意图。
58.图4是本发明实施例提供的指令执行操作模块的结构示意图。
59.图5是本发明实施例提供的语音数据采集模块的异常行为防控的流程图。
具体实施方式
60.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
61.针对现有技术存在的问题,本发明提供了一种基于ai语音智能控制的液晶电视,下面结合附图对本发明作详细的描述。
62.如图1所示,本发明提供的基于ai语音智能控制的液晶电视包括:
63.语音数据采集模块,用于采集语音,进行降噪预处理后得到ai语音信号,然后对ai语音信号进行回音消除、去混响、语音提取和增强处理;
64.语音信号判别模块,用于对语音数据采集模块处理的ai语音信号与预存储的语音特征信息库中的ai语音信号相对比,若比对成功,则进行下一步操作,若比对不成功,则将语音数据采集模块处理的ai语音信号存储至语音特征信息库,存储后返回语音数据采集模块进行处理;
65.语音结果处理模块,用于接收语音数据采集模块处理的ai语音信号,获取ai语音信号的时长;若时长低于预设时长,将ai语音信号作为输入数据输入到lstm模型计算得到ai语音信号的语音结果;
66.指令执行操作模块,用于将语音结果处理模块的语音结果转换为串行命令符的控制指令,并发送至液晶电视的处理器,并对比预设的控制指令表,根据指令作出相应的控制动作。
67.本发明对采集的语音信号进行了降噪、回音消除、去混响、语音提取和增强等处理,提高了语音信号的清晰度、真实度和准确度,让液晶电视能够准确的执行语音的指令,为操作者提供便利和便捷。本发明通过ai语音信号与预存储的语音特征信息库相对比,一定程度上提高液晶电视操作的安全性和稳定性。本发明采用对语音市场进行处理能够提高短时语音的识别精度,提高用户的体验度。本发明采用的语音结果转换为串行命令符的控制指令,提高了液晶电视处理器对语音结果执行的准确度,确保液晶电视按照语音的相关指令进行操作,对提高用户体验度有很大的帮助。
68.实施例2:
69.如图2所示:在实施例1的基础上,本发明提供的语音数据采集模块用于采集语音,进行降噪等预处理后得到ai语音信号,然后对ai语音信号进行回音消除、去混响、语音提取和增强等处理;具体包括:
70.语音信号降噪子模块,用于从语音数据采集模块采集的语音获得背景噪声的参考信号,进行噪声消除,检测是否存在目标语音信号;根据经过控制的自适应滤波系数,对目标语音信号进行自适应滤波处理。
71.回音消除子模块,包括滤波电路、分压电路以及隔直流电路,通过所述隔直流电路对自适应滤波处理的标语音信号进行隔直流处理,通过分压电路对隔直流处理后的音频信号进行分压处理,通过滤波电路对分压处理后的音频信号进行滤波处理。
72.去混响子模块,采用去混响模型,去混响模型包括:复数卷积神经网络cnn层,用于
对所述输入目标语音信号中各帧信号的复数部分进行特征提取,得到各帧目标语音信号所述复数部分的音频特征,其中,所述音频特征用于指示目标语音信号相位和信号幅度;
73.语音提取子模块,用于提取经过上述处理过的目标语音信号。
74.增强子模块,用于自适应波束形成器权值,对目标语音信号的原始数据进行波束形成,得到增强的单通道目标语音时频谱,得到的数据进行反傅里叶变换,用叠接相加法重建增强后的目标语音时域信号。
75.去混响子模块包括:
76.复数卷积神经网络cnn层,用于对各帧目标语音信号所述复数部分的音频特征进行复数转实数处理得到各帧目标语音信号的实数音频特征;根据各帧目标语音信号的实数音频特征,以及对应相邻帧目标语音信号的所述实数音频特征,预测得到各帧目标语音信号的第一irm表征;
77.循环神经网络rnn层,用于根据每一帧目标语音信号的所述第一irm表征,以及对应时序在先的各帧目标语音信号的所述第一irm表征,预测得到各帧目标语音信号的第二irm表征;
78.输出层,用于根据各帧目标语音信号的第二irm表征,映射得到所述n路语音信号中每一路语音信号的第m个子带信号所对应的irm。
79.本发明的语音信号降噪模块从语音数据采集模块采集的语音获得背景噪声的参考信号,进行噪声消除,消除了环境噪音对液晶电视指令的影响,让用户的指令更加准确的到达液晶电视处理器。本发明的回音消除、去混响、语音提取和增强等处理使得目标语音信号消除了回音、混响,并对目标语音信号进行了提取和增强,对于提高用户感受度有很大的帮助。
80.实施例3:
81.在实施例1的基础上,本发明实施例提供的语音信号判别模块还包括:
82.语音参数匹配子模块,用于在语音速率调整的过程,在语音参数集中查与用户选择的语音信号的风格相匹配的语音参数,并根据所述语音参数播放语音,处理对话应答;
83.语音参数分析子模块,用于实时分析通话对象的语音参数与所述语音参数的差异值;
84.差异值对比子模块,用于将差异值与预设阈值进行比较;若所述差异值超过所述预设阈值,获取与编码策略mcs索引值,根据预设的调整策略并基于所述mcs索引值动态调整语音速率。
85.本发明的语音速率调整方法,通过实时对比通话对象的语音参数与语音参数的差异值,当差异值大于预设阈值时,调整语音参数,调整语音速率快,从而保证通话对象的语速与语音信号判别模块识别的语速相匹配。
86.实施例4:
87.如图3所示,在实施例1的基础上,本发明实施例提供的语音信号判别模块的ai语音信号与预存储的语音特征信息库中的ai语音信号相对比具体包括:
88.信号特征计算子模块,用于计算时域,频域和倒谱域指标反映语音信号的信号特征;
89.关键词序列形成子模块,用于通过在语音识别后进行文本词频统计进而形成关键
词序列反映语音信号的内容特征;
90.信息接收子模块,用于当接收到时域,频域和倒谱域查看指令时,获取所述查看指令对应的操作信息,根据所述操作信息从预存储的语音特征信息库中选择目标时域,频域和倒谱域,根据所述时域,频域和倒谱域从所述预存储的语音特征信息库中选择;
91.信息对比结果子模块,用于根据所述时域,频域和倒谱域的对比结果,确定对比结果;
92.多级融合判决子模块,用于建立基于信号和语义的多特征判决规则来进行多级融合判决,从而识别是否存在预存储的语音特征信息库。
93.本发明的方法不仅具有有效性,而且具有工程适用价值;有助于确保ai语音控制的安全。本发明实现了更加简便、准确且节约人力成本的语音对比方法。
94.实施例5:
95.在实施例1的基础上,本发明提供的语音结果处理模块用于接收语音数据采集模块处理的ai语音数据,获取语音数据的时长;若时长低于预设时长,将语音数据作为输入数据输入到lstm模型计算得到语音数据的语音结果;lstm模型计算过程:
96.语义编码和特征向量计算子模块,用于计算注意力分布概率的语义编码和特征向量。
97.进一步,所述计算注意力分布概率的语义编码和特征向量,语义编码是通过注意力概率权重与历史输入节点的隐藏层状态乘积的累加得到;最终的语义编码是将含有历史节点的注意力概率分布的语义编码和总体向量作为传统lstm模块的输入,然后最后节点的隐藏层状态值就是最终的特征向量,为语音数据的语音结果。
98.本发明采用lstm模型计算对语音数据进行处理通过了语音数据的处理效率,对语音时长进行判断和处理对于语音数据的语音结果有很大的帮助,节约了资源,提高了处理准确性。
99.实施例6:
100.如图4所示,在实施例1的基础上,本发明提供的所述语音特征信息库还包括:
101.语音特征参数训练子模块,用于预先将语音特征参数进行训练,经过深度学习生成多种场景并存储到语音特征信息库中;
102.语音特征信息匹配子模块,用于当实时提取的语音特征参数形成特征矢量序列后,与语音特征信息库中的场景进行匹配,并生成识别结果;
103.音量大小调节子模块,用于根据识别结果,液晶电视执行不同对应的音量调节指令,自动控制音量大小的调节;
104.音量执行子模块,用于当用户发出主动调节音量大小的语音时,判断用户是调大当前液晶电视音量还是调小当前电视音量,当为调大时则控制液晶电视音量大小调大一预设值,当为调小时则控制液晶电视音量大小调小一预设值。
105.本发明能够自适应调节液晶电视音量的大小,将液晶电视音量调节至最佳大小以适应用户当前所处的环境,通过自动对液晶电视音量进行智能调节,为用户提供了方便。
106.实施例7:
107.在实施例6的基础上,本发明提供的指令执行操作模块用于将语音结果处理模块的语音结果转换为串行命令符的控制指令还包括:若扫描到未执行的语音结果任务,判断
当前是否仍处于闲时时段,若当前已不处于所述闲时时段,则退出闲时合成扫描进程,等待下一个闲时时段自动触发扫描进程;当前处于所述闲时时段,则与预存储的语音特征信息库相对比,若比对成功,则进行下一步操作,若比对不成功,则将语音数据采集模块处理的ai语音信号存储至语音特征信息库,存储后返回语音数据采集模块进行处理。
108.本发明利用闲时时段对未执行的语音结果任务进行扫描,不仅可以有效利用闲时扫描未执行的语音结果任务,提高了语音服务的利用率,还可以减少ai外呼通话过程中合成ai语料的时间,从而提高ai语音的处理效率。
109.实施例8:
110.如图5所示,在实施例1的基础上,本发明提供的语音数据采集模块还包括:异常行为防控子模块,用于对不属于液晶电视能够执行指令的判断,若不属于液晶电视能够执行的指令,则不进行语音数据采集;若属于液晶电视能够执行的指令,则进行语音数据采集。
111.对要输入的语音是否属于所述液晶电视能够执行指令的判断包括:
112.8.1智能分析和记录的语音信息,基于存储的行为异常以及分析后的语音信息进行识别;
113.8.2以及根据分析后的语音信息与存储的风险识别信息进行匹配,并生成匹配结果,根据匹配结果生成对应的等级;
114.8.3根据分析后的语音信息与存储的等级识别信息进行匹配,并生成结果信息,根据结果信息生成相应的客户等级以及判断是否存在液晶电视能够执行指令行为。
115.本发明旨在提高语音数据采集模块的工作效率和准确性,形成自动化的甄别处置流程。对于提高液晶电视的用户的体验度有很大的帮助,也利于节约资源。
116.实施例9:
117.在实施例1的基础上,采集的语音的降噪处理包括:在采集的语音频率高时,输入音频划分方式与bark标度一致,但是采集的语音频段低时,输入音频至少被划分为四个频段;对于22个频段,有22个区间[0,1]内的输出值;
[0118]
设wb(k)为频段b在频率k处的幅度,则存在:
[0119]
∑bωb(k)=1;
[0120]
对于变换后的信号x(k),频带能量如下所示;
[0121][0122]
设平均每个频带的增益为gb,则gb可以表示为:
[0123][0124]
其中es(b)为实际音频能量,而e
x
(b)为输入的带噪音频能量;每个频段平均增益为则对于频段k,其内插增益表示为:
[0125][0126]
本发明实现采集的语音的降噪处理采用对频段低处理,对其进行增益,提高了ai语音识别的成功率和稳定性,有利于指令执行操作模块更好的实现液晶电视的控制。
[0127]
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、cd或dvd-rom的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
[0128]
以上所述,仅为本发明较优的具体的实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

技术特征:


1.一种基于ai语音智能控制的液晶电视,其特征在于,包括:语音数据采集模块,用于采集语音,进行降噪预处理后得到ai语音信号;语音信号判别模块,用于对语音数据采集模块处理的ai语音信号与预存储的语音特征信息库中的ai语音信号相对比;语音结果处理模块,用于接收语音数据采集模块处理的ai语音信号,获取ai语音信号的时长;指令执行操作模块,用于将语音结果处理模块的语音结果转换为串行命令符的控制指令,并发送至液晶电视的处理器,根据指令作出相应的控制动作。2.如权利要求1所述的基于ai语音智能控制的液晶电视,其特征在于,所述语音数据采集模块,对ai语音信号进行回音消除、去混响、语音提取和增强处理;所述语音信号判别模块,若比对成功,则进行下一步操作,若比对不成功,则将语音数据采集模块处理的ai语音信号存储至语音特征信息库,存储后返回语音数据采集模块进行处理;所述语音结果处理模块,若时长低于预设时长,将ai语音信号作为输入数据输入到lstm模型计算得到ai语音信号的语音结果;所述指令执行操作模块,并对比预设的控制指令表,根据指令作出相应的控制动作。3.如权利要求1所述的基于ai语音智能控制的液晶电视,其特征在于,所述语音数据采集模块包括:语音信号降噪子模块,用于从语音数据采集模块采集的语音获得背景噪声的参考信号,进行噪声消除,检测是否存在目标语音信号;根据经过控制的自适应滤波系数,对目标语音信号进行自适应滤波处理;回音消除子模块,包括滤波电路、分压电路以及隔直流电路,通过所述隔直流电路对自适应滤波处理的标语音信号进行隔直流处理,通过分压电路对隔直流处理后的音频信号进行分压处理,通过滤波电路对分压处理后的音频信号进行滤波处理;去混响子模块,采用去混响模型,去混响模型包括:复数卷积神经网络cnn层,用于对所述输入目标语音信号中各帧信号的复数部分进行特征提取,得到各帧目标语音信号所述复数部分的音频特征,其中,所述音频特征用于指示目标语音信号相位和信号幅度;语音提取子模块,用于提取经过上述处理过的目标语音信号;增强子模块,用于自适应波束形成器权值,对目标语音信号的原始数据进行波束形成,得到增强的单通道目标语音时频谱,得到的数据进行反傅里叶变换,用叠接相加法重建增强后的目标语音时域信号。4.如权利要求3所述的基于ai语音智能控制的液晶电视,其特征在于,所述去混响模型具体包括:复数卷积神经网络cnn层,用于对各帧目标语音信号所述复数部分的音频特征进行复数转实数处理得到各帧目标语音信号的实数音频特征;根据各帧目标语音信号的实数音频特征,以及对应相邻帧目标语音信号的所述实数音频特征,预测得到各帧目标语音信号的第一irm表征;循环神经网络rnn层,用于根据每一帧目标语音信号的所述第一irm表征,以及对应时序在先的各帧目标语音信号的所述第一irm表征,预测得到各帧目标语音信号的第二irm表
征;输出层,用于根据各帧目标语音信号的第二irm表征,映射得到所述n路语音信号中每一路语音信号的第m个子带信号所对应的irm。5.如权利要求1所述的基于ai语音智能控制的液晶电视,其特征在于,所述语音信号判别模块还包括:语音参数匹配子模块,用于在语音速率调整的过程,在语音参数集中查与用户选择的语音信号的风格相匹配的语音参数,并根据所述语音参数播放语音,处理对话应答;语音参数分析子模块,用于实时分析通话对象的语音参数与所述语音参数的差异值;差异值对比子模块,用于将差异值与预设阈值进行比较;若所述差异值超过所述预设阈值,获取与编码策略mcs索引值,根据预设的调整策略并基于所述mcs索引值动态调整语音速率。6.如权利要求1所述的基于ai语音智能控制的液晶电视,其特征在于,所述语音信号判别模块的对语音数据采集模块处理的ai语音信号与预存储的语音特征信息库中的ai语音信号相对比具体包括:信号特征计算子模块,用于计算时域,频域和倒谱域指标反映语音信号的信号特征;关键词序列形成子模块,用于通过在语音识别后进行文本词频统计进而形成关键词序列反映语音信号的内容特征;信息接收子模块,用于当接收到时域,频域和倒谱域查看指令时,获取所述查看指令对应的操作信息,根据所述操作信息从预存储的语音特征信息库中选择目标时域,频域和倒谱域,根据所述时域,频域和倒谱域从所述预存储的语音特征信息库中选择;信息对比结果子模块,用于根据所述时域,频域和倒谱域的对比结果,确定对比结果;多级融合判决子模块,用于建立基于信号和语义的多特征判决规则来进行多级融合判决,从而识别是否存在预存储的语音特征信息库。7.如权利要求1所述的基于ai语音智能控制的液晶电视,其特征在于,所述语音结果处理模块的lstm模型计算过程:语义编码和特征向量计算子模块,用于计算注意力分布概率的语义编码和特征向量;所述计算注意力分布概率的语义编码和特征向量,语义编码是通过注意力概率权重与历史输入节点的隐藏层状态乘积的累加得到;最终的语义编码是将含有历史节点的注意力概率分布的语义编码和总体向量作为传统lstm模块的输入,然后最后节点的隐藏层状态值就是最终的特征向量,为语音数据的语音结果。8.如权利要求1所述的基于ai语音智能控制的液晶电视,其特征在于,所述语音特征信息库还包括:语音特征参数训练子模块,用于预先将语音特征参数进行训练,经过深度学习生成多种场景并存储到语音特征信息库中;语音特征信息匹配子模块,用于当实时提取的语音特征参数形成特征矢量序列后,与语音特征信息库中的场景进行匹配,并生成识别结果;音量大小调节子模块,用于根据识别结果,液晶电视执行不同对应的音量调节指令,自动控制音量大小的调节;音量执行子模块,用于当用户发出主动调节音量大小的语音时,判断用户是调大当前
液晶电视音量还是调小当前电视音量,当为调大时则控制液晶电视音量大小调大一预设值,当为调小时则控制液晶电视音量大小调小一预设值。9.如权利要求8所述的基于ai语音智能控制的液晶电视,其特征在于,所述指令执行操作模块用于将语音结果处理模块的语音结果转换为串行命令符的控制指令还包括:若扫描到未执行的语音结果任务,判断当前是否仍处于闲时时段,若当前已不处于所述闲时时段,则退出闲时合成扫描进程,等待下一个闲时时段自动触发扫描进程;当前处于所述闲时时段,则与预存储的语音特征信息库相对比,若比对成功,则进行下一步操作,若比对不成功,则将语音数据采集模块处理的ai语音信号存储至语音特征信息库,存储后返回语音数据采集模块进行处理。10.如权利要求1所述的基于ai语音智能控制的液晶电视,其特征在于,所述语音数据采集模块还包括:异常行为防控子模块,用于对不属于液晶电视能够执行指令的判断,若不属于液晶电视能够执行的指令,则不进行语音数据采集;若属于液晶电视能够执行的指令,则进行语音数据采集;对要输入的语音是否属于所述液晶电视能够执行指令的判断包括:智能分析和记录的语音信息,基于存储的行为异常以及分析后的语音信息进行识别;以及根据分析后的语音信息与存储的风险识别信息进行匹配,并生成匹配结果,根据匹配结果生成对应的等级;根据分析后的语音信息与存储的等级识别信息进行匹配,并生成结果信息,根据结果信息生成相应的客户等级以及判断是否存在液晶电视能够执行指令行为。

技术总结


本发明属于智能语音控制技术领域,公开了一种基于AI语音智能控制的液晶电视,语音数据采集模块用于采集语音,进行降噪预处理后得到AI语音信号,然后对AI语音信号进行回音消除、去混响、语音提取和增强处理;语音信号判别模块用于对语音数据采集模块处理的AI语音信号与预存储的语音特征信息库相对比;语音结果处理模块用于接收语音数据采集模块处理的AI语音数据,获取语音数据的时长;将语音数据作为输入数据输入到LSTM模型计算得到语音数据的语音结果;指令执行操作模块用于将语音结果处理模块的语音结果转换为串行命令符的控制指令,并发送至液晶电视的处理器,根据指令作出相应的控制动作。本发明的语音处理结果准确度高。高。高。


技术研发人员:

王旭

受保护的技术使用者:

湖南大友恒实业有限公司

技术研发日:

2022.03.30

技术公布日:

2022/7/29

本文发布于:2024-09-23 06:34:08,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/19845.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:语音   信号   模块   所述
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议