(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201710803552.X
(22)申请日 2017.09.08
(71)申请人 深圳大学
道3688号
(72)发明人 王红岩
(74)专利代理机构 深圳市君之泉知识产权代理
有限公司 44366
代理人 张丕阳
(51)Int.Cl.
G10L 15/02(2006.01)
G10L 15/06(2013.01)
G10L 15/10(2006.01)
G10L 15/26(2006.01)
G10L 25/15(2013.01)
G06F 17/27(2006.01)
(54)发明名称英语元音发声纠错方法及装置(57)摘要本发明涉及一种英语元音发声纠错方法,包括:步骤1,预存标准的英语元音发声声学模型;步骤2,录入被测对象的英语语音;步骤3,识别被测对象的英语语音中的元音;步骤4,录入被测对象朗读所述识别出的元音的语音;步骤5,对被测对象朗读所述识别出的元音的语音进行英语元音发声声学分析;步骤6,被测对象的英语元音发声声学分析数据与标准的英语元音发声声学模型比较,得到第一偏差度;步骤7,根据第一偏差度对被测对象的英语元音发声进行纠错。通过对被测对象的英语元音发声声学进行分析,并与预存的标准的英语元音发声声学模型相比较,从而对被测对象的英语元音发声进行纠正,以使得被 测对象的英语元音发声更准确。权利要求书4页 说明书7页 附图8页CN 107610691 A 2018.01.19
C N 107610691
A
1.一种英语元音发声纠错方法,其特征在于,包括:
步骤1,预存标准的英语元音发声声学模型;
步骤2,录入被测对象的英语语音;
步骤3,识别所述被测对象的英语语音中的元音;
步骤4,录入所述被测对象朗读所述识别出的元音的语音;
步骤5,对所述被测对象朗读所述识别出的元音的语音进行英语元音发声声学分析;
步骤6,所述被测对象的英语元音发声声学分析数据与所述标准的英语元音发声声学模型比较,得到第一偏差度;
步骤7根据所述第一偏差度对所述被测对象的英语元音发声进行纠错。
2.如权利要求1所述的英语元音发声纠错方法,其特征在于,所述步骤1包括:
录入多个标准英语样本对象的英语语音;
识别所述多个标准英语样本对象的英语语音中的元音;
分别对每个样本对象的元音进行英语元音发声声学分析;
根据所述英语元音发声声学分析结果生成所述标准的英语元音发声声学模型。
3.如权利要求1所述的英语元音发声纠错方法,其特征在于,所述步骤2包括:根据所述被测对象的国籍提供语音材料,并录入所述被测对象朗读所述语音材料的英语语音。
4.如权利要求1所述的英语元音发声纠错方法,其特征在于,所述步骤3包括:根据所述元音的共振峰值识别所述被测对象的英语语音中的元音。
5.如权利要求1所述的英语元音发声纠错方法,其特征在于,所述步骤3包括:根据所述元音的共振峰值以及所述元音的时长识别所述被测对象的英语语音中的元音。
6.如权利要求4或5所述的英语元音发声纠错方法,其特征在于,所述共振峰值包括第一共振峰值和第二共振峰值。
7.如权利要求1所述的英语元音发声纠错方法,其特征在于,所述步骤7包括:根据所述英语元音发声声学分析的数据和所述标准的英语元音发声声学模型,以可视的图像纠正所述被测对象的英语元音的发声。
8.如权利要求1所述的英语元音发声纠错方法,其特征在于,所述步骤7后,还包括:
再次录入所述被测对象再次朗读所述识别出的元音的语音;
对所述被测对象再次朗读的语音进行英语元音发声声学分析;
所述被测对象再次朗读的语音的英语元音发声声学分析数据与所述标准的英语元音发声声学模型比较,得到第二偏差度;
根据所述第一偏差度和所述第二偏差度输出所述被测对象的英语元音发声评价文本。
9.如权利要求1、2或8所述的英语元音发声纠错方法,其特征在于,所述英语元音发声声学分析包括:
测量所述录入的英语元音发声的共振峰值;
测量所述录入的英语元音发声的时长;
根据所述录入的英语元音发声的共振峰值以及所述时长生成所述被测对象的英语元音发声声学分析数据。
10.如权利要求9所述的英语元音发声纠错方法,其特征在于,所述共振峰值包括第一共振峰值和第二共振峰值。
11.一种存储设备,其中存储有多条指令,所述指令适于由处理器加载并执行为:
步骤1,预存标准的英语元音发声声学模型;
步骤2,录入被测对象的英语语音;
步骤3,识别所述被测对象的英语语音中的元音;
步骤4,录入所述被测对象朗读所述识别出的元音的语音;
步骤5,对所述被测对象朗读所述识别出的元音的语音进行英语元音发声声学分析;
步骤6,所述被测对象的英语元音发声声学分析数据与所述标准的英语元音发声声学模型比较,得到第一偏差度;
步骤7,根据所述第一偏差度对所述被测对象的英语元音发声进行纠错。
12.如权利要求11所述的存储设备,其特征在于,所述步骤1包括:
录入多个标准英语样本对象的英语语音;
识别所述多个标准英语样本对象的英语语音中的元音;
分别对每个样本对象的元音进行英语元音发声声学分析;
根据所述英语元音发声声学分析结果生成所述标准的英语元音发声声学模型。
13.如权利要求11所述的存储设备,其特征在于,所述步骤2包括:根据所述被测对象的国籍提供语音材料,并录入所述被测对象朗读所述语音材料的英语语音。
14.如权利要求11所述的存储设备,其特征在于,所述步骤3包括:根据所述元音的共振峰值识别所述被测对象的英语语音中的元音。
15.如权利要求11所述的存储设备,其特征在于,所述步骤3包括:根据所述元音的共振峰值以及所述元音的时长识别所述被测对象的英语语音中的元音。
16.如权利要求14或15所述的存储设备,其特征在于,所述共振峰值包括第一共振峰值和第二共振峰值。
17.如权利要求11所述的存储设备,其特征在于,所述步骤7包括:根据所述英语元音发声声学分析的数据和所述标准的英语元音发声声学模型,以可视的图像调整所述被测对象英语元音的发声。
18.如权利要求11所述的存储设备,其特征在于,所述步骤7后,还包括:
再次录入所述被测对象再次朗读所述识别出的元音的语音;
对所述被测对象再次朗读的语音进行英语元音发声声学分析;
所述被测对象再次朗读的语音的英语元音发声声学分析数据与所述标准的英语元音发声声学模型比较,得到第二偏差;
根据所述第一偏差度和所述第二偏差输出所述被测对象的英语元音发声评价文本。
19.如权利要求11、12或18所述的存储设备,其特征在于,所述英语元音发声声学分析包括:
测量所述录入的英语元音发声的共振峰值;
测量所述录入的元音发声的时长;
根据所述录入的英语元音发声的共振峰值以及所述时长生成所述录入的英语元音发声声学分析数据。
20.如权利要求19所述的存储设备,其特征在于,所述共振峰值包括第一共振峰值和第二共振峰值。
21.一种英语元音发声纠错装置,包括:
处理器,适于实现各指令;以及
存储设备,适于存储多条指令,所述指令适于由所述处理器加载并执行为:
步骤1,预存标准的英语元音发声声学模型;
步骤2,录入被测对象的英语语音;
步骤3,识别所述被测对象的英语语音中的元音;
步骤4,录入所述被测对象朗读所述识别出的元音的语音;
步骤5,对所述被测对象朗读所述识别出的元音的语音进行英语元音发声声学分析;
步骤6,所述被测对象的英语元音发声声学分析数据与所述标准的英语元音发声声学模型比较,得到第一偏差度;
步骤7,根据所述第一偏差度对所述被测对象的英语元音发声进行纠错。
22.如权利要求21所述的英语元音发声纠错装置,其特征在于,所述步骤1包括:
录入多个标准英语样本对象的英语语音;
识别所述多个标准英语样本对象的英语语音中的元音;
分别对每个样本对象的元音进行英语元音发声声学分析;
根据所述英语元音发声声学分析结果生成所述标准的英语元音发声声学模型。
23.如权利要求21所述的英语元音发声纠错装置,其特征在于,所述步骤2包括:根据所述被测对象的国籍提供语音材料,并录入所述被测对象朗读所述语音材料的英语语音。
24.如权利要求21所述的英语元音发声纠错装置,其特征在于,所述步骤3包括:根据所述元音的共振峰值识别所述被测对象的英语语音中的元音。
25.如权利要求21所述的英语元音发声纠错装置,其特征在于,所述步骤3包括:根据所述元音的共振峰值以及所述元音的时长识别所述被测对象的英语语音中的元音。
26.如权利要求24或25所述的英语元音发声纠错装置,其特征在于,所述共振峰值包括第一共振峰值和第二共振峰值。
27.如权利要求21所述的英语元音发声纠错装置,其特征在于,所述步骤7包括:根据所述英语元音发声声学分析的数据和所述标准的英语元音发声声学模型,以可视的图像调整所述被测对象英语元音的发声。
28.如权利要求21所述的英语元音发声纠错装置,其特征在于,所述步骤7后,还包括:
再次录入所述被测对象再次朗读所述识别出的元音的语音;
对所述被测对象再次朗读的语音进行英语元音发声声学分析;
所述被测对象再次朗读的语音的英语元音发声声学分析数据与所述标准的英语元音发声声学模型比较,得到第二偏差;
根据所述第一偏差度和所述第二偏差输出所述说话人的英语元音发声评价文本。
29.如权利要求21、22或28所述的英语元音发声纠错装置,其特征在于,所述英语元音发声声学分析包括:
测量所述录入的英语元音发声的共振峰值;
测量所述录入的元音发声的时长;
根据所述录入的英语元音发声的共振峰值以及所述时长生成所述录入的英语元音发声声学分析数据。
30.如权利要求29所述的英语元音发声纠错装置,其特征在于,所述共振峰值包括第一共振峰值和第二共振峰值。