基于语音信号的帕金森预测方法及设备与流程

1.本发明涉及医疗数据采集技术领域，尤其涉及一种基于语音信号的帕金森预测方法及设备。

背景技术：

2.随着社会的老年化，老年人越来越多，而老年人患帕金森病(pd)的概率会增大。同时目前还没有发现帕金森病的可逆疗法，虽然药物可以显著缓解疾病的症状，但在早期阶段，很难用简单的方法预测疾病的发生和严重程度，不仅评估时间周期长，而且评估过程复杂，影响准确性。另一方面，在医院对有帕金森病倾向的患者进行评估也不方便，消耗医疗资源，增大医疗成本。因此有必要开发一种智能的便携式设备，随时随地可以方便筛查，只有预测为帕金森病倾向的风险较高时，才去医院诊断和。
3.帕金森疾病发生前会从声音上表现出一些症状，目前已有一些基于语音的机器学习预测方法，存在的问题是机器学习要求有大量的训练样本，对pd倾向预测的带标记的样本也很少，因为标记样本需要专业知识和大量的人力成本和时间。
4.现有机器学习方法属于惯性思维建模，很容易对测试样本进行错误分类。事实上，人类根据当前的测试样本动态地改变他们的方法，而不是用相同的方法识别所有的测试样本。由于不同人的发声系统都有自己的特殊性，甚至同一个人在不同时间的发音也不同。因此，机器学习所用的训练语音样本可能与预测时测试者的语音存在很大差异，因为它们可能来自不同的人，这就导致机器学习方法容易在不同人之间产生显著的性能差异，导致很差的预测性能。虽然目前有很多很好的语音采集和特征抽取方法，但仍然受很多不可预测的因素影响，如受试者性别、很大程度上变化的声学环境，以及受试者的身体情况及特征。而且训练语音的采集和测量方法跟受试者测试时的方法也可能不同，这些方法受前述的影响具有不同的鲁棒性。这样对于同一个测试样本，这些方法的预测能力是不同的。每种预测方法就对应一种分类器，许多分类器具有不同的能力和互补性。在实验中，我们发现分类器可以很好地用于某些测试样本，但对于其他测试样本，它可能经常出错。特别是，当使用两个分类器对测试样本进行分类时，它们的分类能力可能完全相反。因此，根据测试者的具体情况，选择不同的分类器来实现个性化预测是合理的，为此本发明提出一种基于语音信号的帕金森病风险的个性化预测方法及便携式设备，它对不同测试者，首先分析测试者情况并选择最合适的分类器算法，然后再用选择的分类器算法去预测测试者患病的风险。

技术实现要素：

5.本发明的目的在于提供一种基于语音信号的帕金森预测方法及设备，不仅准确性高，而且速度快。
6.为了实现上述目的，第一方面，本发明提供的一种基于语音信号的帕金森预测方法，包括如下步骤：采集测试者的语音信号并提取语音信号的语音特征向量；构建包含至少三种不同候选分类器的分类器集合模型，对所述分类器集合模型进行训练并获得机器学习
模型，所述机器学习模型根据输入的语音特征向量在候选分类器中选择合适的分类器；将语音特征向量输入到训练好的机器学习模型中并预测测试者患帕金森病的概率。
7.优选地，采集测试者的语音信号并提取语音信号的语音特征步向量骤包括：在安静的环境下，对测试者的声音进行采集，获得语音信号；对采集的语音信号进行预处理；对预处理后的语音信号进行语音特征向量的提取。
8.优选地，所述至少三种不同候选分类器包括决策树、随机森立和神经网络。
9.优选地，构建包含至少三种不同候选分类器的分类器集合模型，对所述分类器集合模型进行训练并获得机器学习模型，所述机器学习模型根据输入的语音特征向量在候选分类器中选择合适的分类器步骤包括：将每个语音特征向量设置一个类别标签，当语音信号的测试者转为患帕金森患者时，其类别标签的值为1，否则类别标签的值为-1，以此构造一个用于训练的语音数据集sd；用所述语音数据集sd训练每个候选分类器，获得候选分类器模型以构造分类器集合模型；为所述语音数据集sd中的每个语音特征向量，选择一个合适的候选分类器模型，将此语音特征向量贴上该合适的候选分类器模型为标签，进而构造一个新的分类器模型数据集cd；采用分类器模型数据集cd训练一个机器学习方法，获得机器学习模型。用训练获得机器学习模型对输入的语音信号的语音特征向量进行分类，获得该语音特征向量的候选分类器模型的标签。
10.优选地，所述机器学习方法包括支持向量机、随机森林，神经网络。
11.优选地，为所述语音数据集sd中的每个语音特征向量，选择一个合适的候选分类器模型，将此语音特征向量贴上该合适的候选分类器模型为标签，进而构造一个新的分类器模型数据集cd包括：将语音数据集sd按k折交叉划分，依次选择1折，剩余(k-1)折为训练集，整个数据集sd为测试集；从分类器集合模型中选择一个分类器模型，在训练集上训练，并对测试集分类；经过k次测试，获得此分类器模型对语音特征向量样本的平均分类准确率；根据贝叶斯定理，计算每个语音特征向量选择此分类器模型的选择概率；对每个语音特征向量，选择具有最大选择概率的分类器模型作为其标签以构造一个新的分类器模型数据集cd。
12.优选地，将语音特征向量输入到训练好的机器学习模型中并预测测试者患帕金森病的概率步骤包括：用训练获得机器学习模型对输入的语音信号的语音特征向量分类，获得该语音特征向量属于帕金森病和不是帕金森病的风险概率。
13.优选地，将语音特征向量输入到训练好的机器学习模型中并预测测试者患帕金森病的概率步骤之后包括：当风险概率大于设定的阈值时，提醒测试者就医诊断。
14.第二方面，本发明还提供一种基于语音信号的帕金森预测设备，所述设备包括语音信号采集设备、显示触摸屏、处理器以及包第一方面的基于语音信号的帕金森预测方法的软件代码；所述显示触摸屏用于反馈测试者患帕金森病的概率。
15.优选地，所述设备为智能手机或平板电脑。
16.与现有技术相比，本发明采用至少三种不同的风险预测分类器作为候选分类器，不仅准确性高，而且速度快，该方法能方便普通众随时分析自己，发现有帕金森病倾向有较高风险时，可以及早就医诊断和。
附图说明
17.图1为本发明实施例基于语音信号的帕金森预测方法的流程图。
具体实施方式
18.为详细说明本发明的技术内容、构造特征、所实现的效果，以下结合实施方式并配合附图详予说明。
19.本发明实施例提供一种基于语音信号的帕金森预测方法，其包括如下步骤：
20.s1、采集测试者的语音信号并提取语音信号的语音特征向量；
21.s2、构建包含至少三种不同候选分类器的分类器集合模型，对所述分类器集合模型进行训练并获得机器学习模型，所述机器学习模型根据输入的语音特征向量在候选分类器中选择合适的分类器；
22.s3、将语音特征向量输入到训练好的机器学习模型中并预测测试者患帕金森病的概率。
23.本发明实施例采用至少三种不同的风险预测分类器作为候选分类器，不仅准确性高，而且速度快。该方法能方便普通众随时分析自己，发现有帕金森病倾向有较高风险时，可以及早就医诊断和。
24.本发明实施例中，如图1所示，步骤s1采集测试者的语音信号并提取语音信号的语音特征步向量骤包括：
25.s11、采集测试者语音信号的方法包括医生与患者的对话、患者阅读指定的一段话和发音；当选择发音时，选择发元音，这是因为不同的声音形成的机理不同。语音数据采集可以通过各种设备进行，为了满足便携式设备的需要，采集时用到的设备为通常的平板电脑和智能手机；采集测试者的信息包括：语音信号、测试者编号、是否确诊为帕金森、是否有其他导致语音障碍的疾病、患病时间、updrs(运动)、updrs(整体)、采集日期及时间在安静的环境下，对测试者的声音进行采集，获得语音信号；具体的，本实施例中，选用语音学研究常用的寓言故事《北风与太阳》，让测试者使用粤语或普通话以自然的语速和适当的响度来朗读测试语料，正式施测之前，测试者可默读以便熟悉短文。采集过程在安静的环境下完成，环境噪声控制在45db以下。通过智能手机，采集患者阅读语料的声音，并与患者的健康档案关联，记录测试者的身份证、姓名、以前是否确诊为帕金森、是否有其他导致语音障碍的疾病、患病时间、updrs(运动)、updrs(整体)、采集日期及时间。
26.s12、对采集的语音信号进行预处理；具体的，预处理语音信号包括格式转换，采样频率转换，预加重，加窗和分帧，去除无声部分，同时还将浊音数据(声带振动)和清音数据(声带无振动)分离，以及数据标准化和去除异常值，以改善患者的声音质量。例如可以采用xaduiopro工具进行预处理。
27.s13、对预处理后的语音信号进行语音特征向量的提取。具体的，提取特征采用两种方法，第一种方法采用人工提取，包括常用的振幅参数、脉冲参数、频率参数、发声参数、音调参数、和谐度参数，第二种方法时采用深度学习方法，首先将语音信号转换为图像数据，每个语音信号被转换到时间-频率域，以保留数据的时间和频率信息，然后按图像处理方式提取特征。本发明实施例采用opensmile语音特征提取工具，该工具在语音识别，情感计算、音乐信息检索等领域有着较为广泛的应用。本实施案例采用opensmile提取以下特
征：frame energy(帧能量)、frame intensity/loudness(approximation)(帧强度)、critical band spectra(mel/bark/octave,triangular masking filters)(临界频带谱)、mel-/bark-frequency-cepstral coefficients(mfcc)(倒谱系数)、auditory spectra(听觉谱)、loudness approximated from auditory spectra(听觉谱近似强度)、linear predictive coefficients(lpc)(线性预测系数)、line spectral pairs(lsp)(线光谱对)、fundamental frequency(via acf/cepstrum method and via subharmonic-summation(shs))(基础频率)、probability of voicing from acf and shs spectrum peak(acf和shs谱峰的概率)、voice-quality:jitter and shimmer(声音质量：紧张和支支吾吾)、formant frequencies and bandwidths(共振频率和带宽)、zero-and mean-crossing rate(过零率和平均穿越率)、psychoacoustic sharpness,spectral harmonicity(心理声学锐度和声谱调和性)。
28.本发明实施例中，所述至少三种不同候选分类器为决策树、随机森立和神经网络，采用不同候选分类器，可以相互补充，保持多样性。在一些其它实施例中也可以选择包括其它的分类器。
29.本发明实施例中，步骤s2构建包含至少三种不同候选分类器的分类器集合模型，对所述分类器集合模型进行训练并获得机器学习模型，所述机器学习模型根据输入的语音特征向量在候选分类器中选择合适的分类器步骤包括：
30.s21、将每个语音特征向量设置一个类别标签，当语音信号的测试者转为患帕金森患者时，其类别标签的值为1，否则类别标签的值为-1，以此构造一个用于训练的语音数据集sd。
31.s22、用所述语音数据集sd训练每个候选分类器，获得候选分类器模型以构造分类器集合模型。
32.s23、为所述语音数据集sd中的每个语音特征向量，选择一个合适的候选分类器模型，将此语音特征向量贴上该合适的候选分类器模型为标签，进而构造一个新的分类器模型数据集cd。
33.s24、采用分类器模型数据集cd训练一个机器学习方法，获得机器学习模型，具体的，所述机器学习方法包括支持向量机、随机森林和神经网络，本发明实施例选择的机器学习方法为支持向量机。
34.s25、用训练获得机器学习模型对输入的语音信号的语音特征向量进行分类，获得该语音特征向量的候选分类器模型的标签，即最合适用来分类这个语音特征向量的分类器模型。
35.本发明实施例中，步骤s23为所述语音数据集sd中的每个语音特征向量，选择一个合适的候选分类器模型，将此语音特征向量贴上该合适的候选分类器模型为标签，进而构造一个新的分类器模型数据集cd包括：
36.s231、将语音数据集sd按k折交叉划分，依次选择1折，剩余(k-1)折为训练集，整个数据集sd为测试集，具体的，所述k为参数，例如，取值为10。
37.s232、从分类器集合模型中选择一个分类器模型，在训练集上训练，并对测试集分类。
38.s233、经过k次测试，获得此分类器模型对语音特征向量样本的平均分类准确率。
39.s234、根据贝叶斯定理，计算每个语音特征向量选择此分类器模型的选择概率。
40.s235、对每个语音特征向量，选择具有最大选择概率的分类器模型作为其标签以构造一个新的分类器模型数据集cd。
41.本发明实施例中，步骤s3将语音特征向量输入到训练好的机器学习模型中并预测测试者患帕金森病的概率步骤包括：
42.s31、用训练获得机器学习模型对输入的语音信号的语音特征向量分类，获得该语音特征向量属于帕金森病和不是帕金森病的风险概率。语音信号的语音特征向量输入机器学习模型之后，机器学习模型会选择合适的分类器模型，并用该选择的分类器模型预测测试者患帕金森病的概率。
43.本发明实施例在步骤s3之后还包括：s4、当风险概率大于设定的阈值时，提醒测试者就医诊断。所述患帕金森病的风险概率的阈值阈值可以设为50％，当测试的结果为患帕金森病的风险概率大于等于50％时，提醒测试者去医院进行诊断和。
44.本发明实施例还提供一种基于语音信号的帕金森预测设备，所述设备包括语音信号采集设备、显示触摸屏、处理器、扬声器以及包含上述基于语音信号的帕金森预测方法的软件代码，所述显示触摸屏用于反馈测试者患帕金森病的概率。
45.本发明实施例中，所述设备为智能手机或平板电脑等便携式设备，当风险概率大于给定的阈值时，通过显示触摸屏显示结果，提醒测试者去医院进行诊断和。
46.本发明实施例基于语音信号的帕金森预测方法及便携式设备不仅预测的准确性高，而且速度快。便携式设备方便众随时随地分析，及时发现患病风险，以便及早就医诊断和。
47.以上所揭露的仅为本发明的较佳实例而已，当然不能以此来限定本发明之权利范围，因此依本发明申请专利范围所作的等同变化，仍属于本发明所涵盖的范围。

技术特征：

1.一种基于语音信号的帕金森预测方法，其特征在于，包括如下步骤：采集测试者的语音信号并提取语音信号的语音特征向量；构建包含至少三种不同候选分类器的分类器集合模型，对所述分类器集合模型进行训练并获得机器学习模型，所述机器学习模型根据输入的语音特征向量在候选分类器中选择合适的分类器；将语音特征向量输入到训练好的机器学习模型中并预测测试者患帕金森病的概率。2.如权利要求1所述的基于语音信号的帕金森预测方法，其特征在于，采集测试者的语音信号并提取语音信号的语音特征步向量骤包括：在安静的环境下，对测试者的声音进行采集，获得语音信号；对采集的语音信号进行预处理；对预处理后的语音信号进行语音特征向量的提取。3.如权利要求1所述的基于语音信号的帕金森预测方法，其特征在于，所述至少三种不同候选分类器包括决策树、随机森立和神经网络。4.如权利要求1所述的基于语音信号的帕金森预测方法，其特征在于，构建包含至少三种不同候选分类器的分类器集合模型，对所述分类器集合模型进行训练并获得机器学习模型，所述机器学习模型根据输入的语音特征向量在候选分类器中选择合适的分类器步骤包括：将每个语音特征向量设置一个类别标签，当语音信号的测试者转为患帕金森患者时，其类别标签的值为1，否则类别标签的值为-1，以此构造一个用于训练的语音数据集sd；用所述语音数据集sd训练每个候选分类器，获得候选分类器模型以构造分类器集合模型；为所述语音数据集sd中的每个语音特征向量，选择一个合适的候选分类器模型，将此语音特征向量贴上该合适的候选分类器模型为标签，进而构造一个新的分类器模型数据集cd；采用分类器模型数据集cd训练一个机器学习方法，获得机器学习模型；用训练获得机器学习模型对输入的语音信号的语音特征向量进行分类，获得该语音特征向量的候选分类器模型的标签。5.如权利要求4所述的基于语音信号的帕金森预测方法，其特征在于，所述机器学习方法包括支持向量机、随机森林和神经网络。6.如权利要求4所述的基于语音信号的帕金森预测方法，其特征在于，为所述语音数据集sd中的每个语音特征向量，选择一个合适的候选分类器模型，将此语音特征向量贴上该合适的候选分类器模型为标签，进而构造一个新的分类器模型数据集cd包括：将语音数据集sd按k折交叉划分，依次选择1折，剩余(k-1)折为训练集，整个数据集sd为测试集；从分类器集合模型中选择一个分类器模型，在训练集上训练，并对测试集分类；经过k次测试，获得此分类器模型对语音特征向量样本的平均分类准确率；根据贝叶斯定理，计算每个语音特征向量选择此分类器模型的选择概率；对每个语音特征向量，选择具有最大选择概率的分类器模型作为其标签以构造一个新的分类器模型数据集cd。
7.如权利要求1所述的基于语音信号的帕金森预测方法，其特征在于，将语音特征向量输入到训练好的机器学习模型中并预测测试者患帕金森病的概率步骤包括：用训练获得机器学习模型对输入的语音信号的语音特征向量分类，获得该语音特征向量属于帕金森病和不是帕金森病的风险概率。8.如权利要求1所述的基于语音信号的帕金森预测方法，其特征在于，将语音特征向量输入到训练好的机器学习模型中并预测测试者患帕金森病的概率步骤之后包括：当风险概率大于设定的阈值时，提醒测试者就医诊断。9.一种基于语音信号的帕金森预测设备，其特征在于，所述设备包括语音信号采集设备、显示触摸屏、处理器以及包含权利要求1-8中任一项所述基于语音信号的帕金森预测方法的软件代码；所述显示触摸屏用于反馈测试者患帕金森病的概率。10.如权利要求9所述的基于语音信号的帕金森预测设备，其特征在于，所述设备为智能手机或平板电脑。

技术总结

本发明公开一种基于语音信号的帕金森预测方法，包括如下步骤：采集测试者的语音信号并提取语音信号的语音特征向量；构建包含至少三种不同候选分类器的分类器集合模型，对所述分类器集合模型进行训练并获得机器学习模型，所述机器学习模型根据输入的语音特征向量在候选分类器中选择合适的分类器；将语音特征向量输入到训练好的机器学习模型中并预测测试者患帕金森病的概率。本发明采用至少三种不同的风险预测分类器作为候选分类器，不仅准确性高，而且速度快，该方法能方便普通众随时分析自己，发现有帕金森病倾向有较高风险时，可以及早就医诊断和。以及早就医诊断和。以及早就医诊断和。