一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统、构建方法及应用


1.本发明属于数字医疗领域,具体涉及一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统、构建方法及其应用。


背景技术:



2.慢性阻塞性肺疾病(chronic obstructive pulmonary disease,copd),是一种严重危害人体健康的常见病,多发病,严重影响病人生活质量,病死率高。据估计,每年因copd死亡的人数超过300万,而且这个数字还随着危险因素的增加而增加,copd已经成为全球三大死亡原因之一。
3.进行性不可逆的气流受限是copd的重要特征,患者往往表现出胸闷气喘,慢性咳嗽和反复的肺部感染等症状,严重影响患者的生活质量和生命健康。及时的可以控制患者的疾病进程,改善患者的生活质量。肺功能检查是临床诊断慢阻肺的金标准。临床上,对于出现持续性,进行性和劳力性呼吸困难、听诊有喘鸣音,反复发作的急性支气管炎和慢性支气管炎急性发作以及有吸烟、环境污染、高pm2.5等危险因素暴露的患者,采取肺功能检查来确诊是否患有copd。最大吸气后呼气的第1s内用力呼出的气量与用力肺活量的比值fev1/fvc反应气流受限的程度,是慢阻肺的一项敏感指标。患者吸入支气管扩张剂后fev1/fvc《70%一般被认为有不可逆的气流受限。然而,由于在不同场合下的可逆性实验可能不同且不具备可重复性,应用fev1/fvc《70%这一指标,会导致某些健康的老年人被诊断成copd,也会导致对小于45岁的成年人造成慢阻肺的诊断不足。在临床上,哮喘由于与copd的表现类似,部分哮喘患者由于病程的延长也会导致气流受限的不可逆,哮喘和copd的鉴别诊断是临床上的难点。nice2010指南中指出,除肺功能测试外,所有患者还应该进行胸透和全血计数,以便准确地诊断copd且将copd与其他疾病区分开。因此,在临床上,单一靠肺功能检查的结果不能作为慢阻肺鉴别和诊断的依据,还需要结合患者其他检查结果以及病史和长期随访综合评估。医生的经验水平尤为重要,医生的经验不足容易造成误诊和漏诊。
4.听诊由于无创便携的特点,是呼吸内科常用的检查手段之一。医生根据肺部附加音如爆裂音,喘鸣音等异常肺音的情况,对患者肺部的病理状况做初步的判断,辅助疾病的诊断。copd患者由于肺部阻塞性的病变,会在整个胸腔产生喘鸣(wheeze),同时还会有呼吸音减弱的现象。然而,听诊结果具有一定的主观随意性,且呼吸音的减低和喘鸣也可能由其他疾病引起,因此,听诊只能作为疾病诊断的辅助,不能作为慢阻肺诊断的依据。随着技术的进步,计算机记录的肺音被用与分析以揭露肺音与肺部疾病之间的关系。已有研究证明,数字化肺音可以作为标志用于copd的诊断。
5.近年来,深度学习在医学中得到广泛应用,深度神经网络模型能提取医学图像或信号中与特定疾病相关的特征用于疾病诊断。目前已有多项研究利用肺音进行呼吸疾病的诊断。然而现有研究大多集中于异常肺音识别,即将肺音分为爆裂音(crackle和wheeze等),以及通过肺音,对肺部疾病的急性和慢性进行分类。数字化肺音用于特定肺部疾病诊
断(如copd等疾病)的研究较少。已有copd的诊断研究存在缺乏数据多样性和丰富性的问题,数据集样本来源单一,采集自一家医院且样本量少。在这样的单中心数据集上训练的模型虽然有很高的准确率,模型泛化能力弱,在遇到其他数据集样本时准确率大幅度降低,不能应用于临床。此外,这些研究提出的copd/健康分类模型或copd/非copd分类模型,在实际的临床应用中并不方便。


技术实现要素:



6.本发明要提供用于慢性阻塞性肺疾病鉴别的方法和系统。提供了一种从被怀疑患有慢性阻塞性肺疾病的候选者获取的数字化肺音记录中鉴别copd及copd分级的方法,所述方法包括从指定听诊位置采集数字化肺音记录;采用数字信号处理的方法对肺音信号预处理并生成梅尔声谱;公开数据集用于训练copd鉴别模型和copd分级模型;鉴别模型将输入的肺音声谱分为copd,健康和非copd的其他肺部疾病三类;分级模型将copd患者分为诊治指南规定的0-4级。
7.本发明提供一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统,包括以下模块:数据采集模块、预处理模块、转换模块、数据模块、数据处理模块、数据增强训练模块、深度学习模块、鉴别模块、分级模块和显示模块。
8.进一步的,所述数据采集模块,包含肺音采集装置,由电子听诊器和记录设备构成。电子听诊器放置在候选者如图1所示的六个听诊位置及气管处,采集呼吸时肺部气流摩擦产生的肺音。录音设备将肺音数字化并用于分析,用于采集候选者呼吸时肺部气流摩擦产生的肺音,数字化并存储用于后续预处理等模块,肺音的预处理和分类的整个过程由软硬件设备系统(包括计算机及其他移动设备)自动完成,分类结果由搭载鉴别系统的设备显示。
9.进一步的,所述预处理模块用于去除采集肺音记录中混杂的环境噪声、心音和工频干扰,同时进行归一化处理,得到有效肺音数据。
10.进一步的,所述转换模块用于预处理后的音频经过傅里叶变换和梅尔滤波器组,肺音转换成梅尔声谱图。
11.进一步的,所述数据模块包括三个数据集,分别为icbhi database 、 king abdullah university hospital database和respiratorydatabase@tr;其中,icbhi database 和 king abdullah university hospital database两个公开数据集合并,用于提供copd鉴别的肺音数据集,所述的数据集划分为训练集和测试集;respiratorydatabase@tr公开数据集,用于提供copd分级的肺音数据集,所述的数据集划分为训练集和测试集。
12.进一步的,所述数据处理模块将数据集的全部数据经过预处理模块和转换模块获取声谱。
13.进一步的,所述数据增强训练模块用于将公开数据集中转换声谱的训练集进行数据扩增网络的训练,包括vq-vae深度学习数据扩增模型,训练集中,用于vq-vae的训练,得到了增强后平衡的训练数据集,平衡后的训练集进入后续深度学习模块。
14.进一步的,所述深度学习模块,包括基于resnet50的诊断和分级模型,用imagenet上预训练的权重对基于resnet50的模型初始化,然后用经过数据增强模块的诊断数据集/
分级数据集的训练集进行再训练。模型训练采用焦点损失函数和warmup学习率优化以提高模型性能,测试集用于对基于resnet50的模型评估、测试和验证。
15.进一步的,所述鉴别模块是基于resnet50的鉴别模型经过50个epoch的训练后,训练准确率不再提升,损失不再下降;在测试集上的准确率,敏感度,特异度达到最高的模型作为最终的鉴别模块,所述的鉴别模块设有输入端和输出端,所述的输入端为采集自候选者的肺音经预处理模块和转换模块的梅尔声谱图;输出端输出候选者的鉴别结果,既候选者患有copd或copd外的其他肺部疾病,或健康。
16.进一步的,所述分级模块是基于resnet50的分级模型经过50个epoch的训练后,训练准确率不再提升,损失不再下降;在测试集上的准确率,敏感度,特异度达到最高的模型作为最终的分级模块,所述的分级模块将输入的copd肺音分为copd0级、copd1级、copd2级、copd3级、或copd4级;所述的分级模块设有输入端和输出端,所述的输入端为采集自候选者的数字化肺音经预处理模块和转换模块的梅尔声谱图;输出端给出候选者copd的病情等级。
17.进一步的,所述显示模块为输出端判定结果在搭载鉴别系统的设备中显示,所述的搭载鉴别系统的设备包括计算机、手机端或者硬件。
18.进一步的,去除采集肺音记录中混杂的环境噪声、心音和工频干扰方法为五阶巴特沃兹滤波器和经验模态分解进行去噪。
19.进一步的,所述的数据扩增网络的训练方法为:区别于传统的过采样方法(随机上采样,随机裁剪,添加噪声,smote和adasyn等方法),提出的方法基于矢量量化自编码器(vq_vae)。样本分布不均的公开数据集的训练集中,将样本数较少类声谱输入vq-vae网络进行训练,网络通过编解码和pixelsnail算法“学习”该类声谱的概率分布特征和自回归先验特征,再作为生成器,从特征空间进行采样解码以生成新的属于该类的样本,得到了增强后平衡的训练数据集,提出的这种方法基于深度学习,克服了传统方法的分布边缘化问题,可以提高后续鉴别模型的性能。本发明提供一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统的构建方法,包括以下步骤:1)采集icbhi database 和 king abdullah university hospital database两个公开数据集合供用于鉴别模型训练的肺音,将数据集合去噪处理后按照8:2的比例分为训练集和测试集;采集respiratorydatabase@tr公开数据集提供用于分级模型训练的肺音,将数据集合去噪处理后按照8:2的比例分为训练集和测试集;2)训练集中进行增强网络的训练,样本分布不均衡的训练集中,样本数量较少类别的声谱输入vq-vae网络进行训练,网络通过编解码和pixelsnail算法“学习“声谱的概率分布特征和自回归先验特征。再作为生成器,从特征空间进行采样解码以生成新的属于少数类的样本。这样,经过vq-vae过程,得到了增强后平衡的训练数据集;3)增强后平衡的训练数据集采用迁移的学习方法进行深度学习,用imagenet上预训练的权重对基于resnet50的模型初始化,然后用增强的训练集进行再训练。模型训练采用焦点损失函数和warmup学习率优化以提高模型性能,经过测试集对模型评估、测试和验证;4)经过深度学习得到性能最优的模型作为最终的的鉴别模块和分级模块,所述的鉴别分级模块将输入的肺音声谱分为copd,健康和非copd的其他肺部疾病三类,非copd类
包括肺炎、哮喘、支气管哮喘、毛细支气管炎、上/下呼吸道感染等疾病。所述的分级模块将输入的copd肺音分为copd0级、copd1级、copd2级、copd3级、或copd4级,所述的鉴别模块和分级模块设有输入端和输出端,所述的输入端为候选者的梅尔声谱图;5)候选者的梅尔声谱图来自于采集候选者呼吸时肺部气流摩擦产生的肺音,经过去噪和归一化处理得到有效肺音数据,经过傅里叶变换和梅尔滤波器组,肺音转换成梅尔声谱图;6)鉴别模块和分级模块给出候选者的鉴别结果和分级结果并显示在搭载鉴别系统的设备界面上。
20.本发明提供一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统在制备慢性阻塞性肺疾病辅助诊断工具中的用途。
21.本发明的有益效果在于:本发明通过充分训练的深度学习模型对肺音声谱进行分析,能对受试者的健康状况(患有copd,患有除copd外的其他肺部疾病,健康,以及copd疾病等级)做出判断,临床应用中可用于初诊分诊。
22.诊断需要的肺音既可以在临床由电子听诊器采集,也可以在非临床条件下使用麦克风记录,数字化肺音在用本专利提出的实施方式进行诊断外,还可以上传到云端以便医生远程听诊,这提供了患者在居家情况下实现copd的初诊的可能,减少疾病传播的风险。
23.仅通过听诊过程就可以对候选者做出患有copd的诊断,是目前临床做不到的。诊断只需听诊肺音,不需要肺功能测试以及放射学检查,简化了诊断过程,避免放射性检查对受试者的辐射以及肺功能测试中患者配合度差引起的漏诊和误诊。此外相比于肺功能测试所需的吹气过程可能产生的飞沫,听诊在一定程度上减少了疾病的传播。
24.鉴别模型是多中心的公开肺音数据集上训练得到的,训练模型时还采用了深度生成式网络对公开数据集进行数据增强以提高鉴别模型的性能。鉴别结果由充分训练的深度学习模型完成,避免了临床医生在听诊即其他检查结果解读中的主观性而造成的漏诊误诊。
附图说明
25.图1为系统流程图。
26.图2为肺音数据的采集图。
27.图3为公开数据集划分的测试集的roc曲线图。
28.图4为公开数据集划分的测试集的混淆矩阵图。
29.图5为数字化肺音及梅尔声谱。
具体实施方式
30.图1为整个系统流程图,将麦克风放置于如图2所示的位置处,采集过程中候选者采取坐姿。记录候选者平静呼吸时20s的肺音用于后续分析。采集好的肺音记录进入肺音的预处理系统,采用巴特沃兹高通滤波以及经验模态分解的方法,对采集过程中记录中混杂的环境噪声,心音和工频噪声进行滤波降噪,随后信号进行归一化。预处理后的音频经过傅里叶变换和梅尔滤波器组,肺音转换成梅尔声谱图。
31.采集icbhi database 和 king abdullah university hospital database两个
公开数据集合供用于鉴别模型训练的肺音,将数据集合去噪处理后按照8:2的比例分为训练集和测试集;采集respiratorydatabase@tr公开数据集提供用于分级模型训练的肺音,将数据集合去噪处理后按照8:2的比例分为训练集和测试集。
32.如图3和图4所示,应用的鉴别模型在训练前划分的测试集上表现优秀,敏感度,特异度和f1分数分别为0.94,0.98 和0.94,高特异度和敏感度表示模型具有很低的漏诊率和误诊率。
33.训练集中进行增强网络的训练,样本分布不均衡的训练集中,样本数量较少类别的声谱输入vq-vae网络进行训练,网络通过编解码和pixelsnail算法“学习“声谱的概率分布特征和自回归先验特征。再作为生成器,从特征空间进行采样解码以生成新的属于少数类的样本。这样,经过vq-vae过程,得到了增强后平衡的训练数据集;增强后平衡的训练数据集采用迁移的学习方法进行深度学习,用imagenet上预训练的权重对基于resnet50的模型初始化,然后用增强的训练集进行再训练。模型训练采用焦点损失函数和warmup学习率优化以提高模型性能,经过测试集对模型评估、测试和验证;经过深度学习得到性能最优的模型作为最终的鉴别模块和分级模块,所述的鉴别模块将输入的肺音声谱分为copd,健康和非copd的其他肺部疾病三类,非copd类包括肺炎、哮喘、支气管哮喘、毛细支气管炎、上/下呼吸道感染等疾病。
34.所述的分级模块将输入的copd肺音分为copd0级、copd1级、copd2级、copd3级、或copd4级,所述的鉴别和分级模块设有输入端和输出端,所述的输入端为如图5所示的候选者的梅尔声谱图,诊断模块和分级模块给出候选者的诊断结果并显示在搭载鉴别系统的设备界面上。

技术特征:


1.一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统,其特征在于,包括以下模块:数据采集模块、预处理模块、转换模块、数据模块、数据处理模块、数据增强训练模块、深度学习模块、鉴别模块、分级模块和显示模块。2.根据权利要求1所述的一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统,其特征在于,所述数据采集模块,用于采集候选者呼吸时肺部气流摩擦产生的肺音,数字化并存储用于后续预处理模块;所述预处理模块用于去除采集肺音记录中混杂的环境噪声、心音和工频干扰,同时进行归一化处理,得到有效肺音数据;所述转换模块用于预处理后的音频经过傅里叶变换和梅尔滤波器组,肺音转换成梅尔声谱图。3.根据权利要求1所述的一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统,其特征在于,所述数据模块包括三个数据集,分别为icbhi database 、 king abdullah university hospital database和respiratorydatabase@tr;其中,icbhi database 和 king abdullah university hospital database两个公开数据集合并,用于提供copd鉴别的肺音数据集,所述的数据集划分为训练集和测试集;respiratorydatabase@tr公开数据集,用于提供copd分级的肺音数据集,所述的数据集划分为训练集和测试集;所述数据处理模块将数据集的全部数据经过预处理模块和转换模块获取声谱。4.根据权利要求1所述的一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统,其特征在于,所述数据增强训练模块用于将公开数据集中转换声谱的训练集进行数据扩增网络的训练,包括vq-vae深度学习数据扩增模型,训练集中,用于vq-vae的训练,得到了增强后平衡的训练数据集,平衡后的训练集进入后续深度学习模块,所述深度学习模块,包括基于resnet50的鉴别和分级模型,用imagenet上预训练的权重对基于resnet50的模型初始化,然后用经过数据增强模块得到的平衡后的鉴别数据集/分级数据集的训练集在此模块再训练;模型训练采用焦点损失函数和warmup学习率优化以提高模型性能,测试集用于对基于resnet50的模型评估、测试和验证。5.根据权利要求1所述的一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统,其特征在于,所述鉴别模块是基于resnet50的鉴别模型经过50个epoch的训练后,训练准确率不再提升,损失不再下降;在测试集上的准确率,敏感度,特异度达到最高的模型作为最终的鉴别模块,鉴别模块将输入的肺音分为患有copd,患有copd外的其他肺部疾病,或健康;所述的鉴别模块设有输入端和输出端,所述的输入端为采集自候选者的肺音经预处理模块和转换模块的梅尔声谱图;输出端输出候选者的鉴别结果,即候选者患有copd或copd外的其他肺部疾病,或健康;所述分级模块是基于resnet50的分级模型经过50个epoch的训练后,训练准确率不再提升,损失不再下降;在测试集上的准确率,敏感度,特异度达到最高的模型作为最终的分级模块,所述的分级模块将输入的copd肺音分为copd0级、copd1级、copd2级、copd3级、或copd4级;所述的分级模块设有输入端和输出端,所述的输入端为采集自候选者的数字化肺音经预处理模块和转换模块的梅尔声谱图;输出端给出候选者copd的病情等级。6.根据权利要求1所述的一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统,其特征在于,所述显示模块为输出端判定结果在搭载鉴别系统的设备中显示。7.根据权利要求2所述的一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统,其特征在于,去除采集肺音记录中混杂的环境噪声、心音和工频干扰方法为五阶巴特沃兹滤波
器和经验模态分解进行去噪。8.根据权利要求4所述的一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统,其特征在于,所述的数据扩增网络的训练方法为:样本分布不均的公开数据集的训练集中,将样本数较少类声谱输入vq-vae网络进行训练,网络通过编解码和pixelsnail算法“学习”该类声谱的概率分布特征和自回归先验特征,再作为生成器,从特征空间进行采样解码以生成新的属于该类的样本,得到了增强后平衡的训练数据集。9.一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统的构建方法,其特征在于,包括以下步骤:1)采集icbhi database 和 king abdullah university hospital database两个公开数据集合供用于鉴别模型训练的肺音,将数据集合去噪处理后按照8:2的比例分为训练集和测试集;采集respiratorydatabase@tr公开数据集提供用于分级模型训练的肺音,将数据集合去噪处理后按照8:2的比例分为训练集和测试集;2)训练集中进行增强网络的训练,样本分布不均衡的训练集中,样本数量较少类别的声谱输入vq-vae网络进行训练,网络通过编解码和pixelsnail算法“学习“声谱的概率分布特征和自回归先验特征;再作为生成器,从特征空间进行采样解码以生成新的属于少数类的样本;这样,经过vq-vae过程,得到了增强后平衡的训练数据集;3)增强后平衡的训练数据集采用迁移的学习方法进行深度学习,用imagenet上预训练的权重对基于resnet50的模型初始化,然后用增强的训练集进行再训练;模型训练采用焦点损失函数和warmup学习率优化以提高模型性能,经过测试集对模型评估、测试和验证;4)经过深度学习得到性能最优的模型作为最终的鉴别模块和分级模块,所述的鉴别模块将输入的肺音分为患有copd,患有copd外的其他肺部疾病,或健康;所述的分级模块将输入的copd肺音分为copd0级、copd1级、copd2级、copd3级、或copd4,所述的鉴别和分级模块设有输入端和输出端,所述的输入端为候选者的梅尔声谱图;5)候选者的梅尔声谱图来自于采集候选者呼吸时肺部气流摩擦产生的肺音,经过去噪和归一化处理得到有效肺音数据,经过傅里叶变换和梅尔滤波器组,肺音转换成梅尔声谱图;6)鉴别模块和分级模块给出候选者的鉴别结果或分级结果并显示在搭载鉴别系统的设备界面上。10.一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统在制备慢性阻塞性肺疾病辅助诊断工具中的用途。

技术总结


本发明属于数字医疗领域,具体涉及一种基于数字化肺音构建慢性阻塞性肺疾病鉴别系统、构建方法及其应用。本系统包括数据采集模块、预处理模块、转换模块、数据模块、数据处理模块、数据增强训练模块、深度学习模块、鉴别模块、分级模块和显示模块。采集候选者的数字化肺音记录,转成梅尔声谱图,利用深度神经网络进行诊断。候选者为COPD患者,健康,或者患有其他肺部疾病,以及COPD患者的疾病等级将由搭载鉴别系统的设备给出。检查只需要临床或其他场所中采集的肺部听诊肺音,减少常规诊断过程中的放射损伤与可能的接触感染风险。在新冠肺炎流行的当下,在减少感染风险同时,为COPD的早期诊断提供了方案,提高呼吸内科,特别是COPD疾病的诊断效率。疾病的诊断效率。疾病的诊断效率。


技术研发人员:

于璐 付俊义

受保护的技术使用者:

中国医科大学

技术研发日:

2022.09.19

技术公布日:

2022/12/1

本文发布于:2024-09-20 11:57:00,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/26531.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:模块   声谱   数据   所述
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议