一种PTMC颈部淋巴结转移辅助诊断方法与流程


一种ptmc颈部淋巴结转移辅助诊断方法
技术领域:
1.本发明涉及疾病诊断技术领域,特别涉及一种甲状腺微小乳头状癌(papillary thyroid microcarcinoma,ptmc)颈部淋巴结转移辅助诊断方法。


背景技术:



2.甲状腺癌发病率在全球范围内快速增长,是年增长率最快的实体恶性肿瘤,这其中大多数新发病例都是甲状腺微小乳头状癌(papillary thyroid microcarcinoma,ptmc),即肿瘤直径≤1cm的甲状腺乳头状癌。根据国家的不同,ptmc在新发甲状腺癌中的比例在40%-50%间浮动。
3.ptmc患者颈部淋巴结的转移与否,是ptmc患者时的一个关键性指标,医生对患者的众多病理检查数据进行比对,得出一个ptmc患者颈部淋巴结是否转移的结论,而现实中,经常出现患者病理检测数据的缺失,甚或某些病理检查数据的错误等现象,这些会造成医生的漏诊、误诊,耽误病人的。目前国内外尚无方法对ptmc患者颈部淋巴结的转移与否进行有效诊断。
4.公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。


技术实现要素:



5.本发明的目的在于提供一种ptmc颈部淋巴结转移辅助诊断方法,以弥补现有技术的空白,为医生诊断ptmc颈部淋巴结转移提供一个可靠的参考依据。
6.基于该发明目的,发明人站在人工智能技术的角度,通过近些年人工智能的飞速发展,了解到人工智能在语音、图像、视频等领域的应用取得了突破性的进展,想到利用机器的深度学习技术来构建用于诊断ptmc颈部淋巴结转移的分类模型,以达到给出医生诊断时的合理建议,。
7.据此,本发明提供了一种ptmc颈部淋巴结转移辅助诊断方法,包括以下步骤:
8.s101:建立用于诊断ptmc颈部淋巴结转移的分类模型;
9.s102:获取目标患者的相关病理数据;
10.s103:将所述相关病理数据输入至所述分类模型,并获取所述分类模型的输出结果;
11.s104:根据所述输出结果确定所述目标患者的ptmc颈部淋巴结转移状态信息。
12.通过构建用于诊断ptmc颈部淋巴结转移状态的分类模型,就可以基于目标患者的相关病理数据智能化的计算出患者的ptmc颈部淋巴结转移状态,给出可靠的诊断建议,防止误诊、漏诊。
13.在一些实施方式中,上述步骤s101的分类模型是基于机器学习算法实现。
14.在一些实施方式中,上述步骤s101建立用于诊断ptmc颈部淋巴结转移的分类模型包括以下步骤:
15.s201:获取样本患者的相关病理数据;
16.s202:为所述相关病理数据设置对应的分类标识,生成训练集;
17.s203:将所述训练集输入至机器学习算法中进行训练,生成用于诊断ptmc颈部淋巴结转移的分类模型。
18.在一些实施方式中,上述步骤s202生成训练集包括以下步骤:
19.s301:获取样本并统计样本患者相关病理数据缺失量;
20.s302:对病理数据缺失量进行判断,缺失量大于阈值时,执行步骤s303;
21.否则执行步骤s304;
22.s303:删除样本,后执行步骤s301;
23.s304:给缺失的病理数据补上该病理数据的平均值;
24.s305:对离散的病理数据进行连续化处理;
25.s306:为相关病理数据设置对应的分类标识,加入训练集;
26.s307:统计训练集中样本数量;
27.s308:对样本数量进行判断,样本数量大于等于预设值时,训练集生成
28.结束,否则执行步骤s309;
29.s309:随机自动产生样本,后执行步骤s301。
30.在一些实施方式中,上述相关病理数据至少包括性别、年龄、病理、肿块横径、肿块纵径、位置、纵横比、边界、形态、回声、钙化灶、血流、贴近包膜、肿块内横波声速、超声诊断淋巴结、弹性评分、弹性成像贴近和突破包膜。
31.在一些实施方式中,上述机器学习算法采用light gbm算法。
32.本发明的另一方面,提供了一种计算机存储媒介,其上存储有计算机程序,该程序被处理器执行时,实现上述ptmc颈部淋巴结转移辅助诊断方法的步骤。
附图说明:
33.图1为本发明一实施方式的ptmc颈部淋巴结转移辅助诊断方法的方法流程图;
34.图2为本发明一实施方式的建立用于诊断ptmc颈部淋巴结转移状态的分类模型方法流程图;
35.图3为本发明一实施方式的生成训练集的方法流程图;
36.图4为本发明一实施方式的light gbm建立决策树策略示意图。
具体实施方式:
37.下面对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
38.除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。
39.为实现本发明的目的,本发明的发明人构思通过深度学习来构建用于诊断ptmc颈部淋巴结转移状态的分类模型,在选取具体采用的模型时,优先采用了light gbm算法,light gbm算法属于监督学习范畴,它具有更快的训练速度和效率、更低的内存使用、更高
的准确率等特点,同时还支持并行化学习,处理大规模数据上也有明显的优势。
40.light gbm是梯度提升决策树的一种高效实现,是将损失函数的负梯度作为当前决策的残差近似值,去拟合新的决策树,即每一次迭代都保留原来的模型不变,再加入一个新的函数到模型中,使预测值不断逼近真实值。
41.训练目标函数如下,其中,yi为标签的真实值,为第k-1次学习的结果,c
k-1
为当前k-1棵树的正则化项和,目标函数的含义为寻一棵合适的树fk使得函数的值最小。
[0042][0043]
如图4所示,light gbm模型在建立决策树时采用按叶生长(leaf-wise)策略代替按层生长(leval-wise)策略,并增加最大深度的限制,在保证效率的同时防止过拟合。采用单边梯度采样保留梯度较大的实例,对梯度较小的实例进行随机抽样,用更小的数据量获得精确的信息增益估计。同时采用互斥特征合并将一定的冲突比率内互斥的特征进行合并,以达到降维的效果,且不会造成信息丢失。因此light gbm在leaf-wise上增加限制最大深度的参数,在保证算法高效的同时,防止过拟合。
[0044]
虽然light gbm本身在其他领域应用广泛,但其在ptmc颈部淋巴结转移辅助诊断中的应用,本领域尚未作出探索和尝试,因而如何选取模型的输入信息和如何将输入信息与状态准确映射,对训练出的分类模型的准确度和可利用价值至关重要,而这也是本发明能够得以实现的关键点和难点。对于分类模型,发明人基于在本行业的长期经验积累和研究,最终将输入信息即患者的相关病理数据确定为包括:病理、肿块横径、肿块纵径、位置、纵横比、边界、形态、回声、钙化灶、血流、贴近包膜、肿块内横波声速、超声诊断淋巴结、弹性评分、弹性成像贴近和突破包膜十七项,而将状态确定为低风险、中风险和高风险三类,并通过标准和专家评审来对相关病理数据和状态标识的映射关系作出标签,从而保证了训练样本集的有效性和可利用度,进而保证了本发明构建出的分类模型的准确度。下面结合附图对发明的方法作进一步详细的说明。
[0045]
图1至3示意性地显示了根据本发明的一种实施方式的ptmc颈部淋巴结转移辅助诊断方法包括以下步骤:
[0046]
s101:建立用于诊断ptmc颈部淋巴结转移的分类模型。为了实现对患者的ptmc颈部淋巴结转移状态进行系统化分类,辅助医生根据患者的ptmc颈部淋巴结转移的不同状态作出诊断,建立用于诊断ptmc颈部淋巴结转移的分类模型,如图2所示,以采用基于light gbm模型的机器算法进行深度学习为例来构建分类模型的方法包括如下步骤:
[0047]
s201:获取样本患者的相关病理数据。其中,根据发明人多年的经验和反复的实验,最终确定选用的相关病理数据包括病理、肿块横径、肿块纵径、位置、纵横比、边界、形态、回声、钙化灶、血流、贴近包膜、肿块内横波声速、超声诊断淋巴结、弹性评分、弹性成像贴近和突破包膜十七项。
[0048]
s202:为所述相关病理数据设置对应的分类标识,生成训练集。在获取了样本患者的相关病理数据后,对相关病理数据进行处理并生成训练集,如图3所示,包括如下步骤:
[0049]
s301:获取样本并统计样本患者相关病理数据缺失量。在样本数据中,包含大量缺失相关病理数据的样本,不同样本中病理数据缺失情况都不相同,因此根据样本中病理数
据缺失比例,对样本采用不同的处理方法,当缺失量大于阈值时,比如上述十七项病理数据,可定义阈值为6,当样本中病理数据缺失量大于6时,该样本为无意义样本,删除该样本,当样本中病理数据缺失量不大于6时,该样本可用,但是需要对缺失的病理数据补值,才能作为有效的样本加入到训练集中。
[0050]
s302:对病理数据缺失量进行判断,缺失量大于阈值时,执行步骤s303;否则执行步骤s304。
[0051]
s303:删除样本,后执行步骤s301。
[0052]
s304:给缺失的病理数据补上该病理数据的平均值。
[0053]
s305:对离散的病理数据进行连续化处理。由于样本数据中大量病理数据已经进行了离散化处理,但是这些病理数据原本是一些连续值,则需将离散化的病理数据进行连续化处理。所谓连续化处理就是在病理数据的取值范围内,设定若干个离散的划分点,将取值范围划分为一些离散化的区间,最后用不同的符号或整数值代表落在每个子区间中的数据值。比如纵横比这一病理数据,样本中已将纵横比大于1的数据标为1,小于等于1的数据标为0,而实际中,纵横比是一个连续的值,则在可取值的范围内对该病理数据进行梯度化,使其是一个连续的值。
[0054]
s306:为相关病理数据设置对应的分类标识,加入训练集。为相关病理数据设置分类标识,该分类标识根据医生临床诊断记录来确定,分低风险、中风险和高风险三类。
[0055]
s307:统计训练集中样本数量。因为训练集中样本越多,在机器学习算法中进行训练时,生成的分类模型越能接近实际,可靠性越高,因此,在样本量不够的情况下,通过大量模拟自动产生病理数据的样本加入到训练集里,通过扩充大量的样本量,达到light gbm算法模型矫正的作用。
[0056]
s308:对样本数量进行判断,样本数量大于等于预设值时,训练集生成结束,否则执行步骤s309,预设值可以设定为10000等一个比较大的数字;
[0057]
s309:随机自动产生样本,后执行步骤s301,对随机自动产生的样本进行处理,处理合格的的样本加入到训练集里面。
[0058]
s203:将所述训练集输入至机器学习算法中进行训练,生成用于诊断ptmc颈部淋巴结转移的分类模型。数据集中提出的ptmc颈部淋巴结转移的17个病理数据都作为特征变量,采用light gbm算法建立用于诊断ptmc颈部淋巴结转移状态的分类模型。
[0059]
s102:获取目标患者的相关病理数据。
[0060]
s103:将所述相关病理数据输入至所述分类模型,并获取所述分类模型的输出结果。
[0061]
s104:根据所述输出结果确定所述目标患者的ptmc颈部淋巴结转移状态信息。医生根据分类模型给出的结果,来判断目标患者ptmc颈部淋巴结转移的状态,并给出诊断结果。
[0062]
本发明的另一方面,提供了一种计算机存储媒介,其上存储有计算机程序,该程序被处理器执行时,实现上述ptmc颈部淋巴结转移辅助诊断方法的步骤。
[0063]
前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应
用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。

技术特征:


1.一种ptmc颈部淋巴结转移辅助诊断方法,其特征在于:包括以下步骤:s101:建立用于诊断ptmc颈部淋巴结转移的分类模型;s102:获取目标患者的相关病理数据;s103:将所述相关病理数据输入至所述分类模型,并获取所述分类模型的输出结果;s104:根据所述输出结果确定所述目标患者的ptmc颈部淋巴结转移状态信息。2.根据权利要求1所述的一种ptmc颈部淋巴结转移辅助诊断方法,其特征在于:所述步骤s101的分类模型是基于机器学习算法实现。3.根据权利要求2所述的一种ptmc颈部淋巴结转移辅助诊断方法,其特征在于:所述步骤s101建立用于诊断ptmc颈部淋巴结转移的分类模型包括以下步骤:s201:获取样本患者的相关病理数据;s202:为所述相关病理数据设置对应的分类标识,生成训练集;s203:将所述训练集输入至机器学习算法中进行训练,生成用于诊断ptmc颈部淋巴结转移的分类模型。4.根据权利要求3所述的一种ptmc颈部淋巴结转移辅助诊断方法,其特征在于:所述步骤s202生成训练集包括以下步骤:s301:获取样本并统计样本患者相关病理数据缺失量;s302:对病理数据缺失量进行判断,缺失量大于阈值时,执行步骤s303;否则执行步骤s304;s303:删除样本,后执行步骤s301;s304:给缺失的病理数据补上该病理数据的平均值;s305:对离散的病理数据进行连续化处理;s306:为相关病理数据设置对应的分类标识,加入训练集;s307:统计训练集中样本数量;s308:对样本数量进行判断,样本数量大于等于预设值时,训练集生成结束,否则执行步骤s309;s309:随机自动产生样本,后执行步骤s301。5.根据权利要求1至4任意一项所述的一种ptmc颈部淋巴结转移辅助诊断方法,其特征在于:所述相关病理数据至少包括性别、年龄、病理、肿块横径、肿块纵径、位置、纵横比、边界、形态、回声、钙化灶、血流、贴近包膜、肿块内横波声速、超声诊断淋巴结、弹性评分、弹性成像贴近和突破包膜。6.根据权利要求2至4任意一项所述的一种ptmc颈部淋巴结转移辅助诊断方法,其特征在于:所述机器学习算法采用light gbm算法。7.一种计算机可读存储介质,其特征在于:所述存储介质上存储有计算机可执行指令,当所述计算机可执行指令被计算机执行时,可用来实现权利要求1至6任意一项所述的方法。

技术总结


本发明涉及一种PTMC颈部淋巴结转移辅助诊断方法,包括步骤:S101:建立用于诊断PTMC颈部淋巴结转移的分类模型;S102:获取目标患者的相关病理数据;S103:将所述相关病理数据输入至所述分类模型,并获取所述分类模型的输出结果;S104:根据所述输出结果确定所述目标患者的PTMC颈部淋巴结转移状态信息。本发明通过构建用于诊断PTMC颈部淋巴结转移状态的分类模型,就可以基于目标患者的相关病理数据智能化的计算出患者的PTMC颈部淋巴结转移状态,辅助医生给出可靠的诊断结论,防止误诊、漏诊。漏诊。漏诊。


技术研发人员:

娄可新 吴蓉 陈刚

受保护的技术使用者:

上海市第一人民医院 江苏易用科技有限公司

技术研发日:

2022.08.05

技术公布日:

2022/11/25

本文发布于:2024-09-20 16:37:23,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/10928.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:淋巴结   病理   颈部   数据
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议