产前三体综合征的筛查方法与流程



1.本发明涉及产前筛查领域,尤其是涉及产前三体综合征的筛查方法。


背景技术:



2.目前在产前三体综合征的筛查方面存在如下问题:第一,传统的通过计算血清标记物的mom值,计算似然比得到胎儿三体综合征概率的方法,在判断胎儿三体综合征时考虑的影响因子不够全面,容易出现漏判、错判。第二,在主流的产前筛查组合中,仅提供孕早期二联检、三联检和孕中期二联检、三联检、四联检,而缺少孕中期四联检和鼻骨筛查的筛查组合,而根据权威文献报道在假阳性不变的情况下,孕中期四联检三体综合征的检出率比孕中期三联检的检出率提高了5%-7%,而鼻骨筛查更是将产前三体综合征筛查的准确率从85%-90%,提高至97%,因此,亟需增加孕中期四联检和鼻骨筛查的筛查组合。第三,随着计算机技术的蓬勃发展,机器学习算法的不断进步,产前三体综合征的筛查已开始应用机器学习以提高预测的准确性。但是目前基于机器学习算法的产前三体综合征的筛查技术,主要在于解决如何处理机器学习算法中三体综合征和非三体综合征原始数据的不平衡问题,使得基于机器学习筛选方法准确率低且计算量大。


技术实现要素:



3.本发明目的在于提供一种产前三体综合征的筛查方法。
4.为实现上述目的,本发明采取下述技术方案:本发明所述的产前三体综合征的筛查方法,包括以下步骤:s1,确定产前三体综合征的筛查组合;与现有技术相比,增加了孕中期四联检和鼻骨筛查的筛查组合,完善了产前三体综合征的筛查组合。
5.s2,以logistic回归模型为基础,确定影响三体综合征判断的影响因子;丰富了三体综合征的影响因子。
6.s3,收集原始数据,将原始数据按照7:3拆分为训练集和验证集;s4,以各筛查组合和影响因子为特征向量,采用lightgbm算法训练训练集,经优化调参后,获得各筛查组合的预测模型;该步骤以筛查组合的筛查内容和影响因子为共同特征向量,利用机器学习算法建立筛查模型,进行产前三体综合征的产前判断,提高了计算效率和预测准确率。
7.s5,确定待进行产前三体综合征筛查的筛查组合和影响因子,使用相应筛查组合的预测模型筛查三体综合征。
8.进一步地,s1步中所述筛查组合包括孕早期二联检、孕早期三联检、孕早期三联检和鼻检、孕中期二联检、孕中期三联检、孕中期四联检;其中孕早期三联检筛查血清标记物papp-a、fbhcg和超声扫描物nt、crl,孕早期三联检和鼻检筛查血清标记物papp-a、fbhcg和超声扫描物nt、crl、nb。
9.进一步地,s2步中所述影响因子包括预产期年龄、生化孕长、超声孕长、种族、体
重、吸烟、糖尿病、辅助生殖、双胎异常妊娠史,其中种族包括东亚人、南亚人、高加索人和加勒比黑人,糖尿病包括i性糖尿病,辅助生殖包括外受孕和诱导生殖,双胎异常妊娠史包括怀过t21或t18或t13。
10.进一步地,所述孕早期、孕中期确定以手动输入的辅助生殖、超声孕周为主,以头臀颈、头围、双顶颈、末次月经辅助。
11.本发明的优点在于:首先,本技术增加了孕中期四联检和鼻骨筛查的筛查组合,完善了产前三体综合征的筛查组合,进一步确保了产前三体综合征筛查准确率和筛查可靠性。其次,更全面的研究了mom值、年龄风险等三体综合征的影响因子,通过对更加丰富的影响因子进行特征分析和筛选,并筛选出计算效率和预测准确率均更高机器学习算法,获得产前三体综合征筛查更高的检出率和更低假阳性率。与传统筛查方法相比,本技术计算流程简单,筛选过程可自由增加减少影响因子,方法可拓展性更强。
附图说明
12.图1是本发明所述方法流程图。
13.图2是本发明所述方法中boosting模型示意图。
具体实施方式
14.下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
15.本发明所述的产前三体综合征的筛查方法,如图1所示,步骤如下:s1,确定产前三体综合征的筛查组合;产前三体综合征的筛查组合包括孕早期二联检、孕早期三联检、孕早期三联检和鼻检、孕中期二联检、孕中期三联检、孕中期四联检;其中孕早期是9-13孕周,孕中期是14-20孕周。孕早期、孕中期的确定是以手动输入的辅助生殖、超声孕周为主,以头臀颈、头围、双顶颈、末次月经辅助确定。
16.孕早期二联检筛查血清标记物papp-a、fbhcg,孕早期三联检筛查血清标记物papp-a、fbhcg和超声扫描物nt、crl,孕早期三联检和鼻检筛查血清标记物papp-a、fbhcg和超声扫描物nt、crl、nb。
17.孕中期二联检筛查血清标记物afp、fnhcg,孕中期三联检筛查血清标记物afp、fnhcg、ue3,孕中期四联检筛查血清标记物afp、fnhcg、ue4、inhibina。
18.与现有技术相比,增加了孕中期四联检和孕早期三联检加鼻骨筛查的筛查组合,完善了产前三体综合征的筛查组合。
19.s2,以logistic回归模型为基础,通过比较f检验发现,在0.9的显著性水平下,影响三体综合征判断的影响因子包括预产期年龄、生化孕长、超声孕长、种族、体重、吸烟、糖尿病、辅助生殖、双胎异常妊娠史等。其中种族包括东亚人、南亚人、高加索人和加勒比黑人,糖尿病包括i性糖尿病,辅助生殖包括外受孕和诱导生殖,双胎异常妊娠史包括是否怀过t21或t18或t13胎儿。
20.s3,收集原始数据,将原始数据按照7:3拆分为训练集和验证集;s4,以各筛查组合和影响因子为特征向量,采用lightgbm算法训练训练集,经优化调参后,获得各筛查组合的预测模型;如以确定孕早期二联检筛查组合筛选模型为例,将孕早期二联检血清标记物papp-a、fbhcg和s2步中确定的影响因子为特征向量,采用lightgbm算法训练训练集,经多次优化调参后,获得孕早期二联检筛查组合的预测模型。
21.lightgbm模型就是boosting模型的新成员。boosting模型采用将多个基础模型串联亲来,在多颗树模型的基础上,新增一棵树优化整整体结果。如图2所示。
22.lightgbm的主要优势表现在:1.采用直方图算法直方图算法的基本思想是将连续的特征离散化为k个离散特征,同时构造一个宽度为k的直方图用于统计信息(k即个bin)。利用直方图算法我们无需遍历数据,只需要遍历k个bin即可以到最佳分裂点。在产前筛查项目中,将血清标记物等特征分桶处理,使得连续特征离散化,进而方便到最佳的分裂点。
23.2. 采用单边梯度抽样算法boost算法梯度大小可以反应样本的权重,梯度越小说明模型拟合越好。单边梯度抽样算法((gradient-based one-side sampling, goss))正是利用这一信息对样本进行抽样,减少大量梯度小的样本,在接下来的计算中只需要关注梯度高得样本,因此能极大的减少计算量。
24.3. 采用互斥的特征捆绑算法高维特征往往是稀疏的,而且特征间可能是相互排斥的,如果两个特征并不完全互斥,可以用互斥率标识互斥程度。互斥特征捆绑算法指出如果将一些特征进行融合绑定,则可以降低特征数量。这样就无需再对种族特征中的四个子类别进行类别编码,进而规避了one-hot编码带来的样本切分不均衡问题。
25.s4,确定待进行产前三体综合征筛查的筛查组合和影响因子,使用相应筛查组合的预测模型筛查三体综合征。
26.本技术发明人通过对比logistic逻辑回归算法、支持向量机算法和lightgbm算法的准确率和f1值后,发现在逻辑回归的基础上引入影响因子,采用lightgbm算法在多数筛查组合上表现最好,显著提高了计算效率和预测准确率。如下表1所示,针对孕早期三联检+nb和孕中期四联检,lightgbm算法的检出率为100% 和95.76%。
27.表1。

技术特征:


1.一种产前三体综合征的筛查方法,其特征在于:包括以下步骤:s1,确定产前三体综合征的筛查组合;s2,以logistic回归模型为基础,确定影响三体综合征判断的影响因子;s3,收集原始数据,将原始数据按照7:3拆分为训练集和验证集;s4,以各筛查组合和影响因子为特征向量,采用lightgbm算法训练训练集,经优化调参后,获得各筛查组合的预测模型;s5,确定待进行产前三体综合征筛查的筛查组合和影响因子,使用相应筛查组合的预测模型筛查三体综合征。2.根据权利要求1所述的产前三体综合征的筛查方法,其特征在于:s1步中所述筛查组合包括孕早期二联检、孕早期三联检、孕早期三联检和鼻检、孕中期二联检、孕中期三联检、孕中期四联检;其中孕早期三联检筛查血清标记物papp-a、fbhcg和超声扫描物nt、crl,孕早期三联检和鼻检筛查血清标记物papp-a、fbhcg和超声扫描物nt、crl、nb。3.根据权利要求1所述的产前三体综合征的筛查方法,其特征在于:s2步中所述影响因子包括预产期年龄、生化孕长、超声孕长、种族、体重、吸烟、糖尿病、辅助生殖、双胎异常妊娠史,其中种族包括东亚人、南亚人、高加索人和加勒比黑人,糖尿病包括i性糖尿病,辅助生殖包括外受孕和诱导生殖,双胎异常妊娠史包括怀过t21或t18或t13。4.根据权利要求2所述的产前三体综合征的筛查方法,其特征在于:所述孕早期、孕中期确定以手动输入的辅助生殖、超声孕周为主,以头臀颈、头围、双顶颈、末次月经辅助。

技术总结


本发明公开了一种产前三体综合征的筛查方法,确定产前三体综合征的筛查组合后,以logistic回归模型为基础,确定影响三体综合征判断的影响因子;将原始数据按照7:3拆分为训练集和验证集;以各筛查组合和影响因子为特征向量,采用lightGBM算法训练训练集,经优化调参后,获得各筛查组合的预测模型筛查三体综合征。本发明的优点在于完善了产前三体综合征的筛查组合,进一步确保了产前三体综合征筛查准确率和筛查可靠性。确率和筛查可靠性。确率和筛查可靠性。


技术研发人员:

侯剑平 王超 张蕊 付坤明 刘玉凤 刘聪

受保护的技术使用者:

上海安图生物技术有限公司

技术研发日:

2022.09.23

技术公布日:

2022/12/19

本文发布于:2024-09-21 00:26:13,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/46308.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:筛查   综合征   组合   前三
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议