牙颈部非龋性缺损预测模型构建方法、装置和预测系统



1.本技术涉及计算机编程技术领域、生物信息技术领域,具体而言,涉及牙颈部非龋性缺损预测模型构建方法、装置和预测系统。


背景技术:



2.牙颈部非龋性缺损(non-carious cervical lesions,nccls),是一种临床上常见的牙体硬组织缺损,在老年体(≥60岁)发病率极高。nccls的发生为一个缓慢过程,合并多个因素的共同作用,nccls的出现会进一步引起牙本质过敏、牙髓炎等一系列并发症,同时易发生牙齿折断,因此对nccls进行预防极为重要。
3.目前的对nccls进行预测需要通过复杂的计算公式进行风险的计算,方法复杂,全域推广性差。


技术实现要素:



4.本技术实施例的目的在于提供牙颈部非龋性缺损预测模型构建方法、装置、预测系统、电子设备和存储介质。通过lasso-logistic回归构建预测模型,避免当两个或更多的自变量有些相关时,出现多重共线性的情况,从而造成的预测模型估计失真或估计不准确的问题。并且基于预测模型构建列线性预测模型,通过列线图预测模型将预测结果可视化,避免复杂公式的计算,提高牙颈部非龋性缺损预测方法可行性。
5.第一方面,本技术实施例提供了一种牙颈部非龋性缺损预测模型构建方法,包括:根据牙颈部非龋性缺损的致病因素获取潜在影响参数;对每个潜在影响参数进行单因素分析,获得每个潜在影响参数的特征值;将特征值小于预设阈值的潜在影响参数进行lasso回归,获得每一潜在影响参数的系数;将潜在影响参数的系数不为零的潜在影响参数,通过多因素logistic回归模型,根据赤池信息量准则进行双向逐步回归;获得影响参数以及每一影响参数的系数;根据影响参数及影响参数对应的系数构建预测模型。
6.在上述的实现过程中,根据牙颈部非龋性缺损的致病因素获取潜在影响参数,将获取到的潜在影响参数作为潜在预测因子,在logistic回归中进行筛选,以得到最终的独立预测因子,即预测模型中的影响参数以及其对应的系数,再根据影响参数及影响参数对应的系数构建预测模型。实现通过模型对用户的牙颈部非龋性缺损进行风险预测。
7.可选地,在本技术实施例中,其中,潜在影响参数包括:牙颈部非龋性缺损患者的人口学特征参数、口腔卫生习惯参数、饮食习惯参数、胃肠病史参数、口腔相关疾病病史参数、唾液信息;影响参数包括:年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙。
8.在上述的实现过程中,对潜在影响参数进行选择的时候,分别从人口学特征参数、口腔卫生习惯参数、饮食习惯参数、胃肠病史参数、口腔相关疾病病史参数、唾液信息进行选择,涵盖酸蚀(erosion)、磨损(abrasion)、内部碎裂(abfraction)三大方面的致病因素。以及通过lasso-logistic回归,确定年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及
是否横向刷牙为构建预测模型的影响参数。
9.可选地,在本技术实施例中,预测模型具体为:
10.p=exp(w)/1+exp(w),
11.w=-6.81857+0.09017
×
x1-5.36660
×
x2+1.34774
×
x3+2.44044
×
x4+1.85148
×
x5,
12.其中,p为患病概率,x1为年龄;x2为唾液流速;x3为是否有胃肠道病史;x4为是否夜磨牙;x5是否横向刷牙。
13.在上述的实现过程中,通过lasso-logistic回归,获得影响参数以及其对应的系数,再根据影响参数及影响参数对应的系数构建预测模型,得到精准的预测模型。
14.第二方面,本技术实施例还提供了一种牙颈部非龋性缺损预测模型构建装置,包括:获取模块,用于根据牙颈部非龋性缺损的致病因素获取潜在影响参数;单因素分析模块,用于对每个潜在影响参数进行单因素分析,获得每个潜在影响参数的特征值;lasso回归模块,用于将特征值小于预设阈值的潜在影响参数进行lasso回归,获得每一潜在影响参数的系数;多因素回归模块,将潜在影响参数的系数不为零的潜在影响参数,通过多因素logistic回归模型,根据赤池信息量准则进行双向逐步回归;获得影响参数以及每一影响参数的系数;预测模型构建模块,用于根据影响参数及影响参数对应的系数构建预测模型。
15.第三方面,本技术实施例还提供了一种牙颈部非龋性缺损预测系统,应用于牙颈部非龋性缺损的预测,包括:
16.采集模块,用于采集目标用户的影响参数,其中,影响参数包括:目标用户的年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙;预测模块,用于将目标用户的年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙输入预先构建好的预测模型,获得预测模型输出的用户患有牙颈部非龋性缺损的预测概率;其中,预测模型为利用单因素分析算法、lasso回归算法和多因素logistic回归算法对潜在影响参数进行分析获得。
17.在上述的实现过程中,通过采集模块采集目标用户的影响参数,通过预测模块,将采集到的用户的影响参数输入与先构建的预测模型中,获得用户患有牙颈部非龋性缺损的预测概率。
18.可选地,在本技术实施例中,系统还包括模型构建模块,用于:根据牙颈部非龋性缺损的致病因素获取潜在影响参数;对每个潜在影响参数进行单因素分析,获得每个潜在影响参数的特征值;将特征值小于预设阈值的潜在影响参数进行lasso回归,获得每一潜在影响参数的系数;将潜在影响参数的系数不为零的潜在影响参数,通过多因素logistic回归模型,根据赤池信息量准则进行双向逐步回归;获得影响参数以及每一影响参数的系数;根据影响参数及影响参数对应的系数构建预测模型。
19.在上述的实现过程中,系统还包括模型构建模块,用于预先构建预测模型,模型构建模块将采集到的潜在影响参数进行单因素分析、lasso回归以及多因素回归,获得影响参数,实现基于logistic回归构建预测模型。以便后续通过构建好的预测模型对患有牙颈部非龋性缺损的风险概率进行预测。
20.可选地,在本技术实施例中,系统还包括列线图生成模块,用于:根据影响参数的系数,确定每一影响参数对应的自变量评分;将每一影响参数对应的自变量评分相加,得到
总评分;将总评分进行函数转换,得到预测概率;根据影响参数、每一影响参数的系数以及预测概率,生成列线图。
21.在上述的实现过程中,基于获得的影响参数和影响参数的系数,构建列线图预测模型,通过列线图预测模型将预测结果可视化,将复杂的回归方程,转变为可视化的图形,提高了预测概率的结果的可读性。
22.可选地,在本技术实施例中,其中,潜在影响参数包括:牙颈部非龋性缺损患者的人口学特征参数、口腔卫生习惯参数、饮食习惯参数、胃肠病史参数、口腔相关疾病病史参数、唾液信息;影响参数包括:年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙;预测模型具体为:p=exp(w)/1+exp(w),
23.w=-6.81857+0.09017
×
x1-5.36660
×
x2+1.34774
×
x3+2.44044
×
x4+1.85148
×
x5,
24.其中,p为患病概率,x1为年龄;x2为唾液流速;x3为是否有胃肠道病史;x4为是否夜磨牙;x5是否横向刷牙。
25.第四方面,本技术实施例还提供了一种电子设备,包括:处理器和存储器,存储器存储有处理器可执行的机器可读指令,机器可读指令被处理器执行时执行如上面描述的方法。
26.第五方面,本技术实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上面描述的方法。
附图说明
27.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
28.图1为本技术实施例提供的牙颈部非龋性缺损预测模型构建方法的流程示意图;
29.图2为本技术实施例提供的牙颈部非龋性缺损预测模型构建装置的结构示意图;
30.图3为本技术第一种实施例提供的牙颈部非龋性缺损预测系统的结构示意图;
31.图4为本技术第二种实施例提供的牙颈部非龋性缺损预测系统的结构示意图;
32.图5为本技术实施例提供的牙颈部非龋性缺损列线图示意图;
33.图6为本技术实施例提供的牙颈部非龋性缺损预测模型的受试者运行特征图;
34.图7为本技术实施例提供的预测模型的校准曲线图;
35.图8为本技术实施例提供的决策曲线分析图;
36.图9为的本技术实施例提供的电子设备的结构示意图。
具体实施方式
37.下面将结合附图对本技术技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本技术的技术方案,因此只作为示例,而不能以此来限制本技术的保护范围。
38.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的
技术人员通常理解的含义相同;本文中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本技术。
39.在本技术实施例的描述中,技术术语“第一”、“第二”等仅用于区别不同对象,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量、特定顺序或主次关系。在本技术实施例的描述中,“多个”的含义是两个及以上,除非另有明确具体的限定。
40.请参见图1示出的本技术实施例提供的牙颈部非龋性缺损预测模型构建方法的流程示意图。
41.步骤s110:根据牙颈部非龋性缺损的致病因素获取潜在影响参数。
42.上述步骤s110的实施方式包括:牙颈部非龋性缺损的致病因素包括酸蚀(erosion)、磨损(abrasion)、内部碎裂(abfraction)多个方面,获取的潜在影响参数可涵盖每一方面的致病因素,即在每一方面的致病因素选取一个或多个影响参数作为潜在影响参数。具体例如,根据牙颈部非龋性缺损的致病因素,获得牙颈部非龋性缺损患者的潜在影响参数,潜在影响参数可以为牙颈部非龋性缺损模型的潜在预测因子。
43.步骤s120:对每个潜在影响参数进行单因素分析,获得每个潜在影响参数的特征值。
44.上述步骤s120的实施方式包括:对每个潜在影响参数进行单因素分析,通过单因素分析方法对潜在影响参数进行变量显著性分析,获得每个潜在影响参数的特征值。这里的特征值包括进行单因素分析之后各个潜在影响因素的p值。
45.步骤s130:将特征值小于预设阈值的潜在影响参数进行lasso回归,获得每一潜在影响参数的系数。
46.上述步骤s130的实施方式包括:特征值小于预设阈值,则说明该潜在影响因素与牙颈部非龋性缺损患病风险相关性高,因此将特征值小于预设阈值的潜在影响参数,进行lasso回归,其中,特征值预设阈值可以设置为0.25,即保留单因素回归中,p值小于0.25的潜在影响参数,此处放宽p值范围是为了达到筛选目的同时防止重要预测变量的遗失,可以理解的,特征值预设阈值也可以根据其他实际需求进行设置。
47.特征值预设阈值设置为0.25,步骤s130具体例如:将潜在影响参数进行单因素分析之后,对p值小于0.25的潜在影响因素进行lasso回归,通过lasso回归分析方法,获得每一潜在影响参数的系数,每一潜在影响参数的系数即为每一潜在影响参数的重要性。
48.步骤s140:将潜在影响参数的系数不为零的潜在影响参数,通过多因素logistic回归模型,根据赤池信息量准则进行双向逐步回归;获得影响参数以及每一影响参数的系数。
49.上述步骤s140的实施方式包括:根据步骤s130获得的潜在影响参数的系数,将潜在影响参数的系数不为零的潜在影响参数进行筛选,以规避多重共线性和过拟合的出现。将筛选出的系数不为零的潜在影响参数纳入多因素logistic回归,根据赤池信息量准则(akaike information criterion,aic)进行双向逐步回归,精简解释变量数目,选择aic值最小的潜在影响参数,作为牙颈部非龋性缺损模型的影响参数,即获得了牙颈部非龋性缺损模型的影响参数和影响参数的系数。
50.步骤s150:根据影响参数及影响参数对应的系数构建预测模型。可以根据影响参数的数目建立不同的牙颈部非龋性缺损模型,对多个牙颈部非龋性缺损模型拟合效果,以
及预测准确性进行分析,根据拟合效果和预测准确性选择最优的模型。并且,预测模型可以是针对全年龄段的nccls发生风险的预测模型,也可以是针对老年体,即大于等于60岁人的nccls发生风险的预测模型。
51.在上述的实现过程中,通过lasso-logistic回归构建预测模型,避免当两个或更多的自变量存在关联关系时,出现多重共线性的情况,从而造成的预测模型估计失真或估计不准确的问题。以及根据影响参数及影响参数对应的系数构建预测模型。实现通过模型对用户的牙颈部非龋性缺损进行风险预测。
52.可选地,在本技术实施例中,潜在影响参数包括:牙颈部非龋性缺损患者的人口学特征参数、口腔卫生习惯参数、饮食习惯参数、胃肠病史参数、口腔相关疾病病史参数、唾液信息;影响参数包括:年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙。
53.上述步骤的实施方式例如:根据牙颈部非龋性缺损的致病因素获取潜在影响参数,具体例如,获取牙颈部非龋性缺损患者的人口学特征参数,人口学特征参数包括患者年龄、性别等;口腔卫生习惯参数,包括刷牙方向、刷牙频率等;饮食习惯参数,包括酸食摄入频率、饮料摄入频率等;胃肠病史参数,包括是否有胃肠病史;口腔相关疾病病史参数,包括夜磨牙、紧咬牙以及颞下颌关节紊乱等;以及获取牙颈部非龋性缺损患者的唾液信息,对唾液流速、唾液ph、缓冲能力等指标的测定。
54.将潜在影响参数进行单因素分析之后,对p值小于0.25的潜在影响因素进行lasso回归,获得各潜在影响参数的系数,其中,潜在影响参数的系数不为零的潜在影响参数包括:年龄、性别、心率、bmi、唾液流速、胃肠道病史、刷牙方式、夜磨牙、口干情况。
55.潜在影响参数的系数不为零的潜在影响参数在logistic多因素回归分析中进行筛选,得到的最终的独立预测因子,即为牙颈部非龋性缺损模型中的影响参数,影响参数包括:年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙。
56.在上述的实现过程中,对潜在影响参数进行选择的时候,分别从人口学特征参数、口腔卫生习惯参数、饮食习惯参数、胃肠病史参数、口腔相关疾病病史参数、唾液信息进行选择,涵盖三大方面的致病因素。以及通过lasso-logistic回归,确定年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙为构建预测模型的影响因素,经过实验研究,影响因素为上述参数的时候,预测模型为最优的模型,预测效能良好。
57.可选地,在本技术实施例中,预测模型具体为:
58.p=exp(w)/1+exp(w),
59.w=-6.81857+0.09017
×
x1-5.36660
×
x2+1.34774
×
x3+2.44044
×
x4+1.85148
×
x5,
60.其中,p为患病概率,x1为年龄;x2为唾液流速;x3为是否有胃肠道病史;x4为是否夜磨牙;x5是否横向刷牙。
61.具体例如,x1为年龄,单位为岁;x2为唾液流速,单位为毫升每分钟;x3为是否有胃肠道病史,若有胃肠道病史,则x3为1,若没有胃肠道病史,则x3为0;x4为是否夜磨牙,若有夜磨牙,则x4为1,若没有夜磨牙,则x4为0;x5是否横向刷牙,若是横向刷牙,则x5为1,若不是横向刷牙,则x5为0。
62.在上述的实现过程中,通过lasso-logistic回归,获得影响参数以及其对应的系数,再根据影响参数及影响参数对应的系数构建预测模型,得到精准的预测模型。
63.请参见图2示出的本技术实施例提供的牙颈部非龋性缺损预测模型构建装置的结构示意图;该装置可以是电子设备上的模块、程序段或代码。应理解,该装置与上述图1方法实施例对应,能够执行图1方法实施例涉及的各个步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置200,包括:
64.获取模块210,用于根据牙颈部非龋性缺损的致病因素获取潜在影响参数;
65.单因素分析模块220,用于对每个潜在影响参数进行单因素分析,获得每个潜在影响参数的致病概率;
66.lasso回归模块230,用于根据致病概率小于预设阈值的潜在影响参数进行lasso回归,获得每一潜在影响参数的系数;
67.多因素回归模块240,将潜在影响参数的系数不为零的潜在影响参数,通过多因素logistic回归模型,根据赤池信息量准则进行双向逐步回归;获得影响参数以及每一影响参数的系数;
68.预测模型构建模块250,用于根据影响参数及影响参数对应的系数构建预测模型。
69.可选地,在本技术实施例中,其中,潜在影响参数包括:牙颈部非龋性缺损患者的人口学特征参数、口腔卫生习惯参数、饮食习惯参数、胃肠病史参数、口腔相关疾病病史参数、唾液信息;影响参数包括:年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙。
70.可选地,在本技术实施例中,预测模型具体为:
71.p=exp(w)/1+exp(w),
72.w=-6.81857+0.09017
×
x1-5.36660
×
x2+1.34774
×
x3+2.44044
×
x4+1.85148
×
x5,
73.其中,p为患病概率,x1为年龄;x2为唾液流速;x3为是否有胃肠道病史;x4为是否夜磨牙;x5是否横向刷牙。
74.请参见图3示出的本技术第一种实施例提供的牙颈部非龋性缺损预测系统的结构示意图;本技术实施例还提供了牙颈部非龋性缺损预测系统300,应用于牙颈部非龋性缺损的预测,包括:
75.采集模块310,用于采集目标用户的影响参数,其中,影响参数包括:目标用户的年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙。
76.预测模块320,用于将目标用户的年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙输入预先构建好的预测模型,获得预测模型输出的用户患有牙颈部非龋性缺损的预测概率;其中,预测模型为利用单因素分析算法、lasso回归算法和多因素logistic回归算法对潜在影响参数进行分析获得。
77.上述步骤的实施方式例如:通过采集模块310采集目标用户的影响参数,其中,采集模块310可以包括预测系统与用户进行交互的交互界面,目标用户通过交互界面输入包括年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙的影响参数,通过采集模块获取到用户输入的模块,再通过预测模块320,将采集到的用户的影响参数输入预先构建的预测模型中,根据影响参数进行计算处理,获得用户患有牙颈部非龋性缺损的预测概率。具体例如,年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙的影响参数分别代入预设的预测模型中,预测模型包括具有每一影响参数对应的系数以及计算出
预测概率的公式。预测模块320根据预设的预测模型和影响参数,进行计算处理,获得用户患有牙颈部非龋性缺损的预测概率。
78.其中,预测概率可以是具体地概率值,也可以为患有牙颈部非龋性缺损预测结果,具体为发生或不发生。
79.请参见图4示出的本技术第二种实施例提供的牙颈部非龋性缺损预测系统的结构示意图。可选地,在本技术实施例中,系统还包括模型构建模块330,用于:根据牙颈部非龋性缺损的致病因素获取潜在影响参数;对每个潜在影响参数进行单因素分析,获得每个潜在影响参数的致病概率;根据致病概率小于预设阈值的潜在影响参数进行lasso回归,获得每一潜在影响参数的系数;将潜在影响参数的系数不为零的潜在影响参数,通过多因素logistic回归模型,根据赤池信息量准则进行双向逐步回归;获得影响参数以及每一影响参数的系数;根据影响参数及影响参数对应的系数构建预测模型。
80.实施方式例如:系统还包括模型构建模块,模型构建模块具体用于,根据牙颈部非龋性缺损的致病因素,获得牙颈部非龋性缺损患者的潜在影响参数,潜在影响参数可以为牙颈部非龋性缺损模型的潜在预测因子。
81.对每个潜在影响参数进行单因素分析,通过单因素分析方法对潜在影响参数进行变量显著性分析,获得每个潜在影响参数的特征值。这里的特征值包括进行单因素分析之后各个潜在影响因素的p值。
82.特征值小于预设阈值,则说明该潜在影响因素与牙颈部非龋性缺损患病风险相关性高,因此将特征值小于预设阈值的潜在影响参数,进行lasso回归,其中,特征值的预设阈值可以为0.25,此处放宽p值范围是为了达到筛选目的同时防止重要预测变量的遗失,可以理解的,特征值预设阈值也可以根据其他实际需求进行设置。具体例如:将单因素分析之后,对p值小于0.25的潜在影响因素进行lasso回归,通过lasso回归分析方法,获得每一潜在影响参数的系数,每一潜在影响参数的系数即为每一潜在影响参数的重要性。
83.将潜在影响参数的系数不为零的潜在影响参数进行筛选,以规避多重共线性和过拟合的出现。将筛选出的系数不为零的潜在影响参数纳入多因素logistic回归,根据赤池信息量准则(akaike information criterion,aic)进行双向逐步回归,精简解释变量数目,选择aic值最小的潜在影响参数,作为牙颈部非龋性缺损模型的影响参数,即获得了牙颈部非龋性缺损模型的影响参数和影响参数的系数。
84.根据影响参数的数目建立不同的牙颈部非龋性缺损模型,对多个牙颈部非龋性缺损模型拟合效果,以及预测准确性进行分析,根据拟合效果和预测准确性选择最优的模型,从而完成牙颈部非龋性缺损预测模型的构建。
85.在上述的实现过程中,系统还包括模型构建模块,用于预先构建预测模型,实现基于logistic回归构建预测模型。以便后续通过构建好的预测模型对患有牙颈部非龋性缺损的风险概率进行预测。
86.请继续参见图4,可选地,在本技术实施例中,预测系统还包括列线图生成模块340,用于:根据影响参数的系数,确定每一影响参数对应的自变量评分;将每一影响参数对应的自变量评分相加,得到总评分;将总评分进行函数转换,得到预测概率;根据影响参数、每一影响参数的系数以及预测概率,生成列线图。
87.实施方式例如:列线图生成模块340具体用于,根据模型中各个影响因素对结果变
量的贡献程度,即根据预测模型得出的影响参数的系数,给每个影响参数的取值水平进行赋分,然后再将各个评分相加得到总评分,最后通过总评分与结果事件发生概率之间的函数转换关系,从而计算出患有牙颈部非龋性缺损的预测值,并生成列线图(nomogram)预测模型。
88.根据构建好的牙颈部非龋性缺损的模型获得影响参数为:年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙,以及影响参数的系数分别为0.09017、5.36660、1.34774、2.44044、1.85148。根据影响参数的系数对每个影响参数进行赋分,分值范围为0-100,将每个影响参数的分值标记在标尺上。各影响参数的分值具体例如,当列线图预测模型为针对老年体,即年龄在60至86岁之间,包括60岁和86岁,则年龄对应标尺取值范围可以为60-86;唾液流速,对应标尺取值范围为0-0.8;是否有胃肠道疾病史,若存在,对应分值为32分;第五个标尺为是否夜磨牙,若是,对应分值为57分;第六个标尺为是否喜好横向刷牙,若是,对应分值为43分。
89.再将各个影响因素的分值相加得到总分值,总分值评分公式,具体为:总分值=年龄对应分值+唾液流速对应分值+胃肠道病史对应分值+夜磨牙现象对应分值+是否横向刷牙对应分值。
90.请参见图5示出的本技术实施例提供的牙颈部非龋性缺损列线图示意图。
91.根据各影响因素分值以及总分值绘制列线图,具体例如,列线图模型,由8个标尺组成,其中,第一个标尺为分值标尺,分值范围为0-100;第二个标尺为年龄标尺,取值范围为60-86;第三个标尺为唾液流速,取值范围为0-0.8;第四个标尺为是否有胃肠道疾病史,若存在,对应分值为32分;第五个标尺为是否夜磨牙,若是,对应分值为57分;第六个标尺为是否喜好横向刷牙,若是,对应分值为43分;第七个标尺为总分值,取值范围为0-280;第十一个标尺为发生率,取值范围为0.1-0.9。
92.需要说明的是,列线图的构建使用r语言的rms包,将传统公式形态的预测模型转化为可视化的图形。也可以通过其他程序语言或数据分析软件实现,例如python、sas以及stata等。
93.作为一种实施方式,在使用采集模块310进行概率预测之前,通过模型构建模块330构建预测模型,以及通过列线图生成模块340构建列线图预测模型。
94.在上述的实现过程中,基于获得的影响参数和影响参数的系数,构建列线性预测模型,通过列线图预测模型将预测结果可视化,将复杂的回归方程,转变为了可视化的图形,提高了预测概率的结果的可读性。
95.可选地,在本技术实施例中,其中,潜在影响参数包括:牙颈部非龋性缺损患者的人口学特征参数、口腔卫生习惯参数、饮食习惯参数、胃肠病史参数、口腔相关疾病病史参数、唾液信息;影响参数包括:年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙;预测模型具体为:p=exp(w)/1+exp(w),
96.w=-6.81857+0.09017
×
x1-5.36660
×
x2+1.34774
×
x3+2.44044
×
x4+1.85148
×
x5,
97.其中,p为患病概率,x1为年龄;x2为唾液流速;x3为是否有胃肠道病史;x4为是否夜磨牙;x5是否横向刷牙。
98.在构建列线图预测模型之后,根据列线图预测模型,制备受试者运行特征、预测模
型的校准曲线以及预测模型的决策曲线分析;根据受试者运行特征、预测模型的校准曲线以及预测模型的决策曲线分析,对列线图预测模型的性能进行评估。
99.请参见图6示出的本技术实施例提供的牙颈部非龋性缺损预测模型的受试者运行特征(roc)图,图7示出的本技术实施例提供的预测模型的校准曲线,以及图8示出的本技术实施例提供的决策曲线分析(dca)。
100.对构建的预测模型进行roc曲线分析,计算roc曲线下面积(auc),以及约登指数(youden index)点上模型敏感度和特异度等指标,评价列线图预测模型的预测、区分低/高风险人。如图6所示,本技术实施例提供的牙颈部非龋性缺损预测模型的roc曲线下面积(auc)值为0.869,说明模型的区分能力较好。
101.制作具有1000个bootstrap再抽样的校准曲线,若列线图预测模型的校准曲线贴近于对角线,则表示列线图预测概率与实际概率相似,即预测与实际观察结果具有较好的一致性,同时表明,列线图对nccls预测的鉴别能力可以推广到其他人,具有较高适用性。如图7所示,nomogram模型的校准曲线,可以看出nomogram模型预测值的大小和观察值的大小一致性较好,说明该模型的校准度较好。
102.对预测模型进行决策曲线分析(dca),使用决策曲线分析,对列线图在不同阈值概率下的具体标准化净收益进行分析,判断列线图性能。如图8所示,当阈概率大于0.11时,预测模型的dca决策曲线在概率区间净收益率均高于全或无的干预方案,则该预测模型的临床应用性较好。
103.在上述的实现过程中,通过roc曲线、校准曲线和临床决策分析,检验基于上述方法建立的预测模型区分度、校准度以及临床应用价值等,判断该模型是否适用于辅助临床预防措施的实施。同时,提供的预测模型效能检验方法可用于比较多个列线图预测模型的效能,选出最佳模型。
104.请参见图9示出的本技术实施例提供的电子设备的结构示意图。本技术实施例提供的一种电子设备400,包括:处理器410和存储器420,存储器420存储有处理器410可执行的机器可读指令,机器可读指令被处理器410执行时执行如上的方法。
105.本技术实施例还提供了一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上的方法。
106.其中,存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(static random access memory,简称sram),电可擦除可编程只读存储器(electrically erasable programmable read-only memory,简称eeprom),可擦除可编程只读存储器(erasable programmable read only memory,简称eprom),可编程只读存储器(programmable red-only memory,简称prom),只读存储器(read-only memory,简称rom),磁存储器,快闪存储器,磁盘或光盘。
107.本技术实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其他的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本技术实施例的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以不
同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
108.另外,在本技术实施例各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
109.以上的描述,仅为本技术实施例的可选实施方式,但本技术实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术实施例的保护范围之内。

技术特征:


1.一种牙颈部非龋性缺损预测模型构建方法,其特征在于,包括:根据牙颈部非龋性缺损的致病因素获取潜在影响参数;对每个所述潜在影响参数进行单因素分析,获得每个所述潜在影响参数的特征值;将所述特征值小于预设阈值的所述潜在影响参数进行lasso回归,获得每一所述潜在影响参数的系数;将潜在影响参数的系数不为零的所述潜在影响参数,通过多因素logistic回归模型,根据赤池信息量准则进行双向逐步回归;获得影响参数以及每一所述影响参数的系数;根据所述影响参数及所述影响参数对应的系数构建预测模型。2.根据权利要求1所述的方法,其特征在于,其中,所述潜在影响参数包括:牙颈部非龋性缺损患者的人口学特征参数、口腔卫生习惯参数、饮食习惯参数、胃肠病史参数、口腔相关疾病病史参数、唾液信息;所述影响参数包括:年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙。3.根据权利要求1所述的方法,其特征在于,所述预测模型具体为:p=exp(w)/1+exp(w),w=-6.81857+0.09017
×
x1-5.36660
×
x2+1.34774
×
x3+2.44044
×
x4+1.85148
×
x5,其中,p为患病概率,x1为年龄;x2为唾液流速;x3为是否有胃肠道病史;x4为是否夜磨牙;x5为是否横向刷牙。4.一种牙颈部非龋性缺损预测模型构建装置,其特征在于,包括:获取模块,用于根据牙颈部非龋性缺损的致病因素获取潜在影响参数;单因素分析模块,用于对每个所述潜在影响参数进行单因素分析,获得每个所述潜在影响参数的特征值;lasso回归模块,用于将所述特征值小于预设阈值的所述潜在影响参数进行lasso回归,获得每一所述潜在影响参数的系数;多因素回归模块,将潜在影响参数的系数不为零的所述潜在影响参数,通过多因素logistic回归模型,根据赤池信息量准则进行双向逐步回归;获得影响参数以及每一所述影响参数的系数;预测模型构建模块,用于根据所述影响参数及所述影响参数对应的系数构建预测模型。5.一种牙颈部非龋性缺损预测系统,其特征在于,应用于牙颈部非龋性缺损的预测,包括:采集模块,用于采集目标用户的影响参数,其中,所述影响参数包括:所述目标用户的年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙;预测模块,用于将所述目标用户的所述年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙输入预先构建好的预测模型,获得所述预测模型输出的所述用户患有牙颈部非龋性缺损的预测概率;其中,所述预测模型为利用单因素分析算法、lasso回归算法和多因素logistic回归算法对潜在影响参数进行分析获得。6.根据权利要求5所述的系统,其特征在于,所述系统还包括模型构建模块,用于:根据牙颈部非龋性缺损的致病因素获取潜在影响参数;
对每个所述潜在影响参数进行单因素分析,获得每个所述潜在影响参数的特征值;将所述特征值小于预设阈值的所述潜在影响参数进行lasso回归,获得每一所述潜在影响参数的系数;将潜在影响参数的系数不为零的所述潜在影响参数,通过多因素logistic回归模型,根据赤池信息量准则进行双向逐步回归;获得影响参数以及每一所述影响参数的系数;根据所述影响参数及所述影响参数对应的系数构建预测模型。7.根据权利要求6所述的系统,其特征在于,所述系统还包括列线图生成模块,用于:根据所述影响参数的系数,确定每一所述影响参数对应的自变量评分;将每一所述影响参数对应的自变量评分相加,得到总评分;将所述总评分进行函数转换,得到预测概率;根据所述影响参数、每一所述影响参数的系数以及所述预测概率,生成列线图。8.根据权利要求6所述的系统,其特征在于,其中,所述潜在影响参数包括:牙颈部非龋性缺损患者的人口学特征参数、口腔卫生习惯参数、饮食习惯参数、胃肠病史参数、口腔相关疾病病史参数、唾液信息;所述影响参数包括:年龄、唾液流速、是否有胃肠道病史、是否夜磨牙以及是否横向刷牙;所述预测模型具体为:p=exp(w)/1+exp(w),w=-6.81857+0.09017
×
x1-5.36660
×
x2+1.34774
×
x3+2.44044
×
x4+1.85148
×
x5,其中,p为患病概率,x1为年龄;x2为唾液流速;x3为是否有胃肠道病史;x4为是否夜磨牙;x5为是否横向刷牙。9.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述机器可读指令被所述处理器执行时执行如权利要求1至3任一所述的方法。10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至3任一所述的方法。

技术总结


本申请提供一种牙颈部非龋性缺损预测模型构建方法、装置和预测系统,方法包括:根据牙颈部非龋性缺损的致病因素获取潜在影响参数;对每个潜在影响参数进行单因素分析,获得每个潜在影响参数的特征值;将特征值小于预设阈值的潜在影响参数进行Lasso回归,获得每一潜在影响参数的系数;将潜在影响参数的系数不为零的潜在影响参数,通过多因素Logistic回归模型,根据赤池信息量准则进行双向逐步回归;获得影响参数以及每一影响参数的系数;根据影响参数及影响参数对应的系数构建预测模型。通过Lasso-Logistic回归构建预测模型,避免出现多重共线性情况;通过列线图预测模型将预测结果可视化,提高预测方法可行性。提高预测方法可行性。提高预测方法可行性。


技术研发人员:

程兴 汪潇潇 杨卓远

受保护的技术使用者:

四川大学

技术研发日:

2022.10.14

技术公布日:

2022/12/26

本文发布于:2024-09-22 13:28:36,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/49018.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:参数   模型   颈部   系数
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议