一种膳食风险预测系统的制作方法



1.本发明涉及膳食风险预测领域,特别是涉及一种膳食风险预测系统。


背景技术:



2.目前,社会老龄化的加剧、生活习惯的演变以及居住环境等不同因素,推进了社会饮食图谱的演进,亚健康人乃至慢病人也在逐年增长。
3.随着科技的发展,一个围绕远程医疗、精准健康和可穿戴设备的个性化数字健康世界正在形成。因此,健康管理的个性化、数字化、精准化是大势所趋。其中,针对危险因素(如吸烟状况、体力活动、膳食状况等)的一般健康风险的精准识别已经成为很多医疗科技公司的数字化医疗产品研发方向。例如,已有很多公司正在研发通过佩戴可穿戴设备追踪呼吸、体温、心电等数据以监控运动损伤或睡眠异常风险,然而,目前针对膳食风险的实时精准预测及识别工具却十分匮乏。
4.现有的膳食风险预测方案有:adam dunki-jacobs等人公开了一种利用一个或多个传感器可用于检测或监视用户的生理参数(例如,心率、身体运动、温度、ph值、阻抗、胃伸展、声音发射等)以检测膳食摄入量的装置。通过设定传感器阈值以判断进食状况(如当阻抗传感器指数超过阻抗传感器阈值并且麦克风指数超过麦克风阈值时发生固体膳食摄入,当阻抗传感器指数不超过阻抗传感器阈值并且麦克风指数超过麦克风阈值时发生液体膳食摄入,并且当阻抗传感器指数不超过阻抗传感器阈值并且麦克风指数不超过麦克风阈值时没有发生膳食摄入)。该方案阈值设定等核心功能为经验性的确定,准确性难以保证;并且通过收集用户生理生化参数,预测单一的膳食相关指标,难以对用户进食前、中、后的全周期膳食风险进行量化监测,难以有效预测膳食风险。


技术实现要素:



5.基于此,本发明实施例提供一种膳食风险预测系统,以提高预测的准确性,并对用户进食前、中、后的全周期膳食风险进行量化监测,有效预测膳食风险。
6.为实现上述目的,本发明提供了如下方案:
7.一种膳食风险预测系统,包括:数据采集设备和与所述数据采集设备连接的移动终端设备;
8.所述数据采集设备用于采集目标人体的第一数据信息;所述第一数据信息包括:体温数据、心率数据、行为数据和环境温度数据;
9.所述移动终端设备包括处理器,所述处理器包括:
10.信息获取模块,用于获取所述目标人体的相关信息;所述相关信息包括所述第一数据信息和第二数据信息;所述第二数据信息包括:个人信息、饮食模式、日常作息频率、进食冲动时间、进食冲动强度、营养摄入量信息、生化数据和生活作息记录数据;
11.特征提取模块,用于对所述目标人体的相关信息进行特征提取,得到所述目标人体的特征集合;所述特征集合包括:个人特征、生活方式特征以及心率变异性及食物特殊动
力学效应特征;所述个人特征包括:个人指标和生化指标;所述生活方式特征包括:设定行为的频率;所述心率变异性及食物特殊动力学效应特征包括:出现进食冲动的心率、用餐前不同时间的心率、用餐开始时的心率、用餐后不同时间的心率与用餐开始时的心率的差值、用餐后不同时段内心率的标准差、用餐后不同时段内心率的变化量、出现进食冲动的心率变异值、用餐前不同时间的心率变异值、用餐开始时的心率变异值、用餐后不同时间的心率变异值与用餐开始时的心率变异值的差值、用餐后不同时段内心率变异值的标准差、用餐后不同时段内心率变异值的变化量、出现进食冲动时的体温、用餐前不同时间的体温、用餐开始时的体温、用餐后不同时间的体温与用餐开始时的体温的差值、用餐后不同时段内体温的标准差和用餐后不同时段内体温的变化量;所述心率变异值是根据对所述心率数据进行分析得到的时域指标和频域指标确定的;
12.风险预测模块,用于将所述目标人体的特征集合输入膳食风险预测模型中,得到所述目标人体的膳食风险特征;所述膳食风险特征包括:进食特征、膳食的能量差值、膳食中各种元素的含量、用餐前不同时间的血糖值、用餐开始时的血糖值、用餐后不同时间的血糖值与用餐开始时的血糖值的差值、用餐后不同时段内血糖值的标准差、用餐后不同时段血糖值的变化量、前一餐的数据、前一餐与当前餐的时间间隔以及进餐后是否肠胃不良;所述膳食风险特征用于确定所述目标人体的膳食风险程度;
13.其中,所述膳食风险预测模型是采用训练数据对机器学习模型进行训练得到的;所述训练数据包括患病类型已知的训练人体的个人特征、生活方式特征、心率变异性及食物特殊动力学效应特征以及膳食风险特征。
14.可选地,所述数据采集设备,具体包括:
15.设置在所述目标人体上的人体记录仪和设置在所述移动终端设备内的环境温度计;所述人体记录仪包括心电感应设备、体温计和陀螺仪;所述心电感应设备、所述体温计、所述陀螺仪和所述环境温度计均与所述处理器连接。
16.可选地,所述处理器还包括:模型确定模块,用于确定所述膳食风险预测模型;
17.所述模型确定模块,包括:
18.训练数据获取单元,用于获取训练数据;
19.训练单元,用于将所述训练数据输入机器学习模型,以累计误差最小为目标,采用梯度下降法对所述机器学习模型进行训练,得到训练好的机器学习模型;
20.膳食风险预测模型确定单元,用于将训练好的机器学习模型确定为所述膳食风险预测模型。
21.可选地,所述训练单元,具体包括:
22.特征筛选子单元,用于采用主成分分析法对所述训练数据进行数据筛选,得到筛选特征;
23.模型训练子单元,用于将所述筛选特征输入所述机器学习模型,以累计误差最小为目标,采用梯度下降法对所述机器学习模型进行训练,得到训练好的机器学习模型。
24.可选地,所述训练单元中的所述机器学习模型为前馈神经网络。
25.可选地,所述移动终端设备,还包括:
26.第二数据输入模块,与所述信息获取模块连接,用于将所述第二数据信息输入所述信息获取模块;
27.所述第二数据信息中的所述个人信息、所述饮食模式、所述日常作息频率、所述进食冲动时间和所述进食冲动强度是采用问卷的方式得到的;
28.所述第二数据信息中的所述营养摄入量信息是基于营养成分分析软件得到的;
29.所述第二数据信息中的所述生活作息记录数据是对所述目标人体的生活作息事项和对应的时间进行记录得到的。
30.可选地,所述特征提取模块,具体包括:
31.降噪单元,用于对所述目标人体的相关信息进行数据降噪,得到降噪后的数据;
32.特征集合确定单元,用于对所述降噪后的数据进行特征提取,得到所述目标人体的特征集合。
33.可选地,所述特征提取模块中的所述个人指标,包括:性别、年龄、教育水平、身高、体重和身体质量指数;
34.所述特征提取模块中的所述生化指标,包括:血压中的舒张压、血压中的收缩压、动脉粥状硬化指数、空腹时的血糖值、血中的胆固醇值、血中的糖化血红蛋白值、血中的脂蛋白值和血中的甘油三酯值。
35.可选地,所述风险预测模块中的所述进食特征,包括:餐次、是否夜间进食、是否有进食冲动和进食速度。
36.可选地,所述风险预测模块中的所述前一餐的数据,包括:
37.前一餐的血糖指数、前一餐的血糖负荷、前一餐中碳水化合物的含量、前一餐中蛋白质的含量、前一餐中脂肪的含量和前一餐中膳食纤维的含量。
38.与现有技术相比,本发明的有益效果是:
39.本发明实施例提出了一种膳食风险预测系统,所述系统采用基于机器学习模型构建的膳食风险预测模型预测目标人体的膳食风险特征险,与需要经验确定阈值的方案相比,能提高预测的准确性;并且,提取目标人体的特征集合,特征集合包括:个人特征、生活方式特征以及心率变异性及食物特殊动力学效应特征,将目标人体的特征集合输入膳食风险预测模型中,得到目标人体进食前、中、后的全周期膳食风险的膳食风险特征。本发明将机器学习与心率变异性及食物特殊动力学效应相结合,不仅能提高预测的准确性,并且能对用户进食前、中、后的全周期膳食风险进行量化监测,有效预测膳食风险。
附图说明
40.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
41.图1为本发明实施例提供的膳食风险预测系统的结构图;
42.图2为本发明实施例提供的前馈神经网络的模型结构的示意图;
43.图3为本发明实施例提供的斜坡函数示意图;
44.图4为本发明实施例提供的进食冲动的模型结果图;
45.图5为本发明实施例提供的膳食能量差值的模型结果图;
46.图6为本发明实施例提供的进食速度的模型结果图;
47.图7为本发明实施例提供的餐后120分钟与用餐开始时之血糖差值的模型结果图;
48.图8为本发明实施例提供的预测进食冲动的rmse验证图;
49.图9为本发明实施例提供的预测膳食能量差值的rmse验证图;
50.图10为本发明实施例提供的预测进食速度的rmse验证图;
51.图11为本发明实施例提供的预测餐后120分钟与用餐开始时之血糖差值的rmse验证图。
具体实施方式
52.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
53.目前,现有的技术方案主要通过收集用户生理生化参数,预测单一的膳食相关指标,难以对用户进食前、中、后的全周期膳食风险进行量化监测并即时干预。本发明的目的是将机器学习与心率变异性及食物特殊动力学效应相结合,提高预测的准确性,并且对用户进食前、中、后的全周期膳食风险进行量化监测,有效预测膳食风险。
54.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
55.术语解释:
56.心率变异性(heart rate variability,hrv):指逐次心动周期之间时间的微小变化,即窦性心律不齐的程度,反映自主神经系统的活性及其平衡协调关系。
57.食物特殊动力学效应(thermic effect offood,tef):是进食后体内的代谢反应增加,使部分能量以热的形式消散的一种代谢效应。
58.膳食风险:指现有的或潜在的与膳食有关的危险因素导致患者不利临床结局的风险,属于一般健康风险。
59.心率变异性(hrv)与膳食的关系:
60.hrv分析的本质就是对窦性心律不齐的程度的定量分析,反映神经体液因素对窦房结的调节作用,也就是反映自主神经系统的活性及其平衡协调关系。已有研究证实,在迷走神经活性减低和/或交感神经活性升高时,hrv值降低,反之升高。在反映进食状况方面,胃肠道受迷走神经控制,迷走神经的传出和传入纤维参与调节饥饿和饱腹感。迷走神经介导的心率变异性(vmhrv)反映迷走神经活动。一方面,在头期迷走神经传出神经的激活,当预期食物进入胃部为身体消化做好准备时,导致生长素释放肽的释放;另一方面,食物摄入后迷走神经传入的激活会引发反馈过程,从而引起饱腹感并最终鼓励用餐结束。
61.对hrv进行分析的数学方法在不断发展的过程中,目前可以分为时域分析、频谱分析、非线性分析三类。时域分析是对采集到的窦性心搏的rr间期的时间序列信号,按时间顺序或心搏顺序排列的nn间期的数值,直接进行统计学或几何学的分析。时域分析的结果,一般用于描述在较长时间段内(例如24h)hrv的大小,对自主神经系统对心率的调控作用做出总的概括性的评价。具体指标包括:1)sdnn:24小时心电图记录中剔除所有异常心博的所有正常rr间期(即nn间期)的标准差。神经网络标准差反映了自主神经功能的副交感神经成
分;2)sdann:短时间内计算的平均nn间隔的标准偏差,通常为5分钟,这是由于长度超过5分钟的循环导致的心率变化的估计,对于反映低频率活动(如身体活动、体位变化等)非常敏感;3)rmssd:窦传导连续nn间隔总平方差异的平方根,反映心率每一拍的方差,是主要的时域指标,被认为是副交感神经活动的重要指标;4)nn50数量:在整个记录中,差值出现大于50毫秒的nn间隔数,需要至少2分钟的数据。5)sdrr:「所有窦性心动」间期时间标准差,包括正常及异常心动。6)pnn50(%):将nn50数除以nn总数得到的。它显示了24小时心电图记录中连续正常rr间隔之间大于50毫秒的差异百分比。它主要反映了副交感神经活动。
62.频谱分析(或称频域分析)是将nn间期的时间序列信号采用数学变换的方法变换到频率域上,形成频谱曲线,并对频谱曲线的形状进行分析,可以比较细致的研究和观察交感神经与迷走神经在临床中的意义。功率谱密度(psd)分析提供功率(方差)作为频率的函数分布的基本信息。基本上,用2~5分钟的短期周期或24小时的长期周期对数据进行分析可以得出4个主要光谱成分,分别为超低频(ulf)、极低频(vlf)、低频(lf)和高频(hf)。如hf hrv由至少2分钟数据处理获得,反映心脏的迷走神经调节情况,与情绪、自我控制相关。
63.以上两种方法都是把自主神经对心率的调控系统看成是一个线性系统来进行分析的,属于线性分析方法。实际上,心率调控的过程是很复杂的,是一个非线性系统。采用非线性数学方法及模型对hrv进行分析和描述称为hrv非线性分析方法。非线性分析方法目前仍在发展中,需要更多的临床研究进行验证。除此之外,还有一些其它指标,目前仍处于不断优化的过程中。
64.geisler等人在111名大学生中研究发现hrv与食物渴望/讨厌等进食冲动(food craving)相关,同时进食冲动可以在一定程度上可以预测控制饮食者的体重变化,因此hrv可以作为反映进食的自我控制能力的潜在标志物。wu j等人也发现青少年的静息「高频心率变异性指标」(hf hrv)与进食冲动负相关。进食冲动越强,进食自控力越差,进而导致高热量食物摄入超标。hf hrv反映迷走神经对心脏的影响以及副交感神经功能,静息状态下hf hrv越低,情绪调节、自我调节以及认知功能越差。stephanie k.v.peschel等人发现反映迷走神经活动度的hrv时域指标rmssd与饱腹感显著负相关。juarascioa s等人发现hrv的短暂变化可以预测情绪性进食。leon j rothberg等人发现hrv的动态性质可能会提供一种独特且实时的方法来监视血糖水平,以进行糖尿病患者的连续无创预测和/或管理。
65.总结以上研究可以合理推测,对hrv的各项指标可以通过量化分析,以反映用户进食前的进食冲动、进食中饱腹感/情绪变化以及进食后生化指标。
66.食物特殊动力学效应(tef)与膳食的关系:
67.tef是进食后体内的代谢反应增加,使部分能量以热的形式消散的一种代谢效应。tef主要为处理、运输和储存膳食中的营养物质所需的能量消耗,以及营养物质流入的代谢效应。因此,食物的摄入能刺激tef的发生,使能量消耗增加10-15%,一般在进食后的一至两小时出现最高峰值,八小时左右回复至基线的状态。
68.不同的膳食、人所产生的tef程度不同,目前发现许多影响因素,包括年龄、身体活动度、膳食份量等。不同年龄层的tef有所不同,du s等人发现年长者的tef所散失的热量较年轻人少。其中可能与身体活动量有关,poehlman et等人发现不论是年轻人或年长者,身体活动度较高者比较低者的tef高。已有许多研究显示能量摄入越多,tef越显着。quatela a等人在27份文献的荟萃分析中发现每100千焦的能量摄入,显着增加了1.1-1.2
千焦/小时的tef所消耗的能量。
69.在探索tef的过程中,科学界对于此反应发生的位置始终围绕在棕脂肪组织(brown adipose tissue,bat)。nedergaard j等人在2022年发布的《棕脂肪组织》书中提到bat为食物特殊动力学效应最主要发生的地方。早在40年前,nancy j等人就指出能量平衡是通过交感神经系统的调控和bat的活化,如食物摄入后的食物特殊动力学效应和寒冷环境中的自适应产热反应。bat的含量和活性反映产热导致体温上升的程度。vosseler a等人发现进食后体温上升的程度与年龄呈负相关,老年人的bat含量较少,tef较年轻人低,进食后体温上升的程度也较年轻人少。不同条件下bat的活性也不同,女性受性皆素调节作用影响,bat活性较男性高。fuller-jackson等人发现不论是寒冷环境的自适应温度调控或餐后体温的变化,女性的bat反应皆比男性显著,产热所导致的体温上升程度比男性高。martinez-tellez等人也发现在摄入同样份量的饮食后,女性的体温上升幅度显著大于男性。driver h等人则发现能量较高的饮食有较高的体温上升程度,且tef程度也较高,因此认为tef和体温上升是受高能量饮食影响。
70.总结以上研究可以合理推测,tef对bat的影响可以通过分析产热导致的体温变化,以反映不同年龄、性别人的膳食情况。
71.基于上述推理,本实施例提出一种将机器学习模型应用于心率变异性及食物特殊动力学效应预测膳食风险的思路,设计的膳食风险预测系统如图1所示。
72.参见图1,本实施例的膳食风险预测系统,包括:数据采集设备和与所述数据采集设备连接的移动终端设备。
73.所述数据采集设备用于采集目标人体的第一数据信息;所述第一数据信息包括:体温数据、心率数据、行为数据和环境温度数据。
74.所述移动终端设备包括处理器,所述处理器包括:
75.信息获取模块,用于获取所述目标人体的相关信息;所述相关信息包括所述第一数据信息和第二数据信息;所述第二数据信息包括:个人信息、饮食模式、日常作息频率、进食冲动时间、进食冲动强度、营养摄入量信息、生化数据和生活作息记录数据。
76.特征提取模块,用于对所述目标人体的相关信息进行特征提取,得到所述目标人体的特征集合;所述特征集合包括:个人特征、生活方式特征以及心率变异性及食物特殊动力学效应特征;所述个人特征包括:个人指标和生化指标;所述生活方式特征包括:设定行为的频率;所述心率变异性及食物特殊动力学效应特征包括:出现进食冲动的心率、用餐前不同时间的心率、用餐开始时的心率、用餐后不同时间的心率与用餐开始时的心率的差值、用餐后不同时段内心率的标准差、用餐后不同时段内心率的变化量、出现进食冲动的心率变异值、用餐前不同时间的心率变异值、用餐开始时的心率变异值、用餐后不同时间的心率变异值与用餐开始时的心率变异值的差值、用餐后不同时段内心率变异值的标准差、用餐后不同时段内心率变异值的变化量、出现进食冲动时的体温、用餐前不同时间的体温、用餐开始时的体温、用餐后不同时间的体温与用餐开始时的体温的差值、用餐后不同时段内体温的标准差和用餐后不同时段内体温的变化量;所述心率变异值是根据对所述心率数据进行分析得到的时域指标和频域指标确定的。
77.风险预测模块,用于将所述目标人体的特征集合输入膳食风险预测模型中,得到所述目标人体的膳食风险特征;所述膳食风险特征包括:进食特征、膳食的能量差值、膳食
中各种元素的含量、用餐前不同时间的血糖值、用餐开始时的血糖值、用餐后不同时间的血糖值与用餐开始时的血糖值的差值、用餐后不同时段内血糖值的标准差、用餐后不同时段血糖值的变化量、前一餐的数据、前一餐与当前餐的时间间隔以及进餐后是否肠胃不良;所述膳食风险特征用于确定所述目标人体的膳食风险程度。
78.其中,所述膳食风险预测模型是采用训练数据对机器学习模型进行训练得到的;所述训练数据包括患病类型已知的训练人体的个人特征、生活方式特征、心率变异性及食物特殊动力学效应特征以及膳食风险特征。
79.在一个示例中,所述数据采集设备,具体包括:
80.设置在所述目标人体上的人体记录仪和设置在所述移动终端设备内的环境温度计;所述人体记录仪包括心电感应设备、体温计和陀螺仪;所述心电感应设备、所述体温计、所述陀螺仪和所述环境温度计均与所述处理器连接。
81.在一个示例中,所述处理器还包括:模型确定模块,用于确定所述膳食风险预测模型。所述模型确定模块,包括:
82.训练数据获取单元,用于获取训练数据。
83.训练单元,用于将所述训练数据输入机器学习模型,以累计误差最小为目标,采用梯度下降法对所述机器学习模型进行训练,得到训练好的机器学习模型。
84.膳食风险预测模型确定单元,用于将训练好的机器学习模型确定为所述膳食风险预测模型。
85.其中,所述训练单元,具体包括:
86.特征筛选子单元,用于采用主成分分析法对所述训练数据进行数据筛选,得到筛选特征。
87.模型训练子单元,用于将所述筛选特征输入所述机器学习模型,以累计误差最小为目标,采用梯度下降法对所述机器学习模型进行训练,得到训练好的机器学习模型。
88.其中,所述训练单元中的所述机器学习模型为前馈神经网络。
89.在一个示例中,所述移动终端设备,还包括:
90.第二数据输入模块,与所述信息获取模块连接,用于将所述第二数据信息输入所述信息获取模块。
91.所述第二数据信息中的所述个人信息、所述饮食模式、所述日常作息频率、所述进食冲动时间和所述进食冲动强度是采用问卷的方式得到的。
92.所述第二数据信息中的所述营养摄入量信息是基于营养成分分析软件得到的。
93.所述第二数据信息中的所述生活作息记录数据是对所述目标人体的生活作息事项和对应的时间进行记录得到的。
94.在一个示例中,所述特征提取模块,具体包括:
95.降噪单元,用于对所述目标人体的相关信息进行数据降噪,得到降噪后的数据。
96.特征集合确定单元,用于对所述降噪后的数据进行特征提取,得到所述目标人体的特征集合。
97.在一个示例中,所述特征提取模块中的所述个人指标,包括:性别、年龄、教育水平、身高、体重和身体质量指数。
98.所述特征提取模块中的所述生化指标,包括:血压中的舒张压、血压中的收缩压、
动脉粥状硬化指数、空腹时的血糖值、血中的胆固醇值、血中的糖化血红蛋白值、血中的脂蛋白值和血中的甘油三酯值。
99.所述风险预测模块中的所述进食特征,包括:餐次、是否夜间进食、是否有进食冲动和进食速度。
100.所述风险预测模块中的所述前一餐的数据,包括:
101.前一餐的血糖指数、前一餐的血糖负荷、前一餐中碳水化合物的含量、前一餐中蛋白质的含量、前一餐中脂肪的含量和前一餐中膳食纤维的含量。
102.在实际应用中,上述膳食风险预测系统的一个更为具体的实现过程如下:
103.步骤1构建数据采集设备
104.a、采集第一数据信息
105.构建人体记录仪,人体记录仪至少包含以单导联心电图为原理的心电感应设备、连续性体温计和陀螺仪,所述人体记录仪可直接与中继器构建远程交互,也可与手机构建远程交互,交互方式为蓝牙、wifi等,但不限于此。
106.1)体温数据的采集:连续性体温计位于人体记录仪中,将其和移动终端设备相连接,并将人体记录仪粘贴在被测者的非惯用手之上胸靠近腋下的位置。在连续测量过程中,人体记录仪每秒采集一次体温数据并记录,通过数据传输连接到移动终端设备中。
107.2)心率数据的采集:心电感应设备位于人体记录仪中,将其和移动终端设备相连接,并将人体记录仪粘贴在被测者的非惯用手之上胸靠近腋下的位置。在连续测量过程中,心电感应设备每毫秒采集一次心率数据并记录,通过数据传输连接到移动终端设备中。
108.3)行为数据的采集:测量行为数据的陀螺仪位于人体记录仪中,将其和移动终端设备相连接,并将人体记录仪粘贴在被测者的非惯用手之上胸靠近腋下的位置。在连续测量过程中,陀螺仪以方向及加速度去分析被测者当前的位姿,包括躺、坐/直立、行走、运动等行为数据,通过数据传输连接到移动终端设备中。
109.4)环境温度数据的采集:连续性环境温度计位于移动终端设备中。在连续测量过程中,连续性环境温度计每秒采集一次环境温度数据并记录,并传送至移动终端设备的处理器中。
110.b、采集第二数据信息
111.1)问卷:在最开始使用人体记录仪测量生理数值之前,会先填写一份问卷,采集个人信息(如性别、年龄、身体质量指数bmi等)、饮食模式和日常作息频率(如午睡、运动等)等。
112.此外,每一次「用餐前」,基于生态瞬时评估(ema)技术收集用户在自然条件下产生的进食冲动信息,并经倾斜台测试、fcq

s(the food cravings questionnaire

state)量表等神经生理学测试进行验证,获得进食冲动时间及进食冲动强度(弱进食冲动/强进食冲动)。
113.2)饮食照片及生化指标测量:「用餐时」拍照记录每餐的食物种类及份量,以获取食物摄入的相关信息,并且记录进食持续时间,录入营养成分分析软件(nccw)进行汇算分析得到用户膳食能量、蛋白质、碳水化合物、脂肪、微量营养素等营养摄入量信息;「用餐后」记录生化数据(如餐后血糖、甘油三酯等)。
114.3)行为记录:每天的日常生活作息,需要记录生活作息事项和对应的时间,如上厕
所、散步、午睡等,得到作息记录数据,将会与陀螺仪采集的行动数据进行比对。
115.步骤2构建样本集
116.样本集中的样本数据应尽量保证数据涵盖所有特征,以避免样本集的误差。本具体实施例所使用的样本集,是从300名患者(单纯性肥胖患者200名,肿瘤患者100名)在90天内使用以上人体记录仪和连续性环境温度计获得,总共采集了超过3000000条数据,其中也包含问卷、饮食记录和行为记录等其他信息。
117.步骤3样本集的数据降噪
118.噪点,常见原因为测量仪器的误差、人为误差或测试方法的问题等。因此,需要对采集到的样本数据进行降噪。
119.步骤4样本集的提取特征
120.先前有研究表示性别是心率变异性的一个重要影响因素,男性心率变异性高于女性。年龄与基线体温呈负相关,年龄越大者,体温上升的幅度也越有限。另有研究发现性别也是个影响因素,女性比男性体温上升的幅度更大。因此,所有会影响心率变异性、体温数值的因素,应该将它们一一列出并作为特征。
121.针对用户膳食风险指标,主要依据不同病种的指南、专家共识等权威资料进行筛选制定,如单纯性肥胖患者膳食风险指标依据《中国超重/肥胖医学营养指南(2021)》进行设计;肿瘤患者膳食风险指标依据《恶性肿瘤患者康复期营养管理专家共识》、《中国肿瘤患者膳食营养白皮书2020-2021》进行制定等等。
122.在参考众多机器学习相关研究的基础上,仅列举常用的136个特征,并对特征分成四类,分别为个人特征、生活方式特征、心率变异性及食物特殊动力学效应特征、膳食风险特征。个人特征的相关说明如表1所示;生活方式特征的相关说明如表2所示;心率变异性及食物特殊动力学效应特征的相关说明如表3所示;为了确定反应心率变异性的心率变异值,对心率数据进行分析得到的心率变异性指标(时域指标和频域指标)如表4所示;膳食风险特征的相关说明如表5所示。个人特征、生活方式特征、心率变异性及食物特殊动力学效应特征、膳食风险特征构成训练数据。
123.表1个人特征
124.特征说明sex性别:1-男性,2-女性age年龄:1-18~49,2-50~64,3-65~79,4-80以上education教育水平:(1-初中及以下,2-高中,3-大学,4-硕士,5-博士)height身高(cm)weight体重(cm)bmi身体质量指数:1-《18.5,2-18.5~24,3-24.1~27,4-》27bp_dyast1血压中的舒张压(mmhg)bp_syst1血压中的收缩压(mmhg)ai_v1动脉粥状硬化指数fasting_pg空腹时的血糖值(mmol/l)chol_v1血中的胆固醇值(mmol/l)hba1c_v1血中的糖化血红蛋白值(mmol/l)
hdlc_v1血中的高密度脂蛋白值ldlc_v2血中的低密度脂蛋白值tg_v3血中的甘油三酯值
125.表2生活方式特征
[0126][0127]
表3心率变异性及食物特殊动力学效应特征
[0128][0129]
[0130]
[0131]
[0132][0133]
表4心率变异性指标
[0134][0135]
表5膳食风险特征
[0136]
[0137]
[0138]
[0139][0140]
步骤5训练模型
[0141]
1)筛选特征
[0142]
当特征数据较多时,增加了分析问题的复杂性,但在特征之间可能存在一定的相关性。因此,需要筛选有用的数据,使用主成分分析法(principal component analysis,pca)将训练数据中可能存在的重叠信息进行降维,不只保留数据结构和可用性,选取权重较高的特征以提升机器的分析效率及准确性。
[0143]
首先,训练数据中n个特征,每个特征对应m个观测值,将其按列排成n
×
m的矩阵。为了方便求得方差,每一行都减去该行的平均值,从而将训练数据表示成特征矩阵x,且按行把x整理成n个行向量的形式,即用x1,x2,

,xn来表示,如下式:
[0144][0145]
x
11
表示第1个特征的第1个观测值;x
12
表示第1个特征的第2个观测值;x
1m
表示第1个特征的第m个观测值;x
21
表示第2个特征的第1个观测值;x
22
表示第2个特征的第2个观测值;x
2m
表示第2个特征的第m个观测值;x
n1
表示第n个特征的第1个观测值;x
n2
表示第n个特征的第2个观测值;x
nm
表示第n个特征的第m个观测值;x1表示第1个特征的特征向量;x2表示第2个特征的特征向量;xn表示第n个特征的特征向量。
[0146]
变换座标系的矩阵有很多,但是只有一个矩阵可以由原始变量得到降维的特征矩阵,又称为主成分。这个矩阵成为转换矩阵p,主成分的筛选以y=px呈现,如下式:
[0147][0148]
y表示经过特征筛选后得到的筛选特征的主成分;y中包含k个元素,用y1,y2,

,yk来表示,k<n;p1表示转换矩阵中的第1个元素;p2表示转换矩阵中的第2个元素;pn表示转换矩阵中的第n个元素。
[0149]
计算筛选特征的主成分y的累计贡献率:
[0150][0151]
其中,η表示主成分y的累计贡献率;λ表示主成分y的方差,即x的斜方差矩阵的特征值;λ1表示y中第一个方差值;λk表示y中第k个方差值;γ1表示x的斜方差矩阵中第一个元素的特征值;γn表示x的斜方差矩阵中第n个元素的特征值。
[0152]
经过计算,η的值为0.85,表示筛选特征的主成分y的方差累积贡献率达到了85%,说明采用主成分分析筛选后的y去代替原来的训练数据对应的特征矩阵x后,不能解释的方差不足15%,没有损失太多信息,便可以把n个特征减少为k个特征,达到降维的目的。
[0153]
2)模型训练
[0154]
将筛选特征输入至机器学习模型中进行训练。输入的数据使用数据集的拆分法中最常被使用的是随机的训练测试拆分法。先前研究发现,机器学习模型在使用大量数据,并以70:30的比例进行训练时,会有更准确的结果。因此,在类似的医学领域中的做法也是将数据分成70%作为训练集,剩下的30%作为测试集。
[0155]
将训练集的数据导入机器学习模型中,对机器学习模型进行训练,获得特征之间的重构关系模型,即得到膳食风险预测模型。其中,机器学习模型包括但不限于前馈神经网络(feedforward neural network,fnn)。
[0156]
以前馈神经网络为例,对训练过程进行说明。
[0157]

构建前馈神经网络
[0158]
前馈神经网络的模型结构如图2所示,该模型由输入层、隐藏层、输出层组合而成。数据y1,y2,y3…
,yk从最左侧的输入层输入,中间层为不直接与输入输出相连的隐藏层,最右侧是输出数据的输出层。层与层之间有连接权重。隐藏层与输入层、输出层之间有连接权重w,权重w和输入数据相乘得z值。权重控制着上层信号对其影响,如果权重为正数,表示更易兴奋,权重为负数,表示该路信号被抑制。隐藏层中有激活函数f(z),可以得到a值。当前神经元将接收到的各个输入值求和,所得的和与神经元的阈值进行比较,接着通过激活函数(activation function),生成输出a。使用的激活函数为先行修正单元(rectified linearunits)中的斜坡函数f(z)=max(0,z),如图3所示。其中,z
[1]1
表示隐藏层中第一个神经元的输入值;a
[1]1
表示隐藏层中第一个神经元的激活函数值;z
[1]2
表示隐藏层中第二个神经元的输入值;a
[1]2
表示隐藏层中第二个神经元的激活函数值;z
[1]3
表示隐藏层中第三个神经元的输入值;a
[1]3
表示隐藏层中第三个神经元的激活函数值;z
[1]4
表示隐藏层中第四个神经元的输入值;a
[1]4
表示隐藏层中第四个神经元的激活函数值;w
[1]11
表示输入层第一神经元与隐藏层第一神经元之间的连接权重;w
[1]21
表示输入层第二神经元与隐藏层第一神经元之间的连接权重;w
[1]34
表示输入层第三神经元与隐藏层第四神经元之间的连接权重;w
[2]11
表示隐藏层第一神经元与输出层第一神经元之间的连接权重;w
[2]21
表示隐藏层第二神经元与输出层第一神经元之间的连接权重;w
[2]31
表示隐藏层第三神经元与输出层第一神经元之间的连接权重;w
[2]41
表示隐藏层第四神经元与输出层第一神经元之间的连接权;z
[2]
表示输出层中神经元的输入值;a
[2]
表示输出层中神经元的激活函数值;y表示输出值,即膳食风险特征。
[0159]
输出层采用激活函数sigmoid,sigmoid常用于二分类问题的概率值处理。
[0160]

训练过程
[0161]
从筛选特征中任取一组特征数据作为样本,将表1至表3的特征数据代入上述前馈神经网络计算得到表4中对应的各预测膳食风险值输出结果,进而计算该输出结果与实际膳食风险值的累积误差e
train
,计算公式为:
[0162][0163]
为单次筛选特征经过输出层的第r次输出结果(实际值),or为单次筛选特征的第r个预测值,m为观测值的总数,p为输出层输出总数(预测总数量)。
[0164]
根据e
train
的结果,利用梯度下降法(以下公式)对前馈神经网络中隐藏层和输出层之间的权值系数进行修正,进而从筛选特征中任取另一组特征数据代入修正后的模型中。修正后的模型为:
[0165][0166]whb
(u)为第u次样本输入至模型时隐藏层中的第h个(由上到下排序)神经元和输出层中第b个神经元之间的权值系数,其中,h表示隐藏层中神经元的序号,b表示输出层中神经元的序号。w
hb
(u+1)为第u+1次样本输入至模型时隐藏层中的第h个(由上到下排序)神经元和输出层中第b个神经元之间的权值系数。为单次训练样本经过输出层的输出结果,o为单次训练样本的预测值,ah为通过隐藏层激活函数的输出值,c为学习速率。
[0167]
遍历筛选特征的所有数据,取累积误差最小时所对应的前馈神经网络为膳食风险预测模型。
[0168]
步骤6模型验证
[0169]
构建膳食风险预测模型后,将从未训练过的测试集中的特征数据输入至膳食风险预测模型中,使模型输出预测膳食风险值的结果,作为预测值;而实际膳食风险值,作为实际值。
[0170]
为了评估模型的表现,收集以上两种数值并计算了膳食风险预测模型的均方根误差值(rootmean square error,rmse),其计算公式为:
[0171][0172]
模型的rmse值,即模型的预测值与实际值之间偏差的平方和预测总数量比值的平方根,能够反映出模型预测的准确性。rmse值越小,表示两者之间的误差越小。rmse值小于10%,表示预测值与实际值有极好的一致性,rmse大于30%表示预测值与实际值偏差大,预测效果不佳。
[0173]
在具体实例中,从200例单纯性肥胖患者中收集了2000000条原始数据。将数据预处理并提取特征数据,输入至不同膳食风险指标的模型中进行分析,得到输出预测膳食风险指标的结果,部份截取数据如图4-图7所示。图4为foodcr进食冲动的模型结果图,其中sex表示特征中的性别;age表示特征中的年龄;bmi表示特征中的身体质量指数;time表示特征中的用餐开始时间;tb30表示特征中的用餐前30分钟的体温;tb0表示特征中的用餐开始时的体温;diff_t20表示餐后20分钟体温与tb0的差值;diff_t40表示餐后40分钟体温与tb0的差值;diff_t60表示餐后60分钟体温与tb0的差值。图5为gap_kcal膳食能量差值的模
型结果图;图6为foodve进食速度的模型结果图;图7为diff_bg120餐后120分钟与用餐开始时之血糖差值的模型结果图。
[0174]
根据所收集的模型输出的预测值or,与实际值进行均方根误差值(rmse)的计算以验证准确性,如图8-图11所示,其中fc为低进食冲动(是/否)、gk为膳食的能量差值(kcal)、fv为进食速度(g/min)、dbg为餐后120分钟与bgb0的差值,图8中o
r_fc
表示fc对应的预测值,表示fc对应的实际值,图9中o
r_gk
表示gk对应的预测值,表示gk对应的实际值,图10中o
r_fv
表示fv对应的预测值,表示fv对应的实际值,图11中o
r_bdg
表示bdg对应的预测值,表示bdg对应的实际值。
[0175]
根据计算结果,机器输出预测膳食风险指标的结果与实际值的rmse分别为0.17、0.11、0.20、0.13。机器学习输出的统计结果中有189人存在风险,实际则为173人有膳食风险,准确率为90.6%,有较好的一致性,证明该模型在预测膳食风险上均具有很好的性能。
[0176]
以上实施例仅用于说明本发明而非对其进行限制,有关领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化,如针对糖尿病患者、痛风患者等人中实施类似的方案,也属于本发明的范畴。
[0177]
本实施例通过机器学习模型,对传感器收集的用户进食全周期的生理参数进行实时分析,以量化监测患者「进食前风险」、「进食中风险」、「进食后风险」,从而实现预测膳食风险等级、辅助实施个体化膳食干预的目的。应用机器学习模型对膳食状况进行个体化分析预测的手段,解决了无法个体化、及时精准预测膳食风险的难题,有助于更高效地进行营养管理。
[0178]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
[0179]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的系统及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

技术特征:


1.一种膳食风险预测系统,其特征在于,包括:数据采集设备和与所述数据采集设备连接的移动终端设备;所述数据采集设备用于采集目标人体的第一数据信息;所述第一数据信息包括:体温数据、心率数据、行为数据和环境温度数据;所述移动终端设备包括处理器,所述处理器包括:信息获取模块,用于获取所述目标人体的相关信息;所述相关信息包括所述第一数据信息和第二数据信息;所述第二数据信息包括:个人信息、饮食模式、日常作息频率、进食冲动时间、进食冲动强度、营养摄入量信息、生化数据和生活作息记录数据;特征提取模块,用于对所述目标人体的相关信息进行特征提取,得到所述目标人体的特征集合;所述特征集合包括:个人特征、生活方式特征以及心率变异性及食物特殊动力学效应特征;所述个人特征包括:个人指标和生化指标;所述生活方式特征包括:设定行为的频率;所述心率变异性及食物特殊动力学效应特征包括:出现进食冲动的心率、用餐前不同时间的心率、用餐开始时的心率、用餐后不同时间的心率与用餐开始时的心率的差值、用餐后不同时段内心率的标准差、用餐后不同时段内心率的变化量、出现进食冲动的心率变异值、用餐前不同时间的心率变异值、用餐开始时的心率变异值、用餐后不同时间的心率变异值与用餐开始时的心率变异值的差值、用餐后不同时段内心率变异值的标准差、用餐后不同时段内心率变异值的变化量、出现进食冲动时的体温、用餐前不同时间的体温、用餐开始时的体温、用餐后不同时间的体温与用餐开始时的体温的差值、用餐后不同时段内体温的标准差和用餐后不同时段内体温的变化量;所述心率变异值是根据对所述心率数据进行分析得到的时域指标和频域指标确定的;风险预测模块,用于将所述目标人体的特征集合输入膳食风险预测模型中,得到所述目标人体的膳食风险特征;所述膳食风险特征包括:进食特征、膳食的能量差值、膳食中各种元素的含量、用餐前不同时间的血糖值、用餐开始时的血糖值、用餐后不同时间的血糖值与用餐开始时的血糖值的差值、用餐后不同时段内血糖值的标准差、用餐后不同时段血糖值的变化量、前一餐的数据、前一餐与当前餐的时间间隔以及进餐后是否肠胃不良;所述膳食风险特征用于确定所述目标人体的膳食风险程度;其中,所述膳食风险预测模型是采用训练数据对机器学习模型进行训练得到的;所述训练数据包括患病类型已知的训练人体的个人特征、生活方式特征、心率变异性及食物特殊动力学效应特征以及膳食风险特征。2.根据权利要求1所述的一种膳食风险预测系统,其特征在于,所述数据采集设备,具体包括:设置在所述目标人体上的人体记录仪和设置在所述移动终端设备内的环境温度计;所述人体记录仪包括心电感应设备、体温计和陀螺仪;所述心电感应设备、所述体温计、所述陀螺仪和所述环境温度计均与所述处理器连接。3.根据权利要求1所述的一种膳食风险预测系统,其特征在于,所述处理器还包括:模型确定模块,用于确定所述膳食风险预测模型;所述模型确定模块,包括:训练数据获取单元,用于获取训练数据;训练单元,用于将所述训练数据输入机器学习模型,以累计误差最小为目标,采用梯度
下降法对所述机器学习模型进行训练,得到训练好的机器学习模型;膳食风险预测模型确定单元,用于将训练好的机器学习模型确定为所述膳食风险预测模型。4.根据权利要求3所述的一种膳食风险预测系统,其特征在于,所述训练单元,具体包括:特征筛选子单元,用于采用主成分分析法对所述训练数据进行数据筛选,得到筛选特征;模型训练子单元,用于将所述筛选特征输入所述机器学习模型,以累计误差最小为目标,采用梯度下降法对所述机器学习模型进行训练,得到训练好的机器学习模型。5.根据权利要求3所述的一种膳食风险预测系统,其特征在于,所述训练单元中的所述机器学习模型为前馈神经网络。6.根据权利要求1所述的一种膳食风险预测系统,其特征在于,所述移动终端设备,还包括:第二数据输入模块,与所述信息获取模块连接,用于将所述第二数据信息输入所述信息获取模块;所述第二数据信息中的所述个人信息、所述饮食模式、所述日常作息频率、所述进食冲动时间和所述进食冲动强度是采用问卷的方式得到的;所述第二数据信息中的所述营养摄入量信息是基于营养成分分析软件得到的;所述第二数据信息中的所述生活作息记录数据是对所述目标人体的生活作息事项和对应的时间进行记录得到的。7.根据权利要求1所述的一种膳食风险预测系统,其特征在于,所述特征提取模块,具体包括:降噪单元,用于对所述目标人体的相关信息进行数据降噪,得到降噪后的数据;特征集合确定单元,用于对所述降噪后的数据进行特征提取,得到所述目标人体的特征集合。8.根据权利要求1所述的一种膳食风险预测系统,其特征在于,所述特征提取模块中的所述个人指标,包括:性别、年龄、教育水平、身高、体重和身体质量指数;所述特征提取模块中的所述生化指标,包括:血压中的舒张压、血压中的收缩压、动脉粥状硬化指数、空腹时的血糖值、血中的胆固醇值、血中的糖化血红蛋白值、血中的脂蛋白值和血中的甘油三酯值。9.根据权利要求1所述的一种膳食风险预测系统,其特征在于,所述风险预测模块中的所述进食特征,包括:餐次、是否夜间进食、是否有进食冲动和进食速度。10.根据权利要求1所述的一种膳食风险预测系统,其特征在于,所述风险预测模块中的所述前一餐的数据,包括:前一餐的血糖指数、前一餐的血糖负荷、前一餐中碳水化合物的含量、前一餐中蛋白质的含量、前一餐中脂肪的含量和前一餐中膳食纤维的含量。

技术总结


本发明公开了一种膳食风险预测系统,涉及膳食风险预测领域,该系统包括:数据采集设备和与数据采集设备连接的移动终端设备;移动终端设备包括处理器,处理器包括:信息获取模块,用于获取目标人体的相关信息;特征提取模块,用于对目标人体的相关信息进行特征提取,得到包括个人特征、生活方式特征以及心率变异性及食物特殊动力学效应特征体的特征集合;风险预测模块,用于将目标人体的特征集合输入膳食风险预测模型中,得到目标人体的膳食风险特征。其中,膳食风险预测模型是采用训练数据对机器学习模型进行训练得到的。本发明能提高预测的准确性,并对用户进食前、中、后的全周期膳食风险进行量化监测,有效预测膳食风险。有效预测膳食风险。有效预测膳食风险。


技术研发人员:

殷俊 孙合庆 何承源 龙志文 何慧敏 许慧霖 张琴秋

受保护的技术使用者:

成都尚医信息科技有限公司

技术研发日:

2022.09.30

技术公布日:

2022/11/25

本文发布于:2024-09-20 17:33:19,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/5639.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   膳食   特征   心率
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议