大数据时代下慢性病防控新模式的研究进展

门外有敲门声大数据时代下慢性病防控新模式的研究进展
随着我国社会经济的发展、城市化进程的不断加快、居民生活行为/方式等的改变,以癌症、高血压等为代表的慢性非传染性疾病(简称慢性病)的患病率逐年升高,慢性病正严重威胁着我国居民的健康[1]。2019年,我国因慢性病死亡人数占总死亡人数的88.5%[2]。纵观全球,慢性病已成为全球性的重大公共卫生问题,全球因慢性病死亡人数占全因死亡人数的60%以上[3]。近年来,信息技术和互联网的飞速发展,使我国医疗卫生领域积累了种类繁多、形式多样的健康'大数据'资源[4]。'大数据时代'的到来,为我国慢性病防控难题的解决提供了新模式、新方法。在信息化快速发展的大背景下,如何利用'大数据'制定出新的信息化慢性病防控方案,以适应居民日益增长的慢性病管理需求,改善日益严峻的慢性病防控形势,已成为当今慢性病管理领域的一大研究热点[5]。本文通过对'大数据'在国内外慢性病防控中的应用情况进行梳理,以期为慢性病防控新模式的开发与深入研究提供参考与依据。
1 '大数据'在慢性病防控中的意义
传统慢性病管理模式主要包括生物医学管理模式、认知行为干预模式和心理动力干预模式,是长久以来医学各领域通过积极探索而形成的有效模式[6]。然而,传统慢性病管理模式仍存
在一定不足:(1)人监测范围受限,监测的危险因素种类少,监测数据的准确性、连续性和完整性难以保证;(2)预防和管理策略多具有通用性,在制定和实施时未能充分考虑个体需求的差异;(3)个体自我管理能力较弱、缺乏慢性病相关知识、依从性较差,导致健康干预效果减弱[6]。而'大数据'的利用成为改变现状、突破'瓶颈'的关键点。
近年来,在数据爆炸式增长的背景下,'大数据'这一术语应运而生。'大数据'的特点可用'3v'概括,即大量(volume)、高速(velocity)和多样(variety);还有一部分学者认为'大数据'具有'5v'特点,即大量(volume)、高速(velocity)、多样(variety)、价值(value)和真实性(veracity)[7,8,9]。在'大数据时代',数据已成为世界各国的基础性战略资源。做好数据治理不仅有助于提高政府的社会治理能力,还有利于提升公共服务水平。此外,'大数据'技术的产生与发展也推动了信息技术的飞速发展。过去的二十年里,组学、可穿戴设备、传感器、人工智能、数字医疗与创新技术取得了巨大的进步,并被应用于精准化、个体化医疗领域[10]。移动健康管理设备可通过人体体征传感器获取个体的健康'大数据',如慢性病特征(心率、血压、血糖等)及生活/行为习惯(吸烟、饮酒、睡眠情况等)等方面的信息,并将其上传至云平台,进而使患者/医务人员能够随时随地对自身/患者的健康状况进行监测,有效地改善了传统慢性病管理模式下,人健康数据可获得性
水平较低、连续性不足和时效性较差等问题[11]。除了可助益个体水平上的慢性病防控外,医疗健康'大数据'的应用还能为体水平上的慢性病防控带来新模式,助力实现慢性病体特征刻画、慢性病发展预测等,进而可促进慢性病并发症风险防范和预警效果、慢性病防治工作水平的提升[12]。随着'大数据'逐步应用于慢性病防治管理领域,国内外许多学者对慢性病防控新模式开展了研究,且相关研究工作已取得了一定的成效。
2 '大数据'在慢性病风险预测中的应用
随着'大数据时代'的到来,'大数据'逐渐成为产学两界共同关注的焦点。作为分析'大数据'价值的关键技术,机器学习技术使研究人员能够更好地分析健康医疗'大数据'复杂多变的内部联系,已被广泛应用于数据挖掘、病因探索等领域,在疾病早期预测与诊断及预后评估中发挥着重要作用[13]。周阳等[14]选取了约20万份居民健康档案,通过机器学习中的逻辑回归、随机森林和支持向量机算法建立了3种高血压风险预测模型,并对3种模型在高血压风险预测中的应用价值进行比较、分析。研究结果显示,基于支持向量机建立的高血压风险预测模型的预测性能最为优异,预测准确率达87%。GUIDA等[15]利用逻辑回归算法构建了基于循环蛋白生物标志物的肺癌风险预测模型。相比于传统基于吸烟情况建立的肺癌风
险预测模型,该模型的灵敏度和特异度均得到明显改善。根据美国预防服务工作组(USPSTF)发布的筛选标准:(1)当总体特异度为0.83时,基于循环蛋白生物标志物、吸烟情况建立的肺癌风险预测模型的灵敏度分别为0.63、0.43;(2)当总体灵敏度为0.42时,基于循环蛋白生物标志物、吸烟情况构建的肺癌风险预测模型的特异度分别为0.95、0.86。REZAEE等[16]通过递归特征消除法(RFE)自动筛选用于预测的最佳变量集(变量集中的变量不仅包括传统危险因素,还包括多种血液生物标志物和合并症),构建了具有良好预测性能和可重复性的异质性心血管疾病风险预测模型,该模型对冠状动脉疾病、卒中的区分能力均处于中等水平(C指数分别为0.794、0.778)。未来仍需要在大样本人中对上述基于生物标志物建立的疾病风险预测模型进行验证和校准。
而在人工智能技术探索的道路上,更多高性能、灵活性更强的机器学习算法被开发出来。WANG等[17]利用纵向监测病例随访队列信息数据库,基于长短时记忆循环神经网络(RNN)开发了一种多疾病风险预测模型,该模型能够较好地预测患者未来发生疾病的风险。我国学者黄旭等[18]采用随机森林、梯度提升决策树和极端梯度提升3种集成学习算法对慢性病进行分类,将多疾病风险预测问题转化为多标签分类问题,并进一步建立了神经网络模型,以实现对多种疾病风险的预测。虽然该方法提高了模型对数据的适应能力、运
氨基酸尿算速度和高维参数寻优速度,但研究者仍需进一步利用不同数据处理方法,构建更为复杂多变的神经网络模型,同时在进行问题转化的过程中也要考虑标签间关联性的问题。此外,在基因测序等技术快速发展的背景下,研究者也尝试将多组学研究引入慢性病风险预测领域。CHOI等[19]考虑了逐步逻辑回归(SLR)等变量选择和预测方法对2型糖尿病风险预测模型性能的影响,以及单核苷酸多态性(SNP)数据集对风险预测效能的影响,发现包含人口统计变量和遗传变量的预测模型与仅包含人口统计变量的预测模型相比,在预测2型糖尿病发生上更准确。MARS等[20]评价了全基因组多基因风险评分(PRS)在冠心病、2型糖尿病等5种慢性病风险预测中的附加价值,并评估了不同PRS水平下个体的终生患病风险及不同PRS水平对疾病发病和风险预测的影响。研究结果显示,与平均PRS水平相比,高PRS可能会导致个体终生患病风险增加21%~38%、疾病发病时间提前4~9年。调整年龄和性别的影响后,PRS还有助于改善模型对2型糖尿病、心房颤动、乳腺癌和前列腺癌的预测价值。除传统的三大组学外,转录组学、表观基因组学等新兴组学的出现也促进了研究者对疾病风险预测的理解[21]。但值得注意的是,多基因、多组学技术在临床中的实际应用效果仍有待进一步研究确认。
疾病风险预测是预防控制慢性病的有效措施之一。近年来,各种算法和模型不断被应用于
林荫道慢性病风险预测领域,多疾病、多基因、多组学研究取得的成果也进一步推动了慢性病风险预测研究的深入开展。但目前,国内外相关风险预测模型中变量的种类较为局限,模型构建时使用的算法较为单一。同时,训练数据集和测试数据集的代表性不足,也可能导致研究结果的论证强度受限。未来在开展慢性病风险预测研究时应注意以下3点:(1)将膳食、睡眠等健康相关因素和生物标志物纳入模型;(2)合理选择建模方法,提高模型的实用价值;(3)利用针对不同地区、人开展的大型队列研究数据对模型进行验证。此外,还应注重对慢性病风险预测模型的转化及推广,进而助力实现慢性病的早期发现、慢性病防控'关口前移'。疾病风险预测模型的开发也为慢性病综合防控平台的搭建奠定了坚实的基础。
3 '大数据'慢性病综合防控平台的建设
截至2020年8月,我国已经建成了488个国家级慢性病综合防控示范区[22]。北京、上海等地均已启动并初步完成了省级卫生信息化平台建设。上海市基于3 000多万份居民电子健康档案数据和100亿条临床诊疗记录,建立了'上海健康云'信息平台,该平台不仅能够为居民提供慢性病管理、预约挂号、预防接种、家庭医生等线上服务,还支持通过个体健康风险南海纪行
评估细化对慢性病患者的分类管理,可更好地为居民提供覆盖全生命周期的慢性病健康服务[23]。徐汇区将营养干预与'互联网+'深度融合,基于糖尿病患者的健康数据研发并启用了'合理营养自评系统'和'营养门诊咨询管理系统',两大系统的应用使糖尿病患者的血糖、血脂水平得到了有效改善,并为系统化的慢性病营养干预模式的建立奠定了基础;闵行区利用居民电子健康档案开展糖尿病等疾病患者的筛查、管理及干预工作,通过采用基于'大数据'构建的、具备自动评分与识别功能的糖尿病筛查评分系统对辖区居民进行糖尿病筛查,目前已使近万名糖尿病前期患者得到了及时,这一措施有效地提高了慢性病的早期发现率、筛查准确率[24]。近年来,浙江省宁波市鄞州区基于'互联网+健康'推出了系列管理工具。2015年搭建了'健康教育云平台',已助力健康教育宣传在全区医疗卫生服务机构实现'全覆盖',并逐步走向家庭;自2016年起,逐步开发和使用的'大数据'平台也为高脂血症、糖尿病及高血压等慢性病的筛查和干预提供了更加科学、精确的依据,使慢性病管理工作的效率及效果得到了明显的提高,全区高脂血症患者规范管理率达到了85.5%[25]。

本文发布于:2024-09-21 18:55:00,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/412984.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:慢性病   预测   风险   数据   模型   疾病   防控
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议