基于空间聚类离散格网的传染病时空扩散预测方法及装置与流程

1.本公开涉及计算机技术领域，尤其涉及基于空间聚类离散格网的传染病时空扩散预测方法及装置。

背景技术：

2.传染病是指由各种病原体引起的能在人和/或动物之间相互传播的一类疾病。通常这种疾病可通过直接接触已感染的个体、患者所污染到的物体、患者的体液及排泄物等进行扩散，也具有空气传播、水源传播、食物传播、接触传播、土壤传播、母婴传播、体液传播等多种传播途径。它的爆发对人类的生命安全、科技文明、经济环境和社会稳定构成了巨大的威胁。
3.近年来，随着科学技术的进步，人们的生活质量和医疗水平都得到了巨大的提升，然而传染病的危害却并没有因此减弱，反而因为污染、战争、生态破坏等原因，病毒的变异速度加快，诸如早年的黑死病、天花、、麻疹、疟疾和近年的埃博拉病毒、流感和sars(severeacute respiratory syndrome)都给全球的公共安全带了巨大的危害。社会生产力的进步使得人类的居住环境越来越密集，发达的自由贸易和先进的交通工具让人们的出行活动越来越方便，但这也给传染病的爆发带来了前所未有的契机。人的聚集性居住与出行活动的日益频繁不仅增加了传染病突发性爆发的可能，还会大大提高传染病的传播能力。综上所述，在大多数传染病面前，人类只能尽可能地减小传染病带来的危害，消灭部分致命的传染病，彻底消灭所有传染病的想法是不现实的。因此，无论是现在还是未来对于传染病的研究都是关乎人类生命健康、社会稳定发展和科技文明进步问题的重点和热点。

技术实现要素：

4.本公开提出了一种疫情预测方法、装置、电子设备及存储介质。
5.根据本公开的一方面，提供了一种疫情预测方法，包括：将疫区划分为n个子区域，其中， n为正整数；根据病例历史数据，以及预设的时间周期，确定疫情爆发点的位置信息；根据所述疫情爆发点的位置信息，以及所述n个子区域之间的空间相关性，在所述n个子区域中确定感染区域；根据所述感染区域的人口数据，确定所述感染区域各时刻的预测病例数量。
6.根据本公开的实施例，根据病例历史数据，以及预设的时间周期，确定疫情爆发点的位置信息，包括：根据所述病例历史数据，确定所述病例历史数据符合的正态分布；根据所述正态分布，确定截止时间点；根据所述截止时间点和所述预设的时间周期，确定目标时间点；根据所述目标时间点，在所述病例历史数据中确定目标病例的活动区域；根据所述活动区域，确定所述疫情爆发点的位置信息。
7.根据本公开的实施例，根据所述疫情爆发点的位置信息，以及所述n个子区域之间的空间相关性，在所述n个子区域中确定感染区域，包括：根据所述子区域之间的距离，确定所述感染区域。
8.根据本公开的实施例，根据所述子区域之间的距离，确定所述感染区域，包括：根据公式确定第j个区域的最小支持度，其中，为第t天出现病例的第i个子区域，为第t+1天出现病例的第j个子区域，为第i个子区域到第j个子区域的距离，p为预设常数；在所述第j个子区域的最小支持度大于或等于最小支持度阈值的情况下，将第j个子区域确定为感染区域。
9.根据本公开的实施例，所述方法还包括：根据公式确定第k个区域的感染程度的置信度，其中，wk为人聚集性权重；在所述第k个区域的感染程度的置信度大于或等于预设的最小置信度阈值的情况下，根据所述病例历史数据，确定第k个区域的病例数量。
10.根据本公开的实施例，所述人聚集性权重根据各子区域的人口数据、夜间灯光数据、路网数据、交通站点数据、人位置数据、患者流调数据、网络舆情数据、社会经济数据、城市poi数据中的至少一种来确定。
11.根据本公开的实施例，根据所述感染区域的人口数据，确定所述感染区域各时刻的预测病例数量，包括：
12.根据公式组根据公式组根据公式组综合确定所述感染区域各时刻的预测病例数量，其中，s 为易感染人数量，e为潜伏人数量、a为无症状感染人数量、c为隔离人数量，r为移除人数量，i为预测病例数量，s、e、a、c、r、i的下角标表示时刻，β为有效感染率，σ为潜伏状态转化为感染状态的概率；γ为感染人的康复率；d为死亡率；θ为无症状感染人的检测率，为有症状感染人的检测率，ν为无症状感染者的比例，η为治愈后再次被感染的比例。
13.根据本公开的一方面，提供了一种疫情预测装置，包括：划分模块，用于将疫区划分为n 个子区域，其中，n为正整数；爆发点确定模块，用于根据病例历史数据，以及预设的时间周期，确定疫情爆发点的位置信息；感染区域确定模块，用于根据所述疫情爆发点的位置信息，以及所述n个子区域之间的空间相关性，在所述n个子区域中确定感染区域；预测模块，用于根据所述感染区域的人口数据，确定所述感染区域各时刻的预测病例数量。
14.根据本公开的实施例，所述爆发点确定模块进一步用于：根据所述病例历史数据，确定所述病例历史数据符合的正态分布；根据所述正态分布，确定截止时间点；根据所述截止时间点和所述预设的时间周期，确定目标时间点；根据所述目标时间点，在所述病例历史数据中确定目标病例的活动区域；根据所述活动区域，确定所述疫情爆发点的位置信息。
15.根据本公开的实施例，所述感染区域确定模块进一步用于：根据所述子区域之间
的距离，确定所述感染区域。
16.根据本公开的实施例，所述感染区域确定模块进一步用于：根据公式确定第j个区域的最小支持度，其中，为第t天出现病例的第i个子区域，为第t+1天出现病例的第j个子区域，为第i个子区域到第j个子区域的距离，p为预设常数；在所述第j个子区域的最小支持度大于或等于最小支持度阈值的情况下，将第j个子区域确定为感染区域。
17.根据本公开的实施例，所述装置还包括：置信度模块，用于根据公式确定第k个区域的感染程度的置信度，其中，wk为人聚集性权重；在所述第k个区域的感染程度的置信度大于或等于预设的最小置信度阈值的情况下，根据所述病例历史数据，确定第k个区域的病例数量。
18.根据本公开的实施例，所述人聚集性权重根据各子区域的人口数据、夜间灯光数据、路网数据、交通站点数据、人位置数据、患者流调数据、网络舆情数据、社会经济数据、城市poi数据中的至少一种来确定。
19.根据本公开的实施例，所述预测模块进一步用于：根据公式组：根据公式组
20.综合确定所述感染区域各时刻的预测病例数量，其中，s为易感染人数量，e为潜伏人数量、a为无症状感染人数量、c为隔离人数量，r为移除人数量，i为预测病例数量，s、e、a、c、r、i 的下角标表示时刻，β为有效感染率，σ为潜伏状态转化为感染状态的概率；γ为感染人的康复率；d为死亡率；θ为无症状感染人的检测率，为有症状感染人的检测率，ν为无症状感染者的比例，η为治愈后再次被感染的比例。
21.根据本公开的一方面，提供了一种疫情预测设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为调用所述存储器存储的指令，以执行上述方法。
22.根据本公开的一方面，提供了一种计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现上述方法。
23.根据本公开的疫情预测方法，可在疫区内的各个子区域中进行预测，分别确定个各自区域的疫情状况，为精准化防控提供数据基础，并且，可考虑区域之间的互相影响，区域内的影响，以及人口数据、夜间灯光数据、路网数据、交通站点数据、人位置数据、患者流调数据、网络舆情数据、社会经济数据、城市poi数据等多种数据的影响，进一步提升预测的准确性。
24.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，而非
限制本公开。根据下面参考附图对示例性实施例的详细说明，本公开的其它特征及方面将变得清楚。
附图说明
25.此处的附图被并入说明书中并构成本说明书的一部分，这些附图示出了符合本公开的实施例，并与说明书一起用于说明本公开的技术方案。
26.图1为根据本公开的实施例的疫情预测方法的流程图；
27.图2为根据本公开的实施例的子区域的示意图；
28.图3为根据本公开的实施例的空间相关性的示意图；
29.图4为根据本公开的实施例的预测病例数量的示意图；
30.图5为根据本公开的实施例的疫情预测装置的框图；
31.图6是根据一示例性实施例示出的一种疫情预测设备的框图；
32.图7是根据一示例性实施例示出的一种疫情预测设备的框图。
具体实施方式
33.以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。
34.在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
35.本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。另外，本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合，例如，包括 a、b、c中的至少一种，可以表示包括从a、b和c构成的集合中选择的任意一个或多个元素。
36.另外，为了更好地说明本公开，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本公开同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本公开的主旨。
37.传染病的防控关乎人类生存安全，因此传染病研究的意义不言而喻。历史经验表明，传染病绝对不会只出现一次。面对疫情和未来某一未知病毒的爆发，人类该如何有效地采取人为防控措施使其危害降到最低，同时所花费的代价也最小？传染病流行的危害有多大？会持续多长时间？哪些地方的人需要重点防控？有限的医疗资源如何进行优化配置？这些问题都迫切需要科学来解决。由于传染病的病理学机理非常复杂，尤其对于新出现的传染病，通常很难在短时间内得到其病理学上的根本解决方法，即最有效的疫苗是很难获得的。传染病传播的最大的特点是它需要一定的传播途径才能在人中实现扩散，如果能在传染病暴发的初期有效切断其传播途径便可以实现传染病的有效防控，使其危害降到最低，例如，及早发现并隔离感染者、严密监控易感人、限制人活动、物理隔离、禁止在公共场所聚集、戴口罩、检测并隔离感染患者、勤洗手、保持室内通风、主动与发热病人保持安全距离等。传染病的科学防控是一个复杂的系统性课题，由于每个地区的疫情现状、城市住宅分布、人们的生活方式、社会经济发展等社会地理环境不同，各地区所需要采取的非药物
措施、实施的范围、实施的力度、介入的时间等都可能是不同的。同时，不同防控措施的实施效果及所付出的代价也是不同的，人们希望不仅能够实现传染病的有效防控，使危害尽量降低，而且代价也要是最低的。这就需要人们充分了解和认识传染病的传染源、传染病的发展趋势、传播途径、时空扩散模式、人的分布与活动状况、病毒的危害潜力、不同人的差异性及传染病的时空扩散特征等方面的信息，并仿真模拟不同防控措施对抑制疫情传播的潜在效果。它可以为全球疫情的科学防控和施策的精准实施提供重要的信息支撑。
38.然而，相关技术中，更多是在省市级别甚至以上的尺度进行研究，缺乏对城市内部较精细粒度上空间传播演变的模拟。基于代理的模型虽然是小城市(如学校和公司周边)的模拟，但是它通常是基于个体在一定空间内随机移动进行仿真，仅融入了部分城市和属性人移动特征，仍缺乏城市地理时空大数据的融入，城市分布和人流动的形式与实际差别仍然很大。在突发公共卫生安全事件中，详细的人观测数据通常是难以获得的，如人的空间交互数据、患者轨迹数据和居民出行活动数据，往往会出现缺失或覆盖不全的问题。虽然相关技术使用了多源数据来分析疫情的传播，但由于数据的完整性和尺度，仍属于小样本下的观察和推理。此外，目前的疫情相关资料中，大部分只记录了患者首次出现症状的地点，对患者被感染的地点无法获得，这表明当前与流行病相关的数据存在患者轨迹回溯的问题。因此，如何建立符合实际传染病传播的监测策略和科学方法是当前突发公共卫生安全事件的关键问题。
39.传染病的传播具有明显的时空演变规律，它不仅反应了健康人经过传播途径受到感染并在自身免疫或外界作用下恢复或因感染死亡而退出传播的过程，又体现了易感染人与感染人的空间交互特征及其空间分布信息。掌握更多的传染病传播扩散规律，模拟并揭示其时空发展趋势可以识别病毒的传播途径，发现高感染区域，这对传染病的防控具有非常重要的意义。受到数据尺度和精度的影响，详细和完备的观测数据通常是很难获得的。目前关于传染病的时空演变模型通常都是针对大尺度范围的地区，如省市和国家。或者对于小范围地区(如城市内部)采用社会网络方法，基于个体的移动仿真人活动以及传染病在人中感染传播的情况，但是这种方式缺少与真实城市场景的融合，对实际防控措施的指导意义有限。受到详细人观测数据和科学技术的限制，长久以来，有关传染病的时空传播问题一直是流行病学研究的重点和难点。传统的动力学模型及其改进模型通常将疫区作为一个整体，不考虑内部的地域差异和人差异，这也使得传染病模型往往只能表达传染病的时序变化过程，最多融入了相应的人为干预措施。微分方程的形式缺乏空间信息的表达，从而使得模型承载的属性信息有限，较难得到传染病空间扩散方面的信息。实际的传染病传播受到了主观因素 (如防控措施和人流动等)与客观因素(如地理环境和人分布等)的综合影响，传染病在时空上传播扩散的规律就蕴含在这些与传染病相关的时空大数据当中。因此，在详细数据缺失的情况下，如何在基于时序过程的动力学模型中采用定量方法同时考虑空间信息和人为防控措施的影响构建更贴合实际传染病时空扩散过程的科学方法和观测策略是当前公共卫生和安全应急的重点和难点。
40.针对上述问题，本公开利用数学建模方法和现代空间分析技术定量研究传染病的时空分布、地域差异性、传播过程等信息，并基于获取的传染病信息对传染病的时空扩散过程进行仿真模拟。其中，传染病的时空传播模式、传播途径、传播能力等物理规律对制定疫情防控措施有着重要的指导意义。
41.图1为根据本公开的实施例的疫情预测方法的流程图，如图1所示，所示方法包括：
42.s1：将疫区划分为n个子区域，其中，n为正整数；
43.s2：根据病例历史数据，以及预设的时间周期，确定疫情爆发点的位置信息；
44.s3：根据所述疫情爆发点的位置信息，以及所述n个子区域之间的空间相关性，在所述n 个子区域中确定感染区域；
45.s4：根据所述感染区域的人口数据，确定所述感染区域各时刻的预测病例数量。
46.根据本公开的实施例，在步骤s1中，可将疫区划分为n个子区域，上述疫区可包括省级或城市级的疫区，子划分为n个子区域后，则可利用疫区的病例历史数据，以及针对城市级或省级的预测模型预测的数据，来进一步细化数据，分析各个子区域的疫情传播情况。
47.图2为根据本公开的实施例的子区域的示意图，如图2所示，假设研究区a(疫区)由n个互不重叠的区域ai(i＝1,2,3,
…
,n)组成，在相关技术中，如图2左侧示图，可将研究区a的人分为易感染人s、潜伏人e、感染人i和移出人r。设t时刻(例如，第t天)这四种人的数量分别为st、et、it和rt，相关技术中的传染病模型将疫区作为一个整体，所有人均匀随机地混合在一起。而传染病的时空传播问题是研究当子区域出现传染病感染患者时，因此，可在各个分区中，采用数学建模的方法模拟和表达真实的传染病时空传播过程，并得到各子区域任意时刻的易感染人数量sit、潜伏人数量eit、感染人数量iit和移除人数量rit。
48.根据本公开的实施例，大多数传染病在人中的广泛扩散都需要近距离接触的传播途径。由于人的居住、工作、生活范围、周围环境等地理空间对象是存在时空相关性的，受到这些时空相关性因素制约的传染病传播也存在着空间相关性，因此，传染病的传播在地理空间上具有很强的扩散效应。
49.图3为根据本公开的实施例的空间相关性的示意图，如图3所示，t时刻(例如，第t天)疫区中某子区域ai的当前感染状态会影响周围区域aj、ak、ag和ah第t+1时刻的感染人数，同时aj、ak、ag和ah地区的感染状态也会继续影响ai下一时刻的感染状态。在传染病传播的过程中，各子区域之间相互影响，传染病正是通过子区域之间的交互作用由初始的感染区域向其他地区扩散。针对t时刻某一子区域ai的感染人数不仅受到了自身区域内人与周围区域交互的影响和其它区域内人与该区域的交互影响，还受到了区域内人的自我交互影响。因而，该区域t时刻的感染人数如以下公式(1)所示，函数f为子区域之间的交互作用。传染病的时空建模可定量有效地描述传染病在各子区域的传播能力，即，描述函数f。
50.i
i,t
＝f
ijij,t-1
+f
jiii,t-1
+f
iiii,t-1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
51.根据本公开的实施例，首先可确定疫情发生的起始位置，即，疫情爆发点的位置信息。在步骤s2中，该步骤可包括：根据所述病例历史数据，确定所述病例历史数据符合的正态分布；根据所述正态分布，确定截止时间点；根据所述截止时间点和所述预设的时间周期，确定目标时间点；根据所述目标时间点，在所述病例历史数据中确定目标病例的活动区域；根据所述活动区域，确定所述疫情爆发点的位置信息。
52.传染病早期爆发点的推断，对采取疫情防控措施，且最大程度的控制疫情的传播至关重要。由于人的流动性和医疗检测的滞后性，传染病开始传播的起始点，即第一例病例被检测出来的位置，不能准确的代表造成此次疫情大规模扩散的爆发点(即，疫情的起始
位置)。因此，为了能够更加准确的推断出爆发传染病城市的传染病爆发点，首先，根据疫情城市每日新增病例，运用传染病动力学模型对当地疫情每天新增感染人数进行预测，获取对该城市疫情的预测数据(例如，基于当前已获取的病例历史数据，预测未来几日的病例数据)，为爆发点推估和疫情时空扩散提供数据基础；其次，通过分析实际疫情数据和预测疫情数据，假设每天新增的感染人数曲线符合统计学中的正态分布，计算预测数据的平均值μ和标准差σ，即，使实际疫情数据和预测疫情数据的曲线，与正态分布曲线拟合，并确定正态分布曲线的平均值μ和标准差σ；然后，根据3σ准则对影响此次疫情走向的截止时间点(t0＝μ-3σ，向上取整)进行划分；根据病毒潜伏周期(预设的时间周期，例如，14天)来划定时间窗口。选取t0前14天作为目标时间点(若不足14天，按实际天数计算)，并获取的患者在目标时间点之后的流调数据，并对该数据进行空间定位，获取其地理坐标，即，获取目标病例的活动区域。根据疫情空间扩散的特点和人日常活动范围，早期疫情爆发点附近会出现较多的感染病例，且一处感染很大程度将导致周围另一处的感染。因此，根据上述特点，选取density-basedspatial clustering of applications with noise(dbscan)聚类方法，按照人日常活动范围和感染区域相关性，设置邻域半径为1000m，最小邻域点数为1，对患者流调数据建立空间上的关联性。选取聚类后较大的数据集，对该数据集进行求重心处理，用该重心来模拟本轮疫情的爆发点，即，获得疫情爆发点的位置信息。
53.根据本公开的实施例，在获得疫情爆发点的位置信息后，可确定受疫情爆发点影响的感染区域。步骤s3可包括：根据所述子区域之间的距离，确定所述感染区域。
54.传染病的扩散需要一定的传播途径才能实现，传染病主要是人与人的近距离接触导致的。由于人们的生活出行等地理对象及周围环境是时空相关性的，感染者的空间分布也不是完全独立的随机分布，而是存在一定的时空聚集效应，且受到多种自然社会因素的影响，如人的出行方式、城市设施和医院的空间分布。传染病的时空扩散模型就是用于定量描述已被感染人的空间分布位置和不同地区的感染人数量以及其时空扩散模式。
55.根据本公开的实施例，地区和病毒种类的差异使得传染病的时空传播模式、传播途径和传播能力存在一定的差异，但其传播过程通常是从与传播途经空间邻近的地方出发，逐步向周围地区扩散(无人为干预的自由传播状态)。当疫区的人口流动没有被完全禁锢时，某个子区域某时刻新增的感染数量不仅受所在区域前面时间内患者数量的影响，同时还受到了前面时间周围区域感染者数量的影响。假设疫区a被划分成n个子区域，其中，为第t天某一被感染的区域，则定义区域i下一时刻感染其他区域的最小支持度如以下公式(2)所示，
[0056][0057]
根据本公开的实施例，根据所述子区域之间的距离，确定所述感染区域，包括：根据公式(2)，确定第j个区域的最小支持度，其中，为第t天出现病例的第i个子区域，为第t+1 天出现病例的第j个子区域，为第i个子区域到第j个子区域的距离，p为预设常数；在所述第 j个子区域的最小支持度大于或等于最小支持度阈值的情况下，将第j个子区域确定为感染区域。
[0058]
根据本公开的实施例，为下一时刻与区域强相关的区域，为区域i到区域j的距离， p为任意常数，例如，2。由传染病近距离接触的空间传播模式可知感染区域ai的患者最有可能与周围8个区域内的人频繁接触并感染该区域。因此，定义最小支持度阈值为人们日常生活出行的平均距离的-p次幂，如图中圆形区域，将平均距离带入公式(2)，可确定最小支持度阈值。进一步地，利用子区域与ai的距离，通过上述公式(2)确定子区域的最小支持度，如果大于或等于最小支持度阈值，则该子区域为频繁交互的空间集合，即为下一时刻新增的感染区域。该半径的数值参考基于居民生活出行特征的日常生活单元尺度研究分析结果，从而便于计算对于未被完全感染的网格视为感染网格。同时，在引入患者的流调数据和精细化的人员空间迁徙数据，可以扩展各区域的交互距离来实现由工作、旅游和访亲导致的较长远距离的跳变扩散情况
[0059]
根据本公开的实施例，在确定疫情爆发点以及受爆发点影响的感染区域后，还可确定每个感染区域中的病例数量，即，基于疫情爆发时刻的病例历史数据，将病例数分配至各个感染区域中，进而还可基于感染区域之间的相互影响以及感染区域内的自我影响，迭代计算每个时刻(例如，每天)中各子区域的预测病例数量。
[0060]
根据本公开的实施例，感染者在空间上是由多个离散的点组成，受地理空间因素制约的传染病传播也存在较强的空间相关性特征。但是在可能被感染的区域集合中，也会受到人活动、交通便利、生活服务设施分布等因素的影响导致感染程度不同或者并未被感染，因此，对于满足上述最小支持度得到的新增感染区域为新增的疑似感染区域。假设由感染区域影响的新增疑似感染区域为由于传染病的传播主要是因为人传人所致，因此，传染病在不同地区的传播程度主要是由该地区人活动的聚集程度决定。设各新增疑似区域的人聚集性权重为wk，则区域k感染程度的置信度如以下公式(3)所示：
[0061][0062]
根据本公开的实施例，所述方法还包括：根据公式(3)，确定第k个区域的感染程度的置信度，其中，wk为人聚集性权重；在所述第k个区域的感染程度的置信度大于或等于预设的最小置信度阈值的情况下，根据所述病例历史数据，确定第k个区域的病例数量。
[0063]
根据本公开的实施例，上述置信度可以表达各子区域之间人的空间交互作用，即传染病在这些地区传播程度的概率。在传染病的传播过程中，每天新增的感染人数总是有先增后减的时序变化过程，可以依据此概率将下一时刻所产生的总新增感染人数分配到对应的感染区域中。同时，假设传染病的传播事件符合正态分布，根据统计学中正态分布的3σ准则，传染病的传播更有可能发生在中间概率较大的区间。因此，选择新增疑似区域中聚集性权重的置信下区间作为最小置信度阈值，满足最小置信度阈值的区域才会被分配感染人数，成为实际感染区域，且分配人数按照上述公式(3)中的权重来确定。各子区域中人数均以整数表示，不足1的网格将视为未被感染的网格，同时将该区域不足1的人数传递给下一网格，保证总新增感染人数的正确性(即，各感染区域中分配的总病例数等于病例历史数据中该日的新增病例数)。
[0064]
根据本公开的实施例，上述权重为wk可基于以下方式确定：人生活出行的聚集
性特征可用于量化不同地理区域人的时空交互作用。由于空间异质性下各地区感染程度的不同，该特征可以为传染病的时空扩散轨迹和传播程度提供依据。随着城市化和生产力的发展，居民的生活出行方式发生了重大变化，按居民需求种类、出行方式和需求层次建设的公共设施服务正朝向“市级-居住区-居住小区”等级进行划分和配置。人们的居住、工作、活动范围及周围环境等地理对象是存在空间相关性的，例如，人们密集聚集性的场所通常为饭店、地铁、公交车、商场、游乐园等一些公共设施区域。因此，人的聚集性特征也蕴含在相应的地理时空数据中。
[0065]
所述人聚集性权重根据各子区域的人口数据、夜间灯光数据、路网数据、交通站点数据、人位置数据、患者流调数据、网络舆情数据、社会经济数据、城市poi数据中的至少一种来确定。
[0066]
根据本公开的实施例，为了充分反映人员在不同区域的密接聚集状态，利用人口数据、夜间灯光数据、路网数据、交通站点数据、人位置数据、患者流调数据、网络舆情数据、社会经济数据、城市poi数据中的至少一种等进行核密度分析，以描述各数据反映下人居住、出行和活动的密集特征。然后，通过层次权重分析法(analytic hierarchy process,ahp)将各因子进行空间叠加分析，获得人出行活动的空间聚集性权重，并以此描述人在不同区域活动的时空生活行为特征。最后，以该权重为基础构建传染病传播的空间权重矩阵，将下一时刻产生的感染人数分配到对应的格网中，进而模拟下一时刻各子区域中疫情的传播状态。
[0067]
根据本公开的实施例，在步骤s4中，在获得上述感染区域以及感染区域中分配的病例数量后，可根据感染区域中的人口数据，确定各感染区域在各市可的预测病例数量。
[0068]
图4为根据本公开的实施例的预测病例数量的示意图，如图4所示，传染病动力学模型将人之间的接触感染问题转化为数学微分方程进行表达。传染病模型使用的前提通常是不考虑人口的迁入迁出，同时传染病模型是一个正向的人移动，即，由易感染人s转化到移除人r之后不会返回，因为普遍认识是死亡和获得抗体的人不会再被感染。然而，疫情并不适用于相关技术中的传染病模型。相关技术中的传染病模型无法适应于“长时序”、“多波峰”的传染病预测，因为在长时间的疫情状态下，由于传染病模型是单向转化，易感染人数会不断的减少，康复和死亡的人数会越来越多，最终将出现全部变为移除人而无健康人可以被感染情况。因此，可对相关技术中的传染病模型进行改进，使传染病模型包括循环步骤。将人划分为易感染人s、潜伏人e、无症状感染人a、有症状感染人i，隔离人c 和移除人r。在疫情爆发的初期，除了一个或几个迁入型感染者外，其余全是易感染者，当易感染人与感染者有效接触后不会立即表现出症状，称为潜伏人，一段潜伏期后，一部分受到感染的人会出现临床症状，变为感染人，剩下的潜伏人依然不会表现出症状但已经具备传染性，称为无症状感染人；感染者(包括无症状者和症状感染者)会有两种方式退出传播系统：一种是被检测而隔离，这种人称为被检测的感染人；另一种方式是通过免疫、和死亡，他们又被称为移除人(包括感染人和被检测隔离的人)。康复人中又会因为自身免疫系统、疫苗的功效、病毒变异等原因再次被感染，这可以实现一个闭环的流行病学动力学传播机制从而适应长时间的传染病预测。
[0069]
在示例中，可通过以下公式组来确定某子区域中各时刻(各天)的预测病例数量：
[0070][0071][0072][0073][0074][0075][0076]
根据本公开的实施例，步骤s4可包括：根据以上公式组，综合确定所述感染区域各时刻的预测病例数量，其中，s为易感染人数量，e为潜伏人数量、a为无症状感染人数量、c 为隔离人数量，r为移除人数量，i为预测病例数量，s、e、a、c、r、i的下角标表示时刻(例如，天数)，β为有效感染率，σ为潜伏状态转化为感染状态的概率；γ为感染人的康复率；d为死亡率；θ为无症状感染人的检测率，为有症状感染人的检测率，ν为无症状感染者的比例，η为治愈后再次被感染的比例。
[0077]
在示例中，β的范围为0～1，例如，0.5，ν的范围为0～1，例如，0.5，θ和可基于病例历史数据进行拟合估计，σ的范围为1/14～1/3，例如，1/5.2，γc的范围为1/30～1/3，例如，1/15，γa和γi的范围为1/30～1/3，例如，0.14，dc和di的范围为0.001～0.1，例如，0.015。本公开对上述参数的具体取值不做限制。
[0078]
根据本公开的实施例，在某个区域给定感染病例数量的情况下，可基于上述公式组，预测其他各时刻(例如，其他各天)的预测病例数量。同样地，可基于相同方式，预测每个感染区域在各时刻(例如，各天)的预测病例数量。
[0079]
根据本公开的疫情预测方法，可在疫区内的各个子区域中进行预测，分别确定个各自区域的疫情状况，为精准化防控提供数据基础，并且，可考虑区域之间的互相影响，区域内的影响，以及人口数据、夜间灯光数据、路网数据、交通站点数据、人位置数据、患者流调数据、网络舆情数据、社会经济数据、城市poi数据等多种数据的影响，进一步提升预测的准确性。
[0080]
可以理解，本公开提及的上述各个方法实施例，在不违背原理逻辑的情况下，均可以彼此相互结合形成结合后的实施例，限于篇幅，本公开不再赘述。本领域技术人员可以理解，在具体实施方式的上述方法中，各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
[0081]
此外，本公开还提供了疫情预测装置、电子设备、计算机可读存储介质、程序，上述均可用来实现本公开提供的任一种多孔介质压力损失确定方法，相应技术方案和描述和参见方法部分的相应记载，不再赘述。
[0082]
图5为根据本公开的实施例的疫情预测装置的框图，如图5所示，所述装置包括：划分模块11，用于将疫区划分为n个子区域，其中，n为正整数；爆发点确定模块12，用于根据病
例历史数据，以及预设的时间周期，确定疫情爆发点的位置信息；感染区域确定模块13，用于根据所述疫情爆发点的位置信息，以及所述n个子区域之间的空间相关性，在所述n个子区域中确定感染区域；预测模块14，用于根据所述感染区域的人口数据，确定所述感染区域各时刻的预测病例数量。
[0083]
根据本公开的实施例，所述爆发点确定模块进一步用于：根据所述病例历史数据，确定所述病例历史数据符合的正态分布；根据所述正态分布，确定截止时间点；根据所述截止时间点和所述预设的时间周期，确定目标时间点；根据所述目标时间点，在所述病例历史数据中确定目标病例的活动区域；根据所述活动区域，确定所述疫情爆发点的位置信息。
[0084]
根据本公开的实施例，所述感染区域确定模块进一步用于：根据所述子区域之间的距离，确定所述感染区域。
[0085]
根据本公开的实施例，所述感染区域确定模块进一步用于：根据公式确定第j个区域的最小支持度，其中，为第t天出现病例的第i个子区域，为第t+1天出现病例的第j个子区域，为第i个子区域到第j个子区域的距离，p为预设常数；在所述第j个子区域的最小支持度大于或等于最小支持度阈值的情况下，将第j个子区域确定为感染区域。
[0086]
根据本公开的实施例，所述装置还包括：置信度模块，用于根据公式确定第k个区域的感染程度的置信度，其中，wk为人聚集性权重；在所述第k个区域的感染程度的置信度大于或等于预设的最小置信度阈值的情况下，根据所述病例历史数据，确定第k个区域的病例数量。
[0087]
根据本公开的实施例，所述人聚集性权重根据各子区域的人口数据、夜间灯光数据、路网数据、交通站点数据、人位置数据、患者流调数据、网络舆情数据、社会经济数据、城市poi数据中的至少一种来确定。
[0088]
根据本公开的实施例，所述预测模块进一步用于：根据公式组：根据公式组：根据公式组综合确定所述感染区域各时刻的预测病例数量，其中，s为易感染人数量，e为潜伏人数量、a为无症状感染人数量、c为隔离人数量，r为移除人数量，i为预测病例数量，s、e、a、c、r、i 的下角标表示时刻，β为有效感染率，σ为潜伏状态转化为感染状态的概率；γ为感染人的康复率；d为死亡率；θ为无症状感染人的检测率，为有症状感染人的检测率，ν为无症状感染者的比例，η为治愈后再次被感染的比例。
[0089]
在一些实施例中，本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法，其具体实现可以参照上文方法实施例的描述，为了简洁，这
里不再赘述。
[0090]
本公开实施例还提出一种计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是非易失性计算机可读存储介质。
[0091]
本公开实施例还提出一种疫情预测设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为调用所述存储器存储的指令，以执行上述方法。
[0092]
本公开实施例还提供了一种计算机程序产品，包括计算机可读代码，当计算机可读代码在设备上运行时，设备中的处理器执行用于实现如上任一实施例提供的疫情预测方法的指令。
[0093]
本公开实施例还提供了另一种计算机程序产品，用于存储计算机可读指令，指令被执行时使得计算机执行上述任一实施例提供的多孔介质压力损失确定方法的操作。
[0094]
疫情预测设备可以被提供为终端、服务器或其它形态的设备。
[0095]
图6是根据一示例性实施例示出的一种疫情预测设备的框图；如图所示，所述设备包括以下一个或多个组件：处理组件1502，存储器1504，电源组件1506，多媒体组件1508，音频组件1510，输入/输出(i/o)的接口1512，传感器组件1514，以及通信组件1516。
[0096]
处理组件1502通常控制设备1500的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件1502可以包括一个或多个处理器1520来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件1502可以包括一个或多个模块，便于处理组件1502和其他组件之间的交互。例如，处理组件1502可以包括多媒体模块，以方便多媒体组件1508和处理组件1502之间的交互。
[0097]
存储器1504被配置为存储各种类型的数据以支持在设备1500的操作。这些数据的示例包括用于在设备1500上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器1504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(sram)，电可擦除可编程只读存储器(eeprom)，可擦除可编程只读存储器(eprom)，可编程只读存储器(prom)，只读存储器(rom)，磁存储器，快闪存储器，磁盘或光盘。
[0098]
电源组件1506为设备1500的各种组件提供电力。电源组件1506可以包括电源管理系统，一个或多个电源，及其他与为设备1500生成、管理和分配电力相关联的组件。
[0099]
多媒体组件1508包括在设备1500和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件1508包括一个前置摄像头和/或后置摄像头。当设备1500处于操作模式，如拍摄模式或视频模式时，前置摄像头和/ 或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
[0100]
音频组件1510被配置为输出和/或输入音频信号。例如，音频组件1510包括一个麦克风 (mic)，当设备1500处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1504或经由通
信组件1516 发送。在一些实施例中，音频组件1510还包括一个扬声器，用于输出音频信号。
[0101]
i/o接口1512为处理组件1502和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。
[0102]
传感器组件1514包括一个或多个传感器，用于为设备1500提供各个方面的状态评估。例如，传感器组件1514可以检测到设备1500的打开/关闭状态，组件的相对定位，例如组件为设备1500的显示器和小键盘，传感器组件1514还可以检测设备1500或设备1500一个组件的位置改变，用户与设备1500接触的存在或不存在，设备1500方位或加速/减速和设备1500的温度变化。传感器组件1514可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1514还可以包括光传感器，如cmos或ccd图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件1514还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。
[0103]
通信组件1516被配置为便于设备1500和其他设备之间有线或无线方式的通信。设备1500 可以接入基于通信标准的无线网络，如wifi、2g、3g、4g、5g或它们的组合、或对讲网络。在一个示例性实施例中，通信组件1516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，通信组件1516还包括近场通信(nfc)模块，以促进短程通信。例如，在nfc模块可基于射频识别(rfid)技术，红外数据协会(irda)技术，超宽带 (uwb)技术，蓝牙(bt)技术和其他技术来实现。
[0104]
在示例性实施例中，设备1500可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子组件实现，用于执行上述方法。
[0105]
在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器1504，上述指令可由设备1500的处理器1520执行以完成上述方法。例如，非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
[0106]
图7是根据一示例性实施例示出的一种疫情预测设备的框图。例如，所述设备1600可以被提供为一服务器。设备1600包括处理组件1602，其进一步包括一个或多个处理器，以及由存储器1603所代表的存储器资源，用于存储可由处理组件1602的执行的指令，例如应用程序。存储器1603中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件1602被配置为执行指令，以执行上述方法。
[0107]
设备1600还可以包括一个电源组件1606被配置为执行设备1600的电源管理，一个有线或无线网络接口1605被配置为将设备1600连接到网络，和一个输入输出(i/o)接口1608。设备1600 可以操作基于存储在存储器1603的操作系统，例如windows servertm，mac os xtm， unixtm，linuxtm，freebsdtm或类似。
[0108]
一种非临时性计算机可读存储介质，例如，非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等；当存储介质中的指令由设备1500或设备1600的处理器执行时，使得设备1500或设备1600能够执行所述方法。
[0109]
以上已经描述了本公开的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技
术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

技术特征：

1.一种基于空间聚类离散格网的传染病时空扩散预测方法，其特征在于，包括：将疫区划分为n个子区域，其中，n为正整数；根据病例历史数据，以及预设的时间周期，通过拟合预测，确定疫情曲线以及疫情爆发点的位置信息；根据所述疫情曲线以及疫情爆发点的位置信息，以及所述n个子区域之间的空间相关性，通过疫情时空扩散模拟以及爆发点推估在所述n个子区域中确定感染区域，其中，所述疫情时空扩散模拟包括离散格网、聚集性分析以及频繁模式中至少一种，所述爆发点推估包括3sigma准则以及空间聚类中至少一种；根据所述感染区域的人口数据，确定所述感染区域各时刻的预测病例数量。2.根据权利要求1所述的方法，其特征在于，根据病例历史数据，以及预设的时间周期，通过拟合预测，确定疫情曲线以及疫情爆发点的位置信息，包括：根据所述病例历史数据，确定所述病例历史数据符合的正态分布；根据所述正态分布，确定截止时间点；根据所述截止时间点和所述预设的时间周期，确定目标时间点；根据所述目标时间点，在所述病例历史数据中确定目标病例的活动区域；根据所述活动区域，确定所述疫情爆发点的位置信息。3.根据权利要求1所述的方法，其特征在于，根据所述疫情曲线以及疫情爆发点的位置信息，以及所述n个子区域之间的空间相关性，通过疫情时空扩散模拟以及爆发点推估在所述n个子区域中确定感染区域，包括：根据所述子区域之间的距离，确定所述感染区域。4.根据权利要求3所述的方法，其特征在于，根据所述子区域之间的距离，确定所述感染区域，包括：根据公式确定第j个区域的最小支持度，其中，为第t天出现病例的第i个子区域，为第t+1天出现病例的第j个子区域，为第i个子区域到第j个子区域的距离，p为预设常数；在所述第j个子区域的最小支持度大于或等于最小支持度阈值的情况下，将第j个子区域确定为感染区域。5.根据权利要求1所述的方法，其特征在于，所述方法还包括：根据公式确定第k个区域的感染程度的置信度，其中，w
k
为人聚集性权重；在所述第k个区域的感染程度的置信度大于或等于预设的最小置信度阈值的情况下，根据所述病例历史数据，确定第k个区域的病例数量。6.根据权利要5所述的方法，其特征在于，所述人聚集性权重根据各子区域的人口数据、夜间灯光数据、路网数据、交通站点数据、人位置数据、患者流调数据、网络舆情数据、社会经济数据、城市poi数据中的至少一种来确定。7.根据权利要求1所述的方法，其特征在于，根据所述感染区域的人口数据，确定所述
感染区域各时刻的预测病例数量，包括：根据公式组根据公式组根据公式组根据公式组根据公式组根据公式组综合确定所述感染区域各时刻的预测病例数量，其中，s为易感染人数量，e为潜伏人数量、a为无症状感染人数量、c为隔离人数量，r为移除人数量，i为预测病例数量，s、e、a、c、r、i的下角标表示时刻，β为有效感染率，σ为潜伏状态转化为感染状态的概率；γ为感染人的康复率；d为死亡率；θ为无症状感染人的检测率，φ为有症状感染人的检测率，ν为无症状感染者的比例，η为治愈后再次被感染的比例。8.一种基于空间聚类离散格网的传染病时空扩散预测装置，其特征在于，包括：划分模块，用于将疫区划分为n个子区域，其中，n为正整数；爆发点确定模块，用于根据病例历史数据，以及预设的时间周期，通过拟合预测，确定疫情曲线以及疫情爆发点的位置信息；感染区域确定模块，用于根据疫情曲线以及所述疫情爆发点的位置信息，以及所述n个子区域之间的空间相关性，通过疫情时空扩散模拟以及爆发点推估在所述n个子区域中确定感染区域，其中，所述疫情时空扩散模拟包括离散格网、聚集性分析以及频繁模式中至少一种，所述爆发点推估包括3sigma准则以及空间聚类中至少一种；预测模块，用于根据所述感染区域的人口数据，确定所述感染区域各时刻的预测病例数量。9.一种电子设备，其特征在于，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为调用所述存储器存储的指令，以执行权利要求1至7中任意一项所述的方法。10.一种计算机可读存储介质，其上存储有计算机程序指令，其特征在于，所述计算机程序指令被处理器执行时实现权利要求1至7中任意一项所述的方法。

技术总结

本公开涉及一种基于空间聚类离散格网的传染病时空扩散预测方法及装置。所述方法包括：将疫区划分为n个子区域；根据病例历史数据，以及预设的时间周期，确定疫情爆发点的位置信息；根据疫情爆发点的位置信息，以及n个子区域之间的空间相关性，在n个子区域中确定感染区域；根据感染区域的人口数据，确定感染区域各时刻的预测病例数量。根据本公开的疫情预测方法，通过3sigma准则、空间聚类离散格网、人聚集性分析、频繁模式等技术手段，可在疫区内的各个子区域中进行预测，分别确定各自区域的疫情状况，为精准化防控提供数据基础，并且，可考虑区域之间的互相影响，区域内的影响，以及多种社会数据等因素的影响，进一步提升预测的准确性。的准确性。的准确性。