一种空气质量预测方法、装置、电子设备及存储介质

1.本发明涉及空气质量预测技术领域，特别是涉及一种基于鲸鱼优化算法的长短期记忆网络模型的空气质量预测方法、装置、电子设备及存储介质。

背景技术：

2.目前存在的空气质量预测方法主要有三类，分别为：基于模拟的方法、统计方法和机器学习方法。其中，机器学习方法主要通过建立的神经网络模型对空气质量指数进行预测。文献“duen-ren liu，yi-kuan hsu，hsing-yu chen，huan-jianjau.air pollution prediction based on factory-aware attentional lstm neural network[j]puting，2020(prepublish)”公开了一种基于机器学习的空气质量预测方法，具体为：采用长短期记忆(long short-term memory，lstm)网络模型对空气质量进行预测，并得到了较高的预测精度，但该方法的局限是lstm网络模型存在网络结构与网络参数随机性大的问题，导致预测结果仍然不理想。

技术实现要素：

[0003]
本发明的目的是提供一种基于鲸鱼优化算法的长短期记忆网络模型的空气质量预测方法、装置、电子设备及存储介质，能够提供空气质量预测精度。
[0004]
为实现上述目的，本发明提供了如下方案：
[0005]
第一方面，本发明提供了一种空气质量预测方法，包括：
[0006]
获取前h个小时内的与目标区域空气质量相关的多种污染物数据；
[0007]
对每个污染物数据进行处理，得到多种污染物浓度等级数据；
[0008]
将每种所述污染物浓度等级数据输入到对应的训练好的长短期记忆网络模型中，预测得到第h+1个小时内的多种污染物浓度等级数据；
[0009]
根据第h+1个小时内的多种污染物浓度等级数据，预测目标区域空气质量；
[0010]
其中，任一所述训练好的长短期记忆网络模型均是通过鲸鱼优化算法对长短期记忆网络模型参数进行优化后确定。
[0011]
第二方面，本发明提供了一种空气质量预测装置，包括：
[0012]
污染物数据获取模块，用于获取前h个小时内的与目标区域空气质量相关的多种污染物数据；
[0013]
污染物浓度等级数据计算模块，用于对每个污染物数据进行处理，得到多种污染物浓度等级数据；
[0014]
污染物浓度等级数据预测模块，用于将每种所述污染物浓度等级数据输入到对应的训练好的长短期记忆网络模型中，预测得到第h+1个小时内的多种污染物浓度等级数据；
[0015]
目标区域空气质量预测模块，用于根据第h+1个小时内的多种污染物浓度等级数据，预测目标区域空气质量；
[0016]
其中，任一所述训练好的长短期记忆网络模型均是通过鲸鱼优化算法对长短期记
忆网络模型参数进行优化后确定。
[0017]
第三方面，本发明提供了一种电子设备，包括存储器及处理器，所述存储器用于存储计算机程序，所述处理器运行所述计算机程序以使所述电子设备执行根据第一方面所述的空气质量预测方法。
[0018]
第四方面，本发明提供了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时实现第一方面所述的空气质量预测方法。
[0019]
根据本发明提供的具体实施例，本发明公开了以下技术效果：
[0020]
为了克服基于lstm网络模型在空气质量预测问题中存在因网络参数导致的网络随机性大的问题，本发明提供了一种基于鲸鱼优化算法的长短期记忆网络模型的空气质量预测方法、装置、电子设备及存储介质。本发明将鲸鱼优化算法引入长短期记忆网络模型中，即在长短期记忆网络模型训练过程中，将lstm网络参数作为输入放入鲸鱼优化算法中，得到优化后的lstm网络参数，进而得到训练后的长短期记忆网络模型，然后将前h个小时内的与目标区域空气质量相关的污染物浓度等级数据输入到对应的训练好的长短期记忆网络模型中，预测得到第h+1个小时内的多种污染物浓度等级数据，进而确定出空气质量。
附图说明
[0021]
为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
[0022]
图1为本发明空气质量预测方法的流程示意图；
[0023]
图2为本发明空气质量预测装置的结构示意图；
[0024]
图3为本发明长短期记忆网络模型的结构示意图。
具体实施方式
[0025]
下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0026]
为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。
[0027]
实施例一
[0028]
如图1所示，本发明实施例提供的一种空气质量预测方法，包括：
[0029]
步骤100：获取前h个小时内的与目标区域空气质量相关的多种污染物数据。所述污染物包括pm
10
、pm
2.5
、so2、no2、co和o3。
[0030]
步骤200：对每个污染物数据进行处理，得到多种污染物浓度等级数据。
[0031]
步骤300：将每种所述污染物浓度等级数据输入到对应的训练好的长短期记忆网络模型中，预测得到第h+1个小时内的多种污染物浓度等级数据。
[0032]
步骤400：根据第h+1个小时内的多种污染物浓度等级数据，预测目标区域空气质
量。
[0033]
其中，任一所述训练好的长短期记忆网络模型均是通过鲸鱼优化算法对长短期记忆网络模型参数进行优化后确定。
[0034]
一种污染物对应一种训练好的长短期记忆网络模型，不同的污染物对应不同的训练好的长短期记忆网络模型；任一所述训练好的长短期记忆网络模型的确定过程为：
[0035]
s1：将一段时间内的样本数据进行等时间间隔划分，得到多个样本对；所述样本对包括输入数据以及对应的标签数据；其中，所述输入数据为前h个小时内的与样本区域空气质量相关的一种污染物浓度等级数据，所述标签数据为第h+1个小时内的与样本区域空气质量相关的一种污染物浓度等级数据。
[0036]
s2：按照时间顺序，将多个所述样本对进行排序。
[0037]
s3：将当前样本对中的输入数据输入到目标长短期记忆网络模型中，得到预测结果。
[0038]
s4：判断当前样本对中的标签数据与预测结果的差值是否符合设定条件，得到第一判断结果。
[0039]
s5：若所述第一判断结果表示当前样本对中的标签数据与预测结果的差值符合设定条件，则目标长短期记忆网络模型确定为样本对中污染物对应的训练好的长短期记忆网络模型。
[0040]
s6：若所述第一判断结果表示当前样本对中的标签数据与预测结果的差值不符合设定条件，则采用鲸鱼优化算法优化目标长短期记忆网络模型的网络参数，得到优化的网络参数，并判断所述当前样本对是否为最后一个样本对，得到第二判断结果。
[0041]
s7：若所述第二判断结果表示当前样本对为最后一个样本对，则将优化的网络参数确定的长短期记忆网络模型确定为样本对中污染物对应的训练好的长短期记忆网络模型。
[0042]
s8：若所述第二判断结果表示当前样本对不为最后一个样本对，则将目标长短期记忆网络模型更新为优化的网络参数确定的长短期记忆网络模型，将当前样本对更新为下一样本对，返回步骤s1。
[0043]
进一步地，在执行步骤将一段时间内的样本数据进行等时间间隔划分，得到多个样本对之前，还包括：
[0044]
获取一段时间内的与样本区域空气质量相关的多种污染物数据，并按照污染物等级划分标准，对每个污染物数据进行等级处理，得到多种污染物浓度等级数据。
[0045]
进一步地，所述采用鲸鱼优化算法优化目标长短期记忆网络模型的网络参数，得到优化的网络参数，具体包括：
[0046]
将当前样本对中的标签数据作为猎物位置，将目标长短期记忆网络模型的网络参数作为鲸鱼初始位置，采用鲸鱼优化算法优化目标长短期记忆网络模型的网络参数，得到优化的网络参数。所述网络参数包括lstm网络层数，lstm网络单元数，全连接层数，全连接单元数，batch size值，dropout值和recurrent dropout值。
[0047]
实施例二
[0048]
为了执行上述实施例一对应的方法，以实现相应的功能和技术效果，下面提供一种空气质量预测方法装置。
[0049]
如图2所示，本发明实施例提供的空气质量预测方法装置，包括：
[0050]
污染物数据获取模块1，用于获取前h个小时内的与目标区域空气质量相关的多种污染物数据。
[0051]
污染物浓度等级数据计算模块2，用于对每个污染物数据进行处理，得到多种污染物浓度等级数据。
[0052]
污染物浓度等级数据预测模块3，用于将每种所述污染物浓度等级数据输入到对应的训练好的长短期记忆网络模型中，预测得到第h+1个小时内的多种污染物浓度等级数据。
[0053]
目标区域空气质量预测模块4，用于根据第h+1个小时内的多种污染物浓度等级数据，预测目标区域空气质量。
[0054]
其中，任一所述训练好的长短期记忆网络模型均是通过鲸鱼优化算法对长短期记忆网络模型参数进行优化后确定。
[0055]
实施例三
[0056]
为了克服基于lstm网络模型在空气质量预测问题中存在因网络参数导致的网络随机性大的问题，本发明提供了一种长短期记忆网络模型的训练方法，先对建立的长短期记忆网络模型进行训练并得到模型准确率和lstm网络参数，并当模型准确率低于设定值时，将lstm网络参数和本次训练的标签数据作为输入放入鲸鱼优化算法中，使用鲸鱼优化算法对放入的lstm网络参数进行优化操作，即将本次训练的标签数据作为鲸鱼优化算法的“猎物”，lstm网络参数作为“鲸鱼”，设置边界，设置搜索维度，设置最大迭代次数，采用“鲸鱼”进行包围“猎物”、搜索“猎物”等行为，让“鲸鱼”逐渐接近“猎物”，最终得到最优的网络参数，确定最优的长短期记忆网络模型，最后，将该最优的长短期记忆网络模型引入对应数据集中进行训练和测试，利用训练好的长短期记忆网络模型对空气质量等级进行预测。
[0057]
本发明实施例提供了实施例一所述的长短期记忆网络模型的训练方法，包括以下步骤：
[0058]
步骤一、将原始空气质量数据集按照原有顺序划分为训练集和测试集，并分别对训练集和测试集中的数据依照污染物浓度划分等级。
[0059]
其中，前n年原始空气质量数据集为训练集，第n+1年原始空气质量数据集为测试集。
[0060]
在划分等级后的训练集和测试集中，将每连续h+1小时的数据作为一个样本，其中，将该样本中的前h小时的某种污染物浓度等级数据作为输入数据，将第h+1个小时的某种污染物浓度等级数据作为标签数据，即一个样本用来预测同一污染物的污染物浓度等级。
[0061]
一个示例：前2年原始空气质量数据集为训练集，第3年为原始空气质量数据集为测试集。染物数据等级划分标准，如表1所示。
[0062]
表1污染物等级划分标准表
[0063]
[0064][0065]
然后，对划分等级后的数据训练集d
train
'和测试集d
test
'进行采样获得样本数据。本示例中h为24。
[0066]
步骤二、使用经过步骤一中处理过的空气质量监测站点监测前h个小时的空气污染物i浓度等级数据进入多层长短期记忆网络训练，再经过全连接层获得预测的第h+1个小时的空气污染物浓度等级数据并获得网络的准确率和网络参数。
[0067]
一个示例：
[0068]
(1)初始化lstm网络模型：设置迭代次数，随机初始化网络参数。
[0069]
(2)使用经过数据预处理后的带有时间序列的输入数据进入多层长短期记忆网络进行训练，进行序列时间特征学习，再经过全连接层获得预测的空气污染物浓度等级数据。将lstm网络模型的输出结果和标签进行对比获得预测准确率。同时获得lstm网络层数x0，lstm网络单元数x1，全连接层数x2，全连接单元数x3，batch-size(每批次样本数)x4，dropout值(随机失活率)x5和recurrent dropout值(周期间随机失活率)x6。
[0070]
lstm网络模型结构如图3所示。本示例中迭代次数为100，24小时的污染物浓度等级input作为输入进入lstm网络网络中的lstm1和lstm2，随后进入全连接层dense1和dense2，最后输出output为网络模型预测结果。
[0071]
步骤三、采用鲸鱼优化算法优化网络参数；先初始化算法模型，然后在运行时鲸鱼优化算法会通过包围猎物、气泡网攻击、搜索猎物的行为，到长短期记忆网络模型中最优解的网络参数，保存最优解。
[0072]
一个示例为：
[0073]
使用鲸鱼优化算法将lstm网络模型的网络参数进行优化，将步骤二中得到的网络参数作为输入经过算法后得到最优解具体步骤如下：
[0074]
(1)初始化鲸鱼优化算法，设置算法循环次数t。将网络参数保存为当前鱿鱼位置信息。
[0075]
(2)设置为循环迭代时线性从2下降到0的值，计算算法参数向量为循环迭代时线性从2下降到0的值，计算算法参数向量如公式(1)(2)所示。
[0076]
[0077][0078]
其中为绝对值在[0,1]之间的随机向量。
[0079]
(3)随机设定概率p，选择算法中气泡网攻击的行为是收缩边界还是螺旋更新位置。若p≥0.5，则按公式(3)中更新位置并产生螺旋气泡，若p＜0.5，则收缩包围，如公式(3)所示。
[0080][0081]
其中，t为当前循环次数，为当前鲸鱼的位置向量，为目前最优位置鲸鱼的位置向量，l为(-1,1)中的随机数。b为螺旋形状参数。
[0082]
(4)判断的绝对值是否小于1，若小于1，则进行包围猎物同时更新位置，若大于1，则随机搜索位置并更新。搜索过程如公式(4)所示。
[0083][0084]
其中，为随机搜索的位置。
[0085]
(5)计算适应度，将与目前最优位置鲸鱼的位置向量的适应度比较，若优于则将替换为然后重复(2)、(3)、(4)和(5)直至t代结束。
[0086]
(6)获得鲸鱼优化算法的最优解并保存最优解。
[0087]
步骤四、使用步骤三得到的最优解更新长短期记忆网络模型的网络参数，并使用更新后的长短期记忆网络模型进行训练与测试。
[0088]
使用鲸鱼优化算法得到的最优解为lstm网络模型的网络参数，得到训练好的lstm网络模型，然后将测试样本输入训练好的lstm网络模型，得到预测结果，最终得到优化好的lstm神经网络。
[0089]
由于用鲸鱼优化算法能够到长短期记忆网络模型中最优解的网络参数，减少了因网络参数导致的网络随机问题，可以得到更好的空气质量预测结果。
[0090]
实施例四
[0091]
本发明实施例提供一种电子设备包括存储器及处理器，该存储器用于存储计算机程序，该处理器运行计算机程序以使电子设备执行实施例一的空气质量预测方法。
[0092]
可选地，上述电子设备可以是服务器。
[0093]
另外，本发明实施例还提供一种计算机可读存储介质，其存储有计算机程序，该计算机程序被处理器执行时实现实施例一的空气质量预测方法。
[0094]
本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。
[0095]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据
本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

技术特征：

1.一种空气质量预测方法，其特征在于，包括：获取前h个小时内的与目标区域空气质量相关的多种污染物数据；对每个污染物数据进行处理，得到多种污染物浓度等级数据；将每种所述污染物浓度等级数据输入到对应的训练好的长短期记忆网络模型中，预测得到第h+1个小时内的多种污染物浓度等级数据；根据第h+1个小时内的多种污染物浓度等级数据，预测目标区域空气质量；其中，任一所述训练好的长短期记忆网络模型均是通过鲸鱼优化算法对长短期记忆网络模型参数进行优化后确定。2.根据权利要求1所述的一种空气质量预测方法，其特征在于，所述污染物包括pm
10
、pm
2.5
、so2、no2、co和o3。3.根据权利要求1所述的一种空气质量预测方法，其特征在于，一种污染物对应一种训练好的长短期记忆网络模型，不同的污染物对应不同的训练好的长短期记忆网络模型；任一所述训练好的长短期记忆网络模型的确定过程为：将一段时间内的样本数据进行等时间间隔划分，得到多个样本对；所述样本对包括输入数据以及对应的标签数据；其中，所述输入数据为前h个小时内的与样本区域空气质量相关的一种污染物浓度等级数据，所述标签数据为第h+1个小时内的与样本区域空气质量相关的一种污染物浓度等级数据；按照时间顺序，将多个所述样本对进行排序；将当前样本对中的输入数据输入到目标长短期记忆网络模型中，得到预测结果；判断当前样本对中的标签数据与预测结果的差值是否符合设定条件，得到第一判断结果；若所述第一判断结果表示当前样本对中的标签数据与预测结果的差值符合设定条件，则目标长短期记忆网络模型确定为样本对中污染物对应的训练好的长短期记忆网络模型；若所述第一判断结果表示当前样本对中的标签数据与预测结果的差值不符合设定条件，则采用鲸鱼优化算法优化目标长短期记忆网络模型的网络参数，得到优化的网络参数，并判断所述当前样本对是否为最后一个样本对，得到第二判断结果；若所述第二判断结果表示当前样本对为最后一个样本对，则将优化的网络参数确定的长短期记忆网络模型确定为样本对中污染物对应的训练好的长短期记忆网络模型；若所述第二判断结果表示当前样本对不为最后一个样本对，则将目标长短期记忆网络模型更新为优化的网络参数确定的长短期记忆网络模型，将当前样本对更新为下一样本对，返回将当前样本对中的输入数据输入到目标长短期记忆网络模型中，得到预测结果的步骤。4.根据权利要求3所述的一种空气质量预测方法，其特征在于，在执行步骤将一段时间内的样本数据进行等时间间隔划分，得到多个样本对之前，还包括：获取一段时间内的与样本区域空气质量相关的多种污染物数据；按照污染物等级划分标准，对每个污染物数据进行等级处理，得到多种污染物浓度等级数据。5.根据权利要求3所述的一种空气质量预测方法，其特征在于，所述采用鲸鱼优化算法优化目标长短期记忆网络模型的网络参数，得到优化的网络参数，具体包括：
将当前样本对中的标签数据作为猎物位置，将目标长短期记忆网络模型的网络参数作为鲸鱼初始位置，采用鲸鱼优化算法优化目标长短期记忆网络模型的网络参数，得到优化的网络参数。6.根据权利要求3或5所述的一种空气质量预测方法，其特征在于，所述网络参数包括lstm网络层数、lstm网络单元数、全连接层数、全连接单元数、batch size值、dropout值和recurrent dropout值。7.一种空气质量预测装置，其特征在于，包括：污染物数据获取模块，用于获取前h个小时内的与目标区域空气质量相关的多种污染物数据；污染物浓度等级数据计算模块，用于对每个污染物数据进行处理，得到多种污染物浓度等级数据；污染物浓度等级数据预测模块，用于将每种所述污染物浓度等级数据输入到对应的训练好的长短期记忆网络模型中，预测得到第h+1个小时内的多种污染物浓度等级数据；目标区域空气质量预测模块，用于根据第h+1个小时内的多种污染物浓度等级数据，预测目标区域空气质量；其中，任一所述训练好的长短期记忆网络模型均是通过鲸鱼优化算法对长短期记忆网络模型参数进行优化后确定。8.一种电子设备，其特征在于，包括存储器及处理器，所述存储器用于存储计算机程序，所述处理器运行所述计算机程序以使所述电子设备执行根据权利要求1至6中任一项所述的空气质量预测方法。9.一种计算机可读存储介质，其特征在于，其存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的空气质量预测方法。

技术总结

本发明公开了一种空气质量预测方法、装置、电子设备及存储介质，涉及空气质量预测技术领域，该方法包括：获取前h个小时内的与目标区域空气质量相关的多种污染物数据并进行处理，得到多种污染物浓度等级数据；将每种污染物浓度等级数据输入到对应的训练好的长短期记忆网络模型中，预测得到第h+1个小时内的多种污染物浓度等级数据；根据第h+1个小时内的多种污染物浓度等级数据，预测目标区域空气质量；其中，任一训练好的长短期记忆网络模型均是通过鲸鱼优化算法对长短期记忆网络模型参数进行优化后确定。本发明能够提供空气质量预测精度。测精度。测精度。