基于GCN-LSTM的空气质量预测

祁柏林2, 郭昆鹏1,2, 杨　彬3, 杜毅明3, 刘　闽3, 王继娜4

1(中国科学院大学, 北京 100049)

(中国科学院沈阳计算技术研究所, 沈阳 110168)3

(辽宁省沈阳生态环境监测中心, 沈阳 110000)4

(辽宁省先进装备制造业基地建设工程中心, 沈阳 110001)通讯作者: 郭昆鹏摘　要: 随着我国环境监测技术的不断发展, 环境空气质量的网格化监测体系越来越受到相关工作人员的青睐, 为应对空气污染的网格化监测体系中的小型、微型监测站的空气质量预测问题, 本文提出了一种基于GCN 和LSTM 的空气质量预测模型. 首先利用GCN 网络提取网格化监测体系中的小微型监测站之间的空间特征, 然后再使用LSTM 提取时间特征, 最后使用线性回归层来综合时空特征并产生空气质量的预测结果. 为了验证本文提出的预测模型的性能, 我们使用了沈阳市浑南区的14个小微型监测站的空气质量监测数据进行实验. 实验结果显示, 基于GCN-LSTM 的空气质量预测模型在空间关联较强的网格化监测中的小微型监测站上的预测结果的精度要优于单一的LSTM 预测模型.

关键词: 网格化监测; GCN; LSTM; 空气质量预测; 微型监测站

引用格式: 祁柏林，郭昆鹏，杨彬，杜毅明，刘闽，王继娜.基于GCN-LSTM 的空气质量预测.计算机系统应用,2021,30(3):208–213. /1003-3254/7815.html

Air Quality Prediction Based on GCN-LSTM

QI Bo-Lin 2, GUO Kun-Peng 1,2, YANG Bin 3, DU Yi-Ming 3, LIU Min 3, WANG Ji-Na 4

1(University of Chinese Academy of Sciences, Beijing 100049, China)

(Shenyang Institute of Computing Technology, Chinese Academy of Sciences, Shenyang 110168, China)3

(Shenyang Ecological Environment Monitoring Center, Liaoning Province, Shenyang 110000, China)4

(Liaoning Advanced Equipment Manufacturing Base Construction Engineering Center, Shenyang 110001, China)

Abstract : With the development of environmental monitoring technology in China, the grid monitoring system of ambient air quality has received more attention from environmental workers. In order to solve the air quality prediction of small and miniature monitoring stations in the grid monitoring system of air pollution, we propose an air quality prediction model based on GCN and LSTM. First, GCN is applied to extract the spatial features between the small and miniature monitoring stations in the grid monitoring system. Then, LSTM is employed to extract the relevant te

mporal features. Finally, the linear regression layer is used to integrate the spatial and temporal features and get the prediction results of air quality. Furthermore, experiments are carried out on the air quality monitoring data from 14 small and miniature monitoring stations in Hunnan District, Shenyang, verifying the prediction effect of the proposed model. The experimental results show that the air quality prediction model based on GCN-LSTM is more accurate than the LSTM prediction model in terms of the prediction results on the small and miniature monitoring stations in the grid monitoring with strong spatial association.

Key words : grid monitoring; GCN; LSTM; air quality prediction; micro monitoring station

计算机系统应用 ISSN 1003-3254, CODEN CSAOBN

Tel: +86-10-62661041

① 基金项目: 辽宁省“兴辽英才计划”(XLYC1808004)

Foundation item: Talent Program of Revitalizing Liaoning, Liaoning Province (XLYC1808004)收稿时

间: 2020-07-17; 修改时间: 2020-08-13; 采用时间: 2020-08-17; csa 在线出版时间: 2021-03-03

208

1 引言

近年来随着科学技术的不断发展, 各种传感器, 电子元器件的体积进一步减小, 精度进一步提高, 而这些传感器和电子技术的快速发展又进一步推动环境监测从区域化粗粒度监测向更细粒度的区域网格化监测发展. 同时网格化监测手段与大数据技术的有机结合, 又使得环境监测部门可以获得更多尺度、更加详细的空气污染信息, 通过分析这些空气污染数据不但可以迅速的发现污染源头, 快速治理, 还可以对网格化监测区域内未来的空气污染状况进行预测, 因此挖掘空气污染数据的潜在信息对于推动我国生态文明建设, 改善空气质量污染状况, 提升人民生活的幸福度具有一定的意义.

长期以来, 空气质量的预测一直是国内外空气污染监测与治理相关领域的研究热点之一. 按照研究手段分类, 空气质量预测可以分为统计预测、数值预测和以机器学习为代表的人工智能算法预测这3种方案[1], 其中统计预测是指通过分析空气中污染物的变化规律来进行预测, 常用的模型有灰度模型和回归模型.但是单一的灰度模型或者回归模型又各自存在一些缺陷, 有的学者提出了将基于残差修正的灰度模型[2]应用到空气质量预测的工作上面, 有效的提高了灰度模型的预测精度. 也有学者将多元线性回归模型应用到空气质量分析中, 都取得了一定的成果[3].

有关于空气质量的数值预测是指以大气运动规律为基础, 综合空气中污染物之间可能发生的物理和化学变化, 利用数学的方法建立起污染物在空气中扩散模型来预测未来一段时间内污染物浓度的变化, 其中主流的模型有CQMA, NAQPMS, CAMs等. 虽然数值预报在空气质量预测方面有着不可取代的作用, 但是由于数值预报本身的不确定性, 所以可能会导致单一的数值预报模式的预测精准度存在问题, 所以来自浙江理工大学的谢磊提出了一种综合多种数值预报模式的空气质量的预测方法, 在一定程度上提高了空气质量的数值预测的精度[4].

近年来随着人工智能学科的快速发展, 已经有越来越多的人将有关于机器学习, 神经网络等方面的相关知识应用到空气中污染物预测和空气质量预测方面.有学者将支持向量机的方法与空气质量的预测相结合，提出了基于改进萤火虫寻优支持向量机的预测模型(IFA-SVM), 该模型改进了以往使用的萤火虫算法-支持向量机(FA-SVM)在训练模型时收敛速度慢和参数震荡等问题[5]. 有国外学者将ANN应用到空气质量预测方面并取得了较高质量的预测效果[6], 也有学者将BP神经网络应用到空气中污染物浓度的预测工作方面, 并且使用K近邻算法(KNN)来优化传统BP神经网络方法不能体现历史时间窗内的数据对当前预测影响的问题[7]. 还有学者将能够高效的提取连续时间特征的长短期记忆神经网络(Long Short-Term Memory, LSTM)应用到空气中污染物的浓度预测方面. 来自西安电子科技大学的张晗提出了一种基于LSTM的空气污染物预测模型, 可以有效的提取有关空气污染物浓度的历史数据之间的时间特征从而获得一个准确率较高的预测数据[8]. 还有学者将经济因素的影响添加到空气质量的预测中, 并取得一定的成果[9].

当前对于空气中污染物浓度预测的相关研究大多是以可以产生大量, 多元监测数据的大中型监测站为研究对象, 而以网格化监测中小微型监测站作为研究对象的研究较少. 同时, 由大中型监测站所产生的空气质量数据与网格化监测中小, 微型监测站所产生的空气质量数据在数据种类, 特征维度方面都有一定的区别, 比如说部分网格化监测中的小微型监测站所产生的监测数据并不包括当前时刻的温度, 湿度, 风向，气压等信息, 而且网格化监测中的小微型监测站所产生的监测数据之间除了具备天然的时间关联, 还由于小微型监测站之间的影响关系而具备空间关联. 所以在预测网格化监测中小微型监测站的空气中污染物浓度相关问题上使用以往常用的线性回归算法或者LSTM算法都会使预测结果由于温湿度等信息的缺失和空间特征的忽略而产生一定的误差.

因此为了有效的提取网格化监测中小微型监测站之间的空间关联特征和空气污染物数据之间天然的时间关联特征, 本文将能够有效且快速的提取非欧结构中的空间特征的图卷积神经网络(Graph Convolutional Network, GCN)与可以有效提取时序数据之间的时间特征的长短期记忆神经网络(LSTM)相结合, 提出了一种可以应用于网格化监测中空气质量预测的GCN-LSTM模型. 然后本文结合了沈阳市浑南区的14个小微型监测站的PM2.5数据对本文提出的方法进行验证.

2 基于GCN-LSTM的空气质量预测模型

空气质量网格化监测中的各个小微型监测站的空间分布属于非欧式结构, 也就是说网格化监测中的每

2021 年第 30 卷第 3 期计算机系统应用

209

个小微型监测站周围的邻接监测站的个数和监测站之间距离是不确定的, 所以对网格化监测所产生的监测数据使用传统的卷积神经网络(Convolutional Neural Networks, CNN)并不能有效的提取数据之间的空间信息. 因此需要使用GCN 来提取数据之间的空间特征，并且使用LSTM 来处理数据之间的时间特征, 最后再使用线性回归层来综合时空特征来产生比较准确, 有效的预测信息.

2.1 图卷积神经网络概述

图卷积神经网络(GCN)是一种以图数据为研究对象的卷积神经网络, 由Bruna 等在2013年首次提出[10].图卷积神经网络的出现为一些非欧的图数据的处理提供了新的思路, 比如GCN 可以应用到社交网络分析，推荐系统, 交通流量预测等[11].

G =(V ,E ,A )GCN 的本质目的就是利用图卷积来提取非欧结构的图数据的空间特征, 根据文献[12]中提出的理论，对于图, 输入信号X 和输出信号Y , 图卷积神经网络采取的处理方式f 定义为:

V ={v i }N i =1A ∈R N ×N A i j v i v j 其中, V 表示图中的节点个数, 而E 表示的边的集合, A 是图的邻接矩阵, , 矩阵A 中的元素

表示图G 中节点和之间的连接关系. 图卷积的

前向传播公式为:

˜A

=A +I ˜D ˜D ii =∑

˜A

拉丝模激光打孔机

i j H l ∈R N ×D H 0

=X σ(·)W l 式中, , I 是大小为N×N 的单位矩阵; 为对角矩阵, ; 表示第l 层的输出值, 其中; 表示激活函数; 表示第l 层的参数值.

2.2 长短期记忆神经网络概述

LSTM 网络是循环神经网络(Recurrent Neural Network, RNN)的一种变种[13], 是由Hochreiter 和Schmidhuber 为解决RNN 中的长期依赖问题在1997年首次提出. 由图1 RNN 的示意图及其展开图可以看出，虽然每个RNN 单元都会将自身提取的信息传递给下一个单元, 但是当传递链的长度增加到一定程度的时候会出现信息丢失, 也就是上文提到的长期依赖的问

题, 这也就促使了LSTM 的出现与流行.

图1 RNN 示意图及展开

通过图2 LSTM 的细胞结构示意图可以看出, LSTM 采用了3种门控机制来解决传统RNN 中的长期依赖问题.湖水净化

结绳记事

图2 LSTM 细胞结构图

C t LSTM 的3种门控单元分别为: 遗忘门f , 输入门i 和输出门o . 其中遗忘门用来控制当前细胞状态

要丢弃哪些信息, 遗忘门的状态更新公式为:

x t C t 输入门控制了当前网络的输入会有多少保留到单元状态中, 输入门的状态更新规则为:

输出门控制了当前细胞状态能输出多少信息. 输出门的状态更新规则为:缺陷者捧出的花束

σ˜C

t W f ,W i ,W o ,W c b

f ,b i ,b o ,b c 式中, 表示Sigmoid 函数, 会根据输入产生[0,1]之

间的向量; 表示的是候选细胞信息; 表示的是LSTM 细胞状态更新过程中的权重系数矩阵;

表示状态更新过程中的偏置矩阵.

2.3 GCN-LSTM 模型

[X t −s ,···,X t −1]X t 网格化监测中的小微型监测站的空气质量预测问题可以描述为: 通过小微型监测站时长为s 的历史时刻数据和各个监测站之间的空间关系A 来预测下一个时刻t 的空气质量, 即:

X t 式中, 表示t 时刻网格化监测体系中各个小微型监测站的空气中污染物的预测浓度; A 表示不同小微型站之间的空间影响关系即邻接矩阵; F 为处理方式, 在本

计算机系统应用

2021 年第 30 卷第 3 期

210

文中F表示GCN-LSTM模型.

GCN-LSTM模型由图卷积神经网络和长短期记忆单元两部分组成, 如图3所示. 本次研究将长度为s 的历史时间序列数据输入模型, 利用双层GCN结构解析网格化监测中小微型监测站的拓扑结构, 提取空间特征; 然后将具备空间特征的时间序列数据输入LSTM 中学习时间特征, 最后通过一个线性回归层得到预测数据, GCN-LSTM模型具体的训练流程如图4所示.

图3 GCN-LSTM模型总览

图4 基于GCN-LSTM的PM2.5预测流程

首先将收集到的原始数据进行数据预处理和数据集划分, 然后将训练集和验证集组成的训练数据输入到如图3结构所示的GCN-LSTM模型中对模型进行训练; 最后将测试数据输入到训练完成的模型中观察模型的预测精度是否达到预期, 如果没有达到预期则调整模型GCN和LSTM中的隐层节点数然后再次训练直到得出达到预期精度的模型.

3 实验结果与分析

3.1 数据说明与预处理

本文使用的数据样本集为沈阳市浑南区14个小微型监测站的2020年1月到5月之间的PM2.5浓度值, 数据采样的时间间隔是1小时, 每天可以获取336个样本数据.

部分原始数据如图5所示, 在图5中横轴代表的是PM2.5原始数据的组数, 纵轴代表的是PM2.5原始数据的浓度值. 从图上可以看出部分原始数据存在缺失和失真的情况. 因此在使用此数据集进行模型训练和验证之前需要对原始数据进行数据预处理, 补充缺失数据和清洗掉异常数据.

05001000

组

15002000

图5 南屏东路PM2.5原始数据

本文对于数据集中的缺失数据和异常数据采取的是如式(10)所示一元线性插值的方式进行数据补充和清洗, 同时采用式(11)对原始数据进行归一化使原始数据都映射到[0,1]之间.

x a+i x a

x a+j

j i i 式中, 为插值产生的补充数据, 为距离缺失数据最近的之前时刻的数据, 为距离缺失数据最近的之后时刻的缺失数据, 表示缺失数据的个数, 表示第个需要补充的缺失数据.

x i x i

x max x min

式中, 为原始PM2.5数据; 为归一化后的PM2.5数据;

为原始数据中的最大值; 为原始数据中的最小值.

2021 年第 30 卷第 3 期计算机系统应用

211

3.2 实验环境

实验所用的硬件配置为: Intel(R) Core(TM)i5-5200U ******** GHz, 8 GB 内存; 实验所用的软件环境为: Windows10 (64位)操作系统, Python3.7,PyTorch1.5.0.

3.3 评价指标

本次研究的目的是预测网格化监测中的小微型监测站的空气质量和空气中污染物浓度的变化趋势, 所以为了能够更好的衡量预测的效果, 本文采用了2个评价指标: 绝对平均误差(Mean Absolute Error, MAE )，均方根误差(Root Mean Squared Error, RMSE ), 来分析预测结果和真实测量值之间的偏差.

一般来说当预测值与真实值之间的偏差越小MAE 和RMSE 的值也就越小, 也就是说MAE 和RMSE 的值越小, 模型的预测

效果越好.

y i

y i 式中, 为真实的PM 2.5浓度的测量值; 为PM 2.5浓度的预测值.

3.4 预测结果分析

本次研究将数据集以7:1:2的比例划分训练集, 验证集和测试集, 并且使用长短期记忆神经网络作为对比模型, 模型的训练过程如算法1所示.

算法1. 模型搭建与训练

s A ∈R N ×N C ∈R N ×M 输入: 时间序列长度, 小微型监测站所构成的图的邻接矩阵,PM 2.5的浓度表

红白歌会2016示, 模型选择标志flag

输出: 训练好的模型

1. 对邻接矩阵A 添加自连接, 并对自连接后的邻接矩阵进行对称归一化处理.

2. 对PM 2.5的浓度数据C 进行归一化并且构建数据集D.m <M

3. for do

X m ←[x 1m ,x 2m ,···x N m

新旧巴塞尔协议]

4. m ←m +1

5. 6. end

[X t −s ···X t ]∈C 7. for do D ←{X =[X t −s ···X t −1],Y =X t }8. t ←t +1

9. 10. end

11. 按照7:1:2划分数据集D 得到训练集train, 验证集valid 和测试集test 12. if flag == LSTM do

13. 使用PyTorch 搭建一个隐层节点数分别为80, 108和36的3层LSTM 网络.

14. else if flag == GCN-LSTM do

15. 搭建如图3所示的GCN-LSTM 模型.16. end if 17. repeat

18. 从train 中随机选取batch 为64的数据输入模型进行训练.19. 以MSE 作为loss, 使用Adam 算法以1e–4为学习率更新权重.20. until 满足停止条件.21. 返回训练完成的模型.

实验中分别采用LSTM 和GCN-LSTM 两种模型使用14个小微型监测站过去12个小时的PM 2.5数据来预测未来1小时的PM 2.5浓度, 预测结果对比如表1所示.

表1 不同模型的预测效果对比

站点LSTM GCN-LSTM MAE RMSE MAE RMSE 浑南中路8.4112.538.2912.14新才街7.9110.877.0010.11仓储街9.3612.769.0212.47新秀街9.7213.898.2711.92第二热源厂7.8211.758.0311.60安姆大厦9.1313.637.9111.95前榆村10.8714.819.3412.63南屏东路12.4317.9511.5317.53南堤东路8.9113.088.4512.98银卡东路10.3116.069.6615.05全运路7.159.93 6.

299.33白塔河二路8.4612.207.7111.28学城路8.5512.878.6012.81苏王线东段9.6313.948.2212.11平均值

9.19

13.305

8.45

12.42

从表1中两种模型的对比可以看出, 本文所提出的GCN-LSTM 模型在大多数小微型监测站中MAE 和RMSE 这两种评价指标的数值都要比使用LSTM 模型的值要小. 而且这两种评价指标都是越小就代表模型的预测值与实际的测量值之间的偏差越小, 也就是说在网格化监测中小微型监测站的PM 2.5的预测问题上, 本文提出的模型的预测效果要优于以往研究中所使用的LSTM 模型.

图6和图7分别为实验中预测效果最好的监测站点全运路监测点和预测效果最差的南屏东路监测点的部分预测结果. 图6和图7中的横轴代表第几组测试数据, 纵轴代表PM 2.5的浓度值, pre 代表有GCN-LSTM 模型产生的PM 2.5浓度的预测值, real 代表当前监测站的实际的PM 2.5的监测值. 从图上的预测曲线与实际测

计算机系统应用

2021 年第 30 卷第 3 期

212

本文发布于:2024-09-22 01:02:36，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/603598.html

上一篇：课件4_污染运移模拟(MT3D)的原理及应用

下一篇：海上溢油风险的数值模型预警