一种基于多尺度时空融合图网络的交通预测方法

著录项
  • CN202210884031.2
  • 20220726
  • CN115240425A
  • 20221025
  • 西北师范大学
  • 田冉;王楚;胡佳;马忠彧;刘颜星;王灏篷;王晶霞;李新梅
  • G08G1/01
  • G08G1/01 G06K9/62 G06N3/04 G06N3/08

  • 甘肃省兰州市安宁区安宁东路967号
  • 甘肃(62)
  • 北京盛凡佳华专利代理事务所(普通合伙)
  • 靳桂琳
摘要
本发明提供了一种多尺度时空融合图网络交通预测方法。为了建模交通数据的时空相关性以及交通网络中固有的空间异质性,本发明提出了一种多尺度时空融合图网络预测框架(MFSTGN),具体来说,其中设计的一个时空图卷积模块(STGCN),它在保留交通网络固有结构的基础上动态建模时空相关性,并且通过一种趋势图卷积来描述交通流量的趋势变化情况,同时利用时空嵌入建模交通网络的空间异质性。此外,还开发了一个门控注意力机制,来自适应融合周期性依赖和趋势性依赖,使MFSTGN享有多序列信息。通过大量的实验证明,无论在交通速度数据集还是在交通流量数据集中,MFSTGN在长时间序列预测上结果优于最先进的基线。
权利要求

1.一种基于多尺度时空融合图网络的交通预测方法,其特征在于包括下述步骤:

定义:MFSTGN全称为Multi-Scale Spatial-Temporal Fusion Graph Network,即多尺度时空融合图网络,是一种面向交通领域的时序预测方法,为了打破在长时间时间序列预测任务缺乏有效捕捉时空特征的能力这一局限性,因此本发明提出了一种多尺度时空融合图网络预测框架,MFSTGN基于编码器-解码器结构,编码器编码时间序列的周期性特征,解码器重点关注时间序列的趋势性特征,两者进行特征融合预测未来序列,编码器和解码器均由时空图卷积和门控注意力构成,每个时空图卷积模块通过三种不同的图网络分别对空间相关性、时间相关性、空间异质性进行建模,有效的提高了节点之间的消息传递效率,门控注意力对不同类型的特征在时间维度上进行自适应融合,增强了特征表达,减小了误差传播;

步骤1:定义交通路网表示,明确本发明中出现的符号和概念,并在此基础上将交通预测问题公式化;本发明将交通路网定义为一个加权有向图G=(V,E,A);其中V是一个N=|V|的顶点集合,表示道路网络中的传感器;E边的集合表示顶点之间的连通性,是一个加权邻接矩阵,表示节点和节点的邻近性;

步骤2:确定模型的输入和输出;交通信号是衡量交通状况的重要指标,本发明中将历史时间序列作为图信号表示为X∈RT×N×D,其中T表示时间序列的长度,D是每个节点特征的数量,在时间步t,观察到的图信号表示为Xt∈RN×D,模型的输入有观察到的历史时间序列Xh,Xw,Xd,其中Xh=(Xt-Q,...,Xt-1)∈RQ×N×D表示趋势性依赖,Xw=(Xt-M×7,...,Xt+Q-1-M×7)∈RQ×N×D表示周周期性依赖,Xd=(Xt-M,...,Xt+Q-1-M)∈RQ×N×D表示日周期性依赖,模型的目的是学习一个函数f(·),它可以将Xh,Xw,Xd和G映射到下一个时间步Q的图形信号,Y=(Xt,...,Xt+Q-1)∈RQ×N×D,具体表示如下:

步骤3:划分数据集;本发明将时间粒度设置为5分钟,对于两类交通数据集,将70%的数据用于训练,10%的数据用于验证,其余20%的数据用于测试,并对整体数据集进行Z-Score规范化;

步骤4:嵌入空间相关性、时间相关性以及空间异质性信息;城市交通状况复杂,受多种时空相关性的影响,因此本发明从多种不同的角度描述交通网络,分别对空间相关性、时间相关性、空间异质性建模;

步骤4.1:构建空间图卷积模块;交通网络的固有结构可以反应道路平稳的交通状况,基于预定义的邻接矩阵,本发明专注于一定距离间隔的传感器,并认为它们之间存在直接相关性,在一定程度上可用于相互表示,对原始的交通网络,本发明基于成对的路网距离定义空间邻接矩阵为:

其中表示路网中传感器vi到传感器vj之间的距离,σ是标准差,ε是控制邻接矩阵A的稀疏度的阈值,指定为0.1,加权邻接矩阵可以区分节点之间的相关程度,使节点关注更重要的邻域信息,具体地,通过领域节点的消息传递效应来表示节点的交通流量:

其中,和表示图信号的输入与输出,和都是可学习的参数,φ(·)是ReLU(·)非线性激活函数,是归一化邻接矩阵,是带有自循环的邻接矩阵,是度矩阵,空间图卷积模块体现了固有的交通路网结构,提取了最原始的路网特征,在一定程度上表现出有效的预测结果;

步骤4.2:时间图卷积;空间图卷积完全基于由地理近邻性定义的交通网络,然而,道路之间的影响关系要复杂的多,道路上的车辆密度、人口密度、交通状况呈现出动态的变化趋势,并且存在交通事故等突发性事件,因此,将道路距离作为连接两点的权重无法有效的建模时间相关性,因此本发明提出了一个时间图卷积去自适应学习时间序列数据之间的隐藏关系,首先,使用流量点积机制建模两个节点之间的相关性:

其中,表示节点i、j在t时刻第L层的相关性,表示节点i在t时刻第(L-1)层的特征表示,和表示可学习的参数,接着,构建自适应邻接矩阵:

其中,表示节点i、j在t时刻第L层的相关性分数,基于相关性分数,可将节点i处的图信号聚合为:

其中表示节点i在t时刻第L层的特征表示,它将当前时刻邻居节点的信息按照不同的权重统一起来,接着,将多个时间步上的图信号连接:

其中,表示Q个时间步的图信号输出;

步骤4.3:建模基于位置编码的趋势图卷积模块;准确描述交通网络的空间异质性,并提取不同道路交通流的变化趋势,有助于精准聚合邻域信息,因此本发明提出了一种基于位置编码的趋势图卷积,具体来说,随机初始化一个节点嵌入矩阵来学习最优的交通网络结构表示,此外,为了体现动态的时间相关性,将历史序列的时间编码,将一天分为M个时间步长,随后使用one-hot编码将一周里的每天编码为将一天里的每个小时编码为随后将它们连接在一起为从而得到历史时间序列的时间嵌入矩阵通过全连接神经网络分别转化为向量从而得到顶点的时空嵌入矩阵:

ST=φ(SWs)+φ(TWt)

其中是N个顶点在Q个时间步上的时空嵌入表示,也可称为位置嵌入,是可学习的参数,此外,考虑到类别相近的地点通常具有相似的变化趋势,本发明在时间维度上使用长度为3的1D平均池化层获得近期趋势表示,具体地,将其表示为:

Xm=AvgPooL1d(Xin)

其中,表示图信号的输入,是交通流量的趋势表示,接着,图信号Xin,时空嵌入表示ST和流量趋势表示Xm被连接作为趋势图卷积的输入:

其中,是图信号输出,和都是可学习的参数;

步骤5:构建MFSTGN整体模型;在分别嵌入时空编码和趋势图卷积编码后,开始着手于构建MFSTGN整体架构,接下来,从构建图卷积层到构建门控注意力机制两方面介绍;

步骤5.1:构建图卷积层;基于静态距离的图和基于动态节点属性的图从不同的角度反映了节点间的相关性,为了扩大感受野,将两种图卷积进行融合,从多维度观察交通流变化规律,使用GRU为了自适应地融合空间和时间表示,对于时间步长t处的所有节点,GRU的操作可以表示如下:

zt=φz(YS[t,:]Wz+YT[t,:]Uz+bz)

rt=φr(YS[t,:]Wr+YT[t,:]Ur+br)

H=concat(ht,…,ht+Q-1,yt+Q)

其中⊙表示逐元素乘法,和都是可学习参数,t时刻交通网络所有节点的时空表示表示N个节点在Q个历史时间步的时空特征,接着,将与趋势图卷积的输出进行连接,进一步增强节点的时空表征能力:

其中,表示STGCN模块提取的交通路网的时空特征,和是可学习参数;

步骤5.2:构建门控注意力机制;不同的时间序列呈现出不同的流量变化趋势,在不同的场景下对预测未来交通状况所起的作用不同,例如,周六早上学校附近的交通状况显然与周序列联系更密切,但是在一些没有明显周期模式的路段,时序列作用更关键,因此本发明使用门控注意力机制在不同的时间序列上聚合消息,这意味着它可以灵活地在时间轴上建模时空相关性,不同时间序列揭示了不同的交通属性,周期性依赖是道路流量长期以来形成的一种稳定的变化规律,趋势性依赖则是短时间范围内可预见的一种交通状况,受注意力机制和门控单元的启发,本发明提出了一种带有门控单元的双向注意机制来融合周期性和趋势性特征;

首先使用全连接层将输入转换为对应的Query和Value矩阵,Query有自身和转置两种形态,然后,通过“注意力”操作得到两个注意力矩阵,表示双方互相关注的程度,注意力矩阵与相应的Value矩阵相乘得到对应的全局上下文矩阵,体现了关注的信息量,这种操作可以表示为:

其中,表示时间步ti和时间步tj之间的关联度,表示时间步ti对时间步tj的重要程度,和表示两种不同可学习的转换方式,Nt表示对应时间序列的所有时间步,表示节点vi在x序列的ti时间步聚合了变量h序列所有时间步的信息:

其中是变量h对应Value矩阵的非线性变换,同上述公式原理相同,得到变量h序列对变量x序列的关注:

其中表示节点vi在h序列的ti时间步聚合了变量x序列所有时间步的信息;

接着,利用两个输入得到一个门控单元来控制双方的稀疏程度:

更新得到节点vi在ti时间步融合后的信息表示:

其中Wo、Uo和是可学习的参数;

步骤6:MFSTGN模型的训练和优化;构建整体模型后,需要对模型进行训练和优化,尽可能的使模型效果达到最佳,本发明使用Adam优化器对模型进行优化,选取MAE、MSE和RMSE作为评价指标,具体的评价指标公式如下:

MFSTGN基于编码器-解码器架构,编码器用来提取周期性特征,其中两个STGCN模块分别用来对周周期依赖和日周期依赖在时空方面进行建模,然后将两者通过门控注意力归纳周期性依赖,解码器使用STGCN对趋势性依赖进行时空建模,然后通过时间注意力机制关注更重要的时间步,提高趋势性依赖特征表达能力,周期性依赖和趋势性依赖通过门控注意力进行特征融合,预测未来时间序列,本发明预测精确度高,实现过程不复杂,适用于处理各种复杂的时序数据。

说明书
技术领域

本发明专利涉及一种交通预测方法,在城市管理及智慧城市建设领域具有极其有意义的应用前景。

智能交通系统是智慧城市的重要组成部分,得益于智慧城市建设的先进性,智能交通系统的信息化得到了飞速发展。然而,随着城市化进程加快,不断增长的人口和车辆导致了频繁的交通拥堵,智能交通系统也因此面临着巨大挑战。幸运的是,随着数据智能和城市计算的进步,收集大量交通数据并进行分析成为可能,这有助于解决众多交通难题。其中,交通预测由于其复杂的时空特性一直以来是一项极具挑战性的任务,合理的预测未来的交通状况可以有效的减少交通拥堵,提升人们的幸福指数,对新时期的智慧城市新道路规划建设和交通管理具有重要意义。

交通预测的目的是通过历史观测值预测道路网络中未来的交通状况,由于其复杂的时空相关性和长期预测的内在困难,这一任务具有挑战性。一方面,交通流序列在时间维度上存在波动性和不确定性,例如:在长时间段内表现出较为平稳的周期性变化规律,在短时间内往往会因为交通高峰期或交通事故而引起剧烈波动,其不确定性因素使长期预测变得困难。另一方面,交通路网中的传感器之间存在着复杂而又独特的相关性,例如,在欧几里得空间距离相近的两个传感器通常情况下表现出相似的行为,如果在之间发生交通事故则会使两者在短时间内表现出截然不同的行为,反而与距离更远的传感器在行为上更相似。这意味着交通路网的空间结构随时间变化呈现出不同的节点相关性。

面对上述挑战,人们进行了广泛的研究。现有研究方法主要分为知识驱动方法和数据驱动方法。知识驱动方法通常应用于排队理论和行为模拟。数据驱动方法例如向量自回归(VAR),支持向量机(SVR),自回归综合移动平均(ARIMA)等。然而,这些方法通常需要满足时间序列的平稳性假设,复杂的交通路况限制了其捕捉时空特征的能力。近年来,随着深度学习的兴起,循环神经网络、长短时记忆网络、门控融合单元等方法具有对序列数据建模的优势,因而被广泛应用于时间序列捕捉时间相关性。然而,这些方法将来自不同道路的交通序列视为独立的数据流,无法对交通路网结构进行统一建模,丢失了空间语义信息。因此,图神经网络被引入交通领域来处理非欧几里得的空间关系,传感器之间的距离作为边的权值来构建邻接矩阵,图卷积通过邻接矩阵建模空间相关性。图注意网络自适应的给予邻居节点不同的关注度,体现了动态的空间结构。图神经网络通常结合序列模型来共同建模交通路网的时空依赖关系。

为了打破在长时间时间序列预测任务缺乏有效捕捉时空特征的能力这一局限性,本发明提出了一种多尺度时空融合图网络预测框架MFSTGN,MFSTGN基于编码器-解码器结构,编码器编码时间序列的周期性特征,解码器重点关注时间序列的趋势性特征,两者进行特征融合预测未来序列。编码器和解码器均由时空图卷积和门控注意力构成。每个时空图卷积模块通过三种不同的图网络分别对空间相关性、时间相关性、空间异质性进行建模,有效的提高了节点之间的消息传递效率。门控注意力对不同类型的特征在时间维度上进行自适应融合,增强了特征表达,减小了误差传播。

本发明主要包括五个部分:(1)确定模型的输入和输入。(2)数据集选取和数据处理。(3)建模交通数据的时空特性。(4)构建多融合时空图网络预测模型MFSTGCN。(5)方法有效性验证。

步骤1:定义交通路网表示,明确本发明中出现的符号和概念,并在此基础上将交通预测问题公式化。本发明将交通路网定义为一个加权有向图G=(V,E,A)。其中V是一个N=|V|的顶点集合,表示道路网络中的传感器。E是边的集合表示顶点之间的连通性,是一个加权邻接矩阵,表示节点和节点的邻近性。

步骤2:确定模型的输入和输出。交通信号是衡量交通状况的重要指标。本发明中将历史时间序列作为图信号表示为X∈RT×N×D,其中T表示时间序列的长度,D是每个节点特征的数量。在时间步t,观察到的图信号表示为Xt∈RN×D。模型的输入有观察到的历史时间序列Xh,Xw,Xd,其中Xh=(Xt-Q,...,Xt-1)∈RQ×N×D表示趋势性依赖,Xw=(Xt-M×7,...,Xt+Q-1-M×7)∈RQ×N×D表示周周期性依赖,Xd=(Xt-M,...,Xt+Q-1-M)∈RQ×N×D表示日周期性依赖,模型的目的是学习一个函数f(·),它可以将Xh,Xw,Xd和G映射到下一个时间步Q的图形信号,Y=(Xt,...,Xt+Q-1)∈RQ×N×D,具体表示如下:

步骤3:划分数据集。本发明将时间粒度设置为5分钟,对于两类交通数据集,将70%的数据用于训练,10%的数据用于验证,其余20%的数据用于测试,并对整体数据集进行Z-Score规范化。

步骤4:嵌入空间相关性、时间相关性以及空间异质性信息。城市交通状况复杂,受多种时空相关性的影响。因此本发明从多种不同的角度描述交通网络,分别对空间相关性、时间相关性、空间异质性建模。

步骤4.1:构建空间图卷积模块。交通网络的固有结构可以反应道路平稳的交通状况。基于预定义的邻接矩阵,本发明专注于一定距离间隔的传感器,并认为它们之间存在直接相关性,在一定程度上可用于相互表示。对原始的交通网络,本发明基于成对的路网距离定义空间邻接矩阵为:

其中表示路网中传感器vi到传感器vj之间的距离,σ是标准差。ε是控制邻接矩阵A的稀疏度的阈值,指定为0.1。加权邻接矩阵可以区分节点之间的相关程度,使节点关注更重要的邻域信息。具体地,通过领域节点的消息传递效应来表示节点的交通流量:

其中,和表示图信号的输入与输出,和都是可学习的参数。φ(·)是ReLU(·)非线性激活函数。是归一化邻接矩阵,其中是带有自循环的邻接矩阵,是度矩阵。空间图卷积模块体现了固有的交通路网结构,提取了最原始的路网特征,在一定程度上表现出有效的预测结果。

步骤4.2:时间图卷积。空间图卷积完全基于由地理近邻性定义的交通网络,然而,道路之间的影响关系要复杂的多,道路上的车辆密度、人口密度、交通状况呈现出动态的变化趋势,并且存在交通事故等突发性事件。因此,将道路距离作为连接两点的权重无法有效的建模时间相关性。因此本发明提出了一个时间图卷积去自适应学习时间序列数据之间的隐藏关系。首先,使用流量点积机制建模两个节点之间的相关性:

其中,表示节点i、j在t时刻第L层的相关性,表示节点i在t时刻第(L-1)层的特征表示,和表示可学习的参数。接着,构建自适应邻接矩阵:

其中,表示节点i、j在t时刻第L层的相关性分数。基于相关性分数,可将节点i处的图信号聚合为:

其中表示节点i在t时刻第L层的特征表示,它将当前时刻邻居节点的信息按照不同的权重统一起来。接着,将多个时间步上的图信号连接:

其中,表示Q个时间步的图信号输出。

步骤4.3:建模基于位置编码的趋势图卷积模块。准确描述交通网络的空间异质性,并提取不同道路交通流的变化趋势,有助于精准聚合邻域信息。因此本发明提出了一种基于位置编码的趋势图卷积。具体来说,随机初始化一个节点嵌入矩阵来学习最优的交通网络结构表示。此外,为了体现动态的时间相关性,将历史序列的时间编码。将一天分为M个时间步长,随后使用one-hot编码将一周里的每天编码为将一天里的每个小时编码为随后将它们连接在一起为从而得到历史时间序列的时间嵌入矩阵通过全连接神经网络分别转化为向量从而得到顶点的时空嵌入矩阵:

ST=φ(SWs)+φ(TWt)

其中是N个顶点在Q个时间步上的时空嵌入表示,也可称为位置嵌入。是可学习的参数。此外,考虑到类别相近的地点通常具有相似的变化趋势,本发明在时间维度上使用长度为3的1D平均池化层获得近期趋势表示。具体地,将其表示为:

Xm=AvgPooL1d(Xin)

其中,表示图信号的输入,是交通流量的趋势表示。接着,图信号Xin,时空嵌入表示ST和流量趋势表示Xm被连接作为趋势图卷积的输入:

其中,是图信号输出,和都是可学习的参数。

步骤5:构建MFSTGN整体模型。在分别嵌入时空编码和趋势图卷积编码后,开始着手于构建MFSTGN整体架构,接下来,从构建图卷积层到构建门控注意力机制两方面介绍。

步骤5.1:构建图卷积层。基于静态距离的图和基于动态节点属性的图从不同的角度反映了节点间的相关性。为了扩大感受野,将两种图卷积进行融合,从多维度观察交通流变化规律。使用GRU为了自适应地融合空间和时间表示,对于时间步长t处的所有节点,GRU的操作可以表示如下:

zt=φz(YS[t,:]Wz+YT[t,:]Uz+bz)

rt=φr(YS[t,:]Wr+YT[t,:]Ur+br)

H=concat(ht,…,ht+Q-1,yt+Q)

其中⊙表示逐元素乘法,和都是可学习参数。t时刻交通网络所有节点的时空表示表示N个节点在Q个历史时间步的时空特征。接着,将与趋势图卷积的输出进行连接,进一步增强节点的时空表征能力:

其中,表示STGCN模块提取的交通路网的时空特征,和是可学习参数。

步骤5.2:构建门控注意力机制。不同的时间序列呈现出不同的流量变化趋势,在不同的场景下对预测未来交通状况所起的作用不同。例如,周六早上学校附近的交通状况显然与周序列联系更密切,但是在一些没有明显周期模式的路段,时序列作用更关键。因此本发明使用门控注意力机制在不同的时间序列上聚合消息,这意味着它可以灵活地在时间轴上建模时空相关性。不同时间序列揭示了不同的交通属性,周期性依赖是道路流量长期以来形成的一种稳定的变化规律,趋势性依赖则是短时间范围内可预见的一种交通状况。受注意力机制和门控单元的启发,本发明提出了一种带有门控单元的双向注意机制来融合周期性和趋势性特征。

首先使用全连接层将输入转换为对应的Query和Value矩阵,Query有自身和转置两种形态。然后,通过“注意力”操作得到两个注意力矩阵,表示双方互相关注的程度。注意力矩阵与相应的Value矩阵相乘得到对应的全局上下文矩阵,体现了关注的信息量。具体地,这种操作可以表示为:

其中,表示时间步ti和时间步tj之间的关联度。表示时间步ti对时间步tj的重要程度。和表示两种不同可学习的转换方式。Nt表示对应时间序列的所有时间步。表示节点vi在x序列的ti时间步聚合了变量h序列所有时间步的信息:

其中是变量h对应Value矩阵的非线性变换。同上述公式原理相同,得到变量h序列对变量x序列的关注:

其中表示节点vi在h序列的ti时间步聚合了变量x序列所有时间步的信息。

接着,利用两个输入得到一个门控单元来控制双方的稀疏程度:

更新得到节点vi在ti时间步融合后的信息表示:

其中Wo、Uo和是可学习的参数。

步骤6:MFSTGN模型的训练和优化。构建整体模型后,需要对模型进行训练和优化,尽可能的使模型效果达到最佳。本发明使用Adam优化器对模型进行优化,选取MAE、MSE和RMSE作为评价指标,具体的评价指标公式如下:

MFSTGN基于编码器-解码器架构,编码器用来提取周期性特征,其中两个STGCN模块分别用来对周周期依赖和日周期依赖在时空方面进行建模,然后将两者通过门控注意力归纳周期性依赖。解码器使用STGCN对趋势性依赖进行时空建模,然后通过时间注意力机制关注更重要的时间步,提高趋势性依赖特征表达能力。周期性依赖和趋势性依赖通过门控注意力进行特征融合,预测未来时间序列。本发明预测精确度高,实现过程不复杂,适用于处理各种复杂的时序数据。

图1是本发明中MFSTGN的整体结构图

图2是本发明中表示复杂交通网络复杂时空特性的展示图

图3是本发明中设计的时空图卷积网络图

图4是本发明中设计的基于门控单元的双向注意机制展示图

图5是本发明中在四个数据集下模型参数分析柱状图

图6是本发明中在速度数据集下的消融实验图

图7是本发明中在流量数据集下的消融实验图

图8是本发明在速度数据集下对模型超参数的折线分析图

图9是本发明在流量数据集下对模型超参数的折线分析图

下面结合附图和实施例对本发明进一步说明。

本发明从城市中分布的传感器中获取交通数据,并对其进行了数据清理,整理过后分别得到了速度、流量、历史时间序列、预测时间序列等具体属性。

步骤1:为解决长时程时间序列预测问题,本发明设计了一种基于多尺度时空融合图网络交通预测MFSTGN。首先确定模型的输入和输出,以及预测目标,随后选择合适的数据集,并对数据集进行合适的划分。模型是由Pytorch 1.8.0在一个拥有24G内存的NvidiaGeForce RTX 3090GPU的虚拟工作站上实现的。通过Adam优化器对模型进行训练,初始学习率设置为0.01,批量大小设置为64,模型维度设置为64。按照通用的划分标准,70%的数据用于训练,10%的数据用于验证,其余20%的数据用于测试。给定图G=(V,E,A)和观察到的历史时间序列Xh,Xw,Xd。其中Xh=(Xt-Q,...,Xt-1)∈RQ×N×D表示趋势性依赖,Xw=(Xt-M×7,...,Xt+Q-1-M×7)∈RQ×N×D表示周周期性依赖,Xd=(Xt-M,...,Xt+Q-1-M)∈RQ×N×D表示日周期性依赖,去学习一个函数f(·)可以将Xh,Xw,Xd和G映射出下一个时间步Q下的图信号Y=(Xt,...,Xt+Q-1)∈RQ×N×D,具体表示为:

步骤2:数据预处理。所提取的交通数据通常情况下会存在异常值和一些噪音,采用标准化处理可以间接通过中心化避免异常值和极端值的影响。本发明中对整体数据集进行Z-Score规范化处理。

步骤3:定义路网信息。本发明将交通路网定义为一个加权有向图G=(V,E,A)。其中V是一个N=|V|的顶点集合,表示道路网络中的传感器。E是边的集合表示顶点之间的连通性,是一个加权邻接矩阵,表示节点和节点的邻近性。

步骤4:输入嵌入信息。交通网络是一个具有复杂空间相关性和非线性时间相关性的网络空间,本发明为更好的获取交通网络潜在的时间相关性和复杂的空间异质性,因此本发明将从多种不同的角度描述交通网络。如图3所示,本发明设计了一种新颖的时空图卷积网络,分别对空间相关性、时间相关性、空间异质性建模,既能记忆交通路网的固有结构,也能捕捉节点之间动态变化的相关性,还可以从一个平稳的角度提取不同地点交通流量变化趋势。首先,对原始的交通网络,本发明基于成对的路网距离定义空间邻接矩阵为:

其中表示路网中传感器vi到传感器vj之间的距离,σ是标准差。ε是控制邻接矩阵A的稀疏度的阈值,指定为0.1。通过领域节点的消息传递效应来表示节点的交通流量:

其中,和表示图信号的输入与输出,和都是可学习的参数。φ(·)是ReLU(·)非线性激活函数。是归一化邻接矩阵,其中是带有自循环的邻接矩阵。是度矩阵。空间图卷积模块体现了固有的交通路网结构,提取了最原始的路网特征,在一定程度上表现出有效的预测结果。

步骤5:建模时间图卷积模块。空间图卷积完全基于由地理近邻性定义的交通网络,但道路之间的影响关系很复杂,将道路距离作为连接两点的权重无法有效的建模时间相关性。因此本发明提出了一个时间图卷积去自适应学习时间序列数据之间的隐藏关系。首先,使用流量点积机制建模两个节点之间的相关性:

其中,表示节点i、j在t时刻第L层的相关性,表示节点i在t时刻第(L-1)层的特征表示,和表示可学习的参数。接着,构建自适应邻接矩阵:

其中表示节点i、j在t时刻第L层的相关性分数。基于相关性分数,可将节点i处的图信号聚合为:

其中表示节点i在t时刻第L层的特征表示,它将当前时刻邻居节点的信息按照不同的权重统一起来。接着,将多个时间步上的图信号连接:

其中,表示Q个时间步的图信号输出。

步骤6:建模基于位置编码的趋势图卷积模块。准确描述交通网络的空间异质性,并提取不同道路交通流的变化趋势,有助于精准聚合邻域信息。因此本发明提出了一种基于位置编码的趋势图卷积。首先随机初始化一个节点嵌入矩阵学习交通网络结构表示。随后将一天分为M个时间步长,随后使用one-hot编码将一周里的每天编码为将一天里的每个小时编码为再将它们连接在一起为从而得到历史时间序列的时间嵌入矩阵通过全连接神经网络分别转化为向量从而得到顶点的时空嵌入矩阵:

ST=φ(SWs)+φ(TWt)

其中是N个顶点在Q个时间步上的时空嵌入表示,也可称为位置嵌入。是可学习的参数。此外,近期趋势表示为:

Xm=AvgPooL1d(Xin)

其中,表示图信号的输入,是交通流量的趋势表示。接着,图信号Xin,时空嵌入表示ST和流量趋势表示Xm被连接作为趋势图卷积的输入:

其中是图信号输出,a和都是可学习的参数。

步骤7:构建MFSTGN整体模型。为了从多个时间序列中提取有价值信息进行,并消除冗余信息,本发明依次提出了图卷积层模块和门控注意模块,两种时间序列在时间维度上进行信息融合从而增强特征表达能力。接下来,从构建图卷积层到构建门控注意力模块两方面介绍。

步骤7.1:构建图卷积层。基于静态距离的图和基于动态节点属性的图从不同的角度反映了节点间的相关性。为了扩大感受野,将两种图卷积进行融合,从多维度观察交通流变化规律。使用GRU为了自适应地融合空间和时间表示,对于时间步长t处的所有节点,GRU的操作可以表示如下:

zt=φz(YS[t,:]Wz+YT[t,:]Uz+bz)

rt=φr(YS[t,:]Wr+YT[t,:]Ur+br)

H=concat(ht,…,ht+Q-1,yt+Q)

其中⊙表示逐元素乘法,和都是可学习参数。t时刻交通网络所有节点的时空表示表示N个节点在Q个历史时间步的时空特征。接着,将与趋势图卷积的输出进行连接,进一步增强节点的时空表征能力:

其中表示STGCN模块提取的交通路网的时空特征,和是可学习参数。

步骤7.2:构建门控注意力模块。不同的时间序列呈现出不同的流量变化趋势,在不同的场景下对预测未来交通状况所起的作用不同。受注意力机制和门控单元的启发,本发明提出了一种带有门控单元的双向注意机制来融合周期性和趋势性特征。

首先注意力矩阵与相应的Value矩阵相乘得到对应的全局上下文矩阵,体现了关注的信息量:

其中,表示时间步ti和时间步tj之间的关联度。表示时间步ti对时间步tj的重要程度。和表示两种不同可学习的转换方式。Nt表示对应时间序列的所有时间步。表示节点vi在x序列的ti时间步聚合了变量h序列所有时间步的信息:

其中是变量h对应Value矩阵的非线性变换。同上述公式原理相同,得到变量h序列对变量x序列的关注:

其中表示节点vi在h序列的ti时间步聚合了变量x序列所有时间步的信息。

接着,利用两个输入得到一个门控单元来控制双方的稀疏程度:

更新得到节点vi在ti时间步融合后的信息表示:

其中Wo、Uo和是可学习的参数。

步骤8:MFSTGN模型的训练和优化。本发明使用Adam优化器对模型进行优化,选取MAE、MSE和RMSE作为评价指标,具体的评价指标公式如下:

为了明确建模空间相关性以及显式周期建模的必要性,本发明对四个数据集进行了统计分析。图5展示了四个数据集上的节点相关性、周期相关性以及交通速度的分布情况。

进一步评价MFSTGN中各个组件的有效性,本发明在NE-BJ和PEMSD8两个数据集上进行了消融实验。四种变体与MFSTGN在相同的条件下进行了多次实验。图6和图7展示了未来一小时内模型的平均预测结果,以及在十二个时间段上预测性能的详细结果。实验结果表明,基于位置编码的趋势图卷积模块和基于门控的注意力机制模块对模型的性能至关重要,它们作为基石以帮助MFSTGN取得更好的预测性能。

为了进一步研究超参数设置对模型性能的影响,本发明在NE-BJ和PEMSD8数据集上对MFSTGN的模型维度d和注意力头的数量k展开研究。将每个实验重复三次,并报告测试集指标的平均值。图8和图9分别显示了在NE-BJ和PEMSD8数据集上的实验结果。

本文发布于:2024-09-25 02:26:21,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/73201.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议