基于神经网络的OD分布矩阵反推方法

基于神经网络的OD分布矩阵反推方法
MUSSONE Lorenzo;MATTEUCCI Matteo
【摘 要】以道路网络的路段流量为基础进行OD分布矩阵估计.与以往文献不同的是本文应用了多层前馈神经网络的方法.由于路段流量与相关的OD矩阵分布之间存在连续性关系,这为神经网络模型的逼近特性提供了可行性.本文的方法适用于OD分布矩阵的实时校正.在已知OD分布矩阵的前提下,对两种情境——试验网络和实际Naples 农村道路网进行仿真分析.主成分分析法的应用减少了变量个数并有利于改进输入数据.估计误差相对较低,与分析方法相反的是处理的时间几乎是实时的,因此这种方法可用于动态交通管理.本文的神经网络方法在误差和计算时间方面优于传统商业软件得到的OD估计结果.
【期刊名称】《交通运输系统工程与信息》
【年(卷),期】2013(013)004
【总页数】11页(P84-93,133)
【关键词】城市交通;OD分布矩阵估计;神经网络;主成分分析法;路段流量;方差稳定性
矩阵干扰【作 者】MUSSONE Lorenzo;MATTEUCCI Matteo
【作者单位】米兰理工大学建筑环境科学与技术系,米兰20133,意大利;米兰理工大学米兰理工大学电子信息系,米兰20133,意大利
【正文语种】中 文
【中图分类】U491;U268.6
20世纪80年代中期以来,为了解决从空间预测和时间序列预测两类研究领域中产生的道路流量问题,城市网络分析取得了较为显著的进展.
空间预测通常利用全部或部分OD分布矩阵来预测道路流量,其中,OD分布矩阵反映了起点和终点(也称为矩心)之间的交通需求.尽管许多OD之间缺乏联系,而且OD分布矩阵通常是稀疏的,但空间预测的维度与矩心的数量相关.多数动态平衡的规划方法都是基于OD分布矩阵的.然而,构建OD分布矩阵通常需要实地调查,这种调查费用较高而且难以再现.因此,多年来,研究人员一直在探索通过路段流量来估计OD分布矩阵的新方法和实施手段,这种方法的费用通常也较低.
同时,基于自回归(Auto Regressive,AR)、移动平均(Mobile Average,MR)和其变形形式[1]及神经网络[2]的时间序列预测方法也得到了发展.尤其是,在城市道路网络中,流量预测需要对路段流量或交叉口的转向比例进行处理,得到的结果较为满意.在噪声敏感和无法识别的数据分析模型中,神经网络具有较高的可操作性.神经网络的研究文献和专业软件数量很多,其中,Mussone[3]综述了神经网络在交通领域的研究进展.
研究人员一直在尝试解决OD分布矩阵的估计问题.其中一些方法基于熵最大化的思想. Gong[4]以Hopfield神经网络为工具来解决相关的优化问题.一些学者则最大化地分散所有有效路径的出行分布;另外一些模型基于客观的OD分布矩阵,但尚未兼顾到估计矩阵与实际矩阵之间的差异[5].随后,Fisk[6]将此模型应用到拥堵网络中,然而非凸和非微的特征给这种双层规划方法求得最优解带来了一定的困难.
Florian和Chen[7]提出通过界定OD分布矩阵的校正来求得最优解的启发式算法.其它一些方法的基础模型中结合了变量数据的统计特性,例如Cascetta[8]使用的方法是广义最小二乘法,Bell[9]使用的方法是广义最小约束二乘法,Cascetta和Nguyen[10]概述了基于统计数据的OD分布矩阵估计方法,包括广义和约束最小二乘法及贝叶斯型的似然估计.
既有文献中对OD分布矩阵的动态特性进行建模的方法包括时空轨迹[11]、随机漫步模型[12]和时间序列[13]或者基于实际与历史OD偏差的自回归方程[14],一些学者[12,15]也运用Kalman滤波算法对动态映射进行建模和估计[16].这方面的研究成果还包括最小二乘法的不同分式、非分配与动态交通分配的嵌套模型[17]等,这些方法都有较为广泛的应用[18].
递归和非递归形式的神经网络通过使用或者弃用时间作为明确变量来解决函数逼近问题,是解决OD分布矩阵估计问题的常用工具.事实上,路段流量与OD值的连续性关系值得注意,Yang等[19,20]介绍了神经网络在OD分布矩阵估计中的具体应用.两个案例中的OD分布矩阵估计基于预测和监测流量之间的方差最小.第一个案例中运用前馈神经网络对最小化进行求解,第二个案例涉及的日本阪神高速具有坡度较多的特点,因为实际的动态OD矩阵是未知的,只能将预测结果与静态矩阵进行比较,因此实现精度评估非常困难.Kikuchi和Tanaka[21]将神经网络应用于高速公路出入口匝道的持续性监测中.
本文旨在通过道路网络的路段流量,基于神经网络方法对OD分布矩阵进行估计,并对Chang和Tao[17]提出的OD分布矩阵的非分配方法有所改善.本文通过多层前馈神经网络的逼近特性对OD分布矩阵进行估计,路段流量与OD值的连续性关系用连续函数来描述,由于前馈神经
网络的学习机制,OD分布矩阵和相关路段流量需要训练样本集,Naples大学的虚拟实验室的交通研究小组[22]提供了所必需的信息.
本文假设使用新路段流量的待估计的OD分布矩阵与神经网络学习阶段的数据结构类似,因此,可以对OD分布矩阵进行修正.这种方法虽然具有局限性,但是适用于交通供给(路段完全或部分关闭)或需求(社会动乱或其它状况)发生不可预知的变化时的特殊情景.特别是在虚拟实验室对交通场景进行模拟时,异常或可预测的变动也可体现在神经网络模型中.
与所有神经网络模型一样,该方法的运行时间较短,由于输入数据规模可能较大,因此,采用主成分分析法来减少输入数据的规模.该方法的另一个优势是在部分路段流量未使用时(模拟实际中一些措施无效时),可以测试模型的鲁棒性.
本文第二部分分析了应用神经网络方法之前对数据进行分析和预处理的过程,着重对建模过程和应用方法进行分析性描述,以期提高模型的计算精度.第三部分介绍了试验场景,交通网络、OD分布矩阵和路段流量,为训练神经网络提供了必要数据,同时这一部分也给出了训练结果.第四部分为交通网络的验证结果,最后一部分为结论和未来的研究方向.
本文所采用的方法中,使用神经网络方法来进行OD分布矩阵的非线性极大似然估计.进行合理估计的第一步是尽可能简单的训练网络,从这个角度来说,基础性工作包括对数据(OD分布矩阵和路段流量)进行去干扰和标准化.
随后,为获得较好的时间序列拟合模型,过程稳定性和数据降维这两个问题需要重点考虑.这两个问题在道路交通中是相关的,因为流量是动态的,并且路段流量(与路段数量成正比关系)的规模非常庞大.
2.1 过程稳定性
北京个别患者出现非典型症状过程稳定性与稳定的必要条件相关,或者与过程均值和方差之间的稳定性关系相关.既有文献对稳定性进行了定义,但由于需要在时间分布上进行无限的假设[1],因此实现观察过程的统计稳定性是不切实际的.可以通过一个更简单的方法来降低二阶统计量(OD分布完全可以描述成前两个时刻的分布)的稳定性,需要一个常数期望值E[(v(t))]=m,∀t,其中v(t)是观测OD量,m是常数,以及一个独立于特定时间(即它只取决于时间差τ=t2-t1)的协方差函数γ(τ)=E[(v(t)-m)(v(t+τ)-m].本文采用这种弱稳定性来假设每个OD值的期望值和相对方差与时间变化无关,它们仅取决于通过非线性函数计算的实际路段流量.
弱稳定过程与传统最小二乘法的最小化方法是密切相关的.由于误差函数,通过反向传播的学习神经网络权重(w)涉及到此结构,即训练步骤最小化(这是经典的反向传播或其它训练方法)是K维(K值为OD数)目标值vn和网络输出yu的误差平方之和.
通过误差函数学习的方法与神经网络参数(即权重)的最大似然估计是等价的.假设v(即OD值)是y(w,x)(即神经网络输出)的错误值,高斯噪声ε~N(0,Σ),v1,v2,…,vn是OD多元高斯分布v~N(y(w,x),Σ)的样本,这个分布的均值是y(w,x),常数协方差Σ与y(w,x)无关.
金瓶梅 (10)计算均值的最大(对数)似然估计(即神经网络OD最大似然估计的权重),结果表明,它与传统的最小二乘法是等价的.
高行健
当过程不稳定时(例如,测量中的非对称误差或噪声或者Σ与y(w,x)在某种程度上是相关的),这种学习方法不再适用,因此,需要一定规模的预处理过程来使输入稳定化.
实际的时间序列的非稳态条件通常取决于可以被识别和移除的确定性成分,典型案例包括线性趋势和周期性(如每天、每周或每年)等.
若去除趋势和周期性影响后,输入仍然不稳定,则应该对输入的均值与方差之间的关系进行研
究,这种关系的典型案例是协方差Σ是均值y(w, x)的某种函数(例如,均值经常随着方差的增加而增加)的情况下,对于这种情况,采用表1的方法对方差进行稳定性变换通常比较有效.
2.2 通过主成分分析法进行数据降维
神经网络学习和建模过程中涉及到的第二个问题即维数灾难[24].神经网络在高维空间里的学习是困难并且容易出错,通常的做法是对数据进行预处理,减少输入和(或者)输出基数.处理交通网络时,流量与网络中路段数量有关,在复杂的神经网络中的这个路段数量会非常庞大.
由于可用样本与路段流量是高度相关的,可以利用这种特性来降低输入维度,这样做仅仅会失去少量信息.主成分分析法[25]通过信号方差的形式保存信息来进行降维,成分数量可以直接选择或将其定义为保留了定量方差的成分数量,下面的试验保留了99%的方差,输入数据的降维效果非常显著.
主成分分析法通常采用奇异值分解(SVD)算法来分解数据集X,即X=USV′.S是对角矩阵,维数等于X中的主成分数量(每一个对角元素的特征值与特征向量相关),V′行是主成分,U是数据在主成分空间的投影,通过减少U的列数来获得约化表示.
3.1 模拟器
试验过程中的场景测试使用的是意大利Naples大学交通研究小组研发的“Federico II”道路网络模拟软件包,模拟器能够重现特定交通需求的动态车流.模拟器的操作工具有:
·机动性需求特征的定义;
三星c188·由美国马萨诸塞州的麻省理工学院研究的微型模拟器——传播流量的MITSIM软件;
·更新估计出行时间的模型,每天的出行时间更新了路径的效用集合;
·路径选择模型.
试验设置要求定义运输系统、运输需求和供给,对每个模型和步骤必须进行校准.因此首先采用6个节点(其中包含3个矩心)和12个路段组成的试验网络,如图1所示.为了使试验场景更加符合实际,需要对实际的土地利用情况进行系统调查,包括人口特征、活动地点和实际运输供给.土地利用情况的背景是Naples全省的农村网络(简称“Naples网络”),如图2所示.网络包括994个节点(其中包括48个矩心)以及1 363个路段(除没有循环流的路段之外为1 190个).

本文发布于:2024-09-20 20:25:48,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/697026.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:矩阵   分布   方法   进行   流量   神经网络   路段
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议