基于上海轨道交通刷卡数据的乘客出行模式研究

基于上海轨道交通刷卡数据的乘客出行模式研究
JIN Yu
【摘 要】乘客出行模式研究是深入认识城市交通的基础性工作,也是交通规划的重要技术支撑.基于上海轨道交通刷卡数据分析网络客流特征,以轨道交通出行全过程出行链视角对进出站客流量、站间客流量、乘距等出行要素的空间模式开展研究,发现上海轨道交通进站和出站客流量分布均呈现对数正态分布特征,乘客乘距服从负二项分布特征.研究同时发现,相比于幂律分布,上海站间客流量分布更加适合采用对数正态分布拟合.此外,工作日客流和周末客流在空间分布总体形态上较为接近,工作日客流分布更为集聚,周末客流分布则更为离散.
【期刊名称】《都市快轨交通》
【年(卷),期】2019(032)003
【总页数】6页(P91-96)
【关键词】交通规划;轨道交通;出行模式;幂律分布;对数正态分布阻尼系数
【作 者】JIN Yu
【作者单位】
【正文语种】中 文
【中图分类】U231
发展轨道交通是特大城市缓解交通拥堵、带动城市发展、减少环境污染的重要措施。目前我国已有30余座城市开通运营轨道交通,运营里程逾5 000 km;已有43座城市的约8 600 km的轨道交通建设规划获得国家批复,在建里程超过3 000 km[1]。国内掀起了新一轮轨道交通建设的热潮。面对高涨的建设热情和高昂的建设成本,轨道交通规划领域相关的基础性研究工作显得愈发重要。
既有规划方法中多通过发放居民出行问卷调查的统计抽样方法来分析现状客流模式。借助大数据分析技术,尤其是目前已经十分成熟的刷卡数据,可快速提取轨道交通出行的全样本数据,进而分析轨道交通客流出行的基本模式。
关于人类出行模式的定量研究兴起于21世纪初《自然》杂志的一系列研究论文。2006年,Brockmann等人对人类长途旅行行为开展定量分析,发现人类长途旅行出行中,距离分布衰减服从幂律分布[2]。2008年,González等人利用约10万匿名手机用户连续6个月的使用数据,发现手机用户出行特征可用截断的幂律分布予以拟合[3]。随后几年,轨道交通的客流出行模式开始逐渐进入研究视野。例如,2008年,Lee等人基于韩国首尔轨道交通2005年6月24日的交通卡数据,分析了380座轨道车站、约490万居民出行客流特征,发现站间出行量分布呈现幂律分布,进出站量服从对数正态分布[4]。2010年,Soh等人分析了新加坡轨道交通和常规公交系统的客流空间分布特征,发现轨道站间客流呈现出幂律分布特征[5]。2011年,Roth等人基于伦敦交通卡一周的数据分析,发现站间客流量呈现幂律分布,而站间出行量则服从负二项分布[6]。2016年,Xu等人利用北京地铁203座地铁单日客流进行分析,发现北京地铁站间客流量分布亦存在幂律分布特征[7]。轨道交通客流出行模式已有研究见表1。
分离定律
已有研究基于国际上多个轨道交通大都市的客流数据,分析了不同阶段客流的空间分布特征,但仍缺乏轨道交通出行链全过程的系统分析,对于工作日和周末两个典型时间的客流差别分析亦十分有限。本文立足已经形成网络化运营的上海轨道交通刷卡数据,以工作日
和周末两个特征时段轨道交通乘客“进站—站间出行—出站”全过程出行链的空间分布模式为研究内容,利用统计分析方法开展定量研究。在此基础上,从轨道交通客流出行模式本源角度,对国内城市轨道交通的规划建设提出相关建议。
上海轨道交通经过20余年的快速发展,已经建成超过600 km的超大型运营网络。以2014年上海轨道交通285座车站为研究对象,选取2014年8月份某一周的周三和周日分别约500万人次和380万人次的智能交通卡刷卡数据进行分析。通过刷卡数据,首先生成285座车站的进站客流量S·i和出站客流量Sj·数据,随后计算生成任意两座车站间的站间客流量矩阵W={wij},最后利用车站空间关系计算出任意两座车站间最短距离数据,并以此生成乘客乘距矩阵D={dij}。轨道交通出行链如图1所示。
前列舒安
交通研究中对于进出站客流这类计数数据通常使用泊松分布等计数模型进行分析。随着统计物理学的发展,幂律分布、对数正态分布的应用也日益频繁。下面逐一作简要介绍。
泊松分布通常用于刻画一定时间或空间内某个特定事件出现次数的统计规律性。在交通领域广泛应用于分析交通流的排队和拥堵、交通事故等问题。泊松分布假设相邻事件发生的间隔时间τ服从负指数分布,即p[τ]=λe–λτ,进而泊松分布可以表达为
泊松分布具有的一个重要特性是平稳性,即事件以某一平均速率发生,相邻事件的平均时间或空间间隔差异不大。
钻机转盘
中国图书馆分类法实际上现实生活中很多事件的分布规律很难用泊松过程来分析,尤其是当相邻事件发生的间隔存在明显的偏离负指数分布的长尾分布特性时。因此,研究人员提出了用具有长尾特征的幂函数来拟合事件发生的时间间隔τ,即p[τ]~τ–α,进而可得到幂律分布
幂律分布的重要特性是标度(α)不变性,即f(cx)= ckf(x)f(x),这意味着f(x)的对数和x的对数之间是线性关系。相比于泊松分布适合于分析个体性质差异不大的系统,幂律分布由于长尾特征更适合模拟现实生活中复杂系统大量存在的不均匀性和差异性。
对数正态分布是指对数为正态分布的任意随机变量的概率分布,即假设Y=ln X服从正态分布,则X服从对数正态分布。其概率密度函数为
幂律分布和对数正态分布具有一定的相似性,即在双对数坐标下散点图均呈现线性关系。将幂律分布两边作对数处理后,可以得到ln Pr[X≥x]=–α ln x+α ln k,可以理解为ln Pr[X≥x]和 ln x间存在线性关系。对于对数正态分布,两边作对数处理后,可以得到 ,当σ很大时,ln f(x)和ln x间近似满足线性关系。
工作日日均进站量和出站量约1.76万人次左右,周末日均进站量和出站量约1.34万人次左右,约为工作日客流的76.1%。相比于工作日数据,周末数据方差更小,但数据在低值和高值的出现频率高于工作日,具有一定“两级分化”特征。值得注意的是,周末进出站客流最大的站点较工作日进出站客流大8.0%~9.0%。例如,工作日进站客流最大的两个站点为人民广场站(15.45万乘次)和上海火车站站(10.53万乘次),而周末进站客流最大的同样为这两个站点,客流量分别为16.57万乘次和上海火车站站11.29万乘次。轨道交通进出站客流量描述性统计见表2,站点进站和出站客流量分布如图2所示。
将进出站客流量数据作对数处理后,可以看出数据具有对数正态分布特征,工作日和周末进站客流数据的均值分别为4.06×104和3.90×104。相比而言,2008年Lee 等人基于韩国首尔轨道交通数据同样得出进出站数据服从均值为4×104对数正态分布的结论[4],而2014年Xu等人利用北京地铁客流数据则发现进出站客流量服从幂律分布特征[7]。半对数坐标下进出站客流量概率分布及拟合曲线如图3所示。
从站间客流量数据的描述性统计信息来看,80 940 组站间OD对工作日的平均值约为0.006万人次/d,周末的平均值约为0.005万人次/d。工作日最大值为0.76万人次/d,周末最大值
略大于工作日,为0.93万人次/d,均出现在市中心的南京东路站至陆家嘴站。工作日和周末分别有5 841组和7 076组的0值,见表3。
对工作日和周末的数据散点图进行横纵坐标对数处理,可以看出散点图近似服从线性关系。采用幂律分布进行拟合,工作日数据中,当Wij≥412时,数据可用幂律分布拟合,其α值为2.85;周末数据中,当Wij≥138时,数据可用幂律分布拟合,其α值为2.41。这与首尔[4]、新加坡[5]、伦敦[6]、北京[7]等城市已有研究成果类似,如图4所示。
考虑到幂律分布和对数正态分布的相似性,进一步研究表明,上海轨道交通站间客流数据亦可以用对数正态分布进行拟合,对数正态分布的拟合效果甚至优于幂律分布,如图5所示(红线为幂律分布拟合、绿线为对数-正态分布拟合)。
为了比较幂律分布和对数正态分布哪个拟合效果更优,建立下列统计检验:假设对数正态分布拟合效果更好,即H0:站间客流量数据服从对数正态分布。随后,采用Vuong检验[9]进行判别。Vuong检验首先建立两个模型的对数似然比作为统计量R。
式中:LA是对数正态分布假设下的模型拟合似然比,LB是幂律分布假设下的模型拟合似然
比,均采用极大似然法计算得到。对于同样一组数据,如果统计量R取值显著为正或负,说明其中某一个模型拟合效果更优,反之说明两种拟合方法平分秋。因此需要计算R统计量的p值,以确定R是否显著区别于0。如果p很小(通常是0.1或者0.05),那么从统计学意义上说R值是显著区别于0的;反之如果p值较大,那么说明无法判断某一个模型拟合效果更优。本次研究中,p值为0.005,远小于0.05,意味着对数正态分布更加接近于数据的真实分布。实际上,包括在互联网、生物医学在内的诸多领域都已经开始反思幂律分布的适应性。例如,2004年,Mitzenmacher 基于互联网文本大小分布的研究提出,对数正态分布能更好地拟合包括互联网文本大小在内的多种数据分布[10]。
对比站间距离、工作日乘距、周末乘距可以看出,上海轨道交通网络站间距离均值为24.15 km,工作日平均乘距为14.01 km,周末平均乘距为15.02 km,后二者均大幅小于站间距离,方差则显示相反趋势,说明居民实际出行倾向于中短距离,呈现明显的“中短距离集聚”特征,但分布离散程度则更为分散,尤其是周末出行。乘距分布具体特征如下:
1) 乘距分布呈现负二项分布特征。采用负二项分布进行拟合乘距分布数据,工作日数据服从均值为14.07 km、方差为16.78的负二项分布,周末数据服从均值为15.07 km、方差为1
轴流式压缩机7.31的负二项分布。2011年Roth等人基于伦敦轨道交通数据得出乘距分布服从均值为9.28 km、方差为5.83的负二项分布[6]。相比而言,上海轨道交通出行的平均距离更长、离散性更高,一方面原因在于上海地铁网络整体规模大于伦敦地铁(不考虑市郊铁路),另一方面原因在于上海人口基数更大、分布更为离散。
2) 乘距和站间距离散点图交汇于15 km左右。周末客流的距离分布曲线在15 km以内的概率大于站间距离相应的分布概率,在15 km以外周末数据的概率则开始迅速衰退低于站间距离相应的分布概率;工作日客流的距离分布在15 km以内大于周末客流分布,在15 km以外则开始衰退,并低于周末客流的分布概率。3组数据的四分位数比较同样揭示了同样的数据分布规律,周末居民出行客流50%分位数为12.5 km;工作日居民出行50%分位数为12 km。
从伦敦轨道交通数据的分布规律[6]中同样可以观察到类似规律,15 km左右是居民乘距与站间距离分布的交叉点,也是出行概率分布的一个重要分界点,也体现了大部分居民对于地铁出行的忍受限度。在上海15 km的出行半径基本上是中心城边缘到市中心的距离,实际上也是目前地铁网络可以提供的相对舒适的出行半径,同时期上海轨道交通网内平均出
行时间约为35 min,加上车站两端一定的接驳时间,出行总时间为50~60 min,这个时间长度也符合人类出行的基本规律。

本文发布于:2024-09-20 20:49:20,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/585583.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:分布   出行   数据   轨道交通   客流   对数
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议