基于公交IC卡的数据挖掘技术概述

基于公交IC卡的数据挖掘技术概述
闻  千
学号:********
摘  要:获取公交客流信息是公交管理工作的基础,它不仅为日常调度提供依据,
也为线网优化提供了参考。公交规划部门和公交经营者必须能够深入了解城市居
民的公交出行特征,及时、准确、全面地掌握公交出行数据,才能做出科学的公
交规划和运营决策。公交数据采集和分析技术正是为公交运营决策提供及时、准
确、可靠的公交运营信息和客流信息的重要方法。因此,一种快速高效的公交数
据采集分析方法,对建立高效合理的城市公交系统具有决定作用,对确立城市公
交的主体地位具有重要意义。公交IC卡数据挖掘技术正是这样一种快速高效的数据采集分析方法,如何处理分析挖掘这些海量公交lC卡数据以获取公交客流信息正是此文研究的目的。
关键词:公交IC卡;聚类分析;数据挖掘;客流
道路交通系统是一个有人参与的、时变的、复杂的非线性大系统,其显著特点之一就是具有高度的不确定性。城市公交系统能否正常和高效地运营,不仅取决于道路和车辆等设施条件,更有赖于运营管理手段和技术手段的先进性。对公交客流的全面、准确把握是公交管理工作的基础,它不仅为日常调度提供依据,也为线网优化提供了参考。公交规划部门和公交经营者必须能够深入了解城市居民的公交出行特征,及时、准确、全面地掌握公交出行数据,才能做出科学的公交规划和运营决策。
公交数据采集和分析技术正是为公交运营决策提供及时、准确、可靠的公交运营信息和客流信息的重要方法。快速高效的公交数据采集分析技术,对建立高效合理的城市公交系统具有决定作用,对确立城市公交的主体地位具有重要意义。手机系统检测
公交IC卡、乘客自动计数系统(APC)等先进技术的应用可以取代传统的调查方法,获取相对实时动态的客流信息。公交IC卡在国内许多城市都有应用,不仅方便了广大乘客,也提供了一种新的客流调查统计手段。IC卡信息量大且全面,技术简单成熟,但目前其作用未得到充分开发。如何充分挖掘IC卡信息,利用IC卡收集的有效数据,为日常调度管理及线
网优化服务,成为目前一个比较热门的研究领域
gu10灯头1 数据挖掘的目标
数据挖掘的目标是从已知的数据中发现隐含的、有意义的知识。通过对公交IC卡数据分析,可获得城市居民公交出行特征信息以及公交客流量信息,为公交规划及公交运营管理者提供决策支持。
本文拟通过对公交IC卡数据进行挖掘,从而获取有价值的公交出行信息。具体工作包括:
(1)线路站点上下车人数统计
(2)客流量统计分析
(3)线路客流量预测。
2 站点上下车人数统计
全国大多数的城市公交采用全线一票制,下车不需要刷卡,因此刷卡数据没有关于下车站
点的记录,不能用判断上车站点的方法,通过刷卡时间判断下车站点。但是由于公交定线定站的运营特征,以及城市居民的出行特点,决定了公交出行在路线的选择和客流的分布上具有一定的规律性和稳定性。
公交乘客每日出行具有偶然性,有时不以通常的线路或交通方式出行,下车站点可采用短期规律和长期归纳相结合的方法。城市居民一日的出行通常具有回归性,即从居住地出发、到居住地结束,使得公交出行站点具有对称特征。以上班出行为例:某人由居住地刷卡乘车到达工作地,完成第一次出行,此时只知道上车站点而不知道下车站点。乘客下班开始第二次出行,由工作地刷卡上车,此次出行的起点站一般可认为是第一次出行的终点。利用多日的数据可帮助判断乘客的出行终点。因此,对每个乘客刷卡数据进行逐个分析,通过上车站点与下车站点的空间关系就能确定下车站点。
2.1 上车站点判断
防辐射屏聚类分析就是将待分析数据根据一定的分类规则,合理地划分数据集合,确定每个数据所在类别。
这里采用聚类分析,是对公交IC卡数据信息中某公交车某一趟运营刷卡记录的分析,由此来确定乘客的上车站点。基本思路是:把每个刷卡记录看作一个样品,刷卡时间作为样品的属性,车辆在某一站最后一个上车刷卡乘客的时间与其下一个站第一个上车刷卡乘客的时间间隔作为类与类之间的距离T,将连续两个刷卡时间间隔小于T的记录归为一类,即归为在同一个站点上车,设线路站点数为N,则把整个记录分成N类。按照时间序列,对这N类进行排序,通过一一对应的关系对应到线路运营站点表,从而得到乘客的上车站点。
利用聚类分析确定上车站点的过程中,T值的选择是关键,过大与过小都会导致上车站点判断错误。如果T取值过大,当公交车在两个站之间运行时间小于这个值时,则会错误判断为这两个站点的刷卡记录属于同一类,即在同一站点上车。如果T取值过小,当同一个站点上车乘客较多、刷卡时间间隔较长时,则可能出现将同一个站点的刷卡记录错误判断为属于不同的类,即认为在不同站点上车。通常根据公交车平均行驶速度与站点间距推算T。
2.2 基于单张卡的下车站点推算
对大部分的公交出行者而言,其上车站点和下车站点总是相互转换的,即回程时的上车站
点就是出发时的下车站点,而出发时的上车站点又是回程时的下车站点。以公交乘客完成一次出行目的作为一次出行,一次出行的第一次刷卡站点作为出行起点,最后下车站点作为出行终点,之间的刷卡站点作为换乘站点。
判断出乘客的换乘站点和出行终点就可以了解某乘客的出行路径。判断乘客的换乘站点和下车站点采用短期规律和长期归纳相结合的方法。公交乘客每日出行具有偶然性,有时不以通常的线路或交通方式出行,此时上面的方法就遇到了困难。公交IC卡信息记录的是乘客很多天的出行数据,一段时间来说乘客的出行路径是基本不变的。利用多日的数据可帮助判断乘客的出行终点。
因此,对同一张IC卡号而言,在连续的两次刷卡记录中,后一次刷卡记录中的上车地点是上一次出行的下车地点,可以通过以下步骤获得下车站点和下车时间:母鸡接鸡蛋
(1)首先,从IC卡数据库中出目标卡号在下一次出现时的汽车编号和刷卡时间,通过上车站点的推算方法可以获得此时刷卡的站点。
(2)然后,根据汽车编号、上一步所求的站点及上一次刷卡时间,可以得到在该次车辆运行班次行程内车辆到达站点的时间,此时间即为该乘客上一次出行的下车时间。
3 客流量统计分析
对公交IC卡进行挖掘,能得到用于公交规划的重要指标包括:线路全天客流量、线路高峰小时客流量、线路全天和高峰小时直达乘客客流量、线路全天和高峰小时直达乘客出行矩阵等。
3.1 线路全天客流量海藻生姜洗发水
线路全天客流量反映了线路的经济效益情况也是预测规划年线路客流量必需的基础资料。
3.2 高峰小时客流量
公共交通定位于服务城市居民日常出行,根据居民出行特征分析,得知公交出行存在早晚两个高峰(其中又以早高峰更为显著),并且大部分线路高峰与平峰的客流量差别较大。满足短时间内运送大量乘客到达目的地的居民出行需求,对公交提出了较高的要求。另外,规划年高峰时段的客流量和服务水平决定了线路的配车数,因此高峰小时客流量是一个必须得到的基础性指标。
高峰时段客流量的计算:首先是利用全日客流量数据确定调查线路的高峰小时。不同线路的高峰小时不太一致,主要是由于城市规模大,区域差别大的原因,比如郊线和市区线路的高峰小时到来和结束的时刻就不一致。具体步骤为:先将调查线路全部车辆的全日刷卡记录存储到一个选择集A中,对记录分组。分组原则为:从清晨线路第一辆车的发车时刻开始,每隔15分钟分成一组,统计各组记录条数,得到各组的持卡客流量。要确定高峰小时,须对小组重新合并。合并原则为:从第四组开始对其上面四组合并,每四小组合并为一大组,统计各大组的记录条数。其中
然后,出最大值手机应急充电器,所对应的时间段,即为高峰小时。
3.3 路段不均匀系数
路段不均匀系数表示统计时间内某一路段的客流量占线路总流量的比例。
路段不均匀系数=第路段客流量/全线单向平均客流量。
可以通过计算路段客流不均匀系数确定区间车开设的必要性。路段客流不均匀系数大于1,就可以视为高峰路段,若路段客流不均匀系数在1.2~1.4,属于正常调节范围,不一定开设区间车;若大于临界值1.4时,就有开设区间车的必要。
3.4 方向不均匀系数
方向不均匀性指一条公交线路同一时段内上行和下行方向客流的不均衡性,方向不均匀系数体现公交线路上下行两个方向客流量差别。在已知上、下行方向的客流量情况下,可以通过计算各时段的高单向客流量与平均单向客流量之比,求得客流的方向不均匀系数Ka。
在现有条件下,线路客流的确定比路段简单易行,且数据较为精确。将数据库中单条线路某日的IC卡记录表与该线路当日的行车调度表以车辆号相关联,即可判断上、下行方向的客流量,进而计算得方向不均匀系数Ka。
3.5 日变动系数
日变动系数表示一个月中星期序号相同日期的日客流量平均值与月平均日客流量之比。
                          式(3-1)
式中:为星期序号,周一到周日分别为从1到7;为当月所含星期序号的个数;为第月份的客流量;为第月份的天数。
3.6 月波动系数
定义月波动系数来描述一年12个月之间的公交客流量差异,表示月平均日客流量与该年平均日客流量之比。
                                  式(3-2)
式中:为一年中各月份的客流量;为一年的日历天数,365或366天;,与的含义与前式相同。
4 基于BP神经网络的线路客流量预测
准确地做出公交线路客流的预测是实现公交运营调度优化的基础。在提前掌握客流变化规律的情况下,才能做到科学地制定运营计划,合理地调配使用人、车资源。但在实际的运营调度管理中,因为缺乏定量实用的分析预测手段,大多依靠经验和直觉来判断客流的变化,预测的结果同实际往往有着较大的偏差。产生偏差的原因是公交线路客流变化的复杂性和随机性。除去复杂性和随机性,公交线路客流变化的另一重要特性是周期性。常规公交线路客流一般呈7天一个周期循环变化。抓住客流周期性变化的特点,结合神经网络适合描述复杂随机事物变化规律的特点,有人提出了一种基于BP神经网络理论的公交线路客流
预测模型,应用该模型可以较为准确地预测的线路客流变化,同时间序列模型相比,该模型具有较强的自适应性,预测的精度较高,是一种能较好满足运营调度管理需要的线路客流预测模型。
5 结束语
城市公交IC卡记录的是城市居民乘车的刷卡信息,包括刷卡时刻、乘车线路等,而进行城市公共交通优化所需要的乘客平均出行次数、起讫点分布、出行时间、换乘次数、出行距离等信息,与IC卡记录的原始信息有很大差别。

本文发布于:2024-09-26 04:24:42,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/174142.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:公交   出行   站点   线路
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议