基于 Python 的单车数据可视化分析研究

基于 Python 的单车数据可视化分析研究
摘 要 :在解决城市“最后一公里”的问题,共享单车起着至关重要的作用,在共享单车以迅猛的势头发展之际,也面临着如借车难、乱停乱放占用公共空间等问题,在早晚高峰时段尤甚。企业缺乏对调度人员、车辆的统筹以及缺乏合理有效的调度策略是导致类似问题发生的“罪魁祸首”,有必要对高峰时期共享单车借还需求通过科学合理的调度策略或方案予以满足。随着大数据的不断发展,开源共享单车数据的出现,本文主要对共享单车用车高峰期的需求预测及调度优化,对数据分析和数据可视化的研究,在Python技术下运用数据可视化工具对共享单车大型数据集进行剖析,对单车的使用进行预测规划,从而为更好地保障共享单车使用用户服务提供有效方法,存在着较高的商业应用价值。
关键词:Python;数据分析;共享单车;数据可视化
中图分类号 :TP274.2 文献标识码 :A脚踏式封口机
1 引言
共享单车,即企业在校园、地铁站、公交车站、居民区、商圈和公共服务区提供的共享单车
服务。这种单车租赁服务模式是一种分时租赁模式。随着城市人口的增加,交通拥堵和环境污染问题日益增多,严重制约着中国城市的发展。而私家车数量的不断增加是许多城市问题的重要原因之一[1],如交通拥堵,噪音污染,能源消耗等。因此,绿出行和公共交通出行的概念被提出。共享单车可以提高道路资源的利用率,缓解道路拥堵,促进节能和减少排放污染,也可以提高城市的健康,提高城市的质量。而共享单车作为一种绿、高效的交通工具,有效地弥补了私家车和公交车的缺陷,带来人们出行共享单车和公共交通的换乘模式,吸引更多的私家车车主更改出行方式,绿出行缓解交通压力,减少空气污染,节约交通资源。共享单车也面临着挑战越来越多,共享单车的私有化一直是个问题。为了一己私利竟给私家车上锁,破解自行车的二维码[2]。增加维护和回收成本,浪费资源,城市空间和资源有限,随意停放会影响城市面貌,阻碍交通。为了抢占市场,一些公司会在自行车上超支。这不仅会造成资源的浪费,还会增加当地自行车停放的压力。损坏的自行车不能及时修复,所以市场上有大量的损坏自行车,也阻碍了用户的使用,造成资源的闲置。自行车停放没有得到很好的管理。共享单车是一种流行的公共交通形式,在数量和规模上都在全球范围内不断增长。共享单车既能满足大量用户的需求,又能适应大城市的节奏。通过研究共享单车的数据可视化,我们可以对用户的骑行时间序列、骑行距离
和骑行速度、地形和天气、站点等进行统计分析、显示和预测。也可以结合天气、性别、年龄、使用方式、站点、路线、自行车数量、骑行时长等多种因素分析它们之间的关系[3]。降低单车再平衡系统的主要运营成本,规划骑行路线,更好地解决城市交通拥堵等问题,预测和规划共享单车的使用,为用户提供更好的服务。从而缓解了交通压力,减少了环境污染。
2 数据可视化
2.1 数据可视化定义及发展历程
数据可视化两个目标是更好地共享和传输数据信息和有效缩短信息传输的时间。这是可视化的最终目的。数据可视化是将大量的数据以图形和图像的形式表现出来,完成利用数据分析和开发工具发现未知信息等处理过程[4]。它涉及计算机图形学、图像处理、计算机视觉、计算机辅助设计等多个领域,成为研究数据表示、数据处理、决策分析等一系列问题的综合技术。这种图形化描述和设计数据的过程通常被称为“数据可视化”。有时可视化的结果可能只是一个柱状图,但大多数时候可视化的过程可能是复杂的,因为数据本身可能是复杂的。一般流程包括“数据采集”—“数据分析与清理”—“视觉设计”,从抽象的原始数据
到视觉图像。
2.2数据预处理
论文数据通过网络获取北京市摩拜单车2022年5月10日至5月24日的订单数据,数据具体参数示例如下所示,其中:
OrderID:订单编号;
UserID:用户编号;
BikeID:共享单车编号;
Biketype:共享单车型号;
Starttime:骑行起始时间点;
Geohashed_ start_loc:用户骑行起点(Geohash 编码后);
Geohashed_ end_loc:用户骑行终点(Geohash 编码后);
双极化天线
From station ID:用户骑行起点的站点编号;
pam加药
To station ID:用户骑行重点的站点编号。
经过统计,从2022年5月10日到5月24日,共记录了3214096次出行[5],共有93106个站点。
2.3 数据过滤与转换
用户对原始数据骑乘的起点和终点坐标采用Geohash编码,该编码由一个区域所有站点共用一个Geohash字符串的方式来表示一个区域,但为了增强可读性和更方便在GIS数据中导入分析,将其转换为经纬度坐标。
3.数据分析
该研究的用户年龄分为5个阶段:24岁及以下、25岁至30岁、31岁至35岁、36岁至40岁以及41岁及以上。其中,24岁以下年龄组占比低于其他年龄组,仅为4.8%。主要原因是中学生主要是每天出门回家和上学,有的直接住在学校,共享单车需求低。然而,大学生主要
参加校园活动[6],步行是主要的出行方式。共享单车用户大多在25岁以上,主要原因是他们大多处于事业上升期,经济能力有限,因此在通勤期间共享单车的需求较大。40岁及以上的共享单车用户比例相对较低。对于这些用户来说,出于物理和经济原因更喜欢使用网约车或私家车。
职业和收入会对旅行者出行方式的选择产生一定的影响。在共享单车用户的职业数据集中,普通员工占58%,超过总数的一半。在共享单车用户月收入数据集中,月收入在5001元至10000元之间的用户占比最大,达到39.3%[7]。显然高职位、高收入人在选择出行方式时更注重安全性和舒适性,而普通工薪阶层的低收入人则更注重经济性,因此共享单车的需求高于高收入人。其他外部因素,如季节、交通设施、天气条件、温度和空气质量都可以影响共享单车的需求。研究发现,与春季和冬季相比,旅行者在夏季和冬季更倾向于使用共享单车出行。共享单车出行率和出行时间与自行车道长度呈正相关,与道路交通流量呈负相关,天气条件和温度是相关性最强的两个影响因素。一般来说,人们更喜欢在10-30℃、无雨的条件下长途骑行。事实上,在大雪、大雾和空气质量较差的天气条件下,由于能见度、路况等因素,绝大多数人出行时不会选择共享自行车,而选择出租车、公交车、地铁等相对安全的交通方式,5月20日骑行后订单的数据量较之前有所增加,这
3g无线摄像机在很大程度上是由于雨天天气条件造成的。
参考文献
[1]朱勇,潘敬. 基于用户体验视角的共享单车定价策略实证研究[J]. 重庆交通大学学报(社会科学版),2020,20(2):36-42. DOI:10.3969/j.issn.1674-0297.2020.02.007.
火石轮[2]谢玲燕. 校园共享单车停放点设置探索 ——以华南师大石牌校区为例[J]. 科技与创新,2019(11):56-58,60. DOI:10.15913/jki.kjycx.2019.11.020.
[3]谢霖浩. 基于数据分析的共享单车需求预测及调度路径优化方法研究[D]. 陕西:长安大学,2021.
[4]曾开邦. 共享单车的时空出行规律与需求预测研究——以北京摩拜单车数据为例[D]. 陕西:长安大学,2021.
[5]顾江岩. 共享单车时空分析及电子围栏选址——以北京市西城区为例[D]. 河南:河南大学,2020.
[6]孙佳昕. 衔接轨道交通站点的共享单车骑行时空分布特征及影响因素研究——以西安市为例[D]. 陕西:长安大学,2020.
推拉式电磁铁[7]张恭. 考虑空间异质性的共享单车客流量与影响因素研究-以芝加哥为例[D]. 四川:西南交通大学,2020.
1

本文发布于:2024-09-23 07:27:42,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/171462.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:单车   共享   数据   出行   用户   研究   骑行   可视化
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议