基于多维数据立方的公共自行车出行特征可视化分析外文翻译资料

 2022-03-01 20:02:38

1

基于多维数据立方的公共自行车出行特征可视化分析

马新伟1,颜杰杰1,2,3,,杨柳1,玉川金1 和陈宇毅1

(1.东南大学交通学院,南京210096; 2.江苏省城市ITS重点实验室,南京210096;

3.江苏省现代城市交通技术协同创新中心,南京210096)

摘要:为了探索不同群体的自行车用户的旅行特征和时空分布,使用一种名为Data Cube的在线分析处理(OLAP)工具来处理和显示多维数据。我们将传统的三维数据立方体扩展和修改为四个维度,即空间,日期,时间和用户,每个维度都具有用户指定的层次结构,并将交易数量和旅行时间作为两个量化指标。结果表明,工作日的早上和下午高峰时段有两个明显的交易高峰,而周末的交易量大致均匀分布。恶劣的天气条件严重限制了bikeshare的使用。此外,无缝智能卡用户通常比独家智能卡用户行程更长;非本地用户比本机用户骑得更快。这些发现不仅支持数据立方体在可视化大规模智能卡数据领域的适用性和效率,而且还提高了具有不同人口背景的自行车共享用户的公平关注。

键词:bikeshare;智能卡数据;旅行模式;多维可视化

中图分类号:U12 文件代码:A

在全球范围内,有一种趋势是自行车共享系统被用于发展城市交通,因为它们不仅为居民和旅行者提供了价格合理,清洁,方便和可持续的旅行模式 [1-2],而且还通过参与更多的体育活动来保证健康的生活方式。 [3]。Bikeshare还有助于减少交通拥堵并占用很小的空间 [4-5]。与私人自行车相比,bikeshare允许用户在仅需要的基础上骑行,这消除了对维护成本和责任的任何担忧 [6]

因此,近年来,bikeshare系统以其他任何城市交通模式 [7-8]无法比拟的速度获得了普及和普及。今天,估计有1328个自行车共享系统在运行,405个此类计划在全球规划或建设中使用,基于自行车共享世界地图 [9],使用了大约12970100辆自行车。中国于2008年首次在杭州推出第3个自行车共享计划[10-11],其次是2009年的上海和武汉,2011年的北京和2013年的南京。截至2015年4月,中国已推出237个自行车共享计划 [12] 并拥有全球杭州最大的自行车共享系统 [13]。此外,2016年在中国出现了一种新型的带无线通信和不固定扩展坞的自行车共享计划,称为第四代自行车共享系统。到2017年5月底,已有30多个中国城市推出了该系统。以北京和上海为例,北京12家公司的第4代公共自行车超过120万辆,上海8家公司有62万辆 [14]

然而,由于第4代自行车共享系统的旅行记录数据无法访问,本研究仅关注第3代自行车共享智能卡数据,以探索不同用户群之间的自行车行为的时空模式。虽然自动收费系统(AFC)最初并非设计用于支持公交行为分析,但AFC的数据为研究人员提供了连续和长期的旅行信息,以便探索各种主题,以便更好地进行交通规划和管理。宋等人。 [15] 指出,开发有效的技术来处理来自数据库的海量数据似乎越来越重要。Song和Miller [16] 还声称,迫切需要更有效地利用现有数据库,以更好地了解旅行需求和交通模式。Data cube是一种用于处理和显示多维数据的在线分析处理(OLAP)工具 [15],用于处理和可视化来自bikeshare数据库的多维数据。该数据库建立在2016年3月1日至2016年3月31日智能卡交易的基础上,位于中国江苏省南京市的自行车共享系统内。在数据立方体的可视化之后,显示了用户的旅行特征和时空分布的结果,并且讨论了结果的含义。

文献评论

Bikeshare近年来得到了广泛的研究,并且已经提供了各种实质性文章,但不限于其历史和近期增长,障碍,对其他交通方式的影响及其再平衡问题 [12]。本文综述了自行车共享使用模式的特点,主要包括四个方面:性别,年龄,卡片类型,工作日/周末和一天中的时间。

性别是bikeshare领域研究最多的特征之一。LDA咨询公司 [17] 发现,女性更有可能通过分享自行车来做腿事,而男性则更有可能参加通勤旅行。与许多单独分析自行车共享系统的研究人员不同,一些专家将自行车共享与一般自行车比较,并讨论了他们在性别方面的差异。固特异 [18] 提到,在北美,性别差异在自行车和一般自行车之间有所不同。具体而言,Buck等人。 [19] 和Pucher等人。 [20] 发现,与私人自行车骑手相比,自行车乘客有更大的机会成为女性。Fishman [12] 指出,bikeshare用户是不成比例的白人男性,受过更高的教育和收入,而私人自行车骑手的性别差异要小得多。一些研究人员还探讨了自行车共享与一般骑行之间的关系。Goodman和Cheshire [21] 研究了伦敦Bikeshare计划并声称在一般骑车使用率相对较低的国家的自行车共享系统将减少女性参与。例如,伦敦妇女参加的自行车旅行占总数的比例不到20%。更重要的是,统计数据表明不同国家和地区的性别差异各不相同。在澳大利亚,女性分别占墨尔本和布里斯班年度自行车会员的23%和40% [22]。在都柏林,爱尔兰,率为22% [23],在华盛顿特区,这一比例为45%,如拦截调查结果 [19]所示。

就年龄而言,富勒等人。 [24] 发现,18-24岁的人更有可能接受高等教育,并在蒙特利尔注册BIXI计划会员资格。巴克等人。 [19] 和Li等人。 [25] 得出了类似的结论,年轻人更有可能成为一名自行车骑手,而老年人则不太愿意使用自行车共享,因为他们更容易受伤,很难从撞车造成的伤害中恢复过来。但是,伍德科克等人。 [26] 从健康效应的角度在他们的研究中得出了不同的结论。他们发现不同年龄段的福利各不相同:老年用户,如果参与崩溃,他们失去的年数就会减少,从而获得的收益也就越多。一般来说,中年人和老年人将享受最大的健康福利,这表明应鼓励这些人使用自行车共享。

至于卡片类型,Buck等人。 [19] 讨论了在长期和短期会员之间使用自行车共享的目的的差异。华盛顿特区对Capital Bikeshare用户的调查显示,最后一次与工作有关的旅行占常规会员总数的43%,而短期用户仅为2% [19]。同样,在伦敦进行的另一项调查发现,52%的年度会员资格最后一次出于通勤目的,其他所有出行目的都不到10% [27]。Noland和Smart [28] 在纽约进行了一项相关研究,发现了临时用户

与普通的自行车用户相比,在中午和晚上之间更频繁地骑车参加休闲用地的车站。Wergin和Buehler[29] 还分析了华盛顿特区短期自行车用户和普通会员之间旅行特征的差异。他们发现短期用户在国家广场及其周围的公园内越野越慢越集中越野,而普通会员的行程越来越短,越来越快,并且集中在国家广场的热门综合用途中邻里。

在时间维度上,研究人员如Pfrommer等人。 [30] 得出结论,不同城市的每日自行车共享使用情况类似:在工作日,使用率分别在早上7:00-9:00和下午16:00-18:00达到峰值,而在周末它在中午达到顶峰。Beecham and Wood [31] 探讨了伦敦自行车租赁计划中大量城市自行车旅行团成员的自行车行为,他们有两个发现:女性更有可能在早晨的山峰进行通勤旅行而不是男性;在工作期间,女性自行车用户比男性更不可能进行实用旅行。此外,一些研究人员还在努力评估在工作日和周末之间改善自行车共享系统的措施的差异。Lathia等。 [32] 指出,更容易访问系统可以促进工作日和周末使用的通勤。Pfrommer等。 [30] 专注于自行车共享系统的车队不平衡,并比较了工作日和周末之间的不平衡程度。他们发现,在周末,价格激励措施可以有效地缓解船队失衡,但在工作日,运营商和价格激励措施都是必需的。

然而,大多数上述研究都属于这两种情况:如果选择调查数据,研究人员要么无法获得足够样本的长期数据,要么在智能卡数据可用时无法探索自行车出行的多维特征。此外,他们没有找到一种用数据可视化多维变量的有效方法 [15]。在本文中,我们获得了具有许多个体属性的智能卡数据,例如性别,年龄,卡片类型,出生地点和扩展数据立方体。一些研究人员使用扩展数据立方体,通过丰富多维数据集的维度和层次结构,并在事务计数之外为其提供新的定量度量,在用户定义的聚合级别上探索跨越各种空间和时间维度的旅行特征。这个经过修改的数据立方体使我们能够利用这些数据并深入讨论自行车旅行的时空特征。

背景和方法

学习区

南京作为江苏省省会和长三角经济区的核心城市,长期以来一直是继上海之后华东地区的第二大商业中心。它的面积为6587公里2 ,2016年人口为823万,预计到2020年将达到1060万,其中86%为城市居民 [33]。与其他许多中国城市一样,南京在过去十年中经历了快速的城市化,经济的快速增长和大规模的机动化。然而,与此同时,所有这些都给城市(包括城市和郊区)带来了严重的问题,如空气污染,交通拥堵和温室气体排放 [6,15]

鉴于文献评论中提到的bikeshare的诸多优势,南京于2013年1月推出了自行车共享计划,以缓解交通压力,为市民带来极大的便利。南京Bikeshare系统被认为是第三代自行车共享计划,采用先进技术和管理策略 [10]。乘坐公共自行车需要支付40美元(250元人民币)的押金。每次人们使用自行车时,第三个小时将收取0.16元人民币(1元人民币),之后每小时收费0.48元人民币(3元人民币)(前两个小时免费)。图1显示了2016年3月之前建立的自行车共享站的分布情况,当时城市地区有130个自行车共享站(内环路内的区域),郊区有510个站点(内环路和环城公路)。它还显示了2016年3月典型周内每个车站使用自行车共享的人数。

图1自行车共享站的空间分布和城市/郊区的乘客量

数据源

案例研究的智能卡数据来自南京公共自行车公司。它可以分为三个数据集:(1)旅程数据集,包括会员ID,交易日期,交易时间和交易站ID;(2)客户数据集,包括年龄,性别,出生地和会员ID。提及由于保密问题,本文件中未提供会员ID。它可以分为两个子类型:无缝卡,如99016178 ****,以及独家卡,如NJHX0016 ****。第一张卡允许用户乘坐许多公共交通工具,如公共汽车和公共自行车;而第二个专门用于进入地铁站;(3)坐标数据集,包括自行车站的地理坐标。原始的bikeshare数据库包含2016年3月1日至2016年3月31日的2,911,245个智能卡交易记录。图2显示了南京bikeshare数据集的结构。报告为缺陷或被盗的交易无效。此外,最小的1分钟和最长120分钟的旅程时间用于数据筛选,如Zhao等。 [34] 使用。因此,数据集数量下降5.36%至2,755,203。

方法

图2南京自行车数据集的结构

数据立方体是用于组织和显示多维数据的OLAP工具(在线分析处理) [16]。Han和Kamber [35] 提到数据立方体在概念上是一个二维电子表格的一部分:数据立方体不是将多个单元格的数据处理成行和列,而是将数据处理成与数据相关的所有可能的交叉制表和聚合维度和用户定义的聚合层次结构。

作为数据立方体分支的流量立方体,专门用于组织和显示交通数据。传统上如Shekhar等人所述。 [36],它建立在平均交通量上作为一个定量测量和三个维度,包括传感器的位置,日期和时钟时间。Song和Miller [16] 提到每个维度都要求用户指定的聚合层次结构,该层次结构定义了从较低级别概念到较高级别概念的映射序列;或者以部分顺序组织概念的聚合点阵。

我们定义了一个维度集D = {D1,D2,D3,...,Dn}。D表示流量立方体中的所有维度,n表示流量立方体是n维数据立方体。让我们设置三个不同的维度D = {X,Y,Z},并且每个维度都有一个用户指定的聚合层次结构。Xa,Yb和Zc表示尺寸X,Y,Z的聚集水平分别为a,b和c,并且Xa 1比Xa低一级,而Zc-1比Zc高一级。图3显示了多维流量立方体的一般操作,选择X,Y,Z作为三维分析。X,Y,Z的可视化是通过在所选维度和用户聚合级别的基础上将三维流量立方体切片为二维来创建的。

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[431143],资料为PDF文档或Word文档,PDF文档可免费转换为Word

<!--

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。