英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料
从大规模地理位置数据挖掘有效的出租车运营策略
摘要:出租车司机总是寻找策略来快速定位乘客,从而提高利润率。实际上,乘客寻求策略主要是经验性的,并且在出租车司机中差异很大。从历史出租车数据来看,表现最佳的出租车司机在同一时间段内的平均收入可能比保持平庸策略的收入高出25%。更好的策略不仅可以帮助出租车司机以更少的努力获得更多收入,还可以减少燃油消耗和碳排放。 研究寻找乘客策略中的影响因素并找出算法来指导出租车司机在适当的时间到达客流热点区域将会是非常有意义的一件事。 随着历史出租车痕迹的充分利用,现有的做出租车业务的方法已经根本改变。本文着重从一年内收集的大规模历史出租车轨迹挖掘高效运营策略的问题。我们的方法对出租车服务的动态进行了普遍观察,目的是最大限度地提高有研究方向上的利润率。我们提出重要指标,例如出行频率,热点和出租车里程,并为更有效的运营策略提供有价值的见解。 我们使用牛顿多项式插值和伽玛分布等技术来分析这些指标,以了解它们的动态。 我们的策略使用长沙市(中国)的真实出租车轨迹,可以每天在不同时间内预测到90.68%的出租车运行轨迹,通过控制每次行程的适当里程,沿着更多的城市出行热门路线,将出租车司机收入水平提高19.38%。
关键字:出租车运营策略,出行频率,热点指标,出行里程。
I.介绍
- 背景和动机
出租车服务已成为公共交通的实际替代方案,因为它们的可用性,舒适的旅行体验以及到达任何选定目的地的灵活性。 与其他面向服务的企业类似,出租车公司依赖个别出租车司机产生的收入,并不断探索提高利润率的渠道。 因此,出租车公司对处理问题的推荐技术表现出极大的兴趣,例如识别一系列合适的提货点并确定最快的驾驶路线。 但是,他们对有用的操作缺乏洞察力,长远来看可以使出租车公司受益的策略。
一般来说,出租车服务可以采用两种不同的模式:集中式 - 集中式预订办公室将出租车分配给客户,以及专用 - 可以直接从道路上出租出租车。 出租车服务的主要优势是它们在任何时间和地点都具有普遍可用性,这与公共交通工具不同,后者在固定路线上运行并在晚间关闭。 出租车服务是必不可少的几种情况,例如医疗紧急情况,携带沉重行李的旅行,与老年人或身体不适的人一起旅行,以及与婴儿一起旅行。 但是,尽管如此巨大的商业潜力和商机,出租车服务难以产生足够的利润空间。
B.问题概述
我们专注于为出租车服务确定高效的运营战略问题,这不仅增加了利润率,还使出租车服务能够适当量化其运营能力。 非正式地说,运营策略是提高运营出租车业务所涉及的运营效率的洞察力。 因此,出租车服务在高度动态和复杂的环境中运行,产生了许多运营挑战,这在确定有用的运营战略时造成了相当大的困难。 为此,我们专注于出租车服务中两项直接负责的运营挑战,并根据这两项挑战来量化问题。 第一个重要的操作挑战是在任何特定时间点确定时间,地点和客户需求之间的关系。 这种关系将有助于出租车服务集中于特定时间的特定地点并与客户需求相匹配。 第二个操作挑战是能够理解出租车行程频率,所覆盖里程和相应收入水平的相互影响。 这种理解对于出租车公司设计有效的运营策略将有助于提高出租车收入水平。
近年来,无线传感器技术在诸如GPS和RFID之类的移动环境中发展迅速,后者感知并记录了出租车行程的各种指标。 这种细粒度的传感技术使我们能够每天记录出租车的出行次数,并根据地点,时间,里程和成本对每次出行进行适当标记,从而为出租车运营的动态提供有价值的见解。 因此,挖掘方法有一个关键技术,可以分析这些行程数据并识别出租车服务的高效运营策略。 本文发现我们的工作与这样一个复杂问题空间的尝试非常吻合。
C.我们的贡献
显然,最近的讨论主要集中在寻找下一个乘客或减少司机的等候时间。 然而,在现实世界中,出租车司机的收入与出行频率,热点和出行效率等因素有关,需要找出这些方面之间的关系并提出一些有效的驾驶策略。 我们的贡献总结如下:
-
- 首先,单位时间的出行频率与出租车司机的收入和城市热点密切相关,然后基于牛顿插值多项式建立城市出行频率模型,可以预测出租车在不同时段的乘坐率为90.68%以每周惊人的99%。
2)其次,我们将长沙市区平均分成56 * 32个网格,然后定义基于热点(HSM)的出行频率的度量方法。 根据我们提出的方法,我们提出了一些关于热点分布和迁移的进一步分析,并通过沿着穿越更多城市热点的路线将出租车司机收入水平提高到19.38%。
3) 第三,我们使用里程数据结合上述两个指标来确定有效的运营策略。 首先,我们注意到出租车司机的收入取决于接送乘客的行程频率以及驾驶路线选择。 其次,出租车司机应该通过跟踪城市热点来提高总收入,从而减少每次行程的里程并提高每天的出行频率。 本文的其余部分安排如下。 在第二节中,我们正式引入了出租车数据的来源并提出了一些预处理策略。 第三部分建立出租车行程频率模型并预测单位时间内的频率曲线。 第四部分根据出行频率和出租车里程分析热点分布和迁移。 第五节介绍了基于出租车行程和里程数改善出租车收入的运营策略。 最后,第六部分我们介绍结论。
II. 相关工作
作为各种交通工具中最常见的选择之一,出租车服务在公共交通和人们生活中扮演着重要的角色,灵活性和便捷性。 近年来,我们见证了无线传感器技术在GPS,Wi-Fi和RFID等移动环境中的快速发展,为我们提供了前所未有的自动发现有用知识的机会[1]。 然后,这些有用的调查结果反过来为实时和高效的驾驶决策提供智能,并且从历史出租车数据中挖掘高效的驾驶策略可能是改善出租车司机收入以及节省时间和能量消耗的最有前途的方法。
通过使用大规模的地理定位数据,近来已经在为出租车司机提供有效的驾驶策略方面做出了努力。 目前有一些工作可以确定出租车司机的起坐顺序,并找到从当前位置到目的地的最快行车路线[2] - [4]。 以前的工作可以帮助出租车司机在更大程度上接载下一个乘客时减少等待时间和里程。 鲍威尔等人。 [5]认为,税务司机应该减少巡航里程的数量,同时增加运行里程的数量,这样可以在没有系统路线的情况下提高盈利能力。 然后,他们提出了一种简单而实用的方法,通过建议有利可图的地点向出租车司机减少巡航里程数,这被证明通过使用大型上海出租车GPS数据集显然有助于提高盈利能力。事实上,前面提到的研究的贡献主要是通过优化驾驶路线在短时间内从当前位置到目的地找到下一位乘客。
然后,一些研究人员提出了一条适应性路线方法在巡航出租车[6]中,其中司机将被分配乘客最有可能匹配客户预期采取的途径。 仿真实验表明,该方法能够比现有的巡航出租车获得更多的客户。 对于出租车司机来说,狩猎或等候空出租车可能是一个难题。 Li等人 [7]从大型真实世界的出租车数据集中发现乘客发现策略,并提供选择的路线模式,可以很好地解释从原始数据分析中得出的实证研究结果,甚至可以揭示有趣的隐藏事实。 显然,在找到客户之前,出租车司机知道实际的行车路线以最小化驾驶时间对于这一点更为重要。 还有一些关于路线优化和接送乘客的工作也被证明对缩短等待时间和提高驾驶员收入有更好的贡献[8] - [10]。然而,上述工作主要基于用户评分或互动,但对于出租车司机而言,这些策略缺乏实时效果,并且在驾驶出租车时难以遵循。 因此,移动推荐系统对于智能移动设备比如PDA,手机更受欢迎。 Ge等人 [11]设计和实现一个基于潜在旅行距离(PT-D)功能的移动推荐系统,用于评估每个候选序列。 他们除了找到推荐的路线外,还从这个提议的PTD功能中设计了两种算法,即LCP和SkyRoute。 这种设计已被证明能够有效提供有效的移动顺序推荐。 从位置轨迹中提取的知识可用于辅导司机,从而有效利用能源。 他们还提出了一个出租车商业智能系统来改善出租车业务表现和乘客体验[12]。郑,等。 [13]尝试挖掘用户及其位置之间的关系,并报告Web上地理信息系统(GIS)的个性化朋友和位置推荐人。 在这个框架中,他们将基于内容的方法合并到基于用户的协同过滤算法中,以评估用户对某个项目的评分并获得更好的推荐结果。 为出租车司机和希望乘坐出租车的乘客提供了一个推荐系统,利用乘客出行模式和出租车司机捡起/放下行为的知识[14]。 他们利用超过12,000辆出租车在110天内产生的历史轨迹构建我们的系统,并通过广泛的评估(包括现场用户研究)验证系统。 Qu等人 [1]提出了能够提供整个行车路线的推荐系统,并且驾驶员通过遵循建议能够找到具有最大潜在利润的乘客。 特别是,他们首次设计了一个净利润目标函数,用于评估驾驶路线的潜在利润,并且通过从旧金山湾地区收集的实际数据集,它比其他现有推荐系统更实用和更有利可图。此外,随着大规模的出租车痕迹可用,丰富的出租车痕迹提供了新的做法
业务从其他有价值的角度来看。 通过节省能源消耗和满足居民的需求,出租车可以带来显着的社会和环境效益。 马等人。 [15]提出了一种大型的出租车乘坐分享服务,该服务为出租车用户发出的实时请求提供服务,并生成可大幅减少总行程的乘车时间表。 郑等人。 [16]将城市规划作为城市规划作为无处不在计算中最重要的应用之一,他们使用出租车在城市地区旅行的GPS轨迹检测有缺陷的城市规划。 他们使用北京的3万辆出租车产生的轨迹进行建议的方法,并使用北京的实际城市规划对结果进行评估。 荣等人。 [17]将乘客寻求过程建模为马尔可夫决策过程(MDP),并从数据中学习MDP的一组不同的参数,以找到空座出租车的最佳移动路线,以最大化该时段的总收入。 为了更好地预测出租车司机未来的行为,需要进行全面的研究以揭示社会传播如何影响,并且从纽约市收集的真实世界数据集的全面实验明确验证了他们提出的框架对预测未来的有效性出租车驾驶行为[18]。 为了支持营销人员提高营销效率,Li和Zhao [19]提出了推荐系统的新应用,该系统选择车辆作为推荐人。 他们提出了基于不同评估标准提高营销人员营销效果的算法。 其他一些作品[15,20] - [24]侧重于特定类型的推荐场景,如快速路由,乘坐分享或公平推荐,但与我们的工作没有太大关系。
III.数据描述和预处理
我们使用的出租车数据集来自中国中部省会首府,涵盖了从2012年至2013年的出租车运营记录将近13个月。数据中共有大约1400辆出租车。 出租车的地理位置数据主要存储在主表T_BUSINESS HISTORY中,如表1所示。
表1.出租车数据的主要结构。
表格结构主要包括获取/关闭时间,获取/关闭纬度和经度,每里行驶里程,每次运行时间,每次运行时间等等。大约有3,500万辆的出租车行程记录(每天85,000个),其中每个记录具有经纬度坐标以及取放事件的时间戳,以及总旅行距离和相应旅程的票价。 然而,由于GPS卫星定位,操作失误,大气影响,GPS多路径问题等原因,本文使用的GPS数据存在一些误差。 因此,我们需要对这些原始GPS数据进行预处理,以便于后期的数据分析。 我们用于识别和修复GPS原始数据的预处理方法通常基于GPS系统原理。 在本文中,我们应充分考虑GPS数据特征和出租车运行状态,以达到更好的预处理目的。
出租车GPS数据的预处理应符合以下策略:
-
- 经纬度跨界清理:我们的研究涵盖了长沙首府的主要范围。 经度坐标范围从112.854452到113.083556,其纬度范围从28.149096到28.239767。 因此,应该消除该范围之外的GPS位置坐标。
- 错误修正和地图匹配:由于本文使用百度地图来分析出租车的操作和定位数据,而且这个地图在选定的坐标系统上可能与出租车的GPS坐标系有些不同。 因此,这种偏差需要通过经纬度位置进行修改。 地图匹配是将排序的用户或车辆位置列表与道路相关联的过程。
我们使用平均距离法通过考虑简单的道路网络条件来确定道路车辆。然后将出租车GPS数据映射到百度地图的道路网络。 根据上述规则,我们可以确定所有GPS定位点在x轴和y轴上的偏差距离。 首先,在出租车GPS数据与百度地图相关联之前,先消除偏差,然后让百度地图上显示一个出租车定位点。 因此,我们可以通过此获得与百度地图高度匹配的出租车GPS数据方法。
IV 出租车出行频率建模和估算
我们可以通过分析城市居民在一个时间段内的出行频率来得到出租车需求的时段,这有助于减少空乘率,并有助于出租车司机提前准备好接载乘客。
- 建造出租车频率
频率预测将会增加的士乘坐率及增加的士司机的收入。 本文选择长沙24小时出租车数据集,如图1所示:
图1.每天的出租车行程频率(24小时)。
基于实际出租车数据的拟合曲线如图2所示,可以看出接近离散数据点。从图2可以看出,长沙的出租车在7点到8点之间急剧上升,因为城市居民在这个高峰时段的出行时间为上午7点到8点,下午15点到16点。 这一时期的接机人数处于较高水平。 由于出租车司机职责转移,出租车的乘坐时间从16日下午到17日大幅下降。 从晚上19点到20点,虽然人们已经下班了,但是由于公共交通停止服务,长沙的丰富夜生活开始,出租车开始上升。 这种情况通常持续到下午24点或第二天早上1点。 我们在2013年随机选择一些出租车数据进行验证
<str
全文共8957字,剩余内容已隐藏,支付完成后下载完整资料</str
资料编号:[12719],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。