英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料
运用大数据量化与可视化的职住平衡研究:以上海为例
作者:张平;周江平;张天然
同济大学交通运输工程学院,上海200092
香港大学建筑学院城市规划与设计系,香港特别行政区
中国上海城市规划设计研究院,上海200040
关键词:蜂窝网络数据;职住平衡;通勤过剩;可视化
摘要:现有的就业-居住平衡研究严重依赖于单一的小数据。本研究以上海为例,说明如何处理蜂窝网络数据来获得有用的信息,特别是通勤者的就业地和居住地。本文以蜂窝网络数据为基础,用一个较大的样本(n=630万)来量化和可视化上海的就业-居住平衡情况,这相比以往的研究有更精确的空间分辨率和更大的地理覆盖范围。它通过基站收发台(BTS)识别本地通勤者并对其进行地理编码,其平均服务区域为0.16公里。通过BTS检测就业和居住后,将按照不同类型(例如:交通分析区、市区、郊区和远郊)对数据进行分类统计,以供地方规划者和决策者参考。它对交通流的实际通勤量(T),理论最小(T)和最大(T)通勤量进行可视化表达。其结果表明,上海的通勤模式远未达到极值(交通流极值以和表示)且就业与居住相对平衡(通勤距离平均3.2km),尽管上海人口众多(2400万),地域范围较大(6800公里)。当通勤距离小于6 km时,实际通勤量()和最小通勤量()的累积分布差异更大。从理论上讲,当通勤行为高度集中在6公里半径内且分布在城市的不同地区,这可能使95%以上的当地就业者在其住所6公里内找到工作,反之亦然。但事实上,只有71%的就业者能享受到这样的便利条件,这可能意味着就业与居住存在质量上的不平衡。
1.简介
过度依赖汽车、交通拥堵、通勤时间过长以及与之相关的空气污染和温室气体排放正折磨着世界各地的许多大都市。针对这些问题,人们提出了不同的对策。其中,就业-居住平衡被认为是最有效的方法之一(加州规划圆桌会议,2008;塞维罗, 1991;韦茨,2003)。尽管如此,在学术界,就业-居住平衡并没有一致的定义。同时还有各种各样的输入数据可用于描述和量化“就业-居住平衡”。在现有的输入数据中,最典型和占主导地位的是家庭出行调查和访谈,但与蜂窝网络数据等新兴的“大数据”相比,可以称之为“小数据”。总体而言,对于小数据的处理、验证和校准已经有了较为成熟和系统的方法。基于验证和校准的小数据,大多数作者/学者含蓄地认为他们的推导资料、结论和调查结果将是可靠的,甚至是可转载的。大数据的存在和可用性,特别是蜂窝网络数据,为作者/学者提供了新的机会来量化“就业-居住平衡”,而不管它的确切定义是什么。
然而,大数据往往不是专门设计为学术研究服务的;相反,它们是设计为特定的业务功能服务的。例如,验证和收集巴士票价(佩尔蒂埃,Trepanier, 莫伦西, 2011)。那么,人们如何才能从大数据中获得有用的信息,应用于就业-居住平衡的学术研究呢?导出的信息如何补充此类研究的小数据?大数据会为解决就业-居住不平衡和通勤时间长等紧迫的城市问题带来新的/更多的启示吗?这些都是大数据时代的学者和决策者需要解决的一些有趣而重要的问题。
本文认为,蜂窝网络数据是一种大数据,可以有效地促进就业-居住平衡研究,使其超越小数据带来的延迟滞后和有限的地理/时间覆盖范围等约束(普奇, Tagliolato, 2015)。本次研究以上海为例,说明了如何对蜂窝网络数据进行处理,获取有用信息,从而推动上述研究的发展。
本文组织结构如下。下一节(第2节)回顾相关文献。第3节以上海为例,说明如何处理蜂窝网络数据以促进和改善就业-居住平衡研究。第四部分总结和讨论了蜂窝网络数据如何进一步加强和改善未来的就业-居住平衡研究。
2.相关研究
2.1.就业-居住平衡定义
学术界对“就业-居住平衡”有不少定义。它是“一定地域区域内就业岗位数量与居住单元数量之间的空间关系”(彭,1997: p.1216)。它也可以是一定空间单位内就业与居住机会的比例,例如交通分析区(TAZ)(如交通分析区,塞维罗,1989;马戈利斯,1973)。如果一个空间单元就业与居住条件达到一定比例,则属于“数量平衡”,反之则属于“数量不平衡”(马,巴尼斯特, 2006:p.2104)。然而,真正的就业-居住平衡也涉及“居住和就业完全互补的特点”(朱利亚诺,1991:p.305)。更普遍地说,就业-居住平衡是城市化或郊区化过程中就业和/或住房的动态调整过程。在这个过程中,通勤时间可以代表就业和居住的平衡(例如,杜宾,1991;戈登,库马尔,理查森,1989)。自由市场会自动生成一定程度的就业-居住的平衡(即协同定位效应)。而不适当的规划和政策干预会造成就业与住房的不平衡(塞维罗,1989;塞维罗,兰蒂斯,1995)。
2.2.就业-居住平衡的描述与量化
学术界对“就业-居住平衡”除了用上述比例进行描述和量化外,学者们还开发了更复杂的分析框架来描述和量化工作就业-居住的平衡以及相关问题,如通勤、空间错配和工作/住房可达性。冒着过于简化的风险,将这些分析框架总结如下。
2.2.1.通勤过剩
这个框架通过使用理论最小通勤量(),理论最大通勤量(),随机通勤量(),实际通勤量(),过剩通勤量(EC)过剩,潜在通勤量(),通勤经济()和规范化通勤经济()等指标来量化并连接就业-居住平衡与通勤效率,通勤效率是用于衡量一个城市/地区通勤模式。在这个框架下,它的设定是:
bull;所有工人、就业和住房机会都是均等的,因此他们可以任何就业和/或住房机会所吸引且不会失去任何公用设施。
bull;任何两个空间单元之间的出行成本或阻力保持不变,出行距离始终是两个空间单元的质心之间的线性距离,不管有多少次出行。
在一个地域内指,就业者至可能的最近工作地点的平均出行平均出行在某种程度上实现了分区的分隔(例如,时间,距离)。表示在一个地域内就业与居住的相对平衡(斯摩尔,Song, 1992)。在 “平均而言,当就业者被分配到距离他们最近的工作地点时”产生(霍纳,2002:p. 550)。它反映了在一个地域在就业和居住分配方面最糟糕的通勤模式。
如果已知现有的通勤模式,则可以直接计算。EC是“在城市内发生的非最优或过剩的工作出行,原因是人们没有减少他们的工作出行路程”(霍纳,2002:p.543),也就是说,
(公式1)
指用于量化有多少可用的通勤范围,即与之间的差异
(公式2)
如果一个地区的所有通勤者都不努力减少他们的通勤时间,而是随机选择他们各自的住所和就业场所,那么这个地区就会有这样的规定。 因此,平均的总是有一个大于的值。查伦(2007)利用下列公式求得的近似值:
(公式3)
在公式内
N为研究区域内通勤的总人数;
表示出发起点的通勤者数量;
表示到达目的地的通勤者数量;
表示在i和j之间出行的成本,成本可以是时间、距离或货币。
最近,墨菲和基伦(2011)提出了一种比上述方法更加复杂但可行的方法来计算。简而言之,他们的方法有三个步骤。
第一步是模拟尽可能多的通勤出行分布,给定一个城市或地区固定/已知的就业和居住数量/分布,其中就业和居住由一些空间分区(如TAZ)集合。
步骤2计算模拟分布的总通勤量。
第3步是由第1步和第2步得到大量的总通勤时间的平均值(比如n=10000)。这个平均值随后可以当作一个近似的来处理。
通过和,可以推导出,它“展示了实际行为在多大程度上对存在于城市地区的居住地和就业地之间的分离成本所做出的反应”(墨菲,基伦, 2011:p.1261)。
具体来说,用下列公式计算:
(公式4)
通过和,是更好的替代品,它可以让人们确定集体行为在多大程度上倾向于通勤经济,同时讨论在土地利用设定的约束条件下,理论上可能达到的程度(墨菲,基伦,2011, p.1261)。具体而言,可以表示为:
(公式5)
以上指标均可采用可修正面积单位问题(MAUP)。有几位作者已经研究过这个问题(例如,霍纳,默里,2002年;涅杰尔斯基,霍纳,肖, 2013)。总的结果是,像和这样的指标基本上不受MAUP的影响。除了MAUP,还有一个问题是什么时候使用哪个指标?加奈荣罗,希金斯,乔社里(2015)认为,这些指标都不能充分衡量一个城市的通勤表现,但每个指标仍然可以用来解决特定的政策问题。当它们结合起来时,可以提供“对城市形态和通勤行为合理的、良好的解释”(p.13)。
2.2.2.基于重力的可达性
基于重力的可达性的倡导者认为,就业和居住的平衡不仅应在一个预定的地域还应包括它周围地区考虑工作或就业机会。列文森(1998)是其倡导者之一,他根据一些空间距离衰减函数,开发了一个就业-居住平衡的可达性度量,以考虑分区/区域和周围的工作或居住单元。他的案例研究表明,就业和居住的可达性与通勤距离呈负相关,公交通勤者就业和居住的可达性似乎高于汽车通勤者。类似地,霍纳和梅德福(2007)利用最小通勤时间和最大通勤时间,以及不同社会群体之间的最小通勤时间和最大通勤时间范围,来说明不同社会群体之间的空间错配和就业-居住平衡是如何变化的。更具体地说,如果我们假设不同的社会群体只能在群体内部交换工作和居住,那么他们可能有不同程度的就业和居住可达性,以及就业与居住的平衡和不平衡。可能会出现这样的情况,在一些居住地附近或在一些就业地附近有工作,但由于当地就业和住房市场的隐性歧视,一些就业者被直接排除在这些就业或居住机会之外。
2.2.3.通勤模式
通勤模式学者认为,一个城市/地区现有的通勤模式可能是多种通勤模式之一,也就是说,在一个城市/地区内,就业和工作场所的通勤出行分布是由一些空间(例如,TAZ)分解而来(杨,费雷拉,2008)。如果我们现在假设出行成本是影响通勤者的就业和居住决策的唯一因素,那么可以校准引力模型,得出的值。当一个分析单元i的就业者被分配到其他分析单元(js)时,每个js占整个区域的就业者的份额就会产生匹配比例的通勤(PMC)。PMC是指就业者对出行成本不敏感的情况,即“该地区的每个就业者都在竞争该地区的每一份工作,且不考虑通勤成本”(杨,费雷拉, 2008:p.367)。和一样,PMC代表了另一种极端的通勤模式。前者主要由地方一级的就业-居住分配决定,后者更依赖于区域一级的就业-住房分配(杨,费雷拉,2008)。
2.3.运用小数据研究的就业-居住平衡
无论各自分析框架如何,现有的大多数就业-居住平衡研究,包括上述研究,即使不是完全依赖于单一数据,也严重依赖小数据作为输入数据。表1简要介绍了一些现有的代表研究。
从表1可以看出,现有的研究很少使用大数据作为输入数据。仍有一些有趣的问题等待人们进一步探索,例如,将输入数据换成一个更大的样本量,甚至整个人口容量,特别是大数据如蜂窝网络数据,正挑战现有的就业-居住平衡知识和发现,其主要依据的是小的数据,可能是不具有代表性和没校准的人口样本?以上海为例,在大数据出现之前,家庭出行调查数据是就业-居住和通勤研究的主要数据来源。一方面,前者(小数据)只能覆盖人口的0.75%;另一方面,他们只记录被调查者工作日的出行行为(丁, 牛,宋, 2015)。这些特征意味着,学者们必须找到可靠的方法来推测样本,只要能得到一个更完整、更长的(几天)人口图。
2.4.利用大数据研究就业与住房的平衡
大数据是具有超过传统数据库系统处理能力的数据。大数据具有数据量大,生成快或不符合数据库架构限制的特点。想要获得从这些数据的价值,你必须选择一个替代的方式来处理它”(杜尔比,,2012:p.3)。与小数据相比,大数据有七个特点:
bull;海量性——大数据比小数据包含更大的数据量,通常是tb或pb级;
bull;高速性——与小数据不同,大数据可以实时或接近实时地生成;
bull;多样性——大数据可以是结构化的,也可以是非结构化的,它可以包含时间
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[240077],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。