英语原文共 14 页,剩余内容已隐藏,支付完成后下载完整资料
基于遗传算法的人工神经网络和LWR模型的城市交通短期预测
摘要
短期交通预测在过去十年受到特别关注,主要是由于它们在支持路线选择决策,交通管理和控制方面的重要作用。在这项研究中,遗传算法(GA)被用来设计人工神经网络(ANN)模型和局部加权回归(LWR)模型。所提出的建模方法依赖于遗传算法,神经网络和局部加权回归的组合以在各种输入和交通条件设置下实现最佳预测性能。 GA设计的ANN(GA-ANN)和GA设计的LWR(GA-LWR)聚合和分解模型被用于预测中国北京四条城市道路的短期交通(5分钟)。本研究中开发的GA-ANN模型显示大部分平均误差小于5-6%,所有车道的第95百分位误差大多小于15%。尽管本研究中开发的GA-LWR模型总体表现出较好的表现,其平均误差大多低于5%,而第95百分位误差低于10%。研究结果表明,这种准确的预测对公路当局通过其全州范围的ATIS是有用的。
关键词:预测;交通管理;算法;神经网络;百分位数;回归;预测。
- 介绍
智能交通(ITS)近年来取得了巨大的发展。 ITS应用提高了运输系统的整体效率,并利用信息和通信技术解决运输问题。 日益增加的交通需求需要高效和适当的交通基础设施。
运输系统与历史数据,实时数据和短期预测数据三种数据一起工作。基于从交通网络中各种系统收集的实时数据和历史数据,预测交通变量(如速度,行程时间和交通流量)的能力,对于ITS的先进旅行者信息系统(ATIS)组件至关重要。
智能交通系统(ITS)的概念引入了几项功能和用户服务,这些功能和用户服务有可能提高地面交通系统的效率,安全性和生产率。由于快速计算机和数学模型的发展,智能交通系统(ITS)的快速发展,缓解了交通管理和控制策略。预测短时交通流量的方法和步骤很多,如时间序列分析,实时方法,历史方法,统计方法,机器学习等。但是,了解这些方法背后的工作过程对于了解与每个人相关的局限性或陷阱。
短期交通预测是当今现代智能交通系统(ITS)的重要组成部分,是发表文献数量最多,发展最迅速的研究领域之一。短期交通预测寿命超过50年,在交通运输研究的许多领域得到广泛应用。根据当前和过去的交通信息,短期交通预测涉及从几秒到未来几小时的预测。这个概念促使研究人员寻求交通预测模型,能够预测短期视野中的交通流量,速度和旅行时间(例如5到30分钟)。
不同的方法已用于短期交通流量预测,也是测试复杂预测算法的绝佳方法。短期交通预测方法的准确性主要取决于迄今为止,许多技术包括时间序列分析,神经网络,模糊神经网络,贝叶斯网络,非参数回归等,已被用于短期交通预测,取决于对输入数据集的类型和精度要求。这些系统的主要目标是提高运用现代信息技术的运输系统的运营效率和能力。对此的主要挑战是开发具有可接受的精度的这种响应算法和预测系统。
2.文献综述
研究人员专注于开发短期交通预测方法,可用于估计流量,密度和速度等近期交通特征。 Box和Jenkins(1971)的工作开辟了时间序列短期交通流量预测建模研究领域的门户。在90年代初,自回归整合移动平均(ARIMA)模型家族已被广泛用于短期交通预测(Hamed et al,1995; Kirby et al,1997; Levin and Tsao,1980; Williams et al,1998)。 ARIMA系列车型包括季节性ARIMA,Vector ARIMA等。
许多研究人员发现,季节性自回归整合移动平均(SARIMA)模型比其他时间序列技术表现更好,并且使用季节性ARIMA模型产生的预报比非季节性ARIMA模型更准确。这主要是因为他们在处理交通的季节性方面更好。非参数回归方法比传统的ARIMA模型(Smith和Demetsky,1997; Smith等,2002)和Kalman过滤模型(Okutani和Stephanedes,1984)显示出更好的准确性。指数平滑(ES)是用于时间序列预测的最常用方法之一。 (ARIMA)模型,时间序列方法和卡尔曼滤波理论是简单的模型,并且是线性的。交通流是非线性的,由随机性组成,所以上述方法无法很好地处理。
根据现有文献,学者们广泛使用ANN模型来预测短期交通流量(Centiner等,2010; Hu等,2010; Pamula,2011)。Smith和Demetsky(1994)使用人工神经网络模型对历史数据进行时间序列分析来预测短期交通流量。此外,(Dougherty&Cobbett(1997);和Kirby等(1997))使用ANN模型预测短期交通流量。 Yasdi(1999)使用ANN模型来避免问题,并检查时间序列数据的更好的预测准确性。
很少有研究人员使用其他模型来预测交通流量。相反,江等人。 (2005)开发了动态小波神经网络模型和Vlaghogianni等人。 (2005)使用先进的遗传算法来预测交通流量。后来对具有时间和空间特征的数据使用多层结构优化策略,并且发现对于单变量和多变量短期业务量预测是重要的。 Quek等人(2006)采用混合模型(i-e神经网络和模糊逻辑相结合)来获得更高的预测能力。
Lam等人(2006)采用基于历史数据的短期交通流预测的两个非参数模型,非参数回归(NPR)和高斯最大似然(GML)来预测日流量。 Turochy(2006)采用非参数回归的最近邻形式和状态监测方法观察当前交通模式,并与基于历史数据的预期交通流模式进行比较,以确定这些观测值与当前情况的接近程度。小波网络(WNs)模型结合了离散小波变换和神经网络处理的优势,实现了强非线性逼近能力,因此已经成功应用于短期交通预测(Xie and Zhang,2006)。许多研究人员对混合建模技术感兴趣,因为结果更加准确和有希望,相对独立的方法。
Zeng等人(2008)使用混合预测模型来减少与历史数据类型相关联的问题,其结合了自回归整体移动平均(ARIMA)和多层人工神经网络(MLANN)。在实际生活中,交通流量本质上是异构的,并没有任何特定的模式,因此我们需要使用强大的分析工具来获得更好的结果。 Theja和Vanajakskshi(2010)使用支持向量机(SVM)预测交通流量。库马尔等人。 (2013)使用流量,速度和密度的ANN模型来预测短期交通流量。
Kumar等人提出了利用流量,速度和密度等过去交通数据进行交通流量短期预测的人工神经网络(ANN)。 (2013年)。从以前的研究工作中已经注意到,人工神经网络被许多研究人员广泛用于小时交通流预测。到目前为止,所有的研究集中在与历史数据类型相关的不同问题上,并且大多数研究集中在单线类型上。基于车道的短期交通流量,特别是5分钟的时间间隔是一个开放的研究领域。
3.应用技术
本研究使用的技术包括用于数据优化的遗传算法,用于预测的人工神经网络和局部加权回归。本节将对这些技术进行简要回顾。
3.1 遗传算法
遗传算法是一种启发式方法,用于查找搜索域中的全局最小值,帮助确定哪些个体应该存活,哪些个体应该重现,哪些个体不应再使用,应该死亡。 GAs的数学形式首先由John Holland(Holland,J.H.,1975)开发。它是解决许多问题的最广泛使用的随机搜索方法之一,其结果远远优于其他随机搜索方法(Davis,L.,1991)。 GAs通常按照预定的固定数量的世代繁殖,并且这些世代进一步填充预定的固定数量的二进制串。 GAs比其他搜索方法的主要优势在于,GAs可以使用“字符串”适合度来指导搜索来解决问题。遗传算法不需要关于搜索空间的具体知识,它在搜索空间中对群体而不是单个点起作用,因此它可以更好地适应包含间隙,跳跃或噪声的任何搜索空间,这使得该算法比其他梯度搜索更具吸引力方法。为了比较个人与其他个体,GAs只需要一种流量测量。
本研究中使用的GA程序包来源于在线来源:http://lancet.mit.edu/ga/。每个基因组都有主要的操作符,如初始化,种群大小,世代数,突变和交叉率。 GA种群大小参数设定在给定时间时间(即,一代中)群体中染色体的数量。它还决定了最初的人口是随机生成的还是通过启发式生成的。输入变量根据其在输入数据集中的位置从1到288进行识别和标记,并且允许每个基因取值1到288.具有更高线性相关值的染色体被选择为继续用于下一代并使用线性排序来评估适应度。
世代人口数量和世代数分别为200和1000。交叉率指定交叉运算符多长时间应用于当前人口以产生新的后代。交叉率,变异率和选择率决定了下一代种群的组成。
在这项研究中,交叉率设置为90%(0.9),这适合更好的输出。用随机置换算子进行突变,突变率设为1%。选择机制被设置为轮盘,并且为了实现目的使用GASteadyStateGA(重叠种群)方法。
3.2 人工神经网络
人工神经网络是建模和预测交通状况最广泛使用的最佳选择。 人工神经网络用于预测许多参数,如流量,占用率和速度。 人工神经网络可以近似任何函数,而不考虑非线性以及事先不了解函数形式(Vlahogianni等,2005)。 由于ANN具有快速预测能力,灵活性强,易于使用且功能强大,无论其性质如何都能解决问题,ANN是最受欢迎的工具。 它已被广泛用于城市交通建模,如Smith和Demetsky(1994)。 人工神经网络被认为是最受欢迎的工具之一,因为它们具有快速预测功能,灵活性强,易于使用且功能强大,足以解决问题,而不管问题性质如何。 人工神经网络可用于查找复杂输入和输出之间的数据模式。 许多研究人员使用人工神经网络来模拟城市交通状况,如Ledoux(1997)。
已经开发了多种神经网络结构,包括多层感知器(MLP)和径向基函数(RBF)网络。在这项研究中,使用多层感知器(MLP)架构。该架构使用由多个层组成的前馈方法。在前馈架构中,输入层的连接直接转发到输出层,而没有任何反馈环路。 ANN多层感知器(MLP)网络是最广泛使用的ANN之一。例如,许多研究人员已经使用Kumar等人的方法。 (2013)使用人工神经网络来预测非城市公路的短期流量预测。它属于称为前馈神经网络的一般结构类。 ANN多层感知器(MLP)网络主要由输入层,隐藏层和输出层三层构成。
MLP输入层由预测器组成,而隐藏单元由处理单元组成,用于处理从输入单元接收到的信息,并将结果直接转发给输出单元。 ANN多层感知器(MLP)已广泛用于交通预测。它是建模交通状况,尤其是短期交通流量预测的最灵活方式。
在这种结构中,输入层通过隐藏层直接连接到输出层,而在它们之间没有任何反馈回路。 MLP网络广泛用于许多运输应用中,以解决与非线性交通流有关的问题。多层感知器(MLP)可以近似任何任意函数,而不管关于它的先验知识如何。
3.3 局部加权回归分析
在这项研究中,使用局部加权回归(LWR),一种基于记忆的非参数方法。它将实值输入向量映射为实值输出向量。与人工神经网络等全球模型不同;本地模型学习。 LWR用于使用过去的交通流量数据预测未来的交通流量。每次需要预测时,它都会保留训练数据。接近预测点的训练观察结果通常会得到更高的权重(Friedman,1995)。 根据它们与查询点的距离来获得数据点的权重,使得接近查询的点获得权重1,并且远离查询点的点获得权重0.最常用的称重函数之一是高斯函数。
一般线性回归和神经网络是参数模型,它们在预测完成后丢弃数据,但在非参数LWR的情况下,它保留训练数据并在需要进行预测时使用它。
许多研究人员使用LWR模型,例如(Cleveland和Devlin,1988)。处理非平稳输入分布时,这些方法通常优于其他全局方法。它使用空间局部化算法,如最近邻居方法,核回归和懒学习(Atkeson,Moore,&Schaal,1997),并且发现局部线性方法比其他方法如k-nearest和内核平滑方法。本地建模优于神经网络等全局模型,不是因为精确性,而是局部模型避免了由全局模型产生的负面干扰(Atkeson et al。,1997b)。随着他们试图计算模型,这些LWR学习系统会不断增长,这些模型的计算成本相对较低。
4.研究数据
数据来自中国北京的一条城市道路,7月和8月。使用开发的数据提取工具提取所需数据。数据通过删除周末过滤,筛选出缺失值的日子,每天有288个数据点。
以不同时间间隔收集的数据具有不同的流量模式。在每个工作日的高峰时段(从上午7点到上午8点,从下午5点到下午6点),所有车道上的交通流量表现出比非高峰时段(从上午11点到下午12点)相对较高的交通流量模式。图3显示了每个工作日24小时内所有车道上7周的总体平均交通流量。从图3可以清楚地看出,在平日上午7点至上午8点以及下午5点至6点之间,所有车道上的车流表现出高流量。
在高峰时段,交通流量达到了所有车道的最大流量。在繁忙时间,在单线道路上,车辆数量达到每小时6500辆。高峰时段的交通流量代表了当日交通流量达到最大值的最关键时段,也是最大交通堵塞发生的时段。
高峰时段是交通流量达到其最低值的时间。在白天非高峰时段,与高峰时段相比,所有车道的交通流量显示出较低的交通流量模式。此外,在非高峰时段,每条车道上的最大车流量甚至低于每小时3000-4000辆,在5分钟内约为250辆车。
5.研究模型
输入数据文件在预测的5分钟之前包含7周的历史时间序列,其被作为GA算法的候选输入(288个初始输入)呈现。存在定义遗传算法的各种参数。这些参数可以变化以获得更好的性能。适应度函数,变异率,交叉率和选择率决定了下一代种群的组成。适应度函数确保最好的个体将继续在下一代中呈现,最差的个体将不再参与选择过程。该过程一直持续到遗传算法达到其预定义的终止函数。交叉率应该足够高,以获得更好的输出,即90%(0.9)。突变率指定在应用交叉算子后设置为0.01的突变频率。选择参数决定了要使用的选择机制的类型。所使用的默认选择机制是“轮盘”,并
全文共8865字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[11276],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。