集装箱吞吐量的短期预测:安特卫普港的ARIMA干预模型
应用经济学系,运输系和地区经济学城校区(CST)B.432,Prinsstraat 13,安特卫普2000,比利时。电子邮件:yasmine.rashed@aast.edu; yasmine.rashed@uantwerpen.be; 希尔德。 meersman@uantwerpen.be; eddy.vandevoorde@uantwerpen.be;蒂埃里。 vanelslander@uantwerpen.be
1.摘要
集装箱吞吐量的短期预测对规划港口业务和腹地活动至关重要。然而,全球经济活动以及海运贸易的波动性和不确定性在港口层面的集装箱吞吐量建模和预测方面带来了复杂性。在本文中,应用了不同的单变量时间序列方法; 自回归整合移动平均(ARIMA)模型,即ARIMA干预模型和具有领先经济指标的ARIMAX模型。 所用方法的优点是双重的;(i)它提供了关于2008年后金融危机后数据生成过程的深刻见解,以及(ii)它确定了经济活动与集装箱吞吐量之间的关系。 1995年1月至2015年3月期间,安特卫普港每月的总集装箱吞吐量数据被使用。在实证分析和预测表现评估的基础上,欧盟工业指标显示导致集装箱吞吐量为期2个月。另外,2008年10月的结构性突破显示,考虑到这些条件,集装箱吞吐量一直回到危机前的水平。
关键词:ARIMA; 集装箱吞吐量 运输建模; 预测; 干预分析; 安特卫普港
2.介绍
短期决策在港口竞争地位的发展以及对经济的直接和间接影响方面发挥着重要作用。码头运营商,港口当局和其他利益相关者就运营规划和资源分配决定做出的短期决定,以避免拥堵和处理集装箱的数量,不仅在码头,而且还在与腹地的联系。港口活动与全球经济变化密切相关。2008年全球金融危机对港口行业产生了重大影响。 因此,港口当局,码头运营商,投资者和其他利益相关方越来越依赖交通需求预测来合理化与运营和投资有关的决策。
这篇文章的目的是提供一个规划工具来应对未来需求短期波动的不确定性和波动性。已开发的模型试图预测港口水平的短期集装箱吞吐量,以20英尺的当量单位(TEU)而不是吨来衡量,这在以前的研究中通常是这种情况。此外,分析是在2008年的金融危机之后进行的,并入该模型。这提供了对结构性中断后的数据生成过程的深入了解,并可以计算冲击期间和冲击后对集装箱吞吐量的影响。 此外,该模型还确定了导致集装箱吞吐量的外生变量。这些都是对当前知识状态的新贡献和原创性贡献。
由于所提供的运营决策和服务取决于每单位时间的集装箱运输数量,因此码头运营商和港口当局对此类预测的重要性感兴趣。尽管如此,预测使用TEU的数量是有限制的,因为这并不总代表一个国家的经济活动。集装箱吞吐量不一定会影响交易量,也不会影响经济活动。因此,挑战是确定经济活动与集装箱吞吐量之间的关系。
因此,我们的方法依赖于单变量时间序列方法。本文采用两种动态时间序列建模方法。首先,估计自回归整合移动平均(ARIMA)模型,将季节性与干预函数结合起来考虑冲击的影响。 其次,估计ARIMAX(具有外生变量的ARIMA)模型以说明港口吞吐量与经济活动之间的关系。单变量建模的优势在于它提供了一个系统的方法来构建,分析和预测时间序列模型,而不依赖于多元回归分析中需要的其他变量。
本文的结构如下。介绍文献回顾,然后介绍建立模型的方法。接下来,对安特卫普港进行了实证分析。最后,对结果和主要结论进行了讨论,并给出了结论和进一步的研究。
3.文献评论
计量经济学预测模型广泛用于金融和宏观经济分析,衡量政策变化和结构性冲击的影响。Meersman等人(2002)广泛地回顾了1970年至1997年期间关于预测港口总需求的文献。在此期间进行的大多数研究均基于专家意见和使用GDP和趋势进行的趋势外推,其中只有少数显示了所使用的特定模型。假定GDP与港口吞吐量之间的关系的预测方法已广泛用于文献中,尽管假设两个变量之间存在稳定的关系。然而,实际上,这种关系正在发生变化,这是由于生产,贸易模式,增加的转运活动以及导致不同港口兴衰的供应链和物流服务的变化。
Klein(1996)的工作发现,应用单变量方法预测海运贸易。他表明,在分解的商品水平上使用变换和干预模型可以为时间序列的行为提供有用的见解,并解释其中的异常值。为了预测安特卫普港的货运情况,他研究了1971-1982年期间的22种商品流量。他分析的商品范围在普通货物和散装货物(装货和卸货)之间差异很大,以吨表示。在Klein(1996)中使用的干预方法取决于分段线性函数(Melard,1981),而不是在这里应用的输出响应(Box和Tiao,1975)。
Peng和Chu(2009)对台湾三个主要港口的月度时间序列进行了六个单变量模型的比较,以预测集装箱吞吐量。他们的结论是,经典分解方法和季节自回归整合移动平均(SARIMA)模型根据预测准确性准则给出了最佳预测。然而,在我们的文章中使用ARIMA方法的附加值是它包含了干预参数和外生变量。
从长远来看,其他方法已被应用,取决于因果方法。Veenstra和Haralambides(2001)使用多元自回归模型来预测商品层面的长期贸易流量。 Fung(2002)估算了香港和新加坡港口码头的误差修正模型,以研究码头运营商之间的竞争互动。作者强调预测对港口之间相互作用的依赖性,并提供了系统的方法来预测集装箱处理服务的需求 Meersman等(2003)和Meersman和Van de Voorde(2013)分别使用多元回归模型研究了进出口之间的长期和短期关系,以及港口的装货和卸货活动。De Langen(2003)的工作确定了海上集装箱运输需求的七个决定因素,其中四个因素与贸易量和贸易流量有关,三个因素与集装箱运输流量份额有关。 Hui等(2004)通过估计协整误差修正模型预测香港的港口货物吞吐量。
在诸如航空运输等其他运输部门,Lai和Lu(2005)采用了干预-ARIMA方法,纳入了2001年9月11日的冲击,以衡量冲击对乘客数量的影响,并预测了航空旅客乘客的需求。美国。在制造业中,Chung等(2009)估计ARIMA干预模型是为了调查突发的金融危机对中国制造业的影响。Pallis和De Langen(2010)发现了其他定性分析,分析了经济危机对港口的结构影响,并分析了Slack(2010)调查了金融危机对海洋产业的主要影响。Grouml;ger等(2011)研究了生态应用中的干预分析,区分导致数据结构性中断的体制转换和由于自然周期性周期导致的体制转变。
从以前的文献回顾中,我们得出结论:选择适当的预测模型取决于目的,预测期,影响该期的外生因素,货物类型和时间序列结构。
4.方法论
文献中采用的标准单变量常用技术是Box-Jenkins方法(Box et al,1976)。 Box Jenkins程序使用时间序列变量的过去值,结合随机冲击的当前和过去值来预测变量。这种方法是合理的,因为随时间测量的观测结果不是独立的,也就是说,它们经常表现出强的自相关性。经验模型是通过模型规范,估计,诊断测试和模型调整的一系列迭代过程来实现的。假设该系列的线性行为,该过程在平稳时间序列上执行。 估计季节性ARIMA干预模型和ARIMAX模型预测港口级别的短期集装箱吞吐量。我们比较结果以确定哪个模型提供了更好的预测。
Box等人(1976)开发了一套系统的经验方法来识别和设定一个严格的模型,这个模型可以在统计上可靠和有效。这包括三个步骤:(i)模型识别,(ii)估计和诊断测试,以及(iii)预测应用。这些步骤是在一个迭代过程中进行的,提出了一些试验模型。对这些参数进行估计,然后进行一系列诊断测试和视觉检查,以确保:(a)模型t对数据的充分性,(b)参数的显着性和可逆性条件的满意度,(c)残差的随机性和(d)交叉验证,以检查模型产生可靠预测的能力,其中平均绝对误差计算MAPE)来衡量坚持样本的预测准确度。一旦潜在模型通过了所有诊断测试,就会选择它并用于生成事前预测,比较预测误差以确保用于操作决策的动态工具。
5.ARIMA模型
Box-Jenkins程序使用时间序列变量 - 自回归(AR),(yt-1,yt-2,...,yt-p)的过去值与过去的随机冲击值 - 移动平均值(MA),(at-1,at-2,...,at-q)。重点在于使用变量历史价值中包含的信息来预测其未来行为,以及未来价值的分布,以过去为条件(见Verbeek,2008)。Box-Jenkins方法是在一个平稳的时间序列数据上进行的,其中(I)表示该序列必须被区分直到其静止的顺序。
每月使用的时间序列数据的一个重要特征是季节性。为了解决这个问题,ARIMA模型扩展到SARIMA(p,d,q)(P,D,Q)模型,其中(s)代表#39;季节性#39;。在方程(1)中,SARIMA模型用滞后算子表示,其中(p)表示自相关阶数,(d)表示差分阶数,(q)表示移动平均阶数。大写字母(P,D,Q)分别指季节性组分。
Yt 是t级的时间序列
B 是滞后算子
Delta;d 是非季节性运营商,定义为(1-B)D
empty;p(B) 是秩序的非季节性自回归算子
theta;q(B) 是定义为q的非季节移动平均算子
Phi;p(Bs) 是无限订单P的季节性AR操作员
Theta;Q(Bs) 是无限订单Q的季节性MA运营商
at 是白噪声,假设为独立同分布,均值为0,方差为sigma;2。
互相关函数(CCF)用于测试不同的经济变量,作为ARIMAX框架中的外生变量。 为了确定先导滞后关系,CCF被用于一个固定的时间序列。 样本CCF根据互协方差函数(CCVF)定义如下(参见Chatfield,2004,pp.155-159)
请注意,在等式(2)中,第一行指代(x导致y或y滞后x),并且第二个是指相反的。样本CCF是:
n 是样本量
K 是滞后数
mu;x 是xt的均值
mu;y 是yt的平均值
sigma;2x 是xt的方差
sigma;2y 是yt的方差
6.干预分析
观察到的序列中存在异常值会导致自回归系数的估计偏差,从而导致预测偏差和较大的相应预测区间。当异常值接近预测原点时,问题会变得更糟(Franses,1998)。 异常值和创新被明确地利用,不仅用于预测准确性和无偏估计的目的,还因为它们可能向决策者传达关于数据生成过程的重要信息。
在Box和Tiao(1975),Tsay(1986)和Franses(1998)的着作中,区分了异常值和干预变量。一方面,由于非经济原因,在事件发生日期没有先验信息,仅影响发生时的平均函数而不改变生成过程,因此异常值或加法异常值在时间序列中是异常的。另一方面,干预或创新异常值被定义为具有先验信息的事件,发生在两个时间段之间并且预期会引起异常观察,或者影响时间序列生成过程的时间序列的变化处理。外部干预如政策变化,危机或任何其他外部因素导致冲击。
这里采用的实证分析取决于两个标准的相互作用。(i)持续时间 - 无论是暂时效应还是永久效应,以及(ii)影响效应 - 如果变化处于水平或斜率或两者兼而有之。对于具有(k)异常值出现在时间(Ti)其中(i = 1,2,...,k)的时间序列的动态干预分析模型的一般形式由等式(4)等人(1976):
Zt= mt yt (4)
其中(Zt)是观察到的污染级数,(y)是未受干扰的过程,但未观测到的时间序列和(mt)是传递函数。 传递函数模拟异常值的影响:
Vi(B) 表示在T时刻异常值i的动态影响
Wi 是影响的大小(系数)
Ti 是干预或异常值的发生时间
PTt= 脉冲干预
STt= 单步干预
无扰动过程yt是这样的:
因此
全文共9210字,剩余内容已隐藏,支付完成后下载完整资料
英语原文共 16 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[17408],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。