英语原文共 19 页,剩余内容已隐藏,支付完成后下载完整资料
组合预测
JM BATES和CWJ GRANGER
诺丁汉大学经济系
两套独立的航空公司客运数据重新组合形成了一套综合的预测。主要结论是,组合预测可以产生比原始预测更低的误差平方误差。每个原始预测的历史过去都用来确定这两个原始预测中形成综合预测的权重,并检查了导出这些权重的不同方法。
介绍
我们的利益存在于对同一事件进行两次(或多次)预测的情况下。通常,大多数统计人员和商人在发生这种情况时的反应是试图发现那个更好(或最好)预测; 然后接受并使用更好的预测,另一个则不会被使用。虽然分析是这项工作的主要目标,但这可能具有一定的优点,但如果目标是尽可能做出好的预测,这显然不是一个明智的过程,因为抛弃的预测几乎总是包含一些有用的独立信息。这个独立的信息可以分为有两种:
- 一个预测会基于其他预测未考虑的变量或信息。
- 预测对变量之间关系的形式做出了不同的假设。
第二种情况可能并不一定会导致组合预测的结果优于单项预测的情况,尽管有时可以如附录第1节所示。
应该指出的是,我们对单项预测的性质强加了一个条件,即它们是无偏的。一套高估真实价值的预测,如果结合一套无偏的预测,则适用于有偏差的预测; 很有可能合并的预测将会比无偏差的预测更“有效”。因此,第一步是检查各组预测是否无偏差,并且如果有偏差来纠正平均百分比(或绝对)偏差。
在讨论各单项预测之间可能得不同组合方式之前,通过对两个预测进行粗略组合,可以给出经验证明。所选择的预测是国际航空公司的客运数据,其中包括(其中包括)Bro,而Box和Jenkins对未来一个月的预测进行了月度预测。这些预测发表在Barnard的一篇文章中,他说:“预测方法......由Box教授开发..... 和詹金斯博士(现在的教授)......已经证明......非常成功. . . 我们现在正在寻找过程......(为此)可以找到更好预测的替代方法“,所示的组合是两个单独预测的算术平均值,表1给出了1953年的的详细信息。
表一
月份 |
布朗 指数平滑预测的误差 |
适应性预测的误差 |
组合预测(指数平滑 适应性预测)的误差 |
一月 |
l |
-3 |
-1 |
二月 |
6 |
-10 |
-2 |
三月 |
18 |
24 |
21 |
四月 |
18 |
22 |
20 |
五月 |
3 |
-9 |
-3 |
六月 |
17 |
-22 |
-19·5 |
七月 |
-24 |
10 |
-7 |
八月 |
-16 |
2 |
-7 |
九月 |
-12 |
-11 |
-16 |
十月 |
-9 |
-10 |
-9·5 |
十一月 |
-12 |
-12 |
-12 |
十二月 |
-13 |
-7 |
-10 |
误差方差 |
196 |
188 |
150 |
列举这些数据和其他对这些数据的预测是在稍后阶段进行的。目前只需要注意的是,在1951 - 60年期间,提到的三个预测中的误差方差分别是177.7(布朗),148.6(Box-Jenkins)和130.2(相等权重组合到每个单项预测)。因此,尽管布朗的预测比Box-Jenkins的预测有更大的差异,但它们显然具有一定的价值。
Stone等人的工作使用了与此类似的想法,尽管他们的工作仅仅是对英国过去的国民收入数据进行了改进的估计,并没有解决预测问题。
确定权重方法的选择
虽然通过给每个单项预测赋予相同的权重形成的综合预测对于说明目的是可接受的,但随着数据的积累,人们希望更加重视一系列预测,这些预测似乎包含在较低的(均方)错误。问题是如何最好地做到这一点。确定这些权重的方法有很多种,目的是选择一种可能对综合预测产生低误差的方法。我们首先想到的方法是通过以下方式推导出来的。假设单项预测的表现是一致的。
随着时间的推移,这两个预测的误差方差可以用和表示所有时间值t。进一步假设两个预测都是无偏的(自然地或在修正之后)。合并的预测将通过两组预测的线性组合来获得,给出第一组预测的权重k和第二组的预测权重(1-k),从而使得组合预测无偏见。然后可以写出组合预测误差的方差:
其中k是第一组预测的比例权重,rho;是第一组预测误差与第二组预测误差之间的相关系数。k的选择应使得组合预测的误差很小:更具体地说,我们选择最小化整体方差。关于k的区分,令等于零,我们得到在以下情况下出现的最小:
K=
在rho; = 0的情况下,它减少为:
K=)
(1)
(2)
可以证明,如果k由等式(1)确定,则的值不大于两个单项方差中较小的一个。附录第二部分记录了这种代数证明。
k的最佳值在组合预测开始时不知道。由于两个原始预测的相对表现积累了数据,所以给予权重k的值会发生变化。因此,时间段T,的组合预测更准确地写为:
= (1-k)
在这里是从第一组开始的时间T处的预测值,其中T是从第二组开始的时间T的预测值。
等式(1)和(2)则作为后面的一些方法的基础。然而,人们认为,其中一个预测的执行情况可能随着时间的推移而发生变化(或许有所改善),并且基于自预测开始以来的误差变化估计的方法可能不适合。因此,我们还构建了两种方法,比过去的方法更重视最近的错误(见下面的方法(iii)和(iv))。
方法的可取性
好的方法(由我们定义为产生低均方差的那些方法)可能具有如下特性:
- 如果预测的数量保持不变,k的平均权重应该接近由(1)定义的最佳值,因为预测的数量增加了。
- 如果其中一个预测的成功发生持续变化,则权重应快速适应新的值。
- 权重应该仅在最佳值上稍有不同。
最后一点是因为财产(a)本身是不够的。如果k的最佳值为0.4,如果k只取两个值,那么仍然可能获得较差的综合预测值,60%的场合为0,其余40%为1。
除了这些属性之外,还试图将方法限制在适度简单的方法中,以便它们可以用于商人。
迄今为止已经检查了五种方法,并且在每个方法中,在时间T,处的组合预测已经通过给予从第一集合到时间T的预测的权重并且从权重1-到第二预测对于时间T; 所有情况下权重都是由过去确定的(已知的)两个系列的误差决定,这些误差表示为,, hellip; ,和,, hellip; ,,除了,因为它的值在所有方法中都被选定为0.5
(i)我们用,并用E1对第一组预测误差进行类似的总和。 然后:=
(ii)=x (1-x)
x为0与1之间的常数值
(iii)我们用表示,w为权重,w大于1代表给予更多的权重给近期的误差方差,给予更小的权重给更久之前的误差方差。
(iv)我们用C表示加权协方差,则:
C=
(v)
(1-x)
方法之间的差异不是唯一的因素,并且对参数v,x和w的适当选择也是重要的。尽管如此,我们的报告集中在各种方法之间的差异,因为我们预计这些方法会变得更加重要。
有必要指出的是,方法(v)不能满足标准(a)。它在(b)和(c)的标准上得分很高,而对于几乎同样好的预测,它的表现非常好。但是,由于它低估了权重以提供更好的预测,所以在某种程度上这是一种不理想的方法。另一个缺点是,权重受到个别预测中两个小误差产生的给定比率的影响,这是由于两个大误差产生的比率。因此,如果过去的错误平均为10,就会被修正,比如=0.01和=0.02,就像误差是10和20一样。其他方法都不会受到这个缺点的影响。 进一步,他们都满足标准(a),尽管在标准(b)方面有些可能不那么明显令人满意。在提到经验性工作后,对这些方法进行进一步评论可能更容易。
不同方法的表现
迄今为止进行的实证工作相当有限,因为我们只对上述航空公司旅客数据进行了预测。因此,对于大多数方法得出明确的结论是不可能的。然而,确实出现了一些初步的结论。
对航空公司旅客数据的五项预测都进行了检查,都是每月预测,提前一个阶段。在1951年至60年期间,Brown和Box-Jenkins的研究成果中,有1954 - 9年由PJ Harrison编写的一套预测和1951 - 1960年的一套预测。哈里森编写的内容与他在“应用统计”5中发表的“Seatrend”相似,唯一的区别是目前的预测基于三个参数,而不是两个参数。 我们自己做出的两个预测被称为恒定季节和变化季节预测。 这两个预测的基础都涉及两个阶段,第一个阶段是估算一个简单的季节性组分,并与最近几个月的数据总和一起用于对下个月的原油预测。 第二步是通过利用上个月原油预测误差的信息来“纠正”这一原油预测。 这两个预测之间唯一的区别在于,季节变化预测分析是否季节性组件在多年内发生变化,如果是这样,在得出原油预测之前会提供一些补贴。 在这里不做过多的讨论,有兴趣了解详情的读者可以通过参阅另一篇文章,里面更全面地描述了这两种预测。
由于布朗的“指数平滑”和Box-Jenkins的“自适应预测”方法对读者来说是相当熟悉的,因此将首先描述结合这两个预测的结果,这也是非常利于说明这个问题的。布朗预测是通过分析1948年以后的数据,拟合一次谐波作为一次季节性的估计,然后以通常的指数平滑方式估算水平和趋势因子。详情请咨询Harr ison。Box Jenkins的预测来源于预测12个月的移动资金,其中11个月是已知的。 在月份T,结束的12个月总和的预测取决于中的预测误差,之间的误差以及所有过去的误差值和。在这里不做过多的讨论,有兴趣了解详情的读者可以通过参阅Box和Jenkins的文章来了解一般细节。
两个单独预测误差的总体差异分别为177.7和148.6; 以及0.60的相关系数,这意味着如果两个单独的预测误差方差的比率始终保持不变,那么整个[见方程(1)]的k = 0.39的值将导致最佳的组合预测整个时期。等式(2)不考虑两组误差之间的相关性,给出k = 0.46。使用k =0.46会导致组合预测的结果不太好,但可能被认为是方法(i) - (iii)和(v)的可能下限。
表2中记录了结合不同方法的结果,包括绝对误差和比例误差。在很多方面,比例误差的使用是一种更合适的测量方法,因为平均误差和绝对误差随时间显着增加,但需要注意的是,这两种预测都是基于绝对数字的分析而编写的。值得注意的是,除了第四种方法以外,所有方法都能够(在适当选择参数的情况下)产生比被认为是“最优”的预测更好的预测。这确实令人惊讶,因为恒定权重的价值是使用所有10年的误差方差总和来计算的:换句话说,只有通过后见之明才能得出来自恒定权重的预测。相比之下,这五种方法中的每一种仅使用过去的错误来对任何时期进行组合预测。为什么会出现这种结果?布朗一系列预测的绝对误差并不总是高于Box-Jenkins在所有时间段内的比例177.7:148.6。有时布朗的预测是好的,如果预测的误差是在时间t很小的时候,很可能第t 1个月的误差也很小;但是,如果趋势发生变化,布朗的指数平滑预测不仅没有立即发现(这是不可避免的),还需要一段时间才能完全纠正。因此,布朗的预测误差高度串联,产生1951 - 1960年间德宾 - 沃森统计的0.83,这个数值在1%的水平上显着。此外,布朗假设的季节模型未能充分反映一年中特定时间的季节模式。这两个原因是造成较低预测误差的方法成功的部分原因相反,值得注意的是,Box,Jenkins和Bacon最近的一组预测基于数据的对数。推导这些预测的基础发表在Harr编辑的一本书中。这些预测的误差方差为160。
可能是因为权重k始终保持不变; 它们也可能
全文共6242字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[16304],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。