英语原文共 19 页,剩余内容已隐藏,支付完成后下载完整资料
首次应用独立分量分析提取股票收益结构
摘要
本文主要研究将独立分量分析(ICA)应用于多元金融时间序列,比如股票组合。独立分量分析(ICA)是一种现代信息处理技术,又称为盲分析。ICA的主要思想是将观测的多元时间序列线性映射到一个统计独立分量的新空间,可以将其视为投资组合的分解,因为联合概率在独立分量空间坐标系中变成了简单乘积。
我们利用ICA分析日本最大的28支股票在三年内的日收益,并用其结果与主成分分析得到的结果进行比较。ICA的结果表明估计的独立分量分为两类:(1)频率低但波动大(代表股票价格的主要变化),(2)高频率的小波动(对股票的整体水平贡献不大)。本文结果表明,通过用一个小阈值对独立变量进行加权,能够较好的拟合股票价格的整体情况。相比之下,当用主成分提取的冲击进行拟合时,拟合效果比独立分量分析的拟合效果差。独立分量分析是一种有效分析和理解金融市场运行机制的潜在方法。ICA重点研究高阶统计量,因此ICA在风险管理方面有进一步应用的前景。
第一章 引言
是什么驱动金融时间序列的变动?这无疑是一个让许多人感兴趣的问题,从希望了解金融市场的研究员到利用这种知识获益的贸易商。现在的知识发现和人工智能技术能帮助发现一些这种潜在的力量吗?
在本文中,我们重点研究一种金融经济知识的新技术,它从来没有在金融或经济问题中有过重要应用,这种方法称为独立分量分析(ICA),也称为盲分析。独立分量分析的核心假设是观测的多元时间序列(比如股票的日收益)能够将系统(比如股票市场)的反应映射到几个统计独立的时间序列。ICA旨在提取独立分量(ICs)和混合过程。
ICA可以根据相关的概念来表示,比如熵、互信息、优化判据及其他表示信号统计独立的度量。对独立的信号而言,它的联合概率可以分解为边际概率的乘积,因此独立分量可以通过最小化输出信号的联合概率和边际概率的Kullback-Leibler散度来得到。因此,找到统计独立分量的目标可以有以下几种表述方式:
- 找到分解联合概率的方向
- 找到互信息最小的方向。当变量间的互信息消失时,变量是统计独立的。
- 找到“有趣的”方向。寻找有趣方向的目标与投影追踪类似,在知识发现和数挖掘领域,“趣味性”这个术语也用来表示意外。
基于上述表述,可以得到提取独立分量的算法。大体上而言,这些算法可以视为无监督学习过程。近期,在参考文献1、参考文献12、参考文献54、参考文献55中都发表了检验。
独立分量分析也可以和主成分分析(PCA)形成对照,下面我们给出了两种方法的简要对比。ICA和PCA都是将观测信号线性变换为成分,两者主要的不同之处是得到的成分的类型。PCA要得到不相关的主成分,此外PCA给出了数据在方差最大方向的投影,主成分(PCs)根据其方差的大小是有序的:第一主成分定义了方差最大的方向,第二主成分定义了在剩余的正交子空间中方差最大的方向,依次循环。然而ICA旨在得到统计独立的分量。
PCA只使用二阶统计信息。但ICA分离信号可能使用更高阶的统计信息,因此非高斯信号(或至多一个高斯信号)通常要求ICA算法基于高阶统计量。然而PCA算法不需要或不能使用非高斯信号所提供的更高阶的统计信息,因此这种情况下信号可以是高斯的。PCA算法可以由批处理算法或者线上算法实现,比如线上PCA算法或神经网络PCA算法。
本文的写作思路如下:第二部分介绍ICA的背景并引入了一些适用的算法;第三部分讨论ICA应用于金融时间序列通常涉及的几个问题;第四部分给出了将ICA应用于日本股票数据的实验结果,还对ICA和PCA得到的结果进行比较;第五部分总结了一些关于将ICA应用于金融时间序列的结论。
第二章 ICA的基本原理
2.1 独立分量分析
ICA代表得到观测信息向量并从中提取出统计独立向量的过程,被称为独立分量或信源。假设原始信源通过混合系统得到观测信号,则是原始信源的估计值。
图1 ICA的示意图
注:矩阵将原信源混合为观测信号,解混矩阵将观测信号转换为独立分量。
如图1所示为大多数ICA的基本过程,该过程记作:假设为观测的多元时间序列,由每个时间点的个值组成,是混合过程的结果
(2.1)
瞬时观测向量,其中'代表转置操作,则需要找到一个解混矩阵
(2.2)
其中是未知的混合矩阵。全文假设观测信息与信源数量相同,因此是的方阵。如果,那么,这是一种很好的分离。一般而言,找到的唯一可能是令,其中是任一矩阵,是对角缩放矩阵。
为了找到符合条件的矩阵,进行如下假设:
- 信源是统计独立的。虽然这听起来可能很强大,但这个假设也有可能是不合理的,比如从外国政治到微观经济变量等非常不同的源都有可能影响股票价格。
- 最多一个源具有高斯分布。在金融数据案例中,正态分布的信号是非常稀少的,因此只允许其中一个源是高斯分布不是一个严格的限制。
- 信号是稳定的。大多数模型的假设都包括稳定性,不仅仅只有ICA要求信号具有稳定性。
本文只考虑信号混合发生在一瞬间的情况。考虑模型与多通道盲解卷积也是很有趣的,但是我们没有考虑这种情况。
2.2 ICA的算法
最早已知的ICA算法是由Herault和Jutten提出来的,此后,在文献中提出了各种实现ICA的方法,包括:最小化高阶矩或高阶累积量,最大化输出量的互信息或最大化输出熵,最小化输出量的联合分布和边际分布的Kullback-Leibler散度。
通常用离线(批)形式或在线方法实现ICA,标准的批量ICA算法有如下两步:
- 去相关或白化。这里旨在对角化输入信号的相关矩阵。
- 旋转。第二步是最小化高阶统计量,这样能保证非高斯的输出信号能尽可能的独立,这步可以利用一个酉矩阵来实现。第二步保证了高阶独立性。
这个方法有时被称为“去相关和旋转”,需要注意的是这个方法适用于非高斯的观测信号。对高斯信号而言,高阶统计量是0,因此ICA不能实现有意义的分离。非高斯随机信号是指不相关且高阶交叉统计(如时刻或累计)归零的信号。
本文进行实验研究使用的是JADE算法(特征矩阵的联合近似对角化法),JADE算法是一种批处理算法,也是上述两步程序的有效版本。第一步是通过计算样本协方差矩阵,给出观测到的输出信号的二阶统计量,对协方差矩阵进行特征值分解,从而白化数据。第二步是找到一个旋转矩阵,旋转矩阵的联合对角化特征矩阵由白化数据的四阶累积量组成,由此得到的输出信号就是独立分量。算法的具体细节,读者可以参考参考文献14。Pope和Bogner扩展了JADE算法,Cardoso 、Comon 和Bogner也提出了其他两步程序方法的案例。
研究人员提出了各种各样的在线算法(具体参考文后的参考文献)。大多数的这些算法又被称为神经网络学习算法,它们定义了一个成本函数,通过调整分离矩阵增加输出信号的独立性来优化成本函数。
最近通过用自然梯度逼近已经大力发展了ICA算法。Cardoso和Laheld构思了一种近似的方法,他们把它称为相对梯度算法,这在理论上合理的修改了普通的在线更新算法,克服了在每一步必须进行矩阵求逆的问题,因此其收敛速度更快。
Pearlmutter和Parra提出了另一种叫做语境的ICA,这个方法基于极大似然估计,对源分布进行建模,用信号的时间性质来获取分离矩阵。用输出信号的过去值来估计输入源的密度函数。经验证,该算法能够有效分离有色高斯分布或低峰度信号。
ICA已经扩展到了非线性混合的分解,Burel首先提出了这种方法之一。最近Yang、Amari和 Cichocki提出了一种方法用于估计被混合且通过可逆的非线性函数的源。Yang和Amari提出了最大化熵和最小化互信息的无监督学习算法。Lin、Grier和Cowan叙述了ICA的原始版,不仅找出了球型坐标系,还计算出了数据子集,当利用可逆变换时,这是一种很有前景的表示全局非线性的方法。
研究人员还考虑到了经混合和卷积信号的ICA算法。
第三章 ICA在金融中的应用
3.1 探索ICA在金融中应用的原因
ICA提供了将给定信号分解为统计独立分量的机制,本文的目标是探索ICA是否能给出一些股票市场基本结构的说明,希望能找到瞬时股票收益的解释因素,这些因素可能包括新闻(政府干预、自然或人为的疾病、政治动荡)、对大交易的反应,当然也包括某些不可解释的随机因素。最后,希望我们能够找到分析和预测金融时间序列的新方法,对更好的了解金融市场有所贡献。
3.2 预处理
像大多数时间序列方法一样,ICA要求观测信号具有稳定性。本文通过计算连续的股票价格序列的差分,将不稳定的股票价格转换为股票收益,即
(3.1)
如果价格水平相对于过去几年有较大的变化,可以用相对收益来代替,即
(3.2)
以此来描述几何增长,与累积增长相对应。
第四章 用ICA分析股票收益
4.1 数据简介
为了研究将ICA技术应用于金融时间序列数据的有效性,本文将ICA应用于东京证券交易所数据。我们使用了28个大公司从1986年到1989年每天的收盘价格,公司名称列在附录中。图2展示了列表中的第一个公司——东京三菱银行从1986年8月到1988年7月的股票价格。图3展示了同一时间段东京证券交易所最大的8支股票的波动,为了表达清晰对股票价格进行了抵消。
图2 东京三菱银行从1986.8到1988.7的股票价格
注:东京三菱银行是东京证券交易所最大的公司之一。
图3 东京证券交易所在1986.8到1988.7最大的8支股票价格
注:在图3中,为了表达清晰对每支股票进行了抵消,每支股票的变化范围大约是2500日元,最低这条线展示了东京三菱银行的股票价格,也就是图2所示的价格。
预处理包括三步:根据3.2所述的方法得到股票的日收益,计算每支股票的均值,将日收益归一化在股票区间[-1,1]内,如图4所示为归一化后股票收益。
图4 前8支股票在1986.8到1988.7的股票收益(不同的时间序列)
注:最大的负收益在第317天,对应的是1987年10月19日的分解,最低的这条线也是对应东京三菱银行。我们面临的问题是:ICA能揭示时间序列有用的信息吗?
4.2 独立分量的结构
本文用JADE算法来实现股票收益的独立分量分析,此处的JADE算法即2.2中所述的JADE算法。在整个实验中,假设股票数目等于混合模型提供的源的数目。
这里介绍的结果,是将28支股票作为ICA的输入信号得到的结果,但是为了描述清晰,只画出了前面几个独立分量。图5展示了根据算法得到的8个子集。请注意,统计独立的目标迫使1987的分解由少数几个分量实现。
图5 28支股票独立分量分析结果的前8个独立分量
注:这些独立分量可以看作相当不同的输入系统的冲击。
下面给出东京三菱银行这支股票的分析,独立分量对每支给定股票的影响如下:
对于每个给定的股票收益,对应混合矩阵的一行,该行用来对独立分量进行加权。通过将独立分量与矩阵对应的行相乘,得到加权独立分量。我们定义占优独立分量为有最大信息振幅的独立分量,它们在重建股票价格中有最大的影响。与此相反,其他的标准不是集中在最大值而是平均值,比如方差。
如图6所示,用混合矩阵的第一行对独立分量进行加权,混合矩阵的第一行对应着东京三菱银行,在底部的4条轨迹展示了这支股票最占优势的4个独立分量。
图6 通过对混合矩阵的第一行进行加权得到的4个最占优的独立分量
注:混合矩阵的第一行对应东京三菱银行,下面的4条轨迹为最占优的独立分量,最上面的一条为保留24个不占优独立分量的概括,所有独立分量的加权总和对应于原始股票回报。
从等式(2.1)给的普通混合过程中,我们可以得到用所有独立分量的估计值重建的第支股票的收益如下:
(4.1)
其中是第个独立分量估计在时间的值,是估计的混合矩阵(是分离矩阵的逆)在第行第列的权重。我们定义第个观测信号(股票收益)的加权独立分量为:
(4.2)
本文对第一支股票收益的加权独立分量进行排序。因此,我们将独立分量与混合矩阵的第一行相乘,然后用来得到加权的独立分量。因为我们最感兴趣的是使特定股票价格产生最大改变的独立分量,所以用来对加权的独立分量进行排序。
根据股票收益所得的独立分量揭示了以下几方面:
- 少数几个独立分量促成了股票收益绝大多数的变动;
- 占优独立分量的瞬时大振幅促成了主要的水平改变,不占优分量不会促成水平改变;
- 小振幅的独立分量促成短时间内的水平波动,但对整个时间段来说,水平没有发生改变。
如图7所示是利用4个占优加权独立分量得到的重建价格,并将此价格与用其余24个不占优加权独立分量得到的重建价格进行比较。
图7 重建价格图
注:最上面的虚线是
全文共7369字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[144489],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。