英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料
Using genetic algorithm to support portfolio optimization for index fund management
基于遗传算法的指数基金投资组合优化
摘要
本文基于遗传算法(GA),提出了指数型基金管理的投资组合优化方案。指数基金是投资组合管理中的流行方案之一,旨在尽可能模仿与接近纽约普尔500指数和伦敦富时100指数等基准指数。当基金经理人不确定表现优于市场时,他们常常会采取这种策略并调整自己的平均表现。最近,人们注意到指数基金的表现要好于许多其他积极型共同基金[Elton, E., Gruber, G., amp; Blake, C. (1996). Survivorship bias and mutual fund performance. Review of Financial Studies, 9, 1097–1120; Gruber, M. J. (1996). Another puzzle: the growth in actively managed mutual funds. Journal of Finance, 51(3), 783–810; Malkiel, B. (1995). Returns from investing in equity mutual funds 1971 to 1991. Journal of Finance, 50, 549–572]。本文的主要目的是实现指数基金可以GA投资组合方案大大提高绩效表现。该方案将用于跟踪韩国(KOSPI)指数200。
1 绪论
指数基金是现代投资组合管理中常用的投资工具。指数基金旨在模拟指定基准市场指数(例如纽约的标准普尔500指数,伦敦的富时100指数,首尔的KOSPI指数200等)的行为。因此,与其他共同基金相比,指数基金通常被认为是相对稳定和有效的投资工具(Jensen,1968; Sharpe,1966)。
指数基金策略是基于被动投资管理的概念。有几篇论文报道了指数基金与其他主动管理的投资组合相比的优越表现(Elton, Gruber, amp; Blake, 1996; Gruber, 1996; Malkiel, 1995)。除了指数基金在风险和收益方面的优异表现外,指数基金也被认为是资本市场上有效降低成本的投资工具(Hogan, 1994)。
指数基金由相对少量的股票组成。如果想建立一个完美的指数基金,我们需要将指数中包括的每一家公司纳入指数基金组合(例如500家标准普尔500指数公司,100家富时100指数公司,KOPSI指数200公司)。然而,将每家公司纳入指数基金组合的成本并不切合实际预算。因此,指数基金试图用相对较少的股票来复制指数的走势。
本文提出了一种用于指数基金优化的遗传算法(GA)投资组合方案。该方案利用遗传算法,并利用基本变量——公式(1)给出的投资组合beta;的标准误差,平均交易量和平均市值,提供最优的股票选择。这些基本变量是分析和预测股票市场常用的众所周知的核心因素。粗略地说,GA投资组合方案由两个步骤组成。首先,指数基金的股票是通过分析基准指数中每个行业部门的基本变量来选择的。其次,所选股票的相对权重通过GA进行优化。能有效复制基准指数且股票数量相对较少的投资组合方案将被显示。有效的指数基金管理业务依赖于复制基准指数的技术。
该遗传算法适用于1999年1月至2001年12月的韩国股票价格指数(KOSPI)200。KOSPI 200包括22个行业中的200家主要公司,目前在韩国证券交易所上市。这200家公司覆盖了韩国证券交易所的大部分,KOSPI 200也是KOSPI 200期货合约的基础指数,这是韩国证券交易所最活跃的期货合约。
本文由五部分组成。在本节之后,第2部分将简要介绍投资组合理论,指数基金和遗传算法。第3节讨论了投资组合方案的细节,第4节报告了实证型实验结果。最后,第5节为结束语。
2文献综述
2.1投资组合理论,指数基金和跟踪误差
现代投资组合理论提供了一个发展完善的范例,形成了一个给定的风险承受水平下具有最高预期回报的投资组合。 Markowitz(1952,1959)是现代投资组合理论的创始人,他最初提出均值-方差投资组合框架的基本定理,解释了均值和方差之间的关系,分别代表投资组合的预期收益和风险。虽然马科维茨的理论只用均值和方差来描述回报的特征,但他关于投资组合结构的理论成为了现代投资组合理论的基石(Fama, 1970; Hakansson 1970, 1974; Merton, 1990; Mossin, 1969)。在均值-方差投资组合理论之后,投资组合理论和实践取得了巨大进展,包括在投资组合公式中引入的各种实际应用。最近发现,低成本被动式管理的指数基金实际上却在各类共同基金中都实现了风险调整回报率最高(Bogle,1998)。
指数基金管理是一种具有指数跟踪技巧的股票分配策略,它试图复制给定基准指数。指数基金通常不包括构成指数的每只股票。然而,它们旨在用相对较少的股票对基准指数进行跟踪和复制。这些股票可以在资本市场中轻松管理和控制。因此,指数基金的表现关键取决于指数跟踪方法。
当然,指数跟踪涉及由TE波动率衡量的跟踪误差(TE)。它是跟踪组合与基准指数的回报偏差总和。当基金经理制定指数基金时,他们会尽量减少TE波动水平,以尽可能接近基准指数的收益(Clarke, Krase, amp; Statman, 1994; Sharpe, 1971; Konno amp; Yamazaki, 1991)。一般来说,有几种跟踪误差计量模型可用,即二次模型,线性模型和绝对模型。其中二次测量是最优的,因为它具有许多理想的统计特性(Roll,1992)。在本研究中将采用二次方法。
2.2 遗传算法
遗传算法是Holland(1975)发明的一种随机的优化方法,是一种基于字符串结构适配的搜索算法(Goldberg,1989)。 他们运用生物学研究方法来指导搜索(近乎)最优解(Wong&Tan,1994)。 总的想法是维持一个由一群染色体组成的人造生态系统。 在这项研究中,每个染色体代表单独的股票所占的权重。每个染色体附有一个适应度值,它定义了染色体代表的解决方案的适用性。 通过使用突变,交叉值和自然选择,群体将会收敛至仅包含具有良好适应性的染色体(Adeli&Hung,1995)。 最近,GA在投资组合学中备受关注(Orito, Yamamoto, amp; Yamazaki, 2003; Xia, Liu, Wang, amp; Lai, 2000)。
3 方案规范
3.1相关变量
该方案基于三个基本变量:贝塔系数,交易量和市值。这三个变量经常用于投资组合管理领域,其中贝塔系数是最重要的变量(Chang, 2004; Keim, 1999)。
3.1.1 贝塔系数
令表示给定投资组合p的贝塔系数,定义如下:
其中是投资组合p的回报率,是基准指数或资本市场m的回报率。众所周知,贝塔系数是用于衡量与基准指数或资本市场相关的投资组合波动的。事实上,如果一个投资组合选择得当,使得投资组合和基准指数的回报高度相关,那么投资组合beta;就会成为投资组合和基准指数之间的波动比率。因此,贝塔系数通常意味着关于市场指数波动的投资组合的敏感度。令表示包含市场指数m的第j只股票:
其中是第j只股票的收益率。
3.1.2 交易金额和市值
每只股票的交易量和市值分别为股票价格与其交易量和股票市场上市股票的总数的乘积。交易量表示股票的流动性和可销售性。市值表示发行该股票的公司的规模。当投资者评估市场上的股票时,这两个变量都是重要的。因此,它们也被纳入这项研究。
3.2 指数基金管理的投资组合方案
设n和l分别为基准指数和指数基金投资组合的股票数量。此外,令为包含在指数基金投资组合中的第k只股票的连续代码。换句话说,指数基金投资组合集合是从所有n个股票中选择的。令s表示构成基准指数的行业部门的数量,为第i个行业部门的股票数量(即)。另外,对于第i个工业部门的第j个股票(和),假设投资组合beta;由给出,其中下标用于表示j对i的依赖关系。对于该特定股票,令和分别表示时间t的回报率,交易量和市值。此外,表示t时刻的基准指数m的回报率。现在,让我们定义每个股票的优先级(即i=1,2,hellip;,s和)。在下面,除非另有说明,否则表示,其中E是由给出的,起始点为a0的和周期长度为T的训练周期。
其中v1,v2和v3是预先分配的正权重,并且
这是(是的估计)的标准偏差。在实验中,和的范围为0到1.请注意,最终表示个股在投资组合中的相对重要性。现在,GA投资组合指数基金方案的详细步骤如下。首先,计算每个行业的市值,例如。
第1步。对重复以下步骤,直到此步骤为投资组合选择l个股票。选择具有最大市值的行业部门ik(即)。对于选定的工业部门ik,计算的并选择具有最高优先级的股票(即)加入到投资组合并从选定的行业部门中删除。然后,在没有股票ik(jk)的情况下,将市值更新为。回到这一步的起点。
对于由步骤1建立的,令为的市值,以整个市值来衡量。请注意,如果,则。
步骤2. 为投资组合中的每只股票分配最佳权重以通过遗传算法将最小化(4)。
其中,这是构成投资组合集合的第k只股票的的方差,并且限制为接近1(即)。 第1步描述投资组合的股票选择过程,而第2步在接近1的条件下通过GA优化所选股票。
4 实证研究
为了证明该遗传算法的的实用性,本文使用了1999年1月至2001年12月期间的KOPSI 200(韩国证券交易所的主要基准指数)数据。为了与传统的权重法进行比较,我们使用了一种标记算法,该算法通过最小化(4)来优化权重。在遗传算法的过程中,需要改变交叉和变异率,以防止输出落入局部最优解。,在群体中使用50个生物体时,交叉率设为0.5到0.8,突变率设为0.05到0.06。在最近的5000次试验中,如果改进超过1%,GA会自动停止。在本节中,GA算法和常规算法分别标记为GA_IF和SIM_IF。
我们仔细检查了两个算法GA_IF和SIM_IF中可能影响其性能的变量。首先,考察(3)中三个基本变量(beta;的标准误差,平均交易量和平均市值)(v1,v2,v3)的权重,因为它们是影响算法性能的关键参数。其次,对投资组合中的股票数量进行调查,因为较大的l通常意味着跟踪误差(TE)的下降,但同时需要更多的再平衡成本(参见e Aiello amp; Chieffe (1999); Chang (2004); Keim (1999)关于再平衡成本的重要性)。三,因为训练周期可能影响算法的训练效率,所以研究起点a0和周期为T的训练周期。最后,检验市场效应(即牛市,熊市和平稳市场效应)。
4.1 实验
对于两种算法的比较,l不能超过60,而且自韩国与KOSPI 200相连的期货市场每3个月到期,T不能超过60天。起始日期a0要使培训期间包含2001年9月11日恐怖分子在纽约世界贸易中心发生袭击的那一天,因为算法需要考虑这种意外对金融市场外的冲击。例如,算法中的a0s是在2001年8月的交易日中随机选择的。在完成训练之后,将训练好的算法立即应用于接下来的60天,用于其性能评估(即训练后的下一个60天期间是测试期间。)
实验首先针对固定的l=30,T=60和a0在2001年8月9日对各种v1,v2和v3进行。在测试期间TE的绝对值和TE本身的运动的标准偏差提供在表1和图1中。可以注意到,GA_IF的标准差比SIM_IF的标准差要小。特别是,GA_IF不如SIM_IF对(v1,v2,v3)的变化敏感。
接下来的实验用固定的a0和(v1,v2,v3)检查l和T。事实上,当2001年8月9日给出a0和(v1,v2,v3)和(2,1,1)时,对于不同的l和T,已经在测试期间完成了表2和图2的实验。同样,GA_IF的TE一律小于SIM_IF。我们还发现,GA_IF的结果对于l和T的选择比SIM_IF的选择更敏感。通过实验,很容易发现GA_IF优于传统算法SIM_IF。进行第三个实验来调查市场效应。这样做是为了查看在各种市场条件下GA的表现是否稳健。图3描述了KOSPI 200从1999年到2001年的变化情况,它们分别将1999-2001年的市场状况分为牛市,熊市和平稳。平均而言,KOSPI 200往往会在牛市中上涨,在熊市中下跌,并在平坦的市场中停留在60和80点之间的相对窄的范围内。 GA_IF和SIM_IF在各种市场情况下进行比较。表3提供了TE和绝对值的标准偏差。 4-6显示了在各种市场情况下的测试期间TE本身的移动。考虑到GA_IF在牛市和熊市中对SIM_IF的支配程度,GA_IF的表现与平板市场中的SIM_IF没有明显的差异。
事实上,在牛市和熊市中,GA_IF的TE(SIMs的TEs)主要分布在K2和2的内部(外部),而在平板市场中,GA_IF和SIM_IF的TEs没有显示出明显的差异。
4.2 讨论
GA实验为有效的投资组合方案提供了有用的信息。事实上,GA_IF方案比传统算法显示出改进的性能。此外,GA_IF对(v1,v2,v3)中的变化较不敏感,但对于l和T的变化比传统变化更敏感。结果完全支持了GA的优越性。请注意,l和T主要是算法的内部组件,因此可以很容易地进行控制。但是,变量(v1,v2,v3)由算法外部的外部因素决定。观察到当市场能量或波动性增加时,GA似乎变得非常有效,这也很有趣。
5 结论
最近,与知名基准指数挂钩的指数基金在投资者中颇受欢迎。本研究提出了利用遗传算法支持投资组合优化过程的指
全文共5933字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[15932],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。