英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料
利用人工神经网络、遗传算法和多元判别分析的经营风险预警模型:伊朗证据
1.绪论
公司的破产和倒闭是一个不受欢迎的现象,这一直是一个重要的问题。企业的经营风险预警一直是企业财务研究的对象。一般来说,商业上的失败会带来严重的负面经济和社会后果,因此应该得到严肃对待。企业的经营风险往往是银行经济学家和政府官员研究的对象。因为它的经济代价是巨大的。它往往影响着整个国民经济,影响着诸如销售、出口和生产等主要经济指标的趋势。此外,每一家公司,或多或少都受到了投资者、客户、雇员和供应商等各种利益相关者的影响。同样的,资本、投资者和债权人,以及管理层和雇员,也会受到了企业经营风险的影响。
经营风险预警模型还将帮助管理者跟踪公司的业绩,并帮助确定重要趋势。虽然模型可能不会明确地告诉经理是什么问题,但它应该鼓励他们找出问题并采取有效的行动来降低失败的发生率。并且,预测模型可以提醒审计师公司的弱点。此外,银行可以采用预测模型来帮助评估公司拖欠贷款的情况。因为监管机构关心的是一家被监控的公司是否有倒闭的危险。
在伊朗,特别是在德黑兰证券交易所上市公司的水平上,有许多公司由于财务状况不佳,或者换句话说他们破产了。举例来说,一些公司不能支付他们的债务,他们的收入不能支付他们的费用。根据《贸易法案》第141条,这些公司已经破产了,其留存损失超过其资本的50%。但是如果这种经营风险可以更早被发现,用简单方法治理恢复的机会就会更高。因此,本论文研究的是企业经营风险,而不是单纯是破产。
利用财务数据对企业经营风险进行预警是一个众所周知的研究课题。第一批研究破产预测的研究人员之一是Beaver(1966年)。他用158个训练集来检验14个财务指标的可预测性,这些训练集包括破产和未破产的公司。Altman(1968,1983)研究了基于MDA的Beaver的研究,将公司分类成现在普遍接受的类别。根据Altman的模型,在最初的22个指标中,使用5个财务指标的组合可以完全解释出现经营风险的原因。根据Z分数所获得的值对Altman模型进行分类,预准确度在破产前一年的准确率为96%。然而,这些使用的统计方法有一些限制假设,如预测器或输入变量的线性、正态性和独立性。财务数据经常违反这些独立变量的假设(Deakin,1972)。因此,这种方法的有效性是有局限性的。最近,一些研究证实,人工智能方法不那么容易受到这些假设的影响。在这些方法中,ANNs可以替代传统统计方法的分类问题,这些方法已经被实践了很长一段时间。
ANNs能够在数据集中识别和呈现非线性关系,因此在破产预测(Barniv,Agarwal,amp;Leach,1997)等经营风险研究中得到了广泛的研究。Bell,1997;Shin,Shin,amp;Han,1998;Zhang,Hu,Patuwo,amp;Indro,1999)。ANNs与参数统计模型完全不同。因为在参数统计模型的情况下,用户必须指定依赖项和自变量之间的线性或逻辑关系等函数关系的性质。在函数形式的假设前提下,优化方法用来决定一组参数,从而减少误差的测量。相反,至少有一个隐藏层的ANNs能够使用数据来扩展内部变量之间关系的内部说明,而之前关于主参数分布的假设并不重要。因此,当变量之间的关系不符合隐式模型(Salchenberger,Cinar,amp;Lash,1992)时,是可以预测更好的结果的。Odom和Sharda(1990)首次使用ANNs进行经营风险预警。他们的模型有5个输入变量,类似于Altman的研究(Altman,1968),并且有一个隐藏的层,有五个节点和一个节点用于输出层。他们将1975年至1982年间的65家破产公司和64家非破产公司作为研究训练集。在这74家公司中(38家破产公司和36家非破产公司)被用于对照组,而其余55家公司(27家破产公司和28家非破产公司)则被用来制作训练集。在相同的条件下也进行了MDA的测试。结果是ANNs正确地分类了81.81%的训练集,而MDA仅为74.28%。Tam和Kiang(1992)利用破产商业银行的数据将ANNmodel的性能与线性判别模型方法进行了比较。在模型中,训练集是1985年至1987年期间的59家破产银行和59家未倒闭的银行。Han、Jo和Shin(1997)将ANNmodel的性能与MDA进行了比较。在给定的训练集中,ANNmodel的精度最高(78.7%)。
遗传算法(GA)是一种创新的人工智能方法,能够在无人监督的情况下处理复杂问题。该算法利用最优法则,选择最佳方案来解决问题(Davis,1991;戈德堡,1989;荷兰,1975)。
Varetto(1998)进行了一项实证研究,他引入了一个GA来分析38个工业意大利公司的经营风险。Varetto将线性判别分析作为经营风险分类和预测的传统统计方法和遗传算法进行比较。他的结论是,遗传算法是一种非常有效的经营风险诊断工具,尽管用线性判别分析得到的结果优于遗传算法。Varetto指出,“GA的结果虽然可以在更短的时间内获得的,但是它的准确度不如线性判断分析。”Shin和Lee(2002)提出了一种经营风险预测建模的GA方法,它更易于被理解。他们提取了5条规则,预测经营风险的准确率为80.8%。Kim和Han(2003)使用GA进行经营风险预测。通过遗传算法发现的规则优于神经网络的规则。
在伊朗,大多数的经营风险研究都是利用广泛的统计方法来预测公司是否可以继续经营下去。这些研究大多采用多元统计方法。第一个研究(Rasoolzadeh,2001)证明了Altman的模型对于预测伊朗企业的经营风险是有效的。该研究预测破产的纺织公司的准确率达75%。本研究采用1996-1999年纺织企业财务信息。最近的一项研究(SohrabiEraghi,2008),使用了21个指标,利用了MDA和所有460家上市公司的总和,声称对破产公司的预测具有80%的准确性。Etemadi、AnvaryRostamy和FarajzadehDehkordi(2009)开发了一个用于经营风险预测的基因编程模型。他们声称这个模型在实验组中具有94%的准确率,而在对照组中90%的准确率。他们的基因编程被用于对144家在德黑兰证券交易所上市的破产和非破产的伊朗公司进行分类。Bostanian(2008)利用GA在她的研究中将伊朗公司划分为破产和非破产。在相同组别中,她的模型只有92.5%和91.5%的准确率。
这篇文章的目的欧两方面。首先,对伊朗公司的经营风险预测研究进行新的研究。其次,提出了一种基于人工神经网络模型的企业经营风险预测模型。这两个方向是本研究的主要目的。
论文的主要结构如下。在第1节绪论后,第2节给出了神经网络的基本分析。第3-5节讨论遗传算法的理论问题、多重判别分析和主成分分析。第6节致力于模型设计,包括选择变量和训练集。第7节将讨论建立模型。最后,第8部分总结全文。
2.神经网络
人工神经网络与人脑相似。与人类的大脑一样,它含有神经元和它们之间的联系。一个学习模型是受监督的,没有监督的,或者是两者的混合,并且复制了训练数据被提供给神经网络的过程。在设计神经网络时,必须预先确定许多不同的参数。这些参数包括层数、每层神经元的数量、训练迭代次数等。在训练和网络能力方面,一些更重要的参数是隐藏神经元的数量,学习速率和动量参数(Nazzal,El-Emary,amp;Najim,2008)。
多层感知(MLP)神经网络是由简单的组件构成的,这些组件将首先被描述。单输入神经元如图1所示。w是标量重量乘以标量输入wlowast;pp形式,发送到加法器的输入求和。另一个输入,1,乘以一个偏置b,然后传递给加法器。adder输出y常被称为净输入,进入激活函数f,它生成标量神经元输出a,w和b都是神经元的可调标量因子。一般来说,传递函数是由用户选择的,然后由一些学习规则来定制w和b的因素,从而使神经元的输入或输出关系达到一个具有挑战性的目标。图1中的传递函数可以是n的线性或非线性函数,选择一个特定的传递函数来满足神经元试图解决的问题。选择一个特定的传递函数,以满足神经元试图解决的问题的某些条件。最常用的函数之一是log-sigmoid传递函数,如图2所示(Nazzaletal.,2008)。
图1单个输入神经元
图2Log-sigmoid传递函数
在使用后向传播的多层网络中,通常使用log-sigmoid传递函数。经常有一个神经元,即使有很多输入,也可能不足够,cient。可能需要多个并行工作的神经元。这将被称为“图层”。神经元通常有多个输入。现在用一个网络层与本文中使用的两层一起来作分析经营风险。在这个网络层具有其自己的权重矩阵w,其自身的偏差矢量b是净输入向量n和输出向量a。一个典型的双层网络是如图3所示。该网络的数学表达如下如下:
Y=b2 w2lowast;S(b1 w1lowast;P)
y是最终输出,S是与每层相关的传递函数。矢量bi和wi分别是第i层神经网络中的网络因子,偏差和输入权重。这些向量在每个图层中的维度显示图层的神经元数量。
图3两层网络示例
对神经网络具有主要意义的属性是网络从环境中学习并通过学习提高其性能的能力。特别是学习过程对应于统计学中的估计过程。在监督学习任务中,一组输入-输出向量被呈现给网络,学习算法调整连接权值直到网络的输出向量尽可能接近目标向量。为了做到这一点,在本文中引入了一个容错函数,例如平方和误差。虽然平方和误差是MLP应用中最常用的误差函数,但根据训练集数据的性质和网络的目标输出,还有很多其他选择是可靠的。许多学习算法被用于包含共轭梯度学习(Zhang,2000),Levenberg-Marquardt学习过程(Singh,Gupta,&Gupta,2007)和贝叶斯学习(Zhang,2009)的神经网络。
3.遗传算法
遗传算法是统计搜索方法,可以搜索基于自然遗传学的大型复杂空间。GAs分四个阶段进行调查程序:初始化,选择,交叉和变异(Davis,1991)。
在初始阶段,具有遗传结构的特征训练集随机分散在解空间中。然后每个特征通过用户定义的适应度函数进行评估。适应度函数被用来评估特征的表现。决定适应度函数是实际应用中最重要的一步。从最初的特征训练集中,使用三种遗传算子生成新种群:繁殖,交叉和变异。这些仿照他们的生物等值。根据与应度成正比的概率选择新的训练集。随机选择新种群中的成对的特征,在称为交叉适的交配操作中交换特征物质以及它们的位点。这产生了两个新的训练集取代初始训练集。后面产生的训练集中随机选择的位被翻转,称为突变。在这些步骤后,产生的新训练集取代了旧的训练集。随着训练集的更新,会含有越来越适合的特征。当达到收敛标准时,例如训练集的平均适应度没有显着进一步增加时,产生的最佳训练集被解码为它所代表的搜索空间点。
4.多重判别分析
多重判别分析是一种多变量统计方法,用于基于两个或多个独立变量进行观察分类(Johnson&Wichern,2002)。该方法确定观察属于哪个组。MDA代表正确分类的最大可能性,并构建一些称为判别函数或分类函数的独立变量的线性组合,以将观察分为预定组。判别函数就像等式:
Z=W1X1 W2X2 ⋯ WnXn
其中Z是判别分数,Wi是变量i的判别权重,Xi是变量i。
判别函数是以这样的方式建立的,以最大化组之间的平方和/平方和之间的指标。它是建立在第一个判别函数计算出最佳的分离群体的一种方式。计算第二判别函数以最佳地分离组别以及与第一个判别函数不相关等等,以达到判别函数的最大数量:min(组数-1,p)。
5.主成分分析
主成分分析是用于减少数据集维度的多变量统计方法(Jolliffe,2002)。数据集维度的减少具有类似低维度的一些优点,数据的解释更容易,而且数据的行为可以在最重要的组件空间中以图形方式看到。重要的组件是那些表达并包含更多数据集的方差的组件。虽然对于问题的定义p变量是必需的,但通常这些变量中的大多数可以用k个分量(klt;p)表示。因此,与原始变量相比,简化组件中的信息量几乎相同。通过这种操作,ptimes;n的问题维数将减少到ktimes;n,其中klt;p和n是观测值的数量。
主成分是在原始变量的方差-协方差矩阵上计算的原始变量的特定线性组合。主要组件根据其重要性进行评级。第一个主成分是方差最大的成分。第二主成分是其方差是次最大值并且与第一主成分不相关的那个等等。主要组件按照重要性的降序排列。可以消除累积方差不高的主成分,从而实现数据降维。
6.实验设计
构建训练集分类模型是基于许多独立于隐含模型的参数。在本节中将讨论训练集的选择。
这项研究的主要目标是使用财务指标来预测伊朗上市公司的财务状况。起初先选择尽可能多符合条件的指标,然后根据专家指导原则来筛选出用于构建模型的指标。
本研究并不是说,除了其目标是找出与公司未来的财务状况有关的相关信号的指标之外,就已经选择了对破产和非破产公司的区分的最佳指标。
6.1人口和训练集
这项研究的训练集是德黑兰证券交易所(TSE)在2008年3月21日结束的一年内接受的制造业公司。选择这些公司的理由是这些公司的财务信息易于获取。TSE在全球37个行业集团中共有461家企业,其中412家为制造企业,49家为非制造企业。制造业公司的数量超过其他上市公司,并且由于其广泛的活动而需要提供更多的贷款。这项研究选择了180家公司作为研究训练集。
在德黑兰证券交易所,退出资本市场的公司的措施是141法案的商业法。根据这一行为,这些公司被称为破产者,其留存损失超过其资本的50%。根据该法,58家公司破产。其余的非破产公司从其余名单中随机抽取。
在德黑兰证券交易所上市的180家制造公司的财务指标已经使用了一年(2008年3月21日结束的年度)。所需的计算指标的数据从公司的资产负债表和损益表中收集。
6.2变量
全文共12417字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[10199],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。