主成分分析和因子分析和SPSS软件的异同细节外文翻译资料

 2022-08-22 10:40:03

Principal component analysis and factor analysis and SPSS software in detail the similarities and differences

Abstract: The principal component analysis and factor analysis (R-type) is widely used, but some papers and some textbooks SPSS software (see text) error. This paper points out these errors and their causes, and points out the harm caused by errors, in principle gives the principal component analysis and R-type factor analysis of the detailed mathematical model of similarities and differences between the methods are given to avoid making mistakes, and the SPSS software and made recommendations about textbooks.
Keywords: Principal component analysis; factor analysis; SPSS software; error; avoid
Let = (X1, ..., XP for the standardized random vector (p ge; 2), R is the correlation coefficient matrix, = (F1, ..., Fm main component vector, = (Z1, ..., Zm for the factor vector, m le; p , for the convenience factor, factor estimates, factor score with the same mark.


First, the issues raised and conclusions
Principal component analysis and R-type factor analysis is a multivariate statistical analysis in two important ways, the same dimension reduction, wide range of applications, but by popular SPSS software very wide process of the two methods is called the command, the user prone to error, what is causing these mistakes? Principal component analysis and factor analysis in the end R-similarities and differences between it? What harm would it go wrong?
The SPSS software in the economy, medicine and management in areas such as widespread use, particularly necessary to solve these problems.
After a number of papers and textbooks, some of SPSS software (see enclosure) due diligence analysis, comparison, the study draws:
Error reason: Some users and the author of the main component analysis and R-type factor analysis theory, similarities and differences and not through the steps towards solving the current SPSS software and the book does not improve the study of these two methods (for university teachers a great error of Health).
Conclusion: The principal component analysis and R-type factor analysis has 10 main difference, resulting in the principal component analysis and factor analysis of the quantitative evaluation system for different values ​​of mixing different alternative quantitative error evaluation must be conducted separately.
Errors harm: economic efficiency of enterprises, competitiveness will bring a comprehensive evaluation of error assessment, medical diagnosis will bring misdiagnosis, wrong decision will bring down and so on.

Second, some users and its causes errors
After due diligence analysis, the following error:
① using principal component analysis theory of principal component analysis are not available, such as principal components analysis described the concept of error. ② solve the wrong principal component F, as = (the unit matrix, the significance of Table 1). ③ I do not know the name based on principal component F, of the principal components F named wrong. ④ Xk be a loss of explanatory variables. ⑤ carried out on the wrong rotation. ⑥ regression wrongly seeking F. ⑦ the factor analysis (with no rotation) error to as principal component analysis.
① using factor analysis on the principle of factor analysis are not available, such as factor analysis of the idea described in the main component analysis of the idea. ② I do not know the name factor Zi based on the factor Zis name wrong, as with a factor score function to name the factor Zi. ③ Xk be a loss of explanatory variables. ④ the principal component or factor that is wrong (meaning see Table 1). ⑤ I do not know the correlation coefficient matrix eigenvalue and factor the difference between contributions to vi, such as integrated function of factor score in Z = Zi vi Fully incorrectly taken as the characteristic value. ① using SPSS software, SPSS software itself, because no principal component analysis module, some users will use some of the modules of factor analysis to make the results of principal components, there has been confusion in the quantitative process. ② the SPSS software, the contents of the textbooks at the confusion factor analysis principal component analysis and factor analysis, resulting in some users confuse the two methods are wrong.
Can be seen from the above cause of the error is: Some users on the principal component analysis and R-type factor analysis of principle (principle see [4]), similarities and differences with the problem-solving steps to master not through SPSS software and the book does not present Both methods of improving.


Third, the principal component analysis and R-type factor analysis model comparing the similarities and differences
Here are the principal component analysis and R-type factor analysis of the similarities and differences compared with the current view is the comparison on the content and process, more thorough, more accurate, is to recognize the depth.
In common: principal component analysis and R-type factor analysis is the approximation of the covariance matrix, are intended to explain the reduced dimension data set. As an indicator of the positive of the specific [3], the standardization of indicators (SPSS software automatically), to determine the correlation matrix through the correlation between variables, find the correlation matrix eigenvalues ​​and eigenvectors, principal components, the factor between the lines sex has nothing to do with the cumulative contribution rate (%), the variable does not appear to determine the main components is missing, the number of factors m, before the previous principal components m m a comprehensive contribution to the X Factor on the same, is maximized, are named according to principal components, factors and variables of the correlation coefficient.
Differences: variance, to maximiz

剩余内容已隐藏,支付完成后下载完整资料


主成分分析和因子分析和SPSS软件的异同细节

摘要:主成分分析法和因素分析(R型)被广泛使用,但一些文件和有些教科书SPSS软件(见正文)有错误。本文指出了这些错误及其原因,并指出造成失误的危害,在原则上给出了相似的方法之间的差异进行详细的数学模型的主成分分析和R型因子分析并且给出用于避免出错,SPSS软件和教科书提出了建议。

关键词:主成分分析;因素分析; SPSS软件;错误;避免

让=(X 1,...,XP为标准化随机向量(Pge;2)中,R为相关系数矩阵,=(F1,...,Fm的主要分量矢量,=(Z 1,...,ZM对于因子矢量,米le;P,为方便起见因子,因子估算,因子得分用相同标记。

首先,提出的问题和结论

主成分分析和R型因子分析是在两个重要方面的多变量统计分析,同样的降维,广泛的应用,但由流行SPSS软件很宽的两种方法中的过程被称为命令,用户容易错误,是什么原因造成这些错误?主成分分析法和因素分析,它的最终R-异同?有什么危害导致了错误?

SPSS软件在经济,医学和管理被广泛使用,特别要解决这些问题的领域。

一些论文和教科书后,一些SPSS软件(见附文)尽职调查分析,比较,研究得出:

错误原因:有些用户和主成分分析和R型因子分析理论,相似性和差异,而不是通过对解决当前SPSS软件本书不改善这两种方法的研究步骤的作者(大学教师健康有很大的误差)。

结论:主成分分析和R型因子分析有10个主要的区别,从而为混合不同的替代量化误差评定的不同值的量化评价体系的主成分分析法和因子分析必须单独进行。

错误的危害:企业的经济效率,竞争力会带来错误的评估进行综合评价,医学诊断带来误诊,错误的决定会失望,等等。

其次,一些用户及其原因的错误

尽职调查分析后,出现以下错误:

①采用主成分分析,主成分分析理论都无法使用,比如主成分分析描述错误的概念。

②解决了错误主要分量F,如=(单位矩阵,表1中的意义)。

③我不知道名字基于主成分楼的主成分F的叫错了。

④值Xk是解释性变量的损失。

⑤实施了错误的循环。

⑥回归错误地寻找F.

⑦因子分析(无旋转)错误的主成分分析。

①采用因子分析因子分析的原则,都无法使用,比如在思想的主要成分分析中所述的想法因素分析。 ②我不知道名字的因素梓基于因子子的名字写错了,作为一个因子得分函数命名的因素子。 ③值Xk是解释性变量的损失。 ④主成分或因素是错误的(意思见表1)。 ⑤我不知道的相关系数矩阵特征值与贡献因素之间的差异,以六,如因子得分为Z轴集成功能=子VI完全错误作为特征值。 ①采用SPSS软件,SPSS软件本身,因为没有主成分分析模块,一些用户将使用一些因素分析的模块,使主成分的结果,出现了混乱的定量过程。 ②在SPSS软件,教科书的混乱因素分析主成分分析法和因素分析,造成一些用户的内容混淆这两种方法都是错误的。

可以从错误的上述原因可以看出是:原则上的主成分分析和R型因子分析一些用户(原则参见[4]),异同与解决问题的措施,通过SPSS软件的掌握不和书不存在改进的两种方法。

三,主成分分析和R型因子分析模型比较异同

这里有异同的主成分分析和R型因子分析与当前视图相比,在内容和过程的比较,更彻底,更精确,是认识的深度。

是共同的:主成分分析和R型因子分析是协方差矩阵的近似,旨在解释降低维数据集。作为正的具体的一个指标[3],指标的标准化(SPSS自动软件),通过变量之间的相关性确定相关性矩阵,求相关矩阵的特征值和特征向量,主成分,该线之间的因子性别无关的累积贡献率(%),该变量不出现,以确定的主要成分是缺少,因素米数,前先前主要组分MMA同于X因子的综合贡献,是最大化,根据主成分,因素和相关系数的变量命名。

差异:方差,最大限度地在该坐标系(标准正交),重点应用,如在表1中的方向。

表1主成分分析和不同的R型因子分析

差异

主成分分析模型的项目:

R-模式的因素分析模型:

表达和系数矩阵

= () = (...,),,

是相应的特征值和

单位特征向量, ge; ... ge;ge; 0.

(对于特殊因素),
因子载荷矩阵 m = () =,
= (...,)
首要因素载荷矩阵 * (与左).

因变量的方差最大化

为了最大限度的贡献的信息Fi,
Var Fi =.

Zi 没有最大化, Var Zi = 1.

方差最大化旋转矩阵

否,而不是主成分旋转后,因为
Var Fi ne; lambda;i

是, 对于最大方差正交旋转矩阵,m最大化方差。

标准正交

(一个标准).

不,因为

对因变量X
贡献

特征值。

vi =, vi, 通常gt; v1.

相关系数

=

=

根据命名

(, ..., )是对应于可变FJ大牌系数的绝对值,有时名为清晰度低。

第一列将是j的绝对值对应于分类为高清晰度(精)的大的类和随之ZJ ZJ名称,名称的变量。朗读显示对应的拉丁字符的拼音

退换货流程

是,因子得分函数

综合评价函数和方差

Fully F = Fi,
Var F Fully = (,, or
... , 通常 VarF 全面gt; VarZ 全面,
F是通常比完全集成大Z的范围高

Fully Z = Zi, vi (标准1) Var Z 全面 = ( (从循环要素贡献 变化至vi,因此权重应取 vi /),
Or v1 v2 ... vm.

应用重点

对影响的综合评估信息的贡献

综合评价的清晰的原因。

注:主成分分析有时也被称为在这个时候明确的信息可以实现贡献作用的影响进行综合评价,同时保持效果的原因进行综合评价的清晰度,这时候主成分分析的结果是比大多数因子分析的结果要好。

上面描述的:对不同标志的定量意义的主要成分分析法和因子分析是方差。事实上,VarFigt;(lt;)var=1,即子网络连接范围比大(小)的范围;通常VarF综合gt;的歼综合范围大于Z大VarZ全面的,综合的范围(见表5,8),这是肯定的主成分分析和评价系统的定量值的因素分析是不同的。

结论:两种方式,最大限度不同的方向,主要成分,因子得分值的价值的一个直接结果差异的主成分分析法和因子分析,综合评价及应用重点不同评价的价值应进行单独,混合在一起,进行定量的值是不同的交替错误。

错误危害:如果企业的综合评价中,行业通过样本收集,以确定主成分分析的其优异的,良好的,在一般情况下,两种方法的范围内的量化值来确定的范围,因子分析定量值肯定是不同的,如果你同时使用两种方法,它会带来的滥用或不正确的评估,定量值的两种方法,使企业失去了公平竞争的机会。在医疗诊断中,经济竞争力综合评价问题为好。

检查:实际结果,经验和原始数据做聚类分析上进行测试的综合评价值。

争议解决:原始数据做判别分析,综合评价,以解决争议。

四,方法和步骤,以避免错误

1.主成分分析和SPSS软件应用程序,一个在正确的一步:

的①阳性指标[2]。

②指标数据的标准化(SPSS软件自动)。

③确定指标之间的相关性:利用SPSS软件表“相关矩阵(相关系数矩阵)”的评委。

④确定主成分米数:用SPSS软件表“合计数差异的解释(总方差解释)”的方差累积%贡​​献率的主成分,并结合该表“分量矩阵(初始因子载荷矩阵)”有被无丢失的变量的主成分,以确定m的数量。

⑤主成分连接的表达(其是SPSS软件和教科书没有改善的地方):使用SPSS软件表“分量矩阵”中的II-特性列向量由第一异后得到的根的平方根除以网络连接功能,主成分的系数(在 - 在计算“改造gt;计算”),它写入的主成分连接的表达。随着测试的=。

⑥命名主成分连接:在i的绝对值的系数的第一列采用SPSS软件表“分量矩阵”对应于变量连接大名称(有时也被称为清晰和低)。

⑦综合主成分的主成分(评估)的值(这是SPSS软件及其教科书中并没有改善的地方):综合主成分(评估)公式F =完全连接(在 - 在计算[“变换gt;计算” 3]),在SPSS软件表“总方差解释”下的“初始Eigrnvalues​​(方差的主要成分)”栏

“方差(侧滑)%的”英寸var˚F完全= =(。

⑧测试:与实际结果和经验的综合主成分(评价)值做聚类分析的原始数据,以测试(对判

别分析的结果有争议,可用于原始数据做解决争端。)

⑨实证分析。

2.因子分析和SPSS软件应用-1在右步骤:

①∽③步程序的主成分分析。

④决定因素数m:用SPSS软件表“总方差解释”的累积贡献率(%)特性值,并结合该表“交错分量矩阵(旋转因子载荷矩阵)”没有出现在可变因素的损失确定m的数量。

⑤需求因素载荷矩阵:SPSS软件表“旋转组件矩阵”。

⑥因素子的名字:在SPSS软件表“旋转组件矩阵”第i列的绝对值因子载荷矩阵对应归类为大型一类子以及随之而来的字命名的(高清晰度名称)的变量。

⑦求因子得分的回归函数子表达式:SPSS软件表“成分得分系数矩阵(因子得分系数矩阵)”中为IIA因素的列向量系数得分函数子,其中写因子得分函数子表达式。

要求和综合因子得分(得分)值⑧因子得分值:一般因子得分(评估)式Z综合=紫(在 - 在计算“改造gt;计算”),该软件SPSS表“总方差解释”下在“载入平方和的旋转(旋转因子对X的方差)”塔“%方差”。用vi =测试,通常gt; V1,无功ž综合=(。

⑨测试:评价采用实际结果和经验值做聚类分析的原始数据,以测试(对判别分析的结果有争议,可用于原始数据做解决争端。)

⑩全面的实证分析。

五,SPSS软件和图书推荐

①应分开这一重要内容的主成分分析。 ②方法,并通过两个步骤一对一的相应结果的软件,提高软件的研究和编写正确的教科书。 ③因子分析组件(组件)应该写成因数(因子)。 ④因子分析将不会是一个“主成分分析”的“主要成分”中的用词和移去内容物。 ⑤后旋转因子分析和相关的因素有助于系数矩阵两者之间的范围的区分的特征值应该被使用。 ⑥的教科书SPSS软件子详细正确的信息,作者可能需要啥。

六,应用实例。

2002年,16在四个指标数据[5]在表2中的上市公司,综合盈利定量分析如下:

表2

公司

销售利润率
(X1)

资产净利率
(X2)

净资产收益率
(X3)

销售利润率
(X4)

Gehua
Wuliangye
UF Software
Taitai medicine
ZhejiangSunshine
Yantai Wanhua
FounderTechnology
Red light
Moutai
ChinaRailwayBureau
RedStarDevelopment
Erie Shares
Qingdao Haier
Hubei Yihua
Younger
Fujian NanpingPaper

43.31
17.11
21.11
29.55
11.00
17.63
2.73
29.11
20.29
3.99
22.65
4.43
5.40
7.06
19.82
7.26

<!--

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[498278],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。