您的当前位置:首页正文

因子分析理论与案例

2020-08-05 来源:易榕旅网
因子分析理论与案例

一、

因子分析原理

因子分析是一种将多变量化简的多元统计方法,它可以看作是主成份分析的推广。因子分析的目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的变量归为一类,不同类间的变量的相关性则较低。每类变量代表了一个“共同因子\",即一种内在结构(联系).因子分析就是寻找这种内在结构(联系)的方法。

从全部计算过程来看作R型因子分析与作Q型因子分析都是一样的,只不过出发点不同,R型从相关系数矩阵出发,Q型从相似系数阵出发都是对同一批观测数据,可以根据其所要求的目的决定用哪一类型的因子分析。 (一)模型

X1a11F1a12F2a1mFm1 XaFaFaF22112222mm2(1 )展开式

Xpap1F1a22F2apmFmp(2)矩阵型式

主要模型形式:

X1a11Xa221Xpap1 简记为:Xa12a22ap2AFa1mF11Fa2m22apmFmp+

(p1) (pm)(m1) (p1)

且满足:

1)mp ) Cov(F,)=0213) D(F)= 0

(二)相关概念解释

0Im即F11Fm不相关且方差=1.1、因子载荷

aij称为因子载荷(实际上是权数)。

因子载荷的统计意义:就是第i个变量与第j个公共因子的相关系数,即表示变量xi依赖于Fj的份量(比重),心理学家将它称为载荷。

2、变量共同度

变量Xi的共同度——因子载荷阵A中第i行元素的平方和,

即:

2haiji1,,p2ij1m为了说明他的统计意义,将下式两边求方差,即

Xiai1F1+ai2F2++aimFm+i

22Var(Xi)=ai1Var(F1)++aimVar(Fm)+Var(i)22=ai1ai22aimi2hi2i2 X已经标准化了,所以有: 1h22由于iii

3、方差贡献率

方差贡献率指的是公因子对于自变量的每一分量所提供的方差总和,它是衡量公因子相对重要程度的指标。通常情况下,我们将因子载荷矩阵的所有方差贡献率计算出来并按照大小排序,从而提炼出最具影响力的因子。

二、

主要计算方法及步骤

(一)方法说明

1、因子载荷矩阵估计方法

因子载荷的求解方法主要有主成分法,主轴因子旋转法和极大似然法。主成分法指在进行因子分析之前先对数据进行主成分分析,把前几个主成分作为未旋转的公因子,但是此种方法得到的特殊因子间并不相互独立,当变量的共同度较大时,特殊因子所起的作用较小,它们之间的相关性可以忽略。

主轴因子法与主成分分析方法类似,都是都分析矩阵的结构入手,主轴因子

法的不同之处在于,其假定m个公因子只能解释原始变量的部分方差,利用变量共同度来代替相关矩阵中对角元素1,并以新矩阵为出发点求解特征值和特征向量.

极大似然估计法假定公因子与特殊因子服从正态分布,通过构造似然函数求因子载荷和特殊因子方差的极大似然估计.

2、因子旋转

因子分析的目的不仅是找出主因子,更重要的是知道每个主因子的意义。主因子的意义是根据主因子与可观测变量Xi的关系来确定的。因此希望主因子Fj对Xi(i=1,2,…,p)的载荷平方,有的值很大,有的值很小,(向0,1两极分化),因子载荷矩阵的这种特征称“因子简单结构”。

但是用上述方法所求出的主因子解,初始因子载荷矩阵并不满足“简单结构准则”,各因子的典型代表变量不很突出,因而容易使因子的意义含糊不清,不便于对因子进行解释。为此须对因子载荷矩阵施行旋转,因子轴方差最大正交旋转的目的即使因子载荷矩阵成为“简单结构”的因子载荷矩阵。使得因子载荷的平方按列向0和1两极转化,较大的载荷值只集中在少数X变量上,达到其结构简化的目的.易于因子命名。

经过旋转后,主因子对Xi的方差贡献(变量共同度)并不改变,但各主因子的方差贡献可能有较大的改变,即不再与原来相同,因此,可以通过适当的旋转求得令人满意的主因子.

为了对公因子F能够更好的解释,可通过因子旋转的方法得到一个好解释的公因子。

所谓对公因子更好解释,就是使每个变量仅在一个公因子上有较大的载荷,而在其余的公因子上的载荷比较小。这种变换因子载荷的方法称为因子轴的旋转。因子旋转的方法很多,常用的为方差最大正交旋转。 3、因子得分

在分析中,人们往往更愿意用公共因子反映原始变量,这样更有利于描述研究对象的特征。因而往往将公共因子表示为变量(或样品)的线性组合,即: f111x112x2f221x122x2fmm1x1m2x21pxp2pxpmpxp称上式为因子得分函数,用它可计算每个样品的公因子得分.估计因子得分的方法很多.

(二)计算步骤 1、数据标准化 2、建立相关系数矩阵 3、求解特征根及相应特征向量 4、因子旋转 5、计算因子得分 三、

实证分析

(一)、背景介绍

随着市场竞争的日益激烈,公司在人才选择方面更加注重人才的综合素质,并结合职位特定选择专门人才.在本文中选取一家集生产与销售于一体的大公司在人才招聘中数据,从综合素质以及招聘职位来选择优秀的员工。

“华威”公司是一家集生产、销售为一体的大型国际著名公司。现公司计划录用6名的员工。经过初选,公司对48位应聘者进行面试,面试共有15项指标,这15项指标分别是:求职信的形式(FL)、外貌(APP)、专业能力(AA)、讨人喜欢(LA)、自信心(SC)、洞察力(LC)、诚实(HON)、推销能力(SMS)、经验(EXP)、驾驶水平(DRV)、事业心(AMB)、理解能力(GSP)、潜在能力(POT)、交际能力(KJ)和适应性(SUIT)。每项指标的分数是从0分到10分,0分最低,10分最高。每位求职者的15项指标的得分在文件(应聘者得分记录.xls)中。试从综合素质选出6名优秀员工,若将这6名员工分别分配到管理、销售和生产部门各2名,指出合理的分配方案. (二)、分析过程详解 1、数据标准化

由于数据均为在面试中的打分成绩,量纲相同,并且观察数据的分布,并无异常值的出现,因此数据没有必要进行标准化,可以直接进行分析. 2、建立相关系数矩阵

利用SPSS软件,correlate功能计算相关系数矩阵,计算皮尔森相关系数并进行卡方双尾检验,可以看出变量间存在这很大的相关性。

进行相关系数矩阵检验——KMO测度和巴特利特球体检验:

KMO值:0.9以上非常好;0.8以上好;0.7一般;0。6差;0.5很差;0。5以下不能接受。巴特利特球体检验原假设H0:相关矩阵为单位阵

KMO and Bartlett's TestKaiser-Meyer-Olkin Measure of SamplingAdequacy.Bartlett's Test ofSphericityApprox. Chi-SquaredfSig..784645.317105.000 通过观察上面的计算结果,可以知道,KMO值为0。784,在较好的范围内;而巴特利球体检验的sig值为0.00,拒绝原假设,说明相关矩阵并非单位矩阵,变量的相关系数较为显著。 3、求解特征根及相应特征向量

 Spss选项:Analyze-Data Reduction-Factor

 用Extraction,选择提取共因子的方法(如果是主成分分析,则选Principal Components),

 用Rotation,选择因子旋转方法(如果是主成分分析就选None),

 用Scores计算因子得分,再选择Save as variables(因子得分就会作为变量存在数据中的附加列上)和计算因子得分的方法(比如Regression);要想输出Component Score Coefficient Matrix表,就要选择Display factor score coefficient matrix; 输出结果如下: 碎石图: Scree Plot86Eigenvalue420123456789101112131415 Component Number通过此图可以明显看出前五个因子可以解释大部分的方差,到第六个因子以后,线逐渐平缓,解释能力不强。因此我们提取5个公因子。

方差贡献率

选择5个公因子,从方差贡献率可以看出,其中第一个公因子解释了总体方差的50。092%,四个公因子的累计方差贡献率为86.42%,可以较好的解释总体方差。

因子载荷矩阵

aComponent Matrix求职信形式外貌专业能力讨人喜欢能力自信心洞察力诚实推销能力经验驾驶水平事业心理解能力潜在能力交际能力适应性1.445.584.110.617.796.863.433.889.367.864.872.909.914.711.6472.615-.051.340-.186-.357-.188-.581-.042.793.066-.098-.033.032-.118.603Component3.381-.028-.519.562-.291-.181.343-.224.100-.096-.252-.141-.088.564.1084-.103.287.696.378-.189-.078.456-.217.074-.171-.218.082.206-.220-.0225.098.748-.183-.111.004-.178-.055.032-.089-.173.140-.071-.109-.096.070a. 5 components extracted. 通过因子载荷矩阵可以看出因子的意义并不是十分明确,为了对因子进行解释与说明,进行因子旋转,选取方差最大因子旋转方法,并保留因子得分。 4、因子旋转

旋转后的因子载荷矩阵:

aRotated Component Matrix求职信形式外貌专业能力讨人喜欢能力自信心洞察力诚实推销能力经验驾驶水平事业心理解能力潜在能力交际能力适应性1.107.325.065.230.907.877.217.897.097.817.891.808.747.460.370Component32.097.830.216.149-.013.120.875.240.142-.110.267.092.848-.247.078.220-.046.849.175.346.053.157.313.249.398.320.565.362.051.7954-.147.057.946-.042-.068.041.022-.050.231-.012-.074.157.247-.481.0715.101.899.038.092.150.005.161.168-.039-.032.270.145.135-.031.152a. Rotation converged in 5 iterations. 通过上表中旋转的结果,我们可以看出第一个公因子在自信心,洞察力,推销能力,驾驶水平,事业心,理解能力,潜在能力上有较大的载荷,可以将其命名为基本素质;第二个因子在求职信形式,经验,适应性上有较大的载荷,可以理解为工作经验素质;第三个因子在讨人喜欢能力,诚实,交际能力上有较大的载荷,可以命名为外在能力;第四个因子在专业能力上载荷较大,但在交际能力上的载荷为负相关,也从侧面反映了专业能力较强的人在交际上有一定的欠缺,这和目前一部分高校毕业生书本专业知识较强,但日常待人接物能力较差的现象相吻合,将其命名为专业素质;第五个因子仅在外貌上有较大的载荷,可以将其命名为外表。

最后,通过上面的因子选注我们的评价指标可以通过五个主要的因子来表示,分别为基本素质,工作经验素质,外在能力,专业素质和外表。接下来计算各因子得分,并按照要求筛选优秀的应试者。

5、计算因子得分

Component Score Coefficient MatrixComponent3.002-.052.073.506-.107.012.494-.151-.028-.040-.184.044.121.231-.061求职信形式外貌专业能力讨人喜欢能力自信心洞察力诚实推销能力经验驾驶水平事业心理解能力潜在能力交际能力适应性1-.112-.128-.005-.140.249.216-.089.211-.066.188.202.138.095.001-.0252.375-.006-.004.070-.173-.078-.160-.019.371.052-.049-.007.028.127.3114-.162-.041.737.037-.055.051.102-.066.137-.009-.096.124.202-.339.0015.0851.033-.071-.062.007-.209.039.029-.112-.232.168-.043-.069-.169.082

各因子得分的计算公式为:

f10.112*求职信形式0.128*外貌0.005*专业能力0.14*讨人喜欢能力

0.249*自信心0.216洞察力0.025*适应性

f50.085*求职信形式1.033*外貌0.071*专业能力0.062*讨人喜欢能力

0.007*自信心0.209洞察力0.082*适应性分别计算各应试者的五个因子得分,按照相对方差贡献率进行加权,得到最终各应试者的综合评价.

综合得分:

编号 综合得分 编号 综合得分 编号 综合得分 1 0。9925 17 0。2369 33 -0。0634 2 0.9315 18 0。1480 34 -0.5107 3 0.7912 19 0.2378 35 -0。4718 4 0。6150 20 0。2073 36 —0.3979 5 0.6968 21 -0。0711 37 —0.1255 6 0。7259 22 0。8704 38 —0.2785 7 0。6070 23 0.0993 39 -0。5476 8 0.6007 24 0。0325 40 —0.6171 9 10 11 12 13 14 15 16 0.4299 1.0461 0。4309 0。3623 0.5168 0.8424 0.3403 0.2117 25 26 27 28 29 30 31 32 —0。2851 0.2296 —0.3275 -0。0763 0。2112 —0.3032 —0.0685 —0.3789 41 42 43 44 45 46 47 48 -0。9400 -0。7864 —1.1902 —1。0797 —0。9281 —0。9682 —0。9455 —1.0527 将综合得分进行排序,前六名为我们重点考虑的对象,编号分别为:10,1,2,22,14,3。我们重点分析这六个人的各方面得分,从而指定较为合理的部门分配。

编号 基本素质 工作经验素质 外在能力 10 1 2 22 14 3 6 2。04521 1.147623 1.009694 1.960285 1.629787 0.833452 1.121359 —0.50527 1。552198 1.585842 -0。54789 —0。83238 1。442163 0。401301 专业素质 外表 综合得分 —1.493955 1.61184 1.040729 0。4904 1.165884 0。556039 -2.70356 1.486739 -0。90829 1.651657 0。168301 0.429408 0.698105 —0。61087 -0。28452 1.046139 -1。42199 —1.53665 -0。22207 -0。36539 0.363725 -0。17064 0。992542 0.931513 0。870439 0。84243 0.791189 0。725859 通过对排在前六名的应试者各因子得分分析可知:10号和22号在基本素质包括自信心,洞察力,推销能力,驾驶水平,事业心,理解能力,潜在能力上的得分最高,这也是他最大的优势所在,在专业素质上的得分也很高,说明此人专业水平和好,但是在外在能力也就是交际能力,讨人喜欢能力以及第五因子外表上得分均为负值,说明此人的外在条件并不是很好;另外此人的工作经验素质的得分也为负值,其中包括求职信形式,经验,适应性等,说明欠缺工作经验,此人很有可能为刚毕业的应届生,基本素质以及专业知识过硬,但是社会生活能力较差。在本次所招收的职位中,生产部门的研发职位要求专业能力强,对于经验及外在条件的要求较低,10号和22号比较适合安排在生产部门.

1号和2号除了外表为负值以外,其他因子得分均为正值,此人外在能力和工作经验素质的得分较高,说明此人有一定的工作经验,社交能力较强。本次招聘中,销售部门对于员工的基本要求就是工作经验以及较强的社交能力,因此1号比较适合安排在销售部门。

3号各方面的得分均为正值,说明比较全面,其中工作经验素质得分最高,

说明此人工作经验丰富并且适应性较强;管理部门要求员工素质要全面均衡,工作经验比较重要,所以3号适合安排在管理部门。

14号的情况与10号和22号类似,由于我们现在需要管理部门的员工,从各项得分来说,14号不太适合;所以我们后移一位,选择6号安排进管理部门,虽然6号在外表和专业素质上的得分为负值,但这对于管理部门来说并不是最重要的。6号在因子1即基本素质的得分高于3号,自信心,洞察力,推销能力,事业心,理解能力,潜在能力等对于管理阶层才是最重要的.

(三)、主要结论

通过上面对应试者的分析我们可以看出,作为应届的学生,在找工作时,公司重点考察的方面,以及我们所欠缺的。如前述分析中大部分的应试者专业能力较强但是待人接物的能力明显较差,这也是应届生求职中的主要障碍之一;还有应届生缺乏工作经验,适应性较差,这也是困扰大学生求职的问题之一。作为应届生可以从中找到自身的弱点加以改善;同时还要注意自身的优点,在求职中结合职位要求有的放矢,才能实现较好的就业.

公司在选拔人才时不能笼统的只看评价打分的平均分或者总分,应该从公司的实际出发,从招聘职位的具体要求出发,选择最适合企业发展的人才.在多指标的评价体系中,因子分析可以将多维空间降维,实现以较少的指标来解释大部分自变量的信息,从而简化分析步骤,评价起来更清晰简便.

因篇幅问题不能全部显示,请点此查看更多更全内容