模型的建立
将8个数据由线性相关的程度拟合为最少的数据,用以代表这8个数据所能表的信息
符号说明
MEAN——各变量的均值 STD——各变量的标准差 R——相关系数矩阵 V——正交变换矩阵
D——以R的特征值为对角元的对角矩阵 i=1,2,3;
j=1,2,3,4,5,6,7,8;
Fi——第i个主成分;
Aij——第i个主成分里的第j个元素的权重;
Xj——第j个影响因素
模型假设
以上三者有一元线性关系,即:
3FiAijXj,i1,2,3
j1
相应的程序如下 load shuini.txt [n,p]=size(shuini) MEAN=mean(shuini); STD=std(shuini);
MEAN=ones(n,p)*diag(MEAN); STD=ones(n,p)*diag(STD); x=(shuini-MEAN)./STD; R=cov(x); [V,D]=eig(R); DD=[];
for i=p:-1:1 DD=[DD;D(i,i)]; end
OFFER=DD/sum(DD); %计算特征值的方差贡献率
cumOFFER=cumsum(DD)/sum(DD); %计算特征值的方差累计率 OUTCOME=[DD,OFFER,cumOFFER] %综合输出结果 得到结果: OUTCOME =
4.8004 0.6001 0.6001 1.2687 0.1586 0.7586 0.9194 0.1149 0.8736 0.5565 0.0696 0.9431 0.3239 0.0405 0.9836 0.1073 0.0134 0.9970 0.0222 0.0028 0.9998 0.0016 0.0002 1.0000
由特征值的方差累计率来看,取前三个(87.36%)主成分即可(相关程序及结果: cumOFFER=cumsum(DD)/sum(DD)
cumOFFER =
0.6001 0.7586 0.8736 0.9431 0.9836 0.9970 0.9998
1.0000)
pcacov=V(:,end:-1:end-2) %输出正交单位化的特征向量矩阵V的前3列
pcacov =
0.4354 -0.0612 -0.2546 0.4091 -0.3426 0.1332 0.3875 0.0176 -0.4084 0.4218 -0.3204 0.0326 0.3673 0.0607 0.2194 -0.1745 -0.7324 -0.2751 -0.2811 -0.0607 -0.6637 0.2656 0.4818 -0.4304
第一主成分可看成是A1、A2、A3、A4、A5的综合变量,可以解释为第一主成分反映了大宗资金对水泥企业经济效益的影响;第二主成分可看成是A6的综合变量,可以解释为第二主成分反映了流动资金对企业经济效应的影响;第三主成分可看成是A7、A8的综合变量,可以解释为第三主成分反映了能耗和生产率对企业经济效益的影响。
得到主成分线性表达式:
F10.4354X10.4091X20.3875X30.4218X40.3673X50.1754X60.2811X70.2656X8
F20.0612X10.3426X20.0176X30.3204X40.0607X50.7324X60.0607X70.4818X8 F30.2546X10.1332X20.4084X30.0326X40.2194X50.2751X60.6637X70.4304X8
利用matlab里的统计工具箱亦可进行上述分析: 输入如下程序:
[PC,latent,explained]=pcacov(R) 得到结果:
PC = %主成分系数向量
-0.4354 0.0612 -0.2546 0.0857 -0.1298 0.0328 -0.8448 -0.0530 -0.4091 0.3426 0.1332 -0.0585 0.0862 -0.4928 0.1160 0.6560 -0.3875 -0.0176 -0.4084 -0.0842 -0.5507 0.4268 0.4039 0.1645 -0.4218 0.3204 0.0326 0.0161 -0.0202 -0.3336 0.2685 -0.7310 -0.3673 -0.0607 0.2194 -0.5937 0.5171 0.4385 -0.0018 -0.0330 0.1745 0.7324 -0.2751 0.2971 0.3470 0.3817 0.0350 0.0437 0.2811 0.0607 -0.6637 -0.5934 0.0915 -0.3381 -0.0256 -0.0360 -0.2656 -0.4818 -0.4304 0.4348 0.5252 -0.1012 0.1891 0.0336 latent = %特征值 4.8004 1.2687 0.9194 0.5565 0.3239 0.1073 0.0222 0.0016
explained = %方差贡献率 60.0051 15.8581 11.4921 6.9565 4.0487 1.3412 0.2781 0.0201
可见二者的分析结果一样,此处不再赘述。 利用SPSS也可以进行此类的分析:
对其进行标准化: 第一步:
标准化过程:打开数据文件,选择 Analyze →Descriptive Statistics → Descriptive ,打开对话框,然后选中 Save standardized value, 然后点 OK 。 第二步:
点击 Transform →Compute, 打开 Compute主对话框,在Target Variable 栏中输入Z1,在Numeric expression栏中输入表达式如下:
0.197*2.203*VAR00001+0.186*2.203*VAR00002+0.177*2.203*VAR00003+0.191*2.203*VAR00004+0.163*2.203*VAR00005-0.083*2.203*VAR00006-0.134*2.203*VAR00007+0.117*2.203*VAR00008
第三步:
重复第二步,在Target Variable 栏中输入Z2,在Numeric expression栏中输入表达式如下:
0.056*1.111*VAR00001+0.306*1.111*VAR00002-0.010*1.111*VAR00003+0.285*1.111*VAR00004-0.059*1.111*VAR00005-0.650*1.111*VAR00006+0.032*1.111*VAR00007-0.446*1.111*VAR00008
第四步:
重复第二步,在Target Variable 栏中输入Z3,在Numeric expression栏中输入表达式如下:
0.277*0.932*VAR00001-0.126*0.932*VAR00002+0.407*0.932*VAR00003-0.020*0.932*VAR00004-0.238*0.932*VAR00005+0.342*0.932*VAR00006+0.681*0.932*VAR00007+0.503*0.932*VAR00008
Step 5:
重新进入Compute对话框,在Target Variable 栏中输入Z,在Numeric expression栏中输入表达式如下:
(0.60660*Z1+0.15549*Z2+0.10878*Z3)/0.87087
点击OK 显示如下
得到和matlab分析一样的结论。
因篇幅问题不能全部显示,请点此查看更多更全内容