课后练习答案
第6章SPSS的方差分析
1、入户推销有五种方法。某大公司想比较这五种方法有无显著的效果差异,设计了一项实验。从应聘人员中尚无推销经验的人员中随机挑选一部分人,并随机地将他们分为五个组,每组用一种推销方法培训。一段时期后得到他们在一个月内的推销额,如下表所示: 第一组 第二组 第三组 第四组 第五组 20.0 24.9 16.0 17.5 25.2 16.8 21.3 20.1 18.2 26.2 17.9 22.6 17.3 20.2 26.9 21.2 30.2 20.9 17.7 29.3 23.9 29.9 22.0 19.1 30.4 26.8 22.5 26.8 18.4 29.7 22.4 20.7 20.8 16.5 28.2 1) 请利用单因素方差分析方法分析这五种推销方式是否存在显著差异。 2) 绘制各组的均值对比图,并利用LSD方法进行多重比较检验。
(1)分析比较均值单因素ANOVA因变量:销售额;因子:组别确定。
ANOVA 销售额 组之间 组内 总计 平方和 405.534 269.737 675.271 df 4 30 34 均方 101.384 8.991 F 11.276 显著性 .000 概率P-值接近于0,应拒绝原假设,认为5种推销方法有显著差异。
(2)均值图:在上面步骤基础上,点 选项均值图;事后多重比较LSD
多重比较 因变量: 销售额 LSD(L) 平均差 (I) 组别 (J) 组别 第一组 第二组 第三组 第四组 第五组 第二组 第一组 第三组 第四组 第五组 第三组 第一组 第二组 第四组 第五组 (I-J) -3.30000 .72857 3.05714 -6.70000 3.30000 4.02857 6.35714 -3.40000 -.72857 -4.02857 2.32857 -7.42857 ********95% 置信区间 标准 错误 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 显著性 .048 .653 .066 .000 .048 .018 .000 .042 .653 .018 .157 .000 下限值 -6.5733 -2.5448 -.2162 -9.9733 .0267 .7552 3.0838 -6.6733 -4.0019 -7.3019 -.9448 -10.7019 上限 -.0267 4.0019 6.3305 -3.4267 6.5733 7.3019 9.6305 -.1267 2.5448 -.7552 5.6019 -4.1552 第四组 第一组 第二组 第三组 第五组 -3.05714 -6.35714 -2.32857 -9.75714 6.70000 3.40000 7.42857 9.75714 ******1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 1.60279 .066 .000 .157 .000 .000 .042 .000 .000 -6.3305 -9.6305 -5.6019 -13.0305 3.4267 .1267 4.1552 6.4838 .2162 -3.0838 .9448 -6.4838 9.9733 6.6733 10.7019 13.0305 第五组 第一组 第二组 第三组 第四组 *. 均值差的显著性水平为 0.05。 可知,1和2、1和5、2和3,2和4,2和5,3和5,4和5有显著差异。
2、从两个总体中分别抽取 n 1 =7 和 和 n 2 =6 的两个独立随机样本,经计算得到下面的方差分析表。请补充表中单元格的两个独立随机样本,经计算得到下面的方差分析表。请补充表中单元格“A” 和单元格“B” 内的计算结果。
答:已知组内均方=组内偏差平方和/自由度, 所以 A=26.4/11=2.4 F 统计量=组间均方/组内均方 所以 B=7.5/2.4=3.125
3、为研究某种降血压药的适用特点,在五类具有不同临床特征的高血压患者中随机挑选了若干志愿者进行对比试验,并获得了服用该降压药后的血压变化数据。现对该数据进行单因素方差分析,所得部分分析结果如下表所示。
1) 请根据表格数据说明以上分析是否满足方差分析的前提要求,为什么?
2) 请填写表中空缺部分的数据结果,并说明该降压药对不同组患者的降压效果是否存在显著差异。 3) 如果该降压药对不同组患者的降压效果存在显著差异,那么该降压药更适合哪组患者? (1)因F检验的概率P值小于显著性水平(0.05),拒绝原假设,方差不齐,不满足方差分析的前提假设。 (2)4*276.032=1104.128; 1104.128+1524.990=2629.118; 4+63=67; 1524.990/63=24.206 (3)各组均值存在显著差异。更适合第三组
4、为研究某商品在不同地区和不同日期的销售差异性,调查收集了以下日平均销售量数据。
销售量 日期 周一~周三 5000 6000 4000 7000 8000 8000 3000 2000 4000 周四~周五 6000 8000 7000 5000 5000 6000 6000 6000 5000 周末 4000 3000 5000 5000 6000 4000 8000 9000 6000 地区一 地区二 地区三 1) 选择恰当的数据组织方式建立关于上述数据的SPSS数据文件
2) 利用多因素方差分析方法,分析不同地区和不同日期对该商品的销售是否产生了显著影响
3)地区和日期是否对该商品的销售产生了交互影响。若没有显著的交互影响,则试建立非饱和模型进行分析,并与饱和模型进行对比。 (1)数据组织方法如下:
(2)分析一般线性模型单变量因变量:销售量;因子:地区、日期确定。
主体间因子
值标
地
1
签 地区1
数字
9 区 2
3 日期
1
地区2 地区3 周一至周三
9 9 9 2 周四至周五
9 3 周末 9 主体间效应的检验
因变量: 销售量
III 类平
源 校正的模型 截距
方和 61.85
2 844.4
81 Area
2.296 a
自由度 8 均方 7.731 844.481 1.148 1.370 14.204 F 8.350 912.040 1.240 1.480 15.340 显著性 .000 1 .000 2 .313 Date
2.741 56.81
5 16.66
7 2 .254 Area * Date 错误
4 .000 18 .926 27
总计 923.0
00 校正后的总变异
78.51
9 26 a. R 平方 = .788 (调整后的 R 平方 = .693)
分析:
(2)由上表可知,Fa1、Fa2的概率P-值为0.313和0.254,大于显著性水平(0.05),所以不应拒绝原假设,可以认为不同地区和日期下的销售额总体均值不存在显著差异,不同地区和不同日期对该商品的销售没有产生显著影响。
(3)产生了交互影响。因为概率P-值接近于0,拒绝原假设,认为不同地区和日期对销售额产生了显著的交互作用。
5、 研究者想调查性别(1 为女,2 为男)和使用手机(1 使用,2 不使用)对驾驶状态的影响。在封闭道路开车的 24 人参与了该项研究。其中,12 男12 女,6 男6 女使用手机,其余6 男 6 女不使用手机。用 0-50 分测度驾驶状态,分数越高驾驶状态越好。数据如下: 性别 1 1 使用手机 1 1 得分 34 29 性别 2 2 使用手机 1 1 得分 35 32 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 38 34 33 30 45 44 46 42 47 40 2 2 2 2 2 2 2 2 2 2 1 1 1 1 2 2 2 2 2 2 27 26 37 24 48 47 40 46 50 39 请问:性别和是否使用手机对驾驶状态有影响吗?如果有影响,影响效应是多少? (1)数据组织方法如下:
(2)分析一般线性模型单变量因变量:得分;因子:性别、是否使用手机确定。
主体间因子 性别 1 2 是否使用手机 1 2 值标签 男 女 使用 不使用 数字 12 12 12 12 主体间效应的检验 因变量: Score III 类平方源 校正的模型 截距 Sex UsePhone Sex * UsePhone 错误 总计 校正后的总变异 和 1028.125 34732.042 5.042 1001.042 22.042 324.833 36085.000 1352.958 a自由度 3 1 1 1 1 20 24 23 均方 342.708 34732.042 5.042 1001.042 22.042 16.242 F 21.101 2138.453 .310 61.634 1.357 显著性 .000 .000 .584 .000 .258 a. R 平方 = .760 (调整后的 R 平方 = .724) 分析:
就性别而言,因为概率P-值=0.584,大于显著性水平0.05,所以不应拒绝原假设,认为性别对驾驶状态无显著影响;就手机使用情况而言,因为概率P-值接近0,应拒绝原假设,认为手机使用情况对驾驶状态存在显著影响。
6、下面的表格记录了某公司采用新、旧两种培训方式对新员工进行培训前后的工作能力评分增加情况的数据。现需要比较这两种培训方式的效果有无差别,考虑到加盟公司时间可能也是影响因素,将加盟时间按月进行了纪录。
ID 1 2 3 4 5 Method 1 1 1 1 1 Month 1.5 2.5 5.5 1 4 scoreadd 9 10.5 13 8 11 ID 10 11 12 13 14 Method 2 2 2 2 2 month 2 4.5 7 0.5 4.5 scoreadd 12 14 16 9 12 6 7 8 9 1 1 1 1 5 3.5 4 4.5 9.5 10 12 12.5 15 16 17 18 2 2 2 2 4.5 2 5 6 10 10 14 16 1)请选择适当的数据组织方式将以上数据录入到SPSS资料编辑窗口,变量名保持不变,并定义各变量的变量值标签,变量Method的变量值标签(1为旧方法,2为新方法)。 2) 按不同的培训方法计算加盟时间、评分增加量的平均数。
3) 在剔除加盟时间影响的前提下,分析两种培训方式的效果有无差别,并说明理由。 (1)数据组织方法如下图:
(2) 步骤:①数据拆分文件比较组:选择培训方式确定;②分析描述统计描述变量:增分、加盟时间;选项:平均值确定。
描述统计
培训方式 旧方式
增分 加盟时间 有效 N(成列)
新方式
增分 加盟时间 有效 N(成列)
数字
9 9 9 9 9 9
12.556 4.000 平均值(E)
10.611 3.500 (3)
分析一般线性模型单变量因变量:增分;固定因子:培训方式;协变量:加盟时间确定。
注意:请先重置“拆分文件”操作。 主体间效应的检验 因变量: 增分 III 类平方源 校正的模型 截距 Month Method 错误 总计 校正后的总变异 和 67.571 200.270 50.557 9.405 26.054 2508.750 93.625 a自由度 2 1 1 1 15 18 17 均方 33.785 200.270 50.557 9.405 1.737 F 19.451 115.299 29.106 5.415 显著性 .000 .000 .000 .034 a. R 平方 = .722 (调整后的 R 平方 = .685) 在剔除加盟时间的影响下,因P-值为0.034,小于0.05,应拒绝原假设,两种培训方式效果有显著差异。
因篇幅问题不能全部显示,请点此查看更多更全内容