时限:120分钟 满分:150分 第Ⅰ卷(选择题 共60分)
一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合要求的)
1.散点图在回归分析过程中的作用是( D ) A.查找个体个数 B.比较个体数据大小关系 C.探究个体分类
D.粗略判断变量是否线性相关
解析:由于散点图是由解释变量和预报变量绘制的图形,所以它可以粗略判断变量间是否具有线性相关关系,故选D.
2.变量x,y的5组数据的散点图如图所示,去掉哪个点对应的数据后,剩下的4组数据的线性相关性最强( A )
A.E C.D
解析:E偏离得最多,故选A.
3.对有线性相关关系的两个变量建立的回归直线方程y=a+bx中,回归系数b( A )
A.可以小于0 C.能等于0 可以大于0也可以小于0.
4.对两个变量y与x进行回归分析,分别选择不同的模型,它们的相
1 知识改变格局 格局决定命运!
B.C D.A
B.只能大于0 D.只能小于0
解析:若b=0,则相关系数r=0,此时不具有线性相关关系,但b
关系数r如下,其中拟合效果最好的模型是( A )
A.模型Ⅰ:相关系数r为0.96 B.模型Ⅱ:相关系数r为-0.81 C.模型Ⅲ:相关系数r为-0.53 D.模型Ⅳ:相关系数r为0.35 解析:|r|越大,拟合效果越好,故选A. 5.下列说法不正确的是( D )
A.回归分析中,R2的值越大,说明残差平方和越小
B.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)满足yi=bxi+a+ei(i=1,2,…,n),若ei恒为0,则R2=1
C.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法
D.画残差图时,纵坐标为残差,横坐标一定是编号
解析:画残差图时,纵坐标为残差,横坐标可以是编号,也可以是原始数据,也可以是数据估计值,D不正确,故选D.
6.一位母亲记录了儿子3~9岁的身高,数据如表.由此建立的身高与年龄的回归模型为y=7.19x+73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是( C ) 年龄/岁 身高/cm 3 94.8 4 104.2 5 108.7 6 117.8 7 124.3 8 130.8 9 139.0 A.身高一定在145.83 cm B.身高在145.83 cm以上 C.身高在145.83 cm左右 D.身高在145.83 cm以下
解析:将x=10代入得y=145.83,但这种预测不一定准确,应该在这个值的左右.故选C.
7.考察四个班的学生数学、物理成绩,得到列联表如下:
物理成绩优秀 物理成绩差 数学成绩优秀 34 5 2 知识改变格局 格局决定命运!
数学成绩差 7 19 则χ2的值约为( D ) A.34 C.37 性回归方程是( C )
A.y=1.23x+4 C.y=1.23x+0.08 回归方程为y=1.23x+0.08.
9.对两个变量y和x进行线性相关检验,n是观察值组数,r是相关系数,且已知:①n=7,r=0.953 3;②n=15,r=0.301 2;③n=17,r=0.999 1;④n=3,r=0.995 0.则变量y和x具有相关关系的是( B )
A.①和② C.②和④
B.①和③ D.③和④ B.y=1.23x+5 D.y=0.08x+1.23 B.20 D.24
8.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则线
解析:由题意知b=1.23,直线经过中心(4,5),则a=0.08,所以线性
解析:②中r太小,④中观察值组数太少.
10.下表是某厂1~4月份用水量(单位:百吨)的一组数据:
月份x 用水量y 1 4.5 2 4 3 3 4 2.5 由如下散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y=-0.7x+a,则a等于( C )
A.5 C.5.25
解析:x=2.5,y=3.5,
∵回归直线方程过定点(x,y),∴3.5=-0.7×2.5+a.
3 知识改变格局 格局决定命运!
B.5.05 D.6
∴a=5.25.
11.在一次男女生是否说谎的调查中,得到如表数据,根据表中数据可知下列结论中正确的是( D )
男 女 合计 说谎 6 8 14 不说谎 7 9 16 合计 13 17 30 A.在此次调查中有95%的把握认为说谎与性别有关 B.在此次调查中有99%的把握认为说谎与性别有关 C.在此次调查中有90%的把握认为说谎与性别有关 D.在此次调查中没有充分证据显示说谎与性别有关
2
30×6×9-7×8
解析:根据表中数据可求得χ2=≈0.002 4,因为
13×17×14×16
0.002 4<2.706,所以在此次调查中没有充分证据显示说谎与性别有关,故选D.
12.为预测某种产品的回收率y,需要研究它和原料有效成分的含量x之间的相关关系,现取了8组观察值.计算得xi=52,yi=228,x2i=
i=1
8
i=1
i=1
8
8
8
478,xiyi=1 849,则y对x的回归方程是( A )
i=1
A.y=11.47+2.62x C.y=2.62+11.47x
B.y=-11.47+2.62x D.y=11.47-2.62x
4 知识改变格局 格局决定命运!
xiyi-8x y
i=1
8
解析:b=
2
x2i-8xi=18
52228
1 849-8×8×8=≈2.62,a=11.47.所以y
522
478-8×8
对x的回归方程为y=2.62x+11.47.故选A.
第Ⅱ卷(非选择题 共90分)
二、填空题(本大题共4小题,每小题5分,共20分,请把答案填写在题中横线上)
13.已知一回归直线方程为y=1.5x+45,x∈{1,5,7,13,19},则y=58.5. 1
解析:因为x=5(1+5+7+13+19)=9,且y=1.5x+45,所以y=1.5×9+45=58.5.
14.若施化肥量x kg与水稻产量y kg之间的线性回归方程为y=5x+250,则当施化肥量为80 kg时,预计水稻产量为650 kg.
解析:将x=80代入线性回归方程,得y=650(kg).
15.为了判断选修文科是否与性别有关,现随机抽取50名同学,得到2×2列联表如下:
理科 男 女 文科 13 7 10 20 已知P(χ2>3.841)≈0.05,P(χ2>6.635)≈0.01,根据表中数据,得到χ2
50×13×20-10×72=≈4.844,则认为选修文科与性别有关系出错的可
30×27×20×23能性为5%.
解析:由题目条件,4.844>3.841,P(χ2>3.841)≈0.05.
16.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围,令z=lny,求得回归直线方程为z=0.25x-2.58,则该模型的回归方程为y=e0.25x-2.58.
解析:因为z=0.25x-2.58,z=lny,所以y=e0.25x-2.58.
三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明
5 知识改变格局 格局决定命运!
过程或演算步骤.)
17.(10分)调查在2~3级风时的海上航行中男女乘客的晕船情况,共调查了71人,其中女性34人,男性37人.女性中有10人晕船,另外24人不晕船;男性中有12人晕船,另外25人不晕船.
(1)根据以上数据建立有关的2×2列联表; (2)判断晕船是否与性别有关系. 解:(1)2×2列联表如下:
晕船情况 性别 女 男 总计 晕船 10 12 22 不晕船 24 25 49 总计 34 37 71 271×25×10-12×24(2)计算χ2=≈0.08.
22×49×37×34
因为χ2<2.706,所以我们没有充分证据说“晕船与性别有关”. 18.(12分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验如下表:
零件的个数x/个 加工的时间y/时 2 2.5 3 3 4 4 5 4.5 (1)在给定坐标系(如图)中画出表中数据的散点图;
(2)求y关于x的回归直线方程y=bx+a; (3)试预测加工10个零件需要的时间. 解:(1)散点图如图.
6 知识改变格局 格局决定命运!
2+3+4+5
(2)由题中数据可得x==3.5, 42.5+3+4+4.5y==3.5, 4
xiyi=52.5,x2i=54,
i=1
i=1
44
52.5-4×3.5×3.5进而可求得b==0.7,
54-4×3.52a=3.5-0.7×3.5=1.05, 故回归直线方程为y=0.7x+1.05. (3)当x=10时,y=0.7×10+1.05=8.05, 故预测加工10个零件需要8.05小时.
19.(12分)两所学校的计算机算法语言学习小组统一测验成绩如下: 甲校:16,12,20,15,23,8,16,19. 乙校:22,17,26,24,8,7,25,28. (1)求这16个数据的中位数. (2)统计中位数上下的频数.
校别 甲 乙 合计 中位数以上 中位数以下 合计 (3)两所学校的计算机算法语言学习小组的成绩有无差异? 解:(1)将两组数据合在一起,从小到大的排列,寻找共同的中位数,由于n1+n2=8+8=16,则第8个与第9个位置上的数据之平均数即为共
7 知识改变格局 格局决定命运!
同的中位数,共同中位数为18.
(2)
校别 甲 乙 合计 中位数以上 3 5 8 中位数以下 5 3 8 合计 8 8 16 2163×3-5×5(3)∵χ2==1≤2.706,
8×8×8×8
∴两所学校的计算机算法语言学习小组的成绩无显著差异. 20.(12分)某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如表:
月平均气温x(℃) 月销售量y(件) 17 24 13 33 8 40 2 55 (1)求线性回归方程y=bx+a(a,b取整数); (2)气象部门预测下个月的平均气温为6℃,据此估计该商场下个月毛衣的销售量.(y=38,xiyi=1 267,x2i=526)
i=1
i=1
4
4
1 267-4×10×38
解:(1)x=(17+13+8+2)÷4=10,b=≈-2,a=
526-4×102y-bx≈38-(-2)×10=58,所以线性回归方程为y=-2x+58.
(2)当x=6时,y=-2×6+58=46.
因此,估计该商场下个月毛衣销售量为46件.
21.(12分)某校对某班50名学生进行了作业量多少的调查,得到如下列联表(单位:名):
喜欢玩电脑游戏与认为作业多少列联表
喜欢玩电脑游戏 不喜欢玩电脑游戏 认为作业多 18 8 8 知识改变格局 格局决定命运!
认为作业不多 9 15 总计 27 23 总计 (1)作出等高条形图; 26 24 50 (2)能否在犯错误的概率不超过0.025的前提下认为喜欢玩电脑游戏与认为作业多之间有关系吗?为什么?
解:(1)作等高条形图如图所示.
(2)能.因为由题中列联表中数据计算,得χ2的观测值k=50×18×15-9×82
≈5.059>5.024.因此,能在犯错误的概率不超过0.025
27×23×26×24
的前提下认为喜欢玩电脑游戏与认为作业多之间有关系.
22.(12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
9 知识改变格局 格局决定命运!
(1)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程; (3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
(ⅰ)年宣传费x=49时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+β u的斜率和截距的最小二乘估计分别为
10 知识改变格局 格局决定命运!
解:(1)由散点图可以判断,y=c+dx适宜作为年销售量y关于年宣传费x的回归方程类型.
(2)令w=x,先建立y关于w的线性回归方程.
c=y-dw=563-68×6.8=100.6,
所以y关于w的线性回归方程为y=100.6+68w,因此y关于x的回归方程为y=100.6+68x.
(3)(ⅰ)由(2)知,当x=49时,年销售量y的预报值y=100.6+6849=576.6,
年利润z的预报值z=576.6×0.2-49=66.32. (ⅱ)根据(2)的结果知,年利润z的预报值 z=0.2(100.6+68x)-x=-x+13.6x+20.12. 13.6
所以当x=2=6.8,即x=46.24时,z取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大.
11 知识改变格局 格局决定命运!
12 知识改变格局 格局决定命运!
因篇幅问题不能全部显示,请点此查看更多更全内容