您的当前位置:首页正文

(人教版)上海市选修三第三单元《成对数据的统计分析》测试题(含答案解析)

2020-07-25 来源:易榕旅网


一、选择题

1.某校对学生进行心理障碍测试,得到的数据如下表:

女生 男生 总计 焦虑 5 20 25 说谎 10 10 20 懒惰 15 50 65 总计 30 80 110 根据以上数据可判断在这三种心理障碍中,与性别关系最大的是( ) A.焦虑 2.以下说法:

①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;

B.说谎

C.懒惰

D.以上都不对

ˆ35x,变量x增加1个单位时,y平均增加5个单位 ②设有一个回归方程y③线性回归方程yˆbxa必过(x,y)

④设具有相关关系的两个变量x,y的相关系数为r,那么|r|越接近于0,x,y之间的线性相关程度越高;

⑤在一个22列联表中,由计算得K2的值,那么K2的值越大,判断两个变量间有关联的把握就越大。

其中错误的个数是( ) ..

A.0 B.1

C.2

D.3

3 4 3.已知变量x,y之间具有较强的线性相关性,测得它们的四组数据如表所示: x y 1 2 8 59 102 51 10 现已求得变量x,y之间的回归方程为yax2,请根据给出的条件,预测x9时,y的值约为( ) A.4 5B.5 2C.

4 5D.

5 24.某研究性学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如表

n(adbc)2(参考公式:K,其中nabcd.)

(ab)(cd)(ac)(bd)2附表:

P(K2k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828

则下列选项正确的是( )

A.有99.5%的把握认为使用智能手机对学习有影响 B.有99.5%的把握认为使用智能手机对学习无影响 C.有99.9%的把握认为使用智能手机对学习有影响 D.有99.9%的把握认为使用智能手机对学习无影响

5.下列说法:①对于独立性检验,2的值越大,说明两事件相关程度越大;②以模型

ycekx去拟合一组数据时,为了求出回归方程,设zlny,将其变换后得到线性方程

z0.3x4,则c,k的值分别是e4和0.3;③根据具有线性相关关系的两个变量的统

计数据所得的回归直线方程yabx中,b2,x1,y3,则a1;④通过回归直线ybxa及回归系数b,可以精确反映变量的取值和变化趋势,其中正确的个数是( ) A.1

B.2

88C.3

8D.4

86.为预测某种产品的回收率y,需要研究它和原料有效成分的含量x之间的相关关系,现取了8组观察值.计算得对x的回归方程是( ) A.y=11.47+2.62x C.y=2.62+11.47x

B.y=-11.47+2.62x D.y=11.47-2.62x

xi1i52,yi228,x478,xiyi1849,则y

2ii1i1i1ˆa7.①线性回归方程对应的直线yˆbxˆ至少经过其样本数据点

(x1,y1),(x2,y2)(xn,yn)中的一个点;

②若两个变量的线性相关性越强,则相关系数的绝对值越接近于1;

③在某项测量中,测量结果服从正态分布N(1,2)(0),若位于区域(0,1)内的概率为0.4,则位于区域(0,2)内的概率为0.8;

④对分类变量X与Y的随机变量K2的观测值k来说,k越小,判断“X与Y有关系”的把握越大.其中真命题的序号为( ) A.①④

B.②④

C.①③

D.②③

8.下列说法错误的是

A.对分类变量X与Y,随机变量K2的观测值k越大,则判断“X与Y有关系”的把握程度越小

B.在回归直线方程y=0.2x+0.8中,当解释变量x每增加1个单位时,预报变量y平均增加0.2个单位

C.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1 D.回归直线过样本点的中心(x,y)

9.下列命题:①在线性回归模型中,相关指数R2表示解释变量x对于预报变量y的贡献率,R2越接近于1,表示回归效果越好;②两个变量相关性越强,则相关系数的绝对值就越接近于1;③在回归直线方程y0.5x2中,当解释变量x每增加一个单位时,预报变量y平均减少0.5个单位;④对分类变量X与Y,它们的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.其中正确命题的个数是( ) A.1个

B.2个

C.3个

D.4个

10.某研究员为研究某两个变量的相关性,随机抽取这两个变量样本数据如下表:

xi yi 0.04 1.1 1 2.1 2.3 4.84 3.3 10.24 4.2 若依据表中数据画出散点图,则样本点(xi,yi)(i1,2,3,4,5)都在曲线y动.但由于某种原因表中一个x值被污损,将方程y程yx1附近波

x1作为回归方程,则根据回归方

x1和表中数据可求得被污损数据为( )

B.1.69

C.1.96

D.4.32

A.4.32 11.有下列说法:

①若某商品的销售量y(件)关于销售价格x(元/件)的线性回归方程为

y5x350,当销售价格为10元时,销售量一定为300件;

②线性回归直线ybxa一定过样本点中心(x,y);

③若两个随机变量的线性相关性越强,则相关系数r的值越接近于1;

④在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关;

⑤在线性回归模型中,相关指数R2表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果越好; 其中正确的结论有几个( ) A.1

B.2

C.3

D.4

12.下列说法中错误的是( )

A.先把高二年级的1000名学生编号为1到1000,再从编号为1到50的50名学生中随机

抽取1名学生,其编号为m,然后抽取编号为m50,m100,m150这样的抽样方法是系统抽样法.

B.正态分布N1,9在区间1,0和2,3上取值的概率相等 C.若两个随机变量的线性相关性越强,则相关系数r的值越接近于1 D.若一组数据1、a、2、3的平均数是2,则这组数据的众数和中位数都是2

的学生,

13.设两个变量x和y之间具有线性相关关系,它们的相关系数为r,y关于x的回归直线方程为

()ykxb,则

B.b与r的符号相同 D.b与r的符号相反

A.k与r的符号相同 C.k与r的符号相反

二、解答题

14.新冠肺炎疫情期间,各地均响应“停课不停学,停课不停教”的号召开展网课学习.为检验网课学习效果,某机构对2000名学生进行了网上调查,发现有些学生上网课时有家长在旁督促,而有些没有网课结束后进行考试,根据考试结果将这2000名学生分成“成绩上升”和“成绩没有上 升”两类,对应的人数如下表所示:

有家长督促的学生 成绩上升 成绩没有上升 合计 500 500 800 没有家长督促的学生 2000 没有家长督促的学生 (1)完成以上列联表,并通过计算(结果精确到0.001)说明,是否有90%的把握认为家长督促学生上网课与学生的成绩上升有关联

(2)从有家长督促的800名学生中按成绩是否上升,采用分层抽样的方法抽出8人,再从

8人中 随机抽取 3人做进一步调查,记抽到3名成绩上升的学生得1分,抽到1名成绩没有上升的学生得1分,抽到3名生的总得分用X表示,求X的分布列和数学期望.

nadbc2,nabcd 附:Kabcdacbd2PK2k0 k0 0.100 0.050 0.010 0.001 2.706 3.841 6.835 10.828 15.冬天的北方室外温度极低,若轻薄保暖的石墨烯发热膜能用在衣服上,可爱的医务工作者行动会更方便.石墨烯发热膜的制作:从石墨中分离出石墨烯,制成石墨烯发热膜.从石墨分离石墨烯的一种方法是化学气相沉积法,使石墨升华后附着在材料上再结晶.现有A材料、B材料供选择,研究人员对附着在A、B材料上再结晶各做了50次试验,得到如下等高条形图.

(1)由上面等高条形图,填写22列联表,判断是否有99%的把握认为试验成功与材料有关?

(2)研究人员得到石墨烯后,再制作石墨烯发热膜有三个环节:①透明基底及UV胶层;②石墨烯层;③表面封装层.每个环节生产合格的概率均为

2,且各生产环节相互3独立.已知生产1吨的石墨烯发热膜的固定成本为1万元,若生产不合格还需进行修复,且生产1吨石塑烯发热膜的每个环节修复费用均为1000元.如何定价,才能实现每生产1吨石墨烯发热膜获利可达1万元以上的目标?

nadbc附:参考公式:K,其中nabcd.

abcdacbd22PK2k0 k 0.100 2.706 0.050 3.841 0.010 6.635 0.005 7.879 0.001 10.828 16.为初步了解学生家长对艺术素质评价的了解程度,某校随机抽取100名学生家长参与问卷测试,并将问卷得分绘制频数分布表如下: 得分 男性人数 女性人数 [30,40) [40,50) 9 2 [50,60) 12 2 [60,70) 13 21 [70,80) 11 10 [80,90) 6 4 90,100 3 2 4 1 (1)将学生家长对艺术素质评价的了解程度分为“比较了解”(得分不低于60分)和“不太了解”(得分低于60分)两类,完成22列联表,并判断是否有99.9%的把握认为“学生家长对艺术素质评价的了解程度”与“性别”有关?

(2)以这100名学生家长中“比较了解”的频率代替该校学生家长“比较了解”的概率.现在再随机抽取3名学生家长,设这3名家长中“比较了解”的人数为X,求X的概率分布列和数学期望.

P2x0 x0 附:20.010 6.635 0.005 7.879 ,nabcd.

0.001 10.828 nadbc2abcdacbd17.电视传媒公司为了解某地区观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:

将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.

(1)根据已知条件完成下面的列联表,并据此资料你是否认为“体育迷”与性别有关?

男 女 合计 非体育迷 体育迷 合计 10 55

(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X).

nadbc2. 附:KabcdacbdP(K2≥k) k 0.05 3.841 0.01 6.635 2

18.2022年北京冬奥会的申办成功与“3亿人上冰雪”口号的提出,将冰雪这个冷项目迅速炒“热”.北京某综合大学计划在一年级开设冰球课程,为了解学生对冰球运动的兴趣,随机从该校一年级学生中抽取了100人进行调查,其中女生中对冰球运动有兴趣的占男生有10人表示对冰球运动没有兴趣额.

(1)完成22列联表,并回答能否有90%的把握认为“对冰球是否有兴趣与性别有关”?

2,而3 男 女 合计 有兴趣 没兴趣 合计 55 (2)已知在被调查的女生中有5名数学系的学生,其中3名对冰球有兴趣,现在从这5名学生中随机抽取3人,求至少有2人对冰球有兴趣的概率. 附表:

P(K2k0) 0.150 0.100 2.706 0.050 3.841 0.025 5.024 0.010 6.635 k0 2.072 n(adbc)2K

(ab)(cd)(ac)(bd)219.调查某桑场采桑员和辅助工桑毛虫皮炎发病情况结果如下表:

患者人数 健康人数 合计 采桑 18 5 不采桑 12 78 合计 利用22列联表的独立性检验估计,“患桑毛虫皮炎病与采桑”是否有关?认为两者有关系会犯错误的概率是多少?

n(adbc)2 (其中nabcd) 随机量变K(ab)(cd)(ac)(bd)2临界值表

PK2k0 k0 0.50 0.455 0.40 0.708 0.25 1.323 0.15 2.072 0.10 2.706 0.05 3.84 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10.83

20.我市今年参加高考的考生是首次取消文理科后的新高考考生,新高考实行

“321”,成绩由语文、数学、外语统一高考成绩和自主选考的3门普通高中学业水平考试等级性考试科目成绩构成.为了解各年龄层对新高考的了解情况,随机调查50人(把年龄在15,45称为中青年,年龄在45,75称为中老年),并把调查结果制成下表: 年龄(岁) 频数 了解 15,25 5 4 25,35 15 12 35,45 10 6 45,55 10 5 55,65 5 2 65,75 5 1 (1)请根据上表完成下面22列联表,并判断是否有95%的把握认为对新高考的了解与年龄(中青年、中老年)有关?

中青年 中老年 总计 了解新高考 不了解新高考 总计 nadbc2. 附:Kabcdacbd2PK2k 0.050 3.841 0.010 6.635 0.001 10.828 k (2)现采用分层抽样的方法从中老年人中抽取8人,再从这8人中随机抽取2人进行深入调查,求事件A:“恰有一人年龄在45,55”发生的概率.

21.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费对年销售量(单位:

t)的影响.该公司对近5年的年宣传费和年销售量数据进行了研究,发现年宣传费x(万

元)和年销售量y(单位:t)具有线性相关关系,并对数据作了初步处理,得到下面的一些统计量的值.

x(万元) 2 4 4 5 4.5 3 3 6 6 y(单位:t) 2.5 (1)根据表中数据建立年销售量y关于年宣传费x的回归方程; 2(2)已知这种产品的年利润z与x,y的关系为zy0.05x1.85,根据(1)中的

结果回答下列问题:

①当年宣传费为10万元时,年销售量及年利润的预报值是多少?

②估算该公司应该投入多少宣传费,才能使得年利润与年宣传费的比值最大.

ˆaˆbxˆ中的斜率和截距的最小二乘估计公式分别为附:问归方程yˆbxyi1ni1n11nxy2xxy1i1n1i1n1y2x12nxSi1xxSi1ˆ. ˆybx,a参考数据:

xy1288.5x,1190.

22.某中学为研究学生的身体素质与体育锻炼时间的关系,对该校100名高三学生平均每天体育锻炼时间进行调查,其中女生为55人,如表:(平均每天锻炼的时间单位:分钟)

平均每天锻炼时间 总人数 [0,10) [10,20) [20,30) [30,40) [40,50) 20 [50,60] 10 10 18 22 20

将学生日均体育锻炼时间在[40,60]的学生评价为“锻炼达标”.

(1)若女生锻炼达标人数为10人,通过计算判断,是否能在犯错误的概率不超过0.025的前提下认为“锻炼达标”与性别有关?

(2)在(1)的条件下“锻炼达标”的学生中,按男女用分层抽样方法抽出15人,进行体育锻炼体会交流,求这15人中,男生、女生各有多少人? 参考公式:

(abcd)(adbc)2K

(ab)(cd)(ac)(bd)2临界值表:

P(K2k0) 0.05 3.841 0.025 5.024 0.010 6.635 k0

23.为了解某高校学生中午午休时间玩手机情况,随机抽取了100名大学生进行调查.下面是根据调查结果绘制的学生日均午休时间的频率分布直方图,将日均午休时玩手机不低于40分钟的学生称为“手机控”.

(1)求列联表中未知量的值;

男 女 合计 非手机控 手机控 合计 x m 10 n 55 y

(2)能否有95%的把握认为“手机控与性别有关”?

nadbc. K2abcdacbd2PK2k0 k0 0.05 3.841 0.10 6.635

24.某品牌新款夏装即将上市,为了对新款夏装进行合理定价,在该地区的三家连锁店各进行了两天试销售,得到如下数据: 连锁店 售价x(元) 销量y(元) A店 80 86 B店 82 88 C店 84 90 88 78 85 75 82 66 (1)分别以三家连锁店的平均售价与平均销量为散点,如A店对应的散点为(83,83),求出售价与销量的回归直线方程ybxa;

(2)在大量投入市场后,销量与单价仍然服从(1)中的关系,且该夏装成本价为40元/件,为使该新夏装在销售上获得最大利润,该款夏装的单价应定为多少元?(保留整数)

n附:b(xx)(yy)iii1(xx)ii1n,aybx.

225.司机在开机动车时使用手机是违法行为,会存在严重的安全隐患,危及自己和他人的

生命.为了研究司机开车时使用手机的情况,交警部门调查了100名机动车司机,得到以下统计:在55名男性司机中,开车时使用手机的有40人,开车时不使用手机的有15人;在45名女性司机中,开车时使用手机的有20人,开车时不使用手机的有25人. (1)完成下面的2×2列联表,并判断是否有99.5%的把握认为开车时使用手机与司机的性别有关;

(2)以上述的样本数据来估计总体,现交警部门从道路上行驶的大量机动车中随机抽检3辆,记这3辆车中司机为男性且开车时使用手机的车辆数为X,若每次抽检的结果都相互独立,求X的分布列和数学期望E(X).

n(adbc)2参考公式与数据:K,其中n=a+b+c+d.

abcdacbd2

26.随着人们经济收入的不断增加,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司做了一次抽样调查,并统计得出某款车的使用年限x与所支出的总费用y(万元)有如表的数据资料: 使用年限x 总费用y 2 2.2 3 3.8 4 5.5 5 6.5 6 7.0 ˆaˆbxˆ; (1)求线性回归方程y(2)估计使用年限为12年时,使用该款车的总费用是多少万元?

ˆ中斜率和截距用最小二乘法估计计算公式如下:ˆaˆbx线性回归方程yˆbxxyyxynxyiiiii1nnxixi1n2i1nxi1ˆ ,aybx2inx2

【参考答案】***试卷处理标记,请不要删除

一、选择题

1.B 解析:B 【分析】

分别求出三种关系的观测值,比较后可得结论. 【详解】

解:对于焦虑,说谎,懒惰三种心理障碍,设它们观测值分别为K1,K2,K3, 由表中数据可得:

1105602520K10.863,

3080258511010702010K26.366,

3080209011015301550K31.410,

30806545因为K2的值最大,所以说谎与性别关系最大. 故选:B. 【点睛】

本题考查独立性检验的应用,考查理解能力和计算能力.

2222.C

解析:C 【分析】

根据用样本估计总体、线性回归方程、独立性检验的基本概念和基本性质,逐项判断,即可得到本题答案. 【详解】

方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方

ˆ35x,变量x增加1个单位时,y平均减少5个差不变,故①正确;一个回归方程y单位,故②不正确;线性回归方程yˆbxa必过样本中心点,故③正确;根据线性回归分析中相关系数的定义:在线性回归分析中,相关系数为r,|r|越接近于1,相关程度越大,故④不正确;对于观察值K2来说,K2越大,“x与y有关系”的可信程度越大,故⑤正确. 故选:C 【点睛】

本题主要考查用样本估计总体、线性回归方程、独立性检验的基本思想.

3.B

解析:B 【分析】

由已知求得x,y,代入yax2求得a值,则线性回归方程可求,取x9求得y值即可.

【详解】

x18921312342.5,y0.75,

451051044a0.7520.5,则线性回归方程为y0.5x2, 2.55. 2取x9,得y0.592故选:B. 【点睛】

本题考查线性回归方程,明确线性回归方程恒过样本点的中心是关键,是基础题.

4.A

解析:A 【解析】

分析:根据列联表中数据利用公式求得K2 ,与邻界值比较,即可得到结论. 详解:根据卡方公式求得K230812822010121810,

7.897K210.828,

该研究小组有99.5%的把握认为中学生使用智能手机对学生有影响,故选A.

点睛:独立性检验的一般步骤:(1)根据样本数据制成22列联表;(2)根据公式

nadbcK2计算K2的值;(3) 查表比较K2与临界值的大小关系,

abadacbd作统计判断.

25.C

解析:C 【分析】

根据独立性检验、非线性回归方程以及回归直线方程相关知识进行判断. 【详解】

2对于命题①,根据独立性检验的性质知,两个分类变量越大,说明两个分类变量相关

程度越大,命题①正确;

kx对于命题②,由yce,两边取自然对数,可得lnylnckx,

令zlny,得zkxlnc,确;

ce4lnc4,则,命题②正z0.3x4,所以k0.3k0.3对于命题③,回归直线方程yabx中,aybx3211,命题③正确; 对于命题④,通过回归直线ybxa及回归系数b,可估计和预测变量的取值和变化趋势,命题④错误.故选C.

【点睛】

本题考查了回归直线方程、非线性回归方程变换以及独立性检验相关知识,考查推理能力,属于中等题.

6.A

解析:A 【解析】

ˆ≈2.62,aˆ≈11.47,即得结果. 分析:根据公式计算bˆ详解:由bxynxyii22xn(x)ii1i1nnˆ,直接计算得bˆ≈2.62,aˆ=2.62xˆybx,aˆ≈11.47,所以y+11.47.选A.

点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求a,b,写出回归方程,回归直线方程恒过点(x,y).

7.D

解析:D 【解析】

对于①,因为线性回归方程是由最小二乘法计算出来的,所以它不一定经过其样本数据点,一定经过(x,y),故错误;对于②,根据随机变量的相关系数知,两个随机变量相关性越强,则相关系数的绝对值越接近于1,故正确;对于③,变量服从正态分布

N1,2,则P(02)2P(01)0.8,故正确;对于④,随机变量K2的观

测值越大,判断“X与Y有关系”的把握越大,故错误. 故选D.

点睛:在回归分析中易误认为样本数据必在回归直线上,实质上回归直线方程必过(x,y)点,可能所有的样本数据点都不在直线上.

8.A

解析:A 【解析】

A.对分类变量X与Y的随机变量K2的观测值k来说,k越大,“X与Y有关系”可信程度越大,因此不正确;

ˆ=0.2x+0.8中,当x每增加1个单位时,预报量平均增加0.2个单B.在线性回归方程y位,正确;

C.两个随机变量相关性越强,则相关系数的绝对值越接近1,因此正确; D.回归直线过样本点的中心(x,y),正确. 综上可知:只有A不正确. 故选A.

9.C

解析:C 【解析】

对于①,在回归分析模型中,相关指数R2表示解释变量x对于预报变量y的贡献率,R2越接近于1,表示回归效果越好,正确,因为相关指数R2越大,则残差平方和越小,模型的拟合效果越好,①正确.

对于②两个变量相关性越强,则相关系数的绝对值就越接近于1;

对于③在回归直线方程y0.5x2中,当解释变量x每增加一个单位时,预报变量y平均减少0.5个单位;正确;

对于④对分类变量X与Y,它们的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.错误,因为在对分类变量X与Y进行独立性检验时,随机变量K2的观测值k越大,则“X与Y相关”可信程度越大,故④错误; 故选C

10.C

解析:C 【分析】 令mixi,根据线性回归中心点在回归直线上,求出y,得出m,即可求解.

xii1,2,3,4,5,则样本mi,yi数据如下表所示:

2.3 2.2 3.3 3.2 4.2 【详解】

设缺失的数据为x,mimi yi 0.2 1.1 1 2.1 ˆm1,由表中数据可得, 其回归直线方程为y1y(1.12.12.33.34.2)2.6,

5ˆm1得,m1.6, 由线性回归方程y即(0.21故选:C. 【点睛】

本题考查线性回归方程的应用,换元是解题的关键,掌握回归中心点在线性回归直线上,考查计算求解能力,属于中档题.

15x2.23.2)1.6,解得x1.96.

11.B

解析:B 【分析】

由最小二乘法求解回归直线和回归直线的性质可知①错误,②正确;随机变量为负相关

时,线性相关性越强,相关系数r越接近1,③错误;残差图中带状区域越窄,拟合度越高,④错误;R2越接近1,模型拟合度越高,⑤正确;由此可得结果. 【详解】

①当销售价格为10时,销售量的预估值为300件,但预估值与实际值未必相同,①错误;

②由最小二乘法可知,回归直线必过x,y,②正确;

③若两个随机变量为负相关,若线性相关性越强,相关系数r越接近1,③错误; ④残差图中,带状区域越窄,模型拟合度越高,④错误;

⑤相关指数R2越接近1,拟合度越高,则在线性回归模型中,回归效果越好,⑤正确. 可知正确的结论为:②⑤,共2个 本题正确选项:B 【点睛】

本题考查统计案例部分命题的判断,涉及到回归直线、最小二乘法、相关系数、相关指数、残差图的相关知识.

12.C

解析:C 【分析】

对于A,根据系统抽样的定义可判断;对于B,根据正态分布的对称性可判断在两个区间上的概率;对于C,两个随机变量的线性相关性越强,则相关系数r的值越接近于1,可进行判断;对于D,根据一组数据1、a、2、3的平均数是2,得a2,求得该组数据的众数和中位数,可判断D. 【详解】

对于A,根据抽样方法特征是数据多,抽样间隔相等,是系统抽样,A正确;

,的曲线关于x1对称,区间10,和2,3与对称轴距离相对于B,正态分布N19等,所以在两个区间上的概率相等,B正确;

对于C,两个随机变量的线性相关性越强,则相关系数r的值越接近于1,C错误; 对于D,一组数据1、a、2、3的平均数是2,a2;所以该组数据的众数和中位数均为

2,D正确.. 【点睛】

本小题考查系统抽样,线性回归,线性相关,平均数,中位数与众数等基础知识,意在考查学生分析问题,及解决问题的能力和运算求解能力.

13.A

解析:A 【分析】

根据相关系数知相关系数的性质:r1,且r越接近1,相关程度越大;且r越接近0,相关程度越小.r为正,表示正相关,回归直线方程上升,选出正确结果. 【详解】

相关系数r为正,表示正相关,回归直线方程上升, r为负,表示负相关,回归直线方程下降,

k与r的符号相同. 故选A. 【点睛】

本题考查用相关系数来衡量两个变量之间相关关系的方法,当相关系数为正时,表示两个变量正相关,当相关系数大于0.75时,表示两个变量有很强的线性相关关系.

二、解答题

14.(1)列联表见解析,有90%的把握认为家长督促学生上网课与学生的成绩上升有关联;(2)分布列见解析,数学期望为【分析】

(1)根据已知数据计算K2的值,看是否大于190%10%的临界值,即可做出判定结论;

(2)利用超几何分布公式求出分布列,并利用期望的定义计算期望值. 【详解】 (1)

3. 4 有家长督促的学生 成绩上升 成绩没有上升 合计 500 300 800 没有家长督促的学生 700 500 1200 没有家长督促的学生 1200 2800 2000 2000500500300700125K23.4722.706

8001200120080036有90%的把握认为家长督促学生上网课与学生的成绩上升有关联.

(2)从有家长督促的800名学生中按成绩是否上升,采用分层抽样的方法抽出8人,其中成绩上升的有5人,成绩没有上升的有3人,再从8人中随机抽取3人,随机变量X所有可能的取值为3,1,1,3

C50C331PX3 3C856C51C3215PX1 3C856C52C3115PX1

C8328C53C305PX3

C8328X的分布列如下:

X P -3 -1 1 8 1 5615 5615 285 28EX3【点睛】

11530103113 565656564方法点睛:本题考查了独立性检验,考查了超几何分布,考查了离散型随机变量分布列和数学期望的计算,求解离散型随机变量分布列的步骤是: 首先确定随机变量X的所有可能取值;

计算X取得每一个值的概率,可通过所有概率和为1来检验是否正确; 进行列表,画出分布列的表格;

最后扣题,根据题意求数学期望或者其它.

15.(1)列联表见解析;有99%的把握认为试验成功与材料有关;(2)2.1万元/吨. 【分析】

(1)根据所给等高条形图,得到22的列联表,利用公式,求得K2的观测值,比较即可得到结论;

(2)设修复费用为X万元.得出X可得0,0.1,0.2,0.3,求得相应的概率,得到X的分布列,利用公式求得数学期望. 【详解】

(1)根据所给等高条形图,得到22的列联表:

成功 不成功 合计 A材料 45 5 50 B材料 30 20 50 2合计 75 25 100 1004520530K2的观测值K12,由于126.635,

50507525故有99%的把握认为试验成功与材料有关.

(2)生产1吨的石墨烯发热膜,所需的修复费用为X万元.易知X可得0,0.1,0.2,0.3.

328112212,PX0.1C3, PX032733271126,1, PX0.2CPX0.327332732322则X的分布列为:(分布列也可以不列) X P 0 0.1 0.2 0.3 8 2712 276 271 27修复费用的期望:EX0812610.10.20.30.1. 27272727所以石墨烯发热膜的定价至少为0.1112.1万元/吨,才能实现预期的利润目标. 【点睛】

求随机变量X的期望与方差的方法及步骤: 理解随机变量X的意义,写出X可能的全部值; 求X取每个值对应的概率,写出随机变量的分布列; 由期望和方差的计算公式,求得数学期望EX,DX;

若随机变量X的分布列为特殊分布列(如:两点分布、二项分布、超几何分布),可利用特殊分布列的期望和方差的公式求解.

16.(1)有99.9%的把握认为学生家长对艺术素质评价的了解程度与性别有关. (2)分布列见解析,E(X)【分析】

(1)完成列联表,求出X211.2910.828,从而有99.9%的把握认为学生家长对艺术素质评价的了解程度与性别有关. (2)推导出X~B3,【详解】

解:(1)由题意得到列联表如下:

21 107,由此能求出X的概率分布和数学期望. 10 男性 女性 合计 不太了解 25 5 30 比较了解 33 37 70 合计 58 42 100 n(adbc)2100(2537335)2K11.29.

(ab)(cd)(ac)(bd)30704258211.2910.828,

有99.9%的把握认为学生家长对艺术素质评价的了解程度与性别有关.

(2)由题意得该校1名学生家长“比较了解”的概率为27033P(X0)C3(),

101000318917P(X1)C3()()2, 101010004412723P(X2)C3()(), 10101000343373P(X3)C3(),

1010007077,且X~B(3,),

1010010X的分布列为:

X P 0 1 2 3 27 1000189 1000441 1000343 1000E(X)0【点睛】

2718944134321123. 100010001000100010独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释. 17.(1)无关;(2) 【详解】

(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而可得列联表如下:

39,. 416 男 女 合计 非体育迷 30 45 75 体育迷 15 10 25 合计 45 55 100 将22列联表中的数据代入公式计算,得 .

因为3.030<3.841,所以我们没有充分理由认为“体育迷”与性别有关.

(2)由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一

名“体育迷”的概率.由题意知X~B(3,),从而X的分布列为 X P E(X)=np=

0 1 2 3 39=.D(X)=np(1-p)=

164718.(1)有(2)p

10【分析】

(1)根据题中数据得到列联表,然后计算出K2,与临界值表中的数据对照后可得结论.(2)由题意得概率为古典概型,根据古典概型概率公式计算可得所求. 【详解】

(1)根据已知数据得到如下列联表

男 女 合计 有兴趣 45 30 75 没有兴趣 10 15 25 合计 55 45 100 由列联表中的数据可得因为

所以有90%的把握认为“对冰球是否有兴趣与性别有关”.

(2)记5人中对冰球有兴趣的3人为A、B、C,对冰球没有兴趣的2人为m、n, 则从这5人中随机抽取3人,所有可能的情况为:(A,m,n),(B,m,n),(C,m,n),(A,B,m),

(A,B,n),(B,C,m),(B,C,n),(A,C,m),(A,C,n),(A,B,C),共10种情况, 其中3人都对冰球有兴趣的情况有(A,B,C),共1种,2人对冰球有兴趣的情况有(A,B,m),(A,B,n),(B,C,m),(B,C,n),(A,C,m),(A,C,n),共6种, 所以至少2人对冰球有兴趣的情况有7种, 因此,所求概率为P【点睛】

由于独立性检验有其独特的作用,其原理不难理解和掌握,但解题时需要注意计算的准确性和判断的正确性,对独立性检验的考查多以解答题的形式出现,一般为容易题,多与概率、统计等内容综合命题.

19.有99%的把握认为“患桑毛虫皮炎病与采桑”有关系.认为两者有关系会犯错误的概率是1%.

7. 10【分析】

本题先求合计的4个值,再根据公式计算随机变量,接着比较数值大小,判断即可. 【详解】

n1118,n1212,n215,n2278,

所以n130,n283,n123,n290,n113. 所以2nn11n22n12n21n1n2n1n22

113(1878512)239.66.635.

30832390所以有99%的把握认为“患桑毛虫皮炎病与采桑”有关系.认为两者有关系会犯错误的概率是1%. 【点睛】

本题考查独立性检验,是基础题

20.(1)填表见解析;有95%的把握判断了解新高考与年龄(中青年、中老年)有关联;(2)【分析】

(1)根据调查结果填写列联表即可(其中频数指各年龄段调查人数),利用卡方检验公式求卡方值,并与参考表的值比较即可确定是否有95%的把握认为对新高考的了解与年龄(中青年、中老年)有关;(2)由分层抽样概念知8人中年龄在45,55中的有4人,年龄在55,65中的有2人,年龄在65,75中的有2人,结合古典概型的概率公式求概率即可; 【详解】

解:(1)依题意,22列联表如图所示,

4. 7 中青年 中老年 总计 了解新高考 22 8 30 不了解新高考 8 12 20 总计 30 20 50 所以有95%的把握判断了解新高考与年龄(中青年、中老年)有关联. (2)由表格数据得到抽取的8人中:年龄在45,55中的有4人,年龄在55,65中的有2人,年龄在65,75中的有2人.

2从8人中抽取2人的方法有C828种,其中恰有一人年龄在45,55被抽中的方法有

11C4C416种.

所以PA164. 287【点睛】

本题考查了卡方计算、分层抽样的方法,结合古典概型的概率公式求概率,属于基础题.

ˆ0.85x0.6;(2)①年销售量为9.1,年利润的预报值为2.25;②5万元 21.(1)y【分析】

(1)利用回归直线方程计算公式,计算出回归直线方程.

(2)①先求得年利润z关于x的表达式,然后将x10分别代入回归直线方程和年利润的函数表达式,由此求得年销售量及年利润的预报值

②求得年利润与年宣传费的比值w的表达式,利用基本不等式求得x5时,年利润与年宣传费的比值最大. 【详解】 (1)由题意xn245362.54.54364,y4,

5588.55420.85, 29054ˆbxynxyiii1nxi12inx2ˆ40.8540.6, ˆybxaˆ0.85x0.6. y22(2)①由(1)得zy0.05x1.850.05x0.85x1.25,

ˆ0.85100.69.1,z0.051020.85101.252.25. 当x10时,y即当年宣传费为10万元时,年销售量为9.1,年利润的预报值为2.25. ②令年利润与年宣传费的比值为w,则w0.05x1.250.85x0,xw0.05x1.251.251.250.850.05x0.8520.05x0.850.35. xxx1.25即x5时取最大值.故该公司应该投入5万元宣传费,才能使得年x利润与年宣传费的比值最大. 【点睛】

当且仅当0.05x本小题主要考查回归直线方程的计算,考查利用回归直线方程进行预测,考查利用基本不等式求最值,属于中档题.

22.(1)能;(2)男生应抽10人,女生应抽5人. 【分析】

(1)直接由题意列出列联表,求得K2的值,结合临界值表得结论;

(2)在30名达标学生中,男生20人,女生10人,通过分层抽样即可得出男女生人数. 【详解】

解:(1)由题意知,女生不达标的人数为45,达标的人数为10人,男生不达标的人数为25人,达标的为20人 ,则可列出22联表:

100(20451025)2K8.1235.024 , 307045552所以能在犯错误概率不超过0.025的前提下,认为锻炼达标与性别有关, (2)达标人数共30人,其中女生10人,男生20人,按分层抽样的方法抽取,

201010人,女生应抽155人. 3030这15人中,男生应抽10人,女生应抽5人. 【点睛】

男生应抽15本题考查分层抽样及独立性检验的应用,考查计算能力.

23.(1)x30,y45,m15,n45;(2)没有95%把握认为“手机控”与性别有关. 【分析】

(1)由频率分布直方图能求出在抽取的100人中,可算出“手机控”人数,因而得出“非手机控”的人数,即可算出x,y,m,n.

(2)求出2×2列联表,假设H0:“手机控”与性别没有关系,求出K23.841,从而得到没有95%把握认为“手机控”与性别有关. 【详解】

(1)由频率分布直方图可知,在抽取的100人中, “手机控”有:1000.20.0525人,非手机控75人, ∴x30,y45,m15,n45; (2)从而22列联表如下:

男 女 合计 非手机控 30 45 75 手机控 15 10 25 合计 45 55 100 假设H0:“手机控”与性别没有关系.

10030101545将22列联表中的数据代入公式,计算得:K23.030,

455575252当H0成立时,PK3.8410.05,

∴3.0303.841,所以没有95%把握认为“手机控”与性别有关. 【点睛】

本题考查独立性检验的应用,还涉及频率分布直方图求频数,考查学生的计算能力. 24.(1)y2.25x270.25(2)x80 【分析】

(1)求出三家连锁店的平均年售价和平均销量,根据回归系数公式计算回归系数,得出回归方程(2)设定价为x,得出利润关于x的函数f(x),利用二次函数的性质确定出f(x)的最值. 【详解】

(1)三家连锁店的平均售价和销售量分别为A(83,83),B(85,80),C(87,74).

2xˆb83858783807485,y79. 3324012(5)2.25,

404ˆ79(2.25)85270.25. aˆ2.25x270.25. 售价与销量的回归直线方程为y(2)设定价为x元,则利润为

f(x)(x40)(2.25x270.25)2.25x2360.25x10810.

当x360.2580时,f(x)取得最大值,即利润最大. 4.5【点睛】

本题主要考查了线性回归方程的求解,二次函数的性质,属于中档题.

25.(1)有99.5%的把握认为开车时使用手机与司机的性别有关;(2)分布列见解析,

E(X)6 5【分析】

(1)根据题意填写2×2列联表,计算观测值,对照临界值得出结论;

(2)求出任意抽取1辆车中司机为男性且开车时使用手机的概率,知X的可能取值,且X服从二项分布,计算对应的概率,写出X的分布列,计算数学期望值. 【详解】

(1)填写2×2列联表,如下;

男性司机人数 女性司机人数 合计 开车时使用手机 40 20 60 开车时不使用手机 15 25 40 合计 55 45 100 2n(adbc)2100(40252015)=≈8.25>根据数表,计算Kabcdacbd5545604027.879,

所以有99.5%的把握认为开车时使用手机与司机的性别有关;

(Ⅱ)由题意,任意抽取1辆车中司机为男性且开车时使用手机的概率是2则X的可能取值为:0,1,2,3,且X~B(3,),

523k2kk可得P(Xk)C3(1)(),

552703320所以P(X0)C3()(),

55125541322P(X1)C3(), 55125P(X2)C3232236(), 55125402, 1005833023P(X3)C3()();

55125所以X的分布列为:

X P 数学期望为E(X)3【点睛】

0 1 2 3 27 12554 12536 1258 12526. 55本题考查了二项分布列的性质及其数学期望和独立性检验思想方法,属于中档题.

ˆ1.23x0.08 (2) 14.84万元 26.(1) y【分析】

(1)由已知表格中的数据求得x,y进而求得b与a的值,则线性回归方程可求; (2)在(1)中求得的线性回归方程中,取x=12求得y值即可. 【详解】 (1)由表可得x11(23456)4,y(2.23.85.56.57.0)5 5552ixyii15iˆ112.3,x90,bi1xyii155i5xy5x2xi12i112.35451.23

90516ˆ51.2340.08,所求线性回归方程为yˆ1.23x0.08 ˆybxaˆ1.23120.0814.84,即使用12年的车的总费用大概为14.84(2)当x12时,y万元. 【点睛】

本题考查线性回归方程的求法,考查计算能力,是基础题.

因篇幅问题不能全部显示,请点此查看更多更全内容