您的当前位置:首页正文

社会统计学复习题

2021-02-16 来源:易榕旅网


《社会统计学》复习题

考试题型:

一、填空(1*20=20) 二、单选(1*10=10) 三、多选(2*5=10) 四、判断(2*5=10) 五、计算题(5*8=40) 六、分析题(1*10=10) 一、填空题

1、大量观察法之所以称为统计上特有的方法,是与( )的作用分不开的。 2、大数定律的一般意义是:在综合大量社会现象的数量特征时,个别单位偶然的数量差异会( ),使大量社会现象的数量特征借助于( )形式,接近用确定的数值显示出必然的规律性。

3、要了解有个班级学生的学习情况,则总体是( ),总体单位是( )。 4、凡是相邻的两个变量值之间可以连续不断分割的变量,称为( )。凡是各变量值之间是以整数断开的变量,称为( )。

5、统计按其内容主要包括两个方面:描述统计和( )。 6、推论统计有两个基本内容:参数估计和( )。

7、通过抽样得到的用以推断总体特征的那个“部分”,在统计学上称为( )。样本中所含的单位数,在统计学上称为样本大小,也叫做( )。

8、( )是指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。( )是指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。

9、( )误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。 ( )误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。

10、统计调查从调查范围上分,可分为( )和( )。

11.( )误差是在遵守随机原则的条件下,用样本指标代表总体指标不可避免存在的误差,它表示抽样估计的精度。

12基尼系数为( ),表示收入绝对不平均;基尼系数为( ),表示收入绝对平均。

13、统计表通常有一定格式,统计表各部位的名称分别是( )、横行标题、纵栏标题、( )。

14、实际收入分配情况则由洛仑兹曲线表示,一般表现为一条下凹的弧线,下凹程度愈大,收入分配( ),反之,则收入分配( )。

相关:洛仑兹曲线是一种用来反映社会收入分配平均程度的累计百分数曲线。洛仑兹曲线的特点是在纵轴和横轴两个方向上都进行累计。

20世纪初意大利经济学家基尼(Gini)根据洛仑兹曲线提出了一种判断社会收入分配平均程度的指标,用G表示。设实际收入分配曲线和收入分配绝对平均线之间的面积为A,实际收入分配曲线右下方的面积为B,并以A除以A+B的商表示不平均程度,这个数值被称为基尼系数。

15、对于连续变量,恰是某一组限的数据应按照( )的原则归入相应的组别。 16、某班级中男生人数所占比重是66.7%,则男生和女生的比例关系是( )。 17、在频数分布图中,( )标示为曲线的最高点所对应的变量值。 18、在频数呈偏态分布时,( )必居于X和M0之中。

19、对于未分组资料,如总体单位数是偶数,则中间位置的两个值的算术平均数就是( )。 20、对收集来的数据,数值最大者和最小者之差叫作( ),又称之为( )。 21、指出下列变量可能需要采用的测量尺度:

(1)年龄 (2)学历 (3)社会等级 (4)利润率 (5)雇员所在岗位

22、假设检验思想中,无论在作出接受或拒绝假设时,都不可能做到百分之百的正确性,通常会犯两类错误: 和 ,假设检验中的显著性水平是指允许犯________错误的概率。

23、数据的离散程度可以通过以下描述性统计量来测量: 、 、 、 。

24、 定理是研究在什么条件下,随机变量之和的分布可以近似为正态分布。 25.统计按其内容划分,主要包括________统计和________统计两个方面。 26.相关关系按方向不同,可分为____ ______和_____ _____。

27、在数据的各种计量尺度中,有绝对零点的计量尺度是 。 28、一元一次回归方程Y=a+bx中的a表示 。

29、以样本统计量估计总体参数,要求估计量的数学期望等于被估计的总体参数,这一数学性质称为 。

30、参数的点估计必须满足 、 和 。 31、中位值适用于 、 和 。

二、判断题

1、在区间估计中,置信度和精度是相互制约的。 ( ) 2、中位值适用于定类、定序和定距变量。 ( ) 3、不论是相关分析还是回归分析,都必须确定自变量和因变量。 ( ) 4、在进行方差分析之前必须先对因变量的分布进行等方差性检验。 ( ) 5、列联表分析是针对表格中的相对频数进行的。 ( ) 6、统计分析内容主要分两部分:统计描述和统计推论。 ( ) 7、数据的离散程度可以通过方差、极值和众数等描述性统计量来测量。 ( )

8、假设检验思想中,无论在作出接受或拒绝假设时,都不可能做到百分之百的正确性。 ( )

9、在进行方差分析之前必须先对因变量的分布进行等方差性检验。 ( ) 10、列联表分析是针对表格中的相对频数进行的。 ( )

二、单选题

1、要了解400个学生的学习情况,则总体单位是( ) 。 A 400个学生 B 每一个学生 C 400个学生的成绩 D 每一个学生的成绩 2、下列属于定距变量的是 ( ) 。 A 职工的工龄 B 职工的性别 C 职工的籍贯 D 职工的政治面貌

3对某市高等学校的科研所进行调查,则统计总体是( )。 A 某市所有的高等学校 B 某一高等学校的科研所 C 某一高等学校 D 某市所有高等学校的科研所

4将总体按与研究有关的标志进行分层,然后再随机地从各层中抽选单位组成样本。这种抽样方式叫( )。

A 简单随机抽样 B 分层抽样 C 等距抽样 D 整群抽样。 5.下面能进行除法运算的测量尺度是( )。

A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 6.教育程度是( )的测量。

A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 7.智商是( )的测量。

A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 8.籍贯是( )的测量。

A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度

9. 某城市男性青年27岁结婚的人最多,该城市男性青年结婚年龄为26.2岁,则该城市男性青年结婚的年龄分布为( )。 A.右偏 B.左偏 C.对称

D.不能作出结论

10.下面四个平均数中,只有( )是位置平均数。 A 算术平均数 B 中位数 C 调和平均数 D 几何平均数 11.关于算术平均数的性质,不正确的描述是( )。 A 各变量值对算术平均数的偏差和为零; B 算术平均数受抽样变动影响微小; C 算术平均数受极端值的影响微小;

D 各变量值对算术平均数的偏差的平方和,小于它们对任何其它数偏差的平方和。 12.在社会统计学中,( )是反映集中趋势最常用、最基本的平均指标。 A 中位数 B算术平均数C 众数 D几何平均数

13.下面资料中哪个厂子的平均工资代表性意义最大( ),哪个厂子最小( )。 平均工资(元) 职工人数 工资标准差(元) A 甲厂 108 346 9.80 B 乙厂 96 530 11.40 C 丙厂 128 210 12.10 D 丁厂 84 175 9.60

14.某企业1994年职工平均工资为5200元,标准差为110元,1998年职工平均工资增长了40%,标准差扩大到150元。职工平均工资的相对变异( )。 A 增大 B 减小 C 不变 D 不能比较

15.已知离散性随机变量x服从参数为λ=2的泊松分布,则概率P(3;λ)=( )。 A 4/3e2 B 3/3e2 C 4/3e3 D 3/3e3

16.当群体的规模逐渐增大,以至于不回置抽样可以作为回置抽样来处理时,( )分布可以用二项分布来近似。

2A t分布 B F分布 C 分布 D 超几何分布

17、只与一个自由度有关的是( )

2A 分布 B 超几何分布 C 泊松分布 D F分布

18.关于t分布,下面哪种说法不正确( )。 A 要求随机样本 B 适用于任何形式的总体分布

C 可用于小样本 D 可用样本标准差S代替总体标准差 19.二项分布的数学期望为( )。

A n(1-n)p B np(1- p) C np D n(1- p)。

20.处于正态分布概率密度函数与横轴之间、并且大于均值部分的面积为( )。 A 大于0.5 B -0.5 C 1 D 0.5。 21.在统计检验中,那些不大可能的结果称为( D A 检验统计量 B 显著性水平 C 零假设 D 否定域

22.对于大样本双侧检验,如果根据显著性水平查正态分布表得Zα/2=1.96,则当零假设被否定时,犯第一类错误的概率是( )。 A 20% B 10% C 5% D.1%

23.设离散型随机变量X~B(2,p),若数学期望E(X)2.4,方差D(X)1.44,则参数n,p的值为( )

A n4,p=0.6 B n6,p=0.4 C n8,p=0.3 D n12,p=0.2

24.如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认为是( )估计。

A 有效 B 一致 C 无偏 D 精确

25.虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来越接近总体参数,满足这种情况,我们就说该统计量对总体参数是一个( )的估计量。 A 有效 B 一致 C 无偏 D 精确

26.估计量的( )指统计量的抽样分布集中在真实参数周围的程度。 A 有效性 B 一致性 C 无偏性 D 精确性

27.抽自两个独立正态总体样本均值差(X1―X2)的抽样分布是( )。

22122122A N(μ1―μ2,n1―n2) B N(μ1―μ2,n1+n2) 22212212C N(μ1+μ2,n1―n2) D N(μ1+μ2,n1+n2)

28.两个大样本成数之差的分布是( )。

p1q1p2q2p2q2ppA N(1-2,

np1q11―

n2) B N(p1-p2,

n1+

n2)

p1q1p2q21q1p2q2C N(p1+p2,

n1―

np2) D N(p1+p2,

n1+n2)

29.为了检验两个总体的方差是否相等,所使用的变量抽样分布是( )。2A F分布 B Z分布 C t分布 D 分布

30.配对小样本的均值d的抽样分布是( )。

A Z分布 B 自由度为n的t分布 2C 自由度为(n—1)的t分布 D自由度为(n—1)的分布

31.在σ12和σ22未知,但可假定它们相等的情况下,σ的无偏估计量S是(n2nS21S12n2nS21S12n1n2A n1n22 B n1n22•

n1n2

n21n2122C n1n2 D

n1n2

五、计算题

)(一)

1.某工厂50名职工每周工资数分配情况如下表,试求: 1)平均差;2)第1及第3四分位数;

工资数(元) 60-62 63-65 66-68 69-71 72-74 合计 人数 3 10 20 13 4 50 1.平均差2.316;第一四分位数 65.35 第三四分位数 69.54 (二)

1.根据统计,北京市初婚年龄服从正态分布,其均值为25岁,标准差为5岁,问25岁到30岁之间结婚的人,其百分数为多少?

2.共有5000个同龄人参加人寿保险,设死亡率为0.1%。参加保险的人在年初应交纳保险费10元,死亡时家属可领2000元。求保险公司一年内从这些保险的人中,获利不少于30000元的概率。

3.为了验证统计报表的正确性,作了共50人的抽样调查,人均收入的结果有:

X871元,S21元,问能否证明统计报表中人均收入μ=880元是正确的(显著性水平α

=0.05)。

4.某单位统计报表显示,人均月收入为3030元,为了验证该统计报表的正确性,作了共100人的抽样调查,样本人均月收入为3060元,标准差为80元,问能否说明该统计报表显示的人均收入的数字有误(取显著性水平α=0.05)。

5.已知初婚年龄服从正态分布,根据9个人的抽样调查有:X23.5(岁),(岁)。S3问是否可以认为该地区平均初婚年龄已超过20岁(α=0.05)?

6.某地区成人中吸烟者占75%,经过戒烟宣传之后,进行了抽样调查,发现了100名被调查的成人中,有63人是吸烟者,问戒烟宣传是否收到了成效?(α=0.05)

7.据原有资料,某城市居民彩电的拥有率为60%,现根据最新100户的抽样调查,彩电的拥有率为62%。问能否认为彩电拥有率有所增长?(α=0.05)

8.一个社会心理学家试图通过实验来表明采取某种手段有助于增加群体的凝聚力。但有16个小组,将它们配对成一个实验组和控制组,实验组和控制组各有8个小组,问怎样用二项分布去检验无效力的零假设,列出检验所需的零假设,计算抽样分布,用显著水平0.05,请指出否定域。

1.【84.13%】 【34.13%】

已知μ=25,σ=5,z1=

x1=

2525=0 5z2=

x2=

3025=1 5P(z1≤Z≤z2)=P(0≤Z≤1)=0.3413

2.【98.75%】

3.不能,因为Z=-3.03<-1.96,所以否定原假设μ=880

4. 可以,因为Z=3.75〉1.96,所以可以拒绝原假设μ=3030,即可以认为统计报表有误

5.可以,因为t=3.2998〉1.8595,所以可以拒绝原假设μ=20,可以认为平均初婚年龄已超过20岁。

=0.05,Z1.65。Z6. H0.75,H10.75。

所以拒绝原假设,接受备择假设。

0.630.75=-2.77<-1.65.

0.75*0.25*/1007.不能,因为Z=0.408<1.65,所以接受原假设p=60%,不能认为彩电拥有率有所增长 8.在社会研究的实验法中,此为“双组实验设计”,其步骤是:1)用匹配或随机指派的方法将实验对象一半分到控制组一半分到实验组;2)对实验组实施实验刺激但不对控制组实施这种刺激;3)然后同时对控制组和实验组进行测量,即后测;4)在比较和分析两个组后测结果之间的差别,得出实验刺激的影响。由此,我们先将16个组两两匹配,得到8个配对组(要使每个配对组在除实验变量之外的其他方面尽量相似)。然后在每个配对组中任取一组安排于实验组,另一组安排于控制组。接着,在4-8年的时间内,让分到实验组的

8组人接受某种手段,如共同游戏,而控制组的8组人则没有这样做。而后对每个配对组分别进行后度测量,并用“+”号表示实验组比控制组好的那些配对组,用“-”表示实验组比控制组差的那些配对组。除非度量方法很粗燥,每配对组应该都能判断出差异。这样便可以用二项分布做实验无效的检验了。

H0:p=0.5,H1:p>0.5,选用0.1的显著性水平。P7P80.03910.1,

P6P7P80.1836>0.1,所以否定域由7个“+”和8个“+”组成,即对每配对组进

行后测度量,如出现7个“+”和或8个“+”时,在0.1的显著性水平上,我们将否定零假设,说明实验有效。否则就不能否定零假设,也就是说实验无效

(三)

1.某社区要选派8名积极申请参加公益活动的居民从事一项宣传活动。申请者为12名女性居民和8名男性居民。社区宣传活动的组织者把他们的名字完全混合后放在一个盒子里,并从中抽取8个。试问,抽出4名女性居民的概率是多少?

2.有16名二年级学生和14名三年级学生选修了社区管理课。假设所有学生都会来教室上课,而且是随机进入教室的。试问,当一名学生进入教室时,恰逢已在教室就坐的5位都是三年级的概率是多少?

1.0.275 2.0.0140 (四)

1.已知初婚年龄服从正态分布,根据21个人的抽样调查有:X23.5(岁),S3(岁),求置信水平为95%的初婚年龄的置信区间。(已知t0。05(21) =1.721、t0。05(20) =1.725、t0。025(21) =2.080、t0,025(20) =2.086)。

2.某工厂妇女从事家务劳动时间服从正态分布N(,0.66)。根据36人的随机抽样调查,每天平均从事家务劳动时间X为:X=2.65小时。求的双侧置信区间(置信度取0.95和0.99两种)。

3.根据某地100户的随机抽查,其中有60户拥有电冰箱,求该地区拥有电冰箱成数P的置信区间(置信度为0.95)。

21. 【22.10,24.90】

已知=0.05,t0,025(20) =2.086,

3S==0.67 n1211X±t/2S=23.5±2.0860.67=23.5±1.39762 n1置信区间为22.10和24.90之间 2. 【2.4344,2.8656】、【2.3662,2.9338】

z/2=1.96,X-Z/2已知=0.05,

【2.4344,2.8656】

0.66SS≤≤XZ/2,2.65±1.96=nn36z/2=2.58,X-Z/2已知=0.01,

【2.3662,2.9338】

3. 【0.5040,0.6960】

0.66SS≤≤XZ/2,2.65±2.58=nn36已知=0.05,z/2=1.96,置信区间为 (p-Z/2(五)

1.独立随机样本取自均值未知,标准差已知的两个正态总体。如果第一个总体的标准差为0.73,抽出的样本容量为25,样本均值为6.9;第二个总体的标准差为0.89,抽出的样本容量为20,样本均值为6.7。试问,两个总体的均值是否显著相等(α=0.05)?

2.对两所学校学生组织的社会活动获奖情况进行调查,发现甲校共组织60次,有18次获奖;乙校共组织40次,有14次获奖。据此,能否认为乙校获奖次数的比例高于甲校(α=0.05)?

3.为研究睡眠对记忆的影响,在两种条件下对人群进行了试验。(1)在早7点放电影,被测者晚上睡眠正常,第二天晚上就电影的50项内容进行测试;(2)在早7点放电影,被测者白天情况正常,同一天晚7点就电影的50项内容进行测试。样本是独立的,每组人数15人,测试结果为:X1=37.2个正确, S1=3.33,n1=15;X2=35.6个正确, S2=3.24,

pq,p+Z/2npq)0.6±1.96n0.6*0.4=【0.5040,0.6960】

100n2=15。假定两种条件下总体均服从正态分布,且方差相等,是否认为睡眠对记忆有显著影

响(α=0.05)?

1.Z=0.81<1.96, 接受H0:μ1―μ2=0 2.Z= —0.5253<1.96, 接受H0:μ1―μ2=0

3.(X1X2)=0.6618,t=2.4176>2.048,拒绝H0:μ1―μ2=0 ,认为平均的睡眠组的得分较高。 (六)

1.对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表;③指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。

年岁(X) Σ 态度(Y) 喜 欢 不喜欢 Σ

2.已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。 身高(cm) 体重(kg) 身高(cm) 体重(kg)

1.①相对频数的联合分布列联表

171 53 175 66 167 56 163 52 177 64 152 47 154 49 172 58 169 55 162 50 老 中 青 38 38 30 15 33 46 对于民族音乐的 对于民族音乐的 态度(Y) 喜 欢 不喜欢 Σ 年岁(X) Σ 老 中 青 0.19 0.19 0.15 0.075 0.165 0.23 ②转化为相对频数的条件分布列联表 对于民族音乐的 态度(Y) 喜 欢 不喜欢 Σ ③民族音乐的态度与被调查者的年岁有关系 2. 编号 身高体重 x2年岁(X) Σ 老 中 青 0.53 0.54 0.39 0.47 0.46 0.61 y2 xy (cm)x (kg)y 1 2 3 4 5 6 7 8 9 10 171 167 177 154 169 175 163 152 172 162 53 56 64 49 55 66 52 47 58 50 550 29241 27889 31329 23716 28561 30625 26569 23104 29584 26244 276862 2809 3136 4096 2401 3025 4356 2704 2209 3364 2500 30600 9063 9352 11328 7546 9295 11550 8476 7144 9976 8100 91830 合计 1662 rnxyxynx(x)22ny(y)220.89

ba=nxyxynx(x)220.659

nny=a+bx=-54.479+0.659xybx54.479

斯皮尔曼相关系数

rs1-6d2n(n2-1)0.94

【皮尔逊相关系数:0.889,斯皮尔曼相关系数:0.94,回归方程:Y=-54.48+0.66X】

3.为了研究职业与家庭子女数之间的关系,随机地抽出了41户家庭进行了调查,调查三种职业家庭的子女数的资料如下:

工人:1,3,4,4,6,2,3,4,3,5,2,4;

干部:3,5,0,5,4,4,2,3,1,3,2,3,3,2,4,2,6,1; 知识分子:6,4,2,2,3,0,5,3,1,2,1。 要求:(1)求三种职业家庭户均子女数; (2)求总变差、组内变差和组间平方和; (3)编制方差分析表;

(4)检验不同职业的生育观是否有显著的不同。 (5)计算职业与子女数量之间的相关比率。

3、 (1)、(2)略;(3)见下表;(4)由于Fo=0.72<F0.05 (2,38)=3.24,接受H0:不同职业的生育观没有显著的不同;(5)0.0381 组间 组内 总

SS 自由度 MS 统计量 临界值 显著性 3.5934 2 1.7967 0.72 3.24 94.4066 38 2.4843 98.000 40 (七)

1、一个学生数学期末成绩是84,该门功课成绩的平均分是76,标准差是10,他物理期末成绩是90,该门功课成绩的平均分是82,标准差是16,她在哪门功课中的名次更前? 84-76/10=0.8 90-82/16=0.5 数学成绩更靠前

2、为了研究某地居民用于请客送礼的费用,我们调查了该地区225户家庭,平均每个家庭每月支出43元,标准差为10.5,对该地区家庭平均每月请客送礼的花费进行区间估计。(显著性水平为0.05)[41.63,44.37]

3、现要考查某学校大一学生的英语水平,随机抽取120名学生的期末英语成绩作为样本,均值是56,样本标准差是18.5,是否可以认为该校学生英语成绩不及格(即小于60分)?(显著性水平为0.05)

4、已知某炼铁厂的含碳量服从正态分布N(4.55, 0.108),现在测定了9炉铁水,其平均含碳量为4.484。如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4.55 (=0.05) 。

5、为了了解男性和女性对体育运动的偏好,某民意测量机构专门做了一次调查,得到如下的一

取0.05的显著性水平,试检验男性与女性对体育运动项目的偏好是否存在显著的差异?

性别 男 女 最喜爱的运动项目 篮球 14 10 足球 24 11 羽毛球 13 13 高尔夫球 19 16 组资料:

0.052(3)=7.815

2=2.41,不存在显著差异

因篇幅问题不能全部显示,请点此查看更多更全内容