第一章 绪 论
思考题
1.
什么是统计学?请简要说明一下它的发展过程。
统计学是关于数据搜集、整理、归纳、分析的方法论科学。 统计学的发展主要经历了三个阶段:
(1) 17世纪中叶至18世纪,统计学的产生和形成阶段;
(2) 18世纪末至20世纪中叶,统计推断方法和理论体系确立的阶段; (3) 20世纪50年代以来,统计理论、方法和应用进入了一个全面发展的阶段。 2.
统计学、统计数据,以及统计活动之间有什么关系?
统计活动直接影响统计数据的数量和质量;统计学是统计实践活动的理论概括,同
时,它又用理论和方法研究分析统计实践活动,统计学和统计活动是理论与实践的关系。
3.
统计学的研究方法有哪些,它们有怎样的关系?并举例说明。
主要方法有两个:
(1) 描述统计:搜集由试验或调查所获得的资料,进行整理、归类,计算出各种用于说
明总体数量特征的数据,并运用图形或表格的形式将它们显示出来。
(2) 推断统计:指利用概率论的理论,根据试验或调查获得的样本信息科学地推断总体
的数量特征。
关系:描述统计和推断统计都是统计方法的两个组成部分,前者是统计学的基础,后者是现代统计学的主要内容。由于现实问题中,要获得总体数据存在很大的难度,能够获得的数据多为样本数据,因此,推断统计在现代统计学中的地位和作用越来越重要,它已成为统计学的核心内容。当然,描述统计的重要性不可忽略,通过它得到可靠的统计数据并为后面的推断统计提供有效的样本信息,只有这样,才可以运用推断统计方法得出符合实际情况的结论。 4.
简要说明总体、样本、变量的概念。
总体:根据一定的目的确定的所要研究对象的全体,它是统计问题最基本的要素; 样本:从总体中随机抽取的若干单位构成的集合体,它是统计问题的第二要素; 变量:可变的数量;变量的具体表现,即可变数量的不同取值,称为变量值。
---
-
5. 简述SPSS统计软件的特点和应用领域。
(1) 特点:
第一,工作界面友好完善、布局合理、操作简便,大部分统计分析过程可以借助鼠标,通过菜单命令的选择、对话框参数设置、点击功能按钮来完成,不需要用户记忆大量的操作命令。菜单分类合理,并且可以灵活编辑菜单以及设置工具栏。
第二,具有完善的数据转换接口,可以方便地和Windows其他应用程序进行数据共享和交换。可以读取Excel、FoxPro、Lotus等电子表格和数据库软件产生的数据文件,可以读取ASCII数据文件。
第三,提供强大的程序编辑能力和二次开发能力,方便高级用户完成更为复杂的统计分析任务的需要,具有丰富的内部函数和统计功能。
第四,附带丰富的数据资料实例和完善的使用指南,为用户学习掌握软件的使用方法提供更多的方便。软件启动后,用户可直接上网访问SPSS公司主页获得更多的帮助和信息。 (2) 应用领域:社会科学、自然科学、经济管理、商业金融、医疗卫生、体育运动等。
6.
SPSS软件的数据编辑器包括哪些内容?
(1) 标题栏,显示当前工作文件名称。 (2) 主菜单栏,排列SPSS的所有菜单命令。
(3) 工具栏,排列系统默认的标准工具图标按钮,此栏图标按钮可以通过单击View菜单的Toolbars命令选择隐藏、显示或更改。
(4) 状态栏,状态栏位于SPSS窗口底部,它反映了工作状态。当用户将光标置于不同的区域时或者进行不同的操作时将显示不同的内容。
(5) 数据编辑栏,用户通过键盘输入的数据首先显示在这里。
(6) 数据显示区域。它是一个二维的表格,编辑确认的数据都将在这里显示,其中每一个矩形格为单元格(Cell),其中边框加黑的单元格称为选定单元格。数据显示区域的左边缘排列观测量序号,上边缘排列要定义的各变量名。
7. 调查表明,顾客每周花在某超市蛋糕的平均费用是30元,他们选择经常购买蛋糕的主要原因是该蛋糕味道很好。要求:
(1) 总体是什么?
(2) 该项研究所使用的方法是描述统计方法还是推断统计方法? (1) 总体是所有的购买蛋糕的顾客; (2) 推断统计方法。
---
-
第二章 数据整理和描述
思考题
1. 获取统计数据有哪两种途径?
一种是直接向调查对象搜集反映调查单位的统计数据,一般称为原始数据或第一手数
据;另一种是搜集已经加工、整理过的、说明总体现象的数据,一般称为次级数据或第二手数据。
2. 统计数据的搜集有哪几种方法? 直接观察法、访问法、报告法、问卷法。
3. 对统计数据进行搜集时,有哪几种组织方式? 普查、抽样调查、重点调查、典型调查。
4. 什么是数据分组?数据分组的方式有哪几种?
(1) 统计数据分组是根据统计研究目的,按某一标志将数据分别列入不同的组,使组
与组之间有比较明显的差别,而在同一组内的单位具有相对的同质性,即同一组内各单位之间具有某些共同的特征。
(2) 统计数据分组可以按品质标志分组和按数量标志分组。
(一)按品质标志分组就是按照事物的性质和属性特征进行分组。一般来言,按品质标志分组的操作比较容易,分组也相对稳定。如人口按性别分组、职工按文化程度分组等;
(二)按数量标志分组,就是按照事物的数量特征进行分组。例如,企业按职工人数、产值、产量等标志分组,人口按年龄分组等。
5. 简述组距、组限、组数与组中值的含义以及它们的计算方法。
(1) 组距是指各组中最大变量值与最小变量值之差,用i表示。计算方法为: i=R/n, 其中,n表示组数,R表示变量最大值与最小值之差(即全距);
(2) 组限是指限定各组组距的数值。各组的较大值称上限,较小值称下限; (3) 组数是指数据被分成的组个数。计算方法为:
n13.322lgN
---
-
式中:n表示组数;N表示变量值个数;
(4) 组中值是上限到下限之间的中点数值,其计算公式为:
组中值=(上限+下限)/2
6. 向上积累和向下积累的数据有什么区别?
累计频数(或频率)可以是向上累计频数(或频率),也可以是向下累计频数(或频率)。(1) 向上累计频数(或频率),通常是指由变量值小的组向变量值大的组依次累计; (2) 向下累计频数(或频率),通常是指由变量值大的组向变量值小的组依次累计。
7. 什么是频数分布?试描述频数分布表的编制过程。
(1) 分布数列是指在统计分组的基础上,将总体的所有单位按一定标志分组整理,并按一定顺序排列,形成总体单位在各组的分布; (2) 一、确定变量数列的形式。
根据变量的类型和变量值的多少及现象本身的特点确定是编制单项数列还是编制组距数列。
二、组距式变量数列编制方法:
计算全距、确定组数、确定组距、确定组限、计算组中值、计算累计频数和累计频率。
8. 对统计数据进行描述时,有哪几种统计图表表达方式? 有统计表和统计图,其中统计图包括:直方图、折线图、曲线图。
9. 直方图和折线图有什么区别和关系?
折线图可以在直方图的基础上,将直方图的每个长方形的顶端中点用折线连点而成。如果不绘直方图,也可以用组中值与频数求出坐标点,连接而成。
它们与横轴围成的区域面积相等。
10. 请举出自己实际生活中的一组数据,对它进行分组,然后绘制直方图、折线图以及箱线图,分析该组数据的结构特征。 略
练习题
---
-
1. 某地区7月份的气温数据(单位:摄氏度)如下:
28 31 32 29 31 33 30 32 34 29 32 30 38 38 37 39 34 36 36 33 34 30 37 36 32 38 35 30 34 35 35 (1) 对以上数据进行适当的分组;
(2) 绘制直方图,说明该城市气温分布的特点。
解:(1) 频数分布如下:[28,30) 3;[30,32) 6;[32,34) 6;[34,36) 7;[36,38) 5;[38,40) 4;
(2) 直方图略。从直方图可以看出,该地区7月份气温集中在34~36摄氏度的天数最多,其次多的时间集中在30~32摄氏度或32~34摄氏度。
2. 某人的家位于城市的A地,工作单位位于城市的B地,为了确定A、B两地的车程,他记录了60天(来回共乘车120次)内往返于A、B两地所花的时间(单位:分钟),所得数据如下: 98 108 117 109 93 92 97 108 123 99 101 112 111 103 98 91 95 112 105 96 120 99 119 92 90 89 102 109 109 105 112 93 100 99 111 87 108 123 112 111 94 98 105 88 109 95 113 121 96 120 96 100 108 80 103 121 99 110 98 98 89 87 98 83 108 119 114 110 108 92 108 89 96 86 112 123 89 124 112 103 106 125 110 93 123 108 95 108 99 102 111 120 123 98 120 99 106 109 90 90 113 118 117 90 109 103 109 113 93 113 109 103 115 120 118 92 100 96 96 120 (1) 利用SPSS对以上数据进行排序。
(2) 以组距10进行等距分组,编制频数分布表,并绘制直方图。 解:(1) 略
(2) 频数分布表如下:[80,90) 10,[90,100) 37,[100,110) 33,[110,120) 25,[120,130) 15; 直方图略。
3. 某百货公司冬天连续60天的销售额数据如下(单位:万元): 372 369 338 372 403 353 321 380 286 331 357 347 328 302 309 308 329 383 318 326 368 329 349 333 ---
-
342 401 322 349 396 320 351 377 336 324 379 343 369 380 389 362 356 369 370 352 375 319 349 398 342 363 359 356 370 364 393 321 354 382 316 350 (1) 用SPSS对以上数据进行适当的分组,编制频率分布表。 (2) 计算出累积频数和累积频率。 (3) 绘制直方图和折线图。 解:(1)、(2)
分组 [285,300) [300,315) [315,330) [330,345) [345,360) [360,375) [375,390) [390,405) (3) 略。
4. 为评价某餐馆服务质量,随机调查了120个顾客对它的评价。评价服务质量的等级分为五种:A. 优;B. 较好;C. 中等;D. 较差;E. 极差。调查结果如下表所示: A D B D B A C B C B B A C A C A C C D C C C B C B B C D D D E C D C C E E C D D B C D B D C C A E E A B E B B D C D B A B E A B D A D C A B B E C A E A A C E C A C E C C D E B B D B E B E D D D D C B C A B D C E C B A E A B C D E A E B C E 频数 1 3 12 7 13 11 8 5 频率分布表 1/60 1/20 1/5 7/60 13/60 11/60 2/15 1/12 向下累积 1 4 16 23 36 47 55 60 向上累积 60 59 56 44 37 24 13 5 (1) 编制频率分布表;
(2) 绘制条形图,找出对该餐馆评价等级的分布。 解:(1) 频率分布表如下:
评价等级 A 频数 19 频率 19/120 ---
-
B C D E (2) 略
27 32 23 19 9/40 4/15 23/120 19/120 5. 某小学对该校四年级160位学生的数学成绩分组如下: 成绩 所占比例 60分以下 9.1% 60~70 14.4% 70~80 32.2% 80~90 29.3% 90~100 15% (1) 对该校四年级学生的成绩绘制直方图; (2) 根据直方图分析四年级学生的成绩分布特点。 解:(1) 略; (2) 左偏分布。
6. 为了确定灯泡的使用寿命(单位:h),在一批灯泡中随机抽取100只进行测试,所得结果如下: 688 693 692 688 727 706 698 708 701 700 717 697 683 689 708 692 696 729 707 716 696 664 712 683 749 691 666 694 692 728 703 681 733 685 673 747 698 681 690 719 729 721 717 702 651 699 658 695 708 685 704 720 683 741 696 682 674 685 691 709 726 677 707 698 689 698 697 706 722 691 725 679 718 713 736 700 693 661 712 684 699 695 671 676 690 710 710 735 715 705 713 691 701 702 694 722 668 665 706 718 (1) 利用SPSS对上面的数据进行排序;
(2) 以10为组距进行等距分组,构建频率分布表;
(3) 根据分组数据绘制茎叶图和箱线图,说明数据分布的特点。 解:(1) 略; (2) 频率分布表如下: 分组 频数 频率 ---
-
[650,660) [660,670) [670,680) [680,690) [690,700) [700,710) [710,720) [720,730) [730,740) [740,750) (3) 略。
2 5 6 14 26 18 13 10 3 3 1/50 1/20 3/50 7/50 13/50 9/50 13/100 1/10 3/100 3/100 ---
-
第三章 数据特征的度量
思考题
1. 数据分布的特征可以从哪些方面进行度量和描述?
(1) 数据集中程度度量的常用方法有均值(算术平均数)、调和平均数、几何平均数、
众数、中位数。
(2) 数据离散程度的测度方法,常用的有极差、内距、标准差及离散系数。
2. 简述中位数、四分位数、十分位数的概念,并举例说明。 中位数是将顺序排列的统计数据从中间分成相等的两部分;
四分位数就是将排序后的数据4等分的三个数值,每部分包含25%的数据,其中中间的四分位数就是中位数,其余两项分别为下四分位数(Q1)和上四分位数(Q3); 十分位数和百分位数分别是将排序后的数据10等分和100等分的数值。
3. 简述众数、中位数和均值的特点和关系。 (1) 关系:
当数据呈对称分布时,均值、中位数、众数必定相等,即有xMeMo; 当数据呈左偏分布时,均值小于中位数且小于众数,即有xMeMo; 当数据呈右偏分布时,均值大于中位数且大于众数,即有xMeMo;
(2) 特点:均值是根据所有数据计算的一般水平代表值,数据信息的提取足够充
分,特别是当用样本信息估计总体特征时,均值就更显示其良好的特征。因而在统计数据分析中均值起着很重要的作用。众数、中位数虽然数据信息利用不够充分,但当数据有极端值出现时,中位数的优势就显现了。
4. 简述内距、极差、标准差的概念,并举例说明。
(1) 内距:又称为四分位数差,是指上四分位数和下四分位数之差,通常用Qd表示; (2) 极差:也称全距,它是一组数据的最大值与最小值之差;
在组距式数列中,极差可以是最高组的上限与最低组下限之差; (3) 标准差:也称均方差,是各数据和均值离差平方平均数的平方根。
5. 什么是离散系数?为什么要计算离散系数?
(1) 常用的离散系数主要有标准差系数,也称均方差系数,它是数据的标准差与其相应
---
-
的均值之比;
(2) 原因:总体和样本的离散程度除了受变量值之间的离散程度影响外,还受变量值本身水平高低的影响,因此,在比较不同总体和样本的离散程度时,应消除由于变量值水平不同或计量单位不同带来的影响。在统计分析中,用离散系数来比较不同总体和不同样本的均值的代表性。
6. 简述偏度和峰度的概念。
偏度:偏度是对分布偏斜方向及程度的度量;
峰度:是对数据分布尖峭程度的度量,它可以衡量频数分布的集中程度。
练习题
1. 对某公司28位员工的年龄进行统计,得到数据如下(单位:周岁):
28 29 32 22 23 46 42 23 29 40 26 30 32 37 44 25 42 30 24 43 25 33 33 31 39 27
(1) 计算员工年龄的众数、中位数和平均数; (2) 计算标准差;
(3) 绘制员工年龄的茎叶图,说明员工年龄的分布特征。 解:(1) 众数:25,中位数:30,平均数:x=S28=88728=31.6786; (2) 7.2011; (3) 略。
2. 某地区7月份上半月的气温数据如下(单位:摄氏度):
35 37.5 28 32 37 39 37 36.5 33 35 37 29 27 30 31 (1) 计算该地区7月份上半月气温的众数、中位数和算术平均数; (2) 计算几何平均数; (3) 计算气温的标准差;
(4) 绘制直方图,说明气温分布的特点。 解:(1) 众数:37,中位数:35,算术平均数:x=S15=50415=33.6; (2) 几何平均数:G153537.5L312.671011;
(3) 3.874; (4) 略。
---
25 27
-
(将第3题改成了分组数据)
3. 某百货公司冬天连续60天的销售额数据分组如下(单位:万元): 按销售额分组(万元) 280~290 290~300 300~310 310~320 320~330 330~340 340~350 350~360 试计算该组数据的平均数、中位数、众数。 解:(1)
频数(fi) 1 3 9 10 13 11 8 5 组中值(xi) 285 295 305 315 325 335 345 355 x325.1667,
(2)由N/230确定中位数在320~330组内,故60-232Me320+*10325.3846,13
(3)由题中数据分布知,众数在出现次数最多的320~330组内,故
Mo320+s=
13-10*10326.
(13-10)+(13-11)4. 一项对大学生身高状况的调查表明,男生的平均身高为175cm,标准差为5cm,女生的平均身高为165cm,标准差为5cm。试问是男生的身高差异大还是女生的身高差异大? 解:比较男、女生身高的离散系数,
女55v男===0.02857,v女===0.0303,
x男175x女165v男v女,故女生的身高差异大。
5. 对10名男生和10名女生的体重(单位:Kg)进行抽样调查,结果如下: 男生组 女生组 64 52 56 54 60 45 62 50 68 48 54 47 52 54 60 55 65 46 61 50 男(1) 现在要比较男生和女生的体重差异,应采用什么方法?
---
-
(2) 比较分析哪一组的体重差异大? 解:(1) 采用离散系数进行比较; (2)
男602x男==60.2,男=5.0067,v男==0.0832,
10x男女501x女==50.1,女=3.573,v女==0.0713,
10x女由于v男>v女,故女生组体重差异大。(男生组体重差异大)
6. 一种机器由多个零组件组成,在使用之前需要人工组装,现在有四种组装方法,为选取最好的方法,随机抽取10个工人,由他们分别用四种方法进行组装。工人们分别采用四种方法组装的机器数量(单位:台)如下:
方法A 92 93 90 85 89 91 87 82 83 90 方法B 65 69 59 60 62 67 56 58 63 62 方法C 82 88 78 70 79 83 85 80 79 78 方法D 79 73 69 70 75 68 65 70 72 71 试采用一种你认为比较好的方法来评价组装方法的优劣。 解:下表给出了一些主要描述统计量:
平均数 中位数 众数 标准差 极差 方法A 88.2 89.5 90 3.795 11 方法B 62.1 62 62 4.0675 13 方法C 80.2 79.5 78、79 4.8488 18 方法D 71.2 70.5 70 3.8816 14 ---
-
最小值 最大值
82 93 56 69 70 88 65 79 7. A、B、C三个工厂生产3种产品的单位成本和总成本资料如下(单位:元): 产品名称 甲 乙 丙 单位成本 7 11 18 A工厂 3410 4000 3890 总成本 B工厂 2000 5200 5420 C工厂 4150 3820 3000 试比较三个工厂哪一个总平均成本高? 解:比较三个工厂的总平均成本:
3410400038901130010.592,
3410400038901066.89017111820005200542012620xB11.911,
2000520054201059.55217111841503820300010970xC9.911,
4150382030001106.796771118xA故B工厂总平均成本最高。
(将第8题删除)
8. 一应试者准备参加某公司的招聘测试,该测试分三个过程,在A项测试中,其平均分
数是120分,标准差为20分;在B项测试中,其平均分数是360分,标准差为40分,在C项测试中,其平均分数是500分,标准差为60分。这位应试者参加测试后,在A项测试中考了125分,在B项测试中得了380分,在C项测试中得了530分。与平均分数相比,该应试者哪一项测试更为理想? 解:通过计算标准化值来判断,
ZA1251203803605305000.25,ZB0.5,ZC0.5, 204060说明在A项测试中该应聘者比平均分数高出0.25个标准差,而B、C项测试中均高出0.5
个标准差,由于B、C测试的标准化值A项测试,所以B、C项测试比较理想。
(将第9题删除或者放在第2章作为计算调和平均数的例子) 9. 两个菜场有关销售资料如下:
---
-
绿叶蔬菜 A B C 单价(元/公斤) 5 5.6 7 甲市场的销售额(元) 2200 1960 1500 乙市场的销售量(公斤) 330 350 430 试计算比较两个菜场价格的高低,并说明原因。 解:x甲=2200+1960+15005660 ==5.636,2200196015001004.2857++55.673305+3505.6+43076620 x乙===5.964,330+350+4301110故乙菜场平均价格较高。
原因:尽管两个菜场的单价相同,但单价较低的蔬菜在甲菜场的销售量中所占比重较大,故拉低了其平均价格。
10. 某班学生《统计学》考试成绩表如下: 成绩(分) 50~60 60~70 70~80 80~90 90~100 合计 试计算该班学生的平均成绩。
解:这里是分组数据,取组中值为代表,
频率(%) (f) /f 6.7 13.3 30.0 36.7 13.3 100.0 x=556.7%+6513.3%+7530.0%+8536.7%+9513.3%=3.685+8.645+22.5+31.195+12.635=78.66.
x<-c(55,65,75,85,95)
f<-c(.067,.133,.30,.367,.133) > sum(x*f) [1] 78.66
> sqrt(sum((x-78.66)^2*f)) [1] 10.79835
> sqrt(sum((x-78.66)^2*f*100)/99) [1] 10.85275
---
-
第四章 统计指数
思考题
1. 什么是统计指数?统计指数与数学上的指数函数有何区别? (1) 统计指数:是表明复杂现象综合变动的相对数; (2) 统计指数与数学上的指数函数是两种完全不同的概念。
2. 统计指数的种类有哪些?
统计指数可以按不同的角度作不同的分类:
(一) 指数按其反映的对象范围的不同,可以分为个体指数和总指数;
(二) 指数按其所反映的社会经济现象特征的不同,分为数量指标指数和质量指标指数; (三) 指数按其采用基期的不同,分为定基指数和环比指数; (四) 指数按其对比内容的不同,分为动态指数和静态指数;
(五) 指数按照常用的计算总指数的方法或形式,可以分为综合指数和平均指数。
3. 综合指数和平均数指数有何区别和联系?
(1) 综合指数是以“先综合,后对比”的方式来编制得到的,就是将对比指标加总之后进
行对比的结果;
(2) 平均指数是以“先对比,后平均”的方式编制得到的,就是对个体指数进行平均的结
果。
4. 什么是拉式指数和帕氏指数?
(1) 拉氏指数是将同度量因素固定在基期水平上,因此也称基期综合指数,公式具体形式如下:
Lppqpq1000, Lqqpqp1000;
(2) 帕氏指数将同度量因素固定在报告期水平上,因此也称报告期综合指数。公式具体形式如下:
Pp
5. 为何要建立指数体系?指数体系有哪两种不同的含义?
---
pqpq1101, Pqqp. qp1101-
(1) 在经济分析中,一个指数通常只能说明某一方面的问题,而实践中往往需要将多个指
数结合起来加以运用,这就需要建立相应的指数体系。
(2) A. 广义的指数体系类似于指标体系的概念,泛指由若干个内容上相互关联的统计指数
所结成的体系;
B. 狭义的指数体系仅指几个指数之间在一定的经济联系基础上所结成的较为严密的数量关系式。
6. 试举一日常生活中的实例来进行总量变动的因素分析。
略
7. 目前常见的经济指数有哪几种?
常用的经济指数有:居民消费价格指数、生产者物价指数(PPI)、股票价格指数、零售价格指数、农副产品收购价格指数。 练习题
1. 某工厂共生产三种不同的产品,其产量、成本和销售价格数据如下: 商品名称 计量单位 基期产量 产量 甲 乙 丙 台 个 件 29 300 198 33 280 230 报告期 单位成本 720 380 45 销售价格 850 450 60 计算下列指数:把(1)删除,只保留(2)
分别以单位产品成本和销售价格为同度量因素,编制该工厂的产量指数,并比较说明两种产量指数具有何种不同的经济分析意义。 解:以单位产品成本为同度量因素得
Pq=qcqc1101=33720+280380+23045140510==0.9772,
29720+300380+19845143790以销售价格为同度量因素得
qpP=qpq0111=33850+280450+23060167850==0.9785.
29850+300450+19860171530同度量因素不同,以致在计算过程中产量的权数不同。
2. 某市场上四种水果的销售资料如下表:
---
-
品种 销售量( kg ) 基期 报告期 890 572 698 800 2960 销售价格(元/ kg) 基期 5.80 5.50 4.80 3.60 — 报告期 6.00 5.80 5.10 3.40 — 苹果 葡萄 荔枝 香蕉 合计 计算下列指数:
800 520 608 746 2674 (1) 用拉式公式编制四种水果的销售量指数和价格指数。 (2) 用帕式公式编制四种水果的销售量指数和价格指数。 (3) 比较两种公式编制出来的销售量指数和价格指数的差异。
qp解:(1) L=qp1q000=8905.8+5725.5+6984.8+8003.614538.4==1.1095,
8005.8+5205.5+6084.8+7463.613104Lp=pqpqq1000=6800+5.8520+5.1608+3.474613453.2==1.0266;
5.8800+5.5520+4.8608+3.674613104=8906+5725.8+6985.1+8003.414937.4==1.11,
8006+5205.8+6085.1+7463.413453.2qp(2) P=qp0111Pp=pqpq1101=6890+5.8572+5.1698+3.480014937.4==1.027;
5.8890+5.5572+4.8698+3.680014538.4(3) 二者差异不大,帕式指数比拉式公式稍微大一些。
3. 某基层供销社向农民收购农产品的有关资料如下表: 农产品名称 报告期收购价格占基期的% 实际收购额(千元) 基期 甲 乙 丙 丁 要求:
(1) 计算农产品收购价格总指数,以及由于收购价格提高使农民增加的货币收入是多少? (2) 计算农产品收购量总指数,以及由于收购量的变动给农民货币收入带来的影响; (3) 计算报告期收购额与基期收购额的发展速度,及其变动差额。
---
报告期 1360 920 416 140 110 115 125 140 1200 800 320 80 -
解:(1)Ippq10pq1.112001.158001.253201.48027521.1467,
1200800320802400pqpq27522400352;
1000001360920416140q1p01.11.151.251.42469.16361.0288, (2)Iq2400q0p0120080032080qpqp10002469.1636240069.1636;
(3)136092041614028361.1817,
1200800320802400变动差额为:2836-2400=436千元。
4. 利用指数体系之间的关系回答下列问题:
(1) 某企业今年与去年相比,各种产品的产量增长了10%,总生产费用增长了15%。试问:该企业今年的单位成本有何变化?
(2) 某企业今年职工平均工资水平提高了10%,职工人数增加了3%,问该企业工资总额增长了多少?
解:(1) 设去年的单位成本为1,那么今年的单位成本为
1+15%1.15==1+4.55%,
1+10%1.1比去年的单位成本增加了4.55%;
(2) 设该企业去年的工资总额为1,那么今年的工资总额为
(1+10%)(1+3%)=1.11.03=1+13.3%,
比去年工资总额增加了13.3%.
5. 设有四种金融业类股票的价格和发行量数据如下: 股票名称 价格/元 前收盘 甲 乙 丙 丁 3.29 12.03 13.12 16.47 本日收盘 3.06 12.56 14.02 16.45 250000 7500 9000 1230 发行量/万股 计算股票价格指数,并对股价指数的变动作简要分析。 解:
---
-
Ip=pqpq1ii0ii=3.06250000+12.567500+14.029000+16.4512301005613.5==0.9568,3.29250000+12.037500+13.129000+16.4712301051063.1即股票价格指数下降了4.32%.
6. 某商场出售三种商品销售资料如下表所示: 商品 名称 计量 单位 销售量q 基期q0 报 告 期 q1 甲 乙 丙 合计 试计算:
(1) 三种商品销售额总指数; (2) 三种商品的价格综合指数; (3) 三种商品的销售量综合指数;
(4) 分析销售量和价格变动对销售额影响的绝对数和相对数。 解:在表中把最后两列补上, (1) v(2)
台 件 吨 — 100 250 400 — 120 300 600 — 基价格p(元) 期报 告 期 p1 82 20 50 8000 4500 16000 9840 6000 30000 销售额(元) p0q0 p1q1 p0 80 18 40 — pqpq110111009840600030000458401.6084;
800045001600028500Ippqpq4584045840458401.1754;
12803001860040960054002400039000390001.3684;
28500(3) Iqpqpq0100(4) 从绝对变动水平来看,
销售额变动p1q1p0q0458402850017340,价格变动的影响额=p1q1p0q145840-39000=6840,
销售量变动的影响额=p0q1p0q039000-28500=10500,三者之间的数量关系为 17340(元)=6840(元)+10500(元),
即报告期与基期相比,该商场出售的3种商品的销售额增加了17340元,其中由于价格变动使销售额增加了6840元,由于销售量变动使销售额增加了10500元。
---
-
三者之间的数量关系为 1.6084=1.17541.3684,
即报告期与基期相比,该商场出售的3种商品的销售额提高了60.84%,其中由于零售价格的变动使销售额提高了17.54%,由于销售量的变动使销售额提高了36.84%.
---
-
第五章 1 (1)21022(元)。x服从N45,2分布。故 n2541.0845x4548.9245P41.08x48.92P
2222(1.96)10.95(2)YEXCEL)
2 (1)均值为20,标准差(2)三倍标准差为6。 (3)与无关。
x:t(24),用t分布求P1.96Y1.96=1-0.0617=0.9383。(计算可用
s/nn162。 8ˆS32.9/93.66,x3 x47.9(克),
4 (1) 分组 组中值(xi) 650~670 660 670~690 680 690~710 700 710~730 720 730~750 740 合计 7 20 44 23 6 100 -40.2 -20.2 -0.2 19.8 39.8 灯泡数(ni) xix 222n3.660.605(克) 10xxinini70020700.2(小时),S2100xixn2ni37996383.80。 99S383.8019.60,重复抽样误差x(2)灯泡合格率抽样误差为: 重复抽样p
---
S2383.601.959(小时) n100p(1p)0.93(10.93)2.55% n100-
5 (1)总平均工资:x2560560720800880704(元),总体方差
5(560704)2L(880704)216384,总体标准差128(元)。
5(2) 样本平均工资 560 640 680 720 760 800 840 880 合计 (3)样本平均工资平均数:
频数 4 4 4 5 2 3 2 1 25 频率 0.16 0.16 0.16 0.2 0.08 0.12 0.08 0.04 1 E(X)(56046404L8801)/25704(元),与总体平均数相等。
(4)抽样误差:
2n1638490.5197(元) 2样本平均工资的标准差:
2x122(560704)4L(880704)18192 25x819290.5197(元),相等。
(5)不重复抽样时: 样本平均工资 560 640 680 720 760 800 840 合计
样本平均工资平均数:
频数 2 4 4 4 2 2 2 20 频率 0.1 0.2 0.2 0.2 0.1 0.1 0.1 1 E(X)(56026404L8402)/20704(元),与总体平均数相等。
抽样误差:
---
-
2NnnN1163845278.3837(元) 251样本平均工资的标准差:
2x122(560704)2L(840704)26144 20x614478.3837(元),仍然相等。
6设最大平均载重为z。已知70,x6/182。
xzz701(0.995)2.575 。即P(xz)P0.005x2x故z73.64,18z1325.551326(千克)
7 0.157,(1)4000.000331,(1)4000.018。p:N(0.157,0.0182)
p0.1570.1550.157P(p0.155)P1(0.1111)(0.1111)0.54380.0180.018 8
12n122n275.2,x1x212500,故服从N(12500,75.2)正态分布。
9 作P-P图,数据基本在对角线上。故正态。
第六章 参数估计 1 (1)x210.521.5(元) n49(2)z=1.5*1.96=2.94(元)
(25.52.94),即(22.56,28.44)元。
2 (对应例6.2,用不重复抽样) n=25,根据样本数据计算得:x105.36,1- = 95%,查标准正态分布表得 z=1.96。总体均值在1-置信水平下的置信区间为:
/2---
-
Nn1012025105.361.96251nn125 105.367.80xz297.56,113.16
3 (1)X560(元)
(524560)24L(660560)23ˆs1074.2857
4922s21074.2857x4.6353
n50(2) Xzx5601.964.63535609.0852,即[550.91,569.09]。 4 tX~t(n1),由实验数据,X45.75,n=10,S=3.5218,
s/nt/2(n1)t0.025(9)2.262。故置信区间为X2.262S/n,即(43.230,48.269)。
5
x1x2z/2 6
126.7426.49281.9680.9878(7.0122,8.9878)(元)n1n2400300222(n11)S12(n21)S2x1x2t/2(n1n22)n1n2211n1n219410.9219413.92700t0.025(38)38
7 xy6,z/211700264.01(6736,7264)元2020ˆ12n1222ˆ2n21.9664362.458 7550x1x2z/2
---
12n1n262.458(3.452,8.458)
-
228 x0.14125,y0.1392,s1/32.75e6,s2/41.04e6
v2.751.04222.751.043425.155,t0.025(5)2.5076
2.75e61.04e63.79e6,2.50763.79e60.0049
xy0.00490.02050.0049(0.0156,0.0254)
9用匹配样本,两组产量之差为 6,8,-2,2,7,1,1,7。故xy3.75。Sd3.6936
S21.9491.396,t0.025(7)2.3646。 nS2故xyt0.025(7)。 (3.753.30),即(0.45,7.05)
n
10 p=50%,p(1p)0.025,1.96*0.025=0.049。 n故得 504.9(45.1,54.9)。
11 p1p210%,标准差p1(1p1)p2(1p2)0.40.60.70.30.0424 n1n2250250z/21.96,4.24%1.968.31%。故置信区间为:10%8.31%=(1.69%,18.31%)。
12 13
22(n11)S12(n21)S2S12/S220.8935,F2/222:F(n11,n21),S12/S21(n11)2(n21)1/220.025(8)2.18,20.975811811(8)17.535,故置信区间为17.535,2.18(7.4,21.1) F0.025(9,9)4.03,F0.975(9,9)1/F0.025(9,9)0.2481。
22S12/S2S12/S2,故[0.222,3.601]
F0.025(9,9)F0.975(9,9)---
-
2ˆˆz1.9620.5(10.5)/2p(1p)385 14 p=0.5时方差最大,n20.052
15已知σ2=1800000,α=0.05,查表得z/2=1.96,E=500,则
22Z2n2E21.9621800000 27.6528(个)2500应抽选28家商店作样本。
11052ˆS(xix)2ˆx2,16 。t0.05(9)1.8331,
9i1922SS5211.3934。 g0.7601,t0.05(9)9nn10故 xt0.05(9)S(0.6066,3.3934)。 n220.025(9)2.7,0.975(9)19.023,故标准差置信区间为
5252,(1.653,4.389),或方差区间为(2.73,19.26)
19.0232.7
17 均值174.44,置信区间(173.14,175.74)
第七章 假设检验
1、(1)H0:01.9;H1:01.9。
2(2)x2.225,S0.2687,S=0.5183。t故拒绝原假设。
2 H0:04.55,H1:0。Unx02.508,t0.05(15)1.7531,
Sx00/n4.0044.5512.21,而
0.10/50.0251.96,故拒绝原假设。即生产异常。
---
-
3 H0:02000,H1:0。tx0S/n1000.8895,
490/19|t|t0.005(19)2.861,故接受原假设。
4 H0:012,H1:012。Ux03.08,0.051.65。故
0/nU0.05,拒绝原假设。
5 (1)差序列:-1.8 -1.8 -2.9 -2.9 -5.9 -6.7 -4.7 -1.6 -0.6 -3.1
d3.2,sd1.978 H0:d0,H1:d0
t
d0S/n5.116,|t|t0.01(9)2.8214,故拒绝原假设。
2222(2)s13.325,s22.225,s1/s21.49。F0.05(9,9)3.181.49,故不拒绝原假
设,即认为方差相等。
(3)H0:12;H1:12。
2(101)s12(101)s2S2.775,t0.01(18)2.552
101022p
x1x24.295<-2.552,故拒绝原假设,即认为有显著改进。
11Spn1n2
2S12S20.5720.4820.051 6 H0:21,H1:21。x2x10.09,n1n22202050.951.645,
x2x1SSn1n221221.7640.95。故拒绝原假设。B的平均重量大。
---
-
7 H0:21,H1:21。统计量:zx1x2(n11)S(n21)S11n1n22n1n22122
z8(121)g8(161)g611121621216223.03,
自由度 v8822/126/162222/121162/161519.6720,t0.025(20)2.086 8 H0:215,H1:215。xy4.4, zx1x2122S12S2n1n24.450.820.62100500.65.145<Z0.0052.58,故拒绝原 0.1166假设,装配时间之差小于5分钟。 9 H0:pp010%,H1:pp0。p=0.15,Zpp00.150.11.05。 p0(1p0)0.10.940nZ0.051.635Z。故接受原假设,可以认为次品率不高于10%。 10 H0:12,H1:12。 p1znpnp155815580.1359 0.126,p20.139。p1122n1n2119418119418p1p211p(1p)n1n20.0130.365>Z0.051.645 0.0356故接受原假设,养猫无显著影响。 11 H0:00.048;H1:0。2(n1)S22013.44。 220.05(4)9.448,20.05(4),故拒绝原假设,总体的标准差放大了。 --- - 12 (1)不拒绝原假设,方差相等。 (2)不拒绝原假设,两班无显著差异。 (3) 两班合在一起,H0:012,H1:0。x77.9,S=14.576。 2(n1)S220222(49)70.22,0.005(49)78.33,20.005(49)故不72.295,0.025能拒绝原假设,教学质量稳定。 第八章 方差分析 1 ANOVA sell Between Groups Within Groups Total Sum of Squares 174008.000 214958.000 388966.000 df 2 33 35 Mean Square 87004.000 6513.879 F 13.357 Sig. .000 有显著差别。 2 方差来源 组间(SSA) 组内(SSE) 总方差(SST) 3 ANOVA day 离差平方和 4095.6 1085.2 5180.8 自由度 3 16 19 F比 20.1 临界值 F0.05(3,16)3.24 Between Groups Within Groups Total Sum of Squares 70.429 137.737 208.167 df 2 27 29 Mean Square 35.215 5.101 F 6.903 Sig. .004 F0.05(2,27)3.35,故显著。 4由已知,r=4,s=3,需检验假设H01,H02,经计算得方差分析表。 --- - 表 方差来源 温度作用 铜含量作用 试验误差 总和 平方和 64.58 60.74 5.43 130.75 自由度 3 2 6 11 均方和 21.53 30.37 0.905 F比 23.79 33.56 由于F0.01(3,6)=9.78 5 样本 列 交互 内部 总和 SS 174.05 92.45 0.05 63.2 329.75 DF 1 1 1 16 19 MS 174.05 92.45 0.05 3.95 F 44.0633 23.4051 0.0127 P-Value 0.0000 0.0002 0.9118 临界值 4.494 4.494 4.494 时段与路段显著,交互不显著。 6 方差来源 组间(SSA) 组内(SSE) 总方差(SST) 7 离差平方和 46.237 48.372 94.609 自由度 4 15 19 均方 11.56 3.2248 F比 3.5845 临界值 F0.05(4,15)3.06 方差分析 差异源 SS df MS F P-value F crit 行 196.15 3 65.38333 21.14825 4.41E-05 3.490295 列 25.3 4 6.325 2.045822 0.151625 3.259167 误差 37.1 12 3.091667 总计 258.55 19 第九章 相关分析与回归分析 1 r=0.697,tn2r1r28g0.69710.69722.75t0.025(8)2.306 --- - 2 (1)成线性关系;(2)r=0.949; (3)回归方程:y0.11810.0036x ˆ(4)SSE=1.843,22SSE0.4799 8(5)r0.9490.9,或 SSR16.6820.9 SST18.529ˆln2r8g0.9491xx(6)t8.509t0.995(8)3.355,很显著。 2ˆ0.11r(7)0.118+0.0036*1000=3.718 (8)3.7181.183[2.535,4.901] ˆ9.88; 3 (1)y=63.07+34.93x;(2)R0.5118;(3)ˆln2r1xx(4)t2.355t0.025(8)2.306,显著。 2ˆ1r1(x0x)2ˆ0t0.025(8)ˆ19825.3272.68,123.32 (5)ynLxx 4 (1)y12.83260.5803x10.7624x2;(2)3.33534亿吨。 5 r=0.2;不存在线性相关关系。从散点图,判断可能有二次相关关系。 2y712.1052.391x0.00165x2,R20.96 方差分析 回归分析 残差 总计 6 (1)y21.826.33x1,r0.55; (2)y143.827.63x12.67x2,r0.61; 2(3)二元模型更优;(4)x112.720.18x2,r0.973;两自变量相关性很高(多重 22 df SS MS F Significance F 2 913.0769 456.5385 125.4877 9.11E-07 8 29.1049 3.638112 10 942.1818 共线性)。 --- - 第十章 时间序列分析 思考题 1. 什么是时间序列?时间序列有哪些种类? (1) 时间序列就是将某一指标在不同时间上的数值,按照时间的先后顺序记录,并排 列而成的数列,也称为动态数列; (2) 绝对数时间序列、相对数时间序列和平均数时间序列。 2. 什么是基期和报告期? 在对各个时间的发展水平进行比较时,把作为比较基础的那个时期称为基期,把所研究 考察的那个时期t称为报告期, 3. 请简述发展速度、增长速度,以及平均发展速度、平均增长速度的概念。 (1) 发展速度是时间序列中报告期水平与基期水平之比; (2) 增长速度是指增长量与基期水平之比; (3) 平均发展速度是各个时期环比发展速度的序时平均数; (4) 平均增长速度是现象逐期增长的平均程度。 4. 影响时间序列的主要因素有哪些? 长期趋势、季节变动、循环变动、不规则变动。 5. 时间序列长期趋势的测定方法有哪些?并分别简述它们的概念。 时间序列长期趋势测定常用的方法有移动平均法、指数平滑法和趋势模型法; (1) 移动平均法是用一定时间间隔内的平均值作为某一期的修匀值,从而消除时间序 列中的不规则变动以及其他变动,从而揭示出时间序列的长期趋势; (2) 指数平滑法是通过计算一系列指数平滑值消除不规则变动,揭示(预测)现象的 基本趋势; (3) 趋势模型法是根据时间序列的指标值的发展变化趋势,在平面直角坐标系中找到 距离所有观测点(t,xt),t1,2,L,n的平均距离最小的一条理想趋势线。 6. 什么是时间数列的季节性变动?季节变动数列的预测有哪些方法? (1) 季节变动是指时间序列受自然因素或社会因素的影响,而形成的在一年内有规律的 --- - 周期性变动; (2) 常用的预测方法:按月平均法、趋势剔除法。 7. 什么是时间数列的循环变动? 循环变动往往存在于一个较长的时期中,是从低到高,又从高到低的周而复始的近乎规 律性的变动。 练习题 1. 某地区国民生产总值在2000-2003年平均每年递增11%,2004-2007年平均每年递增9%。 试计算: (1) 问2007年与2000年相比,该地区国民生产总值共增长多少? (2) 该地区国民生产总值在这8年间发展的平均增长速度是多少? (3) 若2000年国民生产总值为70亿元,按(2)的平均增长速度,2007年的国民生产总值应为多少? 解:(1) 由于93.05%. x2007=(1+11%)3(1+9%)4=(1+93.05%),故该地区国民生产总值共增长x2000x2007=(1+11%)3(1+9%)4=(1+93.05%)=(1+G)7,(2) x2000 G=71.9305-1=9.8525%.(3) 2007年的国民生产总值应为70(1+9.8525%)=135.14(亿元). 2. 某地区彩电制造厂2005年产量为100万台。 (1) 若规定2006-2007年年递增速度为9%,2008-2009年年增长速度为8%,那么2009年该厂彩电产量是多少? (2) 若2007年的彩电总产量为130万台,以后每年的平均增长速度为8.5%,那么2011年可达到多少? (3) 如果2010年的彩电制造量为180万台,求5年的年平均增长速度。 解:(1) 2009年的彩电产量为100(1+9%)(1+8%)=138.58(万台). (2) 2011年可达到130(1+8.5%)=180.1616(万台). (3) 5年的平均增长速度为 G54227180112.4746%. 100--- - 3. 某地区2001年-2006年居民消费水平资料如下: 年份 2001年 2002年 2003年 2004年 2005年 2006年 每人平均消费水平(千元) 123 134 156 159 149 205 要求:计算2002年—2006年居民每人平均消费水平的平均增长速度。 解:G 4. 某股票公司近15年股票的每股收益如下(单位:元): 0.42 2.02 0.48 0.53 0.62 0.70 0.85 0.91 1.05 1.10 1.29 1.47 1.85 2.49 2.53 5205151.66671=10.7571%. 123试用移动平均法预测该股票公司下一年的收益。 解:k=3时,下一年的收益为: 2.02+2.49+2.53=2.3467(元), 31.47+1.85+2.02+2.49+2.53k=5时,下一年的收益为: =2.072(元)。5 5. 下表是某百货公司过去一年的营业额数据(单位:千万元): 月份 1 2 3 4 5 6 营业额(千万元) 9.21 9.04 8.56 8.6 7.93 7.89 月份 7 8 9 10 11 12 营业额(千万元) 8.34 8.29 8.1 7.89 8.6 9.09 (1) 绘制时间序列图描述其形态。 (2) 用3期移动平均法预测第二年1月份的营业额。 (3) 采用指数平滑法,分别用平滑系数0.3,0.5预测第二年1月份的营业额,分 --- - 析预测误差,说明用哪一个平滑系数预测更合适? 解:(1) (2) 用10、11、12月的营业额平均值作为第二年1月份营业额的预测值, 7.89+8.6+9.09 8.5267(千万元)。3(3) 指数平滑法计算表如下: 月份t 营业额xt 9.21 9.04 8.56 8.6 7.93 7.89 8.34 8.29 8.1 7.89 8.6 9.09 — — 0.3 %xt — 9.21 9.159 8.9793 8.86551 8.584857 8.3764 8.36548 8.342836 8.26998 8.15599 8.2892 8.529435 — 0.5 %xt — 9.21 9.125 8.8425 8.72125 8.325625 8.1078 8.2239 8.25695 8.17848 8.03424 8.31712 8.70356 — %|xtxt| — 0.17 0.599 0.3793 0.93551 0.694857 0.0364 0.07548 0.242836 0.37998 0.44401 0.8008 — 4.758173 %|xtxt| — 0.17 0.565 0.2425 0.79125 0.435625 0.2322 0.0661 0.15695 0.28848 0.56576 0.77288 — 4.286745 1 2 3 4 5 6 7 8 9 10 11 12 预测 合计 由于4.286745<4.758173,故当0.5时预测更合适。 6. 下表是某地区7月份前30天的气温数据(单位:摄氏度): 日期 气温 --- 日期 气温 日期 气温 日期 气温 日期 气温 - 1 2 3 4 5 6 28 31 32 29 31 33 7 8 9 10 11 12 30 32 34 29 32 30 13 14 15 16 17 18 38 38 37 39 34 36 19 20 21 22 23 24 36 33 34 30 37 36 25 26 27 28 29 30 32 38 35 30 34 35 (1) 绘制时间序列图描述其形态。 (2) 用5期移动平均法预测7月份最后一天的气温。 (3) 采用指数平滑法,分别用平滑系数0.3,0.5,0.6预测7月份最后一天的气温,分析预测误差,说明用哪一个平滑系数预测更合适? 解:(1) (2) 用26、27、28、29、30号的气温平均值作为7月31号气温的预测值, 38+35+30+34+35=34.4(摄氏度) 5(3) 指数平滑法计算表如下: 日期 t 1 2 3 4 5 6 --- 气温 0.3 %xt — 28 28.9 29.83 29.581 30 0.5 %xt — 28 29.5 30.75 29.875 30.4375 0.6 %xt — 28 29.8 31.12 29.848 30.5392 xt 28 31 32 29 31 33 %|xtxt| — 3 3.1 0.83 1.419 3 %|xtxt| — 3 2.5 1.75 1.125 2.5625 %|xtxt| — 3 2.2 2.12 1.152 2.4608 - 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 预测 合计 30 32 34 29 32 30 38 38 37 39 34 36 36 33 34 30 37 36 32 38 35 30 34 35 — — 30.9 30.63 31.041 31.9287 31.05 31.335063 0.9 1.37 2.959 2.9287 0.95 1.335063 31.71875 30.8594 1.71875 1.1406 32.01568 30.806272 31.5225 33 30.6036 31.44144 30.576576 35.03063 2.01568 1.193728 2.4775 4 1.3964 1.44144 7.423424 2.96937 31.4296875 2.5703125 32.71484 30.8574 31.42871 30.71436 34.35718 36.1786 36.5893 37.79465 35.8973 35.94867 35.97433 34.4872 34.243583 32.1218 34.560896 35.28045 33.640224 35.820112 35.41 32.705028 33.352514 34.176257 — 3.71484 1.1426 1.42871 7.28564 3.64282 0.8214 2.4107 3.79465 0.1027 0.05133 2.97433 0.4872 4.243583 4.8782 1.439104 3.28045 4.359776 0.820112 5.41 1.294972 1.647486 — 71.59777 30.9345441 7.0654559 33.0542 34.53793 35.27655 36.393584 36.27551 4.9458 2.46207 3.72345 2.393584 0.27551 36.8122522 0.1877478 36.9249 38.17 35.668 35.8672 35.9469 34.17876 34.071504 31.6286 34.85144 2.0751 4.17 0.332 0.1328 2.9469 0.17876 4.071504 5.3714 1.14856 36.1928562 0.1928562 36.135 35.1945 34.83615 33.3853 34.4697 34.9288 34.05 35.23511 35.164578 33.6152 33.73064 34.11145 — 3.135 1.1945 4.83615 3.6147 1.5303 2.9288 3.95 0.23511 5.164578 0.3848 1.26936 — 71.093787 35.5405763 3.5405763 33.4162305 4.5837695 36.1665 35.4666 32.18664 33.27466 34.309862 — 0.1665 5.4666 1.81336 1.72534 — 71.76126 由于71.093787<71.59777<71.76126,故当0.3时预测最合适。 7. 下表是某地区20年间的原煤产量数据(单位:千万吨): 年份 原煤产量 1986 1987 --- 年份 原煤产量 1991 1992 3.20 3.28 年份 原煤产量 1996 1997 4.11 4.04 年份 原煤产量 2001 2002 2.91 3.01 2.63 2.73 - 1988 1989 1990 2.88 3.10 3.18 1993 1994 1995 3.38 3.65 4.00 1998 1999 2000 3.68 3.07 2.94 2003 2004 2005 2.99 2.96 2.93 (1) 绘制时间序列图并描述其趋势; (2) 选择一条适合的趋势线拟合数据,并根据趋势线预测2006年的原煤产量。 解:(1) 时间-原煤产量散点图54系列1原煤产量32100510时间152025(2) 设拟合直线方程为ˆt=a+bt,根据系数公式得a=3.18542,b=0.00458。 yˆt=3.18542+0.00458t,当t=21时,得2006年的原煤产量为3.2816。 根据y--- 因篇幅问题不能全部显示,请点此查看更多更全内容