您的当前位置:首页正文

多元线性回归分析在数据模型中的应用

2022-08-01 来源:易榕旅网
 2010年我国各省市财政支出对生产总值的影响

————多元线性回归分析在数据模型中的应用

摘要:本案例研究财政支出对生产总值的影响。首先建立多元回归模型,通过逐步回归法剔除变量,筛选出有效的财政支出项,确定自变量。再对自变量进行多重共线性的诊断和消除,使回归方程显著;最终做残差分析,消除异常值,检验异方差性,确定最优模型;判断影响2010年我国生产总值的财政支出中的教育、住房保障支出、粮油物资储备管理事务、城乡社区事务四项因素最为主要,以此提出相关较科学具体的理论依据。

关键词:生产总值 逐步回归 多重共线性 经济

引言: 国内生产总值(Gross Domestic Product,简称GDP)是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标。它不但可反映一个国家的经济表现,更可以反映一国的国力与财富。影响一个国家或地区生产总值的因素包括消费、资源、进出口、国家基础设施建设等多方面的因素。其中用财政支出占国民生产总值的比重来衡量财政支出的规模,中国统计年鉴把财政支出划为22个组成部分,其中并非所有支出项对国内生产总值都有着显著的影响,通过多元回归的思想建立回归模型,求出回归方程,可对影响国内生产总值的因素做出准确的判断。

一、数据的来源及整理

通过查找《中国统计年鉴2011》中“2-14 地区生产总值和指数”,得到2010年各地区生产总值;“8-8 各地区财政支出 (2010年)”得到2010年各地区财政支出各项指标。

数据整理如下:其中地区包括北京、天津、河北、山西 、内蒙古、辽宁、吉林、黑龙江、上海、江苏、浙江、安徽、福建、江西、山东、河南 、湖北 、湖南 、广东、广西 、上海 、重庆、四川、贵州、云南、西藏、陕西、甘肃 、青海、宁夏 、新疆31个城市,财政支出包括一般预算支出、一般公共服务、国防、公共安全、教育、科学技术、文化体育与传媒、社会保障和就业、医疗卫生、环境保护、城乡社区事务、农林水事务、交通运输、资源勘探电力信息等事务、商业服务业等事务、金融监管等事务支出、地震灾后恢复重建支出、国土资源气象等事务、住房保障支出、粮油物资储备管理事务、国债还本付息支出、其他支出22项。

二、模型的构建

设定模型为下面所示的形式:

01X12X2......22X22

其中Y为各地区生产总值;X1=一般预算支出;X2=一般公共服务;X3=国防;X4=公共安全;X5=教育;X6=科学技术;X7=文化体育与传媒;X8=社会保障和就业;X9=医疗卫生;X10=环境保护;X11=城乡社区事务;X12=农林水事务;X13=交通运

输;X14=资源勘探电力信息等事务;X15=商业服务业等事务;X16=金融监管等事务支出;X17=地震灾后恢复重建支出;X18=国土资源气象等事务;X19=住房保障支出;X20=粮油物资储备管理事务;X21=国债还本付息支出;X22=其他支出。

三、参数估计

(一)逐步回归:

表1:

模型汇总 模型 R R 方 调整 R 方 标准 估计的误差 1 2 3 4 5 6 .967 .975 .981 .986 .991 .994 fedcbagDurbin-Watson .934 .951 .963 .973 .982 .988 .931 .946 .957 .966 .976 .982 3272.00825 2902.86541 2595.38190 2305.37586 1936.51052 1649.88453 1.584 a. 预测变量: (常量), 教育。 b. 预测变量: (常量), 教育, 住房保障支出。 c. 预测变量: (常量), 教育, 住房保障支出, 公共安全。 d. 预测变量: (常量), 教育, 住房保障支出, 公共安全, 粮油物资储备管理事务。 e. 预测变量: (常量), 教育, 住房保障支出, 公共安全, 粮油物资储备管理事务, 城乡社区事务。 f. 预测变量: (常量), 教育, 住房保障支出, 公共安全, 粮油物资储备管理事务, 城乡社区事务, 科学技术。 g. 因变量: 生产总值 该表显示各模型的拟合情况。从表中可以看出,模型6的负相关系数为0.994,判定系数为0.988,调整判定系数为0.982,估计值的标准误差为1.584.拟合程度最优。

表2: Anova 模型 回归 1 残差 总计 回归 2 残差 总计 平方和 2899165326.547 203414722.088 3102580048.635 2950900751.766 151679296.869 3102580048.635 df 均方 1 2899165326.547 19 20 10706038.005 F 270.797 Sig. .000 ba 175.094 .000 c 2 1475450375.883 18 20 8426627.604 回归 3 残差 总计 回归 4 残差 总计 回归 5 残差 总计 回归 6 残差 总计 2988067926.041 114512122.594 3102580048.635 3017543923.290 85036125.345 3102580048.635 3046328953.833 56251094.802 3102580048.635 3064470383.286 38109665.349 3102580048.635 3 17 20 4 16 20 5 15 20 6 14 20 996022642.014 6736007.211 147.865 .000 d 141.942 .000 e 754385980.822 5314757.834 162.468 .000 f 609265790.767 3750072.987 187.628 .000 g 510745063.881 2722118.953 a. 因变量: 生产总值 b. 预测变量: (常量), 教育。 c. 预测变量: (常量), 教育, 住房保障支出。 d. 预测变量: (常量), 教育, 住房保障支出, 公共安全。 e. 预测变量: (常量), 教育, 住房保障支出, 公共安全, 粮油物资储备管理事务。 f. 预测变量: (常量), 教育, 住房保障支出, 公共安全, 粮油物资储备管理事务, 城乡社区事务。 g. 预测变量: (常量), 教育, 住房保障支出, 公共安全, 粮油物资储备管理事务, 城乡社区事务, 科学技术。 从方差分析表中可以看出,模型6的f统计量为187.682,概率p值为0.000,在显著性水平为0.05的情形下,可以认为y(生产总值)与x5(教育), x19(住房保障支出), x4(公共安全), x20(粮油物资储备管理事务), x11(城乡社区事务),x6( 科学技术)之间有线性关系。 表3:

系数 模型 非标准化系数 B 1 (常量) -7273.266 标准 误差 1634.089 标准系数 试用版 -4.451 .000 t Sig. a教育 (常量) 2 教育 住房保障支出 (常量) 教育 3 住房保障支出 公共安全 (常量) 教育 4 住房保障支出 公共安全 粮油物资储备管理事务 (常量) 教育 住房保障支出 5 公共安全 粮油物资储备管理事务 城乡社区事务 (常量) 教育 住房保障支出 6 公共安全 粮油物资储备管理事务 城乡社区事务 科学技术 a. 因变量: 生产总值 55.584 -2445.903 55.101 -65.935 -648.156 38.696 -83.390 37.927 -459.825 36.715 -104.375 39.056 78.159 -720.909 32.685 -99.633 33.462 85.993 11.746 -15.359 23.445 -120.351 63.720 82.580 22.391 -45.777 3.378 2428.451 3.003 26.610 2302.157 7.482 24.925 16.146 2046.479 6.699 23.866 14.350 33.189 1721.619 5.812 20.120 12.222 28.021 4.240 1492.044 6.110 18.928 15.678 23.910 5.482 17.732 .967 16.456 -1.007 .000 .327 .000 .023 .782 .000 .004 .031 .825 .000 .000 .015 .032 .681 .000 .000 .015 .008 .014 .992 .002 .000 .001 .004 .001 .022 .958 -.129 18.349 -2.478 -.282 .673 -.164 .305 5.172 -3.346 2.349 -.225 .639 -.205 .315 .108 5.480 -4.373 2.722 2.355 -.419 .568 -.196 .269 .119 .148 5.623 -4.952 2.738 3.069 2.771 -.010 .408 -.236 .513 .114 .282 -.229 3.837 -6.358 4.064 3.454 4.085 -2.582

根据模型6建立的多元线性回归方程为:

Y15.35923.445X5120.351X1963.720X482.580X2022.391X1145.777X6经t检验p值均小于0.05,按给定的显著水平情形下,均有显著性意义。

(二)多重共线性诊断

表4:

地区 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东 河 南 湖 北 湖 南 广 东 广 西 海 南 重 庆 四 川 贵 州 云 南 西 藏 陕 西 甘 肃 青 海 宁 夏 新 疆

y

14113.58 9224.46 20394.26 9200.86 11672.00 18457.27 8667.58 10368.60 17165.98 41425.48 27722.31 12359.33 14737.12 9451.26 39169.92 23092.36 15967.61 16037.96 46013.06 9569.85 2064.50 7925.58 17185.48 4602.16 7224.18 507.46 10123.48 4120.75 1350.43 1689.65 5437.47

x4 x5 180.94 450.22 84.92 229.56 176.08 514.30 121.84 328.58 120.45 322.11 191.29 405.39 109.30 250.20 134.85 299.14 187.25 417.28 326.80 865.36 260.67 606.54 119.48 386.31 120.60 327.77 107.49 297.50 244.03 770.45 189.72 609.37 166.87 366.57 159.14 403.10 495.80 921.48 125.14 366.84 43.94 98.33 91.84 240.46 218.38 540.65 101.46 292.06 145.42 374.79 41.33 60.80 111.50 377.79 70.45 228.23 35.48 82.47 31.49 81.59 128.56

313.84

x6 x11 178.92 294.30 43.25 355.29 29.65 178.75 20.12 111.57 21.39 237.75 68.90 360.31 19.12 108.90 27.69 141.13 202.03 475.47 150.35 624.53 121.40 272.30 57.98 236.18 32.31 107.68 18.26 102.47 84.36 388.40 44.67 165.30 30.09 119.63 35.04 186.98 214.44 407.64 21.66 103.87 7.47 36.81 17.90 251.26 34.71 179.19 16.66 53.00 21.43 86.66 2.71 20.51 25.25 126.84 10.89 56.82 4.08 30.60 5.97 61.89 20.19

95.28

x19 x20 45.81 6.14 6.32 4.59 52.00 23.71 53.30 12.15 83.72 60.41 83.79 25.42 86.84 60.52 108.94 63.93 52.45 13.53 72.77 27.70 29.60 11.75 93.36 30.71 28.13 13.86 68.08 45.21 35.25 30.81 77.25 45.35 56.59 24.58 81.75 28.20 88.57 39.32 58.93 11.98 23.83 1.64 79.91 9.91 107.03 26.80 87.62 5.72 112.12 6.35 10.46 1.89 68.72 15.92 58.10 9.81 61.09 4.43 28.05 2.29 90.02

12.20

表5:

从表5中可以看出,公共安全和教育因素的方差扩大因子较大分别为VIF4=13.053 VIF5=10.281 大于10 说明生产总值回归方程存在多重共线性。

表6:

从表6中得知公共安全和教育因素的简单相关系数为0.939,高度相关。

(三)消除多重共线性:

剔除变量X4,建立y对X5、X6、X11、X19、X20的回归方程,结果如下:

表7:

从表中可以看出五个方差扩大因子都小于10,但是科学技术的p值=0.888 远大于0.05,所以剔除此变量X6,重新回归,建立y对X5、X11、X19、X20的回归方程。

表8:

四个因素方差因子都小于10,回归系数也都有合理的经济解释,说明此回归模型不存在强的多重共线性。回归方程为:

Y2684.87047.569X59.892X1179.954X1985.088X20

四、回归诊断

(一)残差分析

虽然以上线性回归方程通过了t检验,知识表明变量x与y之间的线性关系是显著的,或者说线性回归方程是有效的,但不能保证数据拟合的很好,也不能排除由于意外原因而导致数据不完全可靠,因此在利用回归方程作分析和预测之前,需要诊断回归效果,检查模型是否满足基本假定。

表9

残差统计量 预测值 标准 预测值 极小值 -2966.3296 -1.523 极大值 41445.2070 2.441 均值 14098.1287 .000 标准 偏差 11201.36289 1.000 N 31 31 a预测值的标准误差 调整的预测值 残差 标准 残差 Student 化 残差 已删除的残差 Student 化 已删除的残差 Mahal。 距离 Cook 的距离 居中杠杆值 a. 因变量: 生产总值 485.075 -3552.8162 -4389.31152 -1.922 -2.008 -4792.29443 -2.142 .386 .000 .013 1324.427 41079.4688 4567.85254 2.000 2.333 6212.62793 2.572 9.122 .392 .304 884.897 14075.8412 .00000 .000 .005 22.28747 .013 3.871 .040 .129 245.184 11118.19919 2126.06411 .931 1.015 2537.13463 1.052 2.540 .073 .085 31 31 31 31 31 31 31 31 31 31

从表9中可以看出,绝对值最大的学生化残差为2.333小于3,因而根据学生

化残差诊断认为数据不存在异常值。绝对值最大的删除学生化残差为2.572 小于3,根据学生化残差诊断也认为不存在异常值。

(二)异方差性检验

通过残差图分析法:

图1:

看图1可知:残差图上的n个点散布随机,无任何规律,由此可断定次回归模型无异方差,满足所有假定。

综上:模型的最优方程为: Y2684.87047.569X59.892X1179.954X1985.088X20 X5(教育), X19(住房保障支出), X20(粮油物资储备管理事务), X11(城乡社区事务)。

五、回归应用

(一)模型解释

回归方程的经济意义为:当城乡社区事务(X11)住房保障支出(X19) 粮

油物资储备管理事务(x20)不变时,教育(x5)每增加一个单位,生产总值(Y)增加47.569个单位;当教育(x5)住房保障支出(X19) 粮油物资储备管理事务(x20)不变时,城乡社区事务(X11)每增加一个单位,国内生产总值(Y)增加9.892个单位;当教育(x5)城乡社区事务(X11)粮油物资储备管理事务(x20)不变时,住房保障支出(X19)每增加一个单位,国内生产总值(Y)减少79.954个单位,当教育(x5)城乡社区事务(X11)住房保障支出(X19),不变时,粮油物资储备管理事务(x20)每增加一个单位,国内生产总值(Y)增加85.088个单位。

(二)总结

第一:从对我国2010年国内生产总值的分析中,可以看出最主要的影响因素为粮油物资储备管理事务面的财政支出。据财政部公布,2010年粮油物资储备管理事务支出1171.96亿元,比上年下降9.5%,占全国财政支出的1.3%,主要用于提高粮食最低收购价补贴利息和储备粮油包干费标准,加强粮油以及重要物资储备体系建设。加大粮油物资储备管理事务打支出,可以大力促进国内生产总值的增长。

第二:我国教育支出近年来大幅上升,其所占GPD总量的3%。从研究结果也可以看出教育支出对于经济的增长具有显著促进作用。虽然如此,与世界水平相比,仍相差1.9个百分点。仍需加大投资支出力度。

第三:财政部公布的关于2010年中央本级支出决算的说明中数据显示,2010年城乡社区事务预算数为1.98亿元,决算数为10.09亿元,完成预算的509.6%。足以看出增进城乡社区事务的建设可以促进国内生产总值的增长,部分城市也将加大城乡建设投资纳入工作意见中,这就不难理解国家一直把城乡建设做为经济建设重点的原因。

第四:而关于住房保障支出方面,中国在基本民生方面的投入占GDP比例之低居全世界第一。从回归方程可以看出住房保障支出每增加一个单位,国内生产总值减少79.954个单位,对多内生产总值有着显著的负影响。我国困难群体住房问题依然严峻,住房保障工作任重道远,存在许多的问题。

综上,虽然我国经济发展稳健,但是由于种种原因会导致国内生产总值下降,如住房保障支出过大将导致国内生产总值下降;粮油物资储备管理事务面的财政支出和教育支出的增加则可以帮助国内生产总值上调。通过这次的模型拟合和相

关因素的检验,可以找出影响国内生产总值的关键因素,从而对症下药,调整政府策略,以提高国内的生产总值。

参考文献:[1] 陈共.《财政学》第六版. 中国人民大学出版社,2009.

[2] 吴传生.《经济数学—概率论与数理统计》第二版.高等教育出版社,2004 [3] 何晓群.《实用回归分析》高等教育出版社,2008 [4] 贺辉.《中国教育财政支出的绩效评价》,2009 [5] 中国统计年鉴

因篇幅问题不能全部显示,请点此查看更多更全内容