中国31个省市经济发展水平的动态分析
2023-06-21
来源:易榕旅网
中国3 1个省市经济发展水平的动态分析 刘 干,陆 叶 (杭州电子科技大学经济学院,浙江杭州310018) 【摘 要】 为评估我国区域经济发展状况,从经济、社会和环境三个角度出发构建了一套经济发展水平评 价指标体系,考虑到区域经济发展水平是一个动态变化的过程,为此引入了HA聚类法,实现了对我国区域经济发 展水平的动态聚类及聚类预测,并依据聚类结果从多个角度揭示了我国区域经济发展水平的现状;通过对聚类结 果变动原因的分析为相关部门研究区域经济问题提供了参考。 【关键词】 区域经济发展水平;MA聚类法;聚类预测;最佳聚类数;K-means聚类 【中图分类号】F127 【文献标识码】A 【文章编号】1004—2768(2018)02—0083~05 随着我国经济的快速发展,区域经济发展不 平衡问题也变得日益突出,作为解决区域经济发 展不平衡问题的关键,首先需要解决的是对我国 省域按经济状况做出分类评价。就目前对于该问 题的研究成果来看,大多数学者都是通过聚类分 析法来实现。然而区域经济发展水平是一个动态 的变化过程,不同区域由于各方面条件的差异,其 经济发展速度往往会存在较大差异,因而,对于某 一及增速方面所达到的状态。但从广义上来说,评价 一个地区经济发展水平的高低不应仅仅局限于其 经济表现,还应考虑其在社会生活及生态环境方 面所达到的标准。因此,本文从经济、社会及环境 三个层面筛选了14个指标构建了如下经济发展 水平的评价指标体系(见表1)。 表1 我国经济发展水平评价指标体系 经济总体内部不同区域的评价也应是一个动态 的过程。从这个层面上来说,对于总体的一次聚类 评价显然不能很好地反映内部动态变化过程;而 通过不同截面分别进行聚类,再比较聚类结果的 差异,一方面,聚类结果受随机波动和事物自身可 能存在的周期性波动影响较大;另一方面,不同截 面聚类结果之间的可比性无法得到保障。因此,本 文从面板数据聚类的角度引入了MA聚类法对该 问题进行研究,聚类结果表明该方法具有一定的 可靠性。 一本文的数据选自我国31个省市2005--2015 年的经济指标数据。为了剔除人口和价格因素的 影响,本文的评价指标均采用相对数来表示,指标 、评价指标体系及数据说明 经济发展水平反映的是一个地区在经济总量 中涉及的价格因素均以固定基期(2005)的实际值 【收稿日期】2017一l1—20 【基金项目】杭州电子科技大学研究生科研创新基金项目(CXJJ2016003) 【作者简介】刘干(1967一),男,安徽安庆人,杭州电子科技大学经济学院副教授、硕士生导师,研究方向:统计调查与分析;陆叶(1991一), 男,安徽合肥人,杭州电子科技大学经济学院硕士研究生,研究方向:数据挖掘。 带人。特别地,由于贸易开放程度指标计算中涉及 的货物进出口总额数据采用美元计价,对此,本文 采用各年的平均汇率加权处理。对于数据缺失问 题,本文采用两种处理方法:一是Xll指标2010 年的数据缺失,可直接采用线性插值法处理;二是 其中,兢表示第i个样本点矩阵,其维度为p× T(Q表示聚类指标个数,本文表示主因子个数; 表示聚类周期的长度),vj表示第 个聚类中心矩 阵,其维度与 相同。 平方根。 表示矩阵 的 Frobenius范数,即矩阵A内部所有元素平方和的 (2)聚类数K的确定。在K—means聚类之前, 一西藏的x5指标数据完全缺失,对此,本文考虑先 对其他30个省市进行完全指标数据聚类分析,再 根据未缺失的13个指标运用最近邻判别法将西 般都需要指定聚类数,而聚类数K实际上就是 藏归入据其最近的一类。本文所有的指标数据或 计算数据均来源于《中国统计年鉴》、《中国能源统 计年鉴》、《中国科技统计年鉴》、《国民经济和社 会发展统计公报》及各地区年鉴。 二、MA聚类法 从面板数据聚类的角度来考察我国各省市经 济发展水平的动态变化过程,首先需要解决的是, 在满足可比性的条件下,给出不同时期我国区域 经济发展水平的类别划分。为此,本文引入了基于 K—means聚类的类别变动分析法,由于其实现过 程运用了移动平均法的思想,因此,不妨将其叫做 移动平均聚类法,简称MA聚类法。下面给出该方 法的操作步骤。 (I)给定聚类数K和聚类周期长度TL; (Ⅱ)从数据的起点开始,选取长度为TL的聚 类区间,进行聚类数为K的K—means聚类分析,得 到对总体的K类划分结果{c ,c:,…,C }; (Ⅲ)依次将聚类区间向后平移一期,重复 (Ⅱ)的过程,直到数据的终点,则可得到T—TL+I 组聚类结果; (Ⅳ)对所有聚类结果进行类的优劣排序,不 妨将排序后的第i次的聚类结果仍然记作{c ,c:, …,CK); (V)比较相邻聚类结果之间的差异,并做出 分析。 关于MA聚类法的具体实现过程仍需做如下 几点说明: (1)面板数据的K—means聚类法。与截面K— means聚类不同的是,面板数据K—means聚类的距 离函数度量的是两个矩阵之问的距离,样本点i 与聚类中心 之间的欧式距离为: D(麓,vj)=tr(( ̄i-Vj)’(Xi- ̄)j))=ltx 川F (1) 最佳聚类数,关于最佳聚类数的确定方法有很多, 但据研究【1]表明:在采用K—means聚类法的条件 下,CH指标法的性能最优。另外,考虑到聚类结果 的统一性要求,即所有T—TL+I组聚类结果的聚类 数应相同。因此,本文通过对整个数据区间运用 CH指标法确定最佳聚类数K ,并以其作为聚类 数K的值,其计算公式如下: K*=argmaxCH(K)= 盯肿。 【默{—NK-—KK至!1∑c c∑ ! ! I[ Ix lj (一一 、 2) .(3)聚类周期长度TL的确定。当聚类总体在 目标变量上的变化呈现周期性波动时,聚类周期 TL应选择该周期长度的整数倍;当聚类总体在目 标变量上的变化并无明显的周期性波动时,TL的 长度可选择3,以消除随机波动。 (4)类的优劣判别法。本质上,类的优劣判别 可以归结为对聚类结果的综合评价问题,关于多 指标综合评价问题的方法可参考[21,本文由于在 聚类之前首先运用因子分析对数据进行了降维处 理,因此,可直接以类平均因子综合得分作为各类 优劣程度的测度值,从而其数值大小即代表了各 自类别的优劣。 (5)类预测法。当分析问题除了需要考察总体 内部各区域在历史一段时间内目标变量的动态变 化过程,还需对未来变动趋势做出预测时,可以在 上述方法之前,通过ARIMA模型对各指标数据进 行相同期数的时间序列预测,并将预测后的指标 数据叠加到原有数据基础上进行分析。从而,类预 测的期数与指标数据外推预测的期数相同。 三、实证分析 (一)指标预测 由于统计年鉴中公布的数据截止到2015年, 为了将最新的数据纳入分析过程,本文运用 ARIMA模型对各省市的14个指标分别进行2期 的预测,截取了部分预测结果如下: 山西X3 辽宁X9 上海X2 上海X3 并根据类平均因子综合得分法对聚类结果进行排 序,所得结果如表3和图2所示。 表3 MA聚类分析结果 墨茎 2007—2o15 垡 湘川闽鲁鄂琼 云新甘青 2005—2o13;2006—2o14; 京沪 津粤浙苏辽 冀吉黑皖赣豫 桂蒙渝陕晋 贵宁 京沪 津粤浙苏辽 冀吉黑皖赣豫 桂蒙渝陕 湘川闽鲁鄂琼 晋云新 安徽X3 福建X8 山东X14 河南X9 贵宁甘青 圈 圈 圈 京沪 津粤浙苏 蒙渝陕辽 闽鲁鄂琼 冀吉黑皖赣 晋云新贵 豫湘川桂 宁甘青 贵州X12 青海Xll 宁夏X10 新疆x3 图1 指标预测结果 从图1中可以看出,除部分指标波动较大,指 标做短期时间序列预测基本能捕捉到序列的趋 势,因此,后文基于指标预测结果进行的类预测具 有良好的可信度。 (二)聚类数K和聚类周期长度TL的确定 由于样本量的限制,即本文只对我国31个省 市的经济发展水平进行聚类,所以,最佳聚类数的 取值不宜太大。为此,根据式(2)计算出CH指标 在2~8区间内的值如表2所示。 表2不同聚类数下的CH统计值 K 2 3 4 5 6 7 8 CH(K) 19.1987 27 7713 33.5853 36.2615 35.5737 35.2897 34.8762 注:由于K—meaa8聚类受初始点的影响较大,因此,本文所有K—means聚类结 果都是基于组内误差平方和最小的原则将聚类过程重复进行多次取最优得到的 从表2可得,随着聚类数K的增加,CH指标 值先递增,在K=5处取得最大值,之后又逐渐递 减。因此,从总体来看,将我国省域划分为5类最 为合适。 由于社会经济指标的变化具有一定的周期 性,根据施发启『31的研究表明:我国的经济周期具 有一定的特殊性,即经济周期长短不一,但自第9 个经济周期后已基本接近尤格拉循环,因此,本文 取TL_9进行后续分析。 (三)MA聚类分析及类的优劣判别 考虑到西藏的万元GDP能耗数据完全缺失, 因此,聚类过程只针对其余30个省市进行。为了 对指标数据降维,本文首先进行因子分析,由平行 分析法 保留了3个主因子;然后,基于30个省 市的主因子数据进行K=5,TL=9的MA聚类分析, 注:省市均以简称表示,同一类中各省市排名不分先后 图2类平均因子综合得分 根据表3,从整体来看,我国30个省市中有超 过75%的区域经济发展水平落入了中等及以下的 类别,区域经济发展水平的分布呈现出明显的右 偏性,区域经济发展不平衡状况仍十分严重,这点 从图2的类平均因子综合得分折线图中也可明显 看出。从局部来看,区间2005--2013年、2006— 2014年和2007--2015年的聚类结果没有发生变 动,说明我国各地区经济发展水平在2005--2015 年间发展相对平稳,各类中区域经济发展水平的 平均增速没有太大差异。 根据指标预测数据,区间2008--2016年的聚 类结果相对于上期仅在经济水平较低的两类间发 生了变动,即甘肃和青海的经济增速相对于c4类 其他地区出现了下滑趋势,因而被划分到了经济 水平更低的类中。区间2009--2017年的区域经济 发展水平聚类结果波动较大,变动主要表现在C3 和c4类元素的交换,其中只有内蒙古、重庆和陕 西的变动方向为正,其余包括辽宁、河北、吉林、黑 龙江、安徽、江西、河南、湖南、四川、山西、云南和 新疆的变动方向均为负向。出现如此大面积省市 经济波动的原因主要有两方面:一方面,2o08— 2016年聚类区间内c3和C4类的经济发展水平 差距并不明显(这点从图2可看出),而C4中经济 水平较高的内蒙古、重庆和陕西的经济增速比c3 中的经济水平较低的河北、吉林和黑龙江等的经 济增速高,因而实现了反超;另一方面,在原有类 别中,经济水平相对较低的辽宁、山西、云南等地 区经济增速低于其余省份,因而,导致与经济水平 较低类的距离更近。 从图2中曲线的走势来看,我国区域经济总 体均呈现稳步上升趋势,且在2005--2017年问, 波动的地区主要分布在中西部交界地区。从聚类 变动情况来看,重庆、陕西和内蒙古的经济发展较 快,开始步人中等经济水平,而辽宁、山西等地的 经济增速较为缓慢,甚至出现衰落迹象。结合指标 数据来看,近年来,重庆的对外开放程度不断加 深,内蒙古的人均GDP增幅明显,陕西在科技及 教育方面成果显著,而辽宁在三废处理能力上相 对薄弱;山西由于经济类型较为粗放,且主要以煤 炭资源带动经济发展,随着近年煤炭市场的低迷, 经济出现了严重下滑。从图(a)到(b)的大幅变动 也主要是由于这些地区经济发展速度的变化造成 了聚类结果的重组。 区域间的差距没有被明显拉大的现象,区域间经 济发展不平衡问题也没有得到明显改善。从图2 中折线的疏密情况来看,我国区域间经济发展水 平“贫富悬殊”,区域经济发展不平衡现象主要表 现在经济发达地区、中高经济发展水平地区和中 等及以下经济发展水平地区之间,而经济发展水 平较低的3类间的差距并不明显,这也导致聚类 变动主要发生在这3类间。 (四)经济发展水平的空间分布 一“一 、 I——一 、‘口 为了研究我国31个省市经济发展水平的空 间分布情况,首先需要对西藏的分类情况做出判 别,为了简化分析过程,本文基于除缺失指标(万 元GDP能耗)外的13个指标数据,通过以熵权法 a1 2008-2016 Ib、2009-20l 7 图3聚类结果分布图 四、结论与建议 本文从经济、社会和环境三个角度构建了一 进行指标加权的最近邻判别法将西藏划分到距其 最近的类别。计算结果如表4所示。 表4西藏到各类中心的距离 套区域经济发展水平评价指标体系,相比于只从 经济和社会角度去刻画经济发展状况更准确、更 全面。另外,采用MA聚类法对区域经济发展水平 兰 27 6046 29 9912 3l 0740 24 2986 ,4 894 堕墨 堕 2005—20l3 2006—2014 2007—2015 2008—2016 2009-2n17 ! 91.3535 92.6368 94.2228 95 4522 96 1408 !兰 47 2956 48 5833 4g 7655 50 839l 56 8037 ! 29 2442 30.5147 31.2680 31.9598 2 84l 2 23 l196 24 8402 25.6462 28.17l9 l I 1'1 进行动态聚类和聚类预测,克服了一次聚类无法 给出区域经济动态发展特征和各年度分别聚类带 来的可比性不足的问题。 运用MA聚类法对我国31个省市2005— 由表4可知,西藏与2005--2013年、2006— 2014年及2007--2015年的C4类最近,与2008— 2016年和2009--2017年的C5类最近,因此,根据 最近判别法的原理,分别将西藏归入相应的类别。 2015年的经济发展水平数据进行动态聚类,结果 显示,我国区域经济发展水平的分布呈现出明显 的右偏性,区域间“贫富悬殊”差异显著;区域经济 发展不平衡问题主要表现在经济发展水平高、中 高和中等及以下地区之间差异显著;虽然区域经 济发展水平总体呈上升趋势,但区域间经济发展 将西藏的分类结果添加到表3,并通过 ArcGIS 10.5绘出聚类分布图(见图3)(由于前3 期聚类结果与第4期的差别仅表现在C4和c5类 之间,为了呈现的美观,这里只给出第4、5期的聚 类结果)。 不平衡的状况并没有得到明显的改善。从区域经 济发展水平变动情况来看,重庆、陕西和内蒙古的 经济发展较快,开始步人中等经济水平,而辽宁、 山西等地的经济增速较为缓慢,甚至出现衰落迹 从图3的聚类结果来看,我国经济发展水平 较高的地区均位于东部地区的沿海经济带,西部 象。结合指标数据分析,重庆、陕西和内蒙古经济 发展水平的提升分别得益于在对外开放、科技教 地区经济发展水平相对落后,出现经济发展水平 育和人均GDP等方面发展迅速;而山西受近年煤 炭市场低迷的影响,经济下滑严重;辽宁在环保方 面的表现欠佳也对其整体经济水平造成了一定的 影响。整体来看,解决区域经济发展不平衡问题首 先需各地区发挥自身优势,着力解决阻碍地区经 济发展的问题,并寻求适合地区特点的新经济增 长点;其次,各地区应加强同周边区域的交流互 通,实现经济的互补。 【参考文献】 【1]Arbelaitz 0,Gurrutxaga I,Muguerza J,at a1.An extensive comparative study of cluster validity indices[J].Pattern Recognition,2013,46(1): 243-256. 【2]虞晓芬,傅玳,2014.多指标综合评价方法综述[J1.统计与决策 (11):119—121. [3]施发启,2000.中国经济周期实证分析….统计研究(7):59—62. [4]孔明,卞冉.平行分析在探索性因素分析中的应用[J].心理科学, 2007,30(4):924—925. (责任编辑:C校对:L) (上接第82页)成集群效应。配合区域的良性发 展,作为其中一个要素的高职教育需要发挥其良 好的服务功能和服务区域经济的责任。区域高职 教育协作发展,既要充分利用优质高职教育资源, 提高教育系统的质量和效益,又要满足产业结构 的需要,以有利于大幅度提高区域内的人口素质, 满足社会教育需求l3J。 (二)与区域产业布局相融合。充分发挥高职 教育实践育人功能 与区域经济联动发展 杭宁温三地均形成各自特色的产业结构,如 杭州以服务业主导、信息经济引领、先进制造业支 撑的产业体系;宁波以新材料、高端装备和新一代 信息技术为代表的三大战略引领产业;温州以新 兴产业和先进装备制造业产业与传统产业有着明 显的互补性。高职教育应主动融人“一带一路”和 长江经济带建设,适应社会发展和经济增长方式 转变的发展观,把协作发展放在更加突出、更加重 高职教育链与区域经济产业链的“对接”程 度、高技能应用人才与区域经济的良性“互动”效 应,决定了高职教育能否服务好区域经济。随着区 域产业布局的调整,在特定区域使高职教育与行 业、企业建立起合作联动关系,培养区域对口人 要的位置,积极推进高职教育协作发展,服务区域 经济建设,培养大批符合经济发展需要的应用性 人才。统筹规划区域高职教育协作发展,紧密结合 高职教育链与产业链、无缝对接专业设置与产业 发展、合理衔接课堂教学与岗位工作、深度融合校 园文化与企业文化,制定鼓励企业参与发展高职 教育的政策,培养具有较高素质的劳动者,满足区 域经济建设对高技能人才的要求 【参考文献】 [1]王新凤.欧洲高等教育区域整合研究——聚焦博洛尼亚进程 [M].北京:社会科学文献出版社,2013. 才;重点是通过校企合作、产学研创合作形成实 习、实践、实训和进行创新活动的稳定基地,以支 持高职院校师生的技术操作能力、业务实践能力。 学校和企业要以各自承担的责任为基础,围绕区 域经济发展的需求,急企业所急,解企业难题,建 立起内涵明确、关系清晰、分工协作的合作伙伴关 系,构建以产学研创为特征的新型人才培养模式, 充分发挥高职教育实践育人功能,实现企业出题、 学校接题、老师析题、学生答题的教学模式。 (三)与支柱产业发展相配合,实现高职教育 [2】商霄,2015.高职教育对区域经济发展的影响Ⅲ.职业与教育 (6):25—27. [3]高兵,2015.京津冀教育协同发展的现代化路径探索【J].教育理 论与实践(22):16—2O. (责任编辑:M校对:L)