基于预测有效度的变形数据组合预测
谷川1,秦世伟1,2
1 同济大学测量与国土信息工程系,上海 (200092)
2 上海大学土木工程系,上海 (200072)
Email:guchuanhaha@163.com
摘 要: 对组合预测模型进行了研究,提出采用基于预测有效度的组合预测模型,并探讨将其应用于变形预测领域。通过一个工程实例表明,本文提出采用的基于预测有效度的组合预测模型能够取得比常规组合预测模型更好的变形预测效果。
关键词 组合预测;预测有效度;变形数据;权系数;最优加权 中图分类号: P313.2 文献标示码: A
1 引言
针对某一特定问题的具体预测通常有许多不同的预测方法。由于每种预测方法的使用条件不尽相同,所以会产生不同的预测结果。单项预测方法在数据处理及不同准则方面均有其独到之处,各有其优点和缺点,能从不同的角度来推导和演绎,其预测结果都具有一定的价值,它们之间并不是相互排斥的,而是相互联系、相互补充的。
组合预测就是综合利用各种预测方法所提供的信息,以适当的加权平均形式得出组合预测模型。组合预测最关心的问题就是如何求出加权平均系数,使得组合预测模型更加有效地提高预测精度[1]。自Bates. J. M. 和Granger. C. W. J. 首次提出组合预测方法[2]以来,由于它能有效地提高预测精度,因此受到国内外预测工作者的重视。组合预测在国外称为combination forecasting或combined forecasting,在国内也称为综合预测等[3]。
1989年,国际预测领域的权威学术刊物《Journal of Forecasting》出版了组合预测方法专辑,充分说明了组合预测方法在预测学中的重要地位[4]。国内外学者主要提出以下一些组合预测方法:最小方差方法[1]、无约束最小二乘方法[5]、约束最小二乘方法[6]、Bayes方法[7]、基于不同准则和范数的组合预测方法[8],递归组合预测方法[9]等。其中,实际应用和理论研究最多的是最小方差方法,且大体上以绝对误差作为准则来计算出组合预测方法的权系数向量。
目前,组合预测模型普遍是以误差平方和或离差绝对值之和达到最小为精度指标的单目标优化模型建立起来的。事实上,这样的精度指标不一定能如实地反映预测方法的有效性。一是不同精度指标序列具有不同量纲,不能直接对比;二是普遍单目标组合预测模型的精度指标仅仅刻画了预测模型的局部特征,从而求得的加权系数不一定最优[10]。因而本文尝试建立以预测有效度为优化精度指标的多目标组合模型进行变形预测。
2 预测有效度的概念
设有某种预测对象的某个指标的时间序列为:{xt,t=1,2,L,N,N+1,L,N+T}。其中,样本区间为[1,N],预测区间为[N+1,N+T]。设有k种方法对其进行预测。xit表示第i种方法第t期拟合/预测值,t=1, 2, …, N, N+1, …, N+T,i=1, 2, …, k,则第i种预测方法第t期的拟合误差为:eit=xt−xit。
- 1 -
http://www.paper.edu.cn
⎧eiteit
− ≤≤110⎪xxtt⎪
定义1:Ait=⎨,则称Ait为第i种预测方法第t期的预测精度。
⎪0 eit≥1⎪xt⎩
定义2:第i种预测方法的拟合有效度为Ai的数学期望,即mic=示第i种预测方法在样本区间上第t时刻精度Ait的权系数,且
N+T
∑P
t=1
N
it
Ait,其中,Pit表
∑P
t=1
N
it
=1,Pit≥0, t=1, 2, …, N。
定义3:第i种预测方法的预测有效度mif=
N+T
t=N+1
∑PA
it
it
,其中Pit表示第i种预测方法在预
测区间上第t时刻精度Ait的权系数,且
t=N+1
∑P
it
=1,Pit≥0,t=N+1, N+2,…, N+T。
定义4:第i种方法的综合预测有效度mi=αmic+(1−α)mif,0≤α≤1,α越大表示越重视拟合有效度,α越小表示越重视预测有效度。
3 基于预测有效度的组合预测模型
3.1 在样本区间上组合预测模型权系数的确定
k
ˆt=令x
∑lx
i=1
iit
ˆt表示时间序列第t期的组合预测值,t=1, 2, …, N。其中,li表示第,则x
i种预测方法在样本区间组合预测模型中的权系数,i=1, 2, …, k,且
∑l
i=1
k
i
=1,li≥0。此时
ˆtx−x
组合预测模型第t期拟合的精度为:At=1−t=1−
xt
∑le
i=1
k
iit
xt
,t=1, 2, …, N。由定义2
可知组合预测模型的拟合有效度为:m1=
∑P
t=1
N
t
At,其中Pt为At的已知权系数,∑Pt=1,
t=1
N
Pt≥0。
显然,m1越大表示组合预测方法越有效,因此,以组合预测模型的拟合有效度为准则的组合预测模型可表示成如下模型,记为模型(1)。
- 2 -
http://www.paper.edu.cn
N
max m1=∑PtAt
t=1
k
⎧
lieit∑⎪
⎪At=1−i=1, t=1,2,L,N (1)
x⎪t
s. t. ⎨
⎪⎪k
⎪∑li =1, li≥0, i=1,2,L,k⎩i=1
令εt=
k
∑le
i=1
k
iit
xt
i
⎧εt εt≥0−⎧−εt εt≤0+−+−
,,,则有et=et+et,et=et−et,ε=⎨εt=⎨
⎩0 εt≤0⎩0 εt≥0
+t
注意到
∑P=1,则模型(1)等价如下模型,记为模型(2)。
i=1
min j1=∑Pt(et++et−)t=1
N
⎧k
⎪∑lieit
(2) +−i=1
⎪−+= =εεL0,t1,2,,N⎪tts. t. ⎨xt
⎪k
⎪∑li=1, li≥0, i=1,2,L,k⎪⎩i=1
显然,模型(2)为一个线性规划问题,可用大M法求解组合预测模型中的最优权系数,li,i=1, 2, …, k。
*
3.2 在预测区间上组合预测模型权系数的确定
N+T
由定义3可知在预测区间上组合预测的预测有效度m2=
N+T
t=N+1
∑PA,其中P为A的权系
tt
tt
数,Pt≥0,为模型(3)。
t=N+1
∑P=1,以预测有效度m
t
2
作为目标函数的组合,预测模型可表示如下,记
max m2=
N+T
t=N+1
∑PA
t
t
k
⎧
liAit∑⎪
⎪At=1−i=1, t=N+1,L,N+T (3)
xt⎪
s. t. ⎨
⎪⎪k
⎪∑li=1, li≥0, i=1,2,L,k⎩i=1
- 3 -
http://www.paper.edu.cn
m
令εt=有
+t
∑le
i=1
iit
+
x
,εt=⎨
+t
⎧εt 当εt≥0⎩0 当εt≤0
−
t,注意到
,εt=⎨
−
⎧−εt 当εt≤0⎩0 当εt≥0
,t=N+1,N+2,…,N+T,则
εt=ε+ε−
t,t
ε=ε−εN+T
t=N+1N
∑P=1,则模型(3)等价如下模型,记为模型(4):
t
min j2=∑Pt(εt++εt−)t=1
⎧k
⎪∑lieit
(4) +−i=1
⎪tNNT−+= =+L+εε0,1,,⎪tts..t⎨xt
⎪k
⎪∑li=1, li≥0, i=1,2,L,k⎪⎩i=1
3.3 在总区间上组合预测模型权系数的确定
由定义4得,在总区间上组合预测的综合预测有效度:
N
N+T
m3=αm1+(1−α)m2=α∑PtAt+(1−α)t=1
t=N+1
∑PA
t
t
,其中,Pt为At的权系数,
∑P=1,∑P=1。
t
t
t=1
t=N+1
NN+T
以综合预测有效度m3作为目标函数的组合预测模型可表示如下,记为模型(5)。
max m3=α∑PtAt+(1−α)t=1
NN+T
t=N+1
∑PA
t
t
k
⎧
lieit∑⎪
⎪At=1−i=1, i=1,2,L,N,N+1,L,N+T (5)
xt⎪
s. t. ⎨
⎪⎪k
⎪∑li=1, li≥0, i=1,2,L,k⎩i=1
令εt=
k
∑le
i=1
k
iit
+
xt
i
,εt=⎨
⎧εt εt≥0−⎧−εt εt≤0+−+−
,,则有et=et+et,et=et−et,εt=⎨
⎩0 εt≤0⎩0 εt≥0
注意到
∑P=1,则模型(5)等价如下模型,记为模型(6)。
i=1
- 4 -
http://www.paper.edu.cn
N
N+T
min j3=α∑Pt(e+e
+t
t=1
−t
)+(1−α)∑P(e
t
t=N+1
+t
+et−)⎧k
⎪∑lieit
(6) +−i=1
⎪−−==L+L+ee0, t1,2,,N,N1,,NT⎪tts. t. ⎨yt
⎪k
⎪∑li=1, li≥0, i=1,2,L,k⎪⎩i=1
4 工程实例
笔者在多个工程实例采用本文基于预测有效度的组合预测方法进行变形预测,并且同最常用的最优加权组合预测模型进行了比较,结果均表明基于预测有效度的组合预测模型能够取得更好的预测结果。限于文章篇幅,在此仅举出其中的一个工程实例用以说明问题。
采用某大坝水平位移监测点的实际测量数据作为工程实例进行分析,样本区间为31~36期,预测区间为37~38期。选取趋势分析、灰色模型、时间序列、神经网络、模糊指数平滑6个预测模型为组合预测的参考方案。
表1所示为实际测量数据以及组合预测建模用到的单项预测方法得到的拟合/预测数据。
表1 实测数据以及单项方法拟合/预测数据
Tab.1 Observation data and fitted/forecasted data using individual method
期数 实测数据 趋势分析 灰色模型
趋势分析
时间序列
神经网络 模糊指数平滑
14.2 19.5 22.2 28.2 33.4 40.2 44.9 31 12.1 11.7 14.1 11.7 13.5 12.5 13.3 32 14.8 14.1 17.1 14.1 14.2 13.6 拟合区域
33 18.5 17.0 18.4 17.0 17.5 17.3 34 23.4 22.4 23.7 22.4 22.1 23.0 35 27.9 27.9 27.5 27.9 27.2 28.2 36 34.1 31.9 32.7 31.9 32.7 32.4 预测区域
37 39.2 36.6 36.0 36.6 38.2 37.2 38 43.6 39.3 40.7 39.3 45.1 42.7
采用参考文献[1]提出的最优加权组合预测模型得到的37、38 期水平位移量分别为: 38.3㎜, 42.8㎜。
采用本文的基于有效度的组合预测模型,α取0.9,得到的37、38 期水平位移量分别为38.7㎜, 43.3㎜。
表2所示为几种单项预测方法、最优加权组合预测、基于预测有效度的组合预测模型预测得到的37、38 两期数据以及实测数据之间的分析和比较。
- 5 -
http://www.paper.edu.cn
表2 预测结果分析和比较
Tab.2 Analysis and comparison of forecasted results
期数
实测数据/㎜
内容 预测值/㎜
37 39.2 绝对偏差/㎜
相对误差/% 预测值/㎜
38 43.6 绝对偏差/㎜
相对误差/%
趋势分析
灰色模型
时间序列
神经网络
模糊指数平滑40.2 +1.0 +2.6 44.9 +1.3 +3.0 最优加权组合预测 38.3 -0.9 -2.3 42.8 -0.8 -1.8
基于有效度的组合预测
38.7 -0.5 -1.3 43.3 -0.3 -0.7
38.2 36.0 36.6 37.2-1.0 -3.2 -2.6 -2.0-2.6 -8.2 -6.6 -5.145.1 40.7 39.3 42.7+1.5 -2.9 -4.3 -0.9+3.4 -6.7 -9.9 -2.1
显然,在该工程实例中,组合预测模型的预测效果要优于各单项预测模型。此外,本文提出采用的基于预测有效度的组合预测模型得到的预测效果要优于基于最小方差的最优加权组合预测模型。
5 结语
本文对组合预测模型进行了研究,提出了基于预测有效度的组合预测模型,并且尝试将该模型应用于变形数据预测。通过一个工程实例的分析和比较表明,本文提出的基于预测有效度的组合预测模型能够取得比常规组合预测模型更好的预测效果。
References
[1] 潘国荣, 谷川. 形变监测数据组合预测[J]. 大地测量与地球动力学, 2006, 26(4): 27- 29.
[1] Pan Guorong, Gu Chuan, Combination prediction of deformation monitoring data [J]. Journal of Geodesy and Geodynamics, 2006, 26(4): 27-29.
[2] Bates J M, Granger C W J. Combination of forecasts[J]. Oprations Research Quarterly, 1969, 20(4): 451- 468. [3] 陈华友. 组合预测方法及其应用研究[D]. 合肥:中国科学技术大学博士学位论文, 2002.
[3] Chen Huayou. Research on method and application of combination forecasting[D]. Hefei: Doctoral dissertation of university of science and technology of China, 2002.
[4] 唐小我. 预测与决策新方法及其应用研究[M]. 成都: 电子科技大学出版社, 1997.
[4] Tang Xiaowo. New methods of forecasting and decision-making and their application researches[M]. Chengdu: Press of UESTC, 1997.
[5] Granger C W J, Ramanathan R. Improved methods of combining forecasts[]. Journal of Forecasting, 1984, 3(2): 197-204.
[6] Clemen, R. T., Linear Constrains and the Efficiency of combined Forecasts[J], Jounral of Forecasting,1986, 5( 1): 31-38.
[7] Bunn D W. Forecasting with more than one model[J] . Journal of Forecasting, 1989, 8(3): 161- 166.
[8] 王应明, 傅国伟. 基于不同误差准则和范数的组合预测方法研究[J]. 控制与决策, 1994, 9(1): 20- 28.
[8] Wang Yingming; Fu Guowei. Study on the Methods of Combining Forecasts Based on Different Kinds of Error Criteria and Norms[J]. Control and decision, 1994, 9(1): 20- 28.
[9] 唐小我,曹长修,组合预测方法研究的若干新结果[J], 预测, 1992, 11(5): 39- 46.
[9] Tang Xiaowo, Cao Changxiu, Some new results for combined forecasting research[J]. Forecasting, 1992, 11(5): 39- 46.
[10] 曹喜仁,林龙. 高填路堤沉降的优化组合预测. 中南公路工程, 2007, 32(2): 9- 12.
[10] Cao Xiren, Lin Long. Optimized Combination Forecasting Settlement of High Backfill Subgrade. Central South Highway Engineering, 2007, 32(2): 9- 12.
- 6 -
http://www.paper.edu.cn
Combined Forecasting of Deformation Data Based on
Forecasting Effectiveness
GU Chuan1, QIN Shiwei1,2
⒈ Department of Surveying and Geo-Informatics, Tongji University, Shanghai (200092)
⒉ Department of Civil Engineering, Shanghai University, Shanghai (200072) Abstract
Research on combined forecasting method is done in this paper. A combined forecasting method based on forecasting effectiveness is proposed and applied in deformation forecasting. An engineering example indicates that the combined forecasting method based on forecasting effectiveness can achieve better forecasting result compared with ordinary combined forecasting methods.
Keywords: Combined forecasting; forecasting effectiveness; deformation data; weight coefficient; best weighting
作者简介:谷川,男,1983年生,同济大学测量与国土信息工程系博士研究生,主要研究方向为精密工程测量、工业测量与测量数据处理。
- 7 -
因篇幅问题不能全部显示,请点此查看更多更全内容