俞曉軍,葛 文,吳春節(jié)
(1. 寧波市奉化區(qū)城市投資發(fā)展集團有限公司,浙江 奉化 315502;2. 寧波市測繪和遙感技術研究院,浙江 寧波 315402)
有序加權平均(OWA)算子是一種集結信息算子,它能有效地集結數據信息,將其推廣到λ次冪,得到廣義有序加權平均(GOWA)算子。結合誘導變量可獲得誘導廣義有序加權平均(IGOWA)算子。將IGOWA 算子和廣義有序加權對數平均(GOWLA)算子相結合可定義一種新的算子,即誘導廣義有序加權對數平均(IGOWLA)算子。國內外學者研究的組合模型[1]大都以誤差平方和最小作為建模準則。近些年來,相關性指標被越來越多地應用到組合模型中。本文在此基礎上,將向量夾角余弦[2]與誘導廣義有序加權對數平均IGOWLA(算子)[3]相結合,構建了一種新的最優(yōu)組合預測模型。最后通過軟土路基沉降預測實例驗證此模型方法合理有效,可提高預測精度。
定義1令:
式中,i=1,2,…m,t=1,2,…N,則稱ait為第i種預測模型在t時刻的預測精度[4]。由式(1)可知,預測精度的范圍為:ait?[0 ,1] 。
根據預測連續(xù)性原則,獲得樣本區(qū)間上組合模型的最優(yōu)權系數后,可進行區(qū)間[N+1,N+2,…]上的預測,即未來k步的預測值,可采用第i種預測方法近k期擬合平均精度來代表預測區(qū)間N+k期預測精度的大小[5]。
定義2 設(u1,a1,u2,a2,…,un,an)為n個二維數組,W=(w1,w2,…,wn)T是與IOWGA算子相關的加權向量,且滿足wi=1,wi≥0,i=1,2,…,n。若:
則稱函數IGΟWLAw是由u1,u2,…un所產生的n維廣義有序加權對數平均算子,簡稱為IGOWLA 算子,其 中ui為ai的 誘 導 值,λ?(-∞,0)∪(0,∞) 。u-index(i)是u1,u2,…un第i大的數的下標。從以上公式可知,權系數wi的大小由數組ai,i=1,2,…,n所對應的誘導值的排序位置決定,與數本身的大小和位置無關[6]。
沉降預測中通常以預測精度ait作為預測值xit的誘導值,進而,可將兩者組成二維數組a1t,x1t,a2t,x2t,…,amt,xmt。將預測精度序列a1t,a2t,…amt按從大到小順序排序,設a-index(it)是第i大的預測精度的下標。據定義2可得:
則稱上式為第t時刻的IGOWLA算子的組合預測值[7],由其數學模型可知,基于IGOWLA算子的組合模型的預測精度與單項模型各時刻的擬合精度的大小密切相關,而與各模型各時刻的擬合精度大小密切相關。
定義3 稱eit=(lnxt)λ-()λ為第i種單項預測方法在第t時刻的對數λ次冪的預測誤差;稱et=(lnxt)λ-(?)λ為廣義誘導有序加權對數平均的組合預測值在第t時刻的對數的λ次冪的預測誤差。
根據上述定義,可得N期總的組合預測的對數的λ次冪的預測誤差平方和s為:
基于IGOWLA算子的最優(yōu)組合預測模型可表示成如下最優(yōu)化模型。
令:
式中,i,j=1,2…,m,則稱E=(Eij)m×m為m階廣義誘導有序加權對數平均組合預測無量綱化序列的對數的λ次冪的誤差信息矩陣。
傳統(tǒng)組合模型的建模方式單一,通常采用殘差平方和最小準則。為提高建模效率,豐富建模方法,實際建模時,以預測精度作為誘導變量且以向量夾角余弦作為建模準則,構建一種基于向量夾角余弦的IGOWLA算子的組合模型。
由向量夾角余弦的定義可知,ηi為第i種預測模型預測值向量Xi與其對應的實際值向量X的夾角余弦;η為組合預測值向量?與實際值向量X的夾角余弦,其中,i=1,2,…,m。
組合預測值與實際值對數向量的夾角余弦η可用加權系數l1,l2,…,lm的函數表示,簡記為:η(l1,l2,…,lm)。當實際值與預測值之間的向量夾角余弦越大時,表明預測值更加接近實際值,模型預測精度更高。當向量夾角余弦值達到1 時,表明預測值與實際值完全相等。根據上述描述及相關性質可得表達式:
該模型是一個非線性規(guī)劃模型,可利用相關規(guī)劃軟件解算各時刻單項模型的加權系數。
定義3 若組合預測值向量與實際值的向量夾角余弦η(l1,l2,…,lm)ηmin,則稱組合預測為劣性組合預測;若ηmin≤η(l1,l2,…,lm)≤ηmax,則稱之為非劣性組合預測;若η(l1,l2,…,lm)>ηmax,則稱之為優(yōu)性組合預測[8]。當且僅當組合模型的向量夾角余弦值最大,才是最優(yōu)組合。
模型預測效果的好壞通常需要建立相關的指標值來進行判定。本文采用5 種誤差評價準則來評定模型的預測精度和準確度[9],從而更加全面、準確地反映模型的精度高低。
1)均方誤差(MSE)為:
2)預測誤差平方和(SSE)為:
3)平均絕對誤差(MAE)為:
4)平均絕對百分比誤差(MAPE)為:
5)均方百分比誤差(MSPE)為:
本文選取某市一條新建城市道路作為研究對象,其竣工時間為2019年6月。為掌握道路竣工后路基的沉降變化情況,根據相關規(guī)范及技術要求,每隔30 m在道路中間及兩側布設了沉降測釘,按國家二等水準規(guī)范要求進行施測,觀測周期為15 d。選取2019 年6 月—2020 年2 月期間的19 期觀測數據作為研究對象,其中前15期數據作為模型構建數據,后4期數據為預測對比數據,沉降量觀測數據如表1所示。
表1 軟土路基累計沉降數據
首先,采用3種常用的軟土路基沉降預測模型[10]對其沉降量進行預測分析,分別為灰色預測模型、雙曲線模型、S 型預測模型,最后,采用式8 構建的組合模型對軟土路基進行預測。
本文采用GM(1,1)模型對路基沉降量進行預測,利用觀測所得到的前15期數據建立灰色模型,其中時間步長為=30,灰色模型如下式所示:
將原始觀測數據進行累加后可建立微分方程,賦予一定權值后,解算得到(?)=(0.253 2,17.129 6)。最終得原始數據預測模型為:X(0)(t+1)=16.770 5e-0.2532t。利用上述模型表達式可計算得出每期沉降量。
式中,S0為原始沉降量(t=0);St為t時刻的沉降量;t為時間間隔;α、β為由實測值求得的系數。
根據觀測數據和雙曲線模型函數可得:St=34.48+t(1.255+0.03t)。由此預測沉降點各期的沉降量,結果如表2所示。
3) 本文選取S型曲線模型中的Mmrgan-Mer?cer-Flodin模型(MMF模型)作為預測模型,表達式為:
式中,yt為沉降量;L、a、b、r均為大于0的系數。
MMF 模型:由前15 期數據可得模型參數值為a=5.567、b=9 197.446 7、L=72、r=1.917 5 ,yt=(51 202.185 8+72t1.9175)/(9 197.446 7+t1.9175)。根據模型表達式,可得出監(jiān)測點每期沉降量,根據精度定義表達式(1)可獲得各模型的預測精度,預測結果如表2所示。
表2 單一模型擬合值與實際值對比
由單項預測方法的精度及相應的預測值組成二維數組(a1t,x1t),(a2t,x2t),…(amt,xmt),t=1,2,…19,根據式(2)可獲得每期IGOWLA 算子的組合預測值。根據式(8)可獲得組合模型的表達式為:
解算上述非線性規(guī)劃函數,可得:l1=0.753 5,l2=0.143 5,l3=0.103 0。
分析對比表2 的數據可知,單項模型預測精度的持續(xù)性及穩(wěn)定性較差,3 種模型的預測精度在不同時期各有高低,其在一定程度上均能反映實際沉降情況,但不夠全面且可能存在錯誤信息。根據組合模型構建原則,實際應根據單項模型各時刻的擬合以及預測精度進行賦權,不可單依據模型種類賦權。根據式3,可得出各時刻組合預測值如下表3所示。
根據殘差信息可獲得3 種單一模型及組合模型的精度評價指標值,具體如表4 所示。根據各模型預測值繪制預測曲線圖如圖1所示。
由表1、表2、表3的模型預測數據可知,相對于3 種單項預測模型,組合模型的預測殘差值最小,精度值最高且更接近于實際觀測值。由表4 的數據可知,組合模型的5 種精度評價值均最小,從而可判定組合模型的預測精度更高,預測精度的穩(wěn)定性及持續(xù)性更強且預測性能更加良好。從圖1 的預測曲線圖可知,組合模型相對于單一模型,其曲線變化趨勢更加吻合實際情況。
圖1 模型預測曲線圖
表3 組合預測值
表4 模型擬合精度評價指標
計算各模型的向量夾角余弦值分別為:η灰色=0.994 82,η雙=0.995 45,ηS=0.996 13,η組合=0.998 15。由此可知,組合模型的向量夾角余弦值最大,為優(yōu)性組合模型。
根據預測連續(xù)性原則,利用建模的觀測數據越多,其獲得的預測模型精度越高,越能反映實際情況,即利用16期觀測數據所建立的預測模型的精度要高于15 期觀測數據所建立的預測模型,同理,利用17期觀測數據建立的預測模型精度更高,預測更準確。
1)各單項預測方法均包含一定的有效信息,在某時刻能較好地反映實際變化情況,但往往其精度不具有持續(xù)性,個別時段可能存在錯誤信息。本文提出的組合模型能充分、利用各單項預測模型的有效信息,避免錯誤信息的影響,提高數據預測精度,由預測結果可知組合模型在路面沉降數據預測中得到了良好的應用,可以為類似數據預測提供借鑒。
2)本文通過對組合模型相關理論的闡述,引入了IGQWLA 算子及向量夾角余弦的定義,并提出了基于向量夾角余弦的組合模型構建方法及優(yōu)性組合判定方法。實例證明,該方法切實可行,能有效提高預測數據的精度,可廣泛應用于相關工程項目的數據處理中。
3)本文提出的模型精度計算方法科學合理,能準確地反映模型預測效果的好壞,是判定精度高低的重要指標。