路 楊,呂 欣,周福娜,王佳瑜
(河南大學(xué) 計算機與信息工程學(xué)院,河南 開封 475004)
基于缺失數(shù)據(jù)估計的PLSS古建筑壽命預(yù)測
路 楊,呂 欣,周福娜,王佳瑜
(河南大學(xué) 計算機與信息工程學(xué)院,河南 開封 475004)
影響木結(jié)構(gòu)古建筑壽命的因素主要包括物理、化學(xué)和生物等多個方面,且影響過程是錯綜復(fù)雜的。這些因素之間可能非線性相關(guān),相應(yīng)觀測數(shù)據(jù)特征提取的完整性決定了其壽命預(yù)測的精確性。文中引入基于樣條變換的偏最小二乘預(yù)測方法,在更高維空間中把非線性預(yù)測模型的建立問題轉(zhuǎn)化為線性預(yù)測模型的建立問題實現(xiàn)木結(jié)構(gòu)古建筑壽命預(yù)測。針對觀測數(shù)據(jù)缺失情況下,基于樣條變換的非線性偏最小二乘方法預(yù)測精度較低的問題,文中給出一種基于缺失數(shù)據(jù)估計的非線性偏最小二乘預(yù)測方法,以更充分地抽取可用觀測數(shù)據(jù)的特征信息,并將其應(yīng)用于木結(jié)構(gòu)古建筑壽命預(yù)測中。仿真和實驗驗證結(jié)果表明了該方法的有效性。
數(shù)據(jù)缺失;樣條變換;偏最小二乘回歸;古建筑;壽命預(yù)測
木構(gòu)古建筑是我國的歷史見證之一,對了解歷史、傳承民族文化都有積極、深遠的意義;充分反映我國的科技水平,且是不可再生資源,具有極高的社會、經(jīng)濟和文化價值。在歷經(jīng)歲月滄桑的保存過程中,由于人為的和自然力的破壞,木構(gòu)古建筑都不同程度地遭受損害,甚至毀滅。科學(xué)準確地預(yù)測木構(gòu)古建筑的使用壽命,對重大木結(jié)構(gòu)的管理維護具有重要的意義[1]。由于影響木構(gòu)古建筑壽命的因素眾多,影響過程錯綜復(fù)雜,難以用準確的數(shù)學(xué)表達式來描述,所以研究基于數(shù)據(jù)特征抽取技術(shù)的壽命預(yù)測方法具有重要意義。
關(guān)于木構(gòu)古建筑論文多是遺產(chǎn)保護[2]、測繪方法技術(shù)[3]、修繕方法[4],地震災(zāi)害[5]等。對木構(gòu)古建筑壽命預(yù)測的算法較少,多集中于木結(jié)構(gòu)累積損傷模型[6]、有限元分析模型[7]和BP神經(jīng)網(wǎng)絡(luò)[8]等。木結(jié)構(gòu)累積損傷模型,由于結(jié)構(gòu)的特點,技術(shù)問題較為復(fù)雜,目前各種技術(shù)標準和規(guī)范不能全部覆蓋[9]。有限元分析,受到分析軟件功能的限制,在選擇單元屬性以及屈服準則的時候,是不精確的[10]。集中在木構(gòu)件自身的承受能力和結(jié)構(gòu)特性。BP神經(jīng)網(wǎng)絡(luò)算法本質(zhì)上為梯度下降法,且至今尚無一種統(tǒng)一而完整的理論指導(dǎo),一般只能由經(jīng)驗選定,具有不確定性。這些算法均是建立在數(shù)據(jù)完整的基礎(chǔ)上的。
文中引入基于樣條變換的非線性偏最小二乘回歸[11](Partial Least-Squares Splines,PLSS)方法,跳出了之前木構(gòu)古建筑壽命預(yù)測的純結(jié)構(gòu)特性和力學(xué)特性,建立在數(shù)據(jù)基礎(chǔ)上對木構(gòu)古建筑壽命進行預(yù)測。木構(gòu)古建筑所測數(shù)據(jù)是復(fù)雜的非線性關(guān)系,樣條變換將所測數(shù)據(jù)的非線性問題轉(zhuǎn)換為擬線性問題,既解決了所測數(shù)據(jù)間的非線性問題,又保留了偏最小二乘[12](Partial Least-Squares regression,PLS)算法的預(yù)報能力。木構(gòu)古建筑由于傳感器故障或離線維護,人為漏采集數(shù)據(jù)等造成數(shù)據(jù)缺失或不匹配等,堅持通過完整數(shù)據(jù)進行木構(gòu)古建筑壽命預(yù)測,需要刪除大量數(shù)據(jù),不僅造成人力物力的嚴重浪費,而且預(yù)測結(jié)果具有較大預(yù)測誤差。PLSS算法不能解決采集數(shù)據(jù)的缺失問題,為對缺失參數(shù)數(shù)據(jù)進行合理且有效的估計[13],并且科學(xué)地對木構(gòu)古建筑壽命進行預(yù)測,文中提出一種基于缺失數(shù)據(jù)估計的PLSS預(yù)測方法并將其應(yīng)用于木構(gòu)古建筑壽命預(yù)測中,對采集數(shù)據(jù)中缺失數(shù)據(jù)進行估計,使采集數(shù)據(jù)得到充分利用,并且提高了壽命預(yù)測的準確度。
1.1 PLS
自變量與因變量的數(shù)據(jù)表X=[x1,x2,…,xp]n×p和Y=[y1,y2,…,yq]n×q。PLS預(yù)測模型步驟為:
(1)
(2)
其中,p1=XTt1/‖t1‖2、r1=YTt1/‖t1‖2為負荷向量;X1、Y1為殘差矩陣,將X1、Y1代替X、Y進行求解。
(3)
其中,k是通過交叉有效性確定的。
(4)
PLS算法[14]對具有線性關(guān)系的變量,具有很好的預(yù)測能力,但是木構(gòu)古建筑變量間是復(fù)雜的非線性關(guān)系,PLS并不能很好地進行預(yù)測。
在我國的木構(gòu)古建筑中存在大量梁柱式的木結(jié)構(gòu),最典型的有殿堂式木結(jié)構(gòu),這些結(jié)構(gòu)的存在對研究我國的歷史和建筑技術(shù)發(fā)展具有非常重要的意義。影響木構(gòu)古建筑壽命的因素主要有荷載因素、環(huán)境因素、結(jié)構(gòu)材料因素、力學(xué)因素、微生物等,其中選取最重要的影響因素—蟲蛀面積率、腐朽深度、應(yīng)力水平、蟲蛀面積的均值及其變異系數(shù)和開裂深度的均值及其變異系數(shù)來進行壽命預(yù)測。木構(gòu)古建筑壽命預(yù)測關(guān)注的質(zhì)量指標僅有一個即剩余壽命,所以文中討論q=1,p=6情況下的木構(gòu)古建筑數(shù)據(jù)特征抽取和預(yù)測問題。
1.2 PLSS
在實際應(yīng)用中,由于因變量和自變量之間的關(guān)系常常不是線性的,它們之間存在著復(fù)雜的非線性關(guān)系。傳統(tǒng)的PLS僅適用于線性模型,實際應(yīng)用中造成較大偏差。PLSS算法[15]是在PLS算法中加入樣條變換,用分段擬合的思想構(gòu)造樣條函數(shù),具有按需要裁剪以適應(yīng)任意曲線連續(xù)變化的優(yōu)點,樣條函數(shù)具有光滑性、連續(xù)性。
Step1:采集自變量和因變量[X,Y],對自變量X進行樣條變換,在高維空間中把非線性問題轉(zhuǎn)化為擬線性問題。模型采用三次B樣條函數(shù)作為變換基數(shù)。
(5)
其中,ξj,l-1為對變量xj劃分所增加的插入點;hj為對變量xj劃分的分段長度。
記變量xj的最小觀測值為min(xj),最大觀測值為max(xj),有
ξj,l-1=min(xj)+(l-1)hj
(6)
(7)
其中,Mj為對變量xj劃分的分段個數(shù)。
全體自變量與因變量的非線性函數(shù)關(guān)系為:
PLSS預(yù)測是建立在數(shù)據(jù)完整的基礎(chǔ)上的,數(shù)據(jù)有缺失的情況下預(yù)測精度較差。故文中提出基于缺失數(shù)據(jù)估計的PLSS預(yù)測算法。
Step1:采集數(shù)據(jù)X0,其中缺失部分賦該列均值得數(shù)據(jù)X。
其中,負荷向量pi∈Rm×1;得分向量ti=Xpi,ti∈Rn×1。
(9)
記Zj=(zj,0,zj,1,…,zj,Mj+2),所得新的數(shù)據(jù)為[Z,Y]=[Z1,Z2,…,Zm,Y]。
Step5:對[Z,Y]=[Z1,Z2,…,Zm,Y]進行標準化處理,以去除量綱的影響。
(12)
(13)
得到
(14)
其中
(15)
從而可建立起Y關(guān)于X的非線性回歸模型進行木構(gòu)古建筑壽命預(yù)測。
(16)
圖1為基于缺失數(shù)據(jù)估計的PLSS預(yù)測框圖。在木構(gòu)古建筑中每個木構(gòu)件的壽命均對該建筑的壽命有影響,不能機械地刪除其中任何一個部件的數(shù)據(jù),或者是刪除某一項壽命預(yù)測重要指標,所以對缺失數(shù)據(jù)的估計對木構(gòu)古建筑壽命預(yù)測具有實踐意義。
圖1 基于缺失數(shù)據(jù)估計的PLSS預(yù)測流程圖
本節(jié)首先采用模擬數(shù)值仿真的基于缺失數(shù)據(jù)估計的PLSS算法,利用相對預(yù)測誤差對文中的PLSS算法進行測試,然后利用實際采集數(shù)據(jù)的基于缺失數(shù)據(jù)估計的PLSS算法對木結(jié)構(gòu)古建筑壽命進行預(yù)測。
3.1 數(shù)據(jù)仿真實驗
首先采用模擬數(shù)值驗證的基于缺失數(shù)據(jù)估計的PLSS算法,并利用相對預(yù)測誤差衡量預(yù)測算法的精度。觀測數(shù)據(jù)矩陣X=[x1,x2,x3]n×3和Y=[y]n×1,樣本個數(shù)均為n=30。
x1=randn(n,1)
(17)
x2=randn(n,1)
(18)
(19)
(20)
x3中第21到30的數(shù)據(jù)缺失,對缺失數(shù)據(jù)進行估計,并對重構(gòu)后的數(shù)據(jù)進行樣條變換,對數(shù)據(jù)進行擴維。并對基于缺失數(shù)據(jù)估計的PLSS預(yù)測、基于PLSS刪除缺失數(shù)據(jù)項模型預(yù)測、基于PLSS缺失值補0后做預(yù)測以及BP神經(jīng)網(wǎng)絡(luò)預(yù)測方法進行比較。
圖2給出了不同預(yù)測方法的仿真結(jié)果。其中,橫坐標表示預(yù)測樣本,縱坐標表示樣本對應(yīng)的預(yù)測輸出。
圖2 不同預(yù)測方法的仿真結(jié)果
圖2表明,基于缺失數(shù)據(jù)估計的PLSS預(yù)測相比其他算法與實際值更吻合。
表1給出了不同預(yù)測方法所得相對預(yù)測誤差比較,其中相對預(yù)測誤差通過式(21)定義。
(21)
表1 不同預(yù)測方法預(yù)測結(jié)果精度比較
表1表明,基于缺失數(shù)據(jù)估計的PLSS方法預(yù)測精度更高,預(yù)測值更接近于期望輸出,且相對預(yù)測誤差較小。
3.2 實驗驗證
本節(jié)采用歷史建筑木結(jié)構(gòu)殿堂式結(jié)構(gòu),采集到觀測變量有6個,應(yīng)力水平x1和腐朽深度x2、蟲蛀面積的均值x3、變異系數(shù)x4和開裂深度的均值x5、變異系數(shù)x6[1]作為自變量X0=[x1,x2,…,x6];壽命預(yù)測年數(shù)作為因變量Y=[y1]n×1,如表2所示。
表2 實際采集數(shù)據(jù)
圖3 不同預(yù)測方法的實測數(shù)據(jù)結(jié)果
圖3表明,基于缺失數(shù)據(jù)估計的PLSS木構(gòu)古建筑預(yù)測值相比較其他算法與實際壽命值更吻合。
表3給出幾種不同預(yù)測算法的相對預(yù)測誤差比較。
表3 實際采集數(shù)據(jù)預(yù)測方法精度比較
從表3中看出,基于缺失數(shù)據(jù)估計的PLSS方法對木構(gòu)古建筑的壽命預(yù)測優(yōu)于其他三種模型,預(yù)測值更接近于期望輸出,預(yù)測精度更高。
木構(gòu)古建筑實際采集數(shù)據(jù)存在數(shù)據(jù)缺失情況下,為了充分提取現(xiàn)有觀測數(shù)據(jù)中的信息,建立了基于缺失數(shù)據(jù)估計的PLSS壽命預(yù)測方法來實現(xiàn)變量間非線性較強情況下的木構(gòu)古建筑的壽命預(yù)測。經(jīng)仿真測試或?qū)嶒烌炞C均表明了該方法的有效性,可以更好地為木構(gòu)古建筑視情維護提供決策依據(jù)。
[1] 王雪亮.歷史建筑木結(jié)構(gòu)基于可靠度理論的剩余壽命評估方法研究[D].武漢:武漢理工大學(xué),2008.
[2] 劉澤謙,付 宏,王 明.隆里古鎮(zhèn)建筑文化遺產(chǎn)的保護與開發(fā)[J].產(chǎn)業(yè)與科技論壇,2015(12):242-243.
[3] 曹 勇.現(xiàn)代科技在古建筑測繪中的應(yīng)用[J].現(xiàn)代物業(yè):上旬刊,2011(3):54-56.
[4] 姜叢梅.結(jié)合古建筑修繕工程實例淺談古建筑保護修繕方法[J].江蘇建筑,2015(3):57-61.
[5] 周 乾,閆維明,楊小森,等.汶川地震導(dǎo)致的古建筑震害[J].文物保護與考古科學(xué),2010,22(1):37-45.
[6] 王 陽,楊 娜.基于累積損傷理論的古木構(gòu)件剩余壽命計算方法[J].北京交通大學(xué)學(xué)報:自然科學(xué)版,2015,39(1):45-51.
[7] 王 陽.殿堂式古建木構(gòu)有限元分析與可靠度評估[D].北京:北京交通大學(xué),2014.
[8] 路 楊,李鵬珊,翟盼盼.改進BP神經(jīng)網(wǎng)絡(luò)在木構(gòu)古建筑中的壽命預(yù)測[J].計算機技術(shù)與發(fā)展,2014,24(5):207-210.
[9] 李 瑜.古建筑木構(gòu)件基于累積損傷模型的剩余壽命評估[D].武漢:武漢理工大學(xué),2008.
[10] 岳元元.清代徽派木結(jié)構(gòu)古民居塑性有限元分析[J].安徽建筑,2015,22(3):143-145.
[11] 王惠文,吳載斌,孟 潔.偏最小二乘回歸的線性與非線性方法[M].北京:國防工業(yè)出版社,2006:191-215.
[12] 王惠文.偏小二乘回歸方法及應(yīng)用[M].北京:國防工業(yè)出版社,1999:150-171.
[13]NelsonPRC,TaylorPA,MacGregorJF.MissingdatamethodsinPCAandPLS:scorecalculationswithincompleteobservations[J].ChemometricsandIntelligentLaboratorySystems,1996,35(1):45-65.
[14] 劉 強,尹 力.一種簡化遞推偏最小二乘建模算法及其應(yīng)用[J].北京航空航天大學(xué)學(xué)報,2003,29(7):640-643.
[15] 吳曉華,陳德釗.化學(xué)計量學(xué)非線性偏最小二乘算法進展評述[J].分析化學(xué),2004,32(4):534-540.
[16]MutekiK,MacGregorJF,UedaT.Estimationofmissingdatausinglatentvariablemethodswithauxiliaryinformation[J].ChemometricsandIntelligentLaboratorySystems,2004,781:41-50.
Prediction of Ancient Building Life for PLSS Based on Missing Data Estimation
LU Yang,Lü Xin,ZHOU Fu-na,WANG Jia-yu
(School of Computer and Information Engineering,Henan University,Kaifeng 475004,China)
The factors that affect the life of the ancient building of the wood structure include many aspects,such as physical,chemical and biological factors,and the process of impact is complicated.These factors may be nonlinear correlation,and the completeness of the corresponding observation data feature extraction determines the accuracy of the life prediction.In this paper,the PLS based on spline transformation is introduced,and the problem of building the nonlinear model in higher dimensional space is transformed into it of building the linear model to realize the life prediction of wood structure.In order to estimate the accuracy of the nonlinear PLS method based on the case of the missing data,a nonlinear PLS prediction method is given based on the missing data estimation to extract the feature information of the available observation data more adequately and used in the life prediction of wood structures.Simulation and experimental verification results show the effectiveness of the proposed method.
data missing;spline transformation;Partial Least-Squares Regression (PLSS);ancient building;life prediction
2015-09-12
2015-12-16
時間:2016-05-25
國家自然科學(xué)基金資助項目(61203094,61174112);河南省高??萍紕?chuàng)新人才支持計劃(2012HASTIT005)
路 楊(1972-),女,博士,教授,研究方向為模式識別、數(shù)據(jù)挖掘;呂 欣(1987-),女,碩士研究生,研究方向為故障診斷。
http://www.cnki.net/kcms/detail/61.1450.TP.20160525.1706.034.html
TP301
A
1673-629X(2016)06-0195-05
10.3969/j.issn.1673-629X.2016.06.044