趙 卿,周興東
減弱觀測(cè)誤差對(duì)回歸模型的影響研究
趙 卿1,2,周興東1
(1.江蘇師范大學(xué)測(cè)繪學(xué)院,江蘇徐州 221116;2.江西省數(shù)字國(guó)土重點(diǎn)實(shí)驗(yàn)室,江西撫州 344000)
對(duì)變形監(jiān)測(cè)序列進(jìn)行數(shù)據(jù)建模分析時(shí),含有誤差的監(jiān)測(cè)數(shù)據(jù)會(huì)對(duì)模型的建立產(chǎn)生較大的影響。提出一種“事件”模型改變?cè)加^測(cè)序列的表達(dá)形式,通過(guò)對(duì)原始觀測(cè)數(shù)據(jù)進(jìn)行轉(zhuǎn)換,對(duì)變形監(jiān)測(cè)數(shù)據(jù)按照某種規(guī)則進(jìn)行分類劃分,劃分后的數(shù)據(jù)能夠適應(yīng)Cox模型。根據(jù)經(jīng)驗(yàn)或者實(shí)際情況,適當(dāng)調(diào)節(jié)“事件”模型參數(shù),在一定程度上可以減弱觀測(cè)誤差帶給Cox回歸模型的影響,算例分析進(jìn)一步論證了該模型計(jì)算結(jié)果的準(zhǔn)確度能夠進(jìn)一步地提高計(jì)算結(jié)果的準(zhǔn)確度。
觀測(cè)誤差;變形監(jiān)測(cè);事件模型;Cox回歸模型
變形監(jiān)測(cè)對(duì)觀測(cè)精度有很高的要求,而監(jiān)測(cè)過(guò)程中不可避免受到外界條件干擾(如水汽等)而帶來(lái)觀測(cè)誤差,通過(guò)平差的方法可以消除每期觀測(cè)結(jié)果含有的偶然誤差,但是在整個(gè)監(jiān)測(cè)時(shí)期內(nèi),監(jiān)測(cè)點(diǎn)的觀測(cè)序列中含有的誤差仍然無(wú)法消除[1-2],而且較大的誤差會(huì)對(duì)后續(xù)建模分析產(chǎn)生很大影響[3];實(shí)際監(jiān)測(cè)工作中,小波變換進(jìn)行消噪是目前處理含有噪聲信息的監(jiān)測(cè)序列較為常用的辦法[3]。該方法對(duì)減弱誤差對(duì)觀測(cè)序列的影響,具有很好的效果[4]。本文提出一種“事件”模型來(lái)變換監(jiān)測(cè)序列,通過(guò)調(diào)節(jié)模型參數(shù),可以減弱觀測(cè)誤差對(duì)數(shù)據(jù)分析結(jié)果的影響,應(yīng)用Cox回歸模型計(jì)算[5-6]得到對(duì)變形數(shù)據(jù)分析的新方法。
建立“事件”模型的假設(shè)為:上次“事件”的發(fā)生對(duì)下一次“事件”的發(fā)生遲早會(huì)產(chǎn)生很大影響[5,7]。在變形監(jiān)測(cè)數(shù)據(jù)分析過(guò)程中,監(jiān)測(cè)點(diǎn)在某時(shí)刻的變形信息,在一定程度上要受到前一時(shí)期內(nèi)變形結(jié)果的影響。基于此假設(shè),在變形監(jiān)測(cè)數(shù)據(jù)分析中,對(duì)監(jiān)測(cè)資料中的位移量建立如下“事件”模型。
(1)設(shè)監(jiān)測(cè)資料中第i監(jiān)測(cè)點(diǎn)在監(jiān)測(cè)時(shí)刻j的位移量數(shù)據(jù)為δij(i=1,2,…,n;j=1,2,…,m),計(jì)算該監(jiān)測(cè)點(diǎn)在相鄰觀測(cè)時(shí)刻間的平均位移速率vij(i=1,2,…,n;j=1,2,…,m-1),并以矩陣的形式表達(dá),即
式中,Vi(i=1,2,…,n)表示第i個(gè)監(jiān)測(cè)點(diǎn)的位移序列。
(2)根據(jù)監(jiān)測(cè)資料中各個(gè)監(jiān)測(cè)點(diǎn)的平均位移速率vij(i=1,2,…,n;j=1,2,…,m-1),計(jì)算該監(jiān)測(cè)資料的位移速率閾值
或者憑多年觀測(cè)經(jīng)驗(yàn),給定一個(gè)位移速率的閾值v0,定義“監(jiān)測(cè)點(diǎn)位移速率vij和給定閾值v0的比較結(jié)果”為“事件”,用eij(i=1,2,…,n;j=1,2,…,m-1)表示。
(3)對(duì)于第i個(gè)監(jiān)測(cè)點(diǎn),如果滿足“vij<v0”,則稱監(jiān)測(cè)點(diǎn)i在時(shí)刻j為“事件未發(fā)生”狀態(tài),相應(yīng)的eij=0;如果滿足“vij>v0”,則稱監(jiān)測(cè)點(diǎn)i在時(shí)刻j為“事件發(fā)生”狀態(tài),相應(yīng)的eij=1,即,以監(jiān)測(cè)點(diǎn)位移速率vij與閾值v0的比較結(jié)果,決定各監(jiān)測(cè)點(diǎn)的“事件”狀態(tài),并把式(1)表達(dá)成“事件矩陣”其中,Ei(i=1,2,…,n)表示第i個(gè)監(jiān)測(cè)點(diǎn)的“事件”狀態(tài)序列。
通過(guò)上述步驟(1)—(3),可以將原始觀測(cè)數(shù)據(jù)位移δij轉(zhuǎn)化成“事件”eij,完成“事件”模型的建立。
分析“事件”模型的建立的過(guò)程,可以發(fā)現(xiàn)該模型在一定程度上可以減弱觀測(cè)誤差的影響。
變形監(jiān)測(cè)的過(guò)程,不可避免地會(huì)有各類誤差源的干擾,尤其是在觀測(cè)條件較差的環(huán)境里,致使計(jì)算得到的位移數(shù)據(jù)帶有誤差。通過(guò)適當(dāng)調(diào)整位移速率的閾值v0,可以有效減弱觀測(cè)誤差的影響。
例如,由于觀測(cè)條件較差(受水汽較大等影響),第i監(jiān)測(cè)點(diǎn)在j時(shí)刻的Xij坐標(biāo)含有誤差,設(shè)真值為為觀測(cè)值,觀測(cè)精度為σij,真誤差為εij,則
假定本期與上期觀測(cè)為等精度觀測(cè),間隔為δtij=tij-ti,j-1,則本期的位移為
平均速率的精度為
按照常規(guī)的分析計(jì)算(如回歸分析、時(shí)間序列等方法),以位移為研究對(duì)象,可以明顯看到由于觀測(cè)誤差εij影響,致使回歸模型在此刻的輸入數(shù)據(jù)δij中含有εij-εi,j-1誤差;如果建立“事件”模型,根據(jù)需要,調(diào)整位移速率的閾值v0,使得第i監(jiān)測(cè)點(diǎn)在j時(shí)刻的“事件”狀態(tài)保持一致,不受原始觀測(cè)值含有的誤差之影響。例如調(diào)整閾值v0為
v0的調(diào)節(jié)范圍在,可以始終讓第i監(jiān)測(cè)點(diǎn)在j時(shí)刻的“事件”狀態(tài)為eij=0作為模型輸入,則可以有效減弱原始觀測(cè)誤差σ的影響。
由于各個(gè)觀測(cè)值含有的真誤差εij未知,則在調(diào)節(jié)閾值v0范圍時(shí),參考式(7),可以取2倍于平均速率的中誤差作為調(diào)節(jié)限差;由于每個(gè)監(jiān)測(cè)時(shí)期的觀測(cè)精度σij及時(shí)間間隔δtij不同,所以調(diào)節(jié)限差εv大小,可以取
式中:
為了使調(diào)節(jié)限差的結(jié)果不至于影響所有監(jiān)測(cè)點(diǎn)的情況,需要嚴(yán)格控制調(diào)節(jié)限差εv大小,可以取
3.1 事件模型的建立
結(jié)合我國(guó)某大壩為例[8],取該變形體上某部位的16個(gè)監(jiān)測(cè)點(diǎn)數(shù)據(jù)為例,由于觀測(cè)該監(jiān)測(cè)部位的視線不得不穿過(guò)水面,致使觀測(cè)結(jié)果受水汽的影響較大,觀測(cè)數(shù)據(jù)含有大量的噪聲,如圖1所示。通過(guò)對(duì)原始觀測(cè)數(shù)據(jù)序列的擬合,計(jì)算得到16個(gè)監(jiān)測(cè)點(diǎn)各自在x方向的觀測(cè)精度,如圖2所示。
圖1 監(jiān)測(cè)點(diǎn)位移過(guò)程線Fig.1 Process of disp lacement atmonitoring points
圖2 原始觀測(cè)中誤差Fig.2 Mean square errors of the original observations
根據(jù)式(2)計(jì)算得到平均位移速率閾值v0=1.90 mm/d;由于觀測(cè)值的真誤差無(wú)法得到,故采用式(9)計(jì)算可以調(diào)整限差εv的大小。最大天數(shù)間隔為max{δtij}=14 d,根據(jù)圖2,最小原始觀測(cè)中誤差min{σij}=3.26 mm,根據(jù)式(10)得到εv=±0.66 mm/d。
為了書寫及表述方便,選取監(jiān)測(cè)點(diǎn)P3~P7這5個(gè)監(jiān)測(cè)點(diǎn)自2003年4月11日至2004年7月11日間部分?jǐn)?shù)據(jù)。位移數(shù)據(jù)及平差后各監(jiān)測(cè)時(shí)刻的真誤差估計(jì)值如圖3所示。
圖3 位移過(guò)程線及各時(shí)期真誤差估計(jì)值Fig.3 Displacement process and estimated true errors in each period
在沒有受到觀測(cè)誤差影響前,根據(jù)式(3)及平均位移速率閾值v0=1.90 mm/d,得事件矩陣ME;如果考慮每個(gè)監(jiān)測(cè)時(shí)刻觀測(cè)誤差的影響,顧及式(6),其事件矩陣為M′E;根據(jù)式(10),調(diào)節(jié)εv大小,本例前面計(jì)算得到εv∈[-0.66,0.66],根據(jù)式(8)適度調(diào)整閾值v0=1.90+0.22=2.12 mm/d,據(jù)此計(jì)算事件矩陣M″E,如圖4所示。
圖4 各計(jì)算結(jié)果的狀態(tài)矩陣Fig.4 Statusmatrices in three form s
比較圖4中的3個(gè)事件矩陣可以看出,由于受到原始觀測(cè)誤差的影響(如圖3中的“Err”線所示),致使事件狀態(tài)矩陣M′E與ME有較大差異,如果按照事件狀態(tài)矩陣M′E進(jìn)行分析計(jì)算(如回歸分析、時(shí)間序列等),那么計(jì)算結(jié)果會(huì)受到原始誤差很大的影響;而通過(guò)“事件”模型調(diào)節(jié)εv大小,適度調(diào)整閾值v0,得到事件矩陣M″E,可以發(fā)現(xiàn),事件矩陣M″E與ME僅存在少量差異,在進(jìn)行Cox回歸模型計(jì)算時(shí)[6],分析結(jié)果受原始誤差的影響將會(huì)得到有效的控制。
3.2 Cox回歸模型計(jì)算結(jié)果
仿照?qǐng)D4數(shù)據(jù)變換過(guò)程,對(duì)圖1的觀測(cè)序列計(jì)算事件狀態(tài)矩陣,分別將事件狀態(tài)矩陣的3種計(jì)算結(jié)果ME,M′E和M″E代入Cox回歸模型計(jì)算[6,9],結(jié)果如表1所示。
表1 3種不同事件矩陣的Cox回歸模型計(jì)算結(jié)果Table 1 Results calculated by Cox regression model from three different statusmatrices
從表1可以看出,由于觀測(cè)序列含有偶然誤差的影響,致使M′E矩陣代入Cox回歸模型計(jì)算得到的風(fēng)險(xiǎn)比超過(guò)ME的計(jì)算結(jié)果,而經(jīng)過(guò)模型參數(shù)調(diào)節(jié)得到的M″E矩陣,其回歸模型計(jì)算結(jié)果,接近M′E矩陣的Cox模型計(jì)算結(jié)果,即調(diào)節(jié)模型參數(shù)后的事件矩陣,減弱了原始觀測(cè)數(shù)據(jù)中誤差對(duì)Cox回歸模型計(jì)算結(jié)果的影響。
結(jié)合“風(fēng)險(xiǎn)比”的解釋意義,實(shí)際上,隨著監(jiān)測(cè)時(shí)間的推移,該變形體整體的位移速率呈逐步下降的趨勢(shì),按照M′E矩陣(即受原始數(shù)據(jù)觀測(cè)誤差的影響)的計(jì)算結(jié)果,平均約遞減92.0%;按照M″E矩陣(即調(diào)節(jié)事件模型參數(shù)后)的計(jì)算結(jié)果,平均約遞減95.8%,接近以ME矩陣(即原始數(shù)據(jù)不含有觀測(cè)誤差)為準(zhǔn)的計(jì)算結(jié)果96.5%。
對(duì)于變形觀測(cè)工作來(lái)講,由于受觀測(cè)條件影響(如水汽較大),致使觀測(cè)結(jié)果不可避免地受到一定影響??梢越ⅰ笆录蹦P蛯?duì)原始數(shù)據(jù)進(jìn)行轉(zhuǎn)換,把原始監(jiān)測(cè)數(shù)據(jù)轉(zhuǎn)換成“事件狀態(tài)”數(shù)據(jù),通過(guò)調(diào)節(jié)模型參數(shù)、速率閾值參數(shù)的大小,在一定程度上可以減弱觀測(cè)誤差帶給Cox加固歸模型的影響,能夠進(jìn)一步提高計(jì)算結(jié)果的準(zhǔn)確度。
[1] BONALDIP,F(xiàn)ANELLIM,GIUSEPPETTIG.Displacement Forecasting for Concrete Dams via Deterministic Mathematical Models[J].InternationalWater Power andDam Construction,1977,29(9):42-45.
[2] FANELLIM,GIUSEPPETTIG.Techniques to Evaluate Effects of Internal Temperatures in Mass Concrete[J].InternationalWater Power and Dam Construction,1975,(6):162-168.
[3] 文鴻雁,張正祿.小波分析與傅立葉變換相結(jié)合在探測(cè)周期性變形中應(yīng)用[J].測(cè)繪通報(bào),2004,(4):14-16.(WEN Hong-yan,ZHANG Zheng-lu.Detection of the Periodical Signal in the Deformation Analysis with Wavelet and Fourier Transformation[J].Bulletin of Surveying and Mapping,2004,(4):14-16.(in Chinese))
[4] 陳 剛,趙 斌,胡友健,等.無(wú)電離層延遲組合GPS數(shù)據(jù)的小波預(yù)處理方法研究[J].測(cè)繪學(xué)報(bào),2009,38(6):477-481.(CHEN Gang,ZHAO Bin,HU Youjian,et al.Research on GPS Pre-processing Method for Ionosphere-free Combination Data Using Wavelet[J].Acta Geodaetica et Cartographica Sinica,2009,38(6):477-481.(in Chinese))
[5] PURER E,STEINER N.Application of Statistical Methods in Monitoring Dam Behavior[J].InternationalWater Power and Dam Construction,1986,(12):33-35.
[6] COX D R.Regression Models and Life Tables(with Discussion)[J].Journal of the Royal Statistical Society,Series B,1972,(34):187-220.
[7] MARUBINI E,VALSECCHIM G.Analyzing Survival Data Form Clinical Trials and Observational Studies[M].Chichester,UK:John Wiley&Sons,1994.
[8] 趙 卿.大壩變形分析多測(cè)點(diǎn)統(tǒng)計(jì)模型的應(yīng)用研究[D].武漢:武漢大學(xué),2010:92-100.(ZHAO Qing.Research and Application of the Multi-point Statistical Model on Dam-deformation Analysis[D].Wuhan:Wuhan University,2010:92-100.(in Chinese))
[9] 趙 卿,黃聲享.一種分析大壩整體位移變化規(guī)律的新方法[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2009,12(34):1419-1422.(ZHAOQing,HUANG Sheng-xiang.A Way for Overall Analysis on Dam’s Displacement[J].Geomatics and Information Science of Wuhan University,2009,12(34):1419-1422.(in Chinese) )
(編輯:曾小漢)
Impact of Reducing Observation Errors on Regression M odel
ZHAO Qing1,2,ZHOU Xing-dong1
(1.School of Geodesy and Geomatics,Jiangsu Normal University,Xuzhou 221116,China;2.Jiangxi Provincial Key Lab for Digital Land,F(xiàn)uzhou 344000,China)
Errors of deformation monitoring data has great impact on the modeling of the data sequences.A new model called Event-Model,which changes the expression of the original observation data,was proposed.First,the deformation rate at each monitoring point in the original data was calculated,and then the rates were divided into several ranges.By converting the original observation data into events,the numerical data were divided into categorical datawhich were composed of thematrix,named EventMatrix in this paper,which could be fitted to the Cox regression model.Each group of categorical data contained certain ranges.On the basis of experiences and the actual situation such as the average displacement rate calculated previously,parameters in the“Event-Model”were adjusted to avoid or weaken the effect of observation errors.Themean square error of the observation data could be treated as adjusted parameters instead of unknown true errors in practice.The influence ofmonitoring data containing observation errors on the follow-up Cox regressionmodel can be reduced to some extent and improve the accuracy of the calculation results.
observation errors;deformation monitoring;eventmodel;Cox regression model
TV698.1
A
1001-5485(2012)12-0020-04
勘誤啟事
10.3969/j.issn.1001-5485.2012.12.005 2012,29(12):20-23
2011-10-08;
2012-02-20
江蘇師范大學(xué)博士學(xué)位教師科研支持項(xiàng)目(10XLR23,10XLR16);江西省數(shù)字國(guó)土重點(diǎn)實(shí)驗(yàn)室開放研究基金資助項(xiàng)目(DLLJ201203)
趙 卿(1983-),男,江蘇徐州人,講師,博士,主要從事變形監(jiān)測(cè)與災(zāi)害預(yù)報(bào)的研究,(電話)18752128985(電子信箱)zhaoqing7@QQ.com。
《長(zhǎng)江科學(xué)院院報(bào)》2012年第10期《纖維混凝土在水利工程中的應(yīng)用》一文中的作者單位:“b.流域水利河南省高校工程技術(shù)研究中心”應(yīng)為“b.小流域水利河南省高校工程技術(shù)研究中心”(P114)。特此說(shuō)明,并對(duì)該文作者致歉。