閆麗莉 溫少妍 高文晶 劉傳軍 楊 甜
整點(diǎn)氣溫缺測(cè)的插補(bǔ)方法研究及其初步應(yīng)用1
閆麗莉1)溫少妍2)高文晶1)劉傳軍1)楊 甜3)
1)天津市地震局,天津 300201 2)新疆維吾爾自治區(qū)地震局,烏魯木齊 830011 3)山西省地震局代縣中心地震臺(tái),山西忻州 034200
長(zhǎng)期連續(xù)完整的歷史氣溫資料是震前氣溫異常判別研究的重要數(shù)據(jù)基礎(chǔ)。本文考慮了參考站與缺測(cè)站之間的距離,建立改進(jìn)的線性回歸模型。利用該模型插補(bǔ)缺測(cè)和錯(cuò)誤的氣溫整點(diǎn)值數(shù)據(jù),在一定程度上解決了長(zhǎng)期連續(xù)觀測(cè)數(shù)據(jù)缺測(cè)的情況。通過對(duì)收集的唐山觀測(cè)站氣溫整點(diǎn)值數(shù)據(jù)進(jìn)行插補(bǔ),并應(yīng)用插補(bǔ)完整的數(shù)據(jù)分析研究了2012年5月28日唐山4.8級(jí)地震前兆異常。結(jié)果表明:①插補(bǔ)值與其前后觀測(cè)值銜接吻合,插補(bǔ)后完整連續(xù)數(shù)據(jù)符合夏高冬低的年變規(guī)律;②插補(bǔ)誤差在±0.5℃范圍內(nèi)的比例為60.2%,在±0.8℃范圍內(nèi)的比例為80.3%,其誤差絕對(duì)值大于1.0℃的比例為9.6%,平均絕對(duì)誤差為0.84℃,插補(bǔ)值與觀測(cè)值的相關(guān)系數(shù)大部分在0.9以上;③從3月27日起出現(xiàn)增溫異常,特別是震前2天增溫幅度約8℃。
整點(diǎn)氣溫 插補(bǔ) 線性回歸 地震
陸地與大氣緊密相連,地震前大氣的異常情況受到地震學(xué)者們的重視。前人進(jìn)行了大量探索性研究工作,以尋求地震前兆(徐國(guó)鈞等,1993;李貴福等,1996;曹新來等,1997;張鐵寶等,2013)。在這些地震研究中,長(zhǎng)期連續(xù)完整且均一性較好的氣象資料是研究地震前氣溫異常的數(shù)據(jù)基礎(chǔ)。但是,由于各種原因(如環(huán)境干擾、硬件故障等),歷史氣溫資料缺測(cè)現(xiàn)象時(shí)有發(fā)生,導(dǎo)致氣溫觀測(cè)資料缺測(cè),造成歷史資料的不連續(xù)(王建國(guó)等,2010;2013;姚會(huì)琴等,2012)。
中國(guó)許多學(xué)者開展了對(duì)日、月、年時(shí)間尺度的氣象資料缺測(cè)插補(bǔ)研究,并利用一維車貝雪夫多項(xiàng)式展開、線性回歸、標(biāo)準(zhǔn)序列法、基于SVD的迭代等方法對(duì)中國(guó)部分地區(qū)的氣象日、月、年值資料進(jìn)行了恢復(fù)性實(shí)驗(yàn)(張秀芝等,1996a,1996b;涂詩玉等,2001;張永領(lǐng)等,2006;王海軍等,2008;余予等,2012),但對(duì)整點(diǎn)氣溫值進(jìn)行缺測(cè)插補(bǔ)鮮見文獻(xiàn)報(bào)道。在國(guó)外,Huth等(1995)建立回歸模型來插補(bǔ)缺測(cè)的日氣溫?cái)?shù)據(jù),Eischeid等(2000)采用空間差值法,插補(bǔ)后建立美國(guó)西部40年逐日氣溫和降水?dāng)?shù)據(jù)集,但這些插補(bǔ)模型只用于1個(gè)或數(shù)個(gè)缺測(cè)日數(shù)據(jù)的插補(bǔ),不合適用于連續(xù)幾個(gè)月數(shù)據(jù)缺測(cè)的情況。DeGaetano等(1995)引用改進(jìn)的標(biāo)準(zhǔn)序列法,對(duì)美國(guó)東北部近400個(gè)站的日最高、最低氣溫缺測(cè)值進(jìn)行了插補(bǔ)。標(biāo)準(zhǔn)序列法和線性回歸法解決了插補(bǔ)長(zhǎng)期連續(xù)缺測(cè)數(shù)據(jù)的問題。整點(diǎn)氣溫值的缺測(cè)插補(bǔ)方法可借鑒日平均、最高、最低氣溫值的缺測(cè)插補(bǔ)方法。由于線性回歸法具有更好的統(tǒng)計(jì)性能和穩(wěn)健性,本文對(duì)線性回歸法進(jìn)行改進(jìn),考慮了距離因素,采用線性回歸模型參數(shù)求解法,解決了連續(xù)數(shù)日甚至數(shù)月造成的氣溫缺測(cè)問題,為地震前后氣溫變化特征的研究提供長(zhǎng)期連續(xù)完整可靠的數(shù)據(jù)資料,也為今后開展衛(wèi)星遙感紅外亮溫與衛(wèi)星過境時(shí)刻氣溫的對(duì)比研究奠定了數(shù)據(jù)基礎(chǔ)。
本文選取的研究區(qū)范圍為37°—42°N、113°—119°E,在研究區(qū)內(nèi)收集到15個(gè)地震觀測(cè)站(氣溫觀測(cè)站)的氣溫整點(diǎn)值數(shù)據(jù),觀測(cè)站分布情況如圖1所示。
圖1 氣溫觀測(cè)站分布
本文收集了15個(gè)地震觀測(cè)站氣溫?cái)?shù)據(jù),氣溫指地面以上1.5m處百葉窗測(cè)得的空氣溫度。太陽的熱能被地面吸收后,地面再通過輻射、傳導(dǎo)和對(duì)流把熱傳給空氣,這是空氣中熱量的主要來源。氣溫的觀測(cè)范圍-30℃—70℃,精度0.1℃。由于各觀測(cè)站安裝時(shí)間、停測(cè)時(shí)間不同,導(dǎo)致觀測(cè)時(shí)間的長(zhǎng)度不等,多數(shù)觀測(cè)數(shù)據(jù)起止時(shí)間為2007年1月1日,截止時(shí)間為2014年12月31日。
由于觀測(cè)環(huán)境、儀器設(shè)備故障等原因,部分觀測(cè)站的觀測(cè)數(shù)據(jù)缺測(cè),包括僅缺測(cè)1個(gè)值、缺測(cè)1天的值(即24個(gè)觀測(cè)值)、連續(xù)缺測(cè)幾天甚至1個(gè)多月導(dǎo)致長(zhǎng)達(dá)數(shù)千個(gè)觀測(cè)值連續(xù)缺測(cè)等情況?;谡鹄芯?,本文僅討論唐山站氣溫?cái)?shù)據(jù)的缺測(cè)情況(表1),可以看出該站缺測(cè)情況較嚴(yán)重,如2008年8月18日—9月15日連續(xù)缺測(cè)696個(gè)整點(diǎn)值,2009年4月2日—5月13日連續(xù)缺測(cè)1000個(gè)整點(diǎn)值,2012年6月2日—24日連續(xù)缺測(cè)552個(gè)整點(diǎn)值,2013年1月21日—2月5日連續(xù)缺測(cè)384個(gè)整點(diǎn)值。唐山站數(shù)據(jù)連續(xù)缺測(cè)時(shí)間較長(zhǎng),連續(xù)缺測(cè)幾十個(gè)值的頻率較高,同時(shí)該站還存在錯(cuò)誤值,如2010年11月22日18時(shí)的觀測(cè)氣溫整點(diǎn)值是59.701,類似的錯(cuò)誤值在每年均有出現(xiàn)。2010、2011年的觀測(cè)數(shù)據(jù)較完整。
表1 唐山站整點(diǎn)氣溫?cái)?shù)據(jù)的缺測(cè)統(tǒng)計(jì)
圖2為唐山站2012年12月17日—22日氣溫整點(diǎn)值變化曲線,可以看出氣溫日變明顯,最高溫一般出現(xiàn)在14時(shí)左右,最低溫出現(xiàn)在8時(shí)左右,符合日變規(guī)律。
圖2 唐山站氣溫變化曲線
對(duì)唐山站2012年1、4、7、10月的日均值進(jìn)行分析,繪制了相關(guān)曲線,如圖3所示。由圖可以看出,氣溫變化整體表現(xiàn)出明顯的夏高冬低的年變規(guī)律;1月、7月氣溫變化平穩(wěn),4月氣溫表現(xiàn)為升溫過程,10月氣溫表現(xiàn)為明顯的降溫過程。
圖3 唐山站氣溫日均值變化曲線
唐山站2008—2013年連續(xù)的氣溫整點(diǎn)值數(shù)據(jù)變化曲線如圖4所示。由圖可以看出,氣溫表現(xiàn)出明顯的夏高冬低的年變特征,夏季最高日平均溫度接近31℃,冬季最低日平均溫度接近-14℃;氣溫在冬季和夏季處于穩(wěn)定的狀態(tài),氣溫從3月開始上升,1月—7月處于升溫過程,氣溫上升快,7月、8月氣溫達(dá)到最高,9月后氣溫開始迅速降低,進(jìn)入降溫階段,符合季節(jié)變化規(guī)律;此外,數(shù)據(jù)缺測(cè)明顯。
圖4 唐山站氣溫整點(diǎn)值年變曲線
應(yīng)用線性回歸法解決連續(xù)幾日甚至數(shù)月的整點(diǎn)氣溫值缺測(cè)問題,并采用交叉驗(yàn)證方法對(duì)插補(bǔ)結(jié)果進(jìn)行誤差分析。
本文對(duì)線性回歸方法進(jìn)行改進(jìn),考慮了參考站和缺測(cè)站之間的距離。改進(jìn)后該方法更科學(xué),可以更好地去除距離因素的影響。
利用鄰近站資料對(duì)距離進(jìn)行加權(quán),建立回歸模型,插補(bǔ)缺測(cè)站資料的方程式為:
因歷史同期各要素時(shí)空變化規(guī)律通常比較相似,選擇缺測(cè)整點(diǎn)值前后若干整點(diǎn)值的歷史同期(不包括缺測(cè)值所在的年份)數(shù)據(jù),作為擬合回歸模型的樣本數(shù)據(jù),建立線性回歸模型,并利用附近站資料,計(jì)算缺測(cè)記錄插補(bǔ)值。
本文采用交叉驗(yàn)證的方法對(duì)缺測(cè)記錄的插補(bǔ)結(jié)果進(jìn)行分析,即假設(shè)某個(gè)站的記錄缺測(cè),首先利用插補(bǔ)模型插補(bǔ)整點(diǎn)氣溫?cái)?shù)據(jù),然后對(duì)插補(bǔ)值與實(shí)際觀測(cè)資料進(jìn)行對(duì)比和誤差分析,并用平均絕對(duì)誤差(Mean Absolute Error,MAE)代表插補(bǔ)精度(王海軍等,2008),其表達(dá)式為:
參考站的選擇不僅與觀測(cè)站密度有關(guān),也與插補(bǔ)站及其鄰近站所處的地理環(huán)境有關(guān)(如平原、丘陵、山區(qū)等)。同時(shí),時(shí)間窗大小也對(duì)缺測(cè)數(shù)據(jù)的插補(bǔ)精度有影響。本文采用滑動(dòng)優(yōu)選法確定時(shí)間窗,時(shí)間窗的寬度為氣溫整點(diǎn)值個(gè)數(shù),高度為年數(shù)。以選擇缺測(cè)整點(diǎn)值所在的年份為中心,其前后若干點(diǎn)值歷史同期若干年的數(shù)據(jù)作為樣本數(shù)據(jù),對(duì)于前后無資料的年份,則使用靠近插補(bǔ)年份的資料。
唐山站位于華北平原,周圍地勢(shì)平坦,氣溫變化相近,故采用最短距離的原則選取臨近參考站。根據(jù)距離及地形因素,選取了該站周邊的北京、昌黎、薊縣、寧河、青光和徐莊子6個(gè)觀測(cè)站,年數(shù)為7年。采用15個(gè)整點(diǎn)值作為樣本資料,建立線性回歸模型,插補(bǔ)唐山站的缺測(cè)值(包括連續(xù)和不連續(xù)的單點(diǎn)缺測(cè)值)。插補(bǔ)站及其鄰近站的基本信息見表2。
表2 唐山插補(bǔ)站及其鄰近臺(tái)站信息
采用交叉驗(yàn)證的方法評(píng)估上述插補(bǔ)方法,統(tǒng)計(jì)了2010年3月的31天實(shí)際觀測(cè)整點(diǎn)值與相應(yīng)插補(bǔ)值的相關(guān)系數(shù),統(tǒng)計(jì)結(jié)果見表3。從表中可以看出,3月8日、14日、15日、19日和20日的相關(guān)系數(shù)相對(duì)較低。王海軍等(2008)經(jīng)過對(duì)比研究,在平原地區(qū)選取了4個(gè)參考站,選取年數(shù)為8年、天數(shù)為15天,插補(bǔ)誤差最小。唐山站也位于平原地區(qū),考慮與唐山站的距離及地形因素,選取昌黎、寧河、青光、徐莊子4個(gè)參考站,并選取年數(shù)為7年、15個(gè)整點(diǎn)值的優(yōu)化模型。通過對(duì)比發(fā)現(xiàn),4個(gè)參考站的相關(guān)系數(shù)偏高(表3)。
利用式(3)對(duì)優(yōu)化后的模型得到的插補(bǔ)結(jié)果計(jì)算平均絕對(duì)誤差,并統(tǒng)計(jì)其誤差的比例分布(表4)。從表4可以看出,插補(bǔ)誤差在±0.5℃范圍內(nèi)的比例為60.5%,在±0.8℃范圍內(nèi)的比例為80.6%,其誤差絕對(duì)值大于1.0℃的為9.4%,平均絕對(duì)誤差為0.82℃。
表3 觀測(cè)值與插補(bǔ)值相關(guān)系數(shù)
表4 唐山站整點(diǎn)氣溫缺測(cè)插補(bǔ)誤差比例
針對(duì)唐山站2008年1月1日—2013年12月18日的氣溫整點(diǎn)值缺測(cè)數(shù)據(jù)及錯(cuò)誤數(shù)據(jù),利用唐山鄰近站的同期數(shù)據(jù)和線性回歸模型,對(duì)缺測(cè)數(shù)據(jù)插補(bǔ)完整,并修正錯(cuò)誤數(shù)據(jù),繪制氣溫整點(diǎn)值的年變曲線,如圖5所示。從圖中可以看出,在長(zhǎng)時(shí)間序列缺測(cè)的部位,插補(bǔ)值與前后正確的數(shù)據(jù)銜接吻合,沒有出現(xiàn)突升或突降變化。插補(bǔ)后完整連續(xù)的數(shù)據(jù)符合夏高冬低的年變規(guī)律,氣溫6年的變化形態(tài)一致。
圖5 插補(bǔ)后的唐山臺(tái)氣溫整點(diǎn)值年變曲線
據(jù)中國(guó)地震臺(tái)網(wǎng)中心測(cè)定,2012年5月28日10時(shí)22分在河北省唐山市轄區(qū)、灤縣交界處發(fā)生4.8級(jí)地震,震源深度8km。
利用插補(bǔ)完整的連續(xù)數(shù)據(jù),分析2012年3—5月震前氣溫?cái)?shù)據(jù)的變化情況。首先,選取無震年份(2008—2011年)同期(3—5月)整點(diǎn)值氣溫,并計(jì)算歷年同期氣溫日均值,以此作為3—5月正常的背景值;其次,將2012年3—5月日均值與歷年同期背景值做差值,得到2012年3—5月份數(shù)據(jù)與歷年同期均值的偏移程度;最后,以無震年份同期氣溫波動(dòng)范圍作為基準(zhǔn),即2008—2011年3—5月所有氣溫值的標(biāo)準(zhǔn)差作為判斷標(biāo)準(zhǔn)。根據(jù)以往經(jīng)驗(yàn)將差值大于2倍標(biāo)準(zhǔn)差視為氣溫前兆異常。
從2012年3—5月當(dāng)年日均值與歷年同期(2008—2011年)多年日均值的差值及標(biāo)準(zhǔn)差(圖6)中可以看出,從3月27日開始,唐山站數(shù)據(jù)出現(xiàn)大幅度增溫異?,F(xiàn)象,4月增溫天數(shù)也較多,5月1日—11日的氣溫日均值仍然高于歷年同期,特別是5月10日(即震前2天)增幅達(dá)到約8℃,且大于2倍標(biāo)準(zhǔn)差;震后差值開始變小,并逐步恢復(fù)至平靜。
圖6 觀測(cè)值與同期均值的差值及標(biāo)準(zhǔn)差
長(zhǎng)期連續(xù)完整的歷史氣象資料是震前氣溫異常判別研究的重要數(shù)據(jù)基礎(chǔ),但由于觀測(cè)環(huán)境、儀器故障等原因,造成氣溫觀測(cè)數(shù)據(jù)缺測(cè)或錯(cuò)誤數(shù)據(jù),且部分?jǐn)?shù)據(jù)缺測(cè)的時(shí)間較長(zhǎng)。為此,本文利用線性回歸模型,插補(bǔ)缺測(cè)和錯(cuò)誤的氣溫整點(diǎn)值數(shù)據(jù),較好地解決了長(zhǎng)期連續(xù)缺測(cè)的情況。
通過對(duì)唐山觀測(cè)站2008年1月1日—2013年12月18日的氣溫整點(diǎn)值缺測(cè)數(shù)據(jù)及錯(cuò)誤數(shù)據(jù)進(jìn)行插補(bǔ),使得數(shù)據(jù)完整連續(xù),并應(yīng)用插補(bǔ)完整的氣溫整點(diǎn)值數(shù)據(jù),分析研究了2012年5月28日唐山4.8級(jí)地震的氣溫前兆異常現(xiàn)象,主要得出以下結(jié)論:
(1)唐山觀測(cè)站的插補(bǔ)值與其前后的觀測(cè)數(shù)據(jù)銜接吻合,插補(bǔ)后完整連續(xù)的數(shù)據(jù)符合夏高冬低的年變規(guī)律。
(2)插補(bǔ)誤差在±0.5℃范圍內(nèi)的比例為60.2%,在±0.8℃范圍內(nèi)的比例為80.3%,其誤差絕對(duì)值大于1.0℃的為9.6%,平均絕對(duì)誤差為0.84℃。插補(bǔ)值與觀測(cè)值的相關(guān)系數(shù)大部分在0.9以上,可見插補(bǔ)結(jié)果真實(shí)可靠。
(3)從3月27日起,唐山觀測(cè)站數(shù)據(jù)出現(xiàn)增溫異常,震前2天增溫幅度約8℃。
曹新來,張子廣,李福來,1997.1976年唐山7.8級(jí)地震前氣象要素的異常變化.華北地震科學(xué),15(2):50—59.
李貴福,解明恩,1996.本世紀(jì)云南強(qiáng)震(S≥6.0)的氣象特征研究.地震研究,19(2):154—161.
涂詩玉,陳正洪,2001.武漢和宜昌缺測(cè)氣溫資料的插補(bǔ)方法.湖北氣象,(3):11—13.
王海軍,涂詩玉,陳正洪,2008.日氣溫?cái)?shù)據(jù)缺測(cè)的插補(bǔ)方法試驗(yàn)與誤差分析.氣象,34(7):83—91.
王建國(guó),姚會(huì)琴,高遜等,2010.天津市地震前兆臺(tái)網(wǎng)的運(yùn)行監(jiān)控與維護(hù)管理.大地測(cè)量與地球動(dòng)力學(xué),30(S1):111—115.
王建國(guó),劉春國(guó),王偉等,2013.地震前兆數(shù)據(jù)庫綜合管理系統(tǒng).大地測(cè)量與地球動(dòng)力學(xué),33(S1):114—116.
徐國(guó)鈞,譚天明,蘭紅林等,1993.云南破壞性地震與氣象要素的關(guān)系.地震研究,16(2):148—155.
姚會(huì)琴,李悅,高遜等,2012.NagVis等開源監(jiān)控軟件在天津地震前兆臺(tái)網(wǎng)的應(yīng)用研究.震災(zāi)防御技術(shù),7(3):329—333.
余予,李俊,任芝花等,2012.標(biāo)準(zhǔn)序列法在日平均氣溫缺測(cè)數(shù)據(jù)插補(bǔ)中的應(yīng)用.氣象,38(9):1135—1139.
張鐵寶,路茜,辛華等,2013.2010年玉樹7.1級(jí)地震前后氣溫變化分析. 四川地震,(4):7—11.
張秀芝,孫安健,1996a. 利用車貝雪夫多項(xiàng)式進(jìn)行資料缺測(cè)插補(bǔ)的研究. 應(yīng)用氣象學(xué)報(bào),7(3):344—352.
張秀芝,孫安健,1996b. 氣候資料缺測(cè)插補(bǔ)方法的對(duì)比研究. 氣象學(xué)報(bào),54(5):625—632.
張永領(lǐng),丁裕國(guó),高全洲等,2006. 一種基于SVD的迭代方法及其用于氣候資料場(chǎng)的插補(bǔ)試驗(yàn). 大氣科學(xué),30(3):526—532.
DeGaetano A. T., Eggleston K. L., Knapp W. W., 1995. A method to estimate missing daily maximum and minimum temperature observations. Journal of Applied Meteorology, 34(2): 371—380.
Eischeid J. K., Pasteris P. A., Diaz H. F., et al., 2000. Creating a serially complete, national daily time series of temperature and precipitation for the western United States. Journal of Applied Meteorology, 39(9): 1580—1591.
Huth R., Nemeóová I., 1995. Estimation of missing daily temperatures: can a weather categorization improve its accuracy? Journal of Climate, 8(7): 1901—1916.
Interpolating Method for Missing Data of Integral Point Temperature and Its Preliminary Application
Yan Lili1), Wen Shaoyan2), Gao Wenjing1), Liu Chuanjun1)and Yang Tian3)
1) Tianjin Earthquake Agency, Tianjin 300201, China 2) Earthquake Agency of Xinjiang Uygur Autonomous Region, Urumqi 830011, China 3) Daixian Central Seismological Station of Shanxi Earthquake Agency, Xinzhou 034200, Shanxi, China
The analysis of the temperature anomaly before earthquakes is based on the continuously historical air temperature data. The improved linear regression model is established in this paper inconsiderationof the distance of reference sites and missing observation sites. This model is used to interpolate hourly temperature data of missing and incorrect observations, which can partially help to solve the problem of long-term continuous observations data missing. The observation data from 15 sites were interpolated with the improved linear regression method and the interpolated data were applied to the TangshanS4.8 earthquake that occurred on May 28, 2012. Our results suggest that: ①The interpolated data are consistent with its pre and post observation and the complete temperature data have the annual variation characteristic of higher in summer and lower in winter; ②The probability of error in temperature range ±0.5℃is about 60.2%, and the error in ±0.8℃is about 80.3%. The absolute error over 1.0℃is 9.6% and the mean absolute error is 0.84℃. The correlation coefficients between interpolated and observed data are generally greater than 0.9; ③The complete interpolated temperature data of Tangshan site were applied to study the Tangshan earthquake, 2012. The results show that the temperature increasing anomaly was found on May 10, 2012, when the temperature increased 8℃ two days before the quake.
Integral point temperature; Interpolating; Linear regression model; Earthquake
10.11899/zzfy20190218
中國(guó)地震局三結(jié)合課題“氣溫在地震監(jiān)測(cè)中的初步應(yīng)用”(2018008),天津市地震局青年基金“缺測(cè)整點(diǎn)氣溫的插補(bǔ)方法研究及初步應(yīng)用”(20141021),新疆地震局基金項(xiàng)目(201802)
2018-09-17
閆麗莉,女,生于1983年。工程師。主要從事地震前兆數(shù)據(jù)處理和衛(wèi)星紅外遙感在地震監(jiān)測(cè)中的應(yīng)用研究。E-mail:yanlili_2003@163.com
溫少妍,女,生于1985年。工程師。主要從事InSAR同震形變場(chǎng)和震源破裂過程反演研究工作。 E-mail:wenshaoyan999@163.com
閆麗莉,溫少妍,高文晶,劉傳軍,楊甜,2019.整點(diǎn)氣溫缺測(cè)的插補(bǔ)方法研究及其初步應(yīng)用.震災(zāi)防御技術(shù),14(2):446—455.