姚寶寬,周愛(ài)兆,仇春平
(1.江蘇省地質(zhì)礦產(chǎn)局第三地質(zhì)大隊(duì),江蘇鎮(zhèn)江 212000;2.江蘇科技大學(xué)土木工程與建筑學(xué)院,江蘇鎮(zhèn)江 212000;3.中國(guó)礦業(yè)大學(xué)環(huán)境與測(cè)繪學(xué)院,江蘇徐州 221116)
大氣水汽是全球水循環(huán)中最活躍的因子和天氣、氣候的主要驅(qū)動(dòng)力,也是影響災(zāi)害性天氣形成和發(fā)展的關(guān)鍵性因子[1-7]。當(dāng)前,以我國(guó)北斗導(dǎo)航衛(wèi)星系統(tǒng)(BDS)為代表的全球衛(wèi)星導(dǎo)航系統(tǒng)(Global Navigation Satellite System,GNSS)快速發(fā)展,為精確測(cè)量大氣可降水量(Precipitable Water Vapor,PWV)進(jìn)而提高暴雨、霧霾、臺(tái)風(fēng)等災(zāi)害天氣預(yù)警水平正在發(fā)揮重要作用[4]。因此,PWV特征分析及其建模研究引起了眾多學(xué)者的關(guān)注。文獻(xiàn)[1]~[3]分析了不同地區(qū)的PWV 時(shí)間特征,文獻(xiàn)[4]~[6]分析了不同技術(shù)條件下的PWV 時(shí)序精度變化特征,文獻(xiàn)[7]~[9]研究了PWV 時(shí)序建模以及應(yīng)用于天氣預(yù)報(bào)產(chǎn)品的可行性分析。
上述研究結(jié)果表明,PWV 時(shí)間序列表現(xiàn)出了顯著的非等精度特征,而且該特征與時(shí)間、空間的相關(guān)性復(fù)雜。然而,在現(xiàn)有PWV 時(shí)間序列建模研究中,均是采用單位權(quán)隨機(jī)模型。換言之,現(xiàn)有研究工作較少考慮PWV 時(shí)間序列建模中的定權(quán)問(wèn)題。鑒此,本文先介紹PWV 常用的函數(shù)模型與最小二乘參數(shù)估計(jì)方法,在此基礎(chǔ)上分析了PWV 時(shí)間序列的數(shù)據(jù)密度分布特征,從而提出了利用數(shù)據(jù)密度加權(quán)的PWV 建模方法。最后,在全球范圍內(nèi)選取了代表性的4 個(gè)測(cè)站PWV 時(shí)間序列,對(duì)所提方法進(jìn)行了方案對(duì)比和結(jié)果分析,驗(yàn)證了所提方法的正確性和可靠性。
PWV 時(shí)間序列建模一般采用包含線性項(xiàng)、年周期和半年周期的諧波模型[10]。
式中:Yt-歷元t 的PWV 值;β-時(shí)間序列的線性速度項(xiàng);μ-整個(gè)時(shí)間序列的常數(shù)項(xiàng);aj、bj、ωj-周期幅值和頻率;vt-噪聲項(xiàng)。
當(dāng) PWV 時(shí)序長(zhǎng)度為 n 時(shí),即 t∈[1,n],記參數(shù)向量為 X、設(shè)計(jì)矩陣為B、觀測(cè)值向量為Y、誤差向量為V,則根據(jù)式(1)可以建立如式(2)所示的誤差方程:
為了分析PWV 時(shí)間序列的數(shù)據(jù)密度特征,在全球選取了BAKO、ALGO、ALBH、BRMU 四個(gè)代表性的測(cè)站。四個(gè)測(cè)站的時(shí)序長(zhǎng)度分別為 5558d、6317d、6460d、5793d,均在 15 年以上的時(shí)間序列長(zhǎng)度。繪制的數(shù)據(jù)密度分布圖如圖1 所示。
分析圖1 可知,四個(gè)測(cè)站的數(shù)據(jù)密度分布表現(xiàn)出顯著的差異。其中,測(cè)站BAKO 呈現(xiàn)為右側(cè)尖銳、測(cè)站ALGO 呈現(xiàn)左側(cè)尖銳、測(cè)站ALBH 呈現(xiàn)正態(tài)型、測(cè)站BRMU 呈現(xiàn)平峰型。由此分析可知,不同測(cè)站的數(shù)據(jù)密度分布差異較大,若直接采用單位權(quán)則會(huì)因隨機(jī)模型不準(zhǔn)確而導(dǎo)致估計(jì)結(jié)果不合理。因此,以P 表示權(quán)陣,文中利用數(shù)據(jù)密度的定權(quán)方法為:
式中:ρt-PWV 數(shù)據(jù)密度。
結(jié)合式(2)和式(3),利用最小二乘原理可得PWV 模型參數(shù)及其精度估計(jì)式:
圖1 PWV 時(shí)間序列的數(shù)據(jù)密度分布
式(3)~式(5)構(gòu)成了本文的利用數(shù)據(jù)密度加權(quán)的PWV 建模方法。從推導(dǎo)過(guò)程可以看出,通過(guò)數(shù)據(jù)密度分布特征考慮了PWV時(shí)間序列的非等精度特征,以便更加合理地利用PWV 數(shù)據(jù)并降低建模誤差。進(jìn)一步地,當(dāng)權(quán)陣為單位時(shí),本文方法則退化為現(xiàn)有文獻(xiàn)方法。因此,本文方法包含了單位權(quán)最小二乘方法,適用范圍更廣。
為了檢驗(yàn)本文方法的正確性和有效性,仍采用1.2 節(jié)四個(gè)測(cè)站的PWV 數(shù)據(jù)進(jìn)行建模精度分析。比較方案為P,方案1 采用單位權(quán)進(jìn)行參數(shù)最小二乘估計(jì)方法,方案2 采用數(shù)據(jù)密度加權(quán)的參數(shù)最小二乘估計(jì)方法,計(jì)算結(jié)果見(jiàn)表1。
表1 不同方案結(jié)果比較
表1 統(tǒng)計(jì)了四個(gè)測(cè)站的中誤差和相對(duì)誤差計(jì)算結(jié)算。從該表可以看出,方案2 較方案1 的中誤差提高了大約2mm;其次,方案2 較方案1 的相對(duì)誤差提高了5~15 個(gè)百分比。由此可以驗(yàn)證,本文所用的數(shù)據(jù)密度加權(quán)的PWV 建模方法精度更高。為了進(jìn)一步對(duì)比方案1 和方案2 的建模誤差,圖2 顯示了測(cè)站BAKO的自相關(guān)誤差分布圖。
圖2 測(cè)站BAKO 的自相關(guān)誤差分布
圖2 對(duì)比了測(cè)站BAKO 的自相關(guān)誤差分布。從該平面分布圖可以看出,方案1 的誤差分布呈現(xiàn)非常扁長(zhǎng)的橢圓形狀,表明誤差和自相關(guān)誤差存在顯著的相關(guān)性;方案2 的誤差分布呈現(xiàn)聚中化的標(biāo)準(zhǔn)圓形狀,表明誤差和自相關(guān)誤差呈現(xiàn)隨機(jī)性、不存在相關(guān)特性。由此可以得出,方案2 優(yōu)于方案1 的計(jì)算結(jié)果。因此,無(wú)論從中誤差、相對(duì)誤差的精度衡量指標(biāo),還是從誤差分布的角度進(jìn)行對(duì)比分析,方案2 均優(yōu)于方案1 的計(jì)算結(jié)果,從而驗(yàn)證了本文方法的正確性和有效性,并能夠有效改善PWV 時(shí)間序列建模精度。
本文通過(guò)分析了大氣可降水量PWV 在時(shí)間與空間變化的復(fù)雜性,指出了在PWV 時(shí)間序列建模過(guò)程中僅僅考慮單位權(quán)隨機(jī)模型難以顧及PWV 的非等精度特性。由此,在給出包含線性項(xiàng)、年周期和半年周期的諧波模型基礎(chǔ)上,通過(guò)四個(gè)測(cè)站15 年以上的PWV 時(shí)間序列數(shù)據(jù)密度分布特征分析,提出了通過(guò)數(shù)據(jù)密度分布定權(quán)的模型參數(shù)估計(jì)方法。最后,通過(guò)PWV 建模中誤差、相對(duì)誤差以及自相關(guān)誤差分布分析,驗(yàn)證了所提方法的正確性和合理性,為提高PWV 時(shí)序建模精度提供了可行的新思路。