彭宇翔,劉 濤,文繼芬,李 皓,唐辟如,李懷志
(貴州省人工影響天氣辦公室,貴陽 550081)
目前,風(fēng)云二號(G 星)衛(wèi)星提供的云頂溫度、云頂高度、液水路徑、過冷層厚度、光學(xué)厚度、有效粒子半徑以及黑體亮溫等7 項衛(wèi)星反演產(chǎn)品對于冰雹的監(jiān)測預(yù)警業(yè)務(wù)作用巨大。
近年,部分學(xué)者利用衛(wèi)星通道和反演產(chǎn)品進(jìn)行了對流云及冰雹個例方面的研究。2004 年,安曉存等開展了云頂亮溫梯度特征分析,初步了解了云頂亮溫跟冰雹的變化關(guān)系;2014 年,孫玉穩(wěn)等學(xué)者分析了1987年的5 次冰雹天氣冰雹和降水分布特征;2018 年,朝魯門依托了衛(wèi)星遙感對冰雹災(zāi)害的監(jiān)測方法進(jìn)行研究;2019 年,倪煜淮等利用了風(fēng)云二號(D 星)逐小時亮溫分析對冰雹天氣過程進(jìn)行分析;2020 年,劉小艷等對利用統(tǒng)計方法對貴州降雹個例風(fēng)云二號(G 星)反演產(chǎn)品時間變化以及特征參數(shù)進(jìn)行研究。而現(xiàn)階段還沒有相關(guān)學(xué)者基于Logistic 回歸模型,利用風(fēng)云二號(G 星)衛(wèi)星的反演產(chǎn)品開展降雹識別技術(shù)研究。風(fēng)云二號(G 星)衛(wèi)星的反演產(chǎn)品已經(jīng)用于貴州冰雹天氣監(jiān)測預(yù)警業(yè)務(wù)中,但針對風(fēng)云二號(G 星)衛(wèi)星反演產(chǎn)品是否對降雹事件具有實質(zhì)性的指導(dǎo)作用,暫無深入研究。因此,本研究主要基于風(fēng)云二號(G 星)衛(wèi)星7 項反演產(chǎn)品,建立Logistic 回歸模型,檢驗風(fēng)云二號(G 星)衛(wèi)星的反演產(chǎn)品降雹事件的識別作用。
本文以風(fēng)云二號(G 星)衛(wèi)星的7 項反演產(chǎn)品作為輸入?yún)?shù),建立Logistic 回歸降雹識別模型,利用檢驗集數(shù)據(jù)對模型降雹識別效果進(jìn)行檢驗,驗證風(fēng)云二號(G 星)衛(wèi)星的反演產(chǎn)品對降雹識別的有效性。
風(fēng)云二號(G 星)是風(fēng)云2 號(03 批)衛(wèi)星中的第2顆,2014 年升空,2015 年投入氣象觀測業(yè)務(wù)。
本研究收集了2020 年3—5 月的11 個冰雹日(共計136 組)的風(fēng)云二號(G 星)衛(wèi)星反演產(chǎn)品數(shù)據(jù)(分別包含了68 組降雹點和未降雹點數(shù)據(jù)),將每個降雹點降雹時刻前后15 min 內(nèi)的反演產(chǎn)品作為該點的數(shù)據(jù)。同時,選取相應(yīng)數(shù)量的未降雹點數(shù)據(jù)進(jìn)行對比。該數(shù)據(jù)集被分為了訓(xùn)練集跟檢驗集。訓(xùn)練集為隨機(jī)選取的其中116 組數(shù)據(jù),用于訓(xùn)練模型(分別包括58 組降雹點與未降雹點數(shù)據(jù)),模型檢驗集為剩余20 組數(shù)據(jù)(分別包括10 組降雹點與未降雹點數(shù)據(jù))。
Logistic 回歸模型是一種廣義的線性回歸分析模型,常用于數(shù)據(jù)挖掘、疾病自動診斷、經(jīng)濟(jì)預(yù)測等領(lǐng)域。該模型常用來處理二分類問題。事實上冰雹的識別就是一種二分類問題,即:降雹與未降雹。將是否降雹作為因變量,并假設(shè)y=1 表示降雹,y=0 表示未降雹,這樣就將冰雹識別轉(zhuǎn)換成了“0-1 型”因變量的識別問題。要建立識別模型就需要對模型進(jìn)行兩個方面的改進(jìn):第一,回歸函數(shù)應(yīng)該改用限制在[0,1]區(qū)間內(nèi)的連續(xù)曲線,常用的就是Logistic 回歸模型,模型的形式是f(x)=ex/(1+ex);第二,因變量yi本身只取0 或1 兩個離散值,因此可以用yi=1 的概率代替yi本身作為因變量。在冰雹識別Logistic 模型的建立中,用降雹的概率作為模型的因變量,Logistic 冰雹識別模型就可以表示為p(yi)=exp(a0+aijxij)/(1+exp(a0+aijxij)),其中xij為模型輸入變量,i為樣本量,j為自變量數(shù)量。這樣p(yi)的取值就被限制在[0,1]區(qū)間,p(yi)可理解為yi=1 的概率,當(dāng)p(yi)∈[0,0.5)時,yi=0,即未降雹;當(dāng)p(yi)∈[0.5,1]時,yi=1,即降雹?;谠摾碚?,可建立冰雹云識別Logistic 回歸模型,并對冰雹云進(jìn)行識別。
利用訓(xùn)練集完成Logistic 回歸模型建立(式(1))
式中:x1為云頂高度、x2為云頂溫度、x3為過冷層厚度、x4為光學(xué)厚度、x5為有效粒子半徑、x6為液水路徑、x7為黑體亮溫。
收集2020 年3—5 月11 個冰雹日中的136 組風(fēng)云二號(G 星)反演數(shù)據(jù)。其中116 組用于建模,剩余20 組進(jìn)行檢驗(檢驗結(jié)果見表1)。
表1 模型識別檢驗結(jié)果
表1 為Logistic 回歸模型冰雹識別的主要結(jié)果,包括隨機(jī)選取的10 個降雹點和10 個未降雹點,識別結(jié)果統(tǒng)計見表2。
表2 模型識別結(jié)果統(tǒng)計
識別結(jié)果顯示:所建Logistic 回歸模型冰雹識別準(zhǔn)確率為85%,其中對10 個降雹點識別準(zhǔn)確率為90%,對10 個未降雹點識別準(zhǔn)確率為80%。在對冰雹天氣進(jìn)行識別的業(yè)務(wù)中,通常會存在一定的漏報率和空報率,其中漏報是發(fā)生了降雹事件沒有成功識別,空報是沒發(fā)生降雹事件但識別出了降雹,因此,空報和漏報均是錯誤識別的現(xiàn)象,且都無法100%消除。但是,從防災(zāi)減災(zāi)的角度,為了減少冰雹等災(zāi)害造成的損失和危害,對冰雹等災(zāi)害的識別預(yù)警通常采取的是寧愿空報不漏報,為此對模型的漏報率和空報率進(jìn)行分析(見圖1 和圖2)。
圖1 降雹事件識別準(zhǔn)確率與漏報率
圖2 未降雹事件識別準(zhǔn)確率與空報率
從圖1 和圖2 可知:Logistic 回歸冰雹識別模型對降雹事件識別準(zhǔn)確率為90%,漏報率為10%,對未降雹事件的識別準(zhǔn)確率為80%,空報率為20%。因此Logistic 回歸冰雹識別模型的空報率明顯高于漏報率,這也符合冰雹等災(zāi)害識別業(yè)務(wù)中的“寧愿空報不漏報”的方式,因此該模型對冰雹識別預(yù)警工作有著非常重要的作用。
本文以風(fēng)云二號(G 星)衛(wèi)星的7 項反演產(chǎn)品建立Logistic 回歸模型,對貴州2020 年的降雹事件進(jìn)行識別,這7 項反演產(chǎn)品包括:云頂溫度、云頂高度、液水路徑、過冷層厚度、光學(xué)厚度、有效粒子半徑以及黑體亮溫。數(shù)據(jù)集共136 組數(shù)據(jù)(包括降雹點和未降雹點數(shù)據(jù)各68 組)。隨機(jī)抽取116 組作為訓(xùn)練集建立Logistic 回歸冰雹識別模型,利用剩余20 組數(shù)據(jù)作為模型檢驗集,驗證效果。結(jié)果表明,Logistic 回歸冰雹識別模型對降雹的識別準(zhǔn)確率為85%(對檢驗集中的10 個降雹點識別準(zhǔn)確率為90%,10 個未降雹點識別準(zhǔn)確率為80%)。因此,衛(wèi)星反演產(chǎn)品對降雹識別研究是十分有意義的。