摘要:為預測2 h內的雷暴、大雨、冰雹等高強度、快速變化的惡劣天氣現(xiàn)象,減少破壞性天氣帶來的影響,提出基于多元邏輯回歸算法的碳化硅/碳吸波材料雷達惡劣天氣快速識別方法。采用最大似然估計方法求解多元邏輯回歸模型,利用訓練數(shù)據(jù)的似然函數(shù),同時使用多元邏輯回歸算法來過濾雷達雜波,以提高惡劣天氣快速識別預警效果。實驗結果表明,當樣本數(shù)量不同時,多元邏輯回歸算法模型的準確率和損失率隨迭代次數(shù)的增加而顯著變化。
關鍵詞:多元邏輯回歸;樣本數(shù)量;損失率;碳化硅/碳;快速識別
中圖分類號:TQ317;TQ328.3文獻標志碼:A文章編號:1001-5922(2024)10-0100-04
Preparation of silicon carbide/carbon absorbers and researchon radar fast and accurate identification technology
CAI Kai1,LIN Peizhong2
(1. Guoneng Shaanxi New Energy Power Generation Co.,Ltd.,Xi’an 710065,China;2. Henan Natural Resources Monitoring and Land Consolidation Institute, Zhengzhou 450016, China)
Abstract:To predict high-intensity and rapidly changing adverse weather phenomena such as thunderstorms,heavy rain,and hail within 2 hours and reduce the impact of destructive weather,a rapid identification method foradverse weather using silicon carbide/carbon absorbing material radar based on multiple logistic regression algo?rithm was proposed. The maximum likelihood estimation method was used to solve the multiple logistic regressionmodel,the likelihood function of training data was utilized,and the multiple logistic regression algorithm was usedto filter radar clutter to improve the rapid recognition and warning effect of severe weather. The experimental resultsshowed that when the number of samples was different,the accuracy and loss rate of the multiple logistic regressionalgorithm model significantly changed with the increase of iteration times.
Key words:multivariate logistic regression;number of samples;loss rate;carbide/carbon;fast identification
多普勒雷達具有高時空分辨率和快速掃描機制,是小尺度和惡劣天氣事件實時探測和預警的獨特有效方法。目前已有多位學者,研究如何高效快速利用多普勒雷達數(shù)據(jù)識別惡劣天氣。如利用氣象雷達回波的多個物理參數(shù)的組合,將提高災難性對流天氣警告的準確性[1]。利用不同季節(jié)、不同經(jīng)緯度和不同底層區(qū)域的強對流風暴對雷達回波物理特性的預警閾值各不相同,傳統(tǒng)的天氣快速識別預警系統(tǒng)誤差較大[2]。使用相控陣天氣雷達獲取雷達回波三維空間結構的分布,與傳統(tǒng)的惡劣天氣方法相比,研究所使用的方法大大提高了惡劣天氣風暴識別的速度[3]。因此需要提出一種新的算法來處理多普勒雷達數(shù)據(jù),以提高極端天氣的快速識別,并利用碳化硅/碳泡沫介電材料制備雷達吸波材料。利用多元邏輯回歸算法建立了一種新的概率分析方法[4]。將多元邏輯回歸算法模型應用于工程技術領域,對危險概率的辨識與出現(xiàn)問題進行了研究[5]。但由于惡劣天氣其觸發(fā)機制復雜,演化機制多變,在不同的季節(jié),不同的緯度和不同的地面條件下,會產生強烈的冰雹、雷雨等極端天氣[6]?;诖耍疚奶岢龌诙嘣壿嫽貧w算法的碳化硅/碳吸波材料雷達惡劣天氣快速識別方法。采用最大似然估計方法求解多元邏輯回歸模型,利用訓練數(shù)據(jù)的似然函數(shù),同時使用多元邏輯回歸算法來過濾雷達雜波,以提高惡劣天氣快速識別預警效果。
1多元邏輯回歸預警模型及雷達吸收材料制備
1. 1雷達吸收材料制備
SiC/C(碳化硅/碳)泡沫材料是通過復制法制造的。實驗中使用的是商用聚氨酯(PU)泡沫,PU泡沫的平均孔徑為2 mm。由酚醛樹脂(50%)、SiC粉末(50%)和有機溶劑組成的漿料被混合涂覆在聚氨酯泡沫上。SiC粉末的平均粒徑為5μm。為了得到均勻的漿料,將漿料球磨4 h。用漿料浸漬聚氨酯泡沫,然后通過加壓和吹氣方法去除聚氨酯泡沫中所有多余的漿料,以形成開孔泡沫結構。干燥后的涂層聚氨酯泡沫在氮氣保護下于750°C煅燒30 min,加熱速度為3°C/ min。熱解過程結束后,干燥的涂層聚氨酯泡沫轉化為SiC/C泡沫材料。
1. 2預警模型建立
多元邏輯回歸是線性回歸的一種[7]。其基本原理是使用函數(shù)yt作為預測函數(shù),將預測因子線性相加;yt的值為[0,1]。當事件發(fā)生時,概率為p;當事件未發(fā)生時,概率為1-p。參數(shù)計算采用最大似然估計。多元邏輯回歸是一種多元統(tǒng)計分析方法,用于分析多分類情況下因變量(反應)和自變量(觀察)之間的關系。自變量的個數(shù)為n,因變量的個數(shù)為m,其中m?3。多元邏輯回歸的原理是將不同的因素分類分成多個二元邏輯回歸[8]。因此設定t時刻出現(xiàn)惡劣冰雹天氣,稱為yt,其二元值為[0,1],服從參數(shù)π的t多元邏輯回歸模型(Logistic),即yt~Logistic(πt),(0lt;πl(wèi)t;1)。則概率質量函數(shù)f(yt)可以用式(1)表示:
多元邏輯回歸模型參數(shù)πt是惡劣冰雹天氣發(fā)生的概率,隨時間t而變化。由于在每個時間點都可以實現(xiàn)惡劣冰雹天氣發(fā)生的概率預測,因此在每個時間點也計算了惡劣冰雹天氣發(fā)生所遵循的伯努利分布[9]。因此,在模型中考慮了突發(fā)干擾對t、πt時刻惡劣冰雹天氣發(fā)生快速識別預警概率的影響。
多元邏輯回歸模型屬于指數(shù)族分布,稱為p(yt),利用式(2)表示:
p(yt)=b(yt)′exp[ηtT(yt)-α(yt)](2)
式中:b(yt)為縮放常數(shù);ηt為分布的自然參數(shù),用于確定具體分布;T(yt)為充分統(tǒng)計量;α(yt)為對數(shù)分割函數(shù)[10]。因此,多元邏輯回歸模型的概率質量函數(shù)f(yt)可以用式(3)表達。
基于式的(2)和式(3),設定b(yt)=1,T(yt)=yt,ηtπt
=lnt和α(yt)=-ln(1-π)t[11]。發(fā)生概率πt是一個1-π
Sigmoid函數(shù)形式的邏輯模型,如式(4)所示:
假設ηt與輸入xt(xt)存在線n性12i關系,其中n是輸入變量的數(shù)量,則決策邊界可以寫成一個線性回歸ηt(xt)即:
ηt(xt)=δ+δ x1t+δ xt+δ xt++δ xt012 2i in n.
式中:δ為線性模型的差異;δ為輸入變量的系數(shù);m0i為輸入變量的個數(shù)。因此,多元邏輯回歸模型用式(6)表示[12]:
式中:πt表示第d天t時刻出現(xiàn)惡劣冰雹天氣的估計概率;ptd-1和ptd-7為d-1前一天和d-7前一周t時刻的惡劣冰雹天氣[13];δ1~δ6是輸入變量的系數(shù)。
1. 3模型解決方案
采用最大似然估計(MLE)方法求解多元邏輯回歸模型,利用訓練數(shù)據(jù)的似然函數(shù)(L)[14],用式(7)表示:
式中:f(yt)是第d天t時間的樣本的概率質量函數(shù);Q是訓練數(shù)據(jù)集中的樣本數(shù)量。由于似然函數(shù)難以求解,因此將其轉換為對數(shù)格式,如式(8)所示:
lnL=min [-yt′log(πt)-(1-yt)′log(1-πt)](8)
式中:lnL可以任意階推導,并且可以計算出最優(yōu)解。因此,lnL是多元邏輯回歸模型的損失函數(shù)[15],因此使用梯度下降算法求解。
McFaddenR2(以下簡稱R2)是評估模型適應度M最廣泛使用的指標,RM2表達式如式(9)所示:
式中:Lˉ(MNull
)為無輸入變量模型的估計似然;訓練數(shù)據(jù)集上實際輸出變量yt的平均值通常假設為模型MNull的輸出;Lˉ (sMFull)表示模型完全擬合所有數(shù)據(jù)時的似然概率;Lˉ(MFull)是有輸入變量的模型的估計似然。且由于考慮了輸入變量,會進一步提高惡劣天氣快速識別概率。同時R2越大表示適合M度越好。在實際應用中,R2值在0.2~0.4,表明具有M良好的適應度。
1. 4數(shù)據(jù)預處理
影響數(shù)據(jù)質量的主要因素是地面雜波和噪聲雜波。這2種雜波會影響碳化硅/碳吸波材料的回波測量降水性能和回波顯示的完整性,還會影響惡劣天氣快速識別中的特征提取、目標判斷和結果計算。因此,使用多元邏輯回歸算法來過濾雜波。然后,對經(jīng)過質量控制的數(shù)據(jù)進行內插。極坐標數(shù)據(jù)將被插值到平面網(wǎng)格中。最后,對插值數(shù)據(jù)進行歸一化處理。
對于噪聲雜波,采用濾除孤立點和彌補缺失檢測點的方法。過濾孤立點需要echo每個碳化硅/碳吸波材料雷達回波數(shù)據(jù)庫,如果有效,則需要一個矩形窗口N′N在數(shù)據(jù)上創(chuàng)建。并求出有效數(shù)據(jù)的總數(shù)M以及有效數(shù)據(jù)的比例S。通常閾值M0來確定孤立點(通常M為0.7)。如果S小于M,則判斷為孤00立點,并設置為無效數(shù)據(jù)。具體方程式如下:
彌補缺失點與過濾孤立點的方法類似,該方法需要反響碳化硅/碳吸波材料雷達回波數(shù)據(jù)庫,并在反響點上創(chuàng)建一個矩形窗口M′M(本文中窗口的大小為M=5),然后計算M*M窗口中有效數(shù)據(jù)的數(shù)量,并設置一個閾值(默認值為12)。如果有效數(shù)據(jù)數(shù)超過該閾值,目標網(wǎng)格點將被替換為:
式中:Vi是窗口中第i個數(shù)據(jù)的值。
在本文中,地面物體雜波的識別主要由3個因素來判斷:反射率因子平均徑向紋理(TDBZ)、反射率因子垂直梯度(VGZ)和絕對徑向速度(Vabs)。地面雜波在這3個方面與氣象回波有明顯不同。上述3個值的計算方法如下:
式中:i和j分別代表反射系數(shù)的范圍倉數(shù)和徑向數(shù);Ngats和Nradials分別代表以反射率坐標i和j為中心的扇形區(qū)域內的范圍倉數(shù)和徑向數(shù)。在計算方程中Zlow表示低高程處的反射率因子值,Zup表示具有相同方位角的反射率系數(shù)值,Hup和Hlow表示相應的高度,其中參考高度H為4.5 km和pHlow是低海拔處的相應高度1.2 km。此外Vabs表示與方位角和范圍分段數(shù)相對應的徑向速度。
2結果與討論
2. 1訓練數(shù)據(jù)集
多元邏輯回歸算法訓練需要計算龐大的矩陣,而圖形處理器(GPU)可以支持并行計算,這對提高模型訓練速度具有重要意義。因此,在訓練和檢測過程中使用了擁有32 GB內存的NVIDIA Tesla V100PCle圖形芯片。網(wǎng)絡訓練使用運行TensorFlow v2.3.4GPU支持版本的Keras API python軟件包進行。
Numpy庫用于模型矩陣操作和數(shù)據(jù)存儲。同時使用訓練-測試-分割程序將模型樣本隨機分為訓練樣本和測試樣本。其中,訓練樣本和測試樣本分別占樣本總數(shù)的70%和30%。
2. 2準確率和損失率變化
為進一步探究多元邏輯回歸算法模型的性能,進行不同訓練數(shù)據(jù)集中的樣本數(shù)量(Q=2 000、Q=4 000)的準確率和損失率比較,將模型的迭代次數(shù)初始值設為30。實驗結果如圖1所示。
當樣本數(shù)量不同時,多元邏輯回歸算法模型的準確率和損失率隨迭代次數(shù)的增加而顯著變化。當Q=2 000時,模型的準確率隨迭代次數(shù)呈非線性增加趨勢,迭代次數(shù)在0~20次時,準確率增加幅度較快。迭代次數(shù)大于20次時,準確率變化趨于穩(wěn)定,最大準確率為0.998。而Q=4 000時,模型的準確率呈現(xiàn)不規(guī)律變化,準確率在0.996~0.998變化。Q=2 000的樣本數(shù)據(jù)最大及最小損失率分別為0.0 189和0.006;Q=4 000的樣本數(shù)據(jù)的最大及最小損失率分別為0.013和0.006。綜上所述,當多元邏輯回歸算法模型在Q=2 000樣本上顯示出較高的準確率和較低損失率。因此,建議多元邏輯回歸算法模型的訓練數(shù)據(jù)集中的樣本數(shù)量設定為2 000。
2. 3惡劣天氣快速識別預警
本文采用CINRAD-SA雙偏振碳化硅/碳吸波材料雷達,并將多元邏輯回歸算法模型應用在碳化硅/碳吸波材料雷達中,以評估多元邏輯回歸算法識別方法的性能,用于識別惡劣天氣降水運的變化。
3結語
本文通過建立多元邏輯回歸預警模型以提高惡劣天氣的快速識別效果,并制備碳化硅/碳吸波材料,以提高雷達對惡劣天氣吸收波識別的效率。當樣本數(shù)量Q=2 000時,模型的準確率隨迭代次數(shù)呈非線性增加趨勢,迭代次數(shù)在0~20次時,準確率增加幅度較快。當多元邏輯回歸算法模型在Q=2 000樣本上顯示出較高的準確率和較低損失率。因此,建議多元邏輯回歸算法模型的訓練數(shù)據(jù)集中的樣本數(shù)量設定為2000。
【參考文獻】
[1]胡雯婕,馬莉,吳秀芹,等.毛烏素沙地上空沙塵暴的前向軌跡及其影響范圍[J].北京大學學報(自然科學版),2021,57(6):1161-1171.
[2]夏米麒,丘仲鋒,胡晨悅,等.基于色匹配函數(shù)的衛(wèi)星影像真彩色合成研究[J].遙感技術與應用,2023,38(5):1092-1106.
[3]雷大江,唐建烊,李智星,等.基于中心對齊多核學習的稀疏多元邏輯回歸算法[J].電子與信息學報,2020,42(11):2735-2741.
[4]韋凱華,張曙,趙碧云.雙偏振雷達分類強對流天氣分區(qū)預警軟件設計與應用[J].微型電腦應用,2020,36(12):26-30.
[5]鄒夢凡,何曉雨.自動駕駛雷達頻段降雨環(huán)境散射特性建模分析[J].系統(tǒng)仿真學報,2023,35(10):2161-2169.
[6]王雅新,呂運州.大別山南坡暴雨災害特征及衍生地質災害風險區(qū)劃研究[J].江西科學,2023,41(5):985-993.
[7]於瑩,呂抒航,李強,等.廣西天氣雷達保障業(yè)務平臺的設計與實現(xiàn)[J].自動化應用,2023,64(14):8-10.
[8]蔡俊.基于Nef的組網(wǎng)雷達包絡三維可視化研究[J].信息技術,2015(6):125-129.
[9]王劍利.基于多普勒測風激光雷達偏航矯正增功研究[J].微型電腦應用,2023,39(5):205-208.
[10]張勇,謝剛,張申濤.變權模糊綜合評判法在雷達系統(tǒng)效能評估中的應用[J].信息技術,2007(12):26-29.
[11]朱澤鋒,陳庚,鄒德志.基于2D-Capon的雙基地MIMO雷達目標角度估計[J].信息技術,2020,44(7):75-78.