王 華 楊乾鵬/林芝市氣象局
模式識別在氣象探測和信息處理中的應用
王華楊乾鵬/林芝市氣象局
隨著模式識別和氣象探測技術的發(fā)展,模式識別在氣象探測和氣象信息數(shù)據(jù)處理中應用較為廣泛。本文主要總結了在氣象領域內應用的一些方法,包括在基于聚類算法的雷電數(shù)據(jù)應用、神經(jīng)網(wǎng)絡系統(tǒng)在暴雨預報中的應用以及基于多普勒天氣雷達探測資料中低空急流、龍卷、下?lián)舯┝骱完囷L鋒四種天氣現(xiàn)象的分類識別。
模式識別;氣象探測;聚類;神經(jīng)網(wǎng)絡
模式識別是20世紀60年代初迅速發(fā)展起來的一門科學,經(jīng)過幾十年的研究,取的了豐碩的成果,已經(jīng)形成了一個比較完善的理論體系,主要包括統(tǒng)計模式識別、結構模式識別、模糊模式識別、神經(jīng)網(wǎng)絡模式識別和分類器融合等研究內容。模式識別系統(tǒng)由信息獲取、預處理、特征提取和選擇、分類判決等4個部分組成。模式識別主要是應用在其它學科,尤其是在一些文本分類、語音識別、圖像識別、視頻識別,在本文主要是介紹模式識別在氣象探測和氣象信息處理中的應用,從而提高天氣的預報預測能力和氣象資料的分析處理能力。
(一)研究雷電的背景和意義
本文分析了一種新的雷電數(shù)據(jù)應用方法。在這個方法中將會運用一種聚類算法——K-MEANS算法。氣象觀測活動中獲得的雷電數(shù)據(jù)通過該方法進行聚類分析,得出理想的雷暴體聚類中心,這些聚類中心是最佳的雷暴體參數(shù)信息的反應。通過對這一聚類結果的研究與分析,可以掌握雷暴活動中雷暴單體的生命演變過程,并可以預測雷暴的發(fā)展動向。
(二)雷電數(shù)據(jù)應用的現(xiàn)狀
雷電與災害性天氣(如龍卷、冰雹、超級單體和大風)的關系非常密切,這方面已經(jīng)有許多研究。觀測數(shù)據(jù)表明,云地閃的總數(shù)、閃電總數(shù)以及這些因素的綜合指數(shù)與災害性天氣有最直接的關系。天氣預報人員可以使用云地閃電數(shù)據(jù)進行大范圍天氣監(jiān)測和對流天氣短時預報。因為閃電演變特征能較好地指示對流的存在、產(chǎn)生、移動、消散、結構、范圍、強度和再發(fā)展等重要信息。雷電資料對雷達低仰角探測被地物遮擋的地區(qū)和國家邊界周圍以及沿海地區(qū)的作用尤為突出。對于因山地和大面積水域產(chǎn)生的局地強對流天氣,雷電數(shù)據(jù)對其演變的監(jiān)測和識別也具有重要意義。研究表明,一定情形下的云地閃與洪水、冰雹、暴雨、龍卷以及微暴流是密切關聯(lián)的。但這種關聯(lián)需要對不同的地區(qū)和不同的季節(jié)分別進行研究分析。這一課題的廣泛研究必須建立在對雷電網(wǎng)絡數(shù)據(jù)進一步分析的基礎上。
雷電探測網(wǎng)可以24小時連續(xù)監(jiān)測閃電的活動,跟其它探測設備相比,雷電探測系統(tǒng)還具有以下特點:
(1)雷電數(shù)據(jù)能夠有效地在大面積的雨區(qū)內區(qū)分出發(fā)展中的對流云。
(2)當衛(wèi)星云圖、氣象雷達或其它氣象資料缺乏時,雷電數(shù)據(jù)可作補充。
(3)實時的閃電數(shù)據(jù)可在數(shù)秒內報告雷暴的監(jiān)測結果,這是雷達和衛(wèi)星所不能企及的。
(4)雷電數(shù)據(jù)可以瞬間刷新,以幫助識別強對流天氣的區(qū)域和發(fā)展趨勢。
2.3K-均值法聚類和實現(xiàn)處理的大概步驟
1967年,MacQueen首次提出了K均值聚類算法(K-means算法)。迄今為止,很多聚類任務都選擇該經(jīng)典算法。該算法的核心思想是找出K個聚類中心 ,使得每一個數(shù)據(jù)點和與其最近的聚類中心的平方距離和被最小化(該平方距離和被稱為偏差 D)。
K均值(K-means)聚類算法(對n個樣本進行聚類)
(1)[初始化]:隨機指定K個聚類中心();
(2)[分配]:對每一個樣本,找到離它最近的聚類中心,并將其分配到所標明類;
(3)[修正]:將每一個移動到其標明的類的中心;
(4)[計算偏差]: ; (2-1)
(5)[D判斷收斂]:如果D值收斂,則return()并終止本算法;否則,返回步驟(2)。
K-means 算法的優(yōu)點與不足。優(yōu)點:能對大型數(shù)據(jù)集進行高效分類,其計算復雜性為 O(tKmn),其中,t為迭代次數(shù),K為聚類數(shù),m為特征屬性數(shù),n為待分類的對象數(shù),通常,K,m,t<<n。在對大型數(shù)據(jù)集聚類時,K-means 算法比層次聚類算法快得多。不足:通常會在獲得一個局部最優(yōu)值時終止;僅適合對數(shù)值型數(shù)據(jù)聚類;只適用于聚類結果為凸形(即類簇為凸形)的數(shù)據(jù)集[3]。以經(jīng)典K-means算法為基礎,研究者們提出了很多新的改進的K-means 算法。
實現(xiàn)的大概步驟:
輸入:聚類個數(shù)k,包含n個數(shù)據(jù)對象的數(shù)據(jù)集。
輸出:k個聚類。
(1)從n個數(shù)據(jù)中任意選擇k個數(shù)據(jù)作為初始的聚類中心。
(2)計算每個數(shù)據(jù)點到聚類中心的距離,把數(shù)據(jù)點歸類到最近的聚類中心的簇。
(3)所有數(shù)據(jù)點分配完成后,再計算其聚類新的中心。
(4)將新的中心和前一次的聚類中心作比較,如果有變化則轉到步驟2,否則,轉到步驟5。
(5)輸出聚類結果。
(一)研究暴雨的背景和意義
暴雨是我國夏季常見的一種影響嚴重的災害性天氣。某一地區(qū)連降暴雨或出現(xiàn)大暴雨、特大暴雨,常導致山洪爆發(fā),水庫垮壩,江河橫溢,房屋被沖塌,農(nóng)田被淹沒,交通和電訊中斷,會給國民經(jīng)濟和人民的生命財產(chǎn)帶來嚴重危害。暴雨尤其是大范圍持續(xù)性暴雨和集中的特大暴雨,不僅影響工農(nóng)業(yè)生產(chǎn),而且可能危害人民的生命,造成嚴重的經(jīng)濟損失。暴雨的研究和預報,對提高防災減災能力有著重大的意義。
(二)神經(jīng)網(wǎng)絡技術在暴雨中的應用
神經(jīng)元網(wǎng)絡原理模擬人腦的學習、記憶、思維、推理機能,主要是利用其網(wǎng)絡模擬預報員從大尺度環(huán)境場中捕捉暴雨信息的能力。神經(jīng)網(wǎng)絡專家系統(tǒng)與傳統(tǒng)規(guī)則型專家系統(tǒng)亦不相同,傳統(tǒng)型專家系統(tǒng)的規(guī)則基于預報員長期的工作經(jīng)驗,規(guī)則之間要滿足嚴格的合諧性和完備性條件才能保證推理的正確性,而這兩點實際是很難達到的。神經(jīng)元網(wǎng)絡專家系統(tǒng)利用人工神經(jīng)元來模擬大腦的記憶和思維能力,用網(wǎng)絡權系矩陣隱式地表示知識,通過隱單元和節(jié)點作用函數(shù)實現(xiàn)非線性。通過訓練獲取知識,利用網(wǎng)絡對初值的響應實現(xiàn)推理功能。
大概步驟:依據(jù)在一段時間內暴雨的資料,將分布在一定區(qū)域的暴雨資料按照經(jīng)緯度網(wǎng)格化,組成神經(jīng)元網(wǎng)絡待選的感應神經(jīng)元輸入神經(jīng)元。利用具有一層隱結點的BP網(wǎng)絡,設定隱單元的數(shù)目為輸入神經(jīng)元數(shù)據(jù)量的一半,目的是使網(wǎng)絡具有良好的性能,通過BP網(wǎng)絡建立模式資料與發(fā)生暴雨發(fā)生所在地的站點降水資料的映射關系,通過網(wǎng)絡的學習功能,確定網(wǎng)絡權系矩陣,由此對大到暴雨以上的降水進行預報。
本文簡單的從基于聚類算法的雷電數(shù)據(jù)應用;神經(jīng)網(wǎng)絡系統(tǒng)在暴雨預報中的應用;上述方法參考了大量前輩的資料,這里只是一些總結及設想,有一些簡單的嘗試,還沒有大范圍的應用。目前模式識別技術在氣象領域的應用較為廣泛,隨著模式識別技術的快速發(fā)展,將模式識別技術應用到其中將會推動氣象技術的更加快速發(fā)展,會更充分利用好氣象資料,提高識別精度和處理效率。
[1]李弼成,邵美珍,等.模式識別原理與應用.西安:西安電子科技大學出版社, 2008
[2]王耀生.人工智能、模式識別在氣象領域應用的現(xiàn)狀與展望.北京:氣象,1987
[3]孫吉貴,劉杰,趙連宇.聚類算法研究.2008 Journal of Software, Vol.19, No.1,