亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于相似度排名的天氣雷達(dá)故障案例檢索

        2021-05-07 02:06:36周欽強(qiáng)李建勇王明輝陳冰懷
        廣東氣象 2021年2期
        關(guān)鍵詞:特征向量類別檢索

        周欽強(qiáng),李建勇,王明輝,陳冰懷

        (廣東省氣象探測(cè)數(shù)據(jù)中心,廣東廣州 510080)

        CINRAD/SA新一代天氣雷達(dá)網(wǎng)業(yè)務(wù)運(yùn)行十多年以來(lái),各級(jí)保障部門和雷達(dá)站積累了大量故障維修經(jīng)驗(yàn)與案例,黃裔誠(chéng)等[1-2]基于故障樹(shù)組織了全省 CINRAD_SA 雷達(dá)故障案例;郭澤勇[3]、石城等[4]設(shè)計(jì)開(kāi)發(fā)了新一代天氣雷達(dá)故障處理和故障標(biāo)準(zhǔn)化平臺(tái)。此外,雷達(dá)站技術(shù)保障人員對(duì)每次發(fā)生的雷達(dá)故障均給予了充分的分析總結(jié)[5-6],基本解決了故障維修經(jīng)驗(yàn)或案例難以傳承的現(xiàn)狀,對(duì)于天氣雷達(dá)故障案例或維修經(jīng)驗(yàn)共享,同步提升天氣雷達(dá)保障技術(shù)水平發(fā)揮了積極作用。但基于這些案例的二次開(kāi)發(fā)應(yīng)用尚屬空白,隨著新一代天氣雷達(dá)組網(wǎng)運(yùn)行日趨穩(wěn)定,其出現(xiàn)的故障重復(fù)率較高,常見(jiàn)經(jīng)典故障的診斷分析與處理方法,對(duì)于目前大部分新一代天氣雷達(dá)故障都具有較好的維修指導(dǎo)意義,可為技術(shù)保障人員提供第一手的故障維修參考解決方案。

        本研究在以往故障案例研究成果基礎(chǔ)上,開(kāi)發(fā)基于相似度排名的故障案例推理系統(tǒng),這不是嚴(yán)格意義上的故障診斷系統(tǒng)或?qū)<蚁到y(tǒng)[7-9],而是通過(guò)學(xué)習(xí)天氣雷達(dá)歷史案例,對(duì)新輸入的故障現(xiàn)象或描述,經(jīng)過(guò)案例知識(shí)表示、故障特征提取、相似度計(jì)算檢索等人工智能技術(shù)處理后,從歷史故障案例中自動(dòng)匹配出相似故障案例,并以相似度排序給出參考故障解決方案。

        1 工作原理

        系統(tǒng)將人工智能領(lǐng)域的機(jī)器學(xué)習(xí)技術(shù)和天氣雷達(dá)電子信息技術(shù)兩個(gè)學(xué)科緊密結(jié)合應(yīng)用,基于新一代天氣雷達(dá)歷史故障案例,致力于指導(dǎo)天氣雷達(dá)故障快速排查維修,通過(guò)學(xué)習(xí)成熟的歷史天氣雷達(dá)故障案例,獲取新故障信息并基于歷史案例相似度進(jìn)行智能檢索對(duì)比,提出與新故障的參考對(duì)照解決方案,其工作原理如圖1所示。

        1.1 案例表示

        天氣雷達(dá)歷史案例庫(kù)中的每個(gè)案例均包括故障的一般描述,即情景與解決方法。系統(tǒng)采用典型的空間向量模型[10-11],將新一代天氣雷達(dá)每個(gè)歷史故障案例通過(guò)中文分詞、詞頻統(tǒng)計(jì)等進(jìn)行知識(shí)表示處理,使每一個(gè)故障案例成為可機(jī)器識(shí)別的知識(shí)表示形式-空間向量,以便通過(guò)機(jī)器學(xué)習(xí)掌握所有天氣雷達(dá)歷史案例。

        1.2 案例學(xué)習(xí)

        經(jīng)過(guò)機(jī)器識(shí)別處理的天氣雷達(dá)案例不僅包含了大量代表每個(gè)案例的特征詞頻信息,也包含了大量中性、無(wú)實(shí)意等詞頻信息,因此通過(guò)特征提取算法提取最能代表每個(gè)案例的詞頻信息,使每個(gè)故障案例的空間向量代表性最優(yōu),基于天氣雷達(dá)案例庫(kù)最優(yōu)空間向量進(jìn)行學(xué)習(xí)訓(xùn)練,以掌握天氣雷達(dá)各類故障案例的典型特征,從而生成天氣雷達(dá)故障診斷推理模型。

        圖1 系統(tǒng)工作原理示意圖

        1.3 故障檢索

        歷史相似案例檢索或提取過(guò)程,也就是從歷史案例庫(kù)中找到一個(gè)或多個(gè)與當(dāng)前故障現(xiàn)象最相似的案例。當(dāng)接受了一個(gè)新故障的檢索請(qǐng)求后,系統(tǒng)利用樸素貝葉斯(Na?ve Bayes)算法從案例庫(kù)中找出與當(dāng)前故障相近似的排名案例組,并從中選擇一個(gè)最佳故障案例解決方案。通過(guò)3個(gè)子過(guò)程實(shí)現(xiàn):一是特征辯識(shí),就是對(duì)新故障進(jìn)行分析,提取有關(guān)特征;二是初步匹配,指從案例庫(kù)中找到與當(dāng)前故障相關(guān)的候選案例;三是最佳選定,就是從初步匹配過(guò)程中獲得的案例中選取一個(gè)或幾個(gè)與當(dāng)前故障最相近的案例。

        綜上所述,經(jīng)過(guò)對(duì)歷史案例庫(kù)的學(xué)習(xí)訓(xùn)練后,當(dāng)輸入新的天氣雷達(dá)故障現(xiàn)象描述時(shí),系統(tǒng)提取故障關(guān)鍵特征屬性,對(duì)每個(gè)類別的故障案例進(jìn)行檢索,基于Na?ve Bayes算法計(jì)算其屬于每類案例的概率,并按照歸屬概率進(jìn)行排名匹配,技術(shù)人員可選擇概率排名靠前的歷史故障案例作參考來(lái)排查故障。

        2 關(guān)鍵技術(shù)

        2.1 故障案例向量化

        天氣雷達(dá)故障案例的信息表示屬于自然語(yǔ)言處理范疇,是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向,如何能讓計(jì)算機(jī)正確的理解和使用人類自然語(yǔ)言,繼而從大量的天氣雷達(dá)案例中提取出有效的特征信息,是提高故障維修成功率的關(guān)鍵前提。當(dāng)天氣雷達(dá)發(fā)生故障時(shí),維護(hù)維修人員或雷達(dá)站值班員輸入故障現(xiàn)象詳細(xì)信息描述,基于向量空間模型利用中文分詞法[12]將雷達(dá)故障信息進(jìn)行分詞處理,并進(jìn)行屬性抽取與屬性賦值。假設(shè)詞與詞相互獨(dú)立,以向量表示文本,利用向量之間的幾何度量(正弦、余弦)計(jì)算文本間的相似度,簡(jiǎn)化文本中關(guān)鍵詞之間的復(fù)雜關(guān)系,使得模型具備可計(jì)算性。

        (1)屬性提取。

        通過(guò)Apache Lucence中文分詞器IK Analyzer將輸入的故障現(xiàn)象文字描述切分成為單個(gè)字或詞,并對(duì)切分出來(lái)的無(wú)實(shí)意字符進(jìn)行預(yù)處理,最終得到代表故障現(xiàn)象的詞頻信息[12]。如圖2所示。每一個(gè)經(jīng)過(guò)上述處理后的詞語(yǔ)基本上為最能代表該篇文本特征的屬性,特征詞在該類案例出現(xiàn)的次數(shù)越多,則越能代表該類案例的特征,即其類別權(quán)重值越大,反之,權(quán)重值越小。

        圖2 故障描述特征屬性提取

        (2)權(quán)重計(jì)算。

        對(duì)故障案例文本進(jìn)行中文分詞后,其中包含大量冗余詞匯或沒(méi)有多少實(shí)際意義的字或詞,需要對(duì)其進(jìn)行剔除后挑取最能代表故障現(xiàn)象描述的關(guān)鍵詞或字作為新案例特征向量。TF-IDF[13]算法是最常用的特征詞加權(quán)算法,其核心思想是對(duì)每一個(gè)特征集的特征分配一個(gè)權(quán)值,即加權(quán),然后設(shè)定閾值,利用閾值選取一定數(shù)目的特征作為最終的特征向量。這種閾值統(tǒng)計(jì)的方法具有計(jì)算代價(jià)小、效率高等優(yōu)點(diǎn),其計(jì)算公式為

        特征項(xiàng):

        則特征向量:

        其中,ti為故障描述c中提取的第i個(gè)特征項(xiàng);wi為故障描述c中第i個(gè)特征項(xiàng)的權(quán)重值,i=0,1,…,n。

        2.2 Na?ve Bayes算法

        Na?ve Bayes算法[14]是文本分類領(lǐng)域中一種簡(jiǎn)單但性能優(yōu)越的分類算法,為了簡(jiǎn)化計(jì)算,假定各案例特征變量是相互獨(dú)立的,即“貝葉斯假設(shè)”,它假設(shè)天氣雷達(dá)案例空間向量中特征項(xiàng)ti和tj之間兩兩獨(dú)立,根據(jù)貝葉斯公式為

        其中,C為既定天氣雷達(dá)故障案例類別(C1,C2,…,Cj),X為新的天氣雷達(dá)故障特征向量(X1,X2,…,Xn);則相似度計(jì)算就是將故障案例向量X歸類到與其關(guān)聯(lián)最緊密的類別C(C1,C2,…,Cj)中去。也就是說(shuō),求解向量X屬于給定類別C的概率值(P1,P2,…,Pn),其中 Pj為 Xj屬于Cj的概率,則 max(P1,P2,…,Pn)所對(duì)應(yīng)的類別就是新故障案例向量X所屬的類別,因此相似度計(jì)算被描述為求解方程(3)的最大值。

        其中,P(Cj)為故障案例集中,新故障屬于類別Cj的概率;P(X1,X2,…,Xn(Cj)為如果新故障屬于類別Cj,則類別Cj中包含新故障向量X的概率;P(C1,C2,…,Cj)為給定的所有類別的聯(lián)合概率。

        顯然,對(duì)于天氣雷達(dá)既定的所有故障類別,分母 P(C1,C2,…,Cj)是一個(gè)常數(shù),所以求解式(3)簡(jiǎn)化為:

        又根據(jù)貝葉斯假設(shè),新故障特征向量屬性x1,x2,…,xn獨(dú)立同分布,其聯(lián)合概率分布等于各個(gè)屬性特征概率分布的乘積,即

        所以式(4)變?yōu)?/p>

        即為所求解的天氣雷達(dá)故障案例相似度計(jì)算函數(shù)。

        盡管推導(dǎo)出了故障案例相似度計(jì)算函數(shù),但是函數(shù)中的概率值 P(Cj)和 P(Xi(Cj)還是未知的,式(6)中的先驗(yàn)概率值分別估算如下:

        其中,N(C=Cj)為天氣雷達(dá)案例故障集中屬于Cj類別的文本數(shù)量;N為天氣雷達(dá)案例故障集總數(shù)量。

        其中,N(Xi=xi,C=Cj)為類別 Cj中包含特征屬性xi的故障案例數(shù)量;N(C=Cj)為類別Cj中的故障案例數(shù)量;M為故障案例集總數(shù)量。

        2.3 案例檢索

        根據(jù)2.2節(jié)天氣雷達(dá)故障案例相似度算法,可知天氣雷達(dá)新故障的歷史相似案例檢索過(guò)程:

        (1)故障案例集訓(xùn)練。

        基于CINRAD/SA多普勒天氣雷達(dá)故障案例集,經(jīng)過(guò)特征提取,生成每類每個(gè)故障案例最能代表該案例的關(guān)鍵字,并表示成特征向量X(x1,x2,…,xn),計(jì)算 P(Cj)和 P(Xi(Cj)的先驗(yàn)概率值。

        (2)案例相似度計(jì)算。

        新的故障現(xiàn)象表述經(jīng)過(guò)特征提取,提取出最能代表該故障現(xiàn)象的關(guān)鍵字,并表示成向量形式X(x1,x2,…,xn),根據(jù)式(6)計(jì)算天氣雷達(dá)歷史故障案例相似度函數(shù)值,并依大小值排序。

        3 系統(tǒng)測(cè)試

        3.1 學(xué)習(xí)訓(xùn)練

        輸入新一代天氣雷達(dá)歷史故障案例集,并保存生成的雷達(dá)故障推理模型。以CINRAD/SA天氣雷達(dá)結(jié)構(gòu)單元為架構(gòu),建立起來(lái)的包括發(fā)射機(jī)UD3、接收機(jī) UD4、監(jiān)控單元 UD5、天饋系統(tǒng)UD2和附屬設(shè)備UD0等近20年來(lái)全省成功修復(fù)的歷史故障案例集,作為系統(tǒng)輸入,進(jìn)行學(xué)習(xí)訓(xùn)練,使系統(tǒng)模型具有解決新故障的推理診斷能力,如圖3所示。

        圖3 系統(tǒng)學(xué)習(xí)與測(cè)試程序界面

        3.2 最優(yōu)測(cè)試

        在天氣雷達(dá)歷史案例集學(xué)習(xí)訓(xùn)練時(shí),對(duì)案例集中的每一個(gè)故障案例向量化過(guò)程中,為有效排除權(quán)重低的特征項(xiàng),采取有效降低案例特征向量維度來(lái)提高系統(tǒng)學(xué)習(xí)效率。降維系數(shù)過(guò)高,特征向量維度低,系統(tǒng)學(xué)習(xí)效率高,但因丟棄了權(quán)重高的特征項(xiàng)可能導(dǎo)致診斷結(jié)果正確率下降;反之降維系數(shù)低,特征向量維度高,不僅系統(tǒng)學(xué)習(xí)效率低,因特征向量包含了大量權(quán)重較低的特征項(xiàng),診斷結(jié)果正確率也不一定提高,因此采取不同的降維系數(shù)組合,對(duì)系統(tǒng)進(jìn)行反復(fù)訓(xùn)練測(cè)試,以獲取學(xué)習(xí)效率和輸出正確率最優(yōu)的推理診斷模型。圖4給出的4種不同顏色案例相似度準(zhǔn)確率曲線分布。

        圖4 降維系數(shù)組合對(duì)案例相似度準(zhǔn)確率的影響

        (1)降維閾值的選取對(duì)診斷準(zhǔn)確率具有重大影響。閾值不同時(shí)分類準(zhǔn)確率變化起伏較大。因此,為了得到最佳性能的故障維修參考模型,必須選取不同的降維閾值反復(fù)學(xué)習(xí)測(cè)試。

        (2)盡管系統(tǒng)案例學(xué)習(xí)的平均準(zhǔn)確度達(dá)到78.0%,但是對(duì)于每一個(gè)確定降維閾值的準(zhǔn)確率而言,其準(zhǔn)確率變化區(qū)間較大。也就是說(shuō),對(duì)應(yīng)于圖3中每一種顏色的曲線,天氣雷達(dá)各類別測(cè)試準(zhǔn)確率曲線并不平滑,如何使各類別案例準(zhǔn)確率趨于一致也是今后研究的重要問(wèn)題。

        3.3 相似案例檢索

        (1)導(dǎo)入最優(yōu)相似度的故障推理模型,輸入新故障現(xiàn)象描述文本。

        (2)系統(tǒng)自動(dòng)對(duì)新故障描述進(jìn)行中文分詞、特征提取等預(yù)處理,生成文檔空間向量D(d1,d2,…,dn)。

        (3)對(duì)D進(jìn)行案例相似度檢索,輸出診斷參考解決方案,基于定位部件的歷史參考案例,成功解決故障后,將該次案例更新到案例集中。

        基于雷達(dá)保障技術(shù)人員、雷達(dá)生產(chǎn)廠家近10年的天氣雷達(dá)維護(hù)維修歷史案例集,開(kāi)發(fā)了CINRAD/SA天氣雷達(dá)故障案例推理系統(tǒng)。本研究詳細(xì)闡述了故障案例表示、故障特征提取、相似度計(jì)算等關(guān)鍵技術(shù),并分析了系統(tǒng)學(xué)習(xí)訓(xùn)練、最優(yōu)測(cè)試與案例檢索過(guò)程。經(jīng)陽(yáng)江、湛江、韶關(guān)、廣州等天氣雷達(dá)站試用,在故障發(fā)生時(shí)為技術(shù)保障人員提供第一手的故障排除參考解決方案,有效提高天氣雷達(dá)保障維護(hù)效率,對(duì)于縮短雷達(dá)故障排查時(shí)間,幫助準(zhǔn)確定位故障部件,降低天氣雷達(dá)在線故障率,尤其對(duì)于重大天氣過(guò)程中雷達(dá)故障時(shí)快速恢復(fù)運(yùn)行具有重要意義。但也存在一定的技術(shù)限制,如天氣雷達(dá)故障案例不夠豐富,特征向量維度與相似故障案例正確率的最優(yōu)關(guān)系等還需要深入研究,將是今后研究解決的主要技術(shù)問(wèn)題,以為全省新一代天氣雷達(dá)高效智慧保障提供更有效的手段,助力提高故障維修效率。

        猜你喜歡
        特征向量類別檢索
        二年制職教本科線性代數(shù)課程的幾何化教學(xué)設(shè)計(jì)——以特征值和特征向量為例
        克羅內(nèi)克積的特征向量
        2019年第4-6期便捷檢索目錄
        一類特殊矩陣特征向量的求法
        EXCEL表格計(jì)算判斷矩陣近似特征向量在AHP法檢驗(yàn)上的應(yīng)用
        專利檢索中“語(yǔ)義”的表現(xiàn)
        專利代理(2016年1期)2016-05-17 06:14:36
        服務(wù)類別
        論類別股東會(huì)
        商事法論集(2014年1期)2014-06-27 01:20:42
        中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
        聚合酶鏈?zhǔn)椒磻?yīng)快速鑒別5種常見(jiàn)肉類別
        天天插天天干天天操| 我爱我色成人网| 无码午夜人妻一区二区三区不卡视频 | 久久99精品国产99久久6尤物 | 国产亚洲熟妇在线视频| 精品亚洲国产成人| 日本a级一级淫片免费观看| 男人扒开添女人下部免费视频| 欧美性大战久久久久久久| 国产乱子伦视频一区二区三区| 字幕网中文字幕精品一区| 18禁在线永久免费观看| 热re99久久精品国产99热 | 亚洲av无码国产剧情| 国产精品久久久久免费a∨不卡| 国产另类av一区二区三区| 高潮毛片无遮挡高清视频播放| 在线va免费看成| 官网A级毛片| 蜜桃视频一区二区三区四 | 欧美最猛黑人xxxx黑人表情| 国产av一区二区三区丝袜| 中文字幕亚洲一区视频| 国产精品极品美女自在线观看免费 | www夜插内射视频网站| av香港经典三级级 在线| 亚洲电影久久久久久久9999| 国产精品亚洲一二三区| 久久97久久97精品免视看| 国产精品第一二三区久久蜜芽| 成在线人免费视频播放| 日本一区二区三级在线观看| 久久久精品456亚洲影院| 日韩精品成人无码AV片| 国产精品夜色视频久久| 人人摸人人搞人人透| 福利一区视频| 免费看黄在线永久观看| 国产欧美日韩va另类在线播放| 国产色在线 | 亚洲| 中国大陆一级毛片|