亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進(jìn)的ISODATA的超球覆蓋仿生模式分類算法

        2023-01-01 00:00:00劉莉萍馮清賢余志斌
        計算機應(yīng)用研究 2023年3期

        摘 要:現(xiàn)有仿生模式識別分類器難以解決含有多個聚集點、非線性和稀疏性樣本的分類問題。因此,引入特征分類貢獻(xiàn)度,提出了基于改進(jìn)的迭代自組織數(shù)據(jù)分析(M-ISODATA)的超球覆蓋仿生模式識別算法。首先引入馬氏距離對自組織數(shù)據(jù)分析方法(ISODATA)的歐氏距離替換,并引入熵權(quán)法對馬氏距離進(jìn)行加權(quán)以賦予各特征不同的貢獻(xiàn)度;同時為了去除干擾樣本點,引入改進(jìn)的局部離群因子檢測方法(M-LOF)對樣本進(jìn)行訓(xùn)練,減少了不同類別流形之間的重疊區(qū)域。再利用改進(jìn)的自組織數(shù)據(jù)分析方法(M-ISODATA)對每類訓(xùn)練樣本點動態(tài)聚類,尋找到同一類的多個小類覆蓋區(qū)中心后,用超球進(jìn)行該類的有效覆蓋,并對落入重疊區(qū)域的測試樣本點進(jìn)行二次劃分,實現(xiàn)測試樣本的正確分類。最后在iris數(shù)據(jù)集上驗證該算法的有效性,并將該算法應(yīng)用于雷達(dá)輻射源信號的分類識別。實驗結(jié)果表明,該算法具有很好的拒識、免重訓(xùn)能力,對于雷達(dá)信號的識別率能達(dá)到97.29%,相比于傳統(tǒng)典型模式識別算法具有更好的識別能力。

        關(guān)鍵詞:超球覆蓋; 加權(quán)馬氏距離; 局部離群因子; 自組織數(shù)據(jù)分析; 免重訓(xùn)

        中圖分類號:TP391 文獻(xiàn)標(biāo)志碼:A

        文章編號:1001-3695(2023)03-008-0689-07

        doi:10.19734/j.issn.1001-3695.2022.07.0405

        Bionic pattern classification algorithm for hyperspherecoverage based on improved ISODATA

        Liu Liping1, Feng Qingxian2, Yu Zhibin1

        (1.School of Electrical Engineering, Southwest Jiaotong University, Chengdu 611756, China; 2.The 29th Research Institute of China Electro-nics Technology Corporation, Chengdu 610036, China)

        Abstract:The existing biomimetic pattern recognition classifiers cannot solve the problems of classification with multiple aggregation points, nonlinear and sparse samples. Therefore, this paper introduced the contribution degree of feature classification, and proposed a hypersphere coverage bionic pattern recognition algorithm based on improved iterative self-organizing data analysis (M-ISODATA) . Firstly, this paper introduced Markov distance to replace Euclidean distance of the self-organized data analysis method (ISODATA) , and introduced entropy weight method to give each feature different contribution degrees. At the same time, in order to remove the interference sample points, this paper introduced an improved local outlier detection method (M-LOF) to train the samples, which reduced the overlapping area between different classes of manifolds. Then, it used the improved self-organizing data analysis method (M-ISODATA) to dynamically cluster each type of training sample points. After finding the center of the coverage area of multiple subcategories of the same class, this paper used the hypersphere to effectively cover the class, and divided the test sample points falling into the overlapping area twice to achieve the correct classification of test samples. Finally, it verified the validity of the algorithm on iris dataset, and applied the algorithm to the classification and recognition of radar emitter signals. The experimental results show that the algorithm has a good ability to reject recognition and avoid repeated training, and the recognition rate for radar signals can reach 97.29%, which is better than the traditional typical pattern recognition algorithm.

        Key words:hypersphere coverage; weighted Mahalanobis distance; local outlier factor; self organizing data analysis; no retraining

        0 引言

        模式識別是人工智能的重要研究領(lǐng)域,其主要任務(wù)和核心研究內(nèi)容是模式分類,經(jīng)過多年的發(fā)展,已經(jīng)形成了一系列經(jīng)典的理論和方法。在分類模型與方法構(gòu)建方面,圍繞“識”和“別”的不同側(cè)重程度,形成了兩種不同的研究方向。一種是傳統(tǒng)模式識別認(rèn)為所有可用的信息都包含在訓(xùn)練樣本集中,其立足點是建立在特征空間若干類別樣本的最佳分類劃分上,代表性方法有Fisher判別[1]、支持向量機(support vector machine,SVM)[2]、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)、及其相應(yīng)的改進(jìn)方法[3~6]。這類傳統(tǒng)識別方法側(cè)重于“別”,即一類樣本與有限類已知樣本的區(qū)分,而忽視了“識”。然而,人類對事物的識別是一個“ 認(rèn)識” 過程,即一類樣本與無限類未知樣本的區(qū)分,側(cè)重于“ 識”[7]。忽略“認(rèn)識”過程的識別方法至少存在兩個方面的先天不足:a)首次遇到未學(xué)習(xí)過的新事物時容易誤認(rèn)為是某一種學(xué)習(xí)過的舊事物;b)在對未訓(xùn)練過的新事物進(jìn)行新的學(xué)習(xí)時,往往會打亂舊知識,破壞對原學(xué)習(xí)過的舊事物的識別[8]。即識別新類時,必須將新類與原訓(xùn)練所有類一起重新訓(xùn)練,以確定所有類別邊界,時間復(fù)雜度大,難以實現(xiàn)在線學(xué)習(xí);同時在面對未經(jīng)訓(xùn)練的樣本時,必定被劃分為已訓(xùn)練的某一類別,造成誤識;或是面對未知干擾時不能拒識。

        事實上,同類事物的兩個不同樣本之間,至少有一個漸變過程,在這個漸變過程中的所有樣本仍屬于該類,即事物具有同源連續(xù)性規(guī)律[7]。從模式識別的角度來看,即同類樣本在特征空間中是連續(xù)分布的,任意兩個樣本點之間具有某種連續(xù)變化的關(guān)系。如果把模式識別問題看成模式的 “認(rèn)識”,一個一個地“認(rèn)識”同類樣本,則認(rèn)識新類時,無須負(fù)樣本(非新類)參與訓(xùn)練,既能夠“識”,又能夠“別”,從根本上克服了以最佳劃分為基點的分類方法的不足,為建立新的模式識別理論提供了新的途徑。

        于是,基于同源連續(xù)性思想和模擬人類認(rèn)識事物的過程,王守覺院士[7]提出了另一種全新的仿生模式識別理論和方法。仿生模式識別理論把模式識別問題看成是對各類樣本的認(rèn)識,并將同源連續(xù)性規(guī)律作為先驗知識,用高維空間幾何流形覆蓋方法實現(xiàn)對同類事物的學(xué)習(xí),進(jìn)而實現(xiàn)對各類事物的認(rèn)識識別。其核心問題是認(rèn)識學(xué)習(xí)某類事物時,如何在高維特征空間實現(xiàn)對該類事物樣本的最優(yōu)連續(xù)覆蓋。覆蓋后在特征空間中形成的連續(xù)、閉合的復(fù)雜幾何流形區(qū)域賦予該類的屬性。其識別過程就是判斷特征空間中待識別樣本點是否落入此幾何流形區(qū)域內(nèi)。若是,則該樣本點屬于此幾何流形所代表的類別;否則認(rèn)為不屬于該類。由于其獨特的優(yōu)勢,仿生模式識別于 2002 年被提出后,被迅速應(yīng)用于人臉識別[8]、時間序列匹配[9]和語音識別[10]等領(lǐng)域。然而,針對仿生模式識別的流形覆蓋,雖然同一類樣本在高維特征空間中的分布表現(xiàn)為一個具有一定拓?fù)涞牧餍?,但是要實現(xiàn)對這類事物的完全流形覆蓋則面臨多類樣本非線性交疊和離群點等問題。

        于是,圍繞如何建立覆蓋單元、如何對同類樣本連續(xù)覆蓋學(xué)術(shù)辦進(jìn)行了大量的研究和探索。覃鴻等人[11]提出了多權(quán)值神經(jīng)元網(wǎng)絡(luò)仿生模式識別方法,以建立多個神經(jīng)元的超曲面圍成的高維有限空間流形覆蓋區(qū)域,并將其應(yīng)用于小樣本語音識別。文獻(xiàn)[12]提出了一種基于膠囊的分類覆蓋算法,該算法通過引入縮放因子以減少樣本覆蓋中流形區(qū)域的重合問題,然而其僅適用于一類樣本分布只有一個聚集點的情況。文獻(xiàn)[13]提出了一種基于超橢球的多類文本分類算法,該算法的關(guān)鍵是確定空間中超橢球的軸長和方向向量,但是在高維空間中對于超橢球的計算量非常大。文獻(xiàn)[14]提出一種基于超球鏈覆蓋的仿生模式識別方法對文本信號進(jìn)行識別,該方法使用最小二乘法對樣本進(jìn)行直線擬合,在樣本數(shù)據(jù)線性分布情況下分類效果顯著。

        雖然仿生模式識別一經(jīng)提出便得到學(xué)術(shù)界的廣泛關(guān)注,并取得了一系列研究成果,但現(xiàn)有方法主要針對具體的應(yīng)用場景和具有某種分布特性的數(shù)據(jù)集,沒有在流形覆蓋過程中考慮樣本特征空間中各特征對認(rèn)識各類別的貢獻(xiàn)度。同時,由于離群樣本和干擾噪聲等影響,致使現(xiàn)有的仿生模式識別方法分類效果仍然難以滿足實際應(yīng)用的需求。因此,本文針對現(xiàn)有仿生模式識別算法存在的問題,采用信息熵加權(quán)的馬氏距離為距離度量,改進(jìn)了局部離群因子檢測方法,并對樣本中的孤立點進(jìn)行篩除;此外采用加權(quán)馬氏距離改進(jìn)的自組織數(shù)據(jù)分析方法構(gòu)建超球分類模型,在此基礎(chǔ)上建立基于加權(quán)馬氏距離的超球覆蓋仿生模式分類算法,使得該方法能夠適應(yīng)具有多個聚集點、非線性分布、稀疏分布等特點的樣本數(shù)據(jù)集,且對離群樣本和干擾噪聲不敏感。

        1 基于改進(jìn)的ISODATA超球覆蓋

        1.1 基于超球覆蓋的分類思想

        張鈴等人[15]于1998年提出將神經(jīng)元與超球面上的球形領(lǐng)域之間建立直接的對應(yīng)關(guān)系,便能把神經(jīng)網(wǎng)絡(luò)的構(gòu)建轉(zhuǎn)換為特征訓(xùn)練樣本的球形覆蓋求解問題,并相繼提出領(lǐng)域覆蓋算法和交叉覆蓋算法,用超球流形覆蓋面來實現(xiàn)神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建。

        基于超球覆蓋的分類思想是:通過學(xué)習(xí)各類訓(xùn)練樣本,構(gòu)建各類樣本對應(yīng)的超球覆蓋流形(圖1)。當(dāng)分類某樣本時,計算待分類樣本點與各類超球中心點的距離,當(dāng)距離小于某類超球半徑時,則認(rèn)為測試樣本點屬于該超球類別,依此類推,直到所有待分類樣本分類完成。

        仿生模式識別方法的核心是在高維特征空間尋找對待分類事物樣本的最優(yōu)連續(xù)覆蓋。盡管超球覆蓋[13,14]在處理非膠囊或香腸型數(shù)據(jù)時比直線段膠囊覆蓋[7~12]有優(yōu)勢,但面對非線性、稀疏分布數(shù)據(jù)時仍有心無力。特別是當(dāng)某類數(shù)據(jù)具有多個聚集中心且類別間相互交疊時,現(xiàn)有覆蓋方法均無法滿足數(shù)據(jù)分類的要求。圖2給出了數(shù)據(jù)在非線性、稀疏和多聚集中心分布下的球覆蓋和膠囊覆蓋情況。從圖2可知,在數(shù)據(jù)非線性和稀疏分布條件下,膠囊覆蓋的分類效果好于球覆蓋。在數(shù)據(jù)存在多聚集中心且各類交疊情況下,兩種覆蓋都存在嚴(yán)重不足。從超球覆蓋分類原理和圖2可知,在超球流形覆蓋學(xué)習(xí)中,超球中心(類別數(shù)據(jù)聚集中心)和超球半徑的選擇尤為重要。如果能夠依據(jù)數(shù)據(jù)的分布情況,動態(tài)選擇相應(yīng)的超球中心和合適的超球半徑,將能夠更好地解決非線性和稀疏分布,以及存在多聚集中心的各類數(shù)據(jù)的流形覆蓋問題。

        迭代自組織聚類算法(ISODATA)[16]能夠在聚類過程中根據(jù)各個類別的實際情況調(diào)整聚類中心數(shù)量,實現(xiàn)對每類訓(xùn)練樣本進(jìn)行動態(tài)聚類。本文引入該算法,依據(jù)數(shù)據(jù)實際分布確立超球中心和半徑,以實現(xiàn)超球流形覆蓋。

        1.2 改進(jìn)的ISODATA算法(M-ISODATA)

        ISODATA算法通過自動合并和分裂調(diào)整類別數(shù),每類都得到若干小類以及各小類的中心。但在聚類過程中以歐氏距離為測度,忽略了不同特征維度在聚類過程中的重要程度差異。馬氏距離[14]可以用于度量高維數(shù)據(jù)空間中各樣本點間的距離,非常適合作為高維超球覆蓋中距離的測度。假設(shè)有特征樣本集為

        對于m維特征樣本數(shù)據(jù)xi,則樣本xi與xj之間的馬氏距離可以表示為

        其中:Σ-1表示m×m的協(xié)方差逆矩陣;xj為不同于xi的特征樣本點。從式(1)可知,Σ-1表示m×m的協(xié)方差逆矩陣,是衡量超球多維樣本數(shù)據(jù)間相關(guān)性的統(tǒng)計量。馬氏距離實質(zhì)上是一種加權(quán)的歐氏距離,即按照特征樣本的方差大小和特征樣本之間的相關(guān)程度進(jìn)行加權(quán)。圖3為各特征樣本集在歐氏空間和馬氏空間的分布情況。

        以歐氏距離為判據(jù)(圖3(a)),綠色樣本點(未知類別點)與藍(lán)色樣本點(黑色點的均值中心)更近。馬氏距離是歐氏距離的協(xié)方差歸一化加權(quán),消除了量綱,紅色樣本點(未知類別點)與藍(lán)色樣本點更近(圖3(b))。但這種加權(quán)仍然不能夠反映不同特征對聚類效果的貢獻(xiàn)程度。

        信息熵實質(zhì)是對系統(tǒng)無序程度的一種度量方式,也可用于信息有用程度的表征。本文引入信息熵表征某數(shù)據(jù)空間特征對類別劃分的重要程度?;谛畔㈧氐鸟R氏距離加權(quán)過程如下:

        其中:Ω=dia(w1,w2,…,wm)是特征權(quán)重矩陣;Σ-1=dia(1/σ21,1/σ22,…,1/σ2m)為特征協(xié)方差矩陣;wt(t=1,2,…,m)是每個特征的權(quán)重。

        圖4為圖3特征樣本數(shù)據(jù)在基于信息熵加權(quán)的馬氏距離空間的分布,在馬氏距離基礎(chǔ)上考慮了特征貢獻(xiàn)度,當(dāng)特征1貢獻(xiàn)度大于特征2時,出現(xiàn)綠色樣本點與藍(lán)色樣本點更近的情況,該樣本點更可能與藍(lán)色樣本點屬于同一類。

        在實際情況中,需要人工設(shè)置初始的聚類中心數(shù)目K0以及期望的聚類中心數(shù)目Kq,最少樣本數(shù)目Nmin以及類別間允許的最小距離dmin,允許迭代次數(shù)Fmax以及一次迭代過程中允許合并的聚類中心對數(shù)Lmax,可以通過多次實驗取最優(yōu)值。

        基于改進(jìn)的ISODATA算法構(gòu)建的球覆蓋模型能夠通過樣本學(xué)習(xí)對每類樣本內(nèi)部分散的小類進(jìn)行覆蓋,從而完成仿生模式識別過程中類別流形的構(gòu)建。圖4展示了前述非線性分布、稀疏分布或者具有多個聚類點的數(shù)據(jù)的流形覆蓋結(jié)果。從圖6(b)和(d)可知,改進(jìn)算法具有顯著的優(yōu)勢。

        除了特征樣本數(shù)據(jù)分布影響超球覆蓋分類性能外,在分類過程中,噪聲干擾也對分類結(jié)果造成重要影響。噪聲干擾往往造成少數(shù)樣本離群點,導(dǎo)致不同類別間產(chǎn)生嚴(yán)重的流形區(qū)域重疊現(xiàn)象。為了去除離群樣本,減少不同類別流形之間的重疊區(qū)域,通過局部離群因子檢測方法(LOF)[17]對訓(xùn)練集中的離群點進(jìn)行剔除。

        1.3 改進(jìn)的LOF算法(M-LOF)

        局部離群因子檢測方法,是一種具有代表性的基于密度的離群點檢測方法,由于離群點周圍的密度遠(yuǎn)低于其近鄰點附近的密度,所以可以通過計算樣本點與其近鄰點的相對密度比值,反映出該樣本點的離群程度。但是,現(xiàn)有LOF中每一個樣本與其鄰居的關(guān)系只用簡單的歐氏距離進(jìn)行表征,同時樣本中不同變量的權(quán)值比重是一樣的,沒有考慮變量權(quán)重尺度。故以前述的加權(quán)馬氏距離替換LOF中的歐氏距離。

        定義可達(dá)密度lrdk(p),用來衡量數(shù)據(jù)對象p在其附近集合內(nèi)的稀疏程度,值越小則表明分布越稀疏,越可能是離群點。通常可表示為

        其中:o為樣本集中除p以外的集合中的某一數(shù)據(jù);reachdk(p,o)=max{d^k(p),d^(p,o)}為p相對o的第k可達(dá)距離;d^(p,o)為樣本p與o的加權(quán)馬氏距離;d^k(p)為樣本p的第k距離,即距離p第k遠(yuǎn)的點到p的加權(quán)馬氏距離。

        應(yīng)用式(8)計算數(shù)據(jù)集中每個樣本點的離群因子,判斷是否為離群點。LOF值遠(yuǎn)大于1時為離群點,反之則為正常點。

        基于加權(quán)馬氏距離的ISODATA超球覆蓋優(yōu)化算法結(jié)合改進(jìn)的ISODATA和LOF算法,超球流形覆蓋優(yōu)化算法詳細(xì)描述如下:

        a)數(shù)據(jù)預(yù)處理。用改進(jìn)的LOF算法消除干擾孤立點。最大最小值歸一化公式如下:

        其中:x為原始數(shù)據(jù);x′為歸一化后的數(shù)據(jù),并作為LOF算法的輸入。

        b)計算超球覆蓋算法中每個類別的球心C。利用改進(jìn)的ISODATA算法計算第i類訓(xùn)練樣本的K個聚類點C′={c′1,c′2,…,c′K},找出最近的兩個聚類中心點,以兩類聚類中心點的中點為球心C={c1,c2,…,cK-1}。K個聚類中心點能構(gòu)造K-1個球心。

        c)確定球形覆蓋中超球體的半徑R。任意指定一聚類中心cK,計算其余聚類中心到cK的加權(quán)馬氏距離,找出其中最小值對應(yīng)類別cK-1,以這兩聚類中心點的距離為直徑構(gòu)造出兩個超球體。再計算其他聚類中心到cK-1的距離,重復(fù)上述步驟。為了盡可能覆蓋更多的樣本點,確定一個半徑系數(shù)Cr,計算R=R′·Cr,即對R′={r′1,r′2,…,r′k-1}乘以權(quán)重Cr,即可得到K-1個超球體的半徑R={r1,r2,…,rk-1}。

        d)以C為球心,R為半徑構(gòu)造出一類樣本的超球體流形區(qū)域,重復(fù)以上操作,即可得到每一類樣本的流形。

        e)重疊區(qū)域點的二次劃分。構(gòu)造標(biāo)簽矩陣L,利用KNN思想進(jìn)行重疊區(qū)域的二次劃分,劃分流程如圖7所示。

        中的任一條件,則被識別為覆蓋該樣本點的超球所代表的類別,式(10)中條件均不滿足時,樣本點被拒識。其中RA、RB、RC、RD分別表示每個超球區(qū)域的覆蓋半徑。

        2 實驗仿真及結(jié)果分析

        為了驗證該超球算法的有效性,首先使用含三類樣本的iris公共數(shù)據(jù)集進(jìn)行分類驗證實驗。然后,文中算法被應(yīng)用于雷達(dá)輻射源信號分類識別。

        2.1 iris數(shù)據(jù)集實驗驗證

        已知iris數(shù)據(jù)集分為virginica、setosa、versicolour三個品種,通過四個屬性(花萼長度,花萼寬度,花瓣長度,花瓣寬度)進(jìn)行分類識別。數(shù)據(jù)集總共包含3類總共150個數(shù)據(jù)樣本,每一類具有50個樣本。從每類選取30個樣本作為訓(xùn)練集,20個樣本作為測試集。萼片長度、萼片寬度和花瓣長度等三維特征對應(yīng)的M-ISODATA超球流形如圖8所示,其中,藍(lán)色表示setosa,綠色表示virginica,紅色表示versicolour。

        分類模型在不同覆蓋半徑系數(shù)Cr值的半徑下NMI、召回率和精確率的數(shù)值變化,如圖9所示。

        由圖9可知,當(dāng)Cr為1.5時模型的綜合效果更佳。將本文算法與現(xiàn)有的仿生模式識別算法進(jìn)行了對比,識別結(jié)果如表1所示。

        本文算法中,各個屬性特征對分類的貢獻(xiàn)度如表2所示,可以看出在iris數(shù)據(jù)集中,各個特征的貢獻(xiàn)度差異不大。

        改進(jìn)的超球流形算法與傳統(tǒng)SVM、KNN和BP模式識別算法的識別能力對比如圖10所示。從圖10中可以看出,分類類似于iris數(shù)據(jù)集的數(shù)據(jù),本文算法優(yōu)于現(xiàn)有典型分類器。

        2.2 雷達(dá)輻射源信號分類應(yīng)用

        1)特征貢獻(xiàn)率

        雷達(dá)輻射源數(shù)據(jù)樣本數(shù)量為19 125,每個樣本包含脈沖到達(dá)時間、載頻(RF)、脈寬(PW)、幅值(PA)、到達(dá)時間間隔等五個特征參數(shù)。應(yīng)用主成分分析法,對特征樣本進(jìn)行分析,發(fā)現(xiàn)PA、PW和RF三大特征對表征整體樣本特性的總貢獻(xiàn)率高達(dá)95.37%,三個特征的貢獻(xiàn)率如圖11所示。故在后續(xù)研究中,主要利用雷達(dá)信號的這三類特征進(jìn)行分析。

        基于上述雷達(dá)信號數(shù)據(jù)樣本分析,在總樣本集中隨機選取小樣本集,即1 800個樣本點(總共包括四類數(shù)據(jù),每類樣本個數(shù)為450)。選取信號載頻RF、脈沖寬度PW和脈沖幅值PA三個特征作為主元特征構(gòu)成樣本點以便進(jìn)行分析、測試。

        2)雷達(dá)信號分類

        先對數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)歸一化處理以及利用LOF算法去除樣本中的孤立點。PA、PW和RF特征的三維空間的散點分布如圖12所示。同時,為了體現(xiàn)改進(jìn)的LOF算法的有效性,比較了以歐氏距離為度量的LOF算法與加權(quán)馬氏距離度量的LOF算法在雷達(dá)信號的分類測試中的影響。

        經(jīng)過數(shù)據(jù)預(yù)處理,從高質(zhì)量的1 600個樣本中,選取每類樣本中的280個為訓(xùn)練集,120個為測試集。即在1 600個總樣本中有1 120個訓(xùn)練樣本集,480個測試樣本集。第三類樣本在三維空間的分布如圖13所示(其中,單獨的圓圈表示孤立點,星號部分表示提煉出的正常樣本點)。

        為了體現(xiàn)特征貢獻(xiàn)度對算法能力的提高,不進(jìn)行去除孤立點的操作、使用加權(quán)LOF算法、使用未加權(quán)LOF算法預(yù)處理的雷達(dá)輻射源分類識別效果如表3所示。

        在加權(quán)算法中,每類樣本中各屬性特征的貢獻(xiàn)度如表4所示,可以看出在雷達(dá)輻射源信號中,不同特征的特征貢獻(xiàn)度有很大的差異。

        然后,利用改進(jìn)的ISODATA算法計算每類樣本點的覆蓋中心和覆蓋半徑,找到能夠代表每一類樣本的覆蓋中心后,然后依據(jù)球形覆蓋半徑依次覆蓋代表每類樣本中的核心端點,最后對流形作拓?fù)溥\算得到三維空間中的超球簇,完成對所有樣本點的流形覆蓋,得到的RES數(shù)據(jù)三維超球覆蓋流形如圖14所示。訓(xùn)練覆蓋模型中的四種顏色分別代表四個不同類別的超球簇覆蓋流形,分布在不同超球體內(nèi)的樣本點分別屬于不同的類別。

        最后輸入測試集樣本,落于任意流形內(nèi)部的點被識別,外部的點被拒識。再對算法性能進(jìn)行評估。圖中第一類樣本的藍(lán)色流形與第二類樣本的黃色流形之間的覆蓋重疊比較多,因此在混淆矩陣中灰色區(qū)域有所反映,表示第二類中有部分樣本被誤識為第一類。

        在半徑的計算過程中引進(jìn)覆蓋半徑識別系數(shù)Cr,選取不同Cr值下的半徑,觀測三大評價指標(biāo)NMI、精確率和召回率的變化,如圖15所示??梢?,當(dāng)Cr為1.9時,模型的綜合效果更佳。

        為了證明在改進(jìn)的ISODATA算法中特征貢獻(xiàn)度對于構(gòu)建超球模型的有效性,對比了使用加權(quán)的M-ISODATA算法和未改進(jìn)ISODATA算法對雷達(dá)分類的識別結(jié)果,如表5所示。

        分別將膠囊算法、SVM、KNN和BP算法用于分類識別,在RES數(shù)據(jù)集進(jìn)行了對比測試的結(jié)果如表6所示。其中:RR表示識別率,F(xiàn)AR表示誤識率。

        3)對未知干擾類的拒識能力測試

        基于認(rèn)知思想的仿生認(rèn)知分類方法與傳統(tǒng)方法之間的主要區(qū)別在于識別學(xué)習(xí)過程中,其正確拒識新類別的能力。為了進(jìn)一步驗證優(yōu)化超球覆蓋分類算法的拒識能力,選取四類RES數(shù)據(jù)中的任一類作為未知類加入實驗測試集中。這里選擇第四類作為未知類,對前三類樣本進(jìn)行訓(xùn)練,輸入四類測試集樣本進(jìn)行測試。

        在RES數(shù)據(jù)集上進(jìn)行了對比測試的結(jié)果如表7所示。其中:RR表示識別率,F(xiàn)RR表示拒識率。從表7中可以看出,相較于傳統(tǒng)模式識別中的SVM、KNN和BP分類方法,基于認(rèn)知的超球流形覆蓋算法和膠囊流形算法能夠識別未知新類,進(jìn)而整體的識別率高。而其他方法不具備拒識的能力,當(dāng)面對測試集中的新類別樣本時,它會將其誤識為已學(xué)習(xí)過的樣本類別,故大大削減這些方法原始的識別效果。

        4)免重訓(xùn)能力測試

        免重訓(xùn)是指模式識別系統(tǒng)在遇到分類新未知類別時,無須新類與訓(xùn)練集中已有的類別一起重新學(xué)習(xí)。例如:已訓(xùn)練A和B兩類的分類模型,現(xiàn)需要用該模型識別未知C類時,本文模型無須將C類與A、B類數(shù)據(jù)一起訓(xùn)練分類器,只需對C類數(shù)據(jù)進(jìn)行學(xué)習(xí),該過程稱為免重訓(xùn)。這里直接訓(xùn)練四類雷達(dá)數(shù)據(jù)樣本和先訓(xùn)練三類樣本數(shù)據(jù),再加入第四類樣本數(shù)據(jù)之后的識別率的對比結(jié)果如表8所示。

        從表中可以看出,本文算法具有良好的免重訓(xùn)能力,降低了算法復(fù)雜度,有利于在線學(xué)習(xí)。

        2.3 時間復(fù)雜度分析

        改進(jìn)的ISODATA算法的時間復(fù)雜度為O(N2),N為訓(xùn)練集的樣本數(shù)。與傳統(tǒng)ISODATA算法相比,雖然時間復(fù)雜度增加了,但是沒有數(shù)量級上的改變。綜合幾種算法的能力來看,本文算法與文獻(xiàn)[12]具有顯著的分類性能優(yōu)勢。在相同的實驗環(huán)境下,運行兩種數(shù)據(jù)選擇算法所需的最大最小時間如表9所示。其中最小最大時間分別是iris和radar數(shù)據(jù)集??梢?,本文算法在提高性能的同時,并未提升過多時間復(fù)雜度,有一定的可行性。此外,傳統(tǒng)的模式識別算法在樣本數(shù)據(jù)多時,有著顯著的時間優(yōu)越性,但在小樣本集時,本文算法有著顯著的性能。

        3 結(jié)束語

        仿生模式識別是一種新的、不同于傳統(tǒng)識別方式的識別方法,相比于傳統(tǒng)的模式識別方法,它能實現(xiàn)對新類的免重訓(xùn),以及對干擾數(shù)據(jù)的拒識。針對覆蓋樣本中噪聲等擾動導(dǎo)致的流形重疊問題,先使用改進(jìn)的LOF算法篩除樣本中的孤立點,再使用迭代自組織聚類算法對流形重疊區(qū)域進(jìn)行二次劃分。利用加權(quán)馬氏距離對傳統(tǒng)歐氏距離度量中忽略掉的樣本特征的分類貢獻(xiàn)率和彼此之間的聯(lián)系進(jìn)行修正,使得分類結(jié)果更加準(zhǔn)確。針對仿生模式識別中樣本的覆蓋問題,建立超球體為覆蓋單元的仿生模式識別算法,結(jié)合改進(jìn)的ISODATA算法,能夠有效實現(xiàn)對擁有多個聚集點、非線性分布、稀疏分布的樣本的覆蓋,更加符合樣本的分布特性。應(yīng)用三類iris數(shù)據(jù)對該分類器算法進(jìn)行有效性測試,識別率可以達(dá)到100%。再把該算法應(yīng)用于四類雷達(dá)輻射信號的分類識別上,識別率可以達(dá)到97.29%,對于未知干擾類別也可以有效拒識,拒識率達(dá)到100%,此外還有良好的免重訓(xùn)能力。對比基于膠囊的仿生模式識別算法和傳統(tǒng)的模式識別算法,該分類器在各項性能上都有很好的分類效果,但該算法還存在一些問題,比如各個類別的訓(xùn)練樣本構(gòu)成的超球區(qū)域是由流形堆疊而成,而在中間產(chǎn)生的空白區(qū)域可能會導(dǎo)致一定的誤識情況產(chǎn)生,在未來將會對其進(jìn)行進(jìn)一步研究。

        參考文獻(xiàn):

        [1]Fisher R A. Contributions to mathematical statistics[M]. Hoboken:Wiley, 1952.

        [2]Vapnik V N. 統(tǒng)計學(xué)習(xí)理論的本質(zhì)[M].張學(xué)工,譯. 北京:清華大學(xué)出版社,2000. (Vapnik V N.Essence of statistical learning theory[M].Zhang Xuegong, trans. Beijing:Tsinghua University Press, 2000.)

        [3]閆鵬程, 尚松行, 張超銀, 等. 改進(jìn)BP神經(jīng)網(wǎng)絡(luò)算法對煤礦水源的分類研究[J]. 光譜學(xué)與光譜分析,2021,41(7):2288-2293. (Yan Pengcheng, Shang Songxing, Zhang Chaoyin,et al.Research on classification of coal mine water source by improved BP neural network algorithm[J]. Spectroscopy and Spectral Analysis,2021,41(7):2288-2293.)

        [4]李思奇, 呂王勇, 鄧柙, 等. 基于改進(jìn)PCA的樸素貝葉斯分類算法[J]. 統(tǒng)計與決策, 2022,38(1):34-37. (Li Siqi, Lyu Wang-yong, Deng Jia, et al.Naive Bayesian classification algorithm based on improved PCA[J]. Statistics and Decision Making, 2022,38(1):34-37.)

        [5]李博, 張曉, 顏靖藝, 等. 基于值差度量和聚類優(yōu)化的K最近鄰算法在銀行客戶行為預(yù)測中的應(yīng)用[J]. 計算機應(yīng)用, 2019,39(9):2784-2788. (Li Bo, Zhang Xiao, Yan Jingyi, et al. Application of KNN algorithm based on value difference metric and clustering application of KNN algorithm based on value difference metric and clustering[J]. Journal of Computer Applications, 2019,39(9):2784-2788.)

        [6]王新晴, 孟凡杰, 呂高旺, 等. 基于PCA-SVM準(zhǔn)則改進(jìn)區(qū)域生長的非結(jié)構(gòu)化道路識別[J]. 計算機應(yīng)用, 2017,37(6):1782-1786. (Wang Xinqing,Meng Fanjie,Lyu Gaowang,et al. Unstructured road detection based on improved region growing with PCA-SVM rule[J]. Journal of Computer Applications,2017,37(6):1782-1786.)

        [7]王守覺. 仿生模式識別(拓?fù)淠J阶R別) ——一種模式識別新模型的理論與應(yīng)用[J]. 電子學(xué)報,2002,30(10):1417-1420. (Wang Shoujue. Bionic pattern recognition(topological pattern recognition)—Theory and application of a new pattern recognition model[J]. Acta Electronica Sinica,2002,30(10):1417-1420.)

        [8]王守覺,曲延鋒,李衛(wèi)軍,等. 基于仿生模式識別與傳統(tǒng)模式識別的人臉識別效果比較研究[J]. 電子學(xué)報,2004,32(7):1057-1061. (Wang Shoujue,Qu Yanfeng,Li Weijun,et al. Comparative study on the effect of face recognition based on bionic pattern recognition and traditional pattern recognition[J]. Acta Electronica Sinica,2004,32(7):1057-1061.)

        [9]閭海榮,韓慧,王文淵. 基于仿生模式識別思想的時間序列匹配[J]. 電子學(xué)報,2007,35(7):1323-1326. (Lyu Hairong,Han Hui,Wang Wenyuan. Time series matching based on bionic pattern recognition[J]. Acta Electronica Sinica,2007,35(7):1323-1326.)

        [10]徐毅,殷業(yè),王沛. 基于仿生模式識別的語音識別研究[J]. 上海電機學(xué)院學(xué)報,2007,10(2):127-130. (Xu Yi,Yin Ye,Wang Pei. Research on speech recognition based on bionic pattern recognition[J]. Journal of Shanghai Institute of Electrical Engineering,2007,10(2):127-130.)

        [11]覃鴻,王守覺. 多權(quán)值神經(jīng)元網(wǎng)絡(luò)仿生模式識別方法在低訓(xùn)練樣本數(shù)量非特定人語音識別中與HMM及DTW的比較研究[J]. 電子學(xué)報,2005,33(5):957-960. (Qin Hong,Wang Shoujue. A comparative study of multi weight neural network biomimetic pattern recognition method with HMM and DTW in speaker independent speech recognition with low number of training samples[J]. Acta Electronica Sinica,2005,33(5):957-960.)

        [12]Yu Zhibin,Ying Zhang,Chen Chunxia. A classification method of capsule covering[C]//Proc of the 16th International Conference on Natural Computation,F(xiàn)uzzy Systems and Knowledge Discovery. Berlin:Springer ,2020 :1002-1009.

        [13]秦玉平,陳一荻,王春立,等. 基于超橢球的多類文本分類算法研究[J]. 計算機科學(xué),2011,38(8):242-244. (Qing Yuping,Chen Yidi,Wang Chunli,et al. Research on multi class text classification algorithm based on hyperellipsoid[J]. Computer Science,2011,38(8):242-244.)

        [14]李麗,殷業(yè),崔曉靜. 基于超球覆蓋仿生模式識別的指紋點名系統(tǒng)[J]. 上海師范大學(xué)學(xué)報:自然科學(xué)版,2015,44(1):81-87. (Li Li,Yin Ye,Cui Xiaojing. Fingerprint roll call system based on bionic pattern recognition of hypersphere coverage[J]. Journal of Shanghai Normal University:Natural Science Edition,2015,44(1):81-87.)

        [15]張鈴,張鈸. M-P神經(jīng)元模型的幾何意義及其應(yīng)用[J]. 軟件學(xué)報,1998,9(5):334-338. (Zhang Ling,Zhang Ba. Geometric signi-ficance and application of M-P neuron model[J]. Journal of Software,1998,9(5):334-338.)

        [16]朱怡欣. 基于迭代自組織數(shù)據(jù)分析算法的城市地下物流節(jié)點選擇[J]. 智能計算機與應(yīng)用,2021,11(11):112-116. (Zhu Yixin. Urban underground logistics node selection based on iterative self-organizing data analysis algorithm[J]. Intelligent Computer and Application,2021,11(11):112-116.)

        [17]劉灝,朱世佳,畢天姝. 基于局部離群因子的PMU連續(xù)壞數(shù)據(jù)檢測方法[J]. 電力系統(tǒng)自動化,2022,46(1):25-32. (Liu Hao,Zhu Shijia,Bi Tianshu. PMU continuous bad data detection method based on local outlier factor[J]. Power System Automation,2022,46(1):25-32.)

        [18]嚴(yán)晨,李凡長. 覆蓋學(xué)習(xí)的道路優(yōu)化算法[J]. 軟件學(xué)報,2015,26(11):2781-2794. (Yan Chen,Li Fanchang. Path optimization algorithms for corering learning[J]. Journal of Software,2015,26(11):2781-2794.

        [19]來疆亮,王守覺. 最小球覆蓋幾何算法及其在模式識別中的應(yīng)用[J]. 模式識別與人工智能,2006,19(2):271-276. (Lai Jiang-liang,Wang Shoujue. Minimal sphere covering geometry algorithm and its application in pattern recognition[J]. Pattern Recognition and Artificial Intelligence,2006,19(2):271-276.)

        [20]翟傳敏,杜吉祥. 一種基于覆蓋超球算法的徑向基概率神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化[J]. 福州大學(xué)學(xué)報:自然科學(xué)版,2009,37(1):33-38. (Zhai Chuanmin,Du Jixiang. Structure optimization of radial basis probabilistic neural network based on covering hypersphere algorithm[J]. Journal of Fuzhou University:Natural Science Edition,2009,37(1):33-38.)

        [21]陳陽,覃鴻,李衛(wèi)軍,等. 仿生模式識別技術(shù)研究與應(yīng)用進(jìn)展[J]. 智能系統(tǒng)學(xué)報,2016,11(1):1-14. (Chen Yang,Qin Hong,Li Weijun,et al. Research and application progress of bionic pattern recognition technology[J]. Journal of Intelligent Systems,2016,11(1):1-14.)

        [22]武妍,姚瀟,王守覺. 基于重疊空間相對劃分的仿生模式識別方法[J]. 模式識別與人工智能,2008,21(3):346-350. (Wu Yan,Yao Xiao,Wang Shoujue. Bionic pattern recognition method based on relative division of overlapping space[J]. Pattern Recognition and Artificial Intelligence,2008,21(3):346-350.)

        [23]齊留洋,王德勝,劉占全,等. 改進(jìn)加權(quán)距離判別分析模型的邊坡爆破穩(wěn)定性判別[J]. 中國有色金屬學(xué)報,2021,31(7):1989-1996. (Qi Liuyang,Wang Desheng,Liu Zhanquan,et al. Identification of slope blasting stability based on improved weighted distance discriminant analysis model[J]. Chinese Journal of Nonferrous Metals,2021,31(7):1989-1996.)

        [24]邵長龍,孫統(tǒng)風(fēng),丁世飛. 基于信息熵加權(quán)的聚類集成算法[J]. 南京大學(xué)學(xué)報:自然科學(xué)版,2021,57(2):189-196. (Shao Changlong,Sun Tongfeng,Ding Shifei. Clustering integration algorithm based on information entropy weighting[J]. Journal of Nanjing University:Natural Science Edition, 2021,57(2):189-196.)

        [25]王珂瑤,王惠文,趙青,等. 一種修正的馬氏距離判別法[J]. 北京航空航天大學(xué)學(xué)報,2022,48(5):824-830. (Wang Keyao,Wang Huiwen,Zhao Qing,et al. A modified Mahalanobis distance discrimination method[J]. Journal of Beijing University of Aeronautics and Astronautics, 2022,48(5):824-830.)

        [26]林之岸,劉晟源,金偉超,等. 基于改進(jìn)局部離群因子的低壓用戶用電隱患檢測方法[J]. 電力系統(tǒng)自動化,2022,46(1):130-138. (Lin Zhi’an,Liu Shengyuan,Jin Weichao,et al. Detection method of hidden power consumption hazards of low-voltage users based on improved local outlier factor[J]. Power System Automation,2022,46(1):130-138.)

        [27]張婷,戴芳,郭文艷. 基于ISODATA聚類的詞匯樹圖像檢索算法[J]. 計算機科學(xué),2014,41(S2):123-127. (Zhang Ting,Dai Fang,Guo Wenyan. Vocabulary tree image retrieval algorithm based on ISODATA clustering[J]. Computer Science,2014,41(S2):123-127.)

        [28]曹鵬宇,楊承志,石禮盟,等. 基于PSO-DBSCAN和SCGAN的未知雷達(dá)信號處理方法[J]. 系統(tǒng)工程與電子技術(shù),2022,44(4):1158-1165. (Cao Pengyu,Yang Chengzhi,Shi Limeng,et al. Unknown radar signal processing method based on PSO-DBSCAN and SCGAN[J]. System Engineering and Electronic Technology,2022,44(4):1158-1165.)

        [29]肖易寒,王亮,郭玉霞. 基于去噪卷積神經(jīng)網(wǎng)絡(luò)的雷達(dá)信號調(diào)制類型識別[J]. 電子與信息學(xué)報,2021,43(8):2300-2307. (Xiao Yihan,Wang Liang,Guo Yuxia. Radar signal modulation type recognition based on de-noising convolution neural network[J]. Journal of Electronics and Information,2021,43(8):2300-2307.)

        [30]趙永強,饒元,董世鵬,等. 深度學(xué)習(xí)目標(biāo)檢測方法綜述[J]. 中國圖象圖形學(xué)報,2020,25(4):629-654. (Zhao Yongqiang,Rao Yuan,Dong Shipeng,et al. Overview of deep learning target detection methods[J]. Chinese Journal of Image and Graphics,2020,25(4):629-654.)

        收稿日期:2022-07-24;修回日期:2022-09-30 基金項目:裝備發(fā)展部領(lǐng)域基金資助項目;電磁應(yīng)用重點實驗室基金資助項目

        作者簡介:劉莉萍(1995-),女,四川德陽人,碩士研究生,主要研究方向為模式識別、人工智能;馮清賢(1981-),男,山東東營人,高級工程師,主要研究方向為電子對抗總體技術(shù);余志斌(1976-),男(通信作者),湖南寧鄉(xiāng)人,副教授,博士,主要研究方向為信號處理、數(shù)據(jù)分析和電子對抗(zbyu@swjtu.edu.cn).

        亚洲男人天堂2019| 色欲AV成人无码精品无码| 亚洲区精选网址| 亚洲成在人网站天堂日本| 亚洲一区二区三区av天堂| 日产分东风日产还有什么日产| 国产欧美综合一区二区三区| 粉嫩被粗大进进出出视频| 99久久免费精品高清特色大片| 久热爱精品视频在线观看久爱| 亚洲一区二区av免费观看| 巨爆中文字幕巨爆区爆乳| 成人国内精品久久久久一区| 98色花堂国产精品首页| 中文在线最新版天堂av| 一本色道久久88—综合亚洲精品| 国产ww久久久久久久久久| 国产精品国语对白露脸在线播放 | 美女福利一区二区三区在线观看| 久久精品国产福利亚洲av| 精品一二三四区中文字幕| 少妇裸体性生交| 越南女子杂交内射bbwxz| 国产尤物AV尤物在线看| 日本女优在线观看一区二区三区 | 国产精品99精品一区二区三区∴ | 媚药丝袜美女高清一二区| 国产成+人欧美+综合在线观看| a级国产乱理论片在线观看| 在线亚洲AV不卡一区二区 | 女优av一区二区三区| 国精品无码一区二区三区在线| 亚洲一二三区在线观看| 亚洲中文无码精品久久不卡| 一本色道88久久加勒比精品| 人妻丰满熟妇岳av无码区hd| 色爱区综合激情五月综合小说| 蜜桃视频中文字幕一区二区三区| 国产99一区二区三区四区| 人妻丝袜无码国产一区| 久久一区二区三区不卡|