朱學(xué)鋒
(中國(guó)人民解放軍92941部隊(duì),遼寧 葫蘆島 125000)
?
基于最近鄰聚類(lèi)分析的多站遙測(cè)數(shù)據(jù)融合方法
朱學(xué)鋒
(中國(guó)人民解放軍92941部隊(duì),遼寧 葫蘆島 125000)
摘要:為研究多測(cè)站遙測(cè)數(shù)據(jù)智能對(duì)接方法,提供高質(zhì)量全彈道遙測(cè)數(shù)據(jù),利用多傳感器信息融合技術(shù),采用最近鄰聚類(lèi)分析算法實(shí)現(xiàn)目標(biāo)識(shí)別級(jí)多測(cè)站遙測(cè)數(shù)據(jù)融合。以某次試驗(yàn)5個(gè)測(cè)站的遙測(cè)數(shù)據(jù)為例進(jìn)行了仿真測(cè)試,測(cè)試結(jié)果表明:該方法能從多個(gè)測(cè)站中遴選出最優(yōu)遙測(cè)數(shù)據(jù)幀,經(jīng)整合重組后實(shí)現(xiàn)多測(cè)站原始遙測(cè)數(shù)據(jù)融合,有效剔除非正常跟蹤遙測(cè)數(shù)據(jù),提高了數(shù)據(jù)處理效率和質(zhì)量。
關(guān)鍵詞:遙測(cè)數(shù)據(jù);聚類(lèi)分析;最近鄰算法;數(shù)據(jù)融合
飛航式導(dǎo)彈試驗(yàn)的全程遙測(cè)數(shù)據(jù)是由多個(gè)陸上和海上測(cè)量站、船接力測(cè)量完成的。為保證記錄到全程遙測(cè)數(shù)據(jù),通常需要接力測(cè)量并在導(dǎo)彈飛行的各個(gè)階段確保有2套以上的測(cè)量結(jié)果。在對(duì)遙測(cè)數(shù)據(jù)事后處理之前,需要對(duì)這些原始測(cè)量數(shù)據(jù)進(jìn)行質(zhì)量檢查,從有冗余的測(cè)量數(shù)據(jù)中,選擇記錄質(zhì)量最好的遙測(cè)數(shù)據(jù)重新組合,形成新的全彈道遙測(cè)數(shù)據(jù)。傳統(tǒng)的數(shù)據(jù)處理方法是首先解析各地面接收站記錄的遙測(cè)數(shù)據(jù)并提取全部或部分參數(shù),通過(guò)觀察參數(shù)曲線(xiàn)圖的記錄質(zhì)量評(píng)估原始遙測(cè)數(shù)據(jù)的優(yōu)劣,并生成各測(cè)站遙測(cè)數(shù)據(jù)記錄質(zhì)量檢查表,進(jìn)而建立多站遙測(cè)數(shù)據(jù)對(duì)接表。在數(shù)據(jù)對(duì)接表的基礎(chǔ)上以對(duì)接點(diǎn)時(shí)間為基準(zhǔn)截取各測(cè)站的遙測(cè)數(shù)據(jù)進(jìn)行對(duì)接,并將對(duì)接點(diǎn)前后相同的10幀信號(hào)進(jìn)行對(duì)比校驗(yàn)。這種方法步驟繁瑣,需要較多的人工干預(yù),影響了遙測(cè)數(shù)據(jù)檢查的效率和數(shù)據(jù)對(duì)接的質(zhì)量。文獻(xiàn)[1]采用遙測(cè)數(shù)據(jù)的幀同步碼和幀計(jì)數(shù)作為數(shù)據(jù)融合的基準(zhǔn),忽略了幀時(shí)間延遲和幀數(shù)據(jù)匹配程度的問(wèn)題,對(duì)精細(xì)化數(shù)據(jù)分析會(huì)有一定影響。本文提出了一種基于最近鄰聚類(lèi)分析算法實(shí)現(xiàn)遙測(cè)數(shù)據(jù)融合的新方法,能夠精確、高效地完成多測(cè)站遙測(cè)數(shù)據(jù)的子幀數(shù)據(jù)選優(yōu)和重組,有效剔除干擾信號(hào),提供高質(zhì)量的全彈道遙測(cè)數(shù)據(jù)。
1多測(cè)站遙測(cè)數(shù)據(jù)的融合結(jié)構(gòu)
多傳感器信息融合[3-4]的基本原理就是充分利用多個(gè)傳感器資源,合理支配與使用各傳感器及其觀測(cè)信息,依據(jù)某種準(zhǔn)則對(duì)各傳感器在空間和時(shí)間上互補(bǔ)或冗余的信息進(jìn)行自動(dòng)分析和優(yōu)化綜合,最大限度地獲取被探測(cè)目標(biāo)和環(huán)境的信息量,并對(duì)探測(cè)目標(biāo)和環(huán)境形成相對(duì)完整、一致的描述。
遙測(cè)數(shù)據(jù)是由群路數(shù)據(jù)組成的,幀是群路數(shù)據(jù)的基本單元,其幀格式如圖1所示。圖中,N為子幀長(zhǎng)度,M為副幀長(zhǎng)度,W為波道號(hào)。
圖1 遙測(cè)幀數(shù)據(jù)格式
原始遙測(cè)數(shù)據(jù)是各測(cè)控站實(shí)時(shí)測(cè)控獲取的遙測(cè)數(shù)據(jù)流文件,具有圖2所示結(jié)構(gòu)[2]。
圖2 原始遙測(cè)數(shù)據(jù)結(jié)構(gòu)
按照信息抽象的層次,融合分為檢測(cè)級(jí)、位置級(jí)、目標(biāo)識(shí)別級(jí)、態(tài)勢(shì)評(píng)估和威脅估計(jì)等5個(gè)級(jí)別[3-5]。根據(jù)遙測(cè)數(shù)據(jù)的特點(diǎn),遙測(cè)數(shù)據(jù)的多傳感器數(shù)據(jù)融合可以在目標(biāo)識(shí)別級(jí)的數(shù)據(jù)層融合和特征層融合2個(gè)層次上進(jìn)行。
數(shù)據(jù)層融合是在原始數(shù)據(jù)級(jí)實(shí)現(xiàn)數(shù)據(jù)融合。首先將各測(cè)站接收的遙測(cè)數(shù)據(jù)傳輸?shù)綌?shù)據(jù)處理中心進(jìn)行集中式的融合處理,再提取各參數(shù)供后期處理和分析評(píng)估使用,其融合結(jié)構(gòu)如圖3所示。原始數(shù)據(jù)級(jí)融合結(jié)構(gòu)更適合于事后的數(shù)據(jù)處理。
圖3 遙測(cè)數(shù)據(jù)級(jí)融合結(jié)構(gòu)
特征層融合是在遙測(cè)參數(shù)級(jí)實(shí)現(xiàn)數(shù)據(jù)融合,首先在接收終端實(shí)現(xiàn)參數(shù)提取,再將關(guān)鍵參數(shù)傳輸?shù)綌?shù)據(jù)處理中心進(jìn)行融合處理,具有傳輸數(shù)據(jù)量小,時(shí)延短的特點(diǎn),其融合結(jié)構(gòu)如圖4所示。參數(shù)級(jí)融合結(jié)構(gòu)更適合于實(shí)時(shí)的遙測(cè)數(shù)據(jù)處理。
圖4 遙測(cè)參數(shù)級(jí)融合結(jié)構(gòu)
本文以遙測(cè)數(shù)據(jù)級(jí)融合結(jié)構(gòu)為基礎(chǔ),研究遙測(cè)數(shù)據(jù)在數(shù)據(jù)層實(shí)現(xiàn)數(shù)據(jù)融合的方法。
2原始遙測(cè)數(shù)據(jù)融合方法
原始遙測(cè)數(shù)據(jù)融合的關(guān)鍵是各測(cè)控站數(shù)據(jù)的關(guān)聯(lián)。理論上講,在完成幀同步、時(shí)間同步和數(shù)據(jù)對(duì)齊后,各測(cè)站子幀數(shù)據(jù)應(yīng)該是完全相同的。但是在跟蹤測(cè)量飛行器過(guò)程中,各測(cè)站會(huì)受到方位、距離、電磁環(huán)境等的影響,使接收的遙測(cè)數(shù)據(jù)疊加有干擾信號(hào)。遙測(cè)數(shù)據(jù)融合的實(shí)質(zhì)是判別各測(cè)站子幀數(shù)據(jù)是否一致,即相似性度量,從而將完全相異的數(shù)據(jù)剔除掉,達(dá)到數(shù)據(jù)選優(yōu)的目的。為此,筆者采用最近鄰聚類(lèi)方法實(shí)現(xiàn)遙測(cè)數(shù)據(jù)的融合。
2.1最近鄰聚類(lèi)原理
聚類(lèi)是對(duì)數(shù)據(jù)對(duì)象進(jìn)行分組,形成多個(gè)類(lèi)或簇,同一個(gè)簇中的對(duì)象具有較高的相似度,而不同簇中的對(duì)象則差別較大。最近鄰聚類(lèi)算法中的相異度主要是基于描述對(duì)象的屬性值來(lái)計(jì)算,而距離是計(jì)算中經(jīng)常采用的度量方式。
許多聚類(lèi)算法都是以相異度矩陣為基礎(chǔ),相異度矩陣是存儲(chǔ)K個(gè)對(duì)象兩兩之間的鄰近性,表現(xiàn)形式是一個(gè)K×K維的矩陣。將遙測(cè)數(shù)據(jù)中的子幀數(shù)據(jù)看作數(shù)據(jù)向量對(duì)象,則t時(shí)刻K個(gè)測(cè)站子幀數(shù)據(jù)的相異度矩陣[6-8]可表示為
(1)
式中:dij是測(cè)站i和測(cè)站j 之間的子幀數(shù)據(jù)相異性的量化表示,通常它是一個(gè)非負(fù)的數(shù)值。當(dāng)對(duì)象i和j越相似,dij值越接近0;2個(gè)對(duì)象越不同,其值越大。
最常用的距離度量方法是歐幾里得距離和曼哈坦距離??紤]到計(jì)算效率,本文采用曼哈坦距離公式[7-8],計(jì)算如下:
(2)
式中:站位編號(hào)i,j=1,2,…,K;N為子幀數(shù)據(jù)長(zhǎng)度。
為了減小度量單位的選擇對(duì)聚類(lèi)效果的影響,需要對(duì)子幀數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,使原來(lái)的度量值變成無(wú)度量單位的值[7]。對(duì)子幀數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化度量,可以作如下變換。
①計(jì)算絕對(duì)偏差的平均值。
(3)
②計(jì)算標(biāo)準(zhǔn)度量值。
(4)
2.2最近鄰聚類(lèi)的實(shí)現(xiàn)
在實(shí)際應(yīng)用中,無(wú)需計(jì)算相異度矩陣,采用最近鄰算法實(shí)現(xiàn)聚類(lèi)分析。最近鄰聚類(lèi)是一種最簡(jiǎn)單的聚類(lèi)算法[8-9]。根據(jù)此算法,首先把第1個(gè)站位子幀數(shù)據(jù)作為第1組的聚類(lèi)中心。然后,如果1個(gè)站位的子幀數(shù)據(jù)距該聚類(lèi)中心的距離d小于某個(gè)預(yù)期值,就把該站位子幀數(shù)據(jù)放到此組中,即該組的聚類(lèi)中心是和這個(gè)子幀數(shù)據(jù)最鄰近;否則,把該子幀數(shù)據(jù)設(shè)為新的聚類(lèi)中心。詳細(xì)的算法如下。
步驟3。令k=k+1,若k≤K,返回步驟2。
2.3融合準(zhǔn)則
在飛行器飛行試驗(yàn)過(guò)程中,至少要2個(gè)測(cè)站同時(shí)跟蹤測(cè)量相同區(qū)段的遙測(cè)數(shù)據(jù)。因此,在全程彈道中始終至少有2個(gè)站位的子幀數(shù)據(jù)相同。根據(jù)這一特點(diǎn),在最近鄰聚類(lèi)的基礎(chǔ)上,設(shè)計(jì)如下融合準(zhǔn)則。
準(zhǔn)則3。上述2個(gè)準(zhǔn)則失效時(shí),調(diào)整聚類(lèi)半徑。
3仿真測(cè)試
以某次試驗(yàn)5個(gè)測(cè)站的遙測(cè)數(shù)據(jù)為例,經(jīng)時(shí)碼同步、數(shù)據(jù)對(duì)齊、標(biāo)準(zhǔn)化度量變換后,由式(2)獲得5個(gè)測(cè)站的遙測(cè)子幀數(shù)據(jù)相異度矩陣:
由相異度矩陣可以看出:測(cè)站1、測(cè)站2相異度為0,即數(shù)據(jù)完全相同。測(cè)站3、測(cè)站4和測(cè)站5都受到了不同程度的噪聲干擾。由相異度數(shù)值可判斷出測(cè)站4、測(cè)站5的野值要多于測(cè)站3的野值。
根據(jù)最近鄰聚類(lèi)算法,設(shè)聚類(lèi)半徑初始值r=0.1,可以得到聚類(lèi)分析的結(jié)果。
由融合準(zhǔn)則1可確定聚類(lèi)1中存在優(yōu)選數(shù)據(jù),測(cè)站1和測(cè)站2與聚類(lèi)中心距離最小,可作為優(yōu)質(zhì)數(shù)據(jù)加以選擇。
將全程遙測(cè)數(shù)據(jù)的融合處理結(jié)果與各測(cè)站遙測(cè)數(shù)據(jù)的處理結(jié)果進(jìn)行對(duì)比,可以發(fā)現(xiàn)融合數(shù)據(jù)的野值明顯減少,孤立野值的剔除率高于95%,而斑點(diǎn)野值的剔除率不低于85%,數(shù)據(jù)質(zhì)量明顯改善。實(shí)驗(yàn)表明,基于最近鄰聚類(lèi)方法進(jìn)行數(shù)據(jù)融合能夠有效獲得各測(cè)站中的最優(yōu)子幀數(shù)據(jù)。
在算法使用中,初始參數(shù)r的選擇是算法正確實(shí)施的關(guān)鍵。r過(guò)小,在所有測(cè)站都有干擾的情況下,會(huì)使聚類(lèi)的數(shù)目與測(cè)站的數(shù)目相同,即每個(gè)測(cè)站的子幀數(shù)據(jù)都形成一個(gè)聚類(lèi),致使算法失效。在實(shí)際處理中出現(xiàn)失效時(shí),將聚類(lèi)半徑以2倍遞增并重新計(jì)算。
4結(jié)束語(yǔ)
本文分析了遙測(cè)數(shù)據(jù)處理中數(shù)據(jù)對(duì)接方法存在的問(wèn)題和弊病,提出了一種新的基于最近鄰聚類(lèi)分析實(shí)現(xiàn)遙測(cè)原始遙測(cè)數(shù)據(jù)融合的方法,使遙測(cè)數(shù)據(jù)的對(duì)接和整合達(dá)到子幀數(shù)據(jù)級(jí)別,實(shí)現(xiàn)了更精確的遙測(cè)數(shù)據(jù)處理。試驗(yàn)數(shù)據(jù)的測(cè)試和檢驗(yàn)表明,該方法能夠準(zhǔn)確地從多測(cè)站遙測(cè)數(shù)據(jù)中遴選出最優(yōu)的子幀數(shù)據(jù),為數(shù)據(jù)處理提供了全彈道高質(zhì)量遙測(cè)數(shù)據(jù),提高了處理效率和質(zhì)量。
參考文獻(xiàn)
[1]劉亞南,陳雷.遙測(cè)數(shù)據(jù)融合軟件的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代電子技術(shù),2012,35(4):136-138.
LIU Ya-nan,CHEN Lei.Design and implementation of telemetry data fusion software[J].Modern Electronics Technique,2012,35(4):136-138.(in Chinese)
[2]陳以恩.遙測(cè)數(shù)據(jù)處理[M].北京:國(guó)防工業(yè)出版社,2002:393-397.
CHEN Yi-en.Telemetry data processing[M].Beijing:National Defense Industry Press,2002:393-397(in Chinese)
[3]何友,王國(guó)宏.多傳感器信息融合及應(yīng)用[M].第二版.北京:電子工業(yè)出版社,2007:2-6.
HE You,WANG Guo-hong.Multisensor Information fusion with applications[M].Second Edition.Beijing:Publishing House of Electronics Industry,2007:2-6.(in Chinese)
[4]宮志華,段鵬偉,岳銳.外彈道多源異類(lèi)測(cè)元數(shù)據(jù)融合仿真分析[J].彈道學(xué)報(bào),2014,26(4):19-23.
GONG Zhi-hua,DUAN Peng-wei,YUE Rui.Simulation of data fussion with multi-source heterogeneous measurement elements[J].Journal of Ballistics,2014,26(4):19-23.(in Chinese)
[5]王慧斌,王建穎.信息系統(tǒng)集成與融合技術(shù)及其應(yīng)用[M].北京:國(guó)防工業(yè)出版社,2005:219-232.
WANG Hui-bin,WANG Jian-ying.Information system integration and fusion technology and its application[M].Beijing:National Defense Industry Press,2005:219-232.(in Chinese)
[6]岳昆.數(shù)據(jù)工程[M].北京:清華大學(xué)出版社,2013:178-204.
YUE Kun.Data engineering[M].Beijing:Tsinghua University Press,2013:178-204.(in Chinese)
[7]戴劍偉,吳照林.數(shù)據(jù)工程理論與技術(shù)[M].北京:國(guó)防工業(yè)出版社,2010:208-218.
DAI Jian-wei,WU Zhao-lin.Theory and technology of data engineering[M].Beijing:National Defense Industry Press,2010:208-218.(in Chinese)
[8]HAN J,KAMBER M,PEI J.數(shù)據(jù)挖掘概念與技術(shù)[M].第三版.范明,孟小峰,譯.北京:機(jī)械工業(yè)出版社,2015:44-54.
HAN J,KAMBER M,PEI J.Data mining concepts and techniques[M].Third Edition.FAN Ming,MENG Xiao-feng,translation.Beijing:China Machine Press,2015:44-54.(in Chinese)
[9]王立新.模糊系統(tǒng)與模糊控制教程[M].北京:清華大學(xué)出版社,2003:134-164.
WANG Li-xin.A course in fuzzy system & control[M].Beijing:Tsinghua University Press,2003:134-164.(in Chinese)
A Multi-station Telemetry Data Fusion Method Based on the Nearest-neighbor Clustering Analysis
ZHU Xue-feng
(Unit 92941 of PLA,Huludao 125000,China)
Abstract:To study the multi-station telemetry data automated-docking method to provide the high-quality whole-ballistic telemetry data,the multi-sensor information fusion technology was used,and the target recognition level multi-station telemetry data-fusion was realized by adopting nearest-neighbor clustering algorithm.Taking the telemetry data of five stations in an experiment for instance,the simulation was carried out.The tests show that the optimal telemetry data frame can be effectively selected from multiple stations by this method.The multi-station telemetry data fusion can be achieved by the integration and restructuring,and the abnormal tracking telemetry data is effectively eliminated,and the efficiency of data processing and quality can be improved.
Key words:telemetry data;cluster analysis;nearest-neighbor algorithm;data fusion
收稿日期:2015-07-08
作者簡(jiǎn)介:朱學(xué)鋒(1969- ),男,高級(jí)工程師,工程碩士,研究方向?yàn)樵囼?yàn)數(shù)據(jù)工程及遙測(cè)數(shù)據(jù)處理。E-mail:18042909136@163.com。
中圖分類(lèi)號(hào):V557
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1004-499X(2016)02-0093-04