亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        利用聚類算法實現(xiàn)多波束水深數(shù)據(jù)異常值的自動識別與清理

        2022-11-29 13:06:08金紹華李樹軍
        測繪學報 2022年11期

        魏 源,金紹華,李樹軍,王 磊,3,邊 剛,王 沫

        1. 海軍大連艦艇學院軍事海洋與測繪系,遼寧 大連 116018; 2. 91937部隊,浙江 舟山 316002; 3. 92763部隊,遼寧 大連 116018

        隨著世界各國對海洋探索的不斷深入,人們對高精度海底地形的需求不斷增加,當前水下地形獲取的精細度及實時性仍須進一步提升。多波束測深系統(tǒng)作為當前海底地形測量最高效精準的裝備之一,被廣泛應(yīng)用于世界各地的海底地形測量工作中。近年來,多波束測深原始數(shù)據(jù)量呈現(xiàn)爆發(fā)性增長[1-2],然而,長期以來高可信度的多波束測深異常值的清理工作多依賴于人工交互處理,存在處理周期較長的問題,極大地限制了數(shù)據(jù)處理的效率;現(xiàn)有自動處理算法雖然可以實現(xiàn)快速高效處理,但可信度達不到人工交互處理的水平,難以將其應(yīng)用于面向海圖制圖的多波束測深數(shù)據(jù)處理[3-5]。因此,如何提高異常值自動清理算法處理結(jié)果的可信度是當前多波束測深數(shù)據(jù)處理領(lǐng)域亟待解決的一大難題。

        經(jīng)過多年研究,國內(nèi)外已經(jīng)產(chǎn)生大量成熟的異常值自動清理算法,其清理機制可以總結(jié)為以下3種方式:設(shè)置簡單的門限閾值(如:深度、波束角、測深點之間的角度及梯度)[6-9]、基于統(tǒng)計學結(jié)果按條件篩選(如:中值、均值、水深值分布概率、不確定度)[10-15]及建立局部地形模型[16-18]。

        以上傳統(tǒng)算法,雖然都可以達到較好的清理效果,但大多受限于地形因素,且多數(shù)算法僅適用于清理離群粗差值這一種類型的異常值,尤其在地形復(fù)雜、數(shù)據(jù)質(zhì)量較差的前提下,往往難以識別全部待清理的異常值。

        隨著機器學習算法的不斷成熟,由于其在目標識別上所展現(xiàn)的獨特優(yōu)勢,越來越多學者將其應(yīng)用于多波束測深異常值的清理工作。文獻[19]引入侵蝕和膨脹聚類算法,實現(xiàn)了深水區(qū)域多波束測深異常值的自動清理,該方法為多波束測深異常值提取提供了一種新穎的解決方法,但該算法僅僅基于整條測線的投影平面圖進行聚類計算,沒有考慮聚類窗口大小的變化,異常值容易被地形數(shù)據(jù)所掩蓋。文獻[20]將K-means聚類算法引入單脈沖測深數(shù)據(jù)的異常值檢測,根據(jù)地形變化趨勢將整ping劃分為多個聚類窗口,以中央波束一定角度內(nèi)的水深點為初始聚類樣本,從中央波束向邊緣不斷聚類提取出代表真實地形的聚類簇,間接實現(xiàn)異常值的自動剔除,該方法較好地解決了識別精度問題,但由于K-means算法對噪點比較敏感,當存在大面積連續(xù)密集的深度異常及較大距離的數(shù)據(jù)缺失時,算法可能失效。以上兩種基于聚類算法的清理方法能夠相對準確地自動識別異常值,但均未實現(xiàn)離散異常值和集群化異常值的自動分類。離散異常值通??梢宰詣幼R別為無效數(shù)據(jù),而集群化異常值中可能同時包含集群化粗差值與異常特征值,集群化粗差值應(yīng)識別為無效數(shù)據(jù),異常特征值應(yīng)識別為可信數(shù)據(jù)。如果不將集群化異常值中的異常特征值單獨標記出來,容易產(chǎn)生誤判,導(dǎo)致處理結(jié)果存在低可信度風險的問題。當前,在集群化異常值中區(qū)分異常特征值和集群化粗差值多依賴于經(jīng)驗豐富的作業(yè)員,尚無很好的非人工解決方案。為此,本文基于密度聚類算法(density-based spatial clustering of applications with noise,DBSCAN),提出一種部分人工介入的異常值自動清理算法,即利用DBCSAN算法識別異常值,并將其分為無效和存疑兩類,由此水深數(shù)據(jù)可分為可信、無效和存疑3類,保留可信數(shù)據(jù)、剔除無效數(shù)據(jù),并將存疑數(shù)據(jù)提交人工判定有效性。該方法有效提高了異常值自動清理算法的可信度,同時避免了人工查詢存疑數(shù)據(jù)耗費大量時間的問題,一定程度上提高了效率,較好地解決了自動清理算法效率高、可信度低而人工交互處理可信度高、效率低這一矛盾。

        1 異常值的識別與分類

        1.1 異常值的識別

        多波束測深過程中常伴隨3種誤差,即系統(tǒng)誤差、隨機誤差及粗差,在為保障航行安全以及海圖制圖而進行的海道測量作業(yè)中,系統(tǒng)誤差主要是指因儀器安裝不準、聲速校對錯誤等原因而產(chǎn)生的整體性誤差,通過實際測量前良好的儀器校準及后處理中恰當?shù)乃罡恼梢杂枰韵魅?;隨機誤差是指測量過程中因為儀器精度限制和環(huán)境因素影響等原因而產(chǎn)生的隨機性誤差,其誤差值一般較小,包含在規(guī)范規(guī)定的測量精度范圍內(nèi)的隨機誤差可以保留;在排除以上兩種誤差影響的前提下,偏離于主要水深點集群的誤差值可看作粗差,精準識別并剔除粗差值是人工處理以及各種自動清理算法的主要目標[15]。為減少系統(tǒng)誤差對試驗結(jié)果的干擾,本文在研究過程中所采用的數(shù)據(jù)都已經(jīng)過各項改正,系統(tǒng)誤差的影響已降至最小。

        當前人工交互處理大多基于后視圖剔除異常水深值,后視圖即將每一ping采集水深點投影到與航行方向垂直的平面上,通過多ping疊加形成。在人工交互處理過程中,操作人員主要依靠視覺密度大小識別異常值,視圖中組成連續(xù)高密度區(qū)域的點集群據(jù)通常代表真實地形可識別為可信數(shù)據(jù);孤立于連續(xù)高密度區(qū)域的其他數(shù)據(jù)點一般可識別為異常值。

        1.2 異常值的分類

        有學者認為異常值只有一類,即所有處于統(tǒng)計學分布邊緣的水深值[21],基于設(shè)置簡單的門限閾值和基于統(tǒng)計學結(jié)果按條件篩選這兩種方式所提出的多種算法都是基于以上的分類原則。然而,異常值占比通常浮動較大,在數(shù)據(jù)質(zhì)量較好、地形平坦的區(qū)域,異常值占比可以低于1%[22];但在數(shù)據(jù)質(zhì)量較差、地形復(fù)雜的區(qū)域,異常值占比最高可達25%[23]。面對如此復(fù)雜的占比率,此種分類方法很難準確地識別出所有異常值,同時難以進一步對異常值的可信度進行判定,故而難以克服可信度較低的問題。

        由于真實存在的地形大多能夠返回密集且連續(xù)的回波信號,因而可信數(shù)據(jù)應(yīng)表現(xiàn)為連續(xù)的高密度點集群,異常值通常表現(xiàn)為離散點或者密度與規(guī)模相對較小的點集群,根據(jù)密度與幾何特征可將異常值分為離散異常值點、結(jié)構(gòu)化異常值集群和非結(jié)構(gòu)化異常值集群3類。這一分類理論基于異常值在后視圖中的圖像特征,能夠有效地識別定位異常值,但該分類方法未考慮異常值有效性問題,默認所有識別的異常值都是無效粗差值,應(yīng)用于自動清理算法時存在一定弊端。結(jié)構(gòu)化異常值集群和非結(jié)構(gòu)化異常值集群中都有可能包含異常特征值,在自動清理過程容易產(chǎn)生誤判。為此,本文認為應(yīng)當從數(shù)據(jù)有效性角度對異常值進行重新分類,將異常值分為集群化異常值和離散異常值。結(jié)構(gòu)化異常值集群、非結(jié)構(gòu)化異常值集群以及上述分類方法未顧及的異常特征值集群,由于以上3種異常值的有效性難以自動判定,故本文將其共同歸類為集群化異常值;由于離散異常值的有效性通常能夠自動識別,故保留該異常值分類。 綜上所述,本文認為異常值應(yīng)當分為離散異常值(圖1(b)、(d))、集群化異常值(圖1(a)、(c))兩類,集群化異常值又包含集群化粗差值(圖1(c))和異常特征值(圖1(a)),異常值分類如圖2所示。

        圖1 異常值圖像特征示意Fig.1 Examples of outlier 's geometries

        2 密度聚類算法的基本原理

        密度聚類算法(DBSCAN)是將n個d維數(shù)據(jù)樣本聚集成k個類,使同一類中樣本的相似性最大,而不同類中樣本的相似性最小[24]。算法通過鄰域半徑(Eps)和鄰域內(nèi)點數(shù)閾值(MinPts)兩個參數(shù)直接刻畫出核心點的概念,當某點鄰域半徑內(nèi)點的個數(shù)大于最少點數(shù)閾值時,該點即可視為核心點,并基于核心點及其領(lǐng)域內(nèi)的點定義出直接密度可達、密度可達和密度相連3個概念[25],DBSCAN中點的密度關(guān)系如圖3所示。

        (1) 核心點:如果存在點P,以P為圓心、Eps為半徑構(gòu)成鄰域NEps(P),若該鄰域中至少包含MinPts個樣點,則點P是一個核心點。

        (2) 直接密度可達:如果Q在P的鄰域中,并且P是核心對象,稱Q由P直接密度可達。

        圖2 異常值分類示意Fig.2 Classification diagram of outliers

        圖3 DBSCAN中點的密度關(guān)系Fig.3 Density relationship of points in DBSCAN

        (3) 密度可達:對于P和Q,如果存在一個序列P1,P2,…,Pn,其中P1=P,Pn=Q并且Pn+1由Pn直接密度可達,稱Q由P密度可達。

        (4) 密度相連:對于P和Q,如果存在S使P和Q均由S密度可達,則稱P和Q密度相連,密度相連具有對稱性。

        聚類過程包含核心點搜索、初始核心點選取及聚類簇擴散3個主要步驟。首先, 在待聚類數(shù)據(jù)集中搜索所有滿足條件的核心點;然后,從任意一個核心點集群(核心點及其鄰域半徑內(nèi)的點)開始,利用密度相連關(guān)系不斷向未分類的點擴展直至無法繼續(xù),由此得到一個所有點都彼此密度相連的點集群,此點集群即可稱為一個聚類簇,聚類簇內(nèi)所有數(shù)據(jù)點標記為同一類;最后,繼續(xù)查詢是否還有未訪問的核心點,開始新一輪聚類簇擴展,并繼續(xù)形成新的聚類簇,直至所有核心點都被訪問為止,剩余未被任何聚類簇吸納的點將被標記為噪聲。該算法能夠有效識別彼此孤立的多個密集點集群,并將不能組成集群的離散點標記為噪聲[26]。

        海底地形通常是連續(xù)的,在多波束測深得到的水深數(shù)據(jù)中,真實地形數(shù)據(jù)通常反映為連續(xù)高密度點集群,異常值表現(xiàn)為孤立于連續(xù)高密度點集群的離散點或者點集群。因此,通過控制合理的聚類參數(shù),DBSCAN算法能夠有效區(qū)分真實地形數(shù)據(jù)與異常值;同時該算法可以更進一步有效地區(qū)分離散異常值與集群化異常值,進而能夠有效地自動區(qū)分異常值中的存疑數(shù)據(jù)和無效數(shù)據(jù),便于將存疑數(shù)據(jù)獨立出來提交人工判定有效性,增強本文算法的可信度。

        3 部分人工介入的異常值自動清理算法主要步驟

        本文算法如圖4所示:通過聚類算法將原始數(shù)據(jù)分為可信數(shù)據(jù)、無效數(shù)據(jù)和存疑數(shù)據(jù)3類,保留可信數(shù)據(jù),剔除無效數(shù)據(jù),并將存疑數(shù)據(jù)提交人工判定其有效性,最終將其歸類為可信數(shù)據(jù)或者存疑數(shù)據(jù)。

        圖4 本文算法主要流程Fig.4 Flowchart of the main steps of the proposed algorithm

        3.1 基于密度聚類算法的水深數(shù)據(jù)分類

        密度聚類算法能夠?qū)⑺顢?shù)據(jù)準確劃分為可信、存疑和無效3類,該部分由4個主要步驟組成:數(shù)據(jù)轉(zhuǎn)換、聚類區(qū)塊劃分、聚類參數(shù)自適應(yīng)及聚類實施。

        3.1.1 數(shù)據(jù)轉(zhuǎn)換

        沿測量船航行方向?qū)y點數(shù)據(jù)投影到垂直于航行方向的平面上,得到水深點后視圖,即將三維點云數(shù)據(jù)(圖5)轉(zhuǎn)化為以側(cè)向中心距為橫坐標、以水深值為縱坐標的二維數(shù)據(jù)(圖6)。應(yīng)用式(1)將絕對坐標數(shù)據(jù)歸算為以每ping中央波束為基準的側(cè)向中心距離,生成聚類數(shù)據(jù)集,該數(shù)據(jù)集有2個維度數(shù)據(jù),依次是側(cè)向中心距離、水深值

        (1)

        式中,Center_disti為多波束某一條帶中第i個波束到中央波束的側(cè)向中心距;xi、yi為第i個波束測點的絕對坐標;xk、yk為中央波束測點的絕對坐標;swath_per_ping為每ping包含的波束數(shù)。

        圖5 三維點云數(shù)據(jù)Fig.5 Point cloud data of 3D

        圖6 水深數(shù)據(jù)后視圖Fig.6 Rear view of bathymetric data

        3.1.2 聚類區(qū)塊劃分

        聚類區(qū)塊即進行一次聚類所包含的測點數(shù)量,其大小是ping數(shù)規(guī)模值與窗口大小值的乘積。在多波束水深測量中,水深越深、波束越遠離中央時,相鄰兩個波束之間的距離越大,相同半徑的區(qū)域內(nèi)所包含的水深點數(shù)越少,即水深點密度越小。為避免地形起伏及波束距離中央的遠近對聚類準確性的影響,應(yīng)當將整個測區(qū)劃分為數(shù)個聚類區(qū)塊,在每一個聚類區(qū)塊中單獨進行聚類。聚類區(qū)塊的選擇應(yīng)根據(jù)地形特征,參考人工交互處理能夠分辨出異常值的最小規(guī)模,地形復(fù)雜、數(shù)據(jù)較差的測區(qū)應(yīng)當選取較小聚類區(qū)塊,地形平坦、數(shù)據(jù)質(zhì)量好的測區(qū)應(yīng)當選擇較大區(qū)塊,合適的聚類區(qū)塊大小主要通過以下兩個參數(shù)來調(diào)節(jié)。

        (1) ping數(shù)規(guī)模(ping_scale)。該參數(shù)表示當前聚類區(qū)塊吸收的ping數(shù),可控制聚類區(qū)塊沿測量船航行方向的檢測精度,前后相連的數(shù)個ping所測得的地形之間存在一定的關(guān)聯(lián)性,但這種關(guān)聯(lián)性隨著地形變化而變化。當?shù)匦纹鸱酱?,地貌越?fù)雜時,多波束測深ping與ping之間的關(guān)聯(lián)性越弱;當?shù)匦卧狡教?,地貌越簡單時,多波束測深ping與ping之間的關(guān)聯(lián)性越強;當ping數(shù)超過一定值時,ping與ping之間的關(guān)聯(lián)性將消失,部分異常值也將被淹沒在真實地形所對應(yīng)的連續(xù)高密度集群中。因而不能使用同一ping數(shù)規(guī)模值劃分整個測區(qū)的聚類區(qū)塊,根據(jù)人工交互處理經(jīng)驗,對于地形平坦數(shù)據(jù)質(zhì)量好的區(qū)域,使用30 ping以上的規(guī)模依然可以正常識別異常值,但不建議超過100 ping;對于地形復(fù)雜數(shù)據(jù)質(zhì)量較差的區(qū)域,一般不超過30 ping,通常在20 ping以內(nèi)可以正常識別異常值,對于極其復(fù)雜的地形通常需要在10 ping以內(nèi)識別。

        在多波束測深系統(tǒng)中,中央波束所獲取的水深值可信度最高,中央波束所測得水深能夠較好地代表該ping所測區(qū)域水深,而相鄰多ping中央波束水深值的最大差值dlt_depth_max則能夠反映該區(qū)域地形起伏劇烈程度。本文算法以相鄰多ping中央波束水深值最大差值來約束ping數(shù)規(guī)模的大小。當設(shè)定一定閾值后,地形越平坦,區(qū)域參與聚類的ping數(shù)規(guī)模就越大;地形越起伏,區(qū)域參與聚類的ping數(shù)規(guī)模就越小,ping數(shù)規(guī)規(guī)模因而能夠隨著地形起伏劇烈程度而改變。本文選取水深測量深度精度(accuracy)v作為該閾值,當n個ping的中央波束水深最大差值剛好小于accuracyv時,則n即為此次聚類ping數(shù)規(guī)模的取值。

        (2) 窗口大小(window_num)。該參數(shù)表示當前聚類區(qū)塊吸收每ping的波束數(shù),可控制聚類區(qū)塊垂直于測量船航行方向的檢測精度,通常取25~50,默認取值25。

        針對某一測區(qū)的聚類實施過程,如圖7所示,先通過參數(shù)ping_scale從測區(qū)數(shù)據(jù)中獲取一個ping切塊,然后通過參數(shù)window_num從當前ping切塊最左邊開始窗口滑動獲取聚類區(qū)塊,直至該ping切塊所有水深點聚類完畢,進入下一ping切塊重復(fù)窗口滑動直至所有ping結(jié)束。為避免窗口邊緣數(shù)據(jù)被誤判,加強相鄰兩聚類區(qū)塊數(shù)據(jù)分類的彼此驗證,滑塊每次滑動時預(yù)留窗口大小的20%與上一聚類區(qū)塊重疊。

        圖7 聚類區(qū)塊劃分Fig.7 Diagram of clustering block division

        3.1.3 各區(qū)塊聚類參數(shù)自適應(yīng)

        明確聚類區(qū)塊后即可設(shè)置該區(qū)塊內(nèi)聚類參數(shù),主要參數(shù)包括鄰域半徑(Eps)和鄰域內(nèi)最少點數(shù)(MinPts),針對每個聚類區(qū)塊的密度特征自動選取合適的聚類參數(shù)是有效識別異常值的關(guān)鍵。

        (1) 鄰域半徑自適應(yīng)。鄰域半徑主要控制核心點的核查范圍,在后視圖中,y軸為水深值,x軸為側(cè)向中心距,故任意兩個水深點之間的歐氏距離由水深值差值和側(cè)向中心距差值決定,以上兩個差值在異常值檢測過程中可以進一步理解為定位檢測精度和深度檢測精度,可根據(jù)《海道測量規(guī)范》[26]所規(guī)定的測量精度標準設(shè)置(表1)。然而表中深度精度隨水深值變化而變化,為使得鄰域半徑的取值盡量準確,決定深度精度的水深值應(yīng)當能夠反映當前聚類區(qū)塊中絕大部分水深數(shù)據(jù)點的分布深度,為此本文利用中值排序方法確定聚類區(qū)塊內(nèi)代表性水深值,并據(jù)此得到深度精度值,隨后應(yīng)用式(2)可得當前區(qū)塊的第1個聚類參數(shù)領(lǐng)域半徑的取值

        (2)

        式中,Eps為鄰域半徑;accuracyh為定位精度;accuracyv為深度精度。

        表1 各等級測量精度

        (2) 鄰域最少點數(shù)自適應(yīng)。在鄰域半徑確定的前提下,鄰域最少點數(shù)直接決定了該鄰域內(nèi)點的密度大小。為使算法設(shè)定聚類密度大小盡量符合聚類區(qū)塊內(nèi)高密度點集群的密度大小,應(yīng)當選取當前聚類區(qū)塊內(nèi)具有代表性的相鄰點間距,代表性的相鄰點間距依舊通過中值排序方法獲取,并根據(jù)式(3)獲取當前聚類參數(shù)最少點數(shù)的取值

        MinPts=Eps/distance

        (3)

        式中,MinPts為參數(shù)最少點數(shù);Eps為鄰域半徑;distance為具有代表性的相鄰點間距。

        3.1.4 聚類實施

        在聚類實施前先將所有水深點標記為“-1”,表示該點未被任何聚類簇吸收;聚類完畢后,包含點數(shù)最多的聚類簇內(nèi)水深點的標記被更新為“0”,該聚類簇表示可信數(shù)據(jù);不能組成聚類簇的水深點被標記為“-1”,表示無效數(shù)據(jù)。大多數(shù)情況下,水深點都將被分為可信數(shù)據(jù)和無效數(shù)據(jù);少數(shù)情況下,除核心聚類簇以外,還存在其他規(guī)模較小的聚類簇,這些聚類簇被標記為存疑數(shù)據(jù),聚類簇內(nèi)水深點的標記將被更新為“1”。

        3.2 人工介入的存疑數(shù)據(jù)有效性判定

        現(xiàn)有的各種自動清理算法雖然能夠識別出異常值,但卻無法進一步準確區(qū)分其中的存疑數(shù)據(jù),故而清理所得結(jié)果中總是包含被誤刪的異常特征值及誤保留的粗差值,這正是導(dǎo)致當前多種自動處理算法可信度較低的關(guān)鍵問題所在。例如,孤立于主要水深點集群的一個規(guī)模較小的水深點集群,其產(chǎn)生原因可能是水中懸浮物,也有可能是棱角分明的突起物如石塊等,前者代表粗差值應(yīng)標記為無效數(shù)據(jù),后者表示異常特征值應(yīng)標記為可信數(shù)據(jù)。針對此類數(shù)據(jù)目前尚無較好的非人工解決方案,大大限制了現(xiàn)有各種自動清理算法的可信度。存疑數(shù)據(jù)雖然占比非常少但卻至關(guān)重要,因為這類數(shù)據(jù)往往代表地形變化劇烈的特征區(qū)域或者非自然地形起伏的目標物,一旦發(fā)生誤判對整體測量效果影響較大;另外,雖然需要人工介入判別的存疑數(shù)據(jù)并不多,但通過人工逐ping篩查存疑數(shù)據(jù)則需要耗費大量時間,因而通過一定算法自動定位存疑數(shù)據(jù),并將其交由人工進行有效性判定是提高處理結(jié)果可信度與效率的一種可行方案。

        存疑數(shù)據(jù)有效性判定主要考慮以下兩方面因素。

        (1) 存疑數(shù)據(jù)形成原因。多波束水深測量存疑數(shù)據(jù)形成的影響因素有很多,主要分為自身影響因素和環(huán)境影響因素,自身影響因素主要包括回波信號丟失或發(fā)生錯誤、換能器旁瓣波束影響、儀器損壞等,環(huán)境影響因素主要包括環(huán)境中同頻工作儀器干擾、水體渾濁或存在大面積懸浮物、海底地勢較陡峭復(fù)雜(亂石區(qū)域)、人為放置的棱角分明的障礙物等。

        存疑數(shù)據(jù)應(yīng)當首先考慮其產(chǎn)生原因來判定其有效性。明確是由儀器自身原因產(chǎn)生或者外部影響因素干擾原因產(chǎn)生的存疑數(shù)據(jù)可標記為無效數(shù)據(jù),這類原因產(chǎn)生的異常值集群不代表真實海底,應(yīng)當予以剔除;由于海底地勢陡峭復(fù)雜或人為放置障礙物等原因造成的存疑數(shù)據(jù),應(yīng)當進一步結(jié)合異常值集群的分布特征來判定其有效性。

        (2) 存疑數(shù)據(jù)分布特征。由于真實存在的異常深度而形成的存疑數(shù)據(jù),通常都應(yīng)當呈現(xiàn)出明顯的幾何形狀,即異常值集群有明顯的幾何特征,如明顯的山峰、階梯或其他規(guī)則的幾何圖形狀,這類存疑數(shù)據(jù)應(yīng)當標記為有效異常值并予以保留,對于沒有明顯幾何特征的存疑數(shù)據(jù),在不影響航行安全的前提下應(yīng)當標記為無效異常值并予以剔除。

        4 試驗與分析

        4.1 試驗數(shù)據(jù)

        試驗數(shù)據(jù)源自國產(chǎn)多波束測深系統(tǒng)儀器性能比對項目,數(shù)據(jù)采集設(shè)備為Reason SeaBat T50-P,數(shù)據(jù)在采集過程中已經(jīng)進行了安裝偏差改正,并在后期進行了聲速、潮汐及定位精度改正,試驗數(shù)據(jù)已排除系統(tǒng)誤差影響。選取的試驗數(shù)據(jù)位于大連大窯灣海域,平均水深38 m,地形平緩,水質(zhì)清澈,數(shù)據(jù)質(zhì)量較好,為檢測各個國產(chǎn)廠家設(shè)備對最小目標物的探測能力,試驗人員在測區(qū)內(nèi)人工布放一個邊長為2 m的立方物。

        4.2 試驗結(jié)果分析

        布放在測區(qū)中的立方物因為邊緣棱角分明,與周圍水深差值較大,現(xiàn)有自動清理算法往往容易將其視為粗差數(shù)據(jù)直接剔除,為驗證本算法對自動處理算法可信度的增強,本文采取CUBE算法處理結(jié)果作為對照,方案1使用CUBE算法進行自動清理,方案2使用本文算法進行清理。

        方案1:采用Caris中傳統(tǒng)的CUBE算法自動清理異常值,基于Caris軟件內(nèi)自帶的CUBE算法選取Shallow模式參數(shù)建立CUBE曲面,并以濾波參數(shù)2.5進行異常值剔除[27]。處理所得結(jié)果如圖8所示。圖8(a)中灰色點代表被CUBE算法濾除的水深數(shù)據(jù)點,紅圈中的灰色點表示為立方物,可以看出這些水深數(shù)據(jù)被CUBE算法全部當作無效值予以剔除。圖8(b)為處理后所得地形的三維顯示效果,可以看出被CUBE算法濾除的數(shù)據(jù)形成了一個漏洞。

        圖8 CUBE算法處理結(jié)果Fig.8 The results of CUBE algorithm

        方案2:采用本文算法,處理結(jié)果如圖9所示,圖9(a)中綠色聚類簇表示可信數(shù)據(jù),紫色散點表示無效數(shù)據(jù),紅圈內(nèi)黃色數(shù)據(jù)點集群表示立方物所產(chǎn)生的水深點集群,表現(xiàn)為孤立于視圖內(nèi)連續(xù)高密度區(qū)域的點集群,故該聚類簇被準確地標記為存疑數(shù)據(jù),有效地區(qū)別于被標記為紫色離散數(shù)據(jù)點所代表的無效數(shù)據(jù),存疑數(shù)據(jù)經(jīng)識別定位后交由人工介入判定有效性,有效避免了存疑數(shù)據(jù)被誤刪影響測量結(jié)果可信度的問題,圖9(b)為本文算法處理后所得的地形三維顯示,立方物完整地保留下來。

        圖9 本文算法處理結(jié)果Fig.9 The results of the algorithm in this paper

        試驗結(jié)果表明,本文算法對數(shù)據(jù)的分類效果較好,能夠準確地集群化異常值與離散異常值的區(qū)分,有效避免存疑數(shù)據(jù)被錯誤地剔除或保留。

        5 結(jié) 論

        本文將“存疑數(shù)據(jù)”概念引入多波束測深異常值的自動清理,為異常值的自動清理提供了一種思路,建立了結(jié)合密度聚類算法及部分人工介入的多波束測深異常值清理方法。試驗表明,該種自動處理算法有效地將原始水深數(shù)據(jù)分為可信數(shù)據(jù)、存疑數(shù)據(jù)和無效數(shù)據(jù)3類,保留可信數(shù)據(jù)、剔除無效數(shù)據(jù),并由人工介入判定存疑數(shù)據(jù)的有效性,一定程度上提高異常值自動清理算法的可信度,具有實際應(yīng)用價值。但該算法仍舊存在以下不足之處。

        (1) 受限于二維視角,該算法仍無法避免部分異常值被遮蓋的弊端,這將在一定程度上限制清理結(jié)果可信度的提高,下一步將考慮三維聚類算法,以期改善該不足之處。

        (2) 由于樣本數(shù)據(jù)標定的困難以及異常值的復(fù)雜性,目前尚無法實現(xiàn)存疑數(shù)據(jù)有效性的自動判定,下一步將引入優(yōu)化算法實現(xiàn)存疑數(shù)據(jù)判定的自動化,進一步推進高可信度異常值清理的全自動化。

        亚洲福利网站在线一区不卡| 久久精品夜夜夜夜夜久久| 99国产精品久久久蜜芽| av资源在线永久免费观看| 国产情侣自拍在线视频| 国产熟妇另类久久久久| 国内揄拍国内精品| 超高清丝袜美腿视频在线| 亚洲av毛片在线免费看| 夫妇交换性三中文字幕| 久久精品国产日本波多麻结衣| 午夜一区二区三区在线视频| 在线观看视频免费播放| 美丽人妻在夫前被黑人| 日韩在线无| 亚洲一区二区女优av| 久草视频在线手机免费看| 北条麻妃国产九九九精品视频 | 国产又大又硬又粗| 久久久久亚洲av无码a片软件| 国产码欧美日韩高清综合一区| 成人免费av高清在线| 亚欧中文字幕久久精品无码| 亚洲男人的天堂网站| 久久精品av一区二区免费| 亚洲天堂成人av在线观看| 55夜色66夜色国产精品视频| 韩国精品一区二区三区 | 久久精品国产亚洲av电影网| 国产精品第1页在线观看| 丰满少妇又爽又紧又丰满动态视频 | 怡红院免费的全部视频| av少妇偷窃癖在线观看| 亚洲一区二区三区精品久久av| 国产欧美va欧美va香蕉在 | 无人区一码二码三码四码区| 日本欧美国产精品| 日韩男女av中文字幕| 色婷婷五月综合激情中文字幕| 粗一硬一长一进一爽一a级| 日韩少妇人妻一区二区|