亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        點(diǎn)云場景語義標(biāo)注的排序批處理模式主動學(xué)習(xí)法

        2023-03-15 01:47:10鄒祿杰花向紅趙不釩陶武勇李琪琪
        測繪學(xué)報 2023年2期
        關(guān)鍵詞:特征選擇語義次數(shù)

        鄒祿杰,花向紅,趙不釩,陶武勇,4,李琪琪

        1.武漢大學(xué)測繪學(xué)院,湖北 武漢 430079;2.武漢大學(xué)災(zāi)害監(jiān)測與防治研究中心,湖北 武漢 430079;3.廣州市城市規(guī)劃勘測設(shè)計(jì)研究院,廣東 廣州 510060;4.南昌大學(xué)信息工程學(xué)院,江西 南昌 330031

        點(diǎn)云場景語義標(biāo)注為場景中每個數(shù)據(jù)基元賦予一個語義標(biāo)簽,是城市規(guī)劃、自動駕駛、導(dǎo)航定位和數(shù)字城市等應(yīng)用的基礎(chǔ)[1-4],也是各種監(jiān)督學(xué)習(xí)方法[5-7]真實(shí)數(shù)據(jù)的來源。手動標(biāo)注建筑物、樹木、車輛等點(diǎn)云場景對象是一項(xiàng)費(fèi)時費(fèi)力的工作,為此已經(jīng)有很多學(xué)者致力于研究如何減少點(diǎn)云場景手動標(biāo)注的人工成本。傳統(tǒng)的策略是利用條件隨機(jī)場、馬爾科夫隨機(jī)場等概率圖模型[8-9]來進(jìn)行語義標(biāo)注,如低階馬爾科夫模型[10]、Potts模型[11]、Robust Potts[12]模型等。這些方法雖然很好地利用了目標(biāo)鄰域間的上下文信息,能較好地?cái)M合真實(shí)的三維場景,但普遍存在著分類準(zhǔn)確率不夠高、需要特定先驗(yàn)信息等缺點(diǎn),不具有通用性。另外一種策略是通過直接引入其他數(shù)據(jù)源的標(biāo)簽來減少手動標(biāo)注的工作量,如直接從標(biāo)注好的二維圖片數(shù)據(jù)中提取對應(yīng)三維點(diǎn)云場景的標(biāo)簽[13]、利用運(yùn)動結(jié)構(gòu)恢復(fù)(structure from motion,SFM)算法和視頻圖片數(shù)據(jù)重建三維場景進(jìn)行聯(lián)合標(biāo)注[14]等。這類策略雖然利用了二維圖片和物體的三維信息,但需要事先手工標(biāo)注大量的圖片數(shù)據(jù),且利用SFM算法重建的三維場景并不能準(zhǔn)確地描述物體的三維信息。除了上述兩種策略,還有一類策略是識別并標(biāo)注部分對改善模型作用最大的樣本,利用少量高價值樣本快速提高模型性能。每個樣本的價值并不相同,高價值的樣本對模型性能的改善起較大的作用,部分低價值樣本不僅不能提高模型性能,甚至?xí)δP彤a(chǎn)生干擾[15]。因此,需要一種能夠識別并選擇高價值樣本的學(xué)習(xí)策略對模型進(jìn)行優(yōu)化,進(jìn)而減少手工標(biāo)注量。主動學(xué)習(xí)就是為解決這一問題而提出的一種有效的學(xué)習(xí)策略。

        主動學(xué)習(xí)的目的是通過創(chuàng)建最小訓(xùn)練子集來達(dá)到與全監(jiān)督方法相當(dāng)?shù)臉?biāo)注精度。它是通過迭代選擇最有價值的樣本進(jìn)行人工標(biāo)注,將其加入到訓(xùn)練集中,以較少的標(biāo)注樣本獲得更好的分類模型。主動學(xué)習(xí)在自然語言處理[16]、目標(biāo)檢測[17]、圖像分類[18]和圖像語義分割[19]等許多領(lǐng)域中都有應(yīng)用,然而將主動學(xué)習(xí)應(yīng)用于點(diǎn)云場景語義標(biāo)注[20-21]方面的研究較少。傳統(tǒng)的主動學(xué)習(xí)方法每次只采樣一個樣本進(jìn)行模型更新,是目前結(jié)合主動學(xué)習(xí)進(jìn)行點(diǎn)云場景語義標(biāo)注的主流方法,這種方法在樣本量較少時能獲得較好的結(jié)果,但在樣本量過大時需要進(jìn)行多次人工標(biāo)注才能獲得最小訓(xùn)練子集。為解決上述問題,文獻(xiàn)[22]將點(diǎn)云先過分割為超體素,然后通過采樣超體素的方式來減少采樣次數(shù),但是這種方法依舊十分耗時,且模型精度也有待提升。

        綜上考慮,本文提出了一種結(jié)合排序批處理模式的主動學(xué)習(xí)點(diǎn)云場景語義標(biāo)注方法。該方法在特征選擇階段通過改進(jìn)的遞歸特征增加法來篩選特征子集,在保持性能不下降的情況下,避免了維度災(zāi)難,加快了運(yùn)算速度;在主動學(xué)習(xí)模型訓(xùn)練階段通過改進(jìn)的排序批處理模式采樣算法來一次采樣多個樣本,大大減少了主動學(xué)習(xí)迭代次數(shù),并且能在較短時間內(nèi)完成采樣,減少算法本身耗時,同時這些樣本可以獨(dú)立并行地進(jìn)行人工標(biāo)注,這也變相減少了人工標(biāo)注的時間。

        1 點(diǎn)云場景語義標(biāo)注方法

        本文提出的結(jié)合排序批處理模式的主動學(xué)習(xí)點(diǎn)云場景語義標(biāo)注方法主要包括點(diǎn)云數(shù)據(jù)預(yù)處理、特征提取、特征選擇、主動學(xué)習(xí)模型訓(xùn)練和完整點(diǎn)云標(biāo)注5部分,算法流程如圖1所示。

        圖1 本文算法

        1.1 預(yù)處理

        首先,通過孤立森林去噪濾波算法[23]剔除采集原始點(diǎn)云數(shù)據(jù)中的噪聲;對于千萬級以上的大場景點(diǎn)云還應(yīng)進(jìn)行下采樣,以克服逐點(diǎn)標(biāo)注方法對數(shù)據(jù)量敏感的缺點(diǎn)。然后手動選取一小部分點(diǎn)云數(shù)據(jù)(數(shù)量占總體的5%以內(nèi),且包含所有需要語義標(biāo)注的地物類型)進(jìn)行人工標(biāo)注,作為主動學(xué)習(xí)模型的初始標(biāo)注集,剩余點(diǎn)云作為未標(biāo)注集。最后,為了能夠獲取更加具有辨識性的局部特征,采用最優(yōu)鄰域定義[24]來恢復(fù)每個點(diǎn)的局部鄰域。

        1.2 特征提取

        目前公開的點(diǎn)云數(shù)據(jù)集所包含的點(diǎn)云信息有多有少,且大多數(shù)公開數(shù)據(jù)集只包含空間三維坐標(biāo)信息,因此本文只提取與三維空間信息有關(guān)的特征,以增強(qiáng)本文所提方法的通用性。

        利用在點(diǎn)云的三維空間信息以及與其周圍點(diǎn)構(gòu)成的最優(yōu)鄰域,可以為每個點(diǎn)提取線性度Lλ、平面度Pλ、散射度Sλ、垂直度V和局部點(diǎn)密度D[24]等3D特征和2D特征值比率、2D特征熵、基于2D點(diǎn)及其k個鄰近點(diǎn)形成的圓形鄰域半徑rk-NN,2D、局部2D點(diǎn)密度及積累圖特征[25]等2D特征。除了上述單點(diǎn)特征外,本文引入FPFH[26-27]特征描述符來為點(diǎn)云提供更多局部特征的相關(guān)信息,F(xiàn)PFH特征一種基于點(diǎn)及其鄰域點(diǎn)之間法向夾角、點(diǎn)間連線夾角關(guān)系的特征描述子,它在保留PFH特征對點(diǎn)描述主要幾何特性的同時,降低了計(jì)算復(fù)雜度。

        1.3 特征選擇

        冗余特征和不相關(guān)的特征會增加機(jī)器學(xué)習(xí)的負(fù)擔(dān),使模型過擬合,因此進(jìn)行特征選擇很有必要。傳統(tǒng)特征選擇方法一般分為過濾法、包裝法和嵌入法[28]。遞歸特征增加法[29]集合了包裝法與機(jī)器學(xué)習(xí)模型交互和嵌入法推導(dǎo)特征重要性的優(yōu)點(diǎn),但是也存在著時間復(fù)雜度過高、結(jié)果不夠穩(wěn)定的缺陷。相關(guān)系數(shù)法能快速剔除相關(guān)性高的特征,但由于它只考慮特征而不考慮模型,并不能很好地保持模型精度;隨機(jī)森林重要性方法[30]能在模型訓(xùn)練的同時進(jìn)行特征選擇,但容易過擬合。綜合3種方法的優(yōu)缺點(diǎn),本文對遞歸特征增加法進(jìn)行了改進(jìn),在初始階段利用相關(guān)系數(shù)法對所有特征進(jìn)行初步篩選,進(jìn)而利用隨機(jī)森林重要性方法對篩選特征按照特征重要性進(jìn)行排序,最后運(yùn)用遞歸特征增加法篩選出具有最佳性能的特征子集。其中,使用隨機(jī)森林分類器作為遞歸特征增加法的基本分類器,采用F1score作為衡量特征重要性的指標(biāo)。改進(jìn)的遞歸特征增加法(modified recursive feature addition,MRFA)流程如下:

        (1)計(jì)算特征之間的相關(guān)系數(shù),若相關(guān)系數(shù)大于閾值,將后加入特征舍去,否則保留。

        (2)利用隨機(jī)森林重要性方法對篩選特征進(jìn)行排序。

        (3)構(gòu)建只包含最重要特征的隨機(jī)森林模型,并計(jì)算其F1score,記為f1。

        (4)在剩余特征中選取一個最重要的特征,并利用選取的特征和之前保留的特征構(gòu)建隨機(jī)森林模型,并計(jì)算其F1score,記為f2。

        (5)如果Δf=f2-f1大于所設(shè)閾值Tol,則將所選取特征保留,否則將其舍去。

        (6)重復(fù)步驟(2)—步驟(5)直到所有特征選擇完畢。

        1.4 主動學(xué)習(xí)模型訓(xùn)練

        主動學(xué)習(xí)模型訓(xùn)練是一個多次迭代的過程。在每次迭代中,由更新后的標(biāo)注集對主動學(xué)習(xí)分類模型進(jìn)行訓(xùn)練,利用分類模型對未標(biāo)注集進(jìn)行預(yù)測,根據(jù)預(yù)測結(jié)果和主動學(xué)習(xí)采樣算法來選取一批有價值的樣本交由人工標(biāo)注,將人工標(biāo)注好的樣本加入標(biāo)注集更新模型并開始下一次迭代,直到滿足迭代停止條件為止,其整個流程如圖2所示。

        圖2 主動學(xué)習(xí)模型訓(xùn)練流程

        排序批處理模式采樣算法[31](ranked batch-mode sampling,RBMS)是目前較為前沿的主動學(xué)習(xí)算法,但該算法也存在著時間復(fù)雜度高、精度提升慢、不適用于大規(guī)模點(diǎn)云數(shù)據(jù)處理的缺陷。為此,本文針對算法存在的問題,對算法3個步驟進(jìn)行改進(jìn),形成了改進(jìn)的排序批處理模式采樣算法(modified ranked batch-mode sampling,MRBMS):

        (1)分類間距估計(jì)。排序批處理模式采樣算法采用的是不確定度估計(jì),這種方法只關(guān)注樣本的最大概率類,而忽略其他類的潛在價值,為此本文引入分類間距估計(jì)[32],通過關(guān)注現(xiàn)有分類器最優(yōu)類和次優(yōu)類之間的間距來衡量樣本的價值,從而彌補(bǔ)原算法的不足。可由式(1)導(dǎo)出分類間距得分Ms(x)

        (1)

        (2)相似度估計(jì)。相似度一般通過計(jì)算未標(biāo)注樣本U到標(biāo)注樣本L的特征空間距離來度量二者之間的相似程度,原算法直接計(jì)算所有樣本之間的距離不但嚴(yán)重浪費(fèi)內(nèi)存、耗時嚴(yán)重,而且無法保證主動學(xué)習(xí)過程的連續(xù)性。為此本文首先采用快速最近鄰逼近搜索[31]來查找與未標(biāo)注樣本在特征空間上最鄰近的標(biāo)注樣本點(diǎn),通過建立優(yōu)先搜索K-means樹來對特征的所有維度進(jìn)行聚類,快速計(jì)算未標(biāo)注樣本U到標(biāo)注樣本L的特征空間距離,進(jìn)而計(jì)算相似度,其計(jì)算公式為

        (2)

        式中,x是未標(biāo)注樣本,y是離樣本x特征空間距離最近的標(biāo)注樣本點(diǎn),D(x,y)為x與y之間的特征空間距離,一般為歐氏距離。隨著D(x,y)的增大,相似性得分Ss(x)也會增大,表明未標(biāo)注樣本U與已標(biāo)注樣本L相似度越低。

        (3)排序選擇。排序批處理模式采樣算法采用排序函數(shù)Fs(x)來選擇有價值樣本,可由式(3)來表示

        Fs(x)=α×Ss(x)+(1.0-α)×Us(x)

        (3)

        原算法通過權(quán)重α來確定不確定度得分和相似度得分的權(quán)重,可是當(dāng)|U|遠(yuǎn)大于|L|且采樣數(shù)量較少時,α因子幾乎不變。為此本文引入新的權(quán)重因子β,權(quán)重β針對數(shù)據(jù)比例失衡問題做出了調(diào)整,隨著采樣次數(shù)的增加,相似度得分的權(quán)重越來越小,分類間距得分權(quán)重越來越大。新的排序函數(shù)Rs(x)可由式(4)來表示

        Rs(x)=β×Ss(x)+(1.0-β)×Ms(x)

        (4)

        1.5 完整點(diǎn)云標(biāo)注

        2 試驗(yàn)與分析

        2.1 試驗(yàn)設(shè)置與評價指標(biāo)

        為了驗(yàn)證本文方法的有效性,在3個不同的大規(guī)模室外場景點(diǎn)云上進(jìn)行了試驗(yàn)驗(yàn)證。前兩個場景Dataset Ⅰ、Dataset Ⅱ來自著名的Semantic 3D激光點(diǎn)云公開基準(zhǔn)數(shù)據(jù)集[35];第3個場景Dataset Ⅲ來自由FARO三維激光雷達(dá)掃描儀在武漢大學(xué)校園內(nèi)自采集的數(shù)據(jù)集,如圖3所示。這3個場景都存在數(shù)據(jù)集不均衡問題,例如Dataset Ⅰ、Dataset Ⅱ設(shè)施和車輛類的數(shù)量要遠(yuǎn)遠(yuǎn)小于其他類的數(shù)量,Dataset Ⅲ自行車、電動車、設(shè)施和行人4類之和不足所有類的1%。除了數(shù)據(jù)集不均衡問題外,還存在著同類變異、類間相似、相互遮擋、掃描不全等多種挑戰(zhàn)。

        圖3 試驗(yàn)數(shù)據(jù)集原始數(shù)據(jù)

        本文試驗(yàn)平臺為英特爾Core i5-10400F @2.90 GHZ處理器,16 GB內(nèi)存,Python3.7,在開源工具(CloudCompare)上標(biāo)注數(shù)據(jù)。在預(yù)處理階段,首先將3個場景的原始點(diǎn)云下采樣到100萬點(diǎn)左右,然后從采樣后的點(diǎn)云里每類分割出一小部分,進(jìn)行人工標(biāo)注制作成初始標(biāo)注集,如圖4所示。將剩余采樣后的點(diǎn)云制作成未標(biāo)注集。Dataset Ⅰ、Dataset Ⅱ和Dataset Ⅲ初始標(biāo)注集與未標(biāo)注集各類具體數(shù)量可見表1。在特征選擇階段,相關(guān)系數(shù)閾值設(shè)定為0.8,Tol=-0.01。在主動學(xué)習(xí)模型訓(xùn)練階段,隨機(jī)森林模型參數(shù)為默認(rèn)參數(shù),每批次采樣點(diǎn)數(shù)量BatchSize=1000,迭代停止條件設(shè)置為迭代次數(shù)N=30。

        圖4 Dataset Ⅰ—Dataset Ⅲ的初始標(biāo)注集

        本文主要從兩方面來對點(diǎn)云語義標(biāo)注工作進(jìn)行質(zhì)量評價:第一方面是通過精度(Precision)、召回率(Recall)、F1score 3個指標(biāo)來衡量本文所提方法的正確性和準(zhǔn)確性;第二方面本文用指標(biāo)SavedPoints來對語義標(biāo)注方法減少的人工標(biāo)注工作進(jìn)行量化,它代表的是從手動標(biāo)注初始標(biāo)注集開始到整個點(diǎn)云場景標(biāo)注工作完成這個過程中,機(jī)器學(xué)習(xí)算法相較于全程手工標(biāo)注減少的工作量,如式(5)所示

        (5)

        式中,AP為需要語義標(biāo)注的目標(biāo)總數(shù);L為初始人工標(biāo)注的樣本數(shù);N為主動學(xué)習(xí)采樣次數(shù);BS為一次采樣所需人工糾正的樣本個數(shù);RP為模型完成語義標(biāo)注后需要人工修正的樣本個數(shù);PN為N次查詢后模型的預(yù)測精度;UN為N次查詢后未標(biāo)注樣本個數(shù)。SavedPoints在(0,1)之間取值,值越大說明節(jié)省人工標(biāo)注工作量越大,方法效果越好。

        2.2 試驗(yàn)結(jié)果與分析

        為驗(yàn)證本文方法的可行性,本節(jié)首先給出了本文方法在Dataset Ⅰ—Dataset Ⅲ場景下的語義標(biāo)注結(jié)果,對本文方法在Dataset Ⅲ場景少數(shù)類識別結(jié)果差的原因進(jìn)行了探討,然后分析了下采樣和特征選擇方法對語義標(biāo)注結(jié)果的影響,最終分析了主動學(xué)習(xí)模型訓(xùn)練部分中每批次采樣點(diǎn)數(shù)量BatchSize對試驗(yàn)結(jié)果的影響。

        2.2.1 試驗(yàn)結(jié)果初步分析

        圖5、圖6和圖7分別給出了Dataset Ⅰ—Dataset Ⅲ場景下采樣點(diǎn)云與完整點(diǎn)云的標(biāo)注結(jié)果。圖7中,不同顏色表示不同類別,從上到下依次為前視圖、俯視圖、側(cè)視圖及內(nèi)部圖。由圖5、圖6和圖7可以看出,Dataset Ⅰ和Dataset Ⅱ下采樣點(diǎn)云基本上都能正確標(biāo)注,Dataset Ⅲ的下采樣點(diǎn)云標(biāo)注結(jié)果稍差但也能將大部分類正確標(biāo)注,需要人工修正的部分較少。由鄰域等權(quán)標(biāo)簽傳播算法標(biāo)注的Dataset Ⅰ—Dataset Ⅲ完整點(diǎn)云標(biāo)注結(jié)果較好,能夠滿足語義標(biāo)注工作的需求。這也證明了本文方法在大幅減少人工標(biāo)注成本方面的可行性。

        利用河北CORS網(wǎng)絡(luò)RTK得到所有控制點(diǎn)的高程,統(tǒng)計(jì)出和四等水準(zhǔn)測量的較差,計(jì)算出每個控制點(diǎn)四次觀測的平均值,以四等水準(zhǔn)高程為真值,計(jì)算出所有控制點(diǎn)高程中誤差為±28.78 mm,精度亦滿足《衛(wèi)星定位城市測量技術(shù)規(guī)范》關(guān)于四等GPS高程測量的要求。

        圖5 Dataset Ⅰ下采樣點(diǎn)云與完整點(diǎn)云標(biāo)注結(jié)果

        圖6 Dataset Ⅱ下采樣點(diǎn)云與完整點(diǎn)云標(biāo)注結(jié)果

        圖7 Dataset Ⅲ下采樣點(diǎn)云與完整點(diǎn)云標(biāo)注結(jié)果

        表1給出了本文算法在這3個場景下的語義標(biāo)注性能。由表1可以看出:Dataset Ⅰ和Dataset Ⅱ場景的各項(xiàng)性能指標(biāo)都較好,大部分類平均F1score都在0.950以上;而Dataset Ⅲ場景的平均召回率與F1score稍低,分別為0.755和0.821。為了解釋本文算法在Dataset Ⅲ上表現(xiàn)稍遜的原因,統(tǒng)計(jì)了Dataset Ⅰ—Dataset Ⅲ每一類錯誤點(diǎn)的數(shù)量,及其占未標(biāo)注類的比例,見表2。

        表1 本文方法在Dataset Ⅰ-Dataset Ⅲ的試驗(yàn)結(jié)果

        表2 Dataset Ⅰ-Dataset Ⅲ各類錯誤點(diǎn)數(shù)量及其所占比例

        由表2可以看出,Dataset Ⅲ自行車、電動車、設(shè)施和行人類錯分點(diǎn)數(shù)量少但所占比例高;建筑和闊葉林類所占比例低但錯分點(diǎn)數(shù)量多。對于這一現(xiàn)象,一方面是由于數(shù)據(jù)集的極度不平衡導(dǎo)致的,自行車、電動車、設(shè)施和行人4類之和不足所有類的1%,加之本文算法在采樣次數(shù)較少時更為關(guān)注數(shù)量較多的類以快速提高精度,從而導(dǎo)致數(shù)量較少的類標(biāo)注結(jié)果變差,對于這一問題可以通過適當(dāng)增加采樣次數(shù)來解決。圖8給出了每次采樣后Dataset Ⅲ少數(shù)類的平均F1score變化情況。如圖8所示,隨著采樣次數(shù)的增加,Dataset Ⅲ少數(shù)類的平均F1score也逐漸增加,即少數(shù)類的標(biāo)注結(jié)果在逐漸變好。

        圖8 Dataset Ⅲ少數(shù)類不同采樣次數(shù)下的標(biāo)注結(jié)果

        另一方面原因可以從Dataset Ⅲ錯誤點(diǎn)分布情況(圖9)看出,Dataset Ⅲ錯分點(diǎn)分布大致遵循兩個規(guī)律:一是相似類更容易被錯分;二是孤立點(diǎn)更容易錯分。例如自行車類與電動車類,二者大致特征本就比較相似,加之掃描不全、下采樣等因素的影響,細(xì)節(jié)信息損失嚴(yán)重,二者錯分的概率大大增加。針葉林與建筑物內(nèi)部都存在著掃描不全導(dǎo)致的孤立點(diǎn)問題,由于主動學(xué)習(xí)本來利用的訓(xùn)練樣本就少,再加上孤立點(diǎn)群沒有明顯的特征,故其更容易被錯分。除此之外,類與類的邊緣也是錯分點(diǎn)分布較多的地方,可是類的邊緣點(diǎn)所屬類本就難以定義,特別是在所屬類沒有明顯邊緣特征的情況下,邊緣點(diǎn)的分類結(jié)果對整體標(biāo)注結(jié)果影響不大。

        注:紅色表示錯誤標(biāo)注的點(diǎn),灰色表示正確標(biāo)注的點(diǎn)。

        2.2.2 下采樣對語義標(biāo)注結(jié)果影響分析

        為分析下采樣處理對語義標(biāo)注結(jié)果的影響,本節(jié)分別用直接對完整點(diǎn)云進(jìn)行標(biāo)注和先下采樣后標(biāo)簽傳播兩種處理模式對Dataset Ⅲ場景進(jìn)行標(biāo)注,其中完整點(diǎn)云的采樣點(diǎn)數(shù)量BatchSize=5800,其他條件設(shè)置與下采樣點(diǎn)云一致,具體結(jié)果見表3。

        表3 兩種處理模式對比

        由表3可知,對點(diǎn)云下采樣會使標(biāo)注精度有所下降,但在精度和時間成本之間取得均衡,下采樣處理模式相比于直接處理模式能節(jié)省近5倍的時間成本和近4倍的人工成本,對于大場景點(diǎn)云來說,采用下采樣處理模式能更省時、省力。

        2.2.3 特征選擇對語義標(biāo)注結(jié)果影響分析

        為評估本文所提出的特征選擇方法的有效性,本節(jié)測試了經(jīng)過特征選擇后的特征子集與全部特征集合各自的語義標(biāo)注結(jié)果,具體見表4。

        由表4可知,經(jīng)過特征選擇后的特征子集能在保持性能基本不變的情況下,為采樣算法縮短將近1/3的時間,這無疑能幫助本文算法在時間成本上獲得優(yōu)勢。

        表4 特征選擇試驗(yàn)結(jié)果

        2.2.4 采樣點(diǎn)數(shù)量BatchSize對語義標(biāo)注結(jié)果影響分析

        為分析每批次采樣點(diǎn)數(shù)量BatchSize不同取值對語義標(biāo)注結(jié)果的影響,本節(jié)統(tǒng)計(jì)了不同BatchSize值所對應(yīng)的節(jié)省人工成本SavedPoints、平均F1score和完成采樣所需時間,其中總采樣點(diǎn)數(shù)TN不變(TN=30 000),結(jié)果如圖10所示。

        圖10 每批次采樣點(diǎn)數(shù)量BatchSize對語義標(biāo)注工作的影響

        由圖10可知,隨著BatchSize的增大,平均F1score和采樣時間呈下降趨勢,SavedPoints先增加后減少。這是因?yàn)橹鲃訉W(xué)習(xí)算法依賴于小批次的多次迭代來改善模型精度。當(dāng)一次采樣過多樣本后反而會產(chǎn)生較差的結(jié)果。綜合考慮采樣時間、平均F1score及SavedPoints值,本文選取BatchSize=1000作為理想批次采樣點(diǎn)數(shù)量。

        2.3 標(biāo)注結(jié)果和節(jié)省人工成本對比分析

        為進(jìn)一步分析本文算法的有效性,將本文方法與RBS[30]、EBS[36]、RBMS[31]3種方法進(jìn)行了對比分析。RBS、EBS、RBMS和本文方法的初始樣本集、未標(biāo)注樣本集、參數(shù)設(shè)置等外在條件均相同。首先對比了4種方法在不同采樣次數(shù)下的標(biāo)注平均精度和節(jié)省的人工成本情況,然后對比了4種方法在相同采樣次數(shù)下標(biāo)注結(jié)果以及時間成本。

        2.3.1 不同采樣次數(shù)下對比分析

        圖11—圖13給出了本文方法與其他3種方法每次采樣后Dataset Ⅰ—Dataset Ⅲ的標(biāo)注平均精度和節(jié)省的人工成本情況。其中,每次采樣所需人工糾正的樣本個數(shù)都按最壞情況算,即取BS=1000,在實(shí)際情況下,每次需要人工糾正的樣本數(shù)要小于它,且隨著采樣次數(shù)增加,每次需要糾正樣本數(shù)會越來越少,即節(jié)省的人工成本SavedPoints比實(shí)際情況偏小。

        由圖11—圖13可以看出,Dataset Ⅰ—Dataset Ⅲ分別在采樣次數(shù)N=12、17、8時,達(dá)到最大SavedPoints,分別為0.925 0、0.926 5和0.941 7,這代表著利用本文方法最多只需人工標(biāo)注7.50%、7.35%、5.83%的點(diǎn)云即可完成Dataset Ⅰ—Dataset Ⅲ下采樣點(diǎn)云的標(biāo)注工作。除此之外,Dataset Ⅰ—Dataset Ⅲ場景的平均精度隨著采樣次數(shù)增加而不斷增加,而SavedPoints卻隨著采樣次數(shù)的增加先增加后減少。這是因?yàn)殡S著采樣次數(shù)的不斷增加,模型慢慢趨于穩(wěn)定,未標(biāo)注集數(shù)量也在不斷減少,當(dāng)達(dá)到峰值之后,每次人工標(biāo)注樣本帶來的精度提升并不足以抵消人工標(biāo)注樣本本身帶來的人工成本。而且通過對比,本文方法在精度和節(jié)省的人工成本方面相較于其他3種方法都有較大的優(yōu)勢,達(dá)到最大SavedPoints所需采樣次數(shù)也少于其他方法,這也表明了本文方法在減少人工成本方面的優(yōu)越性。

        圖11 RBS、EBS、本文方法、RBMS在Dataset Ⅰ的標(biāo)注結(jié)果

        圖12 RBS、EBS、本文方法、RBMS在Dataset Ⅱ的標(biāo)注結(jié)果

        圖13 RBS、EBS、本文方法、RBMS在Dataset Ⅲ的標(biāo)注結(jié)果

        2.3.2 相同采樣次數(shù)下對比分析

        表5顯示了4種方法在相同采樣次數(shù)下的平均精度、召回率、F1score及運(yùn)行時間。其中,選取在Dataset Ⅰ—Dataset Ⅲ場景里達(dá)到最大SavedPoints所需采樣次數(shù)N作為試驗(yàn)參數(shù)。由表5可知,本文方法在Dataset Ⅰ、Dataset Ⅱ場景下的平均精度、召回率和F1score比其他3種方法高5%~8%;即使在難度較大的Dataset Ⅲ場景下,本文方法也比另外3種方法表現(xiàn)要好。這也進(jìn)一步表明本文方法在標(biāo)注結(jié)果精度方面的優(yōu)越性。

        表5 本文方法與其他方法比較

        在時間成本方面,本文方法在相同采樣次數(shù)下的時間上雖不占優(yōu),但與其他方法相差不大,若以達(dá)到各自最大節(jié)省人工成本的時間為標(biāo)準(zhǔn)(本文方法達(dá)到最大節(jié)省人工成本所需采樣次數(shù)小于其他方法),本文方法在時間上還會優(yōu)于其他方法。總體而言,本文方法能在較短時間內(nèi),利用小部分人工標(biāo)注樣本完成整個點(diǎn)云的標(biāo)注,大大減少了場景點(diǎn)云語義標(biāo)注的人工成本。

        3 結(jié) 語

        為了減少點(diǎn)云場景語義標(biāo)注的人工成本,本文提出了一種結(jié)合排序批處理模式的主動學(xué)習(xí)點(diǎn)云場景語義標(biāo)注方法。該方法具有很好的通用性,只需要點(diǎn)云的三維空間信息即可完成整個標(biāo)注過程;提出了改進(jìn)的遞歸特征增加法來篩選特征子集,在保持性能不下降的情況下,避免了維度災(zāi)難,加快了運(yùn)算速度;在點(diǎn)云場景語義標(biāo)注中引入了主動學(xué)習(xí)方法,只需要人工標(biāo)注很小部分樣本即可完成整個場景點(diǎn)云的語義標(biāo)注工作;提出了改進(jìn)的排序批處理模式采樣算法,能夠更快速、有效地挑選出最有價值的樣本;利用鄰域等權(quán)標(biāo)簽傳播算法能夠由標(biāo)注好的下采樣點(diǎn)云快速、準(zhǔn)確地獲取整個場景點(diǎn)云的語義標(biāo)注結(jié)果。在3個數(shù)據(jù)集上,利用本文方法只需人工標(biāo)注7.50%、7.35%、5.83%的點(diǎn)云即可完成下采樣點(diǎn)云的標(biāo)注工作。而且通過相關(guān)指標(biāo)比較表明,本文方法在標(biāo)注精度和減少人工成本方面優(yōu)于其他方法。綜上所述,本文方法能為點(diǎn)云語義標(biāo)注工作節(jié)省大量人工成本。

        猜你喜歡
        特征選擇語義次數(shù)
        機(jī)場航站樓年雷擊次數(shù)計(jì)算
        2020年,我國汽車召回次數(shù)同比減少10.8%,召回?cái)?shù)量同比增長3.9%
        商用汽車(2021年4期)2021-10-13 07:16:02
        一類無界算子的二次數(shù)值域和譜
        語言與語義
        依據(jù)“次數(shù)”求概率
        Kmeans 應(yīng)用與特征選擇
        電子制作(2017年23期)2017-02-02 07:17:06
        “上”與“下”語義的不對稱性及其認(rèn)知闡釋
        聯(lián)合互信息水下目標(biāo)特征選擇算法
        認(rèn)知范疇模糊與語義模糊
        基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
        国产亚洲午夜精品久久久| 91情侣视频| 视频精品熟女一区二区三区| 日韩av免费一区二区| 亚洲人成欧美中文字幕 | 亚洲国产成人aⅴ毛片大全| 国产一区三区二区视频在线观看| 国产精品理论片在线观看| 国产sm调教视频在线观看| 欧美在线成人午夜网站| 久久色悠悠亚洲综合网| 亚洲女优中文字幕在线观看| 亚洲成av人片在线观看www| 国产白丝在线| 亚洲处破女av一区二区| 亚洲综合极品美女av| 青青草视频免费观看| 不卡国产视频| 日产一区二区三区的精品| 国产日韩精品suv| 欧美性大战久久久久久久| 欧美亚洲尤物久久综合精品| 国产一区二区三区的区| 丰满人妻一区二区三区免费视频| 老少交欧美另类| 日本一区二区三区在线| 国产精品狼人久久影院软件介绍| 亚洲av高清在线一区二区三区| 国产精品一区二区韩国AV| 天堂影院久久精品国产午夜18禁| 四虎永久在线精品免费网址| 亚洲aⅴ在线无码播放毛片一线天| 亚洲国产香蕉视频欧美| 日本免费影片一区二区| 亚洲精品乱码久久久久久中文字幕 | 99国产精品久久久久久久成人热 | 国产在线91精品观看| 亚洲国产精品ⅴa在线观看| 国产福利片无码区在线观看| 日本高清成人一区二区三区| 三级做a全过程在线观看|