胡靖雪,張 馳,徐力恒,呂曉軍,劉躍虎
(1. 西安交通大學(xué) 人工智能學(xué)院,西安 710049;2. 中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司 電子計(jì)算技術(shù)研究所,北京 100081)
安檢智能檢測(cè)軟件(簡(jiǎn)稱(chēng):智能檢測(cè)軟件)采用深度學(xué)習(xí)模型,自動(dòng)識(shí)別行李X光圖像中的危險(xiǎn)品,減輕了安檢人員作業(yè)勞動(dòng)強(qiáng)度,同時(shí)也提高了安檢效率[1]。
在實(shí)際業(yè)務(wù)場(chǎng)景中,由于旅客行李中攜帶的危險(xiǎn)品種類(lèi)繁多,且有些危險(xiǎn)品實(shí)物形態(tài)不固定,智能檢測(cè)軟件可能難以識(shí)別出其中一些危險(xiǎn)品,降低了識(shí)別準(zhǔn)確率。對(duì)于基于深度神經(jīng)網(wǎng)絡(luò)模型的檢測(cè)軟件,樣本數(shù)據(jù)會(huì)直接影響神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)模型的預(yù)測(cè)準(zhǔn)確率。因此,如何有效利用現(xiàn)場(chǎng)行李安檢系統(tǒng)運(yùn)行過(guò)程中的新增圖像數(shù)據(jù),提升智能檢測(cè)軟件的性能,使智能檢測(cè)軟件能夠適應(yīng)車(chē)站行李安檢現(xiàn)場(chǎng)的復(fù)雜業(yè)務(wù)場(chǎng)景,滿足行李安檢系統(tǒng)產(chǎn)品上線應(yīng)用的技術(shù)指標(biāo)要求,是一道亟待攻克的技術(shù)難題。
智能檢測(cè)軟件需要應(yīng)對(duì)行李X光圖像數(shù)據(jù)呈“長(zhǎng)尾分布”特征[2],即旅客行李中不攜帶危險(xiǎn)物品的安全場(chǎng)景占絕大多數(shù),而小概率出現(xiàn)的危險(xiǎn)物品或疑似物品復(fù)雜多樣,通過(guò)有限次數(shù)據(jù)采集無(wú)法獲取完備的危險(xiǎn)品圖像樣本數(shù)據(jù)。
為此,從現(xiàn)場(chǎng)行李安檢系統(tǒng)采集的行李X光圖像數(shù)據(jù)中,找出智能檢測(cè)軟件會(huì)錯(cuò)誤識(shí)別的難分樣本集,作為增量樣本數(shù)據(jù),支持智能檢測(cè)軟件的增量式學(xué)習(xí),實(shí)現(xiàn)模型更新。這種通過(guò)數(shù)據(jù)分析來(lái)改進(jìn)業(yè)務(wù)模型的迭代策略被稱(chēng)為“數(shù)據(jù)分析閉環(huán)”,已在無(wú)人駕駛智能系統(tǒng)研發(fā)領(lǐng)域得到廣泛應(yīng)用[3-4]。
行李安檢智能檢測(cè)數(shù)據(jù)分析閉環(huán)流程,如圖1所示。
圖1 行李安檢智能檢測(cè)數(shù)據(jù)閉環(huán)流程
實(shí)例研究表明,業(yè)務(wù)模型的最難分樣本對(duì)改善系統(tǒng)的邊界決策能力起決定性作用[5],即基于最難分樣本的訓(xùn)練可以有效提升模型處理邊界問(wèn)題的能力。如何高效、準(zhǔn)確地從現(xiàn)場(chǎng)行李圖像數(shù)據(jù)中選取最難分樣本集,最大程度地改善智能檢測(cè)軟件性能,是本文重點(diǎn)研究的問(wèn)題。
受數(shù)據(jù)增強(qiáng)(AutoAugment)策略的自動(dòng)搜索方法啟發(fā)[6],本文提出行李X光圖像數(shù)據(jù)最難分樣本集選取方法,其框架如圖2所示。
圖2 行李X光圖像數(shù)據(jù)最難分樣本集選取方法框架
基于強(qiáng)化學(xué)習(xí)框架,通過(guò)迭代計(jì)算,可選取出行李X光圖像的最難分樣本集。即將最難分樣本集選取問(wèn)題轉(zhuǎn)化為長(zhǎng)短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò)(LSTMRNN,Long Short Term Memory Recurrent Neural Network)控制器的樣本圖像特征空間離散搜索問(wèn)題,使用最差性能獎(jiǎng)勵(lì)約束的策略梯度方法優(yōu)化搜索過(guò)程;利用預(yù)計(jì)算的K-reciprocal重排序技術(shù)[6],查找預(yù)測(cè)樣本在有標(biāo)注數(shù)據(jù)集中的最近鄰樣本;將最近鄰有標(biāo)注樣本作為代理計(jì)算獎(jiǎng)勵(lì)函數(shù),驅(qū)動(dòng)無(wú)標(biāo)注行李X光圖像數(shù)據(jù)(即業(yè)務(wù)數(shù)據(jù)池)的最難分樣本選取。具體步驟如下:
(1)LSTM-RNN控制器從圖像特征空間中采樣,得到視覺(jué)特征向量S;
(2)匹配器從業(yè)務(wù)數(shù)據(jù)池中查找到視覺(jué)特征最接近S的n個(gè)無(wú)標(biāo)注樣本,作為候選最難分樣本集N;并使用重排序技術(shù),來(lái)保證匹配數(shù)據(jù)集的內(nèi)部特征一致性;
(3)對(duì)候選最難分樣本集N中的每個(gè)樣本,在初始數(shù)據(jù)集中搜索其最近鄰樣本,生成代理樣本集N;
(4)計(jì)算智能檢測(cè)軟件對(duì)代理樣本集N的檢測(cè)準(zhǔn)確度mAP,根據(jù)mAP計(jì)算獎(jiǎng)勵(lì)值R,并將獎(jiǎng)勵(lì)值R發(fā)送回控制器,用于更新LSTM-RNN控制器的權(quán)重;使用策略梯度優(yōu)化,解決因獎(jiǎng)勵(lì)值R不可導(dǎo)造成的控制器無(wú)法完成訓(xùn)練的問(wèn)題。
在最難分樣本集的迭代搜索過(guò)程中,控制器采用基于強(qiáng)化學(xué)習(xí)的策略梯度算法進(jìn)行網(wǎng)絡(luò)訓(xùn)練。
控制器采樣得到圖像視覺(jué)特征的過(guò)程可視為動(dòng)作列表a1:T,其中,T是控制器采樣的視覺(jué)特征向量維數(shù)。根據(jù)控制器采樣的圖像視覺(jué)特征,在業(yè)務(wù)數(shù)據(jù)池中選取樣本集N,在已標(biāo)注數(shù)據(jù)集上生成其代理樣本集N;根據(jù)智能檢測(cè)軟件在樣本集N上的檢測(cè)準(zhǔn)確度mAP,計(jì)算用于訓(xùn)練控制器的獎(jiǎng)勵(lì)值R
為了從業(yè)務(wù)數(shù)據(jù)池中挑選出最難分樣本集,控制器的訓(xùn)練目標(biāo)是使智能檢測(cè)軟件的性能表現(xiàn)最小化,并使整個(gè)蒙特卡洛過(guò)程中最大獎(jiǎng)勵(lì)期望值最大化,即有
其中, θc是控制器的網(wǎng)絡(luò)參數(shù)。
求梯度的經(jīng)驗(yàn)近似公式通??杀硎緸?/p>
其中,Rk對(duì)應(yīng)代理樣本集中第k個(gè)樣本的獎(jiǎng)勵(lì)值;基線函數(shù)b是前序迭代獎(jiǎng)勵(lì)值的指數(shù)滑動(dòng)平均,用以降低策略梯度優(yōu)化過(guò)程獎(jiǎng)勵(lì)值的期望方差。
最后,策略梯度算法通過(guò)策略性能的隨機(jī)梯度提升迭代更新 θc,使控制器訓(xùn)練收斂,更新迭代過(guò)程可表示為
在最難分樣本集迭代搜索過(guò)程中,需要檢索與控制器所生成的視覺(jué)特征S最為接近的有標(biāo)注數(shù)據(jù)集。為了高效地匹配到準(zhǔn)確性高、內(nèi)聚性強(qiáng)的有標(biāo)注數(shù)據(jù),可使用K-reciprocal重排序技術(shù),并結(jié)合最近鄰匹配方法,將無(wú)標(biāo)注樣本轉(zhuǎn)化為有標(biāo)注樣本集。
使用K-reciprocal重排序技術(shù),可搜索到最近鄰的匹配數(shù)據(jù)集,并保證匹配數(shù)據(jù)集的內(nèi)部特征一致。但在迭代過(guò)程中,動(dòng)態(tài)重排序會(huì)占用大量?jī)?nèi)存,且耗時(shí)較長(zhǎng),降低了樣本匹配速度,影響了最難分樣本集的搜索效率。為此,提出基于預(yù)計(jì)算重排序的匹配器設(shè)計(jì),即預(yù)先對(duì)所有圖像的視覺(jué)特征進(jìn)行重排序計(jì)算,并把結(jié)果記入靜態(tài)重排序表,用于快速查詢(xún)視覺(jué)特征S的最近鄰樣本[7];靜態(tài)重排序表的生成過(guò)程見(jiàn)算法1。
算法1
靜態(tài)重排序表生成
輸入:
離散特征空間Φ
有標(biāo)注樣本集特征 Θ1,Θ1?Φ
無(wú)標(biāo)注樣本集特征 Θ2,Θ2?Φ
匹配樣本數(shù)n
輸出:靜態(tài)重排序列表T
for eachs2Θ2do
設(shè)置S為目標(biāo)特征
使用K-reciprocal,計(jì)算n個(gè)最近鄰的有標(biāo)注樣本特征p2Θ1
將鍵值S和包含n個(gè)樣本的列表存儲(chǔ)于T中
end for
在此基礎(chǔ)上,在靜態(tài)重排序表中查找最接近目標(biāo)視覺(jué)特征的前K個(gè)最近鄰特征行,可獲得相應(yīng)的重排序結(jié)果;最近鄰有標(biāo)注樣本集查詢(xún)過(guò)程見(jiàn)算法2。
算法2
最近鄰有標(biāo)注樣本子集查詢(xún)輸入:
離散特征空間Φ
控制器生成的目標(biāo)特征S,S2Φ
靜態(tài)重排序列表T
匹配樣本數(shù)n
輸出:對(duì)應(yīng)目標(biāo)特征S的前n個(gè)最近鄰有標(biāo)注樣本子集N
①計(jì)算T中與S最 臨近的n個(gè)鍵值fs1,...,sng
②新建空集合N
for eachsi2fs1,...,sngd o:
①得到T中si對(duì)應(yīng)的列表L
②得到列表L中top1有標(biāo)注樣本ti
③N=N[ftig
end for
為模擬現(xiàn)場(chǎng)行李安檢業(yè)務(wù)場(chǎng)景,使用一組初始訓(xùn)練集來(lái)訓(xùn)練智能檢測(cè)軟件;初始訓(xùn)練集包含電池、瓶子、錘斧等5類(lèi)危險(xiǎn)品圖像共6 819張。同時(shí),使用2組測(cè)試集作為業(yè)務(wù)數(shù)據(jù)池;其中,測(cè)試集A與初始訓(xùn)練集在同一場(chǎng)景下采樣,包含與其獨(dú)立同分布的安檢圖像1704張;測(cè)試集B包含與初始訓(xùn)練集中危險(xiǎn)品形態(tài)迥異的1704張安檢圖像,用于模擬行李安檢運(yùn)行過(guò)程中出現(xiàn)的新增數(shù)據(jù)。這3個(gè)數(shù)據(jù)集中包含的危險(xiǎn)品類(lèi)別及數(shù)目,如表1所示。
表1 測(cè)試數(shù)據(jù)集各類(lèi)危險(xiǎn)品數(shù)目 (單位:張)
最難分樣本集選取算法使用LSTM網(wǎng)絡(luò)作為基本單元,其每層包含60個(gè)隱藏神經(jīng)元;通過(guò)30維softmax函數(shù),輸出預(yù)測(cè)的目標(biāo)視覺(jué)特征,并計(jì)算其交叉熵?fù)p失?;讵?jiǎng)勵(lì)值R,對(duì)控制器的策略梯度進(jìn)行縮放,以確??刂破髂軌蛞暂^低概率采樣到簡(jiǎn)單樣本對(duì)應(yīng)的特征,而以較高概率采樣到難分樣本對(duì)應(yīng)的特征??刂破鞑捎肦MSProp優(yōu)化器進(jìn)行優(yōu)化,學(xué)習(xí)率為0.001,學(xué)習(xí)率的指數(shù)衰減系數(shù)為0.95,衰減步長(zhǎng)為50;最大迭代次數(shù)設(shè)置為300。
選用YOLO v5作為檢測(cè)模型的骨干網(wǎng)絡(luò),其第7層卷積層輸出512×20×20維特征,經(jīng)PCA降維后,所得到的30維特征將作為最難分樣本集選取算法中的視覺(jué)特征。
為消除實(shí)驗(yàn)誤差,對(duì)每組測(cè)試集分別進(jìn)行100次重復(fù)實(shí)驗(yàn),使用全類(lèi)平均準(zhǔn)確率,評(píng)價(jià)本文算法選取最難分樣本集的效果,測(cè)試結(jié)果見(jiàn)表2。
表2 最難分樣本集選取算法實(shí)驗(yàn)結(jié)果
由表2可知:(1)使用本文提出的最難分樣本集選取方法,針對(duì)2個(gè)不同分布的測(cè)試集A和B,所選取的最難分樣本集的準(zhǔn)確率均遠(yuǎn)低于其平均準(zhǔn)確率,說(shuō)明該方法對(duì)于選取不同分布數(shù)據(jù)集的最難分樣本集均具有良好的適用性;(2)測(cè)試集B上的最難分樣本集選取效果明顯差于測(cè)試集A,說(shuō)明對(duì)于測(cè)試集與訓(xùn)練集具有不同數(shù)據(jù)分布的情況,該方法的最難分樣本集選取性能仍有提升空間。
本文分析安檢智能檢測(cè)數(shù)據(jù)分析閉環(huán)流程,能夠從行李安檢系統(tǒng)運(yùn)行過(guò)程中產(chǎn)生的危險(xiǎn)品實(shí)例圖像中持續(xù)選取最難分樣本,作為增量數(shù)據(jù),完成智能檢測(cè)軟件的學(xué)習(xí)更新,實(shí)現(xiàn)車(chē)站安檢智能檢測(cè)軟件性能的持續(xù)成長(zhǎng)。本文將最難分樣本集選取形式化為L(zhǎng)STM-RNN神經(jīng)網(wǎng)絡(luò)控制的樣本圖像特征空間離散搜索問(wèn)題,使用最差性能獎(jiǎng)勵(lì)約束的策略梯度方法優(yōu)化搜索過(guò)程。利用預(yù)計(jì)算的K-reciprocal重排序技術(shù),查找預(yù)測(cè)樣本在有標(biāo)注數(shù)據(jù)集中的最近鄰樣本,將最近鄰有標(biāo)注樣本作為代理計(jì)算獎(jiǎng)勵(lì)函數(shù),驅(qū)動(dòng)無(wú)標(biāo)注業(yè)務(wù)數(shù)據(jù)池的最難分樣本集選取。測(cè)試表明,該強(qiáng)化學(xué)習(xí)架構(gòu)可有效選取業(yè)務(wù)數(shù)據(jù)池中智能檢測(cè)軟件的最難分樣本集。
在實(shí)際的行李安檢場(chǎng)景中,行李中包含的危險(xiǎn)品可能與訓(xùn)練集處于不同分布,無(wú)法選取其最理想的最難分樣本集,將影響智能檢測(cè)數(shù)據(jù)分析閉環(huán)的軟件更新效率。因此,如何在測(cè)試集與訓(xùn)練集處于不同數(shù)據(jù)分布的情況下,提高最難分樣本集的選取性能,將是下一階段的研究重點(diǎn)。