胡紫薇,項(xiàng) 安,陳奕杰
(同濟(jì)大學(xué) 電子與信息工程學(xué)院, 上海 201804)
近年來,機(jī)場(chǎng)、地鐵、車站等區(qū)域?qū)τ谝后w危險(xiǎn)品的安全檢查越來越重視,由于這些區(qū)域人口密集,一旦被不法分子利用將產(chǎn)生難以預(yù)料的后果。然而,實(shí)際的液體一般是多種液體的混合物,混合物的配比不同,容器的形狀、材料、在安檢機(jī)中的位置不同均會(huì)導(dǎo)致識(shí)別結(jié)果精度偏低,誤報(bào)率和漏報(bào)率較高。
現(xiàn)階段利用X射線安檢技術(shù)對(duì)固體爆炸物的識(shí)別技術(shù)取得了極大的突破。SAMET等[1]提出了利用X射線安檢設(shè)備,基于深度神經(jīng)網(wǎng)絡(luò)對(duì)行李的X射線圖像進(jìn)行特征提取后實(shí)現(xiàn)分類,成功檢測(cè)出手槍、管制刀具等危險(xiǎn)物品;ANDRE等[2]提出了利用雙能量CT安檢設(shè)備,基于三維模型重構(gòu)計(jì)算行李中任何區(qū)域的原子序數(shù)和密度信息,實(shí)現(xiàn)物質(zhì)分類,識(shí)別諸如金屬、毒品、爆炸物等危險(xiǎn)品。
對(duì)于固體危險(xiǎn)品的檢測(cè)方法已日漸完善,識(shí)別準(zhǔn)確率非常高,但是在液體危險(xiǎn)品檢測(cè)方向上還存在著諸多問題。Optosecurity公司提出了通過知識(shí)庫去除傳送帶和玻璃壁的影響,基于數(shù)學(xué)模型計(jì)算有效路徑對(duì)液體進(jìn)行識(shí)別[3],但是由于容器形狀不一,在行李中的位置難確定,容器材料與厚度對(duì)識(shí)別結(jié)果的影響,檢測(cè)結(jié)果并不精確。李文博[4]提出在靜態(tài)條件下對(duì)危險(xiǎn)液體進(jìn)行區(qū)分,該方法僅針對(duì)靜態(tài)放置被檢品,且未提出去除容器影響的方案;王宇石等[5]提出MMA算法可對(duì)圓形或橢圓形容器盛放的高密度危險(xiǎn)液體實(shí)現(xiàn)識(shí)別,但需要多個(gè)光源來實(shí)現(xiàn)高識(shí)別率;查艷麗[6]在此基礎(chǔ)上提出對(duì)液體容器材料的識(shí)別算法,為實(shí)現(xiàn)液體檢測(cè)去除容器影響提供了一定的借鑒。
筆者利用現(xiàn)有雙能X射線安檢機(jī),基于圖像深度學(xué)習(xí),提出了一種去除容器壁厚的數(shù)學(xué)模型,計(jì)算容器吸收系數(shù),并利用圖像處理方法獲得精準(zhǔn)的容器定位,采用支持向量機(jī)和邏輯回歸模型實(shí)現(xiàn)R值分類,完成對(duì)液體危險(xiǎn)品的識(shí)別,此方法能夠提升安檢效率與識(shí)別精度。
雙能X射線安檢機(jī)主要由射線源和陣列探測(cè)器組成。由一列探測(cè)器收集線性的扇形X射線穿透物體后的衰減信號(hào)組成單個(gè)列陣,經(jīng)由傳送帶及采集率匹配得到行程矩陣數(shù)據(jù)信息,處理后由灰度信息形成偽圖像。由于被檢測(cè)物體的密度與厚度不同,形成圖像的灰度值也不同。對(duì)于單能系統(tǒng),只能通過圖像中物體形狀來判斷。而對(duì)于雙能系統(tǒng),則可以利用高低能數(shù)據(jù)圖像得到R值,從而計(jì)算得到物質(zhì)的有效原子序數(shù)Zeff的信息,實(shí)現(xiàn)物質(zhì)鑒別。
假定入射X射線束能量為I0,通過厚度為H的物質(zhì)后其衰減為I。經(jīng)過簡(jiǎn)化后,其關(guān)系表現(xiàn)為Beer-Lambert定律[7]
(1)
式中:μm()為坐標(biāo)為處物質(zhì)的質(zhì)量吸收系數(shù);ρ()為物質(zhì)的密度。
對(duì)式(1)進(jìn)行變換得到X射線透視成像公式為
(2)
式中:L為射線穿透的有效長(zhǎng)度。
將X射線透過混合物等效為通過N份均勻的不同物質(zhì)(見圖1),那么式(2)可以表示為
圖1 雙能X射線安檢機(jī)結(jié)構(gòu)示意
(3)
根據(jù)式(3)可以發(fā)現(xiàn)X射線穿透物質(zhì)的吸收強(qiáng)度由物體長(zhǎng)度和透射厚度決定。
X射線穿透物質(zhì)等效示意如圖2所示,高低能圖像的物質(zhì)厚度相抵消。可以得到R值計(jì)算公式如式(4)所示。
圖2 X射線穿透物質(zhì)的等效示意
(4)
這種方法即目前安檢機(jī)區(qū)分有機(jī)物、無機(jī)物和混合物的方法[8]。
通過高低能數(shù)據(jù)得到被檢液體等效的R值之后,根據(jù)式(5)得到有效原子序數(shù)Zeff,從而完成對(duì)液體的識(shí)別。
Zeff=a·exp(α·R)+b·exp(β·R)
(5)
式中:a=-6.596X105,b=4.685,α=-9.815,β=0.678 3。這4個(gè)常數(shù)的取值為經(jīng)驗(yàn)值。
根據(jù)式(4)和式(5),可以得到X射線安檢機(jī)檢測(cè)危險(xiǎn)品是通過高低能數(shù)據(jù)得到等效的R值,或者通過擬合曲線得到有效原子序數(shù)Zeff,實(shí)現(xiàn)物質(zhì)分類的[9-13]。但是,這種方法在檢測(cè)液體危險(xiǎn)品時(shí)需要經(jīng)過一定的改進(jìn)。因?yàn)橐后w一般被盛放于容器中,容器的材料、壁厚等對(duì)高低能數(shù)據(jù)的影響將會(huì)直接影響到對(duì)液體物質(zhì)的分類。所以,提出如下的一種理想狀態(tài)下的算法模型,盡可能剔除容器的干擾,得到液體的高低能數(shù)據(jù)與R值。
假定不考慮空氣、傳動(dòng)帶等因素的影響,將容器壁假定為均一、厚度相等的材料,將容器中的待檢測(cè)液體也視為均勻的?;谝陨系睦硐牖僭O(shè),可以將整個(gè)待檢測(cè)物體的吸收強(qiáng)度等效為
A=μbottleLbottle+μliquidLliquid
(6)
式中:A為吸收強(qiáng)度;μbottle為容器的吸收系數(shù);Lbottle為射線穿過容器的有效長(zhǎng)度;μliquid為液體的吸收系數(shù);Lliquid為射線穿過液體的有效長(zhǎng)度。
只要能夠求得μbottle,Lbottle的值,即可得到液體的相關(guān)參數(shù)并實(shí)現(xiàn)識(shí)別。
對(duì)于X射線源發(fā)出的一條X射線,其在穿過容器壁后,通過待檢測(cè)液體,再穿過容器壁到達(dá)直線上的陣列探測(cè)器接收點(diǎn)。此種理想狀態(tài)下的數(shù)學(xué)模型如圖3所示。
圖3 理想狀態(tài)下的數(shù)學(xué)模型
對(duì)于射線源發(fā)出的兩條射線S1與S2,在分別經(jīng)過有效長(zhǎng)度為L(zhǎng)1與L2的物質(zhì)吸收后被探測(cè)器接收。通過分析最終的成像信息,可以推算得到S1與S2對(duì)應(yīng)的探測(cè)的實(shí)際位置(x1,y1),(x2,y2)。
假定X射線源處正上方的傳送帶為坐標(biāo)軸原點(diǎn),那么對(duì)于S1和S2分別有
(7)
(8)
(9)
(10)
將式(9)與式(10)代入式(7)與式(8),化簡(jiǎn)得到
AS1cosα1=2dμbottle+μliquidHliquid,S1
(11)
AS2cosα2=2dμbottle+μliquidHliquid,S2
(12)
式中:Hliquid,S1,Hliquid,S2為射線穿過液體的有效長(zhǎng)度在垂直方向上的投影。
由于傳送帶的運(yùn)動(dòng)與慣性的存在,一般情況下,Hliquid,S1≠Hliquid,S2。
對(duì)式(11)與式(12)進(jìn)行差分得到
AS1cosα1-AS2cosα2=μliquidΔHliquid
(13)
由式(13)可以發(fā)現(xiàn),通過差分可以消除容器壁對(duì)液體R值的影響。對(duì)高低能圖像同時(shí)進(jìn)行差分處理,后通過高低能數(shù)據(jù)相除可以得到理想狀態(tài)下液體R值的求解方法為
(14)
根據(jù)式(14)即可得到液體R值,再根據(jù)式(5)可得到液體的有效原子序數(shù),實(shí)現(xiàn)對(duì)危險(xiǎn)液體的識(shí)別分類。
2.1.1 圖像噪聲分析與平滑處理
在X射線穿透被檢測(cè)液體的過程中,會(huì)存在暗電流產(chǎn)生的噪聲、探測(cè)器之間相互接收產(chǎn)生的噪聲、系統(tǒng)的噪聲等干擾。若不對(duì)噪聲進(jìn)行前期處理,會(huì)影響容器定位的效果。
對(duì)于暗電流產(chǎn)生的噪聲,采集射線源關(guān)閉時(shí)的圖像,對(duì)其進(jìn)行列均值處理,得到的值可以近似認(rèn)為是每個(gè)探測(cè)點(diǎn)的暗電流數(shù)據(jù)。在通過被檢測(cè)液體時(shí),將得到的雙能圖像減去暗電流數(shù)據(jù),即可排除暗電流噪聲的干擾[14]。對(duì)于其他噪聲,可采用中值濾波的方法濾除。
2.1.2 圖像二值化處理
圖像二值化處理是為了減少圖像的冗余信息,對(duì)圖像進(jìn)行輪廓清晰化處理而進(jìn)行的步驟。二值化處理的基本原理是設(shè)定一個(gè)閾值,將高于該閾值的像素點(diǎn)設(shè)為1,小于該閾值的像素點(diǎn)設(shè)為0,從而達(dá)到過濾不相干信息,突出所需被檢物輪廓的目的。
在危險(xiǎn)液體檢測(cè)中,一般方法的處理結(jié)果顯示仍有較多的不相干背景殘留,無法得到較好的容器輪廓。在上述理論基礎(chǔ)上,筆者提出一種基于R值的圖像二值化處理方法,以盡可能多地濾除背景的影響。
基于R值的二值化處理方法為:首先,在不放置任何待檢測(cè)物的狀態(tài)下,得到“亮場(chǎng)圖片”數(shù)據(jù),對(duì)其進(jìn)行列均值處理后,以得到的數(shù)值作為每個(gè)探測(cè)點(diǎn)的滿載數(shù)據(jù)。然后,通過盛有被測(cè)液體的容器,得到被測(cè)物的高低能圖像數(shù)據(jù),根據(jù)式(4)將其分別除以對(duì)應(yīng)的滿載數(shù)據(jù)后,進(jìn)行對(duì)數(shù)變換再相除可以得到R值圖像。通過選取合適的R值可以突出液體容器的信息,剔除其他不相關(guān)信息。
基于R值的二值化處理結(jié)果如圖4所示,通過對(duì)圖4的分析可以發(fā)現(xiàn),基于R值的二值化算法能夠有效地濾除與液體容器無關(guān)的信息(如尺子等),保留所需物體信息。
圖4 基于R值的二值化處理結(jié)果
2.1.3 圖像形態(tài)學(xué)處理
基于R值的二值化處理雖然能夠有效地剔除無關(guān)信息,得到液體容器信息,但是也導(dǎo)致了圖像出現(xiàn)缺失和存在多余點(diǎn),甚至部分圖像未能連接在一起。為了更好地實(shí)現(xiàn)容器定位,在圖像二值化后進(jìn)行形態(tài)學(xué)處理,以減小空隙和去除多余信息點(diǎn)。對(duì)二值化處理后的圖像迭代4次腐蝕操作,再迭代4次膨脹操作,最后進(jìn)行融合操作,能夠保留較多的有用信息,并去除不必要的信息。
一般的圖像識(shí)別問題中,通常采用如圖5(a)所示的邊界矩形框?qū)崿F(xiàn)目標(biāo)物體的查找,但是對(duì)于液體識(shí)別來說,其無法實(shí)現(xiàn)等厚度截面下的分析,所以采用如圖5(b)所示的最小外接矩形的方法實(shí)現(xiàn)容器定位。
圖5 矩形框方案示意
在簡(jiǎn)單場(chǎng)景下進(jìn)行試驗(yàn)可以發(fā)現(xiàn),最小外接矩形的方案對(duì)經(jīng)過二值化和形態(tài)學(xué)處理后的液體容器的定位準(zhǔn)確性較高(見圖6)。
圖6 簡(jiǎn)單場(chǎng)景下最小外接矩形試驗(yàn)方案
在基于去除容器壁厚的數(shù)學(xué)模型方法進(jìn)行處理后,不同液體的R值仍存在交叉,需要對(duì)其采用邏輯回歸模型與支持向量機(jī)模型進(jìn)行分類。
對(duì)于分類模型,為了避免參數(shù)在訓(xùn)練過程中過擬合的現(xiàn)象,在訓(xùn)練過程中會(huì)隨機(jī)選取80%的數(shù)據(jù)作為訓(xùn)練集,20%的數(shù)據(jù)作為驗(yàn)證集。在訓(xùn)練邏輯回歸模型上,首先在訓(xùn)練集上訓(xùn)練迭代幾次,得到一個(gè)模型參數(shù),再通過得到的模型參數(shù)對(duì)驗(yàn)證集進(jìn)行判別,并將判別結(jié)果反饋給模型,模型通過梯度下降的方法對(duì)參數(shù)進(jìn)行迭代優(yōu)化。執(zhí)行以上步驟多次,得到一個(gè)較為理想的模型參數(shù)作為邏輯回歸的參數(shù)值。對(duì)于支持向量機(jī),因?yàn)槟P褪腔跀?shù)學(xué)方法求解的唯一值,因此不需要進(jìn)行梯度下降的方法優(yōu)化。但為了能夠與邏輯回歸模型訓(xùn)練的結(jié)果進(jìn)行比對(duì),因此在選取數(shù)據(jù)中,選取同等訓(xùn)練數(shù)據(jù)值優(yōu)化支持向量機(jī)。
圖7為邏輯回歸模型、線性SVM(支持向量機(jī))以及非線性SVM在兩個(gè)γ值(支持向量機(jī)選擇高斯核函數(shù)作為內(nèi)核的一個(gè)參數(shù))下,二維數(shù)據(jù)(低能數(shù)據(jù)、R值)的分類結(jié)果。由圖7可以直觀地看出,支持向量機(jī)的分類效果在本該試驗(yàn)采集的樣本內(nèi)比邏輯回歸模型的效果更好,且對(duì)于非線性模型進(jìn)行非線性描述有更好的顯示結(jié)果。
圖7 分類模型可視化結(jié)果
危險(xiǎn)液體識(shí)別事件是一個(gè)二分類問題,其檢測(cè)結(jié)果存在4種情況,即TP(True Positive),F(xiàn)P(False Positive),F(xiàn)N(False Negative),TN(True Negative)。TP是指將危險(xiǎn)液體正確識(shí)別;FP是指將危險(xiǎn)液體錯(cuò)誤識(shí)別為非危險(xiǎn)液體;FN是將非危險(xiǎn)液體錯(cuò)誤識(shí)別為危險(xiǎn)液體;TN是正確識(shí)別非危險(xiǎn)液體。假定危險(xiǎn)液體判定為1,非危險(xiǎn)液體判定為0,該4種情況如表1所示。
表1 二分類問題判定情況
表中FN為誤報(bào)情況,F(xiàn)P為漏報(bào)情況。查準(zhǔn)率=TP/(TP+FP),代表在所有判定為1的樣本中實(shí)際為1的正確率。查全率=TP/(TP+FN),代表所有實(shí)際為1的樣本中被判定為1的正確率。
通過查準(zhǔn)率和查全率可以得到PR曲線(查準(zhǔn)率-查全率曲線),查準(zhǔn)率與查全率一般呈負(fù)相關(guān),即一個(gè)指標(biāo)高時(shí)另一個(gè)指標(biāo)偏低。所以,根據(jù)PR曲線包圍的面積大小可以定性判斷結(jié)果的準(zhǔn)確性。定義該面積為AP,AP越大,表明判定準(zhǔn)確率越高。如圖8所示,邏輯回歸模型的AP值小于支持向量機(jī)。
圖8 不同模型PR曲線對(duì)比
ROC曲線(Receiver Operating Characteristic Curve,接收者操作特征曲線)利用混淆矩陣派生假正率和真正率兩個(gè)度量,并用這兩個(gè)度量作為橫縱坐標(biāo),生成ROC空間。其中,ROC曲線下方面積值為分類模型的AUC(ROC曲線下的面積)值。在模型評(píng)比中,通常利用AUC作為衡量分類器性能的度量,隨機(jī)效果對(duì)應(yīng)的AUC值為0.5,若數(shù)值小于0.5,需要考慮數(shù)據(jù)之間清洗以及替換其他模型,AUC值越接近1,就表示對(duì)應(yīng)的分類模型的效果越好。不同模型和ROC曲線如圖9所示,邏輯回歸模型的AUC值小于支持向量機(jī)模型的。
圖9 不同模型ROC曲線對(duì)比
液體識(shí)別算法流程圖如圖10所示,在對(duì)得到的雙能X射線高低能圖像進(jìn)行濾波、二值化、形態(tài)學(xué)處理后,獲取液體容器的最小外接矩形,然后根據(jù)高低能數(shù)據(jù),利用R值識(shí)別算法,對(duì)無托盤等遮擋物場(chǎng)景下的危險(xiǎn)液體進(jìn)行識(shí)別。設(shè)置了兩種場(chǎng)景,其識(shí)別信息如表2所示。
圖10 液體識(shí)別算法流程圖
表2 無遮擋物場(chǎng)景識(shí)別信息
簡(jiǎn)單場(chǎng)景識(shí)別結(jié)果如圖11所示(自上而下分別為容器1,2,3,4,紅色邊框表示識(shí)別為危險(xiǎn)液體)。
圖11 簡(jiǎn)單場(chǎng)景識(shí)別結(jié)果
對(duì)市面上存在的U型探測(cè)器和L型探測(cè)器分別進(jìn)行779次和740次采樣(總計(jì)1 519次采樣數(shù)據(jù)),采用兩種模型和R值分類模型進(jìn)行評(píng)估,得到的評(píng)估結(jié)果如表3所示。
表3 各種分類模型評(píng)估結(jié)果
根據(jù)表3,可以發(fā)現(xiàn)支持向量機(jī)模型對(duì)雙能X射線危險(xiǎn)液體的識(shí)別表現(xiàn)較好,能夠?qū)崿F(xiàn)較高的識(shí)別準(zhǔn)確度,精確度能夠達(dá)到80%以上。
根據(jù)圖11可以發(fā)現(xiàn),筆者提出的數(shù)學(xué)模型可以在一定程度上去除容器壁厚對(duì)識(shí)別結(jié)果的影響,經(jīng)過中值濾波、二值化、形態(tài)學(xué)處理后,根據(jù)高低能圖像能夠利用最小外接矩陣得到液體容器的精確定位,從而得到液體的R值的原理,實(shí)現(xiàn)了對(duì)液體的識(shí)別。支持向量機(jī)模型和邏輯回歸模型均能夠利用物體的三維信息(高能、低能、R值)對(duì)液體進(jìn)行特征提取后分類,而支持向量機(jī)模型對(duì)于文章研究的對(duì)象具有更好的分類效果。
然而,去除容器壁厚的方法是在容器壁厚均勻的前提下建立的,對(duì)于不均勻壁厚的容器容易出現(xiàn)誤檢、漏檢,而現(xiàn)實(shí)中極有可能存在壁厚不均勻的情況,在此方面需要進(jìn)一步完善模型。另外,由于現(xiàn)實(shí)中液體容器所處的環(huán)境復(fù)雜,其他物體的遮擋對(duì)于判別結(jié)果的影響也需要作進(jìn)一步考慮。