魏婷婷,林 楠,曹仰杰,魏君飛,楊 聰
1(鄭州大學(xué) 軟件學(xué)院,鄭州 450002) 2(鄭州大學(xué) 漢威物聯(lián)網(wǎng)研究院,鄭州 450002)
近年來,隨著一些惡性交通事故的發(fā)生,使“毒駕”這一民眾所不了解的高危駕駛行為逐漸進(jìn)入到公眾的視野當(dāng)中.“毒駕”(Drug-driving)是指交通行為參與人在未完全戒斷毒癮、正在使用毒品或使用毒品后進(jìn)行機(jī)動車駕駛的行[1].“毒駕”行為隱蔽性高且社會危害性極大,目前,我國對由“毒駕”引發(fā)的道路交通事故尚無權(quán)威的統(tǒng)計數(shù)字,在國內(nèi)的相關(guān)報道中,2003-2005年,由“毒駕”引發(fā)的交通道路事故平均每年不足10起;2006-2008年,達(dá)到每年10~20起;2009年則上升至40起以上[2].2013-2016年,國內(nèi)媒體有關(guān)“毒駕”的報道分別為1940篇、4120篇、10400篇和13500篇,從近年相關(guān)報道反應(yīng)出,其造成的交通道路事故呈上升態(tài)勢[3].因此,對于“毒駕”行為的檢測,是避免其造成公民的人身和財產(chǎn)安全的重要措施.
毒品檢測標(biāo)準(zhǔn)方法包括氣相-質(zhì)譜聯(lián)用(GC-MS)[4]與液相-質(zhì)譜聯(lián)用技術(shù)(LC-MS)[5,6],這兩種技術(shù)相對比較成熟.此外,常見的毒品檢測方法還有色譜法[7]、光譜法[8]、免疫分析法[9,10]等方法,此類檢測方式需要使用大型專業(yè)儀器設(shè)備.對于實驗環(huán)境具有一定要求,因此面對復(fù)雜道路環(huán)境,這些方法雖然檢測準(zhǔn)確但無法適用于常規(guī)道路稽查.國內(nèi)對于機(jī)動車駕駛者的毒駕檢測主要采用血液檢測、尿液檢測和唾液檢測3種方式,如表1所示.相較于另外兩種方式,唾液檢測在毒檢道路現(xiàn)場更為普遍.唾液檢測采用的試紙檢測方式,只需將待檢測物質(zhì)與試紙反應(yīng)區(qū)接觸即可完成檢測,具有成本低、靈敏度高、方便快捷等特點.但在實際研究和應(yīng)用中其試紙判斷方式存在不足.目前毒駕道路檢測中對唾檢試紙的常用判斷方式為目測法,目測法進(jìn)行試紙反應(yīng)色域的識別,會受到環(huán)境影響及人眼顏色識別的差異,且唾液檢紙體積較小,其有效試紙前景區(qū)域面積為15mm×15mm,僅僅依靠目測,檢測結(jié)果缺乏準(zhǔn)確性.
表1 國內(nèi)常見機(jī)動車駕駛員毒駕檢測方式對比Table 1 Comparison of common driving test methods for motor vehicle drivers in China
隨著移動設(shè)備的普及以及圖像識別技術(shù)的發(fā)展,使得利用手機(jī)、相機(jī)等攝像設(shè)備結(jié)合機(jī)器學(xué)習(xí)等方法,形成一種更加高效便捷的毒駕識別方式成為了可能.首先,利用攝像頭采集毒檢試紙,經(jīng)轉(zhuǎn)換后存儲為圖片格式,之后從試紙圖像上提取色塊信息經(jīng)過數(shù)字信號處理后,對數(shù)據(jù)進(jìn)行分類,最終得出檢測結(jié)果.但在實際毒駕檢測試紙圖像成像過程中,存在以下問題:
1)由于攝影設(shè)備、環(huán)境光照、色溫等影響,造成圖像目標(biāo)與背景對比度較低、噪聲較高、陰影干擾以及邊緣模糊的問題,對于毒駕試紙圖像的識別檢測造成影響.
2)試紙圖像弱邊緣化.當(dāng)待檢測物質(zhì)濃度處于臨界范圍內(nèi),試紙條顯色區(qū)域呈現(xiàn)的色塊顏色較淺,且形狀不規(guī)則,呈現(xiàn)試紙色域邊界弱邊緣化,對判斷色域是否存在產(chǎn)生影響.
針對上述問題,本文提出一種面向弱邊緣毒駕唾檢試紙圖像識別方法DrugChecking,旨在實現(xiàn)對采集到的毒駕唾檢試紙圖像進(jìn)行識別,并對所屬毒品類別進(jìn)行準(zhǔn)確分類.本文使用多顏色空間信息和機(jī)器學(xué)習(xí)方式,在真實毒駕唾檢試紙圖像數(shù)據(jù)集中進(jìn)行驗證,試驗結(jié)果表明,DrugChecking在高效準(zhǔn)確分割弱邊緣試紙圖像的同時能夠?qū)崿F(xiàn)對毒品的精確分類,為常規(guī)道路毒駕稽查提供了準(zhǔn)確有效的識別方式.
本節(jié)將重點介紹DrugChecking的整體流程,如圖1所示為毒駕唾檢試紙圖像的整體識別流程.首先,對原始圖像進(jìn)行預(yù)處理,使用邊緣檢測、投影變換等方式獲得試紙前景區(qū)域圖像,之后結(jié)合多顏色空間下不同圖像信息,進(jìn)行前景圖像的試紙分割,獲得原始圖像中的試紙圖像,采用PCA對試紙圖像進(jìn)行降維處理,并對降維后的數(shù)據(jù)進(jìn)行分類,從而獲得毒駕試紙中毒品所屬類別.
圖1 DrugChecking毒駕試紙檢測流程圖Fig.1 Flow chart of drug driving test strip image detection
原始毒駕唾檢試紙圖像中包含大量圖像信息,首先對圖像進(jìn)行預(yù)處理,排除干擾信息,鎖定試紙前景區(qū)域,不僅能減少設(shè)備計算量,也能避免由干擾信息引起的分類錯誤.邊緣檢測是圖像處理領(lǐng)域的重要技術(shù),是計算機(jī)視覺尤其是特征檢測和提取的基本工具.傳統(tǒng)的邊緣檢測算法一階包括Prewitt算子、Sobel算子[11]、Roberts算子,二階包括Laplace算子、LOG算子等.通常,這類算子以導(dǎo)數(shù)極大值點或過零點作為候選邊緣點,根據(jù)有效閾值,得到圖像邊緣.此類算子操作簡單、運算速度較快,但噪聲對該類算子影響較大,抗干擾能力弱,例如:LOG算子常產(chǎn)生雙邊界,Sobel算子易形成不閉合的區(qū)域,導(dǎo)致圖像邊緣不夠精準(zhǔn).而Canny算子[12]是最佳階梯型邊緣檢測算法,信噪比大且邊緣檢測精度高.
本文基于算法復(fù)雜度以及實際應(yīng)用效果考慮,采用Canny算子進(jìn)行圖像邊緣的獲取.由于采集到原始圖像邊緣存在無關(guān)信息干擾,如圖2(b)為原始圖像經(jīng)過邊緣檢測后所得圖像,因此,為獲得原始圖像中試紙前景圖像,選取邊緣圖像中的最大連通區(qū)域,從而排除其他無關(guān)圖像信息.首先在獲得的邊緣圖像中搜索所有連通域,從中尋找所需最大連通域(圖2(c))的位置,獲得試紙前景區(qū)域(圖2(d))并從原始圖像中裁剪得到圖2(e)試紙前景圖像,將圖像數(shù)據(jù)量由1920×2560×3減少至480×480×3,識別結(jié)果如圖2所示.
圖2 試紙前景圖像獲取示意圖Fig.2 Schematic diagram of obtaining test strip foreground image
試紙前景圖像四邊形角點位置由中點以及圖形所在點間距離決定,即圖2(d)中標(biāo)記區(qū)域.設(shè)Cj(j=1,2,3,4)為四邊形角點,Oi為四邊形中點,Pi表示最大連通域中坐標(biāo)點,Pi∈{[x1,y1],[x2,y2],…,[xn,yn]},其中i=1,2,…,n.角點Cj的輸出定義如公式(1)所示.根據(jù)得到的4個角點,對圖像裁剪獲得試紙前景圖像.
Cj=Max[(Pi-O0)(Pi-O0)T]
(1)
毒駕唾檢試紙圖像由于在成像過程中容易收到光照、色溫等影響,圖像中產(chǎn)生陰影、偽影等情況,同時試劑暈染模糊也會對試紙圖像的邊緣確定產(chǎn)生嚴(yán)重影響.常用的RGB顏色空間是面向硬件設(shè)備描述的顏色空間,通常攝像系統(tǒng)都是基于RGB顏色空間成像,但由于攝像設(shè)備所采集的圖像,存在由于設(shè)備物理性、環(huán)境高亮度比、色溫等諸多因素的影響,使得攝像得到的圖像與標(biāo)準(zhǔn)光照下比,會存在高噪聲、陰影、強(qiáng)度不均勻等情況,致使RGB顏色空間在描述物體色彩和計算處理方面不夠完全.HSV(Hue,Saturation,Value)顏色空間即色調(diào)、飽和度和亮度,3個分量相互獨立,受外界環(huán)境影響較小[13].因此將RGB顏色空間和HSV顏色空間的分量信息相結(jié)合,能夠從不同角度有效獲得所需試紙圖像特征信息.
將毒駕唾檢RGB圖像轉(zhuǎn)換到HSV顏色空間[14],圖像的各分量計算公式如下:
(2)
(3)
V=max(R,G,B)
(4)
式中,Cmax=max(R,G,B),Cmin=min(R,G,B),Δ=Cmax-Cmin.
本文采用RGB顏色空間中的B通道,HSV顏色空間中的H通道,以及由RGB顏色空間轉(zhuǎn)化所得灰度通道,共同構(gòu)建毒駕唾檢試紙圖像邊緣信息.B通道邊緣能夠擬合圖像的大部分邊緣,因此首先對B通道進(jìn)行形態(tài)學(xué)處理——膨脹,之后與其他通道進(jìn)行并運算,這樣既能保持原有圖像邊緣輪廓,又能通過其他通道補充邊緣信息.最后,進(jìn)行閉操作能夠消除狹窄的間斷和細(xì)長的鴻溝,使得圖像輪廓平滑,填補邊緣輪廓的斷裂,具體數(shù)學(xué)表達(dá)式[15]如下:
EB=A⊕B={x,y|Bxy?A}
(5)
E=EB∩EH∩Egray
(6)
E′=E·C=(E⊕C)?C
(7)
假設(shè)結(jié)構(gòu)元素B對集合A進(jìn)行操作,EB即為膨脹后B通道邊緣,E和E′分別表示進(jìn)行閉操作前后的試紙邊緣輪廓,EB,EH,Egray分別表示B通道、H通道和灰度通道的邊緣輪廓,最終得到試紙邊緣輪廓E′.
根據(jù)試紙條邊緣為直線的特點,本文采用霍夫變換對圖像進(jìn)行直線檢測,從每張前景圖像中可以得到3張毒駕試紙圖像.Hough變換[16]的參數(shù)方程如下所示:
ρ=xcosθ+ysinθ
(8)
用θ和ρ參數(shù)來描述直線,ρ表示原點到直線的垂直距離,θ表示該垂線與x軸的夾角.
霍夫變換通??梢栽趫D像中尋找到所需形狀曲線,根據(jù)曲線信息進(jìn)行下一步圖像處理.從原始圖像中獲取試紙前景圖像后,采用霍夫變換直線檢測,圖3(a)即為采用霍夫直線檢測結(jié)果,霍夫變換的基本方法[16]:用圖像空間的邊緣數(shù)據(jù)點計算參數(shù)空間中的參數(shù)點的可能軌跡,并在一個累加器中給計算出參考點的計數(shù),最后選出符合條件的峰值,該峰值由ρ和θ決定,則在對應(yīng)到圖像空間中滿足該式的點(x,y)就組成該直線.得到所需試紙邊緣信息之后,裁剪獲得試紙圖像,圖3(b)為裁剪后試紙圖像.
圖3 毒駕圖像中試紙條區(qū)域的提取Fig.3 Images of drug driving test strips
直接對唾檢試紙圖像進(jìn)行分類會耗費大量計算資源,通過對圖像進(jìn)行降維處理能夠有效提升處理速度.主成分分析(PCA)是一種利用從高維到低微的降維思想,是從高維的可觀測顯示變量中獲取信息,組成低維不可直接觀測的隱式變量.PCA[17]通過K-L變換,使用盡可能少的低維主成分代替之前高維數(shù)據(jù)信息,計算公式見式(9)-式(14).假設(shè)每張試紙圖像數(shù)據(jù)樣本矩陣為{x1,x2,…,xm},首先將數(shù)據(jù)樣本進(jìn)行中心化處理,取每個特征的均值:
(9)
(10)
從樣本特征中提取主要成分,進(jìn)行數(shù)據(jù)降維.需要計算樣本集的協(xié)方差矩陣,并使用SVD函數(shù)進(jìn)行數(shù)據(jù)計算:
(11)
[U,Λ,V]=svd(∑)
(12)
式中,∑表示樣本x的協(xié)方差矩陣,由∑計算可得樣本x的特征值和特征向量,特征值Λ=[λ1,λ2,…,λp],特征向量U=[u1,u2,…,up],其特征值是遞減排列,可選取全部p維特征中的前n維特征作為主要成分,通常選取保留的能量百分比E為95%以上的特征維度,即:
(13)
最終降維后的樣本數(shù)據(jù)為:
xPCA=[u1,u2,…,un]Td
(14)
本文480×100×3將維的分割所得試紙圖像,經(jīng)過PCA降維,成為480×1維數(shù)據(jù),由于降維后第一主成分的能量百分比為98.7376%,因此,使用第一主成分即可代表該圖像主要數(shù)據(jù),部分降維結(jié)果圖4所示:
圖4 部分試紙圖像降維結(jié)果示意圖Fig.4 Schematic diagram of PCA results of test strip images
從圖4可以看出,降維后圖像存在不同數(shù)目的峰值,峰值高低與圖像的明暗度和色塊顏色強(qiáng)弱有關(guān),而峰值個數(shù)則與試紙條圖像中色塊數(shù)目相對應(yīng),如圖4左上圖中,峰值與試紙色塊均為2,右上圖中峰值與試紙色塊均為1.因此,降維后的數(shù)據(jù)能夠有效代表原始圖片.
支持向量機(jī)(Support Vector Machine,SVM)[18]是機(jī)器學(xué)習(xí)中適用于小樣本數(shù)據(jù)的有效分類方法,通過構(gòu)造最優(yōu)超平面從而對未知樣本進(jìn)行分類.針對毒駕檢測試紙的小樣本性以及樣本特點,本文選用機(jī)器學(xué)習(xí)支持向量機(jī)對試紙毒品進(jìn)行分類.SVM對于解決小樣本非線性的高維數(shù)據(jù)識別中具有很好的準(zhǔn)確率和泛化能力.非線性的支持向量機(jī)學(xué)習(xí)算法[19]如下:
輸入:訓(xùn)練數(shù)據(jù)集T={(x1,y1),(x2,y2),…,(xN,yN)},其中,xi∈Rn,yi∈{+1,-1},i=1,2,…,N;
輸出:分離超平面和分類決策函數(shù)f(x)
步驟1.選取合適的核函數(shù)K(x,z)和懲罰參數(shù)C>0;
步驟2.構(gòu)造并求解凸優(yōu)化問題
(15)
(16)
0≤ai≤C,i=1,2,…,N
得到最優(yōu)解:
(17)
(18)
步驟4.構(gòu)造決策函數(shù)
(19)
式中,sgn()表示符號函數(shù).
SVM中常用核函數(shù)包括:線性核函數(shù)(Liner Kernel,Linear)、多項式核函數(shù)(Polynomial Kernal,Poly)、Sigmoid核函數(shù)、徑向核函數(shù)(Radical Basis Function,RBF),其表達(dá)式分別為:
K(y,yi)Linear=yyi
(20)
K(y,yi)Poly=(yyi+1)d
(21)
K(y,yi)Sigmoid=tanh(k(yyi)+θ)
(22)
K(y,yi)RBF=exp(-‖y-yi‖2/(2σ2))
(23)
針對不同數(shù)據(jù),核函數(shù)的選擇對于分類的準(zhǔn)確性具有重大影響,經(jīng)試驗,Poly核函數(shù)對于毒品試紙的正確分類具有顯著效果.在使用SVM進(jìn)行樣本分類時,由于絕大數(shù)問題都是非線性問題,因此需要選用合適的核函數(shù)K(y,yi)將輸入向量由低維映射到高維特征空間,由非線性變?yōu)榫€性可分的數(shù)據(jù)向量.
本文實驗采用64位Windows10操作系統(tǒng),處理器為Intel(R)Core(TM)i7-8700,內(nèi)存為16.0 GB,整體實驗流程基于Matlab實現(xiàn).
本文所使用的毒駕檢測試紙圖像均是真實場景下常規(guī)道路稽查環(huán)節(jié)檢測所得圖像,共包括1920×2560×3尺寸的247張原始圖片,經(jīng)過圖片分割處理后獲得741張480×100×3尺寸的試紙圖像,按照試紙圖像中色塊位置的不同分為5個類別,類別信息如表2所示.
表2 毒駕試紙原始類別信息Table 2 Type information of drug driving test strips
每張試紙包含3個色塊,從上而下分別代表色塊有效性、毒品A和毒品B,為了類別標(biāo)記的便捷性,我們將色塊的有無分別用1和0表示,組成5種類別,包括000,100,110,111和101,如圖5所示.000表示該試紙檢測無效;100表示試紙檢測有效,并且不存在毒品A和B;110表示試紙有效且存在毒品A,不存在毒品B;111表示試紙有效,同時毒品A和B都已檢測到;101表示試紙有效,不存在毒品A,存在毒品B.
在分類后的試紙數(shù)據(jù)中,類別之間樣本數(shù)量差距較大,類別3和類別4較多,而類別0、1、2則遠(yuǎn)遠(yuǎn)小于其樣本數(shù)量,存在嚴(yán)重數(shù)據(jù)不平衡現(xiàn)象,影響后續(xù)SVM的樣本分類,造成分類精確度下降.目前解決樣本數(shù)據(jù)不平衡問題的方法主要有加權(quán)法、采樣法以及對原始數(shù)據(jù)增加噪聲擴(kuò)大樣本量等方法[20,21].本文通過在原始圖像中加入均值為0,方差為0.025的高斯噪聲,將類別0、1、2進(jìn)行數(shù)據(jù)擴(kuò)充,數(shù)據(jù)擴(kuò)充后信息如表3所示,使得每個類別的樣本數(shù)據(jù)量處于均衡狀態(tài),這樣不僅增加了訓(xùn)練樣本量,解決數(shù)據(jù)不平衡問題,也增強(qiáng)了算法分類的魯棒性.
圖5 試紙類別示意圖Fig.5 Different types of test strips
表3 毒駕試紙數(shù)據(jù)擴(kuò)充類別信息Table 3 Drug driving test strip data extended category information
在機(jī)器學(xué)習(xí)方法中,分類模型的評價指標(biāo)通常為準(zhǔn)確率(Accuracy,Acc)、精準(zhǔn)率(Precision,Pre)、召回率(Recall)、綜合評價指標(biāo)F1-Score(F1),各評價指標(biāo)所使用的樣本數(shù)據(jù)類別如表4所示.Acc表示該算法所有分類正確的樣本占所有數(shù)據(jù)樣本的比率,則Acc越高,代表該算法檢測出數(shù)據(jù)樣本真實情況的能力越強(qiáng).Pre和Recall都表示在不同分類情況下對該類別的判斷能力,Pre和Recall數(shù)值越高,則該算法對該類別的分類能力越強(qiáng).各項評價指標(biāo)如下所示:
表4 樣本數(shù)據(jù)類別表Table 4 Sample data category Table
(24)
(25)
(26)
(27)
3.4.1 試紙區(qū)域識別
為了從原始圖像中得到所需唾檢試紙圖像,通常選用RGB顏色空間或?qū)⒉噬珗D像轉(zhuǎn)化為灰度圖,進(jìn)行邊緣信息提取.由于毒駕檢測圖像中干擾信息較多,存在陰影、偽影以及顏色暈染等情況,使得在RGB顏色空間下無法獲得準(zhǔn)確邊緣,從而影響后續(xù)圖像識別,各通道邊緣識別準(zhǔn)確率如表5所示.
表5 不同顏色通道的邊緣識別準(zhǔn)確率Table 5 Accuracy of edge recognition for different color channels
在圖6中,Green、Blue、Gray分別代表RGB圖像的G通道、B通道以及由RGB圖像轉(zhuǎn)化得到的灰度圖通道,圖6(a)中由于顏色暈染及陰影,導(dǎo)致3個通道均未正確檢測到試紙邊緣,在圖6(b)中只有B通道能夠準(zhǔn)確識別識別試紙邊緣.因此,本文采用HSV顏色空間中H通道,RGB顏色空間中B通道和灰度圖通道,從表5中看出,使用Green、Blue、Gray顏色通道進(jìn)行圖像分割,分割正確率分別為88%、98%和97%,利用3個通道所疊加的邊緣信息進(jìn)行分割,在目前數(shù)據(jù)集中分割正確率為100%,能夠高效準(zhǔn)確識別試紙邊緣,進(jìn)行試紙圖像分割.
圖6 不同顏色通道試紙邊緣識別示意圖Fig.6 Test strip edges with different color channels
3.4.2 試紙分類結(jié)果
本文實驗采用十折交叉驗證策略,將數(shù)據(jù)集分成10份,其中9份作為訓(xùn)練數(shù)據(jù),剩余1份作為測試數(shù)據(jù).交叉驗證重復(fù)10次實驗,綜合每次實驗得出的Acc,Pre,Recall和F1,計算平均值作為對模型整體性能的評估,避免隨機(jī)結(jié)果造成的影響.
對于機(jī)器學(xué)習(xí),數(shù)據(jù)集中樣本類別的數(shù)據(jù)不平衡會影響單個類別預(yù)測精度,導(dǎo)致模型整體性能下降.因此在數(shù)據(jù)預(yù)處理時,對原始圖像數(shù)據(jù)加入高斯噪聲,生成新的數(shù)據(jù)圖像,以平衡數(shù)據(jù)樣本類別.為了驗證數(shù)據(jù)擴(kuò)充前后,模型對不同樣本類別及整體分類性能,本文經(jīng)過一系列對比實驗,得到數(shù)據(jù)擴(kuò)充前后的各種模型指標(biāo)如表6所示.
表6 數(shù)據(jù)擴(kuò)充前后各指標(biāo)對比Table 6 Comparison of indicators before and after data expansion
根據(jù)表6看出,加入噪聲后的擴(kuò)充數(shù)據(jù),分類準(zhǔn)確率由0.946提升至0.9804,其余3種評價指標(biāo)的數(shù)值也明顯高于原始數(shù)據(jù).由于原始數(shù)據(jù)中某些類別數(shù)據(jù)較少,模型對該類別學(xué)習(xí)能力較弱,當(dāng)擴(kuò)大數(shù)據(jù)集后,豐富的信息,使模型做出更加準(zhǔn)確的判斷.實驗結(jié)果表明,使用該方法對數(shù)據(jù)集進(jìn)行擴(kuò)充能夠有效提高模型魯棒性,增強(qiáng)泛化能力.
此外,對于不同分類問題,不同核函數(shù)的選擇對SVM算法模型性能有不同影響.本文使用Linear、Poly、Sigmoid和RBF核函數(shù)進(jìn)行實驗對比,評價不同核函數(shù)對實驗分類,結(jié)果見表7.
表7 不同核函數(shù)的評價指標(biāo)對比Table 7 Comparison of evaluation indicators of different kernel functions
根據(jù)表7看出,采用Poly核函數(shù)進(jìn)行毒駕試紙分類,由于數(shù)據(jù)內(nèi)部關(guān)聯(lián)性,其各個指標(biāo)均高于另外3種核函數(shù),因此,在SVM進(jìn)行樣本分類時,本文選用Poly核函數(shù)能夠達(dá)到當(dāng)前最優(yōu)結(jié)果.
3.4.3 對比試驗
本文所提出的使用毒檢試紙圖像的DrugChecking與常用毒品檢測方法(GC-MS[4]、LC-MS[6])相比具有較低的檢測時間,能夠有效提高對駕駛員的毒駕檢測效率,不同檢測方式用時如表8所示.
表8 不同檢測方式所的檢測時間Table 8 Time taken for different detection methods
常規(guī)的毒品檢測方式CG-MS和LC-MS需要首先對采集到的唾液等試劑進(jìn)行多種預(yù)處理,之后由于試劑的不同導(dǎo)致所需反應(yīng)時間也有所差異,但整個檢測過程通常耗費較多時間.與試紙檢測的目測法相比,DrugChecking依然有更高的檢測效率.
3.4.4 模型分析
DrugChecking毒駕檢測試紙識別方法采用模塊化思想,降低算法耦合性,具有更高的靈活性和可擴(kuò)展性,為毒駕試紙檢測提供新的思路.當(dāng)該模型框架應(yīng)用于其他領(lǐng)域時,可以根據(jù)不同需求進(jìn)行模塊或算法的修改,例如顏色空間的選擇、主成分分析時特征維度的保留、分類算法的選擇等方面.
表9 不同類別試紙的識別準(zhǔn)確率Table 9 Recognition accuracy of different types of test strip
DrugChecking同樣具有較強(qiáng)的抗干擾性,對環(huán)境干擾和試紙污染都能夠有效處理.一方面,此算法是應(yīng)用于日常道路毒駕檢測,因此檢測環(huán)境的光照、天氣和溫度,所產(chǎn)生的高曝光、陰影、偽影等,都會對圖像的拍攝造成影響.另一方面,待檢測試劑與試紙的反應(yīng)不可避免的會產(chǎn)生色塊暈染情況.如圖6所示,陰影、偽影和色塊暈染對邊緣的識別具有影響.本文采用多顏色空間融合方式,HSV顏色空間能夠消除圖像中光線所造成的影響,而采用RGB顏色空間和灰度圖能夠排除試紙暈染帶來的干擾.本文采用的測試圖像包含此類干擾圖像,不同類別試紙的識別準(zhǔn)確率,如表9所示,DrugChecking對每個類別的試紙都具有較高的識別率.
本文針對毒駕唾檢試紙的特點,提出了一種簡潔、高效的試紙分類方法——DrugChecking.該方法在融合不同顏色空間下的試紙圖像邊緣信息基礎(chǔ)上,提取了毒駕唾檢試紙條區(qū)域,并對試紙條區(qū)域進(jìn)行降維分類,最終實現(xiàn)毒檢分類.本文針對毒駕唾檢試紙中樣本不平衡的問題,通過數(shù)據(jù)擴(kuò)充有效提高了模型魯棒性,并增強(qiáng)模型泛化能力.此外,經(jīng)試驗驗證,DrugChecking對于常規(guī)道路毒駕檢測具有穩(wěn)定的識別能力和良好的分類性能.在之后的工作中,將進(jìn)一步提高模型對毒駕唾檢試紙的識別準(zhǔn)確率,并加強(qiáng)對處于檢測閾值的弱色塊識別能力.