張 科
(東華大學 計算機科學與技術學院, 上海 201620 )
物聯(lián)網(wǎng)設備的普及為人們的生活帶來了便利,但同時存在嚴重的安全風險。因此,安全的身份驗證系統(tǒng)對于物聯(lián)網(wǎng)設備至關重要。與指紋和面部識別相比,虹膜識別系統(tǒng)更加安全,在認證過程中不需要接觸。因此,虹膜識別是物聯(lián)網(wǎng)設備的理想安全認證方法。傳統(tǒng)的虹膜識別需要在近紅外照明下并且用戶高度合作的環(huán)境下獲取虹膜圖像。然而,對于物聯(lián)網(wǎng)設備的認證,虹膜識別通常需要在不受控制的環(huán)境條件下完成,這給虹膜識別技術提出了嚴峻的挑戰(zhàn)。
虹膜分割是一種從人眼圖像中定位虹膜區(qū)域和非虹膜區(qū)域的方法。該方法將生成一個相應的虹膜分類圖像,為虹膜識別提供虹膜特征區(qū)域的位置信息。虹膜圖像分割的效果會影響虹膜特征選擇的正確性,進而直接影響最終虹膜識別的性能。對于在不可控的環(huán)境中獲取的非理想人眼圖像,虹膜分割會受到大量環(huán)境噪聲的影響,其中包括:光照條件、運動模糊、鏡面反射等,導致傳統(tǒng)的虹膜分割算法無法完成準確的虹膜定位。
近年來,相關研究者對非理想虹膜圖像的分割技術進行了深入研究。先前的工作主要使用與圖像處理相關的技術,基于諸如梯度和幾何關系等特征來檢索圖像中的虹膜區(qū)域,并使用曲線來擬合虹膜的輪廓。通過這種方式,提出了一種基于改進的快速霍夫變換的抗噪虹膜分割方法,并采用多弧多線虹膜邊界策略來定義虹膜邊界[1]。隨后,一種使用橢圓擬合瞳孔和邊緣邊界的分割方法也被用于檢測非理想虹膜圖像的虹膜區(qū)域[2]。除了使用橢圓擬合邊界之外,其它方法還使用幾何活動輪廓來細化虹膜邊界,并且通過打開操作來抑制睫毛噪聲[3]。這些基于圖像處理的改進的分割方法具有一定的抗噪能力,但處理噪聲干擾的效果有限,分割效果不理想。
為了降低虹膜識別系統(tǒng)的環(huán)境要求并在物聯(lián)網(wǎng)設備上實現(xiàn)快速準確的虹膜識別,研究提出了一種基于深度學習的輕量級的虹膜分割模型。在訓練好虹膜分割模型后,該分割模型可以快速地產(chǎn)生非理想虹膜圖像的分割預測,適合虹膜識別在物聯(lián)網(wǎng)設備上的部署。
早期的虹膜分割方法通常針對在理想環(huán)境中獲取的理想虹膜圖像。 霍夫變換用于從虹膜圖像中檢測圓形邊界,然后基于虹膜或瞳孔半徑的約束進行邊緣圖投票以確定虹膜圖像邊界[4]。 由于基于霍夫變換的圓形檢測方法不夠穩(wěn)定,因此使用積分微分算子的新方法也可用于檢測圖像中的圓形虹膜邊界[5]。 后來,Huang等人[6]提出了一種基于徑向抑制邊緣檢測的虹膜分割方法,以提高精度。研究中通過使用小波變換來提取虹膜圖像的小波變換模量。 根據(jù)設計的徑向非最大抑制方法,保留環(huán)形邊緣,并移除徑向邊緣。 最后,閾值邊緣處理用于去除孤立邊緣并生成二值分割圖像。
后續(xù)的工作注意到虹膜分割上的噪聲引起的干擾,并開始研究非理想條件下的虹膜分割。即有學者設計了一種新穎的噪聲檢測模型以實現(xiàn)準確的虹膜分割。在模型中,通過使用3種條件確定睫毛中的像素,從而解決了反射噪聲的干擾[7]??紤]到由2個圓形邊緣檢測引起的誤差,執(zhí)行Adaboost眼檢測用來做補償?;陬伾姆指罘椒ㄓ糜诮鉀Q重影效果噪聲,并執(zhí)行眼瞼和睫毛檢測以減少誤差[8]。為了更準確地擬合虹膜邊界,出現(xiàn)了一些使用靈活輪廓線的方法?;顒虞喞€可以適應各種形狀并同時分割多對象,從而進一步提高分割的準確性和效率[9]??紤]到噪聲的影響,Amjed等人[10]提出了一種基于加權自適應霍夫變換的虹膜分割方法。模糊邏輯隸屬度函數(shù)被用于在明暗區(qū)域之間定界并增強對比度,繼而使用加權自適應霍夫變換完成虹膜分割。
在本節(jié)中,將詳細描述研究設計的對于非理想虹膜圖像的虹膜分割模型。研究詳情如下。
非理想虹膜圖像中邊界和梯度特征的細微差異對虹膜分割方法產(chǎn)生了嚴峻的考驗。僅使用基于梯度和幾何關系的圖像處理技術很難應對復雜的噪聲干擾。但是,卷積神經(jīng)網(wǎng)絡具有強大的特征提取能力,可以學習從大量數(shù)據(jù)中識別虹膜區(qū)域。本次研究使用卷積神經(jīng)網(wǎng)絡作為非理想虹膜圖像的分割模型。在虹膜圖像分割任務中,研究會利用預測虹膜像素和真實虹膜像素之間的差異構造損失函數(shù)。具體地,使用U-Net[11]的結構作為虹膜分割的骨干網(wǎng)絡。 U-Net在上采樣過程中使用級聯(lián)結構將淺層特征與深層特征相結合。其中,網(wǎng)絡使用較深的特征用于定位虹膜區(qū)域,而較淺的特征用于精確分割,從而在非理想虹膜圖形分割過程中產(chǎn)生更精確分割結果。
在分割損失時,研究會使用二進制交叉熵損失項來表示虹膜分割的損失項L,對虹膜分割損失的數(shù)學定義可表示為:
L=-Ex,y[ylogS(x)+(1-y)log(1-S(x))].
(1)
其中,S(x)表示在給定大小為H×W×3的輸入虹膜圖像x的情況下,分割模型生成的2個大小為H×W×2的類的類概率圖。 這里會使用分割損失來鼓勵分割模型正確預測虹膜區(qū)域的像素位置,并對模型進行訓練以最小化損失函數(shù)。
本次研究的虹膜分割模型基于U-Net的網(wǎng)絡結構,采用了具有skip connection的全卷積自編碼器的形式。 其中,編碼器由大小為3×3卷積組成(每層僅使用一個卷積),每個卷積層后將續(xù)接一個整流線性單元(ReLU)和步幅為2且大小為2×2 的最大池化操作。解碼器是先對特征圖進行上采樣,再進行2×2卷積,從收縮路徑與相應裁剪的特征圖進行拼接,再經(jīng)過3×3卷積,并通過ReLU激活函數(shù)。
本節(jié)重點討論了實驗的實驗細節(jié)和實驗結果。 對此擬展開研究論述如下。
(1)CASIA v4 Interval。 該數(shù)據(jù)庫是NLPR Lab提供的CASIA Iris圖像數(shù)據(jù)庫的子集。 其中包含來自249個主題的2 639個虹膜圖像,圖像分辨率為320 * 280。 該數(shù)據(jù)集是通過配備圓形近紅外光 LED陣列并具有適當通光量的相機獲得的。 由于此數(shù)據(jù)集中缺少相應的真實分割標簽,研究時使用由WaveLab生成的EP數(shù)據(jù)集,其中包含了CASIA v4虹膜數(shù)據(jù)集的真實分割標簽。
(2)Perturbed CASIA v4 Interval。 為了獲得非理想的虹膜數(shù)據(jù)集,文中使用了Shabab研究中提出的增強方法[12]。 這種增強方法通過降低眼窩分辨率,降低圖像對比度、陰影圖像和圖像模糊,來模擬在現(xiàn)實環(huán)境中獲取的非理想虹膜圖像。研究時會在擾動的數(shù)據(jù)集上進行訓練和測試,以驗證該方法在非理想虹膜圖像中的性能。
文中選擇了多種評估指標來分析所提出的非理想虹膜圖像分割方法的性能。 對于評估指標的研究,本文給出闡釋分述如下。
(1)錯誤率: 參考NICE I競賽的評估標準來衡量本文提出的分割方法的性能。錯誤率的定義表示如下:
(2)
其中,TP、TN、FP、FN分別代表真陽例、真反例、假正例、假反例。
(2)交并比:通常用于評估目標檢測任務中預測的準確性。 在這里,使用交并比來衡量分割預測和真實分割標簽之間的差異。 交并比的定義表示如下:
(3)
(3)F1分數(shù):這是統(tǒng)計學中用于衡量分類模型準確性的指標。 該指標同時考慮了分類模型的準確性和召回率。F1分數(shù)的定義表示如下:
(4)
文中的網(wǎng)絡模型在TensorFlow中實現(xiàn),通過使用Adam優(yōu)化算法進行了訓練,其動量值為0.99。繼而使用隨機正態(tài)分布初始化來初始化網(wǎng)絡的權重。 在實驗中,批處理大小設置為10。前10個學習周期的學習率為0.0001,在接下來的10個學習周期中,學習率線性降低為0。 GTX1080Ti GPU服務器用于訓練網(wǎng)絡。對于所有數(shù)據(jù)集,會將數(shù)據(jù)的20%用作測試,60%用作訓練,剩余的20%作為驗證部分。為了彌補數(shù)據(jù)的不足,研究通過水平翻轉數(shù)據(jù)集來進行數(shù)據(jù)擴充。 此外,還會將輸入圖像縮放成128 * 96的大小并送入分割網(wǎng)絡中,以使不同虹膜數(shù)據(jù)集的圖像大小保持一致。
為了將文中方法的分割結果與其他方法進行比較,研究選擇了2種最新的虹膜分割方法,包括虹膜識別系統(tǒng)OSIRIS v4.1[13]和虹膜分割框架IrisSeg[14]。 OSIRIS是集成了多種圖像處理方法的開源虹膜識別框架。 在實驗中,僅使用其虹膜分割模塊,并將其應用于具有非理想虹膜圖像的數(shù)據(jù)集。 為了確保OSIRIS的性能不受無關因素的影響,在實驗前則將虹膜半徑的最大和最小參數(shù)設置為適當?shù)闹怠?IrisSeg是用于非理想虹膜圖像的分割框架。 在實驗中,將直接使用該框架對2個不同的數(shù)據(jù)集進行測試。
在對比實驗中,該方法分別在2個數(shù)據(jù)集中進行了訓練和測試。在此基礎上,將測試集上的分割結果與其它兩種方法進行定量比較,并通過將結果與3個評估指標進行比較來證明該方法的分割性能。2個數(shù)據(jù)集的實驗比較結果見表1、表2。由表1、表2中可以看出,本文提出的方法對擾動的CASIA數(shù)據(jù)集實現(xiàn)了最佳分割效果,并且該方法的3個指標的結果明顯高于其他兩種方法。盡管在CASIA數(shù)據(jù)集上的分割結果比IrisSeg差,但分析后可以發(fā)現(xiàn)兩者之間的差異僅為1%。因此,結果表明本文的方法在分割非理想虹膜圖像方面具有顯著的優(yōu)勢,并且在理想虹膜圖像的分割中表現(xiàn)出良好的性能。此外,還計算了每個指標上的分割結果的標準差。從結果的分析對比中可以看出,本文的方法的標準偏差在所有2個數(shù)據(jù)集中都是最低的,這表明本文方法的性能是最穩(wěn)定的。與其它兩種方法不同,本文的方法沒有產(chǎn)生很多差的分割結果。
表1 CASIA虹膜數(shù)據(jù)集的定量對比結果
表2 Perturbed CASIA虹膜數(shù)據(jù)集的定量對比結果
Tab. 2 The quantitative comparision results on Perturbed CASIA dataset
%
此外,研究還繪制了實驗結果的CDF圖如圖1、圖2所示。與先前的結論類似,本文的方法在CASIA數(shù)據(jù)集上比IrisSeg稍差,但在非理想虹膜數(shù)據(jù)集上卻獲得了最佳結果。 這也展示了本次研究在處理非理想虹膜圖像方面的優(yōu)勢。
(a) (b) (c)
(a) (b) (c)
在本文中,研究提出了一種基于深度學習的虹膜分割模型,該模型有助于在物聯(lián)網(wǎng)設備上部署虹膜識別驗證系統(tǒng)。 本文所設計的虹膜分割網(wǎng)絡可以實現(xiàn)對非理想虹膜圖像準確、快速的分割,能夠有效地應對虹膜分割過程中環(huán)境噪聲的干擾。 通過在2個虹膜數(shù)據(jù)集上進行的大量實驗結果表明,本文的虹膜分割模型可實現(xiàn)頂尖的分割性能,并且提高了虹膜識別系統(tǒng)的可用性,促進了虹膜識別系統(tǒng)在物聯(lián)網(wǎng)設備上的部署。