丁增喜 王旭 祁衛(wèi)煒
1.證件防偽公安部重點實驗室 2.公安部第一研究所
在各種人體生物特征中,指紋識別由于其具有唯一性、穩(wěn)定性、識別率高等特點,在目前使用的各種生物特征識別技術中成為最為成熟、最為廣泛的生物特征識別技術[1]。
指紋識別技術有兩種應用模式:一是1:1的認證,二是1:N的辨識。目前最多的應用場景是1:N辨識,尤其是在刑偵領域中,1:N辨識功能對于案件的偵破有著很大的幫助。對于指紋識別技術來說,無論1:1認證還是1:N辨識都是圍繞如何提高識別準確性和識別的速度來進行的,其研究內容包括指紋圖像增強、指紋特征提取、指紋特征匹配以及指紋分類等算法。而這些指紋識別算法無論是警用還是民用,都需要基于一定容量的指紋庫進行性能測試,指紋庫中數(shù)據組織的分布規(guī)則以及數(shù)據庫容量的大小都對指紋識別算法的性能產生一定的影響。此外,隨著指紋識別技術的大規(guī)模應用,國內外市場上指紋識別類產品種類越來越多,其性能指標、技術參數(shù)參差不齊,各種產品的宣傳往往偏重商業(yè)目的,這些問題為公安行業(yè)以及其他指紋識別技術應用部門在產品的選擇上造成了困難,迫切需要相關部門建立評價體系對指紋識別類產品進行客觀的性能評測,為應用部門提供科學合理的選擇依據。而指紋測試樣本庫是評測指紋識別算法性能的重要依據,只有基于大規(guī)模指紋測試樣本數(shù)據才能真實有效的完成指紋識別算法核心性能指標的評測[2]。如何合理、高效、快捷地完成指紋測試樣本的采集將是指紋測試評測首先面臨的重要問題,而完成這項工作需要解決測試庫建庫規(guī)則、采集設備接口、采集模式設計、系統(tǒng)架構方式等多個技術難題。
首先,需要確立測試樣本庫的建庫規(guī)則。我國幅員遼闊、人口眾多,是一個多民族聚居的地區(qū)。居民在聚居區(qū)域、民族、性別、年齡以及職業(yè)等多個方面具有一定的分布特點,這些因素對指紋的質量均具有一定程度的影響。因此在測試樣本庫建庫之前就要制定一套規(guī)則,使測試樣本庫中指紋的分布符合我國現(xiàn)有國情。
其次,近年來我國指紋生物特征技術發(fā)展迅速。市場上的采集設備品種繁多,接口類型千差萬別。各個廠家設備應用領域各不相同,應用方式千差萬別,采集設備的接口和采集的輸出結果也沒有得到統(tǒng)一。因此在采集前如果不能很好的統(tǒng)一接口和輸出結果,會為采集工作增添很多困難,也會為進一步影響指紋識別算法的評測工作。此外,由于采集系統(tǒng)需要同時掛接多款采集設備,在系統(tǒng)設計時還要確保多款采集設備在實時調用時互不影響。
最后,一般情況下指紋采集工作需在多個采集地點同時進行,因此在系統(tǒng)設計和采集方式選擇上如何讓工作人員能夠方便操作,實現(xiàn)快速、準確、高效地采集到符合要求的指紋樣本也是需要解決的問題。
從測試樣本庫建庫角度出發(fā),為了建立一套客觀、科學、完整的指紋應用技術評價體系,需要針對指紋應用人群分布特點采集特定人群的指紋樣本。以居民身份證指紋測試樣本庫建庫為例,該項工作目標為選出全國范圍應用的指紋識別算法,因此測試庫設計時,參考我國第六次全國人口普查數(shù)、《2009年度人力資源和社會保障事業(yè)發(fā)展統(tǒng)計公報》等文獻資料,編制建庫規(guī)則(如圖1所示)。測試庫建庫規(guī)則按照性別、產業(yè)、民族以及地域/環(huán)境等五個方面進行屬性劃分,其中年齡按照小于15歲、15-59歲以及大于等于60歲三個年齡段進行劃分。在職業(yè)上按照第一產業(yè)、第二產業(yè)以及第三產業(yè)三部分進行分類,這樣就很好地涵蓋了我國當前多種職業(yè),具有很好的代表性[3]。建庫樣本規(guī)則的確定為指紋測試樣本采集工作奠定了基礎。
針對指紋采集設備品種多、可選范圍大等情況,需參考市場占有率及設備試用情況,從各類指紋采集設備中選擇了最有代表性的產品用于樣本采集。為了統(tǒng)一指紋采集設備接口,便于將來系統(tǒng)調用,系統(tǒng)設計時需參考已得到廣泛應用的行業(yè)標準,例如《活體指紋圖像應用程序接口規(guī)范第1部分:采集設備》[4,5]、《指紋采集器接口規(guī)范》等,以用于指導和規(guī)范參與指紋測試樣本采集的采集設備動態(tài)庫接口,只有符合了該接口規(guī)范的采集設備才能夠接入采集系統(tǒng);通過這種方式能很好地解決采集設備接口不統(tǒng)一的問題。
在指紋測試樣本采集系統(tǒng)設計時,對指紋采集器廠家提供的接口文件格式,均要求以Windows動態(tài)庫格式提供。Windows動態(tài)庫格式是微軟提出的一種標準函數(shù)調用格式,它可以將共享的程序代碼編譯成獨立模塊以供調用,庫函數(shù)的任何修改都不對應用程序產生影響。通過對動態(tài)庫的動態(tài)調用,操作人員可以決定在何時加載和釋放指紋采集設備,使各個設備之間的加載和釋放不存在任何影響。在設計開發(fā)的時候,系統(tǒng)列出廠家設備名稱,通過選擇某個廠家,系統(tǒng)自動調用該廠家對應采集動態(tài)庫,激活設備進行指紋采集。而調用該動態(tài)庫時候,會自動釋放上次調用的動態(tài)庫,使多個設備在調用過程中互不影響。對采集設備按照統(tǒng)一的規(guī)則進行編號和命名,如圖2所示。
為了滿足指紋測試樣本的采集數(shù)量大、次數(shù)多、速度快、隨機性高等特點,在采集系統(tǒng)中設計了自動采集模式。廠家要根據自動采集函數(shù)接口要求,提供設備采集動態(tài)庫。系統(tǒng)對質量滿足基本要求的指紋圖像自動采集入庫保存。此外,為了防止在采集過程中有些指紋圖像由于傷病、磨損、脫皮等情況而導致無法自動采集的情況下,系統(tǒng)又提供了人工采集模式,可以實現(xiàn)人工手動實時采集指紋圖像并入庫保存。系統(tǒng)啟動成功并選取設備之后會自動進入自動采集模式,在規(guī)定的時間內自動采集按壓的手指指紋圖像,在系統(tǒng)連續(xù)采集規(guī)定數(shù)量的指紋圖像后由操作人員核驗采集圖像質量然后提交保存,采集界面如圖3所示。采集后在未提交前如果發(fā)現(xiàn)某一幅指紋圖像質量不符合基本要求,則實時選取該幅指紋圖像進行再次采集,而不用影響其他幾幅圖像。在采集過程中如果有些手指指紋圖像質量較差,指紋采集設備無法自動成功采集,可以選擇人工采集模式進行手動采集。通過人工采集模式可以強制采集一幅指紋圖像,從而確保了采集到的指紋測試樣本的真實性。
指紋測試樣本的采集可以采取多種系統(tǒng)架構方式,既可以聯(lián)網集中采集,也可以脫機移動采集。聯(lián)網集中采集將采集機器集中聯(lián)網,采集數(shù)據集中統(tǒng)一入庫。這種方式采集效率高、速度快,采集的指紋數(shù)據記錄編號連續(xù),便于后期處理。每次采集的指紋數(shù)據自動進入統(tǒng)一的數(shù)據庫,不需要后期的數(shù)據歸納整理。此外,每臺機器也可以不必掛接所有指紋采集設備,系統(tǒng)負荷壓力小,但是這種架構方式只適合采集地點固定、采集時間相對集中的情況。
而脫機移動采集方式卻可以在多個地點同時進行指紋測試樣本的采集。通過對采集設備的接口以及對設備采集庫提供方式進行統(tǒng)一,每臺采集系統(tǒng)均可以掛接所有指紋采集設備,并可以在采集設備間實時切換進行樣本采集。這樣每臺采集系統(tǒng)都可以成為一臺采集服務器,可以實現(xiàn)多臺采集系統(tǒng)在多個采集點進行集中采集,多臺采集系統(tǒng)之間互為冗余。這種采集方式存在的問題是要在采集前根據預先規(guī)定的采集人數(shù)需要事先為每個采集地區(qū)的分配采集編號范圍。在采集結束后需要對每臺機器中采集的數(shù)據進行整理集中。脫機移動采集方式如圖4所示。
此外,在采集質量上控制上,通過培訓講解和實際操作等方式,使操作人員快速掌握指紋測試樣本采集系統(tǒng)的使用,避免由于主觀因素而導致采集指紋測試樣本圖像下降的問題。圖5給出了幾種不合格指紋圖像的情況,如采集指紋圖像面積過小、圖像太暗或太淺、手指按壓方向錯誤以及采集部位錯誤等。這樣盡可能確保指紋測試樣本的質量,減少不必要干擾因素對測試樣本庫圖像質量的影響。
指紋測試樣本的采集是一項復雜工作,本文從指紋測試樣本采集的背景和目的出發(fā),對指紋測試樣本采集所面臨的問題以及需要解決的幾項關鍵技術進行詳細介紹。通過筆者及同事多年多地的采集實踐證明,按本文設計的指紋測試樣本采集系統(tǒng)在應用上是成功高效的,無論是刑偵用大面積滾動指紋測試樣本采集,還是證件用平面指紋測試樣本的采集,都可以順利完成。這不僅為指紋識別算法的測試工作提供強有力的支持,同時也為相關類似項目的設計和開發(fā)提供了有益的參考。
[1] 田捷,楊鑫, 等.生物特征識別理論與應用[M].北京:清華大學出版社,2009.
[2] GA/T 894.6-2010, 安防指紋識別應用系統(tǒng) 第6部分:指紋識別算法評測方法.
[3] GA 1012-2012, 居民身份證指紋采集和比對技術規(guī)范.
[4] GA/T 893-2010, 安防生物特征識別應用術語.
[5] GA/T 626.1-2010, 活體指紋圖像應用程序接口規(guī)范 第1部分:采集設備.