張亞,許敏敏,張智,劉洋,賈振軍
1.中國人民公安大學 研究生院,北京 100038
2.中國人民公安大學 偵查學院,北京 100038
信息化時代,網(wǎng)絡空間個人信息安全逐漸成為當下熱門議題,生物特征識別技術應運而生。不同于傳統(tǒng)的知識類密鑰技術保護個人隱私,生物特征識別是利用人體本身存在的特征進行身份認證以達到保障個人信息安全的目的[1]。其中指靜脈識別是一種采用近紅外光照射手指獲取靜脈圖像,提取靜脈特征來進行個人身份認證的技術[2],因具有以下兩方面的獨特優(yōu)勢:一是只能活體識別,二是位于身體內部,于眾多生物特征識別中脫穎而出。2 種特性使得指靜脈難于偽造和復制,不易受外部因素影響,作為生物特征安全等級高[3]。我國開展指靜脈識別相關研究起步晚,但發(fā)展迅速,在感興趣區(qū)域(region of interest,ROI)定位分割、圖像增強處理、特征提取和特征匹配等方面成果顯著。為研究我國指靜脈識別技術相關進展及現(xiàn)狀,本文從文獻計量和可視化分析角度對CNKI 數(shù)據(jù)庫文獻進行深入分析。因為文獻是科研的精華所在,具有重要的研究價值[4-5],通過對各時段文獻進行計量分析,揭示了我國指靜脈識別技術發(fā)展的演變歷程和研究熱點;通過對所有時段文獻的可視化分析,揭示了我國指靜脈識別技術的主要研究內容、主要研究力量以及未來的研究方向,為讀者提供有價值的參考。
本文統(tǒng)計文獻來源于CNKI,搜索關鍵字“指靜脈”并添加關鍵字識別,兩者均為模糊,時間不限,進行高級搜索,搜索結果為386 篇,該數(shù)字涉及期刊論文、碩士論文、博士論文、國家標準、行業(yè)標準、科技成果和會議論文等文獻類型,經(jīng)過篩選后,剩余368 篇。采用CNKI 自帶可視化分析工具繪制其發(fā)表年度趨勢如圖1 所示。
圖1 不同年份關于指靜脈識別文獻數(shù)量
由圖1 統(tǒng)計結果顯示,2018 年發(fā)表文獻48 篇,位居首位;文獻發(fā)表量每年總體呈上升趨勢,其中2004 年—2009 年期間靜脈識別相關文獻發(fā)表量增長緩慢,2010 年—2012 年期間增長迅速,呈現(xiàn)爆發(fā)式增長,2013 年—2018 年期間呈現(xiàn)緩慢增長的發(fā)展趨勢,2018 年至今呈下滑態(tài)勢,但是文獻發(fā)表基數(shù)大,從圖1 可以推測未來發(fā)表量會持續(xù)增加。
受1.1 節(jié)中文獻發(fā)表呈波動式遞增趨勢的啟發(fā),為研究我國指靜脈識別的發(fā)展歷程和最新進展,將發(fā)表年度趨勢圖分成4 個階段進行時間跨度研究,從文獻類型、主題、學科和機構分布狀況對各階段統(tǒng)計結果進行全面對比,通過時間跨度觀察我國指靜脈識別相關研究的發(fā)展歷程和最新研究動態(tài)。此外,又從關鍵字共現(xiàn)、作者共引和機構共引3 方面綜合分析我國指靜脈識別研究的主要內容、主要分布力量以及未來的研究趨勢,為讀者提供參考。本文采用Excel 保存統(tǒng)計數(shù)據(jù),運用圖表功能制作相應的數(shù)據(jù)圖進行統(tǒng)計分析,采用CiteSpace 軟件繪制文獻相應圖譜進行可視化分析。
指靜脈識別文獻在各類型文獻分布情況如圖2所示。圖2 中期刊性文獻和學位性論文占比91%以上,是指靜脈識別文獻發(fā)表的主要發(fā)表形式。這2 類文獻偏向研究型,專業(yè)性強,多為從事相關課題、企業(yè)研發(fā)等專業(yè)人員發(fā)表,國家標準、行業(yè)標準、會議論文亦是少數(shù)人員才會接觸,報紙、科技成果等反映該技術公眾普及性的文獻占比不到1%,可見目前關于指靜脈識別相關的理論、技術和落地產品等受眾人群規(guī)模小,市場發(fā)展空間大,前景廣闊。
圖2 指靜脈識別文章在各類型文獻分布情況
由圖1 和圖2 可知,2004 年—2009 年共發(fā)表指靜脈識別相關文獻34 篇,文獻類型較少,分為期刊論文、研究論文、科技成果3 類;2010 年—2012 年期間總計發(fā)表相關指靜脈識別文獻64 篇,文獻類型較多,包括期刊論文、研究論文、行業(yè)標準、會議論文和科技成果等5 大類;2013 年—2018 年是指靜脈識別發(fā)展最為迅速的黃金時期,相關文獻累計高達204 篇,占據(jù)總文獻2/3 以上,文獻來源廣泛,除上述種類外,還新增國家標準和報紙類型;2018 年至今發(fā)表文獻總計66 篇,主要為期刊論文、研究論文和會議論文3 大類。文獻類型的逐年增加,表明指靜脈識別的研究越來越深入,由理論研究逐漸深入到應用產品開發(fā)。
主題分布情況反映一定時期的研究導向,統(tǒng)計結果顯示,2004 年—2009 年期間,主題主要圍繞指靜脈圖像及其相關處理技術、特征提取及特征匹配相關算法,而研究應用、人員身份認證和指靜脈融合(多模態(tài)、復合識別等)相關研究剛剛起步。這一階段,單一模板識別的算法理論研究是主要方向,其具體分布情況如圖3 所示。
圖3 2004 年—2009 年主要主題分布
2010 年—2012 年期間指靜脈圖像相關處理技術及算法研究依舊是當下的主要內容,身份認證、指靜脈融合(雙模態(tài)識別、決策級融合及加權融合等)正逐漸成為研究熱點,相對于單一模板識別,指靜脈融合可以提高識別的抗攻擊能力,安全性更高。特別需要注意的是,指靜脈圖像相關處理技術及算法開始從理論研究層面向應用層面過渡,相關識別系統(tǒng)開發(fā)研究正發(fā)展迅速(研究與實現(xiàn)、系統(tǒng)設計和應用系統(tǒng)),其主題具體分布狀況如圖4 所示。
圖4 2010 年—2012 年主要主題分布
2013 年—2018 年期間手指靜脈識別相關圖像、特征算法依舊是研究熱點,相關系統(tǒng)設計也穩(wěn)居高位,但是指靜脈融合技術開始迅速崛起(多模態(tài)、多生物特征等),除此之外,深度學習、神經(jīng)網(wǎng)絡等首次出現(xiàn),開啟了算法研究新紀元。傳統(tǒng)的機器學習泛化性低,耗時長,而深度學習和神經(jīng)網(wǎng)絡在處理大規(guī)模數(shù)據(jù)方面具有顯著優(yōu)勢,并且可以解決深層結構優(yōu)化問題[6-7]。與此同時,與指靜脈識別相關的產品也從理論研究成功應用到了現(xiàn)實生活中,具體主題分布如圖5 所示。
圖5 2013 年—2018 年主要主題分布
2019 年—2020 年是研究當下熱點最佳參考階段。與前3 個階段相比,手指靜脈圖像、特征提取等相關算法研究一直是研究熱點,穩(wěn)居前列,而深度學習、神經(jīng)網(wǎng)絡、指靜脈融合相關研究發(fā)展迅速,明顯有趕超趨勢,未來發(fā)展前景廣闊,具體分布情況如圖6 所示。隨著互聯(lián)網(wǎng)技術的深入發(fā)展,大數(shù)據(jù)環(huán)境下,對保障信息安全的要求越來越高,在接下來的幾年里,深度學習、神經(jīng)網(wǎng)絡、指靜脈融合將會是長期的研究焦點。
圖6 2019 年—2020 年主要主題分布
由圖7 統(tǒng)計結果顯示,2004 年—2009 年期間,指靜脈識別主要涉及計算機軟件與應用、自動化技術這2 大學科,總占比85%;而在計算機硬件技術、無線電電子學、生物醫(yī)學工程、安全工程與災害防治和工業(yè)經(jīng)濟等學科占比不相上下,分布均衡。
圖7 2004 年—2009 年指靜脈識別研究學科分布
由圖8 統(tǒng)計結果顯示,2010 年—2012 年期間,計算機軟件及計算機應用學科自占比達84%,并開始涉及公安、電信技術、互聯(lián)網(wǎng)技術、初等教育、無線電子學、建筑科學與工程和金融等方面,其中公安學科和自動化學科占比均等??傮w來說,其學科涉及較上一階段更廣泛。
圖8 2010 年—2012 年指靜脈識別研究學科分布
由圖9 統(tǒng)計結果顯示,2013 年—2018 年期間,學科分布呈現(xiàn)井噴式增長,涉及學科十分廣泛。
圖9 2013 年—2018 年指靜脈識別研究學科分布
計算機軟件及應用仍然占比最高;自動化技術位居其次,卻僅占5%;工業(yè)經(jīng)濟安全與科學防治占比2%;其余涉及學科分布占比均勻,新增社會學及統(tǒng)計學、信息經(jīng)濟和郵政經(jīng)濟、新政學及國家行政管理、輕工業(yè)手工業(yè)、汽車工業(yè)和機械工業(yè)等學科,可見指靜脈識別技術的相關研究已經(jīng)具有了一定的規(guī)模。
由圖10 統(tǒng)計結果顯示,2019 年—2020 年期間,兩大主要學科分別占比63%、15%,明顯可見自動化技術占比上升,此外生物醫(yī)學工程占比也增加,還新增醫(yī)學與衛(wèi)生學、電力工業(yè)、貿易經(jīng)濟和企業(yè)經(jīng)濟等學科。
圖10 2019 年—2020 年指靜脈識別研究學科分布
縱觀圖7—圖10,指靜脈識別技術所涉及的學科占比十分不均衡,學科分布主要涉及計算機軟件及計算機應用,而其他學科涉及較少;此外,涉及學科種類呈逐年增加的演變趨勢,表明指靜脈識別潛在市場還很廣闊,值得大家去深入探索。
由圖11 統(tǒng)計結果顯示,2004 年—2009 年,指靜脈識別研究的主力軍主要集中在東北三大高校和西南兩大高校:吉林大學、哈爾濱工程大學、長春理工大學和重慶理工大學、西華大學,具有明顯的地域集中性;高校研究是主要力量,企業(yè)等研究相比較少。
圖11 2004 年—2009 年指靜脈識別研究機構分布
由圖12 統(tǒng)計結果顯示,2010 年—2012 年,哈爾濱工程大學指靜脈識別研究發(fā)文量位居首位,研究成果遠超吉林大學、重慶理工大學。此外,機構分布不再是東北和西南兩足鼎立格局,華北地區(qū)山東大學、清華大學、北京交通大學、北京大學等高校,以及華東地區(qū)南京郵電大學、深圳大學、江蘇大學、中國民航大學等高校,也開始從事指靜脈識別研究。如果以南北來比較的話,北方機構分布相較于南方多一些。與此同時,企業(yè)參與研究的量也有明顯增加。
圖12 2010 年—2012 年指靜脈識別研究機構分布
由圖13 統(tǒng)計結果顯示,2013 年—2018 年期間,杭州電子科技大學、中國民航大學、山東大學這些后起研究者逐漸成為了指靜脈識別研究的主力軍,研究實力不相上下。各大區(qū)域高校范圍也進一步擴大,新增華南理工大學、湖南大學等,直到2018 年,尚無西北地區(qū)高校開展此類研究。
圖13 2013 年—2018 年指靜脈識別研究機構分布
由圖14 結果顯示,2018 年—2020 年,中國民航大學、遼寧工程大學、山東大學指靜脈識別研究發(fā)文量位居前列,這一時期各高校機構文獻發(fā)表貢獻比均衡,西北地區(qū)陜西科技大學也首次開展了指靜脈識別相關研究。
圖14 2019 年—2020 年指靜脈識別研究機構分布
縱觀圖11—14,可以發(fā)現(xiàn)指靜脈識別相關研究機構發(fā)展趨勢:早期東北和西南地區(qū)各大高校對指靜脈識別研究頗多,之后擴展至華東和華南、華中地區(qū),西北地區(qū)研究最晚,地域性差異明顯。此外,任何時間段,高校在相關研究上的奉獻都遠遠超于企業(yè)等研究機構,是主要研究力量。
CiteSpace 軟件處理知網(wǎng)下載的文獻時,需要去除會議、報紙等文獻類型,如果不去掉就會影響后期的出圖和分析,不夠嚴謹;而期刊論文和碩博士論文是分析重點,兩者各有側重點,碩博士論文更傾向于基礎研究,期刊論文更接近于當前熱點。經(jīng)過篩選后,對353 篇文獻進行分析。
文獻共引分詞共篩選出399 個關鍵詞,如圖15 所示。主要可分為手指靜脈識別、指靜脈識別、手指靜脈、特征提取、圖像分割、多模態(tài)生物特征識別、生物特征識別和單像素點額加權平均這10 類,如圖16 所示。
圖15 關鍵詞共現(xiàn)分析
圖16 關鍵詞聚類分析
對關鍵詞進行突變篩選時,由圖17 統(tǒng)計結果可知,存在5 個關鍵詞激增,分別為模式識別(始于2007 年)、生物特征識別(始于2012 年)、指靜脈識別(始于2018 年)、深度學習(始于2018 年)和卷積神經(jīng)網(wǎng)絡(始于2018 年),由模式識別向指靜脈識別轉變,相關術語更加具體專業(yè),而深度學習、卷積神經(jīng)網(wǎng)絡是近年來才開始的,是當下研究熱點所在,也是長期的研究焦點。
圖17 關鍵詞突變分析
文獻作者共有309 個,統(tǒng)計結果顯示,楊金峰(引用頻次11)、王俊科(引用頻次11)、余成波(引用頻次7)、馬慧(引用頻次6)、尹義龍(引用頻次6)、沈雷(引用頻次5)、孟憲靜(引用頻次5)位居前列;楊金鋒(中心性10)、王俊科(中心性8)、余成波(中心性8)、尹義龍(中心性7)、管鳳旭(中心性7)、襲肖明(中心性7)、沈雷(中心性6)、孟憲靜(中心性6)位居前列,值得特別注意的是,位居前列的研究學者,團隊內合作強度關系密切,文獻影響力高,如圖18 所示。沈雷文章是2017 年以來引用頻次最高的,參考價值高,其主要研究方向為大規(guī)模數(shù)據(jù)下(融合、泛化人群)識別速度和識別率問題[8-10];管鳳旭、襲肖明引用頻次不高,但中心性位居前列,中心性是衡量測度節(jié)點在網(wǎng)絡中重要性的一個指標,近年來引用頻次最高的文獻研究方向為融合識別問題[11-13],管鳳旭相關文獻是罕見的“睡美人”,自2012 年左右提出來后,一直處于0 被引狀態(tài),直到2018 年引用頻次突增,研究方向也為融合識別[14-15]??梢娭胳o脈融合技術提出早,但受當時條件限制,停滯不前,近年來深度學習、神經(jīng)網(wǎng)絡的出現(xiàn)為指靜脈融合的發(fā)展提供了契機。
圖18 作者合作強度分布
文獻機構共引分析共產生157 個節(jié)點74 條連線,密度只有0.006,分布圖譜非常分散,只有少部分機構有合作關系,如圖19 所示。
圖19 機構共引圖譜
由表1 數(shù)據(jù)結果顯示,哈爾濱工程大學自動化學院、中國民航大學天津市智能信號與圖像處理重點實驗室、杭州電子科技大學通信工程學院、山東大學計算機科學與技術學院、遼寧工程技術大學電子與信息工程學院文獻引用頻次位于前列。近年來,杭州電子科技大學通信工程學院引用頻次高,參考價值高,沈雷即是該院學生。
表1 引用頻次統(tǒng)計
綜合上述分析可以看出,我國指靜脈識別技術的發(fā)展具有地域性,分布不均衡;主要研究力量聚集在高校,各高校間合作強度不大;近年來提出的深度學習和卷積神經(jīng)網(wǎng)絡是當下的研究熱點,并促進了指靜脈融合技術的發(fā)展;指靜脈融合技術研究起步早,但近年來才成為研究焦點,深度學習和卷積神經(jīng)網(wǎng)絡功不可沒。目前,我國指靜脈識別技術涉及學科較窄、潛在市場巨大,相關文獻發(fā)表將會持續(xù)增長。通過本文研究大膽預測,指靜脈大數(shù)據(jù)發(fā)展(深度學習、神經(jīng)網(wǎng)絡、多模態(tài)融合)以及相關科技產品開發(fā)將會是指靜脈識別未來的主要研究方向。