張亞,許敏敏,張智,劉洋,賈振軍
1.中國(guó)人民公安大學(xué) 研究生院,北京 100038
2.中國(guó)人民公安大學(xué) 偵查學(xué)院,北京 100038
信息化時(shí)代,網(wǎng)絡(luò)空間個(gè)人信息安全逐漸成為當(dāng)下熱門(mén)議題,生物特征識(shí)別技術(shù)應(yīng)運(yùn)而生。不同于傳統(tǒng)的知識(shí)類(lèi)密鑰技術(shù)保護(hù)個(gè)人隱私,生物特征識(shí)別是利用人體本身存在的特征進(jìn)行身份認(rèn)證以達(dá)到保障個(gè)人信息安全的目的[1]。其中指靜脈識(shí)別是一種采用近紅外光照射手指獲取靜脈圖像,提取靜脈特征來(lái)進(jìn)行個(gè)人身份認(rèn)證的技術(shù)[2],因具有以下兩方面的獨(dú)特優(yōu)勢(shì):一是只能活體識(shí)別,二是位于身體內(nèi)部,于眾多生物特征識(shí)別中脫穎而出。2 種特性使得指靜脈難于偽造和復(fù)制,不易受外部因素影響,作為生物特征安全等級(jí)高[3]。我國(guó)開(kāi)展指靜脈識(shí)別相關(guān)研究起步晚,但發(fā)展迅速,在感興趣區(qū)域(region of interest,ROI)定位分割、圖像增強(qiáng)處理、特征提取和特征匹配等方面成果顯著。為研究我國(guó)指靜脈識(shí)別技術(shù)相關(guān)進(jìn)展及現(xiàn)狀,本文從文獻(xiàn)計(jì)量和可視化分析角度對(duì)CNKI 數(shù)據(jù)庫(kù)文獻(xiàn)進(jìn)行深入分析。因?yàn)槲墨I(xiàn)是科研的精華所在,具有重要的研究?jī)r(jià)值[4-5],通過(guò)對(duì)各時(shí)段文獻(xiàn)進(jìn)行計(jì)量分析,揭示了我國(guó)指靜脈識(shí)別技術(shù)發(fā)展的演變歷程和研究熱點(diǎn);通過(guò)對(duì)所有時(shí)段文獻(xiàn)的可視化分析,揭示了我國(guó)指靜脈識(shí)別技術(shù)的主要研究?jī)?nèi)容、主要研究力量以及未來(lái)的研究方向,為讀者提供有價(jià)值的參考。
本文統(tǒng)計(jì)文獻(xiàn)來(lái)源于CNKI,搜索關(guān)鍵字“指靜脈”并添加關(guān)鍵字識(shí)別,兩者均為模糊,時(shí)間不限,進(jìn)行高級(jí)搜索,搜索結(jié)果為386 篇,該數(shù)字涉及期刊論文、碩士論文、博士論文、國(guó)家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、科技成果和會(huì)議論文等文獻(xiàn)類(lèi)型,經(jīng)過(guò)篩選后,剩余368 篇。采用CNKI 自帶可視化分析工具繪制其發(fā)表年度趨勢(shì)如圖1 所示。
圖1 不同年份關(guān)于指靜脈識(shí)別文獻(xiàn)數(shù)量
由圖1 統(tǒng)計(jì)結(jié)果顯示,2018 年發(fā)表文獻(xiàn)48 篇,位居首位;文獻(xiàn)發(fā)表量每年總體呈上升趨勢(shì),其中2004 年—2009 年期間靜脈識(shí)別相關(guān)文獻(xiàn)發(fā)表量增長(zhǎng)緩慢,2010 年—2012 年期間增長(zhǎng)迅速,呈現(xiàn)爆發(fā)式增長(zhǎng),2013 年—2018 年期間呈現(xiàn)緩慢增長(zhǎng)的發(fā)展趨勢(shì),2018 年至今呈下滑態(tài)勢(shì),但是文獻(xiàn)發(fā)表基數(shù)大,從圖1 可以推測(cè)未來(lái)發(fā)表量會(huì)持續(xù)增加。
受1.1 節(jié)中文獻(xiàn)發(fā)表呈波動(dòng)式遞增趨勢(shì)的啟發(fā),為研究我國(guó)指靜脈識(shí)別的發(fā)展歷程和最新進(jìn)展,將發(fā)表年度趨勢(shì)圖分成4 個(gè)階段進(jìn)行時(shí)間跨度研究,從文獻(xiàn)類(lèi)型、主題、學(xué)科和機(jī)構(gòu)分布狀況對(duì)各階段統(tǒng)計(jì)結(jié)果進(jìn)行全面對(duì)比,通過(guò)時(shí)間跨度觀察我國(guó)指靜脈識(shí)別相關(guān)研究的發(fā)展歷程和最新研究動(dòng)態(tài)。此外,又從關(guān)鍵字共現(xiàn)、作者共引和機(jī)構(gòu)共引3 方面綜合分析我國(guó)指靜脈識(shí)別研究的主要內(nèi)容、主要分布力量以及未來(lái)的研究趨勢(shì),為讀者提供參考。本文采用Excel 保存統(tǒng)計(jì)數(shù)據(jù),運(yùn)用圖表功能制作相應(yīng)的數(shù)據(jù)圖進(jìn)行統(tǒng)計(jì)分析,采用CiteSpace 軟件繪制文獻(xiàn)相應(yīng)圖譜進(jìn)行可視化分析。
指靜脈識(shí)別文獻(xiàn)在各類(lèi)型文獻(xiàn)分布情況如圖2所示。圖2 中期刊性文獻(xiàn)和學(xué)位性論文占比91%以上,是指靜脈識(shí)別文獻(xiàn)發(fā)表的主要發(fā)表形式。這2 類(lèi)文獻(xiàn)偏向研究型,專(zhuān)業(yè)性強(qiáng),多為從事相關(guān)課題、企業(yè)研發(fā)等專(zhuān)業(yè)人員發(fā)表,國(guó)家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、會(huì)議論文亦是少數(shù)人員才會(huì)接觸,報(bào)紙、科技成果等反映該技術(shù)公眾普及性的文獻(xiàn)占比不到1%,可見(jiàn)目前關(guān)于指靜脈識(shí)別相關(guān)的理論、技術(shù)和落地產(chǎn)品等受眾人群規(guī)模小,市場(chǎng)發(fā)展空間大,前景廣闊。
圖2 指靜脈識(shí)別文章在各類(lèi)型文獻(xiàn)分布情況
由圖1 和圖2 可知,2004 年—2009 年共發(fā)表指靜脈識(shí)別相關(guān)文獻(xiàn)34 篇,文獻(xiàn)類(lèi)型較少,分為期刊論文、研究論文、科技成果3 類(lèi);2010 年—2012 年期間總計(jì)發(fā)表相關(guān)指靜脈識(shí)別文獻(xiàn)64 篇,文獻(xiàn)類(lèi)型較多,包括期刊論文、研究論文、行業(yè)標(biāo)準(zhǔn)、會(huì)議論文和科技成果等5 大類(lèi);2013 年—2018 年是指靜脈識(shí)別發(fā)展最為迅速的黃金時(shí)期,相關(guān)文獻(xiàn)累計(jì)高達(dá)204 篇,占據(jù)總文獻(xiàn)2/3 以上,文獻(xiàn)來(lái)源廣泛,除上述種類(lèi)外,還新增國(guó)家標(biāo)準(zhǔn)和報(bào)紙類(lèi)型;2018 年至今發(fā)表文獻(xiàn)總計(jì)66 篇,主要為期刊論文、研究論文和會(huì)議論文3 大類(lèi)。文獻(xiàn)類(lèi)型的逐年增加,表明指靜脈識(shí)別的研究越來(lái)越深入,由理論研究逐漸深入到應(yīng)用產(chǎn)品開(kāi)發(fā)。
主題分布情況反映一定時(shí)期的研究導(dǎo)向,統(tǒng)計(jì)結(jié)果顯示,2004 年—2009 年期間,主題主要圍繞指靜脈圖像及其相關(guān)處理技術(shù)、特征提取及特征匹配相關(guān)算法,而研究應(yīng)用、人員身份認(rèn)證和指靜脈融合(多模態(tài)、復(fù)合識(shí)別等)相關(guān)研究剛剛起步。這一階段,單一模板識(shí)別的算法理論研究是主要方向,其具體分布情況如圖3 所示。
圖3 2004 年—2009 年主要主題分布
2010 年—2012 年期間指靜脈圖像相關(guān)處理技術(shù)及算法研究依舊是當(dāng)下的主要內(nèi)容,身份認(rèn)證、指靜脈融合(雙模態(tài)識(shí)別、決策級(jí)融合及加權(quán)融合等)正逐漸成為研究熱點(diǎn),相對(duì)于單一模板識(shí)別,指靜脈融合可以提高識(shí)別的抗攻擊能力,安全性更高。特別需要注意的是,指靜脈圖像相關(guān)處理技術(shù)及算法開(kāi)始從理論研究層面向應(yīng)用層面過(guò)渡,相關(guān)識(shí)別系統(tǒng)開(kāi)發(fā)研究正發(fā)展迅速(研究與實(shí)現(xiàn)、系統(tǒng)設(shè)計(jì)和應(yīng)用系統(tǒng)),其主題具體分布狀況如圖4 所示。
圖4 2010 年—2012 年主要主題分布
2013 年—2018 年期間手指靜脈識(shí)別相關(guān)圖像、特征算法依舊是研究熱點(diǎn),相關(guān)系統(tǒng)設(shè)計(jì)也穩(wěn)居高位,但是指靜脈融合技術(shù)開(kāi)始迅速崛起(多模態(tài)、多生物特征等),除此之外,深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等首次出現(xiàn),開(kāi)啟了算法研究新紀(jì)元。傳統(tǒng)的機(jī)器學(xué)習(xí)泛化性低,耗時(shí)長(zhǎng),而深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)在處理大規(guī)模數(shù)據(jù)方面具有顯著優(yōu)勢(shì),并且可以解決深層結(jié)構(gòu)優(yōu)化問(wèn)題[6-7]。與此同時(shí),與指靜脈識(shí)別相關(guān)的產(chǎn)品也從理論研究成功應(yīng)用到了現(xiàn)實(shí)生活中,具體主題分布如圖5 所示。
圖5 2013 年—2018 年主要主題分布
2019 年—2020 年是研究當(dāng)下熱點(diǎn)最佳參考階段。與前3 個(gè)階段相比,手指靜脈圖像、特征提取等相關(guān)算法研究一直是研究熱點(diǎn),穩(wěn)居前列,而深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、指靜脈融合相關(guān)研究發(fā)展迅速,明顯有趕超趨勢(shì),未來(lái)發(fā)展前景廣闊,具體分布情況如圖6 所示。隨著互聯(lián)網(wǎng)技術(shù)的深入發(fā)展,大數(shù)據(jù)環(huán)境下,對(duì)保障信息安全的要求越來(lái)越高,在接下來(lái)的幾年里,深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、指靜脈融合將會(huì)是長(zhǎng)期的研究焦點(diǎn)。
圖6 2019 年—2020 年主要主題分布
由圖7 統(tǒng)計(jì)結(jié)果顯示,2004 年—2009 年期間,指靜脈識(shí)別主要涉及計(jì)算機(jī)軟件與應(yīng)用、自動(dòng)化技術(shù)這2 大學(xué)科,總占比85%;而在計(jì)算機(jī)硬件技術(shù)、無(wú)線電電子學(xué)、生物醫(yī)學(xué)工程、安全工程與災(zāi)害防治和工業(yè)經(jīng)濟(jì)等學(xué)科占比不相上下,分布均衡。
圖7 2004 年—2009 年指靜脈識(shí)別研究學(xué)科分布
由圖8 統(tǒng)計(jì)結(jié)果顯示,2010 年—2012 年期間,計(jì)算機(jī)軟件及計(jì)算機(jī)應(yīng)用學(xué)科自占比達(dá)84%,并開(kāi)始涉及公安、電信技術(shù)、互聯(lián)網(wǎng)技術(shù)、初等教育、無(wú)線電子學(xué)、建筑科學(xué)與工程和金融等方面,其中公安學(xué)科和自動(dòng)化學(xué)科占比均等??傮w來(lái)說(shuō),其學(xué)科涉及較上一階段更廣泛。
圖8 2010 年—2012 年指靜脈識(shí)別研究學(xué)科分布
由圖9 統(tǒng)計(jì)結(jié)果顯示,2013 年—2018 年期間,學(xué)科分布呈現(xiàn)井噴式增長(zhǎng),涉及學(xué)科十分廣泛。
圖9 2013 年—2018 年指靜脈識(shí)別研究學(xué)科分布
計(jì)算機(jī)軟件及應(yīng)用仍然占比最高;自動(dòng)化技術(shù)位居其次,卻僅占5%;工業(yè)經(jīng)濟(jì)安全與科學(xué)防治占比2%;其余涉及學(xué)科分布占比均勻,新增社會(huì)學(xué)及統(tǒng)計(jì)學(xué)、信息經(jīng)濟(jì)和郵政經(jīng)濟(jì)、新政學(xué)及國(guó)家行政管理、輕工業(yè)手工業(yè)、汽車(chē)工業(yè)和機(jī)械工業(yè)等學(xué)科,可見(jiàn)指靜脈識(shí)別技術(shù)的相關(guān)研究已經(jīng)具有了一定的規(guī)模。
由圖10 統(tǒng)計(jì)結(jié)果顯示,2019 年—2020 年期間,兩大主要學(xué)科分別占比63%、15%,明顯可見(jiàn)自動(dòng)化技術(shù)占比上升,此外生物醫(yī)學(xué)工程占比也增加,還新增醫(yī)學(xué)與衛(wèi)生學(xué)、電力工業(yè)、貿(mào)易經(jīng)濟(jì)和企業(yè)經(jīng)濟(jì)等學(xué)科。
圖10 2019 年—2020 年指靜脈識(shí)別研究學(xué)科分布
縱觀圖7—圖10,指靜脈識(shí)別技術(shù)所涉及的學(xué)科占比十分不均衡,學(xué)科分布主要涉及計(jì)算機(jī)軟件及計(jì)算機(jī)應(yīng)用,而其他學(xué)科涉及較少;此外,涉及學(xué)科種類(lèi)呈逐年增加的演變趨勢(shì),表明指靜脈識(shí)別潛在市場(chǎng)還很廣闊,值得大家去深入探索。
由圖11 統(tǒng)計(jì)結(jié)果顯示,2004 年—2009 年,指靜脈識(shí)別研究的主力軍主要集中在東北三大高校和西南兩大高校:吉林大學(xué)、哈爾濱工程大學(xué)、長(zhǎng)春理工大學(xué)和重慶理工大學(xué)、西華大學(xué),具有明顯的地域集中性;高校研究是主要力量,企業(yè)等研究相比較少。
圖11 2004 年—2009 年指靜脈識(shí)別研究機(jī)構(gòu)分布
由圖12 統(tǒng)計(jì)結(jié)果顯示,2010 年—2012 年,哈爾濱工程大學(xué)指靜脈識(shí)別研究發(fā)文量位居首位,研究成果遠(yuǎn)超吉林大學(xué)、重慶理工大學(xué)。此外,機(jī)構(gòu)分布不再是東北和西南兩足鼎立格局,華北地區(qū)山東大學(xué)、清華大學(xué)、北京交通大學(xué)、北京大學(xué)等高校,以及華東地區(qū)南京郵電大學(xué)、深圳大學(xué)、江蘇大學(xué)、中國(guó)民航大學(xué)等高校,也開(kāi)始從事指靜脈識(shí)別研究。如果以南北來(lái)比較的話,北方機(jī)構(gòu)分布相較于南方多一些。與此同時(shí),企業(yè)參與研究的量也有明顯增加。
圖12 2010 年—2012 年指靜脈識(shí)別研究機(jī)構(gòu)分布
由圖13 統(tǒng)計(jì)結(jié)果顯示,2013 年—2018 年期間,杭州電子科技大學(xué)、中國(guó)民航大學(xué)、山東大學(xué)這些后起研究者逐漸成為了指靜脈識(shí)別研究的主力軍,研究實(shí)力不相上下。各大區(qū)域高校范圍也進(jìn)一步擴(kuò)大,新增華南理工大學(xué)、湖南大學(xué)等,直到2018 年,尚無(wú)西北地區(qū)高校開(kāi)展此類(lèi)研究。
圖13 2013 年—2018 年指靜脈識(shí)別研究機(jī)構(gòu)分布
由圖14 結(jié)果顯示,2018 年—2020 年,中國(guó)民航大學(xué)、遼寧工程大學(xué)、山東大學(xué)指靜脈識(shí)別研究發(fā)文量位居前列,這一時(shí)期各高校機(jī)構(gòu)文獻(xiàn)發(fā)表貢獻(xiàn)比均衡,西北地區(qū)陜西科技大學(xué)也首次開(kāi)展了指靜脈識(shí)別相關(guān)研究。
圖14 2019 年—2020 年指靜脈識(shí)別研究機(jī)構(gòu)分布
縱觀圖11—14,可以發(fā)現(xiàn)指靜脈識(shí)別相關(guān)研究機(jī)構(gòu)發(fā)展趨勢(shì):早期東北和西南地區(qū)各大高校對(duì)指靜脈識(shí)別研究頗多,之后擴(kuò)展至華東和華南、華中地區(qū),西北地區(qū)研究最晚,地域性差異明顯。此外,任何時(shí)間段,高校在相關(guān)研究上的奉獻(xiàn)都遠(yuǎn)遠(yuǎn)超于企業(yè)等研究機(jī)構(gòu),是主要研究力量。
CiteSpace 軟件處理知網(wǎng)下載的文獻(xiàn)時(shí),需要去除會(huì)議、報(bào)紙等文獻(xiàn)類(lèi)型,如果不去掉就會(huì)影響后期的出圖和分析,不夠嚴(yán)謹(jǐn);而期刊論文和碩博士論文是分析重點(diǎn),兩者各有側(cè)重點(diǎn),碩博士論文更傾向于基礎(chǔ)研究,期刊論文更接近于當(dāng)前熱點(diǎn)。經(jīng)過(guò)篩選后,對(duì)353 篇文獻(xiàn)進(jìn)行分析。
文獻(xiàn)共引分詞共篩選出399 個(gè)關(guān)鍵詞,如圖15 所示。主要可分為手指靜脈識(shí)別、指靜脈識(shí)別、手指靜脈、特征提取、圖像分割、多模態(tài)生物特征識(shí)別、生物特征識(shí)別和單像素點(diǎn)額加權(quán)平均這10 類(lèi),如圖16 所示。
圖15 關(guān)鍵詞共現(xiàn)分析
圖16 關(guān)鍵詞聚類(lèi)分析
對(duì)關(guān)鍵詞進(jìn)行突變篩選時(shí),由圖17 統(tǒng)計(jì)結(jié)果可知,存在5 個(gè)關(guān)鍵詞激增,分別為模式識(shí)別(始于2007 年)、生物特征識(shí)別(始于2012 年)、指靜脈識(shí)別(始于2018 年)、深度學(xué)習(xí)(始于2018 年)和卷積神經(jīng)網(wǎng)絡(luò)(始于2018 年),由模式識(shí)別向指靜脈識(shí)別轉(zhuǎn)變,相關(guān)術(shù)語(yǔ)更加具體專(zhuān)業(yè),而深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)是近年來(lái)才開(kāi)始的,是當(dāng)下研究熱點(diǎn)所在,也是長(zhǎng)期的研究焦點(diǎn)。
圖17 關(guān)鍵詞突變分析
文獻(xiàn)作者共有309 個(gè),統(tǒng)計(jì)結(jié)果顯示,楊金峰(引用頻次11)、王俊科(引用頻次11)、余成波(引用頻次7)、馬慧(引用頻次6)、尹義龍(引用頻次6)、沈雷(引用頻次5)、孟憲靜(引用頻次5)位居前列;楊金鋒(中心性10)、王俊科(中心性8)、余成波(中心性8)、尹義龍(中心性7)、管鳳旭(中心性7)、襲肖明(中心性7)、沈雷(中心性6)、孟憲靜(中心性6)位居前列,值得特別注意的是,位居前列的研究學(xué)者,團(tuán)隊(duì)內(nèi)合作強(qiáng)度關(guān)系密切,文獻(xiàn)影響力高,如圖18 所示。沈雷文章是2017 年以來(lái)引用頻次最高的,參考價(jià)值高,其主要研究方向?yàn)榇笠?guī)模數(shù)據(jù)下(融合、泛化人群)識(shí)別速度和識(shí)別率問(wèn)題[8-10];管鳳旭、襲肖明引用頻次不高,但中心性位居前列,中心性是衡量測(cè)度節(jié)點(diǎn)在網(wǎng)絡(luò)中重要性的一個(gè)指標(biāo),近年來(lái)引用頻次最高的文獻(xiàn)研究方向?yàn)槿诤献R(shí)別問(wèn)題[11-13],管鳳旭相關(guān)文獻(xiàn)是罕見(jiàn)的“睡美人”,自2012 年左右提出來(lái)后,一直處于0 被引狀態(tài),直到2018 年引用頻次突增,研究方向也為融合識(shí)別[14-15]。可見(jiàn)指靜脈融合技術(shù)提出早,但受當(dāng)時(shí)條件限制,停滯不前,近年來(lái)深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)的出現(xiàn)為指靜脈融合的發(fā)展提供了契機(jī)。
圖18 作者合作強(qiáng)度分布
文獻(xiàn)機(jī)構(gòu)共引分析共產(chǎn)生157 個(gè)節(jié)點(diǎn)74 條連線,密度只有0.006,分布圖譜非常分散,只有少部分機(jī)構(gòu)有合作關(guān)系,如圖19 所示。
圖19 機(jī)構(gòu)共引圖譜
由表1 數(shù)據(jù)結(jié)果顯示,哈爾濱工程大學(xué)自動(dòng)化學(xué)院、中國(guó)民航大學(xué)天津市智能信號(hào)與圖像處理重點(diǎn)實(shí)驗(yàn)室、杭州電子科技大學(xué)通信工程學(xué)院、山東大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院、遼寧工程技術(shù)大學(xué)電子與信息工程學(xué)院文獻(xiàn)引用頻次位于前列。近年來(lái),杭州電子科技大學(xué)通信工程學(xué)院引用頻次高,參考價(jià)值高,沈雷即是該院學(xué)生。
表1 引用頻次統(tǒng)計(jì)
綜合上述分析可以看出,我國(guó)指靜脈識(shí)別技術(shù)的發(fā)展具有地域性,分布不均衡;主要研究力量聚集在高校,各高校間合作強(qiáng)度不大;近年來(lái)提出的深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)是當(dāng)下的研究熱點(diǎn),并促進(jìn)了指靜脈融合技術(shù)的發(fā)展;指靜脈融合技術(shù)研究起步早,但近年來(lái)才成為研究焦點(diǎn),深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)功不可沒(méi)。目前,我國(guó)指靜脈識(shí)別技術(shù)涉及學(xué)科較窄、潛在市場(chǎng)巨大,相關(guān)文獻(xiàn)發(fā)表將會(huì)持續(xù)增長(zhǎng)。通過(guò)本文研究大膽預(yù)測(cè),指靜脈大數(shù)據(jù)發(fā)展(深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、多模態(tài)融合)以及相關(guān)科技產(chǎn)品開(kāi)發(fā)將會(huì)是指靜脈識(shí)別未來(lái)的主要研究方向。