高煥芝,劉志丹,郭云鏑,2,鄒北驥,2,陳再良,2
(1. 中南大學 信息科學與工程學院,湖南 長沙,410083;2.“移動醫(yī)療”教育部-中國移動聯(lián)合實驗室,湖南 長沙,410083)
身份認證是保障信息安全和合理分配資源的關(guān)鍵。隨著社會信息化的不斷發(fā)展及智能手機的普遍使用,手機端的網(wǎng)絡購物支付、電子商務及網(wǎng)上銀行等業(yè)務越來越多,很多信息資源的存儲訪問及保護都通過手機端進行,因此,利用手機端的傳感器[1]認證身份日趨重要。傳統(tǒng)的身份認證主要分為2 種類型:一種是用已知的信息對用戶進行身份驗證,常用的有用戶名和密碼、PIN 等;另外一種是用所擁有的實物對用戶進行身份驗證[2],常用的有鑰匙、身份證、護照、銀行信用卡等。但這2 種認證類型中,用來認證的信息容易被竊取、偽造或遺忘,而擁有的實物也容易丟失、盜用或損壞,因此,它們往往達不到很好的安全性能。生物特征認證技術(shù)的出現(xiàn)對傳統(tǒng)的身份認證起到了很好的補充和完善作用。每個人都擁有人臉[3]、指紋[4]、虹膜[5]和人體內(nèi)的DNA 等先天獨特的身體特征,以及筆跡簽名、語音和行為姿勢等后天形成的行為特征。這些生物特征是區(qū)分不同人的有效手段,將這些生物特征用作身份認證可以有效地克服記憶麻煩和密碼丟失等缺點;另一方面,生物體的特征都是自身攜帶且這種生物特征模板難以模仿,因此,保證了信息的隱私和安全,不易被竊取和仿用。筆跡鑒定[6]在身份認證中具有重要的實用價值。常用的筆跡特征主要有字體的大小、形狀、筆跡壓力、熟練程度、各個字符的搭配比例和筆跡軌跡的平均曲率等。目前,進行筆跡鑒定認證比較流行的算法有K 最近鄰算法[7]、隱馬爾可夫模型[8]、神經(jīng)網(wǎng)絡[9]、模版匹配[10]和支持向量機(support vector machines,SVM)等算法。Weiss 等[11]提出記錄設備橫向移動和縱向移動的筆畫構(gòu)成密碼的認證方法。Chong 等[12]提出設計10 種手機運動軌跡,剛好對應數(shù)字0~9,進行密碼輸入的認證方法。Farella 等[13]受到步態(tài)識別的啟發(fā),從生物特征的角度進行了可行性分析,利用加速度傳感器采集手勢數(shù)據(jù),并采用監(jiān)督和非監(jiān)督降維進行分類,通過數(shù)據(jù)分析,提出手勢運動可作為人體行為特征并可應用于小群體的身份認證的結(jié)論。文獻[14]結(jié)合[15]中基于手勢識別的認證方法取得了良好實驗效果,認為基于加速度傳感器采集手勢特征的身份認證方法前景廣闊。在一般情況下,不同的人在揮動手機書寫特定的軌跡時,其軌跡的大小、形狀和力度會不同,而同一個人在書寫同一個手勢軌跡時,其軌跡的大小、形狀和力度在一段時間內(nèi)是相對穩(wěn)定的,這一點跟每個人的簽名類似,因此,手勢軌跡可以看作是筆跡在手機上的另外一種體現(xiàn)形式。手機加速傳感器是目前市場上智能手機普遍配備的能夠測量加速力的電子元件,加速力就是物體在加速過程中作用在物體上的力。手機加速度傳感器采集的數(shù)據(jù)為x,y 和z 3 條軸方向上承受加速度/重力加速度的浮點數(shù)時間序列,通常為-3~3。本文作者對基于手機加速度傳感器的身份認證方法進行研究,針對手機端設備本身的特點,利用手機自帶加速度傳感器采集用戶書寫的手勢軌跡數(shù)據(jù)[16],視為筆跡簽名在手機中的另外一種體現(xiàn)形式,對該原始數(shù)據(jù)進行預處理和特征提取,以此作為生物的行為特征;并結(jié)合支持向量機,進而達到實現(xiàn)用戶身份認證的目的。
圖1 身份認證流程圖Fig.1 Flowchart of identity authentication
圖1 所示為本文所提算法的流程圖:1) 用戶使用手機根據(jù)自己的習慣多次書寫得到相應的軌跡數(shù)據(jù);2) 手機加速度傳感器采集手勢軌跡的加速度;3)對采集到的原始加速度進行預處理;4) 基于小波分解進行特征提取;5) 使用特征向量集訓練SVM 模型;6) 在認證階段,同樣用戶使用手機書寫軌跡,進行上面步驟2)~4)的處理之后得到該軌跡的特征向量;7) 將特征向量放入到步驟5)得到的SVM 模型中進行鑒定認證,從而得到身份認證結(jié)果。
用戶手勢軌跡的大小、形狀和力度可以通過手機的加速度來體現(xiàn)。用戶在利用手機書寫手勢軌跡時,手機在空間中的加速度也會發(fā)生相應變化,利用手機自帶的加速度傳感器來采集手機在空間中每個時刻上x,y 和z 3 個方向的加速度作為最原始的手勢軌跡數(shù)據(jù)。
每一次采集數(shù)據(jù)時,用戶使用手機根據(jù)自己的習慣書寫手勢軌跡,此時,通過手機的加速度傳感器采集到該手勢軌跡從開始到結(jié)束過程中每個時刻(即每一幀)手機在三維空間中x,y 和z 3 個方向的加速度,將這些數(shù)據(jù)保存為1 個n 行3 列的矩陣形式。其中時間為t1,t2, …,tn;n 表示該時段內(nèi)采集到的手勢軌跡幀數(shù);每一列均表示1 個方向上的加速度隨時間的變化,因此,每個矩陣可以表示1 個手勢軌跡。該加速度的矩陣形式A 為
式(1)中3 列分別表示x,y 和z 3 個方向的加速度。
為便于特征提取和SVM 模型訓練,需對采集到的原始加速度曲線進行預處理,包括平滑去噪、邊界檢測和長度歸一化,以消除采集時手抖動和傳感器本身帶來的噪聲,提取出有用的手勢軌跡并將每個手勢軌跡長度變?yōu)橐恢隆?/p>
首先使用簡單移動平均線(simple moving average,SMA)方法進行處理,從而使得曲線更加光滑,其表達式為
其中:m 表示數(shù)據(jù)段的窗口大小,本文中設置的m 為7。使用當前幀i 及它之前m-1 幀的加速度之和的平均值aSMAnow來替代表示當前幀的加速度ai。同時,為了處理方便,將曲線進行平移變換,通過取第1 幀和最后1 幀位置的和求均值作為平移量,把曲線的開始點平移到坐標軸原點附近,從而得到新的矩陣ASMA。
當手機處于平穩(wěn)狀態(tài)時,采集到的加速度在一段時間內(nèi)變化也是比較平穩(wěn)的,故可采用改進的加窗口的門限值方法對手勢軌跡的邊界進行判定。設置窗口大小為7,門限值為0.5 m/s2。從加速度矩陣ASMA的第1 幀開始逐幀向后檢測,在窗口段內(nèi)的平均加速度變化不超過門限值,則對下一個窗口段內(nèi)的數(shù)據(jù)進行檢測。若某一個窗口段內(nèi)的平均加速度變化超過門限值,則判定該窗口段對應時刻為手勢軌跡的開始時刻,此窗口段的第1 幀作為手勢軌跡開始的首幀,記為t1。同時,從加速度矩陣ASMA的最后1 幀開始逐幀向前檢測,在窗口段內(nèi)的平均加速度變化不超過門限值,則對前1 個窗口段內(nèi)的數(shù)據(jù)進行檢測。若某一個窗口段內(nèi)的平均加速度變化超過門限值,則判定此時手勢軌跡結(jié)束,此窗口段的最后1 幀作為手勢軌跡結(jié)束的尾幀,記為ts。最后,將t1幀和ts幀及它們之間的幀提取出來,即獲得一個完整的手勢軌跡加速度AS,長度記為S(S≤n)。該加速度數(shù)據(jù)矩陣形式記為AS。
每一次采集手勢軌跡時所用的時間不同,導致加速度曲線長度也不相等。為便于特征提取,需對AS長度歸一化。設置長度歸一化閾值為L=200 幀,得到歸一化之后的加速度矩陣為AL。具體處理如下:
1) 當其長度S 等于閾值L 時,AS不需要進行處理,即AL=AS;
2) 當其長度S 小于閾值L 時,需要對數(shù)據(jù)AS進行插值處理。按如下方法處理:首先計算j=[(L ×i)/ S ],i=1,2, …,S(其中,[ ]表示對結(jié)果取整運算)。把對應i 下的xi依次賦值給對應j 的yj,將所有的 yj按下標 j 遞增規(guī)則依次排列為yj1,yj2, …,yjh,顯然有jh=L;然后,令j=1,依次遞增至L,若j 滿足j<j1,則yj=yj1;若j 滿足jk<j<jk+1(k=1,2, …,h-1),則采用線性插值法來計算AL中的第j 個分量yj,計算式為
3) 當長度S 大于閾值L 時,需對數(shù)據(jù)AS降采樣,若滿足計算式j=[(L ×i)/ S](i=1,2, … ,S)的i 只有1個,則令yj=xi;若滿足式子j=[(L ×i)/ S]的i 有多個,則計算這些i 對應的分量均值作為第j 幀的結(jié)果。
本文針對手機端采集到的數(shù)據(jù),結(jié)合小波多分辨率理論和Mallat 算法,提出基于小波變換的手勢軌跡特征提取算法對AL特征提取,最后得到1 次手勢軌跡的特征向量FFFF。
輸入:預處理后的手勢軌跡加速度矩陣AL,包括x,y 和z 3 個方向數(shù)據(jù)。
第3 步:求取所選擇的各層信號的能量。小波變換中信號的能量求解公式為
圖2 小波多層分解結(jié)構(gòu)圖Fig.2 Structure diagram of multiwavelet decomposition
第4 步:提取特征向量。根據(jù)式(4)可知從x,y和z 這3 個方向的加速度信號都可以提取到1 個低頻逼近信號和N 個高頻細節(jié)信號的能量,進行組合并分別記為Ex,Ey和Ez。
將式(5)中Ex,Ey和Ez再進行組合,構(gòu)成手勢軌跡的特征向量FFFF:
根據(jù)上述基于小波變換多層分解的特征提取,1次手勢軌跡最終可以使用特征向量FFFF 表示。
2 類問題中,1 個訓練集Dk表示成
式中:yi為樣本xi的標簽;d 為樣本維數(shù);N 為樣本個數(shù)。xi若為正樣本,則yi標記為+1;若特征向量xi為負樣本,則yi標記為-1。因此,支持向量機分類器fk定義為
其中: wTx +b 為邊界函數(shù),它可以通過式(9)求得。
K(xi,x)為核函數(shù);DSV為支持向量集合,即 αi為非零所對應的訓練樣本。
本文中采集數(shù)據(jù)所用的手機為2011-05 上市的三星I9001,CPU 為比較常見的高通驍龍Snapdragon MSM8255,最低頻率為122 MHz,最高頻率可達1.4 GHz;RAM 容量為512 M,實際運行內(nèi)存為357 M;ROM 為8 G。手機的操作系統(tǒng)為Android OS 2.3.6,電池容量為1 650 mA·h,自帶有方向傳感器、加速度傳感器和距離傳感器等。采集的數(shù)據(jù)規(guī)格為60 幀/s,即采樣頻率為60 Hz,這與人的一般手勢運動頻率高6倍左右[17]。在實驗過程中,采集了18 個人的手勢軌跡,其中13 名男性,5 名女性。預設2 個特定的手勢,分別為小寫字母“a”和漢字“中”,這2 個類型的手勢軌跡不是很復雜,且人們普遍比較熟悉,易于執(zhí)行。
每天分別對每個人2 個類型的手勢軌跡采集15次以上數(shù)據(jù),共采集10 d。最后,手勢軌跡的數(shù)據(jù)均有3 000 多個樣本,組成2 個實驗數(shù)據(jù)集,記為“數(shù)據(jù)集一”和“數(shù)據(jù)集二”。采用拒真率和識假率這2個鑒定認證的性能指標來進行評價。拒真率(false rejection rate,用符號FFRR表示)指的是將原本正確合法的用戶錯誤識別為非法用戶而拒絕接受的情況所占的百分比,識假率(false acceptance rate,用符號FFAR表示)即把原本非法的用戶錯誤識別為合法用戶而接受的情況所占的百分比。在認證中,應該盡量降低識假率以達到較好的安全性能。在實驗分析中,為了定性分析幾個方面的因素對最終結(jié)果的影響,在采用不同的小波基函數(shù)、訓練樣本數(shù)量、數(shù)據(jù)曲線的單調(diào)性和支持向量機中的參數(shù)這4 個方面分析其對識假率FFAR和拒真率FFRR的影響。
1) 對“數(shù)據(jù)集一”進行比較分析結(jié)果如表1 所示。比較分析時,分別選擇正、負樣本數(shù)10 個來構(gòu)建訓練樣本集,剩下的樣本隨機選擇一部分作為測試集,選擇不同小波基函數(shù)在不同層數(shù)分解下對身份認證性能的影響,其中得到的結(jié)果FFAR和FFRR是依次使用18個采集者用作合法用戶進行18 次實驗求得結(jié)果的平均值。同樣,對“數(shù)據(jù)集二”進行實驗分析得到的實驗結(jié)果如表2 所示。
表1 由“數(shù)據(jù)集一”在不同小波基函數(shù)和不同分解層數(shù)時得到的FFRR 和FFARTable 1 FFRR and FFAR from Dataset 1 with different wavelet functions and different levels of decomposition
表2 由“數(shù)據(jù)集二”在不同小波基函數(shù)和不同分解層數(shù)時得到的FFRR 和FFARTable 2 FFRR and FFAR from Dataset 2 with different wavelet functions and different levels of decomposition
由表1 和表2 可知:使用dmey 小波基函數(shù)進行小波5 層分解提取特征時,得到的FFAR和FFRR要比其他小波基函數(shù)的效果好,尤其是其中FFAR相對較低,這在身份認證中是比較重要的1 個因素。可知分解層數(shù)對認證的影響是:分解層數(shù)較低可能包含冗余點而影響認證;分解層數(shù)太高,就會丟失一些關(guān)鍵點。
2) 針對手機端數(shù)據(jù)采集的有限性,應用中若采集過多的訓練數(shù)據(jù),則會加重數(shù)據(jù)計算處理負擔,為此進行了訓練樣本集規(guī)模對身份認證結(jié)果影響的研究。分析“數(shù)據(jù)集一”的結(jié)果如表3 所示。分析時,對預處理后的數(shù)據(jù)使用dmey 小波基函數(shù)在小波5 層分解下提取特征向量組成不同規(guī)模的訓練樣本集,然后用于支持向量機模型訓練;進行身份認證得到的FFAR和FFRR也是依次使用18 個采集者作為合法用戶時求得結(jié)果的平均值。表3 中訓練樣本個數(shù)中正、負樣本數(shù)量各占訓練集總數(shù)的1/2。同樣,對“數(shù)據(jù)集二”進行實驗分析,最后得到的實驗結(jié)果如表4 所示。
表3 由“數(shù)據(jù)集一”在不同規(guī)模訓練樣本集下得到的FFRR和FFARTable 3 FFRR and FFAR from Dataset 1 with different sizes of training samples
表4 由“數(shù)據(jù)集二”在不同規(guī)模訓練樣本集下得到的FFRR和FFARTable 4 FFRR and FFAR from Dataset 2 with different sizes of training samples
從表3 和表4 可知:訓練樣本集規(guī)模對身份認證的性能有一定影響,本文選擇正負訓練樣本的模板數(shù)分別為12 個時得到的FFAR和FFRR要比其他規(guī)模的訓練樣本集效果好,其中FFAR也相對較低。
3) 支持向量機中參數(shù)C 和γ對核函數(shù)有一定影響,從而影響身份認證的結(jié)果。在支持向量機模型訓練前,選用的是4 折交叉驗證,通過實驗對其得到的C 和γ是否為最優(yōu)的參數(shù)進行論證分析。當C 和γ均在區(qū)間(2-10,210)范圍內(nèi)變化時,每對C 和γ均可以求得1個準確率。當采集者為合法用戶時,訓練樣本集為24個(其中正、負樣本各12 個),采用dmey 小波基函數(shù)進行5 層分解提取特征向量,使用并行格點搜索的4折交叉驗證得到不同C 和γ下的準確率,如圖3 所示。
圖3 不同C 和γ下交叉驗證得到的準確率Fig.3 Accuracy of cross-validation with different C and γ
根據(jù)圖3 中最高的準確率可以得到最優(yōu)的C 和γ,分別為1.0 和0.5。然后,將這2 個參數(shù)用在整個訓練集上,訓練支持向量機模型使用測試集進行驗證,得到的認證率為97.55%。進一步選擇其他C 和γ進行實驗,在測試集上求認證率,結(jié)果如圖4 所示。圖4 中橫坐標為C,縱坐標為測試集的認證率,不同的曲線表示不同的γ對應的認證率。
從圖4 可以看出:當C=1,γ=0.5 時,測試樣本集能得到的認證率最高。因此,本文根據(jù)交叉驗證得到的C 和γ對使用整個訓練樣本集訓練的支持向量機模型具有較好效果,得到的分類器模型具有很高的認證率。
圖4 不同C 和γ下訓練的SVM 對測試樣本求得的認證率Fig.4 Authentication rate of SVM to test samples with different C and γ
預處理后的數(shù)據(jù)曲線在波峰、波谷和曲線的單調(diào)性上表現(xiàn)出一定的原始特征,對其性能進行分析,并與基于小波多層分解提取的特征進行的認證結(jié)果進行比較。其中,小波多層分解采用dmey 小波基函數(shù)進行5 層分解,訓練樣本集中正、負樣本分別為12 個,依次使用18 個采集者用作合法用戶求得FFAR和FFRR,統(tǒng)計兩者的均值作為最終結(jié)果,對“數(shù)據(jù)集一”進行實驗,得到的FFAR和FFRR對比結(jié)果如表5 所示。同樣,對“數(shù)據(jù)集二”進行實驗分析,得到的實驗結(jié)果如表6 所示。
從表5 和表6 可知:基于小波多層分解提取到的手勢軌跡特征向量能更好地表現(xiàn)同類手勢軌跡之間的相似性,也能很好地表現(xiàn)不同類手勢軌跡之間的差異性。同時,該特征向量的維數(shù)比原始數(shù)據(jù)的維數(shù)要低,從而能有效地提高支持向量機的訓練和測試樣本的匹配效率。
表5 “數(shù)據(jù)集一”下2 種不同特征的FFRR 和FFARTable 5 FFRR and FFAR of two different characteristics from Dataset 1
表6 “數(shù)據(jù)集二”下2 種不同特征的FFRR 和FFARTable 6 FFRR and FFAR of two different characteristics from Dataset 2
1) 提出了基于小波變換的特征提取,利用SVM思想,對用戶手勢軌跡的加速度數(shù)據(jù)進行鑒定認證,判定該用戶是否為合法用戶,進而控制用戶能否訪問手機上的資源,從而達到一個更自由方便、安全性高和體驗性好的手機用戶身份認證的目的。
2) 所提出的基于手機加速度傳感器的身份認證方法準確率達96%以上,這表明基于小波變換提取的特征結(jié)合支持向量機分類器實現(xiàn)的手機端的身份認證算法具有很好的效果和推廣價值。
[1] Khan W, Xiang Y, Aalsalem M, et al. Mobile phone sensing systems: A survey[J]. IEEE Communications Surveys &Tutorials,2013,15(1):402-427.
[2] Selimis G, Fournaris A, Kostopoulos G, et al. Software and hardware issues in smart card technology[J]. Communications Surveys and Tutorials,2009,11(3):143-152.
[3] Chakraborty G, Chakraborty B, Patra J, et al. An MLP-based face authentication technique robust to orientation[C]// IEEE International Conference on Neural Networks. Atlanta: IEEE Computer Society,2009:481-488.
[4] Zhang J, Liu X, Chen B. The design and implementation of ID authentication system based on fingerprint identification[C]//IEEE International Conference on Intelligent Computation Technology and Automation.Shenzhen: IEEE Computer Society,2011:1217-1220.
[5] Kang B, Park K. A new multi-unit iris authentication based on quality assessment and score level fusion for mobile phones[J].Machine Vision and Applications,2010,21(4):541-553.
[6] Chapran J. Biometric writer identification: feature analysis and classification[J]. International Journal of Pattern Recognition and Artificial Intelligence,2006,20(4):483-503.
[7] Tan S. Neighbor-weighted k-nearest neighbor for unbalanced text corpus[J]. Expert Systems with Applications, 2005, 28(4):667-671.
[8] Sim K. Training HMM structure and parameters with genetic algorithm and harmony search algorithm[J]. Journal of Electrical Engineering and Technology,2012,7(1):109-114.
[9] Neaupane K, Achet S. Some applications of a backpropagation neural network in geo-engineering[J]. Environmental Geology,2004,45(4):567-575.
[10] Stefano L, Mattoccia S, Tombari F. ZNCC-based template matching using bounded partial correlation[J]. Pattern Recognition Letters,2005,26(14):2129-2134.
[11] Weiss R, De Luca A. PassShapes: Utilizing stroke based authentication to increase password memorability[C]//Proceedings of the 5th Nordic Conference on Human-computer Interaction: Building Bridges. New York: ACM Press, 2008:383-392.
[12] Chong M K, Marsden G. Exploring the use of discrete gestures for authentication[C]// Human-Computer Interaction-INTERACT 2009.Heidelberg,Berlin:Springer,2009:205-213.
[13] Farella E, O’Modhrain S, Benini L, et al. Gesture signature for ambient intelligence applications: A feasibility study[C]//Pervasive Computing. Heidelberg, Berlin: Springer, 2006:288-304.
[14] Liu J, Zhong L, Wickramasuriya J, et al. User evaluation of lightweight user authentication with a single tri-axis accelerometer[C]// Proceedings of the 11th International Conference on Human-computer Interaction with Mobile Devices and Services.New York:ACM,2009:15.
[15] Liu J,Zhong L,Wickramasuriya J, et al. uWave:Accelerometerbased personalized gesture recognition and its applications[J].Pervasive and Mobile Computing,2009,5(6):657-675.
[16] Ruiz J, Li Y, Lank E. User-defined motion gestures for mobile interaction[C]// CHI'11 of the SIGCHI Conference on Human Factors in Computing Systems. New York: ACM, 2011:197-206.
[17] 陳文. 基于加速度傳感器的智能終端手勢識別關(guān)鍵技術(shù)研究[D]. 長沙: 國防科技大學計算機科學與技術(shù)系,2011:1-30.CHEN Wen. Gesture recognition based on the accelerometer of the intelligent terminals[D]. Changsha: School of National University of Defence Technology. Department of Computer Science and Technology,2011:1-30.