胡園園 ,胡愛群 ,李 晟 ,劉佳琪 李 冰
1 東南大學網(wǎng)絡空間安全學院 南京 中國 211189
2 東南大學信息科學與工程學院 南京 中國 211111
3 南京理工大學紫金學院計算機學院 南京 中國 210023
對終端設備實施接入認證以杜絕非法接入是保障有線網(wǎng)絡安全的重要措施。目前應用的接入認證方法主要有對終端設備的MAC 地址進行認證,以及基于數(shù)字證書的安全認證。但IP 地址和MAC 地址容易被篡改和偽造,因此基于MAC 地址的接入認證不足以保障有線網(wǎng)絡的安全。而基于數(shù)字證書的接入認證雖然相對安全,但使用過程復雜且數(shù)字證書本身也存在被竊取、盜用的風險,這在大規(guī)模的網(wǎng)絡應用中是不方便的。因此,有線網(wǎng)絡需要更安全和方便的安全機制。
近些年的研究表明,通信用設備發(fā)射的信號具有物理指紋特征。該特征類似于人的指紋,稱為設備指紋或設備DNA,是設備中的電子元器件因制造容差或漂移容差等物理因素導致的固有特性,無法改變和偽造。利用設備指紋對設備進行識別和認證具有難以克隆和偽造以及對上層協(xié)議透明等優(yōu)點,目前已在無線網(wǎng)絡認證中引起了高度關注,在無線WiFi、LTE 和Zigbee 等無線系統(tǒng)都有廣泛研究[1-3]。例如,彭林寧等人[4]利用差分星座軌跡圖(CTF)和來自CTF 的載波頻偏、調(diào)制偏移與I/Q 偏移等多個設備指紋特征,很好地實現(xiàn)了對Zig-bee 設備的分類識別。
有線網(wǎng)絡中,一張普通的網(wǎng)卡也含有大量的電子元器件,電子元器件也會因制造容差和漂移容差而造成不同的物理特征。此外,網(wǎng)卡工作環(huán)境(如溫度、噪聲、傳輸通道等因素)的變化也會導致其物理特征的變化[5]。文獻[6]的研究表明,這些物理層特征在不同網(wǎng)卡中是唯一的,即使是同一廠家同一型號同一系列甚至是同一批次的通信設備也會存在微小差異。因此,受無線系統(tǒng)中設備指紋識別成功的啟發(fā),自2006 年起,有線領域也開始了基于設備指紋識別和認證的研究[7-8]。2011 年,Gerdes 首次證實了從以太網(wǎng)網(wǎng)卡信號中可以提取出有效的網(wǎng)卡指紋[9]。后來,陸續(xù)有專家研究有線網(wǎng)絡設備指紋的提取和識別,但截至目前,國內(nèi)外涉足有線網(wǎng)絡設備指紋的提取與識別的研究仍然較少。
無線設備的指紋可從瞬態(tài)信號中提取,也可從穩(wěn)態(tài)信號中提取。瞬態(tài)信號[10]是設備開/關瞬間產(chǎn)生的信號,不包含任何數(shù)據(jù)信息,只體現(xiàn)設備的硬件特征,具有“獨立性”,射頻指紋最初就是從瞬態(tài)信號中提取的[11]。但是瞬態(tài)信號持續(xù)時間短,難以捕獲,而且需要采樣率很高的接收機(比如高性能示波器),對突變點檢測和定位較為敏感,需要高信噪比條件,這些弊端限制了基于瞬態(tài)信號的設備指紋的應用。而且,根據(jù)Gerdes 等人[12]的研究,瞬態(tài)響應在有線網(wǎng)絡的傳輸過程中非常微弱,獲得的數(shù)據(jù)不足以為有線網(wǎng)卡的區(qū)分提供充足的特征,且很難在幀頭捕捉到瞬態(tài)信號。因此,瞬態(tài)信號不適用于有線設備的指紋提取。因而本文主要研究從穩(wěn)態(tài)信號中提取網(wǎng)卡指紋的方法。
穩(wěn)態(tài)信號是指瞬態(tài)信號之后,設備處于穩(wěn)定工作狀態(tài)時的信號。穩(wěn)態(tài)信號持續(xù)時間長,更容易獲得,利用廉價的接收機即可完成。目前針對有線設備指紋的提取也都基于穩(wěn)態(tài)信號,主要的研究有:2012年,Gerdes[12]利用自適應濾波結(jié)合傅里葉變換提取出網(wǎng)卡指紋,對27個10M 以太網(wǎng)網(wǎng)卡的識別率達到94.0%;2015~2016年,Carbino 等人[13-14]利用基于星座獨特本質(zhì)屬性(CB-DNA)的方法,將以太網(wǎng)卡無意的電纜輻射信號映射到二維星座空間從而提取出網(wǎng)卡指紋,對16個10M 以太網(wǎng)網(wǎng)卡的識別率達到93.1%;2017年,Ross[15]利用有線信號獨特本地屬性(WS-DNA)方法從電力線通信系統(tǒng)中的Hub 設備信號中提取指紋,對6個Hub 設備在信噪比SNR=46時識別率達到99.0%;2019年,國內(nèi)的彭林寧等人[16]利用臨近星座恍惚狀態(tài)圖(ACTF)提取出光纖以太網(wǎng)設備的指紋,對24個光纖以太網(wǎng)設備的識別率高達99.49%。
目前,針對有線網(wǎng)卡指紋提取的研究成果僅有上面這些。這些研究大都基于10M 有線網(wǎng)卡,而當前10M有線網(wǎng)卡已非主流,而是被更高的100M及以上速率的網(wǎng)卡所替代。另外,研究的樣本量較低,網(wǎng)卡識別率也普遍不高。相對于一塊10M 有線網(wǎng)卡發(fā)出的前導碼信號固定不變,為了避免出現(xiàn)連續(xù)長度的重復數(shù)據(jù),保證輸出均勻功率的數(shù)據(jù)信號,100M有線網(wǎng)卡在發(fā)送數(shù)據(jù)時會對數(shù)據(jù)進行加擾[17-18],這樣一塊100M 有線網(wǎng)卡發(fā)出的前導碼信號會隨機變動,因此,不能使用前導碼信號提取特征。另外,100M 有線網(wǎng)卡不再如10M 有線網(wǎng)卡那樣采用曼徹斯特編碼(用跳變沿表示二進制0 或1,從高電平到低電平跳變表示0,反之表示1),而是先進行4B/5B 編碼再進行三電平的MLT-3 編碼[19-21](信號分正電平、負電平、零電平三種電位狀態(tài),用電平不變表示二進制0,用電平跳變表示二進制1),這樣二進制0 的波形沒有變化,二進制1 的波形變化不固定,基于波形星座圖的特征提取方法不適用。因此,本文針對50塊100M 速率的以太網(wǎng)網(wǎng)卡展開研究,提出一種基于最小均方誤差(Least Mean Square)自適應濾波算法(以下簡稱LMS 算法)的指紋提取方法,該方法能夠直接從100M 以太網(wǎng)網(wǎng)卡的穩(wěn)態(tài)信號中提取出網(wǎng)卡指紋,無需信號的任何先驗知識,簡單方便,且提取的網(wǎng)卡指紋產(chǎn)生自網(wǎng)卡本身的物理特性,不可克隆,無法被篡改。
LMS 算法[22]是一種自適應濾波算法,自適應濾波算法的核心思想就是調(diào)整濾波器自身參數(shù),使濾波器的輸出信號與期望輸出信號之間滿足某種最佳準則要求。不同的準則可以產(chǎn)生不同的自適應濾波算法,如基于最小均方誤差、遞推最小二乘(RLS)、變換域、子帶分解以及QR 分解等自適應濾波算法。其中,由Widow 和Hoff 提出的最小均方誤差算法(以下簡稱LMS 算法),具有計算量小、易于實現(xiàn)、穩(wěn)定性好等優(yōu)點而在實踐中被廣泛采用。
LMS 算法的準則是使均方誤差達到最小,即期望響應與濾波器實際輸出之差的平方的期望值達到最小,并且依據(jù)這個準則來修改權(quán)重系數(shù)向量。如圖1 所示為LMS 算法原理圖。
現(xiàn)要求期望響應與濾波器實際輸出之間滿足LMS 準則,即求min [E(e2n,使期望響應與濾波器實際輸出之差的平方的期望值Ee2n達到最小。
根據(jù)最速下降理論,沿著目標函數(shù)最速下降方向(即負梯度方向)調(diào)整濾波器權(quán)重系數(shù),會找到目標函數(shù)的最小值,因而對min [E(e2n求導并使導數(shù)為0,得到:
按照公式(3) (μ為收斂因子)來迭代修改自適應濾波器的權(quán)重系數(shù)W,期望響應與濾波器實際輸出之差會越來越小,濾波器實際輸出會無限逼近期望響應。給定收斂因子μ,濾波器的權(quán)重系數(shù)最終會收斂到一個固定值,此時濾波器實際輸出與期望響應之間的誤差最小。
LMS 算法可不需要任何關于目標信號的先驗知識而可直接從目標信號中提取出其特征指紋。鑒于目前國內(nèi)外對有線以太網(wǎng)網(wǎng)卡指紋的研究成果較少,對于有線以太網(wǎng)網(wǎng)卡的信號特征缺少先驗知識,因此本文提出基于LMS 算法提取有線以太網(wǎng)網(wǎng)卡指紋。
本文研究從有線以太網(wǎng)網(wǎng)卡的穩(wěn)態(tài)信號中提取網(wǎng)卡的物理特征。如引言所述,網(wǎng)卡的工作環(huán)境如溫度、噪聲、傳輸通道(包括傳輸介質(zhì)、介質(zhì)長度)等因素也會引起物理特征的變化,這些因素為網(wǎng)卡信號增加了隨機和非平穩(wěn)成分,必須盡可能地將其差異最小化以獲得一致的測量結(jié)果。為此,本文盡可能地在同一環(huán)境下采集網(wǎng)卡信號,這樣,信號的傳輸通道相同,采集信號時的溫度、噪聲變化不大,網(wǎng)卡的物理特征因此而產(chǎn)生的差異可忽略不計。
有線以太網(wǎng)網(wǎng)卡一般作為用戶PC的網(wǎng)絡接口卡與交換機互聯(lián),其網(wǎng)絡環(huán)境是遵守IEEE 802.3 標準的以太網(wǎng)[23]。以太網(wǎng)使用的傳輸介質(zhì)主要包括同軸電纜、雙絞線、光纖。根據(jù)不同的傳輸速率和距離要求,基于這三類介質(zhì)的信號線又衍生出很多不同的種類。目前最主流的傳輸介質(zhì)是100BASE-T 和1000BASE-T 的5 類雙絞線,它們的傳輸速率分別為100Mbps 和1000Mbps。考慮1000BASE-T 雙絞線即使工作在半雙工模式下,在空閑時交換機也會給網(wǎng)卡傳輸數(shù)據(jù),這會干擾網(wǎng)卡發(fā)出的信號,因此本文采集基于100BASE-TX 標準傳輸(采用5 類雙絞線、100Mbps 傳輸速率)的網(wǎng)卡信號。
IEEE 802.3 標準規(guī)定以太網(wǎng)中傳輸?shù)臄?shù)據(jù)包格式如圖 2 所示,該數(shù)據(jù)包格式被稱為以太網(wǎng)MAC 幀。
在傳輸每個以太網(wǎng)MAC 幀時,網(wǎng)卡會先發(fā)一段前導碼,內(nèi)容為連續(xù)7 個字節(jié)的0x55,用于使收發(fā)雙方的時鐘同步;然后發(fā)一個字節(jié)的幀開始定界符,內(nèi)容為0xD5,用于指示以太網(wǎng)MAC 幀的開始。隨后的以太網(wǎng)MAC 幀的每個字段會隨傳輸數(shù)據(jù)和網(wǎng)卡的不同而變化。如2.1 節(jié)所述,100M 有線網(wǎng)卡在發(fā)送數(shù)據(jù)時會對數(shù)據(jù)進行加擾[33],導致發(fā)出的前導碼信號會隨機變動,不能使用100M 有線網(wǎng)卡的前導碼信號提取特征。因此,本文采集包含前導碼在內(nèi)的若干個完整的以太網(wǎng)MAC 幀信號,從長信號段中提取指紋特征以降低擾碼對信號波形的影響。同時,為了盡量減少數(shù)據(jù)對網(wǎng)卡信號的影響,本文采集網(wǎng)卡空閑時的信號,也就是不傳輸用戶數(shù)據(jù)時的信號。
在有線網(wǎng)卡發(fā)送數(shù)據(jù)信息時,傳輸介質(zhì)上便會產(chǎn)生相應的模擬電平信號,這些信號按照IEEE 802.3標準約定的數(shù)據(jù)傳輸協(xié)議與數(shù)據(jù)編碼協(xié)議生成,需要在保留其物理層特征的前提下進行采集,作為提取網(wǎng)卡指紋的原料。為此,本文采用過采樣方式在網(wǎng)卡和交換機之間的線路上采集以太網(wǎng)網(wǎng)卡的完整的兩路差分信號。采集網(wǎng)卡信號的組網(wǎng)如圖3 所示,待采集的網(wǎng)卡通過100Mbps 速率的雙絞線連接交換機,AD9484 信號采集板串聯(lián)在網(wǎng)卡與交換機之間,使用625Mbps 的采樣率、8bit/樣點的采樣精度來采集網(wǎng)卡與交換機間的閑時信號(即不傳輸用戶數(shù)據(jù)情況下的信號),采集的信號經(jīng)過USB 接口存儲到電腦中。
本次實驗實際采集到的網(wǎng)卡信號如圖4 所示。而100BASE-TX 標準傳輸?shù)木W(wǎng)卡信號按MLT-3 編碼方式編碼[32],其標準信號波形如圖5 所示。
對比圖4 和圖5 可以發(fā)現(xiàn),實際的網(wǎng)卡信號波形與標準的MLT-3 編碼波形相比,并沒有那么完美,存在著許多抖動與毛刺,而這其中正包含著網(wǎng)卡的物理特征。從采集到的網(wǎng)卡信號中將這些特征提取并數(shù)據(jù)化,就可以作為發(fā)送設備的身份認證信息。在本文中,將提取的這些特征信息統(tǒng)一稱為“網(wǎng)卡指紋”。
本文利用LMS 算法提取有線網(wǎng)卡指紋,如圖6所示為提取指紋的整個過程:首先將采集的網(wǎng)卡信號進行預處理,以消除影響指紋提取的因素;再通過判決整形和符號同步獲得與接收信號同步的本地時鐘信號,用此同步時鐘對判決整形后的信號重新采樣,即可獲得與接收信號同步的理想信號。將理想信號作為LMS 自適應濾波器的濾波輸入,預處理后的接收信號作為LMS 自適應濾波器的期望響應,使得理想信號在濾波后以最小均方誤差逼近接收信號。自適應濾波器收斂后,采用濾波器的權(quán)重系數(shù)作為網(wǎng)卡指紋。
用上述方法提取同一網(wǎng)卡多個采集信號的指紋信息,取這些指紋信息的平均值,即可獲得較為穩(wěn)定的網(wǎng)卡指紋。
預處理主要目的是消除環(huán)境因素對采集信號的影響,以方便特征提取。一般包括直流分量、功率歸一化等。但本文采集的網(wǎng)卡信號采用曼徹斯特編碼,該編碼下每位編碼中信號都會跳變一次,因此不存在直流分量,具有良好的抗干擾性能,因而無需去除直流分量。但網(wǎng)卡和交換機之間距離的變化會導致接收功率的變化,因此需要通過功率歸一化來消除接收功率等與采集環(huán)境相關的差異。功率歸一化方法比較簡單。就是首先計算采集信號的各電平幅度的平均值,然后將各電平除以該平均幅度即可將功率歸一化。
為了有效地抑制具體數(shù)據(jù)對于指紋提取的影響,信號進行功率歸一化處理后,還需將兩路差分信號相減,使用相減后的信號作為指紋提取的接收信號。
如圖6 所示,在利用LMS 算法提取網(wǎng)卡指紋系統(tǒng)中,LMS 自適應濾波器需要一個理想信號作為濾波輸入,該理想信號須與接收信號同步,否則兩個信號段的起始位置在一個周期內(nèi)可能是不同的,這樣會弱化提取特征的有效性。本文設計先通過“判決整形”和“符號同步”獲得與接收信號同步的本地時鐘信號,再使用該本地時鐘信號重新采樣判決整形后的信號,即可獲得與接收信號同步的理想信號。
4.2.1 判決整形
判決整形的目的是將接收信號的波形整形為與理想的差分曼徹斯特編碼波形相似的方波,本文將判決門限設定為接收信號各個電平的平均幅度值的1/2。如圖7 所示為接收信號判決整形后的波形與接收信號波形對比圖。
4.2.2 符號同步
符號同步的目的是獲得與接收信號同步的本地時鐘信號。為此,本文通過提取判決整形后的信號的上升沿和下降沿生成脈沖序列,并在本地生成一個與信號數(shù)據(jù)速率相同的本地時鐘信號,然后通過循環(huán)移位并計算脈沖序列與本地時鐘信號的異或的和,異或和最小的本地時鐘信號即為與接收信號同步的本地時鐘信號。
如圖8 所示為獲取的理想信號波形與接收信號波形的對比圖。從圖中可以看到,理想信號與接收信號的時鐘是同步的。
如圖6 所示,將上面獲得的理想信號作為LMS自適應濾波器的輸入信號,將預處理后的接收信號經(jīng)過延時后作為期望響應,分別送入LMS 自適應濾波器,使得理想信號在濾波后以最小均方誤差逼近接收信號。
假設接收信號包含M個數(shù)據(jù),接收信號為zmn,m=0,1,…,M–1,經(jīng)判決整形和重采樣后獲得的理想信號為xmn,m=0,1,…,M–1,則理想信號經(jīng)LMS 自適應濾波器濾波后產(chǎn)生的輸出ymn為:
ymn與接收信號zmn間的誤差為en,即:
LMS 自適應濾波器收斂后,其輸出信號與接收信號的最小均方誤差達到最小,此時認為理想信號在濾波后與接收信號基本相同,而自適應濾波器的權(quán)重系數(shù)wi?w0,w1,…,wL-1(其中L為濾波器階數(shù))則認為是接收信號與理想信號之間的差異特征,該差異特征是不同網(wǎng)卡的硬件特性對網(wǎng)卡信號的影響而產(chǎn)生的,具有唯一性,可作為網(wǎng)卡指紋。
通過上述方法對K個包含M個數(shù)據(jù)的接收信號進行指紋提取,取K組自適應濾波器的權(quán)重系數(shù)的平均值作為網(wǎng)卡指紋輸出,即可獲得較為穩(wěn)定的網(wǎng)卡指紋,計算公式如下所述。
本文實驗用到的數(shù)據(jù)集來自6 個品牌共50 塊有線網(wǎng)卡,每塊網(wǎng)卡不同類型。設備品牌和索引分別為銳捷(索引1~9)、綠聯(lián)(索引10~29)、小米(30~34)、山澤(35~42)、TP-LINK(43~46)和CE-LINK(47~50)。對50 塊網(wǎng)卡信號進行過采樣(采樣率為625MHz、采樣精度為8 比特/樣點),每塊采樣1 次共得到100 個波形段(每次差分采樣產(chǎn)生2 個波形段,使用時合成1個波形段),每個波形段捕獲625 萬個樣本點。再將每個波形段的625 萬個樣本按照設定的數(shù)據(jù)長度劃分成若干個信號片段(假設數(shù)據(jù)長度10000,則每個波形段劃分為600 個信號段),形成數(shù)據(jù)集1,其中1/3的信號段用作訓練集,2/3 的信號段用作驗證集。
LMS 算法的主要參數(shù)有數(shù)據(jù)長度L、濾波器階數(shù)N、收斂因子μ、迭代次數(shù)K(N 為了確定數(shù)據(jù)長度L、濾波器階數(shù)N、收斂因子μ三個參數(shù)相對較優(yōu)的參數(shù)設置,本文通過先變化一個參數(shù)、固定其他參數(shù),然后依據(jù)收斂性、收斂速度、穩(wěn)態(tài)誤差和計算復雜度等主要性能指標來確定相對較優(yōu)的參數(shù)設置,采用數(shù)據(jù)集1 進行參數(shù)確定實驗。 5.2.1 數(shù)據(jù)長度確定 選取濾波器階數(shù)N=261、收斂因子μ=0.0001、迭代次數(shù)K=L,然后觀察濾波器系數(shù)在達到最優(yōu)值前的理想信號與實際信號之間的誤差變化曲線,該曲線反映了濾波器權(quán)重系數(shù)的收斂性。實驗中,取初始數(shù)據(jù)長度L=100、500、2000、4000、8000、16000、50000、100000 和200000,分別用這些數(shù)據(jù)長度提取網(wǎng)卡指紋,并記錄濾波器收斂過程中的誤差值,誤差值隨數(shù)據(jù)長度L變化如圖9 所示。 從圖9 可以看到,理想信號與實際信號之間的誤差的震蕩幅度隨著數(shù)據(jù)長度的增加而增大。數(shù)據(jù)長度L低于100 時誤差曲線不收斂;超過16000 后,誤差曲線呈現(xiàn)震蕩收斂;超過50000 后,誤差曲線不再單向收斂。因此,濾波器權(quán)重系數(shù)在數(shù)據(jù)長度100 5.2.2 濾波器階數(shù)確定 選取L=10000、μ=0.0001、K=10000,分別按照濾波器階數(shù)N=[5,25,45,65,85,…,985,1005]提取網(wǎng)卡指紋,然后計算使用每一個濾波器階數(shù)提取指紋時到達平穩(wěn)狀態(tài)后的誤差(即穩(wěn)態(tài)誤差)的幅度平均值,觀察該平均值隨濾波器階數(shù)N的變化,如圖10 所示。 從圖10 可以看出,在濾波器階數(shù)為5~165 范圍內(nèi)時,穩(wěn)態(tài)誤差幅度的平均值隨著濾波器階數(shù)的增加而減小,在濾波器階數(shù)高于165 時,濾波器階數(shù)的增加對穩(wěn)態(tài)誤差幅度的平均值影響不大,階數(shù)高于285 時,穩(wěn)態(tài)誤差幅度的平均值基本不再變化。 考慮濾波器階數(shù)越大,計算復雜度越高,因此,濾波器階數(shù)推薦設置在[165,285]之間。 5.2.3 收斂因子確定 1996 年,Hayjin 證明,只要收斂因子滿足下式,LMS 算法就是按方差收斂的。 其中,λm是輸入向量xmn(即接收信號)組成的自相關矩陣R的最大特征值。由于λm常常不可知,因此,往往使用自相關矩陣R的跡來代替。按定義,矩陣的跡是矩陣主對角線元素之和: 同時,矩陣的跡又等于矩陣所有特征值之和,因此一般有tr(R)>λm。只要取: 即可滿足收斂條件。按定義,自相關矩陣的主對角元素就是各輸入向量的均方值。因此公式又可寫為: 按此公式計算,收斂因子的取值范圍大概為0<μ<0.2。 本次實驗中,分別選取μ=0.1,μ=0.01,μ=0.001,μ=0.0001,μ=0.00001,并設置數(shù)據(jù)長度L=10000,濾波器階數(shù)N=245,迭代次數(shù)K=10000 來提取網(wǎng)卡指紋,到達平穩(wěn)狀態(tài)后,理想信號與實際接收信號的誤差隨收斂因子μ的變化如圖11 所示。 從圖11 可以看出,當μ>0.01 時誤差不收斂,因此濾波器權(quán)重系數(shù)也不具備收斂性。當0<μ<0.001時,誤差收斂,因而自適應濾波器收斂,但是,隨著收斂因子減小,誤差收斂速度變慢,誤差震蕩幅度變大。因此,綜合收斂速度和收斂性,收斂因子推薦選取在[0.00001,0.001]之間。 設置數(shù)據(jù)長度L=10000、收斂因子μ=0.0001、濾波器階數(shù)N=261,迭代次數(shù)K=L,使用數(shù)據(jù)集1 提取指紋,然后分別選取不同品牌網(wǎng)卡的指紋、同一品牌不同網(wǎng)卡的指紋進行對比分析,結(jié)果分別如圖12 所示。 從圖中可以看出,無論同品牌,還是不同品牌,均能從有線網(wǎng)卡信號中提取出唯一且相對穩(wěn)定的特征指紋,但不同網(wǎng)卡之間的指紋差異性比較微弱,區(qū)分性小,尤其是同一品牌不同類型網(wǎng)卡之間的指紋差異性非常微弱。這給指紋的提取和分類識別帶來困難。 為了驗證提取的網(wǎng)卡指紋的有效性,本文使用Matlab 自帶的分類器對數(shù)據(jù)集1 和數(shù)據(jù)集2 提取出的網(wǎng)卡指紋分別進行了分類識別。 5.4.1 分類算法選取 Matlab 自帶有多種分類器,包括決策樹、判別分析、支持向量機SVM、最近鄰分類器、樸素貝葉斯分類器、集成分類器,每一種分類器又包含多種算法。為了確定選取哪些分類算法較優(yōu),本文先使用Matlab 自帶的所有分類器對訓練樣本進行分類訓練,交叉驗證折數(shù)分別設置為5 折、10 折和15 折,然后獲取訓練結(jié)束后的分類準確率,選取準確率較高的分類算法。通過實驗,當交叉驗證折數(shù)為10 折時,分類準確率普遍較高,較高的3 個分類算法分別為線性判別、線性SVM 和集成子空間判別。因此,后續(xù)使用線性判別和集成子空間判別這3 種算法對網(wǎng)卡進行分類識別,且交叉驗證折數(shù)設置為10 折。 5.4.2 使用網(wǎng)卡指紋分類識別 將數(shù)據(jù)集中的每個波形段劃分為600 個信號片段,其中前200 個信號段用于訓練,后400 個信號段用于驗證。提取每個信號片段的特征指紋,并取20個信號片段的特征指紋的平均值作為該波形段對應網(wǎng)卡的網(wǎng)卡指紋,用每個波形段前200 個信號段提取出的10 個網(wǎng)卡指紋進行分類器訓練,后400 個信號段提取出的20 個網(wǎng)卡指紋進行分類識別驗證。 設置μ=0.0001,N=261,L=2000、5000、10000、15000、20000,并設置迭代次數(shù)K=L,交叉驗證折數(shù)設置為10 折,網(wǎng)卡識別率如表1 所示。 表1 網(wǎng)卡識別率隨數(shù)據(jù)長度變化(μ=0.0001,N=261)Table 1 Change of Ethernet card recognition rate with data length(μ=0.0001,N=261) 設置N=261,L=5000,μ=0.00001、0.00005、0.0001、0.0005、0.001,并設置迭代次數(shù)K=L,交叉驗證折數(shù)設置為10 折,網(wǎng)卡識別率統(tǒng)計如表2 所示。 表2 網(wǎng)卡識別率隨收斂因子變化(N=261,L=5000)Table 2 Change of Ethernet card recognition rate with convergence factor (N=261,L=5000) 設置μ=0.0001,L=5000,N=21、81、165、261、501、1001,并設置迭代次數(shù)K=L,交叉驗證折數(shù)設置為10 折,網(wǎng)卡識別率統(tǒng)計如表3 所示。 表3 網(wǎng)卡識別率隨濾波器階數(shù)變化(μ=0.0001,L=5000)Table 3 Change of Ethernet card recognition rate with filter order (μ=0.0001,L=5000) 從表1 可以看出,在收斂因子和濾波器階數(shù)固定情況下,網(wǎng)卡識別率隨數(shù)據(jù)長度先增加后減少,在L=[1000,5000]時識別率較高;從表2 可以看出,在數(shù)據(jù)長度和濾波器階數(shù)固定情況下,收斂因子越小,網(wǎng)卡識別率越大,但同時收斂因子越小,收斂時間越長;從表3 可以看出,在數(shù)據(jù)長度和收斂因子固定情況下,網(wǎng)卡識別率在濾波器階數(shù)處于81~261 之間時較高。同時從表1、表2 和表3 也可看出,使用線性判別和集成子空間判別兩種分類算法時,本文方法提取指紋的網(wǎng)卡識別率較高,前者可在97.1%以上,后者可在97.3%以上。 如圖13 所示為線性識別和集成子空間判別兩種分類算法在識別率為0.973 和0.985 時的混淆矩陣,其中橫坐標為識別出的網(wǎng)卡索引,縱坐標為實際網(wǎng)卡索引。 從圖13 中可以看出,使用線性判別分類算法時,錯誤識別的網(wǎng)卡索引對主要包括:12->15(即網(wǎng)卡12錯誤識別為網(wǎng)卡15)、10->17、13->20、21->23/25、22->21、27->20、28->13、29->10、40->44;使用集成子空間判別分類算法時,錯誤識別的網(wǎng)卡索引對主要包括:12->15、13->20、16->18、17->16/29、20->13、21->22、22->21、26->27、29->10。 根據(jù)前文所述,索引10~29 對應綠聯(lián)網(wǎng)卡,索引40 對應山澤網(wǎng)卡,索引44 對應TP-LINK 網(wǎng)卡,因此使用本文方法提取的網(wǎng)卡指紋識別網(wǎng)卡時,錯誤主要發(fā)生在同品牌的綠聯(lián)網(wǎng)卡中;不同品牌的指紋識別只將索引為40 的山澤網(wǎng)卡錯誤識別為索引為44的TP-LINK 網(wǎng)卡,識別效果比同品牌不同類型網(wǎng)卡好。其根本原因如5.3 章節(jié)所述,不同品牌網(wǎng)卡的指紋之間的差異較大些,而同一品牌不同類型網(wǎng)卡的指紋差異較小。 本文提出了一種基于LMS 自適應濾波算法的有線網(wǎng)卡指紋提取方法,該方法不需要有線網(wǎng)卡信號特征的先驗知識,可直接從100M 以太網(wǎng)網(wǎng)卡信號中提取出網(wǎng)卡指紋。通過實驗證明,有線網(wǎng)卡確實存在特征指紋,但不同網(wǎng)卡指紋區(qū)分性小,當數(shù)據(jù)長度選取在1000~5000 范圍內(nèi)、濾波器階數(shù)選取在81~261范圍內(nèi)、收斂因子選擇在0.00001~0.0001 之間時,使用本文方法可有效提取出有線網(wǎng)卡指紋,且可獲得較好的識別效果(考慮收斂性、收斂速度、計算復雜度和穩(wěn)定誤差等因素)。 然后本文使用Matlab 自帶的分類器對提取的有線網(wǎng)卡指紋進行訓練,利用訓練的模型對網(wǎng)卡進行分類識別。十折交叉驗證結(jié)果表明,使用線性判別和集成子空間判別分類算法時,網(wǎng)卡識別率可分別達到97.2%、98.5%以上,錯誤的指紋識別主要發(fā)生在同品牌網(wǎng)卡中,不同品牌的網(wǎng)卡指紋識別效果較好。 利用本文方法提取網(wǎng)卡指紋,簡單方便,且提取的網(wǎng)卡指紋產(chǎn)生自網(wǎng)卡本身的物理特性,不可克隆,無法被篡改,利用這樣的指紋再結(jié)合合適的分類學習算法就可以對以太網(wǎng)網(wǎng)卡進行有效識別,進而可方便且可靠地實現(xiàn)對有線網(wǎng)終端設備的接入認證。在大規(guī)??刂坪妥詣踊ㄐ蓬I域(如電網(wǎng))、光纖通信領域,以及金融、保險、公安等有線專網(wǎng)領域,目前迫切需要輕量級且安全可靠的接入認證方法,本文提出的方法可以預見地具有廣闊的應用前景。5.3 提取網(wǎng)卡指紋
5.4 指紋有效性驗證
6 總結(jié)