亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于Hough變換的NAT規(guī)模被動(dòng)估計(jì)新方法*

2015-09-28 12:10:06王科人徐正國(guó)

電訊技術(shù) 2015年2期

管濤，王科人，徐正國(guó)

(盲信號(hào)處理重點(diǎn)實(shí)驗(yàn)室，成都610041)

1 引言

網(wǎng)絡(luò)地址轉(zhuǎn)換器(Network Address Translator，NAT)允許多個(gè)內(nèi)網(wǎng)主機(jī)使用相同公網(wǎng)地址連接互聯(lián)網(wǎng)，它可以緩解IPv4地址數(shù)量緊張的問(wèn)題[1]。目前，NAT已經(jīng)在互聯(lián)網(wǎng)中大量部署，范圍涵蓋了小型的家庭網(wǎng)絡(luò)以及大型的企業(yè)內(nèi)網(wǎng)。NAT提高了網(wǎng)絡(luò)使用的隱私性，隱藏了內(nèi)部網(wǎng)絡(luò)的大小和拓?fù)浣Y(jié)構(gòu)。但是，從網(wǎng)絡(luò)管理和網(wǎng)絡(luò)安全的角度來(lái)說(shuō)，NAT的大量使用嚴(yán)重影響了網(wǎng)絡(luò)的正常管理，并且造成了潛在的安全隱患。在被動(dòng)接收條件下實(shí)現(xiàn)NAT檢測(cè)對(duì)網(wǎng)絡(luò)管理和網(wǎng)絡(luò)安全威脅檢測(cè)具有重要作用，例如對(duì)僵尸網(wǎng)絡(luò)的規(guī)模檢測(cè)和未授權(quán)的設(shè)備接入等。因此，被動(dòng)接收條件下的NAT流量檢測(cè)及其規(guī)模估計(jì)成為工業(yè)界和學(xué)術(shù)界關(guān)注的問(wèn)題。

NAT流量檢測(cè)需要判斷某個(gè)IP是否使用了NAT，而NAT規(guī)模估計(jì)還要對(duì)NAT后面主機(jī)數(shù)量進(jìn)行估計(jì)。目前已有大量工作對(duì)NAT流量檢測(cè)及規(guī)模估計(jì)進(jìn)行了研究。

在NAT流量檢測(cè)方面，文獻(xiàn)[2－3]綜合了初始TTL(Time To Live)、IPID(IP Identification)、TCP SYN、TCP源端口、TCP時(shí)間戳等特征進(jìn)行NAT流量檢測(cè)。文獻(xiàn)[4－10]則采用的是流量統(tǒng)計(jì)的方法，通過(guò)訓(xùn)練學(xué)習(xí)流量特征對(duì)NAT流量進(jìn)行檢測(cè)。實(shí)驗(yàn)結(jié)果表明，這些方法均達(dá)到了較高的檢測(cè)率。

在NAT規(guī)模估計(jì)方面，文獻(xiàn)[11]最早提出利用主機(jī)發(fā)送IPID序列的連續(xù)性來(lái)估計(jì)NAT主機(jī)數(shù)目。當(dāng)IPID隨機(jī)產(chǎn)生或者為固定值(如0)時(shí)，文獻(xiàn)[11]方法會(huì)失效，文獻(xiàn)[12]在此基礎(chǔ)上進(jìn)一步關(guān)聯(lián)IPID、TCP序列號(hào)和源端口序列進(jìn)行綜合判斷。文獻(xiàn)[13]給出了一種基于TCP/IP協(xié)議棧指紋的NAT檢測(cè)方法，其適用于NAT后主機(jī)具有不同操作系統(tǒng)的情形。文獻(xiàn)[14－15]利用了HTTP協(xié)議中的User－Agent和Cookie信息出現(xiàn)的種類(lèi)數(shù)進(jìn)行估計(jì)。文獻(xiàn)[16]提取了ICMP和TCP中的時(shí)間戳值，采用時(shí)鐘漂移特征區(qū)分不同主機(jī)。文獻(xiàn)[17－18]指出了通過(guò)主機(jī)啟動(dòng)時(shí)間和TCP時(shí)鐘頻率可以唯一標(biāo)識(shí)一臺(tái)主機(jī)，因此采用TCP時(shí)間戳序列可以估計(jì)NAT規(guī)模大小。

本文主要關(guān)注的是NAT規(guī)模估計(jì)問(wèn)題，即在給定一段時(shí)間內(nèi)的網(wǎng)絡(luò)數(shù)據(jù)的條件下，研究如何準(zhǔn)確估計(jì)NAT后面主機(jī)數(shù)量?？偟膩?lái)說(shuō)，現(xiàn)有NAT規(guī)模估計(jì)的兩類(lèi)方法均存在一定問(wèn)題:統(tǒng)計(jì)IPv4、TCP或HTTP頭部中字段種類(lèi)，如TTL值、User－Agent等，其使用條件比較有限，且分辨率較差;通過(guò)提取序列特征可以更準(zhǔn)確地估計(jì)NAT規(guī)模大小，如對(duì)IPID序列、TCP序號(hào)序列和TCP時(shí)間戳序列的連續(xù)線段進(jìn)行檢測(cè)，但目前采用的方法是密度聚類(lèi)或線性遞歸，當(dāng)線段發(fā)生交叉或距離較近時(shí)誤判率較高，且無(wú)法解決初始類(lèi)別的選擇問(wèn)題。

因此，為了更好地估計(jì)出NAT規(guī)模，我們將采用Hough變換對(duì)基于TCP時(shí)間戳序列的估計(jì)方法進(jìn)行改進(jìn)。我們的解決思路為:對(duì)于TCP時(shí)間戳和數(shù)據(jù)包接收時(shí)間，由于不同主機(jī)的開(kāi)機(jī)時(shí)間和TCP時(shí)鐘頻率存在一定的差異，它們體現(xiàn)出不同的線性關(guān)系;該線性關(guān)系在坐標(biāo)圖中表現(xiàn)為直線，基于計(jì)算機(jī)視覺(jué)中的Hough變換方法遞歸放大該坐標(biāo)圖像，從而檢測(cè)出現(xiàn)的直線數(shù)目即可獲得NAT規(guī)模大小。區(qū)別于以往估計(jì)方法的地方在于，我們改變了序列連續(xù)性檢測(cè)方式，利用計(jì)算機(jī)視覺(jué)的方法解決了初始類(lèi)別的選擇問(wèn)題，并改進(jìn)了序列發(fā)生交叉或距離較近時(shí)的判斷精度。

本文組織結(jié)構(gòu)如下:第2節(jié)對(duì)NAT條件下TCP時(shí)間戳與數(shù)據(jù)包接收時(shí)間之間的關(guān)系進(jìn)行建模分析;第3節(jié)介紹基于Hough變換的NAT主機(jī)數(shù)目估計(jì)算法;第4節(jié)給出了算法在仿真和實(shí)際數(shù)據(jù)條件下的實(shí)驗(yàn)結(jié)果;第5節(jié)對(duì)全文進(jìn)行總結(jié)。

2 模型建立

TCP時(shí)間戳在RFC1323中引入，它作為T(mén)CP頭部的選項(xiàng)字段，長(zhǎng)度為10 Byte[19]。其主要有兩個(gè)作用，一是精確測(cè)量往返傳輸時(shí)延，二是防止高速傳輸網(wǎng)絡(luò)下TCP序號(hào)的沖突。TCP時(shí)間戳選項(xiàng)中包含長(zhǎng)度為32 bit的TSval子字段，它代表當(dāng)前數(shù)據(jù)包發(fā)送主機(jī)設(shè)置的TCP虛擬時(shí)鐘值。下文無(wú)特殊說(shuō)明時(shí)，TCP時(shí)間戳均指的是TSval子字段。

在被動(dòng)接收條件下，假設(shè)我們獲得從某個(gè)IP發(fā)出的一系列包含TCP時(shí)間戳的IP數(shù)據(jù)包，其中第i個(gè)數(shù)據(jù)包的發(fā)送時(shí)間為si，TCP時(shí)間戳值為ti，它們構(gòu)成一個(gè)TCP時(shí)間戳序列。根據(jù)RFC1323規(guī)定，發(fā)送方數(shù)據(jù)包中的TCP時(shí)間戳ti與發(fā)送時(shí)間si之間應(yīng)保持線性關(guān)系ti=ksi+t0。其中:k為T(mén)CP虛擬時(shí)鐘頻率，它與操作系統(tǒng)內(nèi)核直接相關(guān)，RFC建議取值范圍為1～1000 Hz，常見(jiàn)的時(shí)鐘頻率有{2 Hz，10 Hz，100 Hz，250 Hz，500 Hz，1000 Hz};t0為初始計(jì)數(shù)值，它與開(kāi)機(jī)時(shí)間直接相關(guān)，一般從開(kāi)機(jī)起始為0或某個(gè)隨機(jī)值。

對(duì)于被動(dòng)捕獲方，數(shù)據(jù)包發(fā)送時(shí)間si是未知的，我們只能獲取捕獲時(shí)間。假設(shè)第i個(gè)數(shù)據(jù)包的捕獲時(shí)間為ri，數(shù)據(jù)包經(jīng)歷的路徑時(shí)延為τi，那么有ri=si+τi，捕獲時(shí)間 ri與時(shí)間戳 ti滿足 ti=kri－ kτi+t0。定義相對(duì)捕獲時(shí)間為xi，TCP時(shí)間戳值為yi如式(1)所示:

那么有 yi=k·xi+b，其中 b=t0+kr1－ kτi。假設(shè)在時(shí)間跨度T中，收到的含時(shí)間戳的數(shù)據(jù)包個(gè)數(shù)為N，即數(shù)據(jù)集合為{(xi，yi)|i=1，2，…，N}。路徑時(shí)延τi為隨機(jī)變量，當(dāng)接收時(shí)間跨度T較小時(shí)，τi可近似為常數(shù)，此時(shí)，yi與xi能夠較好地滿足線性關(guān)系。

在TCP時(shí)間戳y與相對(duì)捕獲時(shí)間x存在的線性關(guān)系y=kx+b中，斜率k是TCP虛擬時(shí)鐘頻率，截距b由主機(jī)的開(kāi)機(jī)時(shí)間和數(shù)據(jù)包傳輸時(shí)延決定。因此，采用TCP時(shí)間戳序列進(jìn)行NAT規(guī)模估計(jì)基于三個(gè)假設(shè)條件:NAT不修改TCP時(shí)間戳值;具有相同TCP時(shí)鐘頻率的主機(jī)不在同一時(shí)刻開(kāi)機(jī);數(shù)據(jù)包傳輸時(shí)延不發(fā)生劇烈變化。也就是說(shuō)，用TCP時(shí)鐘頻率和時(shí)間戳起始值可以標(biāo)識(shí)一臺(tái)主機(jī)，這在實(shí)際條件下通常是滿足的[17－18]。理論上講，由于時(shí)鐘頻率最大值為1000 Hz，最小可分辨的開(kāi)機(jī)時(shí)間差異為1 ms。

對(duì)某包含6臺(tái)主機(jī)的NAT設(shè)備采集TCP時(shí)間戳序列，其中主機(jī)1和主機(jī)2為Windows XP操作系統(tǒng)，主機(jī)3～6為Ubuntu 12.04操作系統(tǒng)，特別地，主機(jī)4～6為同一型號(hào)設(shè)備。畫(huà)出相對(duì)捕獲時(shí)間和TCP時(shí)間戳的散點(diǎn)圖如圖1所示，線性關(guān)系在坐標(biāo)圖中表現(xiàn)為直線，可以看出不同主機(jī)表現(xiàn)出不同的線性關(guān)系。

圖1 NAT中不同主機(jī)表現(xiàn)出不同的線性關(guān)系Fig.1 Different host behind NAT shows different linearity

假設(shè)NAT包含的主機(jī)數(shù)量為M，對(duì)數(shù)據(jù)包相對(duì)捕獲時(shí)間x和TCP時(shí)間戳y建立如下的線性混合模型:

式中，主機(jī)數(shù)量 M 未知，模型參數(shù){(k1，b1)，(k2，b2)，…，(kM，bM)}未知。這是一個(gè)典型的無(wú)監(jiān)督聚類(lèi)問(wèn)題，本文將其轉(zhuǎn)化為檢測(cè)坐標(biāo)圖中的直線數(shù)目，通過(guò)基于Hough變換的方法估計(jì)直線數(shù)量。

3 算法描述

為了估計(jì)出NAT規(guī)模大小，只需要檢測(cè)TCP時(shí)間戳與相對(duì)捕獲時(shí)間坐標(biāo)圖上直線的數(shù)目。從計(jì)算機(jī)視覺(jué)角度出發(fā)，圖像上直線檢測(cè)可以通過(guò)Hough變換完成。由于圖像分辨率的原因，利用Hough變換進(jìn)行檢測(cè)時(shí)，需要進(jìn)行多級(jí)迭代放大，從而更加準(zhǔn)確地檢測(cè)出直線數(shù)目。

3.1 數(shù)據(jù)預(yù)處理

由于線性關(guān)系的穩(wěn)定性與路徑時(shí)延抖動(dòng)相關(guān)，為盡量減小時(shí)延抖動(dòng)對(duì)檢測(cè)的影響，數(shù)據(jù)的時(shí)間跨度需要限制在比較小的長(zhǎng)度內(nèi)。在數(shù)據(jù)預(yù)處理時(shí)，我們將數(shù)據(jù)按照一定的時(shí)間長(zhǎng)度T分段進(jìn)行處理。通常時(shí)間長(zhǎng)度T根據(jù)目標(biāo)的平均流量來(lái)確定，從而保證用于識(shí)別的數(shù)據(jù)量足夠且具有一定的反應(yīng)速度。此外，相同TCP時(shí)間戳為重復(fù)信息，我們只保留第一次出現(xiàn)的數(shù)據(jù)點(diǎn)。

進(jìn)行Hough變換前，還需要將分段后的數(shù)據(jù)二值化映射為圖像。假設(shè)映射后圖像的大小為W×H，即寬度為W，高度為H，那么圖像分辨率為

歸一化映射后得到原數(shù)據(jù)點(diǎn)在圖像上的坐標(biāo)點(diǎn)為

將圖像上對(duì)應(yīng)坐標(biāo)置為1即可生成二值圖像。生成圖像后，再對(duì)圖像做一次邊緣檢測(cè)處理，完成數(shù)據(jù)預(yù)處理。

3.2 Hough 變換

標(biāo)準(zhǔn)Hough變換采用如下參數(shù)形式表示一條直線[20]:

式中，變量ρ表示從原點(diǎn)到直線的垂直距離，變量θ表示原點(diǎn)到直線的垂向量與x軸的夾角。

參數(shù)空間(ρ，θ)需要離散化，Hough變換后可以獲得離散化參數(shù)空間上的分布矩陣，矩陣的每個(gè)元素代表落在相應(yīng)參數(shù)位置的圖像點(diǎn)數(shù)，其峰值點(diǎn)則代表圖像上可能存在對(duì)應(yīng)參數(shù)的直線。假設(shè)輸入數(shù)據(jù)為(x，y)，Hough 變換后得到

對(duì)Hough變換的矩陣H檢測(cè)參數(shù)空間中出現(xiàn)的峰值點(diǎn)，并得出當(dāng)前圖像中的直線數(shù)目。

參數(shù)空間(ρ，θ)的離散精度決定著檢測(cè)結(jié)果的精度，距離ρ的離散化精度記為Rho，夾角θ離散化區(qū)間記為T(mén)heta。此外，還需要設(shè)置H矩陣的峰值判決門(mén)限V。

3.3 遞歸放大

受圖像分辨率的限制，需要對(duì)檢測(cè)得到的直線進(jìn)行遞歸放大進(jìn)而獲得更精確的結(jié)果。首先按照檢測(cè)結(jié)果對(duì)圖像進(jìn)行分割，選擇已檢測(cè)到的直線鄰域的數(shù)據(jù)作為新的輸入數(shù)據(jù)重新檢測(cè)。對(duì)于不歸屬于任何已檢測(cè)直線的數(shù)據(jù)，同樣作為新的輸入數(shù)據(jù)重新檢測(cè)。

在選擇已檢測(cè)到直線的鄰域數(shù)據(jù)時(shí)，當(dāng)數(shù)據(jù)點(diǎn)與直線的距離小于鄰域半徑ε時(shí)，認(rèn)為數(shù)據(jù)點(diǎn)歸屬該直線的領(lǐng)域。已知TCP虛擬時(shí)鐘頻率大于0，當(dāng)圖像上檢測(cè)到的直線斜率顯著大于0時(shí)，我們認(rèn)為不需要再放大。為了減小奇異點(diǎn)的影響，對(duì)于獲取的數(shù)據(jù)量小于門(mén)限值Th的不做檢測(cè)處理。

3.4 具體步驟

基于Hough變換的NAT規(guī)模被動(dòng)估計(jì)算法的具體步驟如圖2所示。

圖2 算法具體步驟Fig.2 Detailed procedure of the proposed algorithm

算法中涉及的關(guān)鍵檢測(cè)參數(shù)及實(shí)驗(yàn)中采用的典型值如表1所示。

表1 算法關(guān)鍵參數(shù)列表Table1 Key parameters of the proposed algorithm

4 實(shí)驗(yàn)結(jié)果

本節(jié)首先在真實(shí)數(shù)據(jù)環(huán)境下，對(duì)本文算法和已有算法進(jìn)行驗(yàn)證。為了進(jìn)一步測(cè)試算法性能，我們搭建實(shí)驗(yàn)網(wǎng)絡(luò)，對(duì)比本文算法和已有算法的性能。

下面實(shí)驗(yàn)將對(duì)兩種常用的針對(duì)TCP時(shí)間戳序列實(shí)現(xiàn)NAT規(guī)模估計(jì)的算法進(jìn)行對(duì)比。

(1)Bursztein 算法[17]

通過(guò)TCP時(shí)間戳在特定TCP虛擬時(shí)鐘頻率下增長(zhǎng)的誤差值判斷兩個(gè)數(shù)據(jù)包是否屬于同一主機(jī)，設(shè)定 TCP虛擬時(shí)鐘頻率集合為{2 Hz，10 Hz，100 Hz，250 Hz，500 Hz，1000 Hz}，時(shí) 間間隔為10 ms，誤差范圍為 0.1%。

(2)Wicherski算法[18]

以同一TCP連接(即TCP五元組相同)的數(shù)據(jù)包作為初始類(lèi)，通過(guò)最小均方誤差線性回歸方法求取其對(duì)應(yīng)的TCP虛擬時(shí)鐘頻率及估計(jì)的開(kāi)機(jī)時(shí)間，并將相同時(shí)鐘頻率下開(kāi)機(jī)時(shí)間小于δboot的歸為同一主機(jī)，設(shè)置 δboot=2 ms。

注意到，Bursztein算法中將TCP虛擬時(shí)鐘頻率作為先驗(yàn)信息，Wicherski算法則假設(shè)同一連接的所有數(shù)據(jù)包屬于同一主機(jī)，而本文算法并沒(méi)有添加這些限制條件。

4.1 真實(shí)數(shù)據(jù)驗(yàn)證

采集真實(shí)環(huán)境下某網(wǎng)絡(luò)出口的數(shù)據(jù)，取其中兩個(gè)IP地址的TCP時(shí)間戳序列進(jìn)行檢測(cè)。第1個(gè)IP地址的流量和流數(shù)分別為4.1 Mbit/s和7192，圖3(a)所示的為第1個(gè)IP地址數(shù)據(jù)的檢測(cè)結(jié)果，三種算法檢測(cè)得到主機(jī)數(shù)目均為4，與人工分析結(jié)果一致。第2個(gè) IP地址的流量和流數(shù)分別為35.6 Mbit/s和43 734，圖3(b)所示的為第2個(gè)IP 地址數(shù)據(jù)的檢測(cè)結(jié)果，本文算法檢測(cè)得到主機(jī)數(shù)目為21，與人工分析結(jié)果一致，而B(niǎo)ursztein算法和Wich-erski算法檢測(cè)結(jié)果分別為14和18。

圖3 真實(shí)數(shù)據(jù)檢測(cè)結(jié)果Fig.3 Experiment results on real data

4.2 性能對(duì)比測(cè)試

采用實(shí)驗(yàn)網(wǎng)絡(luò)產(chǎn)生數(shù)據(jù)進(jìn)行對(duì)比測(cè)試，實(shí)驗(yàn)采用的網(wǎng)絡(luò)連接如圖4所示。在NAT設(shè)備后面連接若干臺(tái)主機(jī)，這些主機(jī)持續(xù)地隨機(jī)訪問(wèn)服務(wù)器，數(shù)據(jù)采集點(diǎn)位于NAT設(shè)備與服務(wù)器之間。

圖4 實(shí)驗(yàn)網(wǎng)絡(luò)連接圖Fig.4 Experimental network setup

我們采用檢測(cè)準(zhǔn)確率α和偏差值δ評(píng)價(jià)算法性能。對(duì)于特定主機(jī)數(shù)目M，當(dāng)檢測(cè)得到M個(gè)主機(jī)時(shí)，檢測(cè)正確，否則檢測(cè)錯(cuò)誤。假設(shè)檢測(cè)次數(shù)為N，檢測(cè)正確的次數(shù)為P，第n次檢測(cè)得到的主機(jī)數(shù)為Xn，準(zhǔn)確率α和偏差值δ定義如式(7)所示:

選取主機(jī)數(shù)目M范圍為[1，20]，檢測(cè)次數(shù)N=500，統(tǒng)計(jì)算法的檢測(cè)準(zhǔn)確率和偏差值如圖5所示。從圖中可以看出，本文算法檢測(cè)的準(zhǔn)確率要高于Bursztein算法和Wicherski算法，檢測(cè)的偏差值要小于Bursztein算法和Wicherski算法，這說(shuō)明本文算法性能要優(yōu)于這兩種傳統(tǒng)算法。

圖5 實(shí)驗(yàn)結(jié)果對(duì)比圖Fig.5 Comparison results on experimental network

選定主機(jī)數(shù)目為M=10，查看檢測(cè)結(jié)果的分布如圖6所示。從檢測(cè)的分布圖可以看出本文算法的分布較為集中，而其他兩種算法得到分布較為分散，這進(jìn)一步表明本文算法性能更好。

圖6 主機(jī)數(shù)目為10時(shí)檢測(cè)結(jié)果分布對(duì)比圖Fig.6 Distributions comparison with 10 hosts

由于Bursztein算法是根據(jù)數(shù)據(jù)點(diǎn)之間的時(shí)間戳差和接收時(shí)間差來(lái)判斷是否其是否屬于同一主機(jī)，當(dāng)多個(gè)主機(jī)的時(shí)間戳相差較小時(shí)，Bursztein算法會(huì)將這些數(shù)據(jù)都?xì)w于同一主機(jī)，從而發(fā)生誤判。Wicherski算法是基于同一連接屬于同一主機(jī)這一假設(shè)，在短連接條件下數(shù)據(jù)點(diǎn)較少使得擬合誤差較大，進(jìn)而引起誤判。而本文算法是基于Hough變換進(jìn)行直線檢測(cè)，即使存在主機(jī)時(shí)間戳相差較小或存在大量短連接的情況，從圖像上依然可以較為準(zhǔn)確地區(qū)別出不同的直線。

檢測(cè)圖像大小W×H和鄰域半徑ε是本文算法非常關(guān)鍵的參數(shù)，選擇不同的參數(shù)組合對(duì)其靈敏度進(jìn)行分析。圖7(a)為單獨(dú)改變圖像大小的實(shí)驗(yàn)結(jié)果，圖7(b)為單獨(dú)改變鄰域半徑的實(shí)驗(yàn)結(jié)果。從理論上講，基于Hough變換對(duì)直線進(jìn)行檢測(cè)要求映射后的圖像分辨率適中，當(dāng)圖像上的點(diǎn)過(guò)于稀疏時(shí)，檢測(cè)會(huì)發(fā)生一定偏差。實(shí)驗(yàn)結(jié)果顯示圖像大小對(duì)算法準(zhǔn)確率影響不大。檢測(cè)鄰域半徑ε決定著放大的區(qū)域，當(dāng)ε過(guò)小時(shí)，放大區(qū)域包含數(shù)據(jù)可能不完整，而過(guò)大時(shí)，放大區(qū)域可能包含額外的數(shù)據(jù)，這些都會(huì)對(duì)檢測(cè)結(jié)果產(chǎn)生影響。實(shí)驗(yàn)結(jié)果表明，適中的鄰域半徑能夠達(dá)到最好的檢測(cè)效果。

圖7 不同參數(shù)條件下檢測(cè)結(jié)果對(duì)比Fig.7 Comparison results with various parameter settings

5 結(jié)束語(yǔ)

針對(duì)NAT主機(jī)數(shù)目檢測(cè)問(wèn)題，本文利用TCP時(shí)間戳與數(shù)據(jù)包接收時(shí)間之間存在的線性關(guān)系，提出了一種基于Hough變換的NAT主機(jī)數(shù)目自動(dòng)識(shí)別算法。與以往工作相比，該算法解決了多個(gè)主機(jī)時(shí)間戳相距較近以及短連接導(dǎo)致誤識(shí)別的問(wèn)題。實(shí)驗(yàn)測(cè)試結(jié)果表明了算法的有效性，且性能優(yōu)于已有算法。

本文算法并不局限于對(duì)TCP時(shí)間戳序列進(jìn)行分析，它可以很容易地?cái)U(kuò)展至IPID序列和TCP初始序號(hào)序列的線性關(guān)系自動(dòng)識(shí)別中。下一步工作將考慮利用更多的可用先驗(yàn)信息，從而進(jìn)一步提高算法的性能。

[1]RFC 1631，The IP Network Address Translator(NAT)[S].

[2]焦程波，鄭輝，黃宇.被動(dòng)式遠(yuǎn)程網(wǎng)絡(luò)地址翻譯器識(shí)別系統(tǒng)[J].電子科技大學(xué)學(xué)報(bào)，2012(6):899－904.JIAO cheng － bo，ZHENG Hui，HUANG Yu.Novel passive remote network address translation detecting system[J].Journal of University of Electronic Science and Technology of China，2012(6):899 －904.(in Chinese)

[3]Detection of NAT devices[EB/OL].[2014 －06 －07].http://www.muni.cz/ics/research/projects/4622/web/natdet.

[4]Li R，Zhu H L，Xin Y，et al.Remote NAT detect algorithm based on support vector machine[C]//Proceedings of International Conference on Information Engineering and Computer Science(ICIECS).Wuhan:IEEE，2009:1 －4.

[5]高驥翔.基于網(wǎng)絡(luò)流量特征的NAT識(shí)別方法[D].成都:電子科技大學(xué)，2012.GAO Jixiang.NAT Detection Based on Network Traffic Feature[D].Chengdu:University of Electronic Science and Technology of China，2012.(in Chinese)

[6]Detecting NAT Devices using sFlow[EB/OL].[2014 －06 －07].http://www.sflow.org/detectNAT/.

[7]Abt S，Dietz C，Baier H，et al.Passive remote source NAT detection using behavior statistics derived from NetFlow[M]//Emerging Management Mechanisms for the Future Internet.Berlin:Springer，2013:148 －159.

[8]Krmicek V，Vykopal J，Krejci R.Netflow based system for NAT detection[C]//Proceedings of the 5th International Student Workshop on Emerging Networking Experiments and Technologies.New York:ACM，2009:23 －24.

[9]Li R，Zhu H L，Xin Y，et al.Passive NATted hosts detect algorithm based on directed acyclic graph support vector machine[C]//Proceedings of 2009 International Conference on Multimedia Information Networking and Security.Wuhan:IEEE，2009:474 －477.

[10]Gokcen Y，F(xiàn)oroushani V A，Heywood.Can we identify NAT behavior by analyzing Traffic Flows[C]//Proceedings of 2014 IEEE Security and Privacy Workshops.San Jose:IEEE，2014:132 －139.

[11]Bellovin S.A technique for counting NATted hostes[C]//Proceedings of the 2nd ACM SIGCOMM Workshop on Internet Measurement.New York:ACM，2002:267－272.

[12]Mongkolluksamee S，F(xiàn)ukuda K，Pongpaibool P.Counting NATted hosts by observing TCP/IP field behaviors[C]//Proceedings of 2012 IEEE International Conference on Communications(ICC).Ottawa:IEEE，2012:1265－1270.

[13]Beverly R.A robust classifier for passive TCP/IP fingerprinting[M]//Passive and Active Measurement.Berlin:Springer，2004:158 －167.

[14]Maier G，Schneider F，F(xiàn)eldmann A.NAT Usage in Residential Broadband Networks[M]//Passive and Active Measurement.Berlin:Springer，2011:32 －41.

[15]白雪，錢(qián)步仁，梁華慶.一種檢測(cè)NAT后主機(jī)數(shù)目的方案[J].計(jì)算機(jī)安全，2009(4):46－48.BAI Xue，QIAN Buren，LIANG Huaqing.A scheme for counting NATted hosts[J].Computer Security，2009(4):46 －48.(in Chinese)

[16]Kohno T，Broido A，Claffy K.Remote physical device fingerprinting[J].IEEE Transactions on Dependable and Secure Computing，2005，2(2):93 －108.

[17]Bursztein E.Time has something to tell us about network address translation[EB/OL].(2007－07－08)[2014－ 06 － 07].http://cdn.1y.tl/publications/time － has－something－to－tell－us－about－network－ address－ translation.pdf.

[18]Wicherski G，Weingarten F，Meyer U.IP agnostic realtime traffic filtering and host identification using TCP timestamps[C]//Proceedings of 2013 IEEE 38th Conference on Local Computer Networks.Sydney:IEEE，2013:647－654.

[19]RFC 1323，TCP extensions for high performance[S].

[20]Duda R O，Hart P E.Use of the hough transformation to detect lines and curves in pictures[J].Communications of the ACM，1972(15):11－15.