摘 要:網(wǎng)絡(luò)流媒體的發(fā)現(xiàn)是網(wǎng)絡(luò)流媒體服務(wù)質(zhì)量監(jiān)測等行為的前提和基礎(chǔ)。通過對網(wǎng)絡(luò)流媒體傳輸協(xié)議的分析,提出一個基于Winpcap的網(wǎng)絡(luò)流媒體識別算法。經(jīng)試驗證明,該算法能夠有效識別流媒體。
關(guān)鍵詞:Winpcap; 流媒體; RTP/RTCP; P2P
中圖分類號:TN919 文獻(xiàn)標(biāo)識碼:A
文章編號:1004-373X(2010)11-0108-03
Study and Implementation of Network Streaming Media Recognition Algorithm
Based on Winpcap
SONG Xue1, CAI Yi-bing2, JIN Wei-xin2, WANG Meng2
(1. College of Communication Engineering, PLA University of Science and Technology, Nanjing 210007, China; 2. DECSEC, Beijing 100141, China)
Abstract: The discovery of network streaming media is the premise and foundation of network flow media service quality monitoring. The network flow media transport protocol is analyzed. A Winpcap-based network streaming media recognition algorithm is proposed according to the result of the protocol analysis. The test proves that the algorithm can effectively identify the streaming media.
Keywords: Winpcap; streaming media; RTP/RTCP; P2P
0 引 言
隨著計算機(jī)網(wǎng)絡(luò)、視頻壓縮等關(guān)鍵技術(shù)的快速發(fā)展,網(wǎng)絡(luò)流媒體技術(shù)目前已成為繼文字和圖片之后,互聯(lián)網(wǎng)信息傳播的主要形式。通過網(wǎng)絡(luò)流媒體技術(shù),用戶可以方便地存取、查閱和播放網(wǎng)絡(luò)上的流媒體數(shù)據(jù)。如何從海量的網(wǎng)絡(luò)數(shù)據(jù)中快速發(fā)現(xiàn)流媒體數(shù)據(jù),是進(jìn)行網(wǎng)絡(luò)視頻服務(wù)質(zhì)量監(jiān)測、網(wǎng)絡(luò)流量統(tǒng)計、網(wǎng)絡(luò)視頻用戶行為分析及視頻內(nèi)容監(jiān)管等服務(wù)的前提和基礎(chǔ)。
網(wǎng)絡(luò)流媒體服務(wù)為應(yīng)用層服務(wù),其數(shù)據(jù)傳輸主要采用專有應(yīng)用層協(xié)議RTP/RTCP[1]。因此,對網(wǎng)絡(luò)視頻數(shù)據(jù)流的發(fā)現(xiàn)首先是識別應(yīng)用層協(xié)議。針對應(yīng)用層協(xié)議的識別,文獻(xiàn)[2]提出了一種以協(xié)議中出現(xiàn)頻率最高的字段作為特征串來識別協(xié)議的方法,且采用一個特征串來標(biāo)識一種協(xié)議。文獻(xiàn)[3]提出了基于簽名字串的方法來識別應(yīng)用層協(xié)議,其主要針對的是P2P協(xié)議的范圍,且需要對整個報文通過匹配多個特征串來識別一種P2P協(xié)議,時間效率偏低。文獻(xiàn)[4]提出了基于先分類后分組的識別應(yīng)用層協(xié)議及流量的方法,但此方法的本質(zhì)還是基于某些固定端口的,若對于通過隨機(jī)選擇端口而實現(xiàn)的應(yīng)用層協(xié)議,此方法就缺乏準(zhǔn)確性和靈活性。
本文通過分析網(wǎng)絡(luò)流媒體交互過程的特征,以應(yīng)用層傳輸協(xié)議對應(yīng)的關(guān)鍵特征字串為判斷依據(jù),設(shè)計了一種基于Winpcap的網(wǎng)絡(luò)視頻流識別算法,實現(xiàn)了對網(wǎng)絡(luò)流媒體的發(fā)現(xiàn),并通過實驗對本文設(shè)計的算法性能進(jìn)行了分析和驗證。
1 Winpcap簡介
Winpcap是由伯克利分組捕獲庫派生而來的分組捕獲庫,它在Windows 操作平臺上實現(xiàn)對底層包的截取過濾。
Winpcap是BPF模型和Libpcap函數(shù)庫在Windows平臺下網(wǎng)絡(luò)數(shù)據(jù)包捕獲和網(wǎng)絡(luò)狀態(tài)分析的一種體系結(jié)構(gòu),這個體系結(jié)構(gòu)是由一個核心的包過濾驅(qū)動程序,一個底層的動態(tài)連接庫Packet.dll 和一個高層的獨立于系統(tǒng)的函數(shù)庫Libpcap組成。底層的包捕獲驅(qū)動程序?qū)嶋H為一個協(xié)議網(wǎng)絡(luò)驅(qū)動程序,通過對NDIS中函數(shù)的調(diào)用為Windows 95/98/NT/2000提供一類似于 UNIX 系統(tǒng)下Berkeley Packet Filter的捕獲和發(fā)送原始數(shù)據(jù)包的能力。 Packet.dll 是對這個 BPF 驅(qū)動程序進(jìn)行訪問的 API 接口,同時它有一套符合 Libpcap 接口(UNIX 下的捕獲函數(shù)庫)的函數(shù)庫[5]。
Winpcap包括三部分:第一個模塊NPF(Netgroup Packet Filter),是一個虛擬設(shè)備驅(qū)動程序文件。它的功能是過濾數(shù)據(jù)包,并把這些數(shù)據(jù)包原封不動地傳給用戶態(tài)模塊,這個過程中包括了一些操作系統(tǒng)特有的代碼。第二個模塊Packet.dll為Win32平臺提供了一個公共的接口。不同版本的Windows系統(tǒng)都有自己的內(nèi)核模塊和用戶層模塊。Packet.dll用于解決這些不同。調(diào)用Packet.dll的程序可以運(yùn)行在不同版本的Windows平臺上,而無需重新編譯。 第三個模塊Wpcap.dll是不依賴于操作系統(tǒng)的,它提供了更加高層、抽象的函數(shù)。
Winpcap提供了一套標(biāo)準(zhǔn)的編程接口,與libpcap兼容,可使得原來許多UNIX平臺下的網(wǎng)絡(luò)分析工具快速移植過來便于開發(fā)各種網(wǎng)絡(luò)分析工具,充分考慮了各種性能和效率的優(yōu)化,包括對于NPF內(nèi)核層次上的過濾器支持,支持內(nèi)核態(tài)的統(tǒng)計模式,提供了發(fā)送數(shù)據(jù)包的能力。
2 應(yīng)用層協(xié)議RTP/RTCP
RTP/RTCP是一種應(yīng)用型的傳輸層協(xié)議,它沒有連接的概念,既可以建立在面向連接的底層協(xié)議上,又可以建立在面向無連接的底層協(xié)議上,因此RTP對傳輸層是獨立的。由于網(wǎng)絡(luò)流媒體的傳輸實時性要求較高,UDP的傳輸延時低于TCP,能與音頻和視頻流很好地匹配,所以,在實際應(yīng)用中,RTP/RTCP/UDP是流媒體傳輸?shù)闹饕獏f(xié)議[6],其結(jié)構(gòu)如圖1所示。
圖1 網(wǎng)絡(luò)流媒體數(shù)據(jù)包結(jié)構(gòu)
MAC headerIP headerUDP headerRTP header流媒體數(shù)據(jù)
圖1 網(wǎng)絡(luò)流媒體數(shù)據(jù)包結(jié)構(gòu)
實時傳輸協(xié)議RTP是為實時數(shù)據(jù)提供端到端傳遞服務(wù)的協(xié)議,能夠傳遞時間信息和實現(xiàn)流同步。但RTP本身并不能為按順序傳送數(shù)據(jù)包提供可靠的傳輸機(jī)制,也不提供流量控制或擁塞控制,它依靠RTP控制協(xié)議RTCP配合實現(xiàn)控制服務(wù)。在RTP會話期間,各參與者周期性地交互RTCP包,RTCP包中含有己發(fā)送的數(shù)據(jù)包的數(shù)量、丟失的數(shù)據(jù)包的數(shù)量等統(tǒng)計資料,會話方可以利用這些信息動態(tài)地改變傳輸速率,甚至改變有效型。RTP數(shù)據(jù)包結(jié)構(gòu)如圖2所示[7]。
圖2 RTP數(shù)據(jù)包結(jié)構(gòu)圖
從圖2可以看出,RTP數(shù)據(jù)包由12個字節(jié)的固定RTP頭和不定長的連續(xù)多媒體數(shù)據(jù)組成,其中的多媒體數(shù)據(jù)可以是壓縮后數(shù)據(jù)。
其中比較重要的幾個域及其意義如下:
版本(V):2 b,此域定義了RTP的版本,此協(xié)議定義的版本是2。
填料(P):1 b,填料可能用于某些具有固定長度的加密算法,或者在底層數(shù)據(jù)單元中傳輸多個RTP包。
擴(kuò)展(X):1 b,若設(shè)置擴(kuò)展比特,表示固定頭(僅)后面跟隨一個頭擴(kuò)展。
CSRC計數(shù)(CC):4 b,CSRC計數(shù)包含了跟在固定頭后面CSRC識別符的數(shù)目。
標(biāo)志(M):1 b,標(biāo)志用來允許在比特流中標(biāo)記重要的事件,如幀范圍。
負(fù)載類型(PT):7 b,此域定義了負(fù)載的格式,由具體應(yīng)用決定其解釋。協(xié)議可以規(guī)定負(fù)載類型碼和負(fù)載格式之間一個默認(rèn)的匹配。其他的負(fù)載類型碼可以通過非RTP方法動態(tài)定義,RTP發(fā)射機(jī)在任意給定時間發(fā)出一個單獨的RTP負(fù)載類型。
序列號(SN):16 b,每發(fā)送一個RTP數(shù)據(jù)包,序列號加一,接收機(jī)可以據(jù)此檢測丟包和重建包。序列號的初始值是隨機(jī)的。
時間標(biāo)志:32 b,時間標(biāo)志反映了RTP數(shù)據(jù)包中第一個比特的抽樣瞬間。時間標(biāo)志的起始值是隨機(jī)的。
SSRC:32 b,SSRC域用以識別同步源。標(biāo)識符被隨機(jī)生成,以使在同一個RTP會話期中沒有任何兩個同步源有相同的SSRC識別符。
CSRC列表:0~15項,每項32 b。CSRC列表識別在此包中負(fù)載的有貢獻(xiàn)源。識別符的數(shù)目在CC域中給定[8]。
通過對RTP協(xié)議的分析,總結(jié)出以下幾條“流特征”:
(1) UDP負(fù)荷頭兩個比特是0x10(RTP的版本號是2)。
(2) RTP流負(fù)載類型PT值保持不變。即同一流媒體數(shù)據(jù)包RTP頭的9~15 b的值保持不變。
(3) RTP流的SN值為遞增。
(4) RTP包的SSRC值為定值,同一流媒體數(shù)據(jù)各包的SSRC值保持不變。
3 算法實現(xiàn)
首先通過Winpcap過濾器[9]對數(shù)據(jù)包進(jìn)行捕獲,識別其中的握手?jǐn)?shù)據(jù)包,然后分析呼叫信令的內(nèi)容,獲取傳輸流媒體的源、目的地址和端口號,再通知給過濾器針對該源、目的地址和端口號進(jìn)行數(shù)據(jù)捕捉;識別其中的UDP數(shù)據(jù)包進(jìn)行分析,根據(jù)“流特征”進(jìn)行分析,確定所要捕捉的RTP數(shù)據(jù)流。
采用以上4條作為判斷RTP流量的必要條件,當(dāng)對每一個UDP數(shù)據(jù)流,如能連續(xù)檢出4個包符合上述策略,則認(rèn)定其滿足為RTP數(shù)據(jù)流的充分條件。
經(jīng)過大量實際數(shù)據(jù)的測試,該算法可以有效識別網(wǎng)絡(luò)流媒體。
4 結(jié) 語
在分析網(wǎng)絡(luò)流媒體傳輸協(xié)議的基礎(chǔ)上,利用Winpcap實現(xiàn)了一個網(wǎng)絡(luò)流媒體識別算法。 經(jīng)試驗證明,該算法能夠有效識別流媒體,對網(wǎng)絡(luò)流媒體的應(yīng)用具有積極的作用。
參考文獻(xiàn)
[1]吳永英,周淼,陳曉蘇.基于數(shù)據(jù)包分析的多媒體信息還原方法研究[J].華中科技大學(xué)學(xué)報:自然科學(xué)版,2007,35(9):101-103.
[2]陳亮,龔儉,徐選.基于特征串的應(yīng)用層協(xié)議識別[J].計算機(jī)工程與應(yīng)用,2006(24):16-19.
[3]SEN S, SPATSCHECK O, WANG D M. Accurate, scalable in-network identification of P2P traffic using application signatures[C]//www.Proceedings of the 13th International Conference on World Wide Web. New York: WWW, 2004:512-521.
[4]KIM Myung-Sup,WON Yong J, HONG Won-Ki. Application-lecel traffic monitoring and analysis on IP networks[J]. ETRI Journal, 2005,27(1):1-22.
[5]付強(qiáng),左仁輝.基于Winpcap實現(xiàn)網(wǎng)絡(luò)監(jiān)聽技術(shù)[J].電腦知識與技術(shù),2008(13):25-28.
[6]李慧彬.基于QoS組播的RTP協(xié)議的研究與實現(xiàn)[D].太原:中北大學(xué),2007.
[7]盛先剛.基于RTP的H.264視頻傳輸系統(tǒng)研究[D].西安:西安電子科技大學(xué),2006.
[8]SCHULZRINNE Henning, CASNER S L, FREDERCK Ron, et al. RFC1889-RTP: A transport protocol for real-time applications[M]. Berlin: \\, 2007.
[9]譚獻(xiàn)海.網(wǎng)絡(luò)編程技術(shù)及應(yīng)用(計算機(jī)科學(xué)與技術(shù))[M].北京:清華大學(xué)出版社,2006.
[10]孫欽東,郭曉軍,黃新波.基于多模式匹配的網(wǎng)絡(luò)視頻流識別與分類[J].電子與信息學(xué)報,2009,31(3):759-762.