龐立君,廖春偉,黃 波,趙海濤
(南京郵電大學 通信與信息工程學院,江蘇 南京 210003)
基于GID的車聯(lián)網(wǎng)數(shù)據(jù)安全方案
龐立君,廖春偉,黃 波,趙海濤
(南京郵電大學 通信與信息工程學院,江蘇 南京 210003)
車聯(lián)網(wǎng)在“端-管-云”三層架構(gòu)的基礎(chǔ)上,提供豐富的智能交通綜合服務(wù)。然而,將數(shù)據(jù)放置在云端處理和存儲,加大了數(shù)據(jù)被非法用戶竊取的風險。為此,提出了基于網(wǎng)絡(luò)基因GID(Gene IDentification)的車聯(lián)網(wǎng)數(shù)據(jù)安全方案。利用GID標示數(shù)據(jù)上傳者和云中可被外界訪問的數(shù)據(jù),保證數(shù)據(jù)在上傳和存儲在云中時的唯一性。進行數(shù)據(jù)訪問時,通過比較待訪問數(shù)據(jù)的網(wǎng)絡(luò)基因與預(yù)先提取的可訪問數(shù)據(jù)的基因是否一致,如果一致,則允許數(shù)據(jù)流出云端,供用戶使用。經(jīng)過分析和仿真表明,基于GID的車聯(lián)網(wǎng)數(shù)據(jù)安全方案在保證數(shù)據(jù)安全性的同時,可以減少云端存儲空間的浪費,增大數(shù)據(jù)上傳的速率。
車聯(lián)網(wǎng);云存儲;數(shù)據(jù)安全;網(wǎng)絡(luò)基因
作為物聯(lián)網(wǎng)在車輛領(lǐng)域的具體應(yīng)用,車聯(lián)網(wǎng)[1]對通信需求具有即時響應(yīng)[2]的特點,這些通信需求包括車與車、車與路、車與人、車-路-云計算平臺的通信等,并且對信息的采集、感知和處理也十分多樣化[3]。車聯(lián)網(wǎng)[4]通過獲取車輛運行參數(shù)和道路等交通基礎(chǔ)設(shè)施使用狀況,對道路交通路況進行實時監(jiān)控和調(diào)度,從而為車輛行駛提供豐富的智能交通綜合服務(wù)。然而,車聯(lián)網(wǎng)所提供的這些業(yè)務(wù)的運行都需要“端-管-云”[5](通信、傳感、計算終端+數(shù)據(jù)上傳網(wǎng)絡(luò)+云計算中心)平臺提供。其中:“管”將車輛運行狀態(tài)和相關(guān)數(shù)據(jù)進行實時上報;“端”是車與車、車與路、車與人、人與云交互與展示方式,使用戶通過智能終端或App進行車聯(lián)網(wǎng)功能展示和體驗,進而實現(xiàn)車聯(lián)網(wǎng)中人車互動;“云”是整個車聯(lián)網(wǎng)的核心,實現(xiàn)對海量涉車數(shù)據(jù)的存儲、計算、管理、監(jiān)控、分析、挖掘及應(yīng)用,并為其他用戶提供數(shù)據(jù)訪問能力。
車云平臺具有不分地域,不分業(yè)務(wù)種類,車輛全網(wǎng)透視,提供統(tǒng)一集中的開放車聯(lián)業(yè)務(wù)平臺的特點[4]。越來越多的用戶和企業(yè)將自己的數(shù)據(jù)上傳至云端進行存儲和處理,當多個用戶同時向一定區(qū)域云發(fā)送數(shù)據(jù)時,會造成云空間緊張,以及數(shù)據(jù)所有者上傳數(shù)據(jù)的速率降低,甚至因網(wǎng)絡(luò)阻塞中斷數(shù)據(jù)傳輸任務(wù)[6-7]。將數(shù)據(jù)放置在云端進行存儲,數(shù)據(jù)所有者也就失去了對數(shù)據(jù)的直接控制,車輛中如行車軌跡,車輛最近時間進行導航的地點和路線等涉及用戶隱私的數(shù)據(jù),直接存放在云端,增大了被非法用戶竊取的風險。
GID(Gene IDentification)是在物理空間(Physical Space,PS)和信息空間(Cyber Space,CS)中都具有唯一性和統(tǒng)一的可信任性的識別碼,涉及信息物理系統(tǒng)CPS、物聯(lián)網(wǎng)、互聯(lián)網(wǎng)等領(lǐng)域,用于解決上述領(lǐng)域中的實體身份識別問題。GID可實現(xiàn)CS和PS的映射。GID在CS中是可以全面地描述網(wǎng)絡(luò)所有終端以及電子智能實體等網(wǎng)絡(luò)實體自身固有特征標識的系統(tǒng),并具有全球(移動)識別能力的、能夠唯一性地代表使用載體個性的新型ID結(jié)構(gòu)特點。由于云存儲環(huán)境具有多個數(shù)據(jù)上傳者和數(shù)據(jù)使用者的特點,數(shù)據(jù)的上傳、存儲和訪問各個環(huán)節(jié)更易受到外界的攻擊。由于GID具有全球唯一的特性,因此可以用來唯一辨別用戶和數(shù)據(jù)內(nèi)容。
由上述可以看出,GID在車聯(lián)網(wǎng)云端數(shù)據(jù)的安全方面具有很重要的意義和價值[8]。針對云空間緊張,數(shù)據(jù)上傳速率降低甚至為0和數(shù)據(jù)被非法用戶訪問的問題[9],文中提出一種新型的解決車聯(lián)網(wǎng)環(huán)境下數(shù)據(jù)安全的方案—基于GID的車聯(lián)網(wǎng)數(shù)據(jù)安全方案。
1.1 設(shè)計目標
為實現(xiàn)云中數(shù)據(jù)安全性的目標,有以下重要的設(shè)計原則:
(1)數(shù)據(jù)上傳過程中,系統(tǒng)可以產(chǎn)生唯一標示數(shù)據(jù)上傳用戶的DOGID,以便云端可以準確無誤、迅速地識別上傳用戶。如果用戶的數(shù)據(jù)允許放在此塊云區(qū)域內(nèi),給用戶開辟數(shù)據(jù)存儲空間,允許用戶上傳數(shù)據(jù);反之,則立即阻止數(shù)據(jù)的上傳。這樣,由于并不是所有的數(shù)據(jù)用戶都可以將自身的數(shù)據(jù)上傳至云端,將會大大加快授權(quán)用戶數(shù)據(jù)的上傳速率,同時也節(jié)約了云中存儲單位的浪費。
(2)對于存儲在云中并且可以被外界訪問的數(shù)據(jù),云服務(wù)器可以給每條數(shù)據(jù)內(nèi)容創(chuàng)建唯一的標識DGID,并將DGID存儲在數(shù)據(jù)基因數(shù)據(jù)庫DGIDD中,以便用戶訪問時進行信息的匹配和比較。
(3)在數(shù)據(jù)使用者訪問數(shù)據(jù)時,如果用戶訪問的數(shù)據(jù)不允許流出網(wǎng)絡(luò),系統(tǒng)應(yīng)該盡快識別和阻止數(shù)據(jù)的流出。例如,數(shù)據(jù)真實泄露點與系統(tǒng)檢測到泄露點之間的間隔越小越好。
1.2 系統(tǒng)模型
系統(tǒng)假設(shè)合法用戶可以通過執(zhí)行預(yù)先明確的協(xié)議,如HTTP,F(xiàn)TP等來訪問數(shù)據(jù)(只有可以通過這些協(xié)議的用戶才允許進入網(wǎng)絡(luò)傳輸數(shù)據(jù))。即用戶數(shù)據(jù)訪問請求可以被云端接受,并且云端可以完全按照訪問請求返回相應(yīng)的數(shù)據(jù),但是,在數(shù)據(jù)流出系統(tǒng)之前,對用戶待訪問的數(shù)據(jù)提取數(shù)據(jù)網(wǎng)絡(luò)基因DGID′,并與DGIDD中的允許外界訪問數(shù)據(jù)的網(wǎng)絡(luò)基因進行比較,如果匹配成功,則將數(shù)據(jù)返回給訪問用戶。系統(tǒng)總體架構(gòu)圖如圖1所示。
系統(tǒng)分為數(shù)據(jù)上傳者(DO)、云端設(shè)備(CSP)、數(shù)據(jù)GID數(shù)據(jù)庫(DGIDD)、數(shù)據(jù)使用者(DU)四部分。各部分詳細作用如下:
DO:在車輛網(wǎng)中,數(shù)據(jù)所有者即為每個車輛。由于車輛本身擁有唯一標示車輛的DOGID,在上傳數(shù)據(jù)時會將自身的DOGID和數(shù)據(jù)一起上傳至云端進行存儲和處理。
CSP:首先,對于用戶上傳數(shù)據(jù)時附帶的DOGID進行分析。如果用戶在預(yù)先規(guī)定的可以存儲在云設(shè)備中的用戶列表中,則為用戶開辟空間,用以存儲上傳的數(shù)據(jù)內(nèi)容;如果不在列表中,則阻止數(shù)據(jù)的上傳。其次,對于可供外部訪問的數(shù)據(jù),提取數(shù)據(jù)內(nèi)容的DGID,存儲在DGIDD中,以便在訪問時進行匹配,決定數(shù)據(jù)是否可以流出云端。
DGIDD:存儲云中數(shù)據(jù)的DGID,以便在數(shù)據(jù)使用者DU進行數(shù)據(jù)訪問時進行比對和校驗,決定是否允許DU訪問數(shù)據(jù)。
DU:根據(jù)自身的需求產(chǎn)生數(shù)據(jù)訪問請求。
1.3 系統(tǒng)方案描述
整個系統(tǒng)分為四部分:數(shù)據(jù)所有者DOGID的產(chǎn)生與數(shù)據(jù)的上傳,數(shù)據(jù)存儲判斷,數(shù)據(jù)DGID的產(chǎn)生與存儲,授權(quán)數(shù)據(jù)使用者訪問數(shù)據(jù)。
(1)數(shù)據(jù)所有者DOGID的產(chǎn)生與數(shù)據(jù)的上傳:可由車載終端實現(xiàn),為車輛網(wǎng)中的每一車輛獲取唯一的網(wǎng)絡(luò)基因標示—“網(wǎng)絡(luò)車牌”。車載終端采用了模塊化設(shè)計理念,由智能芯片、中央處理模塊、通信模塊、定位模塊等組成。同時內(nèi)部嵌有多種傳感器,可對幾乎所有車輛的靜態(tài)、動態(tài)信息進行感知和監(jiān)控。這些狀態(tài)涉及車輛行駛和車體,動力,車輛安全,環(huán)境等與具體車輛相關(guān)的一些屬性。車載終端從汽車和用戶中提取天然屬性信息,采用“數(shù)字基因”技術(shù),形成唯一標示單輛汽車的ID,使得每輛汽車在網(wǎng)絡(luò)中都有其唯一的身份標識。這個標識不僅是一個標簽,而且是網(wǎng)絡(luò)可信標識,使得車輛的身份能主動、唯一地被識別。將車輛在運行中產(chǎn)生的相關(guān)數(shù)據(jù),如車輛行駛過程中的歷史軌跡、訪問的路線等,進行動態(tài)實時采集,實現(xiàn)車輛駕乘等智能感知。并將數(shù)據(jù)上傳至云端進行存儲和處理。
圖1 系統(tǒng)總體架構(gòu)圖
(2)數(shù)據(jù)存儲判斷:對于處理特定區(qū)域數(shù)據(jù)的云存儲設(shè)備,在云端有列表,存儲可以將數(shù)據(jù)放置在此云設(shè)備的用戶列表。用戶DO′上傳數(shù)據(jù)時,首先對DO′的DOGID′在用戶列表中查找。如果用戶在列表內(nèi),則對用戶開辟存儲空間,進行數(shù)據(jù)的接收、存儲,以便數(shù)據(jù)的處理和數(shù)據(jù)使用者對數(shù)據(jù)進行訪問;如果用戶不在存儲列表中,則將此次數(shù)據(jù)上傳任務(wù)取消。
(3)數(shù)據(jù)DGID的產(chǎn)生與存儲:在產(chǎn)生DGID時,系統(tǒng)首先以文件的重要性作為輸入,判斷哪些數(shù)據(jù)可以流出云端,哪些不可以流出云端。對于可以流出云端的數(shù)據(jù)提取DGID,存儲在DGIDD中,當用戶訪問的數(shù)據(jù)流的DGID′與DGIDD中的數(shù)據(jù)流的DGID一致時,才允許數(shù)據(jù)流流出云端。
定義檢測時延,數(shù)據(jù)用戶訪問時,在被禁止訪問時,已經(jīng)訪問的數(shù)據(jù)比特數(shù)和數(shù)據(jù)用戶實際上可以訪問的比特數(shù)之差,記為L。很顯然,L越小越好。為達到設(shè)定的L比特檢測時延,數(shù)據(jù)的DGID應(yīng)該在文件的每Lbyte產(chǎn)生一個DGIDi,DGIDi的產(chǎn)生采用128位的CRC。隨著文件的增大,DGID的數(shù)目不斷增大,因為每一個DGIDi要包括從文件開頭到當前位置的所有byte信息。具體的實現(xiàn)步驟如下:
S1:對于每一個給定的數(shù)據(jù)內(nèi)容D,將D分為n部分,每一部分為Lbyte。
S2:128位的CRCi是第i部分的校驗碼。假設(shè)CRC1以0為種子數(shù),包括文件的第一部分。CRCi+1將CRCi作為種子數(shù),計算第i+1部分的校驗碼。以此類推,計算CRCi。
因此,前i+1部分的數(shù)據(jù)內(nèi)容變化將會導致CRCi+1部分的校驗碼發(fā)生變化。
(4)授權(quán)數(shù)據(jù)使用者訪問數(shù)據(jù):數(shù)據(jù)使用者的訪問授權(quán)主要是在云端將數(shù)據(jù)使用者訪問請求對應(yīng)的字符串流與存儲在DGIDD中的可允許流出的DGID進行比較。如果兩者相同,則允許數(shù)據(jù)流出云端,供用戶訪問;反之,則中斷數(shù)據(jù)鏈接,禁止數(shù)據(jù)流出云端。記tk為整數(shù),k∈[0,p]且1=t0≤t1≤…≤tp,作為監(jiān)測點。
具體檢測方案如下:
(2)將D中子串產(chǎn)生的DGID存儲在哈希表中;
(5)如果沒有DGID匹配,將該字符串不屬于可以流出云端的數(shù)據(jù)串,數(shù)據(jù)傳輸中止,用戶不得訪問這個字符串。
2.1 實驗環(huán)境配置
文件類型選擇:使用現(xiàn)實世界的文件集合(總共70 GB)對該方案的性能進行評估,如表1所示。
表1 實驗所用文件集合
txt和html文檔是由文獻[10-11]提供。其中,txt文件是來自社交網(wǎng)站(del.icio.us)的454 000名用戶的已經(jīng)公開的書簽中獲得,通過從一個小組隨機用戶開始執(zhí)行廣度優(yōu)先搜索(BFS)來獲得這些用戶,進一步獲得用戶的txt書簽文件。由于Wikipedia.org只保存每個頁面的前500次修改,因此,通過對Wikipedia.org網(wǎng)站頁面的前500次修改內(nèi)容獲得html文件。這些html文件仍然通過BFS隨機選擇一個小組常用頁面獲得?;旌衔募t通過對“Science”,“Microsoft”,“Technology”等關(guān)鍵字進行谷歌搜索,獲得的搜索結(jié)果docx,jpg,pdf等作為實驗測試文件類型。除此之外,為進一步豐富混合文件中的文件類型,將8 000個私人mp3文件也導入到混合文件中。
實驗情形:利用每份文件中的“壞字節(jié)”模擬數(shù)據(jù)泄露。檢測時延通過下述方式獲得:隨機選擇1 000份文件,在每份文件中選擇一個字節(jié)作為“壞字節(jié)”,對其數(shù)值進行修改。于是,對每份文件,對于每個檢測位置逐步計算DGID,檢測該DGID在哈希表中位置是否存在。如果檢測失敗,則認為存在壞字節(jié)。其中,檢測位置和“壞字節(jié)”位置間的差值就是檢測延時。
2.2 實驗結(jié)果與分析
數(shù)據(jù)上傳時,由于使用江蘇迪納科技有限公司的GID設(shè)備產(chǎn)生了自身的DOGID,這樣,上傳數(shù)據(jù)時,云端可以利用這個DOGID,檢測該用戶是否是允許存放數(shù)據(jù)的用戶。如果用戶在允許存放數(shù)據(jù)用戶列表中,云端會給用戶開辟空間,進行數(shù)據(jù)的存放。這樣,可以節(jié)約云端內(nèi)部的存儲空間,防止空間的浪費;同時,阻止其他非法用戶上傳數(shù)據(jù),也會進一步加大授權(quán)用戶數(shù)據(jù)上傳的速率。
在數(shù)據(jù)訪問時,更關(guān)注的是在一定的檢測時延下內(nèi)存的使用情況,以及不同內(nèi)存下的實際檢測時延與真實檢測時延之間的差值。這是對系統(tǒng)的安全性能的兩個主要評價指標。文中將從以上兩方面進行仿真分析。
(1)內(nèi)存使用量。
圖2給出了不同檢測時延期望時,基于GID車輛網(wǎng)數(shù)據(jù)安全的內(nèi)存使用量。其中,x坐標和y坐標為自然對數(shù)坐標(文中的GID匹配假設(shè)哈希表的利用率為100%)。
在圖中可以看到,隨著檢測時延的對數(shù)增大,內(nèi)存的對數(shù)使用量線性減小。換句話說,不管有多少個監(jiān)測點,內(nèi)存使用量和檢測時延都是固定的。原因如下:在基于GID的匹配算法中,檢測點是以固定間隔放置,且間隔長度等于檢測時延。對每個檢測點,每個文件存儲了一個128位的CRC。當檢測時延期望增長Y倍時,內(nèi)存數(shù)量下降到原來的1/Y。即,對不同的檢測時延,每個哈希表的大小是相同的。文中已通過實驗證明了這一點,由于篇幅所限,沒有給出相關(guān)圖形。
圖2 采用GID方案所需的內(nèi)存使用量
請注意,算法與文獻[12]中的Glavlit算法相類似,其主要區(qū)別在于,Glavlit算法 使用 160比特的SHA-1提取指紋,而不是文中基于GID方案的 128位CRC,所以Glavlit算法消耗的內(nèi)存量將多于文中基于128位CRC的GID方案。
(2)實際檢測時延。
在txt,html和混合三種不同類型的文件集進行仿真。由于結(jié)果是相似的,因此只給出html文件的預(yù)期檢測時延和實際檢測時延的比較結(jié)果,如圖3所示。
圖3 html文件預(yù)期時延與真實時延之間的比較
可知,實際檢測時延總是低于預(yù)期檢測時延。原因如下:在計算檢測延時期望時是假設(shè)“壞字節(jié)”剛好加在上一個子字符串結(jié)束之后,但是在仿真實驗中,“壞字節(jié)”的位置是從均勻分布中隨機選擇的。
文中利用GID設(shè)計適合車聯(lián)網(wǎng)的云端數(shù)據(jù)安全方案,采用網(wǎng)絡(luò)基因的方式,保障用戶數(shù)據(jù)在上傳、存儲和訪問時的安全。通過真實數(shù)據(jù)的仿真結(jié)果證明,該方案可以有效減小數(shù)據(jù)非法訪問的概率,同時云存儲設(shè)備的空間得以充分利用,但是利用哈希表對提取GID直接進行匹配比較會導致較大的內(nèi)存開銷。因此,下一步的研究重點是如何減小基于GID的車聯(lián)網(wǎng)云端數(shù)據(jù)安全方案的內(nèi)存和計算開銷。
[1] 王建強,吳辰文,李曉軍.車聯(lián)網(wǎng)架構(gòu)與關(guān)鍵技術(shù)研究[J].微計算機信息,2011,27(4):156-158.
[2] 唐 倫,柴 蓉,戴翠琴,等.車聯(lián)網(wǎng)技術(shù)與應(yīng)用[M].北京:科學出版社,2013:96-116.
[3] 王建強,李世威,曾俊偉.車聯(lián)網(wǎng)發(fā)展模式探析[J].計算機技術(shù)與發(fā)展,2011,21(12):235-238.
[4] 常促宇,向 勇,史美林.車載自組網(wǎng)的現(xiàn)狀與發(fā)展[J].通信學報,2007,28(11):116-126.
[5] 劉南杰.崛起中的車聯(lián)網(wǎng)[J].營贏,2011(11):18-23.
[6] Cisco.Cisco ironport data loss prevention[EB/OL].2013.http://www.ironport.com/kr/technology/ironport_dlp_overview.html.
[7] Mydlp.Web-based data leakage prevention[EB/OL].2014.http://www.mydlp.com/.
[8] Hao F,Kodialam M,Lakshman T V,et al.Protecting cloud data using dynamic inline fingerprint checks[C]//Proc of INFOCOM.Turin:IEEE,2013:2877-2885.
[9] 王志文,王 強.云計算敏感數(shù)據(jù)防泄露技術(shù)研究[J].信息安全與通信保密,2013(8):85-87.
[10] Puttaswamy K,Sala R,Zhao B Y,et al.Starclique:guaranteeing user privacy in social networks against intersection attacks[C]//Proc of CoNEXT.[s.l.]:[s.n.],2009.
[11] Puttaswamy K,Marshall C,Subramanian V R,et al.Docx2go:collaborative editing of fidelity reduced documents on mobile devices[C]//Proc of MobiSys.[s.l.]:[s.n.],2010.
[12] Schear N,Kintana C,Zhang Q,et al.Glavlit:preventing exfiltration at wire speed[C]//Proc of HotNets.[s.l.]:[s.n.],2006.
Data Security Scheme of IOV Based on GID
PANG Li-jun,LIAO Chun-wei,HUANG Bo,ZHAO Hai-tao
(College of Telecommunications & Information Engineering,Nanjing University of Posts and Telecommunications, Nanjing 210003,China)
As a specific application of IOT (Internet Of Things),IOV (Internet Of Vehicle) based on "terminal-pipe-cloud" three-tier system,provides a wealth of intelligent transportation integrated services.However,the data placed in the cloud processing can increase the risk that the illegal user data can steal the secrets.For this,a cloud data security scheme of IOV based on network GID (Gene IDentification) is put forward.Using GID to label data uploaded by data owners and cloud data accessed by the outside world can ensure the uniqueness of the data at the time of uploading and storing in the cloud.When data users want to access data,they can access and use the data only when the gene of data to be accessed is consistent with the pre-extracted gene of data which can be accessed.Analysis and simulation show that the cloud data security scheme of IOV based on network GID not only ensures data security but also reduces the waste of cloud storage space,while increasing the data upload speeds.
IOV;cloud storage;data security;network gene
2014-12-09
2015-04-12
時間:2016-03-22
國家自然科學基金資助項目(61302100,61471203,61201162);中國博士后研究基金(2013M531391);教育部博士點基金(20133223120002);江蘇省基礎(chǔ)研究計劃-重點研究專項基金(BK2011027,BK2012434);江蘇省博士后研究基金(1202083C)
龐立君(1991-),女,碩士研究生,研究方向為下一代通信網(wǎng)絡(luò)技術(shù);黃 波,博士,講師,研究方向為無線網(wǎng)絡(luò)與泛在通信;趙海濤,博士,博士后,副教授,研究方向為無線網(wǎng)絡(luò)與泛在通信。
http://www.cnki.net/kcms/detail/61.1450.TP.20160322.1518.024.html
TP301
A
1673-629X(2016)04-0101-04
10.3969/j.issn.1673-629X.2016.04.022