沈文旭,武航宇,毛 重
(1. 空軍航空大學(xué),吉林 長(zhǎng)春 130022;2. 陸軍裝甲兵學(xué)院士官學(xué)校,吉林 長(zhǎng)春 130051)
無線傳感網(wǎng)絡(luò)[1]依靠自身靈活性強(qiáng)、安裝簡(jiǎn)易等特性被廣泛應(yīng)用于智能交通、數(shù)據(jù)收集以及目標(biāo)定位等高端領(lǐng)域。無線傳感網(wǎng)絡(luò)作為多跳數(shù)的自組織網(wǎng)絡(luò),在運(yùn)行過程中極易遭受網(wǎng)絡(luò)攻擊以及篡改隱私數(shù)據(jù)的威脅,造成不必要的帶寬浪費(fèi)以及隱私泄露危險(xiǎn),由此網(wǎng)絡(luò)隱私數(shù)據(jù)[2]安全以及隱私數(shù)據(jù)融合成為人們一時(shí)間爭(zhēng)相熱議的話題。
文獻(xiàn)[3]提出基于云計(jì)算的社交網(wǎng)絡(luò)安全隱私數(shù)據(jù)融合方法。該方法依據(jù)敏感信息過濾模型對(duì)網(wǎng)絡(luò)隱私數(shù)據(jù)進(jìn)行濾除,通過K匿名技術(shù)對(duì)濾除結(jié)果進(jìn)行隱私保護(hù)處理;再使用均值聚類算法對(duì)隱私數(shù)據(jù)進(jìn)行聚類處理;最后根據(jù)決策樹理論建立網(wǎng)絡(luò)隱私數(shù)據(jù)融合模型,通過該模型實(shí)現(xiàn)網(wǎng)絡(luò)隱私數(shù)據(jù)的融合。該方法由于未能在數(shù)據(jù)融合前對(duì)數(shù)據(jù)進(jìn)行缺失值插補(bǔ)處理,導(dǎo)致該方法在數(shù)據(jù)融合時(shí)的網(wǎng)絡(luò)生命周期短。文獻(xiàn)[4]提出基于分布式壓縮感知和散列函數(shù)的數(shù)據(jù)融合隱私保護(hù)算法。該方法通過分布式的壓縮感知法對(duì)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行稀疏性監(jiān)測(cè),依據(jù)監(jiān)測(cè)結(jié)果去除冗余數(shù)據(jù);使用單向散列函數(shù)對(duì)數(shù)據(jù)監(jiān)測(cè)值進(jìn)行計(jì)算,將數(shù)據(jù)集中的偽裝數(shù)據(jù)填充至數(shù)據(jù)監(jiān)測(cè)值中隱藏真實(shí)數(shù)據(jù);最后通過網(wǎng)絡(luò)節(jié)點(diǎn)獲取散列值,完成數(shù)據(jù)融合。該方法在進(jìn)行監(jiān)測(cè)值計(jì)算時(shí)存在誤差,所以該方法在數(shù)據(jù)融合時(shí)的網(wǎng)絡(luò)延時(shí)高。文獻(xiàn)[5]提出改進(jìn)型支持度函數(shù)的WSN水質(zhì)監(jiān)測(cè)數(shù)據(jù)融合方法。該方法對(duì)數(shù)據(jù)進(jìn)行一致性處理,保證數(shù)據(jù)準(zhǔn)確性;使用動(dòng)態(tài)時(shí)間的彎曲距離優(yōu)化支持度函數(shù);基于優(yōu)化后的支持度函數(shù)計(jì)算數(shù)據(jù)時(shí)間序列;最后使用加權(quán)法對(duì)計(jì)算結(jié)果進(jìn)行加權(quán)處理,實(shí)現(xiàn)數(shù)據(jù)的融合。該方法在優(yōu)化支持度函數(shù)時(shí)存在問題,導(dǎo)致該方法的網(wǎng)絡(luò)延時(shí)高。
為解決上述數(shù)據(jù)融合過程中存在的問題,提出面向網(wǎng)絡(luò)隱私數(shù)據(jù)融合的蟻群算法優(yōu)化方法。
在對(duì)網(wǎng)絡(luò)隱私數(shù)據(jù)進(jìn)行融合[6]前,需要對(duì)數(shù)據(jù)進(jìn)行處理,從而提取網(wǎng)絡(luò)隱私數(shù)據(jù)特征。
2.1.1 網(wǎng)絡(luò)隱私數(shù)據(jù)缺失值插補(bǔ)
網(wǎng)絡(luò)在經(jīng)過長(zhǎng)時(shí)間運(yùn)行后,隱私數(shù)據(jù)中會(huì)出現(xiàn)零值數(shù)據(jù)或空缺數(shù)據(jù),影響隱私數(shù)據(jù)特征提取效果,因此使用拉格朗日插值法對(duì)零值數(shù)據(jù)以及空缺數(shù)據(jù)進(jìn)行插補(bǔ)處理。
首先將網(wǎng)絡(luò)中的隱私數(shù)據(jù)進(jìn)行整合,建立網(wǎng)絡(luò)隱私數(shù)據(jù)集S={s1,s2,…,sn},并對(duì)其進(jìn)行排序處理,找出其中的缺失數(shù)據(jù)確認(rèn)數(shù)據(jù)因變量、自變量,選定缺失值前后10個(gè)隱私數(shù)據(jù)組成5組,進(jìn)行網(wǎng)絡(luò)隱私數(shù)據(jù)的缺失值插補(bǔ),過程如下式所示
(1)
式中,網(wǎng)絡(luò)隱私數(shù)據(jù)缺失值相應(yīng)序號(hào)標(biāo)記為a,非缺失值序號(hào)標(biāo)記為bi,拉格朗日多項(xiàng)式標(biāo)記為ci(a),插補(bǔ)結(jié)果標(biāo)記為Cn(a)。
2.1.2 標(biāo)準(zhǔn)化處理
由于網(wǎng)絡(luò)隱私數(shù)據(jù)特征占比并不相同,所以小數(shù)值數(shù)據(jù)特征會(huì)被大數(shù)值特征替代掉,所以網(wǎng)絡(luò)隱私數(shù)據(jù)在缺失值插補(bǔ)后,要對(duì)數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)化[7]處理,將數(shù)據(jù)整合至[0,1]區(qū)間內(nèi),過程如下式所示
s′=s-smin/smax-smin
(2)
式中,原始網(wǎng)絡(luò)隱私數(shù)據(jù)標(biāo)記為s,數(shù)據(jù)標(biāo)準(zhǔn)化前隱私數(shù)據(jù)集的最大、最小數(shù)據(jù)分別用smin和smax表示,數(shù)據(jù)的標(biāo)準(zhǔn)化結(jié)果標(biāo)記為s′。
依據(jù)上述的網(wǎng)絡(luò)隱私數(shù)據(jù)標(biāo)準(zhǔn)化結(jié)果分析隱私數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。
首先,采用語義特征分解法獲取網(wǎng)絡(luò)隱私數(shù)據(jù)語義相關(guān)特征分布集合A,使用屬性加權(quán)法建立數(shù)據(jù)加強(qiáng)函數(shù)f(w),獲取網(wǎng)絡(luò)隱私數(shù)據(jù)相似度分布系數(shù),結(jié)果如下式所示
(3)
式中,數(shù)據(jù)采樣區(qū)域分布幅值標(biāo)記為b(wi),數(shù)據(jù)的特征匹配系數(shù)標(biāo)記為η,數(shù)據(jù)的可靠特征量標(biāo)記為z(x,y),數(shù)據(jù)的關(guān)聯(lián)信息匹配集標(biāo)記為P,網(wǎng)絡(luò)隱私數(shù)據(jù)相似度分布系數(shù)標(biāo)記為g(h)。依據(jù)上述獲取的g(h)獲取數(shù)據(jù)(p+q)階的相似度幾何矩,結(jié)果如下式所示
(4)
式中,網(wǎng)絡(luò)隱私數(shù)據(jù)融合參數(shù)標(biāo)記為(x+y)形式,相似度系數(shù)總量標(biāo)記為h,建立的相似度幾何矩用P(p+q)表述。
基于模糊聚類法[8]對(duì)上式進(jìn)行轉(zhuǎn)化,獲取網(wǎng)絡(luò)隱私數(shù)據(jù)二階的特征分布矩陣,過程如下式所示
X=P(p+q)+f(n)+γ
(5)
式中,網(wǎng)絡(luò)隱私數(shù)據(jù)特征參數(shù)標(biāo)記為f(n),檢測(cè)參數(shù)標(biāo)記為γ,建立的二階分布矩陣用X表示?;谏鲜鰴z測(cè)結(jié)果,使用相關(guān)鄰域搜索方法,建立網(wǎng)絡(luò)隱私數(shù)據(jù)的自適應(yīng)加權(quán)模型,獲取數(shù)據(jù)的自相關(guān)特征匹配集合,表述過程如下式所示
(6)
式中,網(wǎng)絡(luò)隱私數(shù)據(jù)的特征稀疏性分布集標(biāo)記為Fxs,自適應(yīng)加權(quán)模型標(biāo)記為R,數(shù)據(jù)量化特征分布子集用(t1,t2,…tn)表示,自相關(guān)特征匹配集合標(biāo)記為st(c)。
基于上述分析結(jié)果,結(jié)合信息的多維識(shí)別法[9]對(duì)網(wǎng)絡(luò)隱私數(shù)據(jù)進(jìn)行重組、信息編碼處理,建立網(wǎng)絡(luò)隱私數(shù)據(jù)的線性編碼模型,通過模型分解數(shù)據(jù)獲取數(shù)據(jù)的模糊特征解,過程如下式所示
U(ω)=[Δv+ki]+st(a)
(7)
式中,隱私數(shù)據(jù)的控制參數(shù)標(biāo)記為Δv,數(shù)據(jù)的信息識(shí)別函數(shù)標(biāo)記為ki,數(shù)據(jù)的編碼模型標(biāo)記為st(a),獲取的模糊特征解用U(ω)表述,特征解數(shù)量標(biāo)記為ω。
依據(jù)上述的數(shù)據(jù)集模糊特征解獲取結(jié)果,結(jié)合相空間重構(gòu)法[10]建立數(shù)據(jù)的鄰域特征加權(quán)模型,通過計(jì)算獲取網(wǎng)絡(luò)隱私數(shù)據(jù)的空間維數(shù)以及數(shù)據(jù)特征量,過程如下式所示
(8)
式中,隱私數(shù)據(jù)的鄰域加權(quán)模型標(biāo)記為Q(ev),特征空間維度標(biāo)記為Ji,提取的隱私數(shù)據(jù)特征標(biāo)記為Z(h),隱私數(shù)據(jù)的可靠性特征分量標(biāo)記為assoc(B,V),數(shù)據(jù)特征信息熵用f(g)表述,數(shù)據(jù)的加權(quán)門限值標(biāo)記為Nth,隱私數(shù)據(jù)的特征向量分別標(biāo)記為si、sj形式,最佳迭代次數(shù)標(biāo)記為Δsi,網(wǎng)絡(luò)隱私數(shù)據(jù)融合參數(shù)標(biāo)記為X,數(shù)據(jù)重構(gòu)參數(shù)用φs表述,迭代增長(zhǎng)標(biāo)記為l。
最后基于獲取的網(wǎng)絡(luò)隱私數(shù)據(jù)特征值建立網(wǎng)絡(luò)隱私數(shù)據(jù)特征向量集。
使用優(yōu)化后的蟻群算法計(jì)算網(wǎng)絡(luò)隱私數(shù)據(jù)特征向量集,完成網(wǎng)絡(luò)隱私數(shù)據(jù)的融合。
蟻群算法[11]實(shí)質(zhì)上就是通過模擬螞蟻覓食行為獲取組合優(yōu)化問題。網(wǎng)絡(luò)隱私數(shù)據(jù)融合過程就是螞蟻在固定范圍內(nèi)的最佳路徑選擇過程。
設(shè)定螞蟻數(shù)量為n,自源節(jié)點(diǎn)開始進(jìn)行搜索,路徑上的初始信息素濃度相等,過程中螞蟻依靠路徑上的信息素濃度以及啟發(fā)信息確定下一搜索節(jié)點(diǎn)。螞蟻移動(dòng)規(guī)則如下式所示
(9)
式中,最大鄰域區(qū)間標(biāo)記為([ζij(g)]α,[μij(g)]β),初始搜索概率標(biāo)記為r0。依據(jù)獲取的螞蟻移動(dòng)規(guī)則計(jì)算螞蟻的路徑選取概率,過程如下式所示
(10)
(11)
由于傳統(tǒng)蟻群算法在進(jìn)行網(wǎng)絡(luò)隱私數(shù)據(jù)融合時(shí),會(huì)使算法過早進(jìn)入局部最優(yōu)解狀態(tài),所以要在蟻群算法中引入鄰域搜索算法[12],優(yōu)化傳統(tǒng)蟻群算法。
插入式領(lǐng)域結(jié)構(gòu)是將位置i進(jìn)行剔除處理,并將結(jié)果插進(jìn)位置j當(dāng)中去,設(shè)定路徑全局最優(yōu)解位置為(i,j),移動(dòng)解標(biāo)記ε′從而使ε=(ε(1),ε(2),…ε(m))。再以此為基礎(chǔ)使用反變異算子,對(duì)路徑進(jìn)行反轉(zhuǎn)處理,由此便能使蟻群算法對(duì)整個(gè)解空間的最優(yōu)解進(jìn)行搜索。算法具體流程如下:
1)初始化網(wǎng)絡(luò)節(jié)點(diǎn)連通圖,設(shè)定相關(guān)參數(shù)。
2)將螞蟻放至網(wǎng)絡(luò)源節(jié)點(diǎn),制定禁忌表。
3)螞蟻移動(dòng)搜索路徑,過程中若發(fā)現(xiàn)螞蟻所在位置為sink節(jié)點(diǎn),螞蟻可停止移動(dòng);螞蟻進(jìn)行下一路徑搜索時(shí),需識(shí)別該節(jié)點(diǎn)是否為sink節(jié)點(diǎn),若是就繼續(xù)移動(dòng)至下一節(jié)點(diǎn)并將該節(jié)點(diǎn)加入禁忌表中。
4)計(jì)算螞蟻搜索路徑長(zhǎng)度,執(zhí)行領(lǐng)域搜索變異算子,對(duì)路徑進(jìn)行反轉(zhuǎn)處理。
5)依據(jù)式(10)和式(11)更新路徑信息素濃度。
6)設(shè)定相關(guān)約束條件,辨識(shí)算法是否滿足,若滿足輸出全局最優(yōu)解,若不滿足則返回流程2)繼續(xù)搜索。
在使用鄰域搜索蟻群算法[13]融合網(wǎng)絡(luò)隱私數(shù)據(jù)時(shí),算法計(jì)算初期以及后期需選定較大的初始概率,而算法中期需選定較小的初始概率值。算法迭代至一定范圍時(shí),使用鄰域搜索法搜索當(dāng)前最小路徑,從而進(jìn)一步優(yōu)化蟻群算法的最優(yōu)解搜索結(jié)果,從而獲取最佳的網(wǎng)絡(luò)隱私數(shù)據(jù)[14]融合值。
基于蟻群優(yōu)化算法的網(wǎng)絡(luò)隱私數(shù)據(jù)融合方法具體流程如下:
1)初始化
依據(jù)網(wǎng)絡(luò)隱私特征向量集生成一個(gè)連通圖,并對(duì)路徑信息素進(jìn)行歸一化處理[15]。設(shè)定相關(guān)參數(shù)并制定相關(guān)約束條件以及最大迭代次數(shù)、確定鄰域搜索閾值。
2)投入螞蟻
在連通圖源節(jié)點(diǎn)位置放入若干螞蟻,建立禁忌表。
3)進(jìn)入搜索
設(shè)定螞蟻當(dāng)前所在位置為i,節(jié)點(diǎn)相鄰集合標(biāo)記為allowedk,當(dāng)螞蟻進(jìn)行搜索時(shí),判斷所在節(jié)點(diǎn)是否為sink節(jié)點(diǎn),若是直接加入禁忌表中,停止搜索;同時(shí)對(duì)該節(jié)點(diǎn)位置的相鄰節(jié)點(diǎn)集合進(jìn)行搜索,獲取轉(zhuǎn)移概率,為螞蟻移動(dòng)做好準(zhǔn)備。
4)迭代搜索
基于上述流程,對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)進(jìn)行搜索,并將搜索路徑添加至禁忌表中,直至搜索完成,計(jì)算螞蟻搜索路徑總長(zhǎng)度。
5)判斷
對(duì)螞蟻搜索迭代次數(shù)進(jìn)行判斷,是否開啟鄰域搜索模式。若開啟,則對(duì)搜索路徑進(jìn)行反向變異操作。
6)將流程5)計(jì)算結(jié)果與螞蟻搜索結(jié)果進(jìn)行對(duì)比,若低于螞蟻搜索路徑長(zhǎng)度則對(duì)其進(jìn)行替換處理。
7)更新信息素
對(duì)路徑的信息素進(jìn)行更新,輸出路徑最優(yōu)解,獲取最佳融合值,完成網(wǎng)絡(luò)隱私數(shù)據(jù)融合。
為了驗(yàn)證上述網(wǎng)絡(luò)隱私數(shù)據(jù)融合方法的整體有效性,需要對(duì)此方法進(jìn)行測(cè)試。
分別采用面向網(wǎng)絡(luò)隱私數(shù)據(jù)融合的蟻群算法優(yōu)化方法(所提方法)、基于云計(jì)算的社交網(wǎng)絡(luò)安全隱私數(shù)據(jù)融合方法(文獻(xiàn)[3]方法)、基于分布式壓縮感知和散列函數(shù)的數(shù)據(jù)融合隱私保護(hù)算法(文獻(xiàn)[4]方法)進(jìn)行測(cè)試;
網(wǎng)絡(luò)隱私數(shù)據(jù)在融合過程中,網(wǎng)絡(luò)生命周期的長(zhǎng)短和網(wǎng)絡(luò)時(shí)延的高低都會(huì)影響數(shù)據(jù)融合算法的融合性能。采用所提方法、文獻(xiàn)[3]方法以及文獻(xiàn)[4]方法進(jìn)行網(wǎng)絡(luò)隱私數(shù)據(jù)融合時(shí),對(duì)上述影響指標(biāo)進(jìn)行測(cè)試。
1)網(wǎng)絡(luò)生命周期測(cè)試
網(wǎng)絡(luò)隱私數(shù)據(jù)在進(jìn)行融合時(shí),融合結(jié)果會(huì)影響網(wǎng)絡(luò)生命周期,融合方法的融合效果越好,網(wǎng)絡(luò)節(jié)點(diǎn)的負(fù)載均衡越穩(wěn)定,網(wǎng)絡(luò)生命周期越長(zhǎng)。采用所提方法、文獻(xiàn)[3]方法以及文獻(xiàn)[4]方法融合網(wǎng)絡(luò)隱私數(shù)據(jù)時(shí),測(cè)試三種方法網(wǎng)絡(luò)生命周期,結(jié)果如圖1所示。
圖1 不同融合方法的網(wǎng)絡(luò)生命周期測(cè)試結(jié)果
分析圖1可知,所提方法測(cè)試出的網(wǎng)絡(luò)生命周期高于文獻(xiàn)[3]方法以及文獻(xiàn)[4]方法測(cè)試結(jié)果,文獻(xiàn)[3]方法在測(cè)試次數(shù)為50時(shí),所檢測(cè)出的網(wǎng)絡(luò)生命周期高于文獻(xiàn)[4]方法測(cè)試結(jié)果,但是當(dāng)測(cè)試次數(shù)為100時(shí),文獻(xiàn)[3]方法與文獻(xiàn)[4]方法檢測(cè)出的網(wǎng)絡(luò)生命周期一致,并隨著測(cè)試的進(jìn)行文獻(xiàn)[4]方法超過文獻(xiàn)[3]方法的測(cè)試結(jié)果。由于所提方法測(cè)試出的網(wǎng)絡(luò)生命周期高,可以證明所提方法的數(shù)據(jù)融合性能好、網(wǎng)絡(luò)節(jié)點(diǎn)負(fù)載均衡。
2)網(wǎng)絡(luò)延時(shí)測(cè)試
進(jìn)行網(wǎng)絡(luò)隱私數(shù)據(jù)融合時(shí),網(wǎng)絡(luò)延時(shí)的高低是衡量數(shù)據(jù)融合性能的關(guān)鍵。數(shù)據(jù)在融合時(shí),網(wǎng)絡(luò)延時(shí)越高說明數(shù)據(jù)融合方法的融合性能越差,反之則越好。采用所提方法、文獻(xiàn)[3]方法以及文獻(xiàn)[4]方法融合網(wǎng)絡(luò)數(shù)據(jù)時(shí),測(cè)試三種方法的網(wǎng)絡(luò)延時(shí),結(jié)果如圖2所示。
圖2 不同融合方法的網(wǎng)絡(luò)延時(shí)測(cè)試結(jié)果
分析圖2可知,所提方法在進(jìn)行數(shù)據(jù)融合時(shí),測(cè)試出的網(wǎng)絡(luò)延時(shí)低于其它兩種數(shù)據(jù)融合方法。這主要是因?yàn)樗岱椒ㄔ谶M(jìn)行數(shù)據(jù)融合前對(duì)數(shù)據(jù)缺失值進(jìn)行了插補(bǔ)處理,所以所提方法在進(jìn)行數(shù)據(jù)融合時(shí)的網(wǎng)絡(luò)延時(shí)低,數(shù)據(jù)融合性能好。
近年來,隨著無線傳感技術(shù)的革新,無線傳感網(wǎng)絡(luò)結(jié)果愈加復(fù)雜多樣,網(wǎng)絡(luò)隱私數(shù)據(jù)融合的作用也變得更為重要。針對(duì)傳統(tǒng)數(shù)據(jù)融合方法中存在的問題,提出面向網(wǎng)絡(luò)隱私數(shù)據(jù)融合的蟻群算法優(yōu)化方法。該方法基于插補(bǔ)的缺失值提取網(wǎng)絡(luò)隱私數(shù)據(jù)特征;基于鄰域搜索算法優(yōu)化蟻群算法;最后通過優(yōu)化后的蟻群算法搜索網(wǎng)絡(luò)數(shù)據(jù)特征集,輸出最佳數(shù)據(jù)融合值,實(shí)現(xiàn)數(shù)據(jù)融合。由于該方法在提取數(shù)據(jù)特征時(shí)存在些許問題,今后會(huì)針對(duì)該項(xiàng)問題繼續(xù)優(yōu)化該融合方法。