過(guò) 珺
(安徽中醫(yī)藥高等專科學(xué)校 基礎(chǔ)教學(xué)部, 安徽 蕪湖 241000)
隨著數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)的發(fā)展,網(wǎng)絡(luò)用戶增多,需要對(duì)數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶數(shù)據(jù)進(jìn)行有效的隱私保護(hù),通過(guò)挖掘數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)[1],分析隱私編碼信息分量,結(jié)合模糊度檢測(cè)和信息融合的方法,進(jìn)行數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)檢測(cè)和優(yōu)化挖掘,提高數(shù)據(jù)的檢測(cè)和識(shí)別能力.研究數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)挖掘方法,對(duì)提高其數(shù)據(jù)安全性和可靠性方面具有重要意義[2].
當(dāng)前對(duì)數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)挖掘方法主要有傳感信息跟蹤識(shí)別方法、Hash融合聚類分析方法[3]、關(guān)聯(lián)規(guī)則特征提取方法[4]、統(tǒng)計(jì)分析方法和模糊信息融合方法等[5].結(jié)合大數(shù)據(jù)特征采樣和優(yōu)化建模,進(jìn)行數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)挖掘和特征分析,但傳統(tǒng)方法進(jìn)行數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)挖掘的適應(yīng)度水平不高,挖掘過(guò)程的抗干擾性不好.針對(duì)上述問(wèn)題,本文提出基于概念格模型的用戶隱私保護(hù)數(shù)據(jù)挖掘算法.首先構(gòu)建數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的特征檢測(cè)模型,然后通過(guò)多維信息識(shí)別對(duì)無(wú)線傳感器網(wǎng)絡(luò)的用戶隱私保護(hù)數(shù)據(jù)進(jìn)行重組和編碼,通過(guò)多維參數(shù)融合和信息加密控制方法構(gòu)建用戶隱私保護(hù)數(shù)據(jù)的概念格模型,并在該概念下建立用戶隱私保護(hù)數(shù)據(jù)格模型融合挖掘加密協(xié)議,最后采用關(guān)聯(lián)的頻譜特征檢測(cè)方法,實(shí)現(xiàn)用戶隱私保護(hù)的數(shù)據(jù)挖掘和特征提取.在此基礎(chǔ)上進(jìn)行仿真測(cè)試分析,展示了本文方法在提高用戶隱私保護(hù)數(shù)據(jù)挖掘能力方面的優(yōu)越性能.
為了實(shí)現(xiàn)基于概念格模型的用戶隱私保護(hù)數(shù)據(jù)挖掘,采用分塊結(jié)構(gòu)重組和概念格分布模型,得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的數(shù)據(jù)存儲(chǔ)分布結(jié)構(gòu)如圖1所示.
圖1 數(shù)據(jù)存儲(chǔ)分布結(jié)構(gòu)
采用概念集融合和語(yǔ)義特征分解的方法,得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的語(yǔ)義相關(guān)特征分布集為X,在n維向量中得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的相似度特征分布系數(shù),采用屬性加權(quán)控制[6],得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)加權(quán)學(xué)習(xí)函數(shù)為:ω1,ω2,…,ωe,令Q為優(yōu)化的數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)模型下的關(guān)聯(lián)信息匹配子集,表示為
(1)
(1)式中,p(ωi)為數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)采樣的區(qū)塊分布幅值,μ=E(x)為數(shù)據(jù)的粗糙集特征匹配系數(shù).采用融合特征匹配,構(gòu)建數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的可靠度檢測(cè)特征量,表示為f(x,y),求得(p+q)階隱私保護(hù)數(shù)據(jù)的相似度分布的幾何矩為
(2)
(2)式中,(x,y)是數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的融合參數(shù),采用模糊聚類,得到數(shù)據(jù)的二階特征分布矩為
S=Pa+f(n)+λ,
(3)
(3)式中,f(n)為網(wǎng)絡(luò)數(shù)據(jù)控制特征參數(shù),λ為數(shù)據(jù)檢測(cè)方法參數(shù),通過(guò)頻域檢測(cè)和鄰域空間搜索的方法,構(gòu)建數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的自適應(yīng)加權(quán)學(xué)習(xí)模型,得到自相關(guān)學(xué)習(xí)的特征匹配集,表示為
(4)
(4)式中,xi∈Rn,給定數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的模型結(jié)構(gòu),表示為一個(gè)數(shù)據(jù)圖G=(V,E),采用語(yǔ)義本體融合,得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的稀疏度特征分布集Y={y1,…,yl},采用查詢節(jié)點(diǎn)的向量量化特征分解,得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的量化特征分布子集{v1,v2,…,vn},輸出數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的信息編碼模型,實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)分塊解析[7-9].
通過(guò)多維信息識(shí)別的方法進(jìn)行無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)重組和信息編碼,構(gòu)建隱私保護(hù)數(shù)據(jù)的線性稀疏特征編碼模型[10],通過(guò)多維參數(shù)融合和信息加密控制,得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的模糊分片特征解為
k(w)=[Δr+ui]+xv(a),
(5)
(5)式中,Δr為數(shù)據(jù)信息加密控制參數(shù),ui為多維信息識(shí)別函數(shù),根據(jù)分組檢測(cè)和相空間重構(gòu)的方法,構(gòu)建數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的鄰域特征加權(quán)模型,表示為
(6)
(6)式中,assoc(A,V)是數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的輸出可靠性特征分量,通過(guò)粗糙度匹配,得到數(shù)據(jù)特征提取的信息熵為t(g).
采用關(guān)聯(lián)屬性挖掘和門限特征檢測(cè),得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)重構(gòu)的加權(quán)門限值Nth,當(dāng)用戶隱私保護(hù)數(shù)據(jù)重構(gòu)加權(quán)值Neff (7) (7)式中,Δxi為最優(yōu)迭代步長(zhǎng),采用全局尋優(yōu)和迭代算法,得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的加密密鑰為. v(g)=X+[θs+l]. (8) (8)式中,θs為數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)重構(gòu)輸出參數(shù),l為迭代步長(zhǎng)增量.根據(jù)上述分析,構(gòu)建隱私保護(hù)數(shù)據(jù)加密重構(gòu)模型,通過(guò)多維參數(shù)融合和信息加密控制方法進(jìn)行用戶隱私保護(hù)數(shù)據(jù)的概念格模型構(gòu)造[11]. 采用編碼器—解碼器結(jié)構(gòu)模型,建立數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的融合的線性融合模型,通過(guò)模糊分割方法[12],得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)的本體特征量,表示為 (9) (9)式中,b(τ,φ)是數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私數(shù)據(jù)分布的信息熵,采用多尺度的特征圖融合方法,得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)的適應(yīng)度函數(shù)為cm,g(y)為多尺度的特征分布式融合模型參數(shù). 根據(jù)對(duì)隱私保護(hù)數(shù)據(jù)的位置和類別信息的抽象特征檢測(cè)[13],進(jìn)行自適應(yīng)融合,得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私數(shù)據(jù)融合聚類結(jié)果為 (10) 根據(jù)有效的網(wǎng)絡(luò)結(jié)構(gòu)分析,采用線性特征融合聚類,得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私信息分布的位置向量記為T={T1,T2,…,TNA}.根據(jù)分塊概念格模型,得到無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)的聚類參數(shù)為Mi與Mj,采用雙線性插值運(yùn)算和稀疏模塊化重構(gòu),得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私信息的本體特征分量Clustdist(Mi,Mj),其中,(i≠j,1≤i≤q,1≤j≤q),提取二階統(tǒng)計(jì)特征量作為概念格,根據(jù)網(wǎng)絡(luò)用戶隱私信息挖掘的概念格分布,建立概念格模型融合下的用戶隱私保護(hù)數(shù)據(jù)挖掘加密協(xié)議,通過(guò)模糊空間信息重組,進(jìn)行數(shù)據(jù)的信息編碼[13]. 考慮不同屬性數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私數(shù)據(jù)的聚類過(guò)程的差異性得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)聚類的模糊子空間記作x1,x2,…,xm+1,第k個(gè)數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)挖掘節(jié)點(diǎn)為δk (11) (11)式中,Ui表示數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)集,k為負(fù)載參數(shù),Θ(t)為數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)的隨機(jī)概率密度參數(shù).以此為基礎(chǔ),構(gòu)建數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私數(shù)據(jù)挖掘的線性規(guī)劃模型,表示為 I(as)=V+δk+Θ(t), (12) (12)式中,V表示數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私數(shù)據(jù)的檢測(cè)統(tǒng)計(jì)特征量.通過(guò)系數(shù)線性編碼得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私數(shù)據(jù)挖掘輸出的互信息 (13) (13)式中,τ為離散區(qū)間數(shù),pij表示數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私數(shù)據(jù)挖掘的模糊度參數(shù). 通過(guò)模糊空間信息重組,實(shí)現(xiàn)對(duì)用戶隱私保護(hù)數(shù)據(jù)的特征分布式融合和線性重構(gòu),采用關(guān)聯(lián)譜特征檢測(cè)方法,得到關(guān)聯(lián)譜特征為 ζ=Nw+[w+C], (14) (14)式中,w為用戶隱私保護(hù)數(shù)據(jù)的自適應(yīng)分布權(quán)重,C為用戶隱私保護(hù)數(shù)據(jù)的簇聚類參數(shù),根據(jù)向量量化編碼結(jié)果,得到用戶隱私保護(hù)數(shù)據(jù)挖掘輸出為 Q=NA+C+ζ, (15) (15)式中,NA為用戶隱私保護(hù)數(shù)據(jù)的用戶隱私保護(hù)數(shù)據(jù)參數(shù),根據(jù)不同層級(jí)的特征信息融合結(jié)果,實(shí)現(xiàn)用戶隱私保護(hù)數(shù)據(jù)挖掘.實(shí)現(xiàn)流程如圖2所示. 圖2 用戶隱私保護(hù)數(shù)據(jù)挖掘?qū)崿F(xiàn)流程 為了驗(yàn)證本文方法在實(shí)現(xiàn)數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私保護(hù)數(shù)據(jù)挖掘中的應(yīng)用性能,在Simulink仿真平臺(tái)上進(jìn)行數(shù)據(jù)挖掘的仿真實(shí)驗(yàn),設(shè)置數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私數(shù)據(jù)采集的頻譜帶寬為12.5 dB,相似度分布系數(shù)為0.36,可靠性特征參數(shù)1.26,數(shù)據(jù)維數(shù)為24,像素值為1200,測(cè)試樣本集為500,根據(jù)上述參數(shù)設(shè)定,得到數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私數(shù)據(jù)采集的頻譜如圖3所示. 圖3 數(shù)據(jù)采集的頻譜分布圖4 數(shù)據(jù)編碼 根據(jù)圖3的頻譜特征分析,進(jìn)行數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私數(shù)據(jù)量化編碼,如圖4所示. 根據(jù)數(shù)據(jù)編碼結(jié)果得知,本文方法能有效實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)用戶數(shù)據(jù)隱私保護(hù),在此基礎(chǔ)上實(shí)現(xiàn)數(shù)據(jù)挖掘,優(yōu)化挖掘輸出如圖5所示. 圖5 數(shù)據(jù)挖掘輸出 分析圖5得知,本文方法進(jìn)行數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私數(shù)據(jù)挖掘的輸出值與數(shù)據(jù)采集的頻譜分布輸出值一致,表明該方法的分辨能力較好. 以文獻(xiàn)[4]和文獻(xiàn)[5]的方法作為實(shí)驗(yàn)對(duì)比方法,測(cè)試數(shù)據(jù)挖掘的精度,得到對(duì)比實(shí)驗(yàn)結(jié)果如表1所示. 表1 數(shù)據(jù)挖掘的精度對(duì)比 分析表1得知,在迭代次數(shù)為40時(shí),本文方法對(duì)數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私數(shù)據(jù)挖掘的精度達(dá)到1,而此時(shí)文獻(xiàn)[4]方法的數(shù)據(jù)挖掘精度為0.925,文獻(xiàn)[5]方法的數(shù)據(jù)挖掘精度為0.933.由上述實(shí)驗(yàn)結(jié)果可知,本文方法具有較高的用戶隱私數(shù)據(jù)挖掘的精度,能夠保證用戶隱私數(shù)據(jù)的安全傳輸及存儲(chǔ). 對(duì)數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶數(shù)據(jù)進(jìn)行有效的隱私保護(hù),提高數(shù)據(jù)的隱私保護(hù)性,本文提出基于概念格模型的用戶隱私保護(hù)數(shù)據(jù)挖掘算法.研究得知,本文方法對(duì)數(shù)字媒體無(wú)線傳感網(wǎng)絡(luò)用戶隱私數(shù)據(jù)挖掘的精度較高,性能較好,能夠應(yīng)用于實(shí)際中,提升用戶隱私數(shù)據(jù)的安全性.2 用戶隱私保護(hù)數(shù)據(jù)挖掘優(yōu)化
2.1 數(shù)據(jù)信息編碼
2.2 數(shù)據(jù)挖掘和融合輸出
3 仿真測(cè)試分析
4 結(jié)束語(yǔ)