米 捷, 王旭輝
(1.河南工程學(xué)院 計(jì)算機(jī)學(xué)院,河南 鄭州 451191; 2.河南工程學(xué)院 工程訓(xùn)練中心,河南 鄭州 451191)
隨著智慧物聯(lián)網(wǎng)建設(shè)的發(fā)展,物聯(lián)網(wǎng)應(yīng)用越來越廣泛,通過構(gòu)建層次化物聯(lián)網(wǎng)進(jìn)行數(shù)據(jù)分布式探測(cè)設(shè)計(jì),可實(shí)現(xiàn)組網(wǎng)優(yōu)化,提高物聯(lián)網(wǎng)量化分析能力。在進(jìn)行層次化物聯(lián)網(wǎng)設(shè)計(jì)時(shí),需要進(jìn)行數(shù)據(jù)優(yōu)化檢測(cè),構(gòu)建層次化物聯(lián)網(wǎng)數(shù)據(jù)優(yōu)化檢測(cè)模型[1],結(jié)合模糊相關(guān)性分析方法進(jìn)行物聯(lián)網(wǎng)優(yōu)化檢測(cè)和信息挖掘,以提高大數(shù)據(jù)的挖掘分析能力。
過去的物聯(lián)網(wǎng)數(shù)據(jù)檢測(cè)模型,在數(shù)據(jù)檢測(cè)過程中受網(wǎng)絡(luò)環(huán)境中重復(fù)數(shù)據(jù)和干擾雜質(zhì)數(shù)據(jù)的影響,導(dǎo)致數(shù)據(jù)檢測(cè)的準(zhǔn)確率不高、抗干擾性不好[2]。本研究提出了基于遞歸熵特征提取的層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測(cè)方法,首先進(jìn)行數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)的特征分析,然后進(jìn)行數(shù)據(jù)的特征分析和融合聚類處理,結(jié)合數(shù)據(jù)遞歸熵特征的提取結(jié)果進(jìn)行數(shù)據(jù)的優(yōu)化檢測(cè),最后進(jìn)行仿真測(cè)試,得出了有效性結(jié)論。
為了實(shí)現(xiàn)對(duì)層次化物聯(lián)網(wǎng)數(shù)據(jù)信息處理系統(tǒng)數(shù)據(jù)庫(kù)的訪問和調(diào)度,需要構(gòu)建層次化物聯(lián)網(wǎng)數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)模型,根據(jù)層次化物聯(lián)網(wǎng)數(shù)據(jù)庫(kù)的存儲(chǔ)特征進(jìn)行信息聚類,采用分塊特征匹配方法[3]建立數(shù)據(jù)的存儲(chǔ)空間配對(duì)模型,結(jié)合坐標(biāo)指針?biāo)饕椒ㄟM(jìn)行數(shù)據(jù)的優(yōu)化檢測(cè),得到數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)如圖1所示。
圖1 層次化物聯(lián)網(wǎng)數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)Fig.1 Hierarchical network data storage structure
根據(jù)圖1所示的層次化物聯(lián)網(wǎng)數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)進(jìn)行數(shù)據(jù)的模糊信息聚類,建立數(shù)據(jù)碼元分布序列,采用層次化融合方法進(jìn)行物聯(lián)網(wǎng)數(shù)據(jù)檢測(cè)過程中的自適應(yīng)加權(quán)學(xué)習(xí)[4],學(xué)習(xí)式為
(1)
式中:z0為數(shù)據(jù)的關(guān)聯(lián)估計(jì)值;zi為i點(diǎn)數(shù)據(jù)的實(shí)測(cè)值;di為數(shù)據(jù)檢測(cè)點(diǎn)i和零點(diǎn)的距離;S為實(shí)測(cè)點(diǎn)統(tǒng)計(jì)特征量;K為分塊特征匹配權(quán)重。
根據(jù)自適應(yīng)加權(quán)學(xué)習(xí)方法,進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)的空間特征加權(quán)。提取層次化物聯(lián)網(wǎng)數(shù)據(jù)的關(guān)聯(lián)規(guī)則[5],把數(shù)據(jù)通過多維空間重組方法聚焦到特征空間中,得到分布時(shí)間序列A={a1,a2,…,an},B={b1,b2,…,bm}。層次化物聯(lián)網(wǎng)數(shù)據(jù)的空間聚類模型定義為
(2)
計(jì)算模糊聚類特征系數(shù),定義為
(3)
通過模糊度尋優(yōu)方法進(jìn)行物聯(lián)網(wǎng)數(shù)據(jù)的統(tǒng)計(jì)分析,分析差異度特征量,進(jìn)行數(shù)據(jù)模糊度匹配,得到關(guān)聯(lián)規(guī)則集為
(4)
式中:dm+1(m)為數(shù)據(jù)集在第m點(diǎn)的預(yù)測(cè)值;dk+1(m)為第m點(diǎn)的模糊性特征量。根據(jù)上述分析,實(shí)現(xiàn)了數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)的優(yōu)化重組。
通過挖掘數(shù)據(jù)集統(tǒng)計(jì)的屬性特征,實(shí)現(xiàn)數(shù)據(jù)集統(tǒng)計(jì)檢測(cè)。采用統(tǒng)計(jì)分析方法[6],建立層次化物聯(lián)網(wǎng)數(shù)據(jù)的關(guān)聯(lián)規(guī)則分布矩陣:
(5)
根據(jù)式(5)構(gòu)建層次化物聯(lián)網(wǎng)數(shù)據(jù)的特征提取模型,根據(jù)特征提取結(jié)果進(jìn)行數(shù)據(jù)挖掘。
采用模糊C均值聚類方法進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)的融合聚類。假設(shè)有限數(shù)據(jù)集X={x1,x2,…,xn}?Rs中含有n個(gè)樣本,樣本數(shù)據(jù)為xi。數(shù)據(jù)聚類算法是把對(duì)數(shù)據(jù)的分割轉(zhuǎn)化為對(duì)空間的分割,它不需要直接對(duì)數(shù)據(jù)進(jìn)行處理,而是采用Lagrange定理求得聚類標(biāo)函數(shù)的極值來確定數(shù)據(jù)聚類中心。采用模糊信息聚類算法進(jìn)行數(shù)據(jù)聚類處理[7],得到傳感節(jié)點(diǎn)i處采集到的數(shù)碼元序列(w1 j,w2 j,wtj),其中t為層次化物聯(lián)網(wǎng)數(shù)據(jù)的編號(hào)數(shù)目,wtj為層次化物聯(lián)網(wǎng)數(shù)據(jù)挖掘的加權(quán)系數(shù)。結(jié)合語義特征分析方法,建立層次化物聯(lián)網(wǎng)數(shù)據(jù)挖掘的模糊語義特征規(guī)則分析模型[8],得到層次化物聯(lián)網(wǎng)數(shù)據(jù)的自適應(yīng)加權(quán)系數(shù)
(6)
式中:maxlFreqi, j為數(shù)據(jù)的模糊度辨識(shí)特征量。
采用模糊聚類方法,計(jì)算層次化物聯(lián)網(wǎng)數(shù)據(jù)挖掘的蟻群搜索最短路徑:
(7)
式中:di和dj為相似度屬性。
采用統(tǒng)計(jì)信息分析方法[9]建立層次化物聯(lián)網(wǎng)數(shù)據(jù)挖掘的模糊特征分布集:
(8)
根據(jù)上述分析,構(gòu)建層次化物聯(lián)網(wǎng)數(shù)據(jù)的融合聚類模型,根據(jù)聚類結(jié)果進(jìn)行物聯(lián)網(wǎng)數(shù)據(jù)檢測(cè)[10]。
在采用網(wǎng)格分塊區(qū)域融合方法進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)分析的基礎(chǔ)上,進(jìn)行數(shù)據(jù)檢測(cè)優(yōu)化,提出基于遞歸熵特征提取的層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測(cè)方法。根據(jù)特征提取結(jié)果,采用模糊C均值聚類方法進(jìn)行信息處理:
(9)
式中:Mid表示數(shù)據(jù)檢測(cè)的遞歸熵分布中位數(shù);Lm為最小閾值;fm為數(shù)據(jù)的中位數(shù);fless表示各維度下數(shù)據(jù)的最小統(tǒng)計(jì)特征量。構(gòu)建定量遞歸分析模型,得到遞歸熵特征提取結(jié)果為
(10)
在決策樹模型下,采用自適應(yīng)尋優(yōu)方法進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)遞歸熵的特征提取,根據(jù)提取結(jié)果進(jìn)行物聯(lián)網(wǎng)數(shù)據(jù)檢測(cè)[11]。
提取數(shù)據(jù)的遞歸熵特征量,采用層次化演化聚類方法進(jìn)行數(shù)據(jù)的自適應(yīng)分塊匹配,結(jié)合匹配濾波檢測(cè)器進(jìn)行干擾抑制[12],實(shí)現(xiàn)流程描述如下:
(1)考察層次化物聯(lián)網(wǎng)數(shù)據(jù)信息流矢量x和xn+τ,選擇一個(gè)C值,確定數(shù)據(jù)的匹配濾波系數(shù),若數(shù)據(jù)集為m,令A(yù)j(L)作為濾波階數(shù),其中j=1,2,…,k,使用關(guān)聯(lián)性融合聚類分析方法進(jìn)行數(shù)據(jù)分布式檢測(cè)。
(2)根據(jù)遞歸熵的規(guī)則性分布關(guān)系,得到時(shí)刻t和t+τ之前的相互關(guān)聯(lián)性和數(shù)據(jù)的融合聚類中心F(xi,Aj(L)),其中i=1,2,…,m,j=1,2,…,k。
(3)使用模糊相關(guān)性匹配方法,得到遞歸熵特征分布式檢測(cè)輸出滿足
D(xi,Aj(L))=min{D(xi,Aj(L))},
(11)
那么xi∈ωk。
(4)采用互信息特征分析方法,得到數(shù)據(jù)屬性檢測(cè)的類別特征量S(t),在數(shù)據(jù)聚類中心進(jìn)行多層迭代,得到迭代輸出的平均值:
(12)
(5)當(dāng)滿足收斂條件‖C(l)-C(l-1)‖<ξ時(shí),則中止程序,否則返回步驟(2)。令層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測(cè)的迭代步長(zhǎng)l=l+1,則數(shù)據(jù)檢測(cè)的優(yōu)化輸出為
(13)
通過上述分析,結(jié)合遞歸熵的規(guī)則性分布關(guān)系實(shí)現(xiàn)了層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測(cè)優(yōu)化。
為了驗(yàn)證本方法在層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測(cè)時(shí)的性能,進(jìn)行仿真測(cè)試。采用MATLAB進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測(cè)的算法處理,物聯(lián)網(wǎng)的分布節(jié)點(diǎn)數(shù)為200,數(shù)據(jù)特征重構(gòu)的嵌入維數(shù)為12,采樣時(shí)延為1.4 ms,數(shù)據(jù)存儲(chǔ)的根節(jié)點(diǎn)數(shù)為36,層次化物聯(lián)網(wǎng)數(shù)據(jù)的屬性類別數(shù)為8,數(shù)據(jù)的初始頻率f1=1.5 Hz,終止采樣頻率f2=2.3 Hz。實(shí)驗(yàn)分別選取1維、10維和100維數(shù)據(jù),根據(jù)上述參數(shù)設(shè)定,進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)采樣和檢測(cè)優(yōu)化,分析數(shù)據(jù)的聚類性能和特征檢測(cè)能力,得到層次化物聯(lián)網(wǎng)數(shù)據(jù)如圖2所示。
圖2 層次化物聯(lián)網(wǎng)數(shù)據(jù)Fig.2 Hierarchical Internet of Things data
以圖2的數(shù)據(jù)為研究對(duì)象,采用網(wǎng)格分塊區(qū)域融合方法進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)的優(yōu)化存儲(chǔ)設(shè)計(jì),提取數(shù)據(jù)的遞歸熵特征量,在不同的迭代步數(shù)下得到特征提取結(jié)果如圖3所示。
圖3 數(shù)據(jù)遞歸熵特征提取Fig.3 Data recursive entropy feature extraction
分析圖3可知,本方法能有效實(shí)現(xiàn)對(duì)層次化物聯(lián)網(wǎng)數(shù)據(jù)的特征聚類分析,特征檢測(cè)的聚類性較好,說明數(shù)據(jù)檢測(cè)的抗干擾性較好。分析數(shù)據(jù)檢測(cè)過程中的聚類性能,得到對(duì)比結(jié)果如圖4所示。
圖4 數(shù)據(jù)聚類性能對(duì)比Fig.4 Comparison of the data clustering performance
表1 層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測(cè)準(zhǔn)確率對(duì)比Tab.1 Comparison of the exact probability of the detection of the hierarchical Internet of Thing data
分析圖4發(fā)現(xiàn),采用本方法進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測(cè)的聚類性能較好,抗干擾能力較強(qiáng)。采用不同方法進(jìn)行數(shù)據(jù)檢測(cè)準(zhǔn)確率測(cè)試,得到的對(duì)比結(jié)果見表1。分析表1數(shù)據(jù)得知,采用本方法進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測(cè)的準(zhǔn)確率較高。
構(gòu)建層次化物聯(lián)網(wǎng)數(shù)據(jù)的優(yōu)化檢測(cè)模型,結(jié)合模糊相關(guān)性分析方法進(jìn)行層次化物聯(lián)網(wǎng)的優(yōu)化檢測(cè)和信息挖掘,以提高數(shù)據(jù)的檢測(cè)能力。提出基于遞歸熵特征提取的層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測(cè)方法,根據(jù)自適應(yīng)加權(quán)學(xué)習(xí)方法,進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)的空間特征加權(quán),結(jié)合語義特征分析方法,建立層次化物聯(lián)網(wǎng)數(shù)據(jù)挖掘的模糊語義特征規(guī)則分析模型,采用網(wǎng)格分塊區(qū)域融合方法進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)分析,結(jié)合匹配濾波檢測(cè)方法進(jìn)行數(shù)據(jù)檢測(cè)過程中的干擾抑制。仿真分析得知,采用本方法進(jìn)行數(shù)據(jù)檢測(cè)的準(zhǔn)確率較高、抗干擾性較好。