周賢來
(廣州松田職業(yè)學院,廣東 廣州 511370)
智慧物聯(lián)網(wǎng)建設和發(fā)展過程中,多采用異構多核平臺進行物聯(lián)網(wǎng)層次化結構設計,以提高物聯(lián)網(wǎng)大數(shù)據(jù)的信息分布式存儲和檢測能力。在進行物聯(lián)網(wǎng)構造過程中,需要進行異構多核平臺大數(shù)據(jù)挖掘,進行物聯(lián)網(wǎng)的分布節(jié)點的信息優(yōu)化存儲設計,故采用大數(shù)據(jù)信息融合技術,實現(xiàn)對異構多核平臺大數(shù)據(jù)特征的量化分析,構建異構多核平臺大數(shù)據(jù)的優(yōu)化挖掘模型,結合模糊相關性分析方法進行異構多核平臺大數(shù)據(jù)挖掘和特征提取,分析異構多核平臺大數(shù)據(jù)信息傳輸穩(wěn)定性特征分量,以實現(xiàn)異構多核平臺的大數(shù)據(jù)挖掘和檢測[1]。研究異構多核平臺大數(shù)據(jù)挖掘算法,在異構多核平臺的存儲優(yōu)化設計中具有重要意義。
對異構多核平臺進行大數(shù)據(jù)挖掘,在數(shù)據(jù)融合和特征提取方法基礎上,采用異構多核平臺大數(shù)據(jù)處理方法進行信息管理調(diào)度,進行異構多核平臺大數(shù)據(jù)的采集、統(tǒng)計、匯總,建立大數(shù)據(jù)信息處理平臺進行異構多核平臺大數(shù)據(jù)的自動挖掘[2-3],其中,Sierociuk等[4]提出基于嵌入式Linux內(nèi)核和B/S構架的進行異構多核平臺大數(shù)據(jù)可視化挖掘方法,以MySQL為數(shù)據(jù)庫進行異構多核平臺大數(shù)據(jù)可視化系統(tǒng)的數(shù)據(jù)庫底層構造,在B/S構架體系下,采用程序加載控制方法,進行異構多核平臺大數(shù)據(jù)可視化挖掘系統(tǒng)的Tomcat服務器開發(fā),提高數(shù)據(jù)挖掘的精度,但該方法的計算開銷較大,信息融合度不高。曲琦等[5]提出基于模糊聚類的大數(shù)據(jù)挖掘方法,采用大數(shù)據(jù)挖掘和模糊信息融合聚類方法進行異構多核平臺大數(shù)據(jù)挖掘設計,提高數(shù)據(jù)挖掘的精度,但該方法的模糊度較大,抗干擾性不好[6]。針對上述問題,本文提出基于語義分割的異構多核平臺大數(shù)據(jù)精準挖掘方法。構建異構多核平臺大數(shù)據(jù)的模糊信息檢測模型,采用關聯(lián)特征提取方法進行異構多核平臺大數(shù)據(jù)的模糊指向性聚類分析,構建異構多核平臺大數(shù)據(jù)的輸出自相關特征匹配模型,結合語義特征提取方法進行異構多核平臺大數(shù)據(jù)的特征提取和統(tǒng)計分析,建立異構多核平臺大數(shù)據(jù)的語義動態(tài)特征分析模型,提取異構多核平臺大數(shù)據(jù)的統(tǒng)計特征量,實現(xiàn)異構多核平臺大數(shù)據(jù)挖掘。最后進行仿真實驗,得出有效性結論。
為了實現(xiàn)異構多核平臺大數(shù)據(jù)精準挖掘,構建異構多核平臺大數(shù)據(jù)的模糊信息檢測模型。當前,對異構多核平臺的數(shù)據(jù)挖掘方法主要有基于模糊神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘方法、PSO數(shù)據(jù)挖掘方法、關聯(lián)屬性特征挖掘方法和統(tǒng)計信息挖掘方法等。其中文獻[7]提出基于模糊神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘方法,根據(jù)異構多核平臺大數(shù)據(jù)的混合分類屬性進行相似度分析,提取異構多核平臺大數(shù)據(jù)的數(shù)值屬性特征和分類屬性特征,完成異構多核平臺大數(shù)據(jù)優(yōu)化挖掘,提高數(shù)據(jù)的挖掘精度。文獻[8]提出基于簡化梯度算法的異構多核平臺數(shù)據(jù)挖掘模型,采用匹配濾波器進行網(wǎng)絡通信數(shù)據(jù)的干擾濾波,結合自適應的信道均衡控制方法進行數(shù)據(jù)挖掘,提高數(shù)據(jù)的挖掘自適應性。本文采用關聯(lián)特征提取方法進行異構多核平臺大數(shù)據(jù)的模糊相關性分析,采用云信息處理平臺進行異構大數(shù)據(jù)的特征檢測,構建異構多核平臺大數(shù)據(jù)的自動挖掘模型,采用模糊信息聚類分析方法,進行異構多核平臺大數(shù)據(jù)的統(tǒng)計信息類別分析,采用點、線、面狀要素聯(lián)合分析方法,建立信息屬性鏈模型,建立異構多核平臺大數(shù)據(jù)挖掘的模糊決策模型,采用自適應尋優(yōu)方法,進行異構多核平臺大數(shù)據(jù)的優(yōu)化挖掘。建立異構多核平臺大數(shù)據(jù)的屬性鏈表,得到異構多核平臺大數(shù)據(jù)的空間分布結構模型如圖1所示。
圖1 異構多核平臺大數(shù)據(jù)的空間分布結構模型
在圖1所示的異構多核平臺大數(shù)據(jù)的空間分布結構模型中,采用融合性聚類分析方法,進行異構多核平臺大數(shù)據(jù)優(yōu)化挖掘,結合指針識別方法,進行異構多核平臺大數(shù)據(jù)挖掘的指針分析,得到異構多核平臺大數(shù)據(jù)挖掘的指針分布如圖2所示。
圖2 異構多核平臺大數(shù)據(jù)挖掘的指針分布
采用分塊區(qū)域融合方法進行異構多核平臺大數(shù)據(jù)精準定位,建立異構多核平臺大數(shù)據(jù)挖掘的存儲模塊和信息查詢模塊,提取異構多核平臺大數(shù)據(jù)的統(tǒng)計特征量,進行數(shù)據(jù)優(yōu)化挖掘[9]。
構建異構多核平臺大數(shù)據(jù)的模糊信息聚類模型,采用特征匹配方法,進行異構多核平臺大數(shù)據(jù)的模糊特征聚類,采用語義分割模型建立異構多核平臺大數(shù)據(jù)的自適應加權學習模型[10]。異構多核平臺大數(shù)據(jù)的模糊聚類分布為:
(1)
其中:z0為異構多核平臺大數(shù)據(jù)的關聯(lián)估計值;zi為點i處采集的異構多核平臺大數(shù)據(jù)的實測值;di為點i和點0的距離;S為異構多核平臺大數(shù)據(jù)的實測點統(tǒng)計特征量;K為異構多核平臺大數(shù)據(jù)挖掘的插值權重[11]。
根據(jù)自適應加權學習結果,進行異構多核平臺大數(shù)據(jù)空間特征的自適應加權,構建異構多核平臺大數(shù)據(jù)的模糊加權學習式[12-14],提高其自適應挖掘能力,得到空間聚類模型定義為:
(2)
其中,x、y、z分別表示異構多核平臺大數(shù)據(jù)在三維空間的語義相似度特征量,σ表示語義本體集,b表示數(shù)據(jù)挖掘的模糊度系數(shù),r表示粗糙特征匹配集。
通過挖掘異構多核平臺大數(shù)據(jù)的語義關聯(lián)特征量,結合模糊屬性特征檢測方法,實現(xiàn)異構多核平臺大數(shù)據(jù)統(tǒng)計檢測。采用統(tǒng)計分析方法,建立異構多核平臺大數(shù)據(jù)的語義分割模型[15],計算式定義為:
(3)
其中:wij為第i個點的異構多核平臺大數(shù)據(jù)挖掘的全局加權值,dij表示異構多核平臺大數(shù)據(jù)分布節(jié)點的聚類中心。構建異構多核平臺大數(shù)據(jù)的特征提取模型,根據(jù)特征提取結果進行數(shù)據(jù)挖掘。在STARMA(1,1)網(wǎng)絡模型中,得到信息異構多核平臺大數(shù)據(jù)可視化分割模型,構建異構多核平臺大數(shù)據(jù)的輸出自相關特征匹配模型,結合模糊特征聚類分析方法進行異構多核平臺大數(shù)據(jù)的統(tǒng)計分析[16],采用語義分割方法進行模糊信息特征提取,在特征點i處,得到t時刻的特征分布集表示為(w1j,w2j,…,wtj),其中t表示異構多核平臺大數(shù)據(jù)的編號數(shù)目,wtj為異構多核平臺大數(shù)據(jù)挖掘的加權系數(shù)。結合語義特征分析方法,建立模糊語義特征規(guī)則集[17],得到自適應加權系數(shù)為:
(4)
其中,F(xiàn)reqij為異構多核平臺大數(shù)據(jù)挖掘?qū)?yōu)的模糊約束特征量[18]。定義異構多核平臺搜索的信息素濃度:
(5)
其中:
wij=tfij
(6)
其中,N表示大數(shù)據(jù)挖掘節(jié)點的維數(shù),ni表示第i個節(jié)點的信息嵌入維數(shù),fij表示大數(shù)據(jù)采用節(jié)點i和節(jié)點j采樣數(shù)據(jù)的關聯(lián)信息,t為采樣時間間隔。
采用異構多核平臺大數(shù)據(jù)特征提取方法進行大數(shù)據(jù)挖掘。
建立異構多核平臺大數(shù)據(jù)的語義動態(tài)特征分析模型,提取異構多核平臺大數(shù)據(jù)的統(tǒng)計特征量,進行異構多核平臺大數(shù)據(jù)挖掘的自適應尋優(yōu)[19],其計算式為:
(7)
其中,di和dj為異構多核平臺大數(shù)據(jù)挖掘的模糊規(guī)則特征量。采用統(tǒng)計信息分析方法,建立異構多核平臺大數(shù)據(jù)挖掘的模糊特征分布集,表示為:
(8)
其中,m和n表示樣本嵌入維數(shù)和分割網(wǎng)格數(shù),amn為待挖掘異構多核平臺大數(shù)據(jù)的有用信息的統(tǒng)計幅值,gmn(t)為數(shù)據(jù)統(tǒng)計平均值,n(t)為干擾項。綜上分析,構建異構多核平臺大數(shù)據(jù)的精準挖掘模型為:
(9)
其中,Xkj為語義分割的關聯(lián)維數(shù),F(xiàn)j表示挖掘的輸出特征量,Qj表示數(shù)據(jù)挖掘的語義信息分量。
在決策樹模型下,采用語義分割進行異構多核平臺大數(shù)據(jù)挖掘過程中的自適應尋優(yōu),提取統(tǒng)計特征量,根據(jù)特征提取結果采用模糊C均值聚類方法進行大數(shù)據(jù)聚類[20-21],實現(xiàn)對異構多核平臺大數(shù)據(jù)的數(shù)據(jù)挖掘。
為了驗證本文方法在實現(xiàn)異構多核平臺大數(shù)據(jù)挖掘中的應用性能,采用Matlab進行仿真測試分析。對異構多核平臺大數(shù)據(jù)采樣的物聯(lián)網(wǎng)節(jié)點數(shù)為120,數(shù)據(jù)挖掘的根節(jié)點數(shù)為12,異構多核平臺大數(shù)據(jù)分布的空間維數(shù)為5,數(shù)據(jù)聚類屬性類別數(shù)為10,對大數(shù)據(jù)采樣的初始頻率f1=1.5 Hz,終止頻率f2=2.3 Hz。根據(jù)上述仿真參數(shù)設定,進行異構多核平臺大數(shù)據(jù)挖掘,得到數(shù)據(jù)樣本的時域分布如圖3所示。
以圖3所示的數(shù)據(jù)為研究對象,提取統(tǒng)計特征量,特征提取結果采用模糊C均值聚類方法進行大數(shù)據(jù)聚類,得到數(shù)據(jù)挖掘的直方圖分布如圖4所示。
分析圖4得知,本文方法進行異構多核平臺大數(shù)據(jù)挖掘的特征聚斂性較好,提高了數(shù)據(jù)挖掘的抗干擾能力。通過測試數(shù)據(jù)挖掘的精度,得到對比結果見表1。分析表1得知,本文方法進行數(shù)據(jù)挖掘的精度較高。
(a) 樣本數(shù)據(jù)1
(b) 樣本數(shù)據(jù)2
(a) 樣本數(shù)據(jù)1
(b) 樣本數(shù)據(jù)2
表1 數(shù)據(jù)挖掘的精度對比
構建異構多核平臺大數(shù)據(jù)的優(yōu)化挖掘模型,結合模糊相關性分析方法進行數(shù)據(jù)挖掘和特征提取,提出基于語義分割的異構多核平臺大數(shù)據(jù)精挖掘方法。采用分塊區(qū)域融合方法進行異構多核平臺大數(shù)據(jù)精準定位,采用語義分割方法進行模糊信息特征提取,建立異構多核平臺大數(shù)據(jù)挖掘的模糊語義特征規(guī)則集,進行異構多核平臺大數(shù)據(jù)挖掘的尋優(yōu)控制,采用統(tǒng)計信息分析方法,建立異構多核平臺大數(shù)據(jù)挖掘的模糊特征分布集,在決策樹模型下,采用語義分割進行異構多核平臺大數(shù)據(jù)挖掘,實現(xiàn)數(shù)據(jù)挖掘優(yōu)化。分析得知,本文方法進行數(shù)據(jù)挖掘的精度較高,根據(jù)數(shù)據(jù)挖掘的直方圖分布得知,本文方法進行數(shù)據(jù)挖掘的特征聚斂性較好和抗干擾能力較強。