卜燦燦
(山東英才學(xué)院 山東 濟(jì)南 250104)
目前,要提升物聯(lián)網(wǎng)區(qū)塊鏈的數(shù)據(jù)挖掘水平,關(guān)鍵在于對(duì)數(shù)據(jù)進(jìn)行聚類(lèi)處理,而區(qū)塊鏈數(shù)據(jù)挖掘的基礎(chǔ)在于數(shù)據(jù)信息識(shí)別與特征提取,選擇模糊信息識(shí)別技術(shù)開(kāi)發(fā)區(qū)塊鏈數(shù)據(jù),并與物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)特性相結(jié)合,創(chuàng)建區(qū)塊鏈數(shù)據(jù)信息分析模型,借助資源優(yōu)化調(diào)度與信息融合,實(shí)現(xiàn)區(qū)塊鏈數(shù)據(jù)聚類(lèi)分析[1]。 對(duì)物聯(lián)網(wǎng)區(qū)塊鏈進(jìn)行數(shù)據(jù)挖掘,是以數(shù)據(jù)的特性抽取和信息辨識(shí)為依據(jù),運(yùn)用模糊信息辨識(shí)技術(shù),設(shè)計(jì)物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)的存鏈結(jié)構(gòu),并與其大數(shù)據(jù)的特性分布相結(jié)合,進(jìn)行異質(zhì)重組,實(shí)現(xiàn)對(duì)大數(shù)據(jù)的聚類(lèi)分析。
現(xiàn)階段對(duì)物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)進(jìn)行聚類(lèi)的方法,包括K-Means 聚類(lèi)法、網(wǎng)格區(qū)域聚類(lèi)方法、粒子群聚類(lèi)方法等。本文提出深度學(xué)習(xí)下的區(qū)塊鏈數(shù)據(jù)分片峰值聚類(lèi)算法,首先分析區(qū)塊鏈數(shù)據(jù)結(jié)構(gòu)特征,其次實(shí)施區(qū)塊鏈數(shù)據(jù)特征提取,與分片峰值聚類(lèi)方法相結(jié)合,實(shí)現(xiàn)數(shù)據(jù)聚類(lèi)優(yōu)化,最后展開(kāi)仿真測(cè)試,并獲得有效性結(jié)論。
數(shù)據(jù)和事務(wù)都不會(huì)被第三方所掌控,這就是分布式賬本。 最早被Nakamoto 介紹為比特幣(Bitcoin,BTC)的一個(gè)重要組成部分,而在此之后,又有許多新的區(qū)塊鏈被應(yīng)用到了各個(gè)領(lǐng)域。 但是,區(qū)塊鏈具有一定的共性,具體表現(xiàn)為:(1)復(fù)制賬本:將區(qū)域內(nèi)的各節(jié)點(diǎn)交易記錄保存在一個(gè)獨(dú)立的區(qū)域內(nèi),并將最近一次事件封裝為一個(gè)區(qū)域,使得各區(qū)域內(nèi)事件都可進(jìn)行分配和拷貝。 (2)點(diǎn)對(duì)點(diǎn)網(wǎng)絡(luò)結(jié)構(gòu):各結(jié)點(diǎn)共用一個(gè)公用賬冊(cè),沒(méi)有因特網(wǎng)的中心式管理參與方。 換句話說(shuō),所有的結(jié)點(diǎn)都是經(jīng)由一個(gè)點(diǎn)到點(diǎn)的網(wǎng)絡(luò)聯(lián)結(jié)的,并經(jīng)由這個(gè)網(wǎng)絡(luò)來(lái)將交易與區(qū)塊進(jìn)行同步。(3)密碼學(xué):在一個(gè)數(shù)據(jù)塊被接入到另一個(gè)數(shù)據(jù)塊上之前,整個(gè)數(shù)據(jù)塊上的數(shù)據(jù)必須是一致性。 其中,工作證明、利益證明以及拜占庭等是最為典型的一致性算法。 (4)加密:加密技術(shù)是區(qū)塊鏈網(wǎng)絡(luò)安全的基礎(chǔ)。 在區(qū)塊鏈的環(huán)境下,一個(gè)事務(wù)的完整性應(yīng)該包含數(shù)字簽名以及私有數(shù)據(jù)結(jié)構(gòu)(例如,梅克爾樹(shù)等)。 采用不對(duì)稱(chēng)加密技術(shù)可以實(shí)現(xiàn)數(shù)據(jù)的隱私保護(hù)。 區(qū)塊鏈把不同的數(shù)據(jù)塊以一定的時(shí)間序列相互聯(lián)系起來(lái),形成一種鏈狀的組織形式,每一個(gè)模塊都有各自的頭部和主體。
在這些區(qū)域中,區(qū)域頭等部分包含大部分確認(rèn)信息,如版本號(hào)、時(shí)間戳、區(qū)域頭等。 模塊是對(duì)電網(wǎng)物聯(lián)網(wǎng)內(nèi)部和外部的信息進(jìn)行收集和處理。 以區(qū)塊鏈為基礎(chǔ),通過(guò)與其他節(jié)點(diǎn)之間的間接相互作用,可以避免在相互作用過(guò)程中受到網(wǎng)絡(luò)攻擊時(shí)密鑰泄露,保證數(shù)據(jù)的安全。 另外,這些信息僅由數(shù)字簽字組成,大大減少在區(qū)塊鏈中的數(shù)據(jù)傳送,從而可以縮短建立區(qū)塊鏈所需時(shí)間,確保資料的時(shí)效性。
現(xiàn)階段,物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)聚類(lèi)分析法包括K-Means聚類(lèi)法、粒子群聚類(lèi)法以及網(wǎng)格區(qū)域聚類(lèi)法等,創(chuàng)建物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)的特征提取與大數(shù)據(jù)分析模型,借助特征分布式檢測(cè)方法,實(shí)現(xiàn)物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)聚類(lèi)。
通過(guò)有向圖模型對(duì)物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)結(jié)構(gòu)模型進(jìn)行構(gòu)建,選用統(tǒng)計(jì)分析法,獲得區(qū)塊鏈數(shù)據(jù)異構(gòu)存儲(chǔ)模型,對(duì)其模糊聚類(lèi)特征分布集進(jìn)行計(jì)算,從而獲得融合度函數(shù)式
(1):
對(duì)區(qū)塊鏈數(shù)據(jù)集差異分布特征進(jìn)行分析,獲得各插值點(diǎn)如式(2)所示:
式(2)中,dm+1(m)表示第m 點(diǎn)的區(qū)塊鏈數(shù)據(jù)預(yù)測(cè)值,dm+1(m)表示第m 點(diǎn)所采集區(qū)塊鏈數(shù)據(jù)特征量,依照區(qū)塊鏈數(shù)據(jù)特征,通過(guò)模糊C 均值聚類(lèi)提取結(jié)果,并展開(kāi)信息處理,假設(shè)全局變量,創(chuàng)建區(qū)塊鏈數(shù)據(jù)挖掘分割系數(shù)[2],即式(3)所示:
式(3)中Mi表示區(qū)塊鏈數(shù)據(jù)挖掘平均數(shù),Lm表示區(qū)塊鏈數(shù)據(jù)挖掘下界,fm表示區(qū)塊鏈數(shù)據(jù)均值,fless表示不同維度下的區(qū)塊鏈數(shù)據(jù)統(tǒng)計(jì)特征最小值[3]。
基于大數(shù)據(jù)背景,建立節(jié)點(diǎn)分布模型,并聚類(lèi)優(yōu)化設(shè)計(jì)區(qū)塊鏈數(shù)據(jù)的分片峰值。 假設(shè)區(qū)塊鏈數(shù)據(jù)聚類(lèi)節(jié)點(diǎn)屬性集是X={x1,x1,…,xn} ,設(shè)計(jì)聚類(lèi)節(jié)點(diǎn)圖模型,通過(guò)語(yǔ)義本體模型構(gòu)造處理區(qū)塊鏈數(shù)據(jù),借助自相關(guān)特征匹配,研究相似區(qū)塊鏈數(shù)據(jù)貼近度φ1,如式(4)所示:
假設(shè)(s1,a1),(s2,a2),…,(sn,an)是區(qū)塊鏈數(shù)據(jù)聚類(lèi)的一組分布集,創(chuàng)建區(qū)塊鏈數(shù)據(jù)聚類(lèi)模型,并統(tǒng)計(jì)分析數(shù)據(jù)聚類(lèi),實(shí)現(xiàn)自適應(yīng)調(diào)度。 基于模糊語(yǔ)義融合聚類(lèi)展開(kāi)區(qū)塊鏈數(shù)據(jù)加權(quán)分析,從而獲得模糊加權(quán)分布向量,考慮到等價(jià)語(yǔ)義映射,展開(kāi)物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)的融合分析。 創(chuàng)建物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)統(tǒng)計(jì)特征量,借助映射函數(shù)M 表示,M:C*C→r 對(duì)物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)相似度信息進(jìn)行描述,采用空間聚類(lèi)分析分布式調(diào)度區(qū)塊鏈數(shù)據(jù),創(chuàng)建本體模型,以展開(kāi)區(qū)塊鏈數(shù)據(jù)特征聚類(lèi)處理與語(yǔ)義相似度融合。
通過(guò)有向圖模型,對(duì)區(qū)塊鏈數(shù)據(jù)聚類(lèi)節(jié)點(diǎn)結(jié)構(gòu)模型進(jìn)行構(gòu)建,并在區(qū)塊鏈數(shù)據(jù)庫(kù)提取資源信息特征,假設(shè){(s1,a1),(s2,a2),…,(sn,an)} 為區(qū)塊鏈數(shù)據(jù)語(yǔ)義特征分量,通過(guò)異構(gòu)有向圖分析設(shè)計(jì)區(qū)塊鏈數(shù)據(jù)存儲(chǔ)結(jié)構(gòu),與特征空間重組相結(jié)合,實(shí)現(xiàn)區(qū)塊鏈數(shù)據(jù)結(jié)構(gòu)的充足,以獲得優(yōu)化加權(quán)系數(shù)[4],即:w =((w1,a′1), (w2,a′2),…,(wn,a′n)T),wj∈[0,1] 。 通過(guò)統(tǒng)計(jì)分析實(shí)現(xiàn)區(qū)塊鏈數(shù)據(jù)聚類(lèi)檢測(cè),以獲得關(guān)聯(lián)性本體結(jié)構(gòu)模型如式(5)所示:
轉(zhuǎn)化區(qū)塊鏈數(shù)據(jù)聚類(lèi)特征問(wèn)題為二元語(yǔ)義決策問(wèn)題,其模糊特征匹配評(píng)估指標(biāo)集Ek∈E(k =1,2,…,t),選擇主體詞匹配,對(duì)X 相似度函數(shù)進(jìn)行分析,獲得區(qū)塊鏈數(shù)據(jù)隸屬度函數(shù)如式(6)所示:
選擇決策樹(shù)模型實(shí)現(xiàn)區(qū)塊鏈數(shù)據(jù)特征重構(gòu),遞歸圖模型內(nèi),選擇相空間重構(gòu)法,進(jìn)行模糊特征信息采樣,以獲得區(qū)塊鏈數(shù)據(jù)信息加群權(quán)重向量,其特征分布矩陣為式(8)所示:
式(8)中,c 表示區(qū)塊鏈數(shù)據(jù)聚類(lèi)搜索步數(shù),μik表示區(qū)塊鏈數(shù)據(jù)關(guān)聯(lián)決策系數(shù)[5]。
基于以上分析,實(shí)現(xiàn)區(qū)塊鏈數(shù)據(jù)優(yōu)化調(diào)度與特征分析,獲得區(qū)塊鏈數(shù)據(jù)聚類(lèi)中心。 通過(guò)分塊特征演化,檢測(cè)區(qū)塊鏈數(shù)據(jù)關(guān)聯(lián)特征,從而獲得模糊檢測(cè)向量,如式(9)所示,再與模糊相關(guān)性融合法相結(jié)合,展開(kāi)區(qū)塊鏈分片峰值聚類(lèi)分析。
通過(guò)模糊C 類(lèi)均值聚類(lèi)展開(kāi)區(qū)塊鏈數(shù)據(jù)網(wǎng)格分片屬性分類(lèi)與峰值聚類(lèi)識(shí)別,通過(guò)深度學(xué)習(xí)法實(shí)現(xiàn)數(shù)據(jù)聚類(lèi)的分片峰值融合與聚類(lèi)分析,從而獲得區(qū)塊鏈數(shù)據(jù)在線聚類(lèi)準(zhǔn)則[6],即式(10):
區(qū)塊鏈數(shù)據(jù)聚類(lèi)節(jié)點(diǎn)的深度學(xué)習(xí)加權(quán)系數(shù)是We =(wj(e),0)。 通過(guò)修正各聚類(lèi)自適應(yīng)加權(quán)學(xué)習(xí)系數(shù)vi,即可獲得聚類(lèi)有效性評(píng)估矩陣R =(rij,aij)m×n與指標(biāo)權(quán)重W=((w1,β1),(w2,β2),…,(wn,βn)) 。 綜上所述,創(chuàng)建區(qū)塊鏈數(shù)據(jù)聚類(lèi)的深度學(xué)習(xí)模型,對(duì)區(qū)塊鏈數(shù)據(jù)模糊特征分布集進(jìn)行構(gòu)建,以獲得區(qū)塊鏈數(shù)據(jù)約束規(guī)劃模型見(jiàn)式(11)、(12):
根據(jù)式(11)、(12),可以獲得物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)鏈最優(yōu)評(píng)價(jià)集是L1,L2,…,Ln 與物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)優(yōu)化聚類(lèi)模型為式(13)所示:
式(13)中,cosinij→x(dij,dxv)表示物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)融合聚類(lèi)特征集,基于以上分析,滿足區(qū)塊鏈數(shù)據(jù)優(yōu)化聚類(lèi)目標(biāo)。
區(qū)塊鏈數(shù)據(jù)聚類(lèi)分析中,為對(duì)語(yǔ)義相關(guān)性融合性方法應(yīng)用性能進(jìn)行驗(yàn)證,展開(kāi)實(shí)驗(yàn)測(cè)試分析,通過(guò)Matlab7 與C++混合編程展開(kāi)區(qū)塊鏈數(shù)據(jù)算法處理,基于Hadoop 云平臺(tái)對(duì)區(qū)塊鏈數(shù)據(jù)庫(kù)結(jié)構(gòu)模型進(jìn)行構(gòu)建,區(qū)塊鏈數(shù)據(jù)初始樣本規(guī)模是1200,數(shù)據(jù)采樣集相似度是0.68,自適應(yīng)學(xué)習(xí)迭代步數(shù)為30,設(shè)定以上仿真參數(shù),展開(kāi)區(qū)塊鏈數(shù)據(jù)峰值聚類(lèi)分析,從而獲得如圖1 所示的區(qū)塊鏈數(shù)據(jù)分布[7]。
圖1 數(shù)據(jù)時(shí)域波形
將圖1 數(shù)據(jù)作為研究對(duì)象,通過(guò)語(yǔ)義相關(guān)性融合法提取區(qū)塊鏈數(shù)據(jù)特征與自適應(yīng)調(diào)度,再對(duì)區(qū)塊鏈數(shù)據(jù)特征量展開(kāi)模糊聚類(lèi)處理,進(jìn)而進(jìn)行分片峰值聚類(lèi)分析,可獲得如圖2 所示的聚類(lèi)結(jié)果。
圖2 數(shù)據(jù)分片峰值聚類(lèi)
通過(guò)分析圖2 可以發(fā)現(xiàn),選擇該方法展開(kāi)區(qū)塊鏈數(shù)據(jù)聚類(lèi)分析,具有良好的峰值融合度,測(cè)試誤分率比較低,而且收斂性也比較強(qiáng),表1 為誤分率比較結(jié)果,從結(jié)果可以看出,深度學(xué)習(xí)下的區(qū)塊鏈數(shù)據(jù)聚類(lèi)具有較低誤分率。通過(guò)結(jié)果分析發(fā)現(xiàn),該方法展開(kāi)區(qū)塊鏈數(shù)據(jù)聚類(lèi)具有較低誤分率,使數(shù)據(jù)聚類(lèi)收斂控制能力大幅度提升。
表1 誤分率比較
本文通過(guò)模糊信息識(shí)別技術(shù)開(kāi)發(fā)區(qū)塊鏈數(shù)據(jù)存鏈結(jié)構(gòu),提出深度學(xué)習(xí)下的區(qū)塊鏈數(shù)據(jù)特征重構(gòu),通過(guò)深度學(xué)習(xí)法實(shí)現(xiàn)數(shù)據(jù)聚類(lèi)分片峰值聚類(lèi)與融合。 物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)遞歸圖模型內(nèi),選擇相空間重構(gòu)方式,采集物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)聚類(lèi)模糊特征信息,通過(guò)深度學(xué)習(xí)法對(duì)數(shù)據(jù)聚類(lèi)實(shí)施分片峰值融合與聚類(lèi)分析,從而達(dá)到分片峰值聚類(lèi)目的。 結(jié)果顯示,該方法展開(kāi)區(qū)塊鏈數(shù)據(jù)峰值聚類(lèi)具有良好收斂性,數(shù)據(jù)聚類(lèi)精度高,而且誤分率也比較低。