林倩瑜
(集美大學誠毅學院, 福建 廈門 361021)
隨著云計算技術和云服務技術的快速發(fā)展,大量用戶通過云存儲的方法將數(shù)據(jù)存儲在云系統(tǒng)中,實現(xiàn)對數(shù)據(jù)的在線調度和管理。云存儲系統(tǒng)中的大數(shù)據(jù)稱為云服務組合大數(shù)據(jù),云服務組合大數(shù)據(jù)的準確挖掘和分類管理是保障云服務質量的關鍵。當采用智能挖掘和信息處理算法進行云服務組合大數(shù)據(jù)的優(yōu)化挖掘和調度,并根據(jù)云服務組合大數(shù)據(jù)的挖掘結果構成最優(yōu)的服務組合時,可提高數(shù)據(jù)的自適應檢索和調度性能。研究云服務組合大數(shù)據(jù)的優(yōu)化分類挖掘算法在云服務器的優(yōu)化管理和智能控制方面都具有重要意義[1]。
云服務組合大數(shù)據(jù)建立在對大規(guī)模數(shù)據(jù)集的特征提取和關聯(lián)規(guī)則約束分析基礎上,結合模糊信息聚類和特征提取方法,實現(xiàn)云服務組合大數(shù)據(jù)的優(yōu)化挖掘和智能檢索[2]。傳統(tǒng)方法中,對云服務組合大數(shù)據(jù)挖掘的方法有時頻分析方法、平均互信息挖掘方法、模糊挖掘方法以及網(wǎng)格挖掘方法等[3-4]。上述方法采用智能特征提取技術進行云服務組合數(shù)據(jù)的關聯(lián)規(guī)則項提取和模糊聚類處理,提取云服務組合大數(shù)據(jù)集的規(guī)則知識項,實現(xiàn)數(shù)據(jù)優(yōu)化挖掘,取得了一定的研究成果。其中,文獻[5]中提出一種基于模糊指向性聚類的云服務組合大數(shù)據(jù)挖掘技術,采用機器學習方法進行關聯(lián)規(guī)則數(shù)據(jù)的量化編碼,基于模糊信息融合方法對大數(shù)據(jù)進行準確挖掘,但該方法的計算信息量較大,對云組合服務大數(shù)據(jù)挖掘的實時性不好。文獻[6]中提出基于粗糙集和神經(jīng)網(wǎng)絡的云服務組合大數(shù)據(jù)挖掘算法,構建云服務組合大數(shù)據(jù)的特征分布模型,采用BP神經(jīng)網(wǎng)絡進行數(shù)據(jù)分類,在特征子空間中實現(xiàn)云組合服務大數(shù)據(jù)的優(yōu)化挖掘,但該方法在抗干擾能力方面性能不佳。
針對上述問題,本文提出一種基于模糊卷積神經(jīng)網(wǎng)絡的大數(shù)據(jù)分類挖掘技術。首先,進行云服務組合大數(shù)據(jù)的信息融合處理,對高維融合數(shù)據(jù)進行頻繁項檢測和關聯(lián)規(guī)則特征提?。蝗缓?,對提取的關聯(lián)規(guī)則采用模糊卷積神經(jīng)網(wǎng)絡分類器進行屬性分類,結合特征壓縮方法對分類輸出的云服務組合大數(shù)據(jù)進行降維處理,采用模糊聚類方法實現(xiàn)對云服務組合大數(shù)據(jù)的分類挖掘;最后,進行仿真實驗分析,證明了本文方法在提高云組合服務大數(shù)據(jù)挖掘能力方面的優(yōu)越性。
為實現(xiàn)云服務組合大數(shù)據(jù)的優(yōu)化挖掘,首先構建云服務組合模式下大數(shù)據(jù)的分布式數(shù)據(jù)結構模型,用四元組G表示云服務組合大數(shù)據(jù)的模糊分布式存儲中心,G=(V,E,W,C)。假設d為云服務組合大數(shù)據(jù)交互的相空間嵌入維數(shù),采用多個非線性成分聯(lián)合統(tǒng)計方法進行云服務組合大數(shù)據(jù)的高維特征空間重構,結合模糊聚類方法進行大數(shù)據(jù)的自適應分類處理。根據(jù)上述分析,構建云服務組合大數(shù)據(jù)挖掘的總體結構模型,如圖1所示。
圖1 云服務組合大數(shù)據(jù)挖掘的總體結構模型
云服務組合大數(shù)據(jù)挖掘過程中受到的擾動影響因素較多,具有時變性和隨機性。采用模糊聚類方法進行大數(shù)據(jù)信息融合[7],構建關聯(lián)規(guī)則項約束方程表達云服務組合大數(shù)據(jù)的信息流模型:
xn=x(t0+nΔt)=h[z(t0+nΔt)]+ωn
(1)
其中:h(·)為云服務組合大數(shù)據(jù)分布式時間序列,表示為一個具有多維數(shù)據(jù)結構模型的函數(shù);ωn為大數(shù)據(jù)多傳感信息融合跟蹤的觀測或測量誤差。云服務組合大數(shù)據(jù)的分布結構模型的分布函數(shù)描述式為:
(2)
式中:p為分布式云服務組合大數(shù)據(jù)存儲結構的階數(shù);α為統(tǒng)計信息采樣的時間窗口寬度。
k=0,1,…,N-1
(3)
其中an表示云服務組合大數(shù)據(jù)線性規(guī)劃模型的幅值。對于一組連續(xù)的云服務組合大數(shù)據(jù),采用連續(xù)模板匹配技術進行大數(shù)據(jù)的分布式數(shù)據(jù)結構分析,結合匹配相關檢測方法進行云服務組合大數(shù)據(jù)的信息融合處理[9]。
設有m個云服務組合大數(shù)據(jù)節(jié)點A1,A2,…,An,每個節(jié)點的閉頻繁項集特征提取輸出表示為a1,a2,…,an?;跇O限學習方法進行數(shù)據(jù)特征提取的全局尋優(yōu),構造云服務組合大數(shù)據(jù)挖掘的線性規(guī)劃問題數(shù)學表達如下:
(4)
(5)
(6)
其中NI、NR和NS分別表示云服務組合大數(shù)據(jù)的平均互信息特征量和狀態(tài)分布集。
在上述采用連續(xù)模板匹配技術的大數(shù)據(jù)分布式數(shù)據(jù)結構分析和關聯(lián)規(guī)則特征提取基礎上,進行數(shù)據(jù)分類挖掘算法的優(yōu)化設計。本文提出一種基于模糊卷積神經(jīng)網(wǎng)絡的大數(shù)據(jù)分類挖掘技術,采用統(tǒng)計平均方法[11],構建需要挖掘的大數(shù)據(jù)的回歸分析模型:
(7)
采用一個多元統(tǒng)計特征方程描述云服務組合大數(shù)據(jù)的擬合狀態(tài)模型為
(8)
(9)
假設卷積神經(jīng)網(wǎng)絡進行大數(shù)據(jù)識別的學習步長為η,經(jīng)過n步訓練和學習后,采用自適應加權算法[13],得到模糊卷積神經(jīng)網(wǎng)絡進行大數(shù)據(jù)特征分類器的加權系數(shù)為
(10)
采用模糊卷積神經(jīng)網(wǎng)絡的學習算法[14],得到云服務組合大數(shù)據(jù)分類的自適應學習加權系數(shù)為
(11)
在B?D,A∩B?D等規(guī)則約束項下,得到云服務組合大數(shù)據(jù)分類的屬性集滿足:
(12)
數(shù)據(jù)的統(tǒng)計量化集為(u,v)∈E,設A?V,B?V且A∩B=φ,采用模糊卷積神經(jīng)網(wǎng)絡分類器進行屬性分類,實現(xiàn)云服務組合大數(shù)據(jù)重組和數(shù)據(jù)結構重排[14]。
在采用模糊卷積神經(jīng)網(wǎng)絡分類器進行屬性分類的基礎上,為降低計算開銷,結合特征壓縮方法對分類輸出的云服務組合大數(shù)據(jù)進行降維處理[15]。特征壓縮器描述為
(13)
其中:
(14)
采用模糊卷積神經(jīng)網(wǎng)絡分類器得到云服務組合大數(shù)據(jù)的概念格結點為
(15)
對分類輸出的云服務組合大數(shù)據(jù)進行降維處理,采用模糊聚類方法實現(xiàn)對云服務組合大數(shù)據(jù)的分類挖掘[16-17],下面詳述其實現(xiàn)過程。
輸出:云服務組合大數(shù)據(jù)分類挖掘結果α。
初始化參數(shù),從t=1開始進行云服務組合大數(shù)據(jù)特征的自適應尋優(yōu):
步驟1計算所有樣本云服務組合大數(shù)據(jù)挖掘的規(guī)則項特征點e(t)=y-Dα(t)。
步驟2構建模糊卷積神經(jīng)網(wǎng)絡分類器,得到神經(jīng)網(wǎng)絡分類器的加權值:
(16)
為測試本文方法在實現(xiàn)大數(shù)據(jù)分類挖掘中的性能,進行仿真實驗。實驗軟件平臺采用Matlab 7,實驗中的大數(shù)據(jù)樣本庫采用Olivetti-Oracle Research Lab(ORL)云服務組合大數(shù)據(jù)庫。每個高維融合數(shù)據(jù)子塊閾值YHW=0.43,大數(shù)據(jù)采樣的占空比為0.5 dB,樣本訓練集規(guī)模為120 Kbps,測試集為3 000 Kbps,卷積神經(jīng)網(wǎng)絡的輸入層節(jié)點數(shù)為100,輸出層為20,關聯(lián)規(guī)則特征向量的分布密度為0.14,仿真迭代次數(shù)為100,對云服務組合大數(shù)據(jù)挖掘的采樣周期為12 s。實驗中,以數(shù)據(jù)挖掘的準確召回率為測試指標:
(17)
其中:I表示挖掘大數(shù)據(jù)事務中的項;li表示準確挖掘數(shù)據(jù)的組合長度;函數(shù)f(Ij,Ik)定義為
(18)
根據(jù)上述仿真環(huán)境和參數(shù)設定進行大數(shù)據(jù)分類挖掘的仿真實驗,得到數(shù)據(jù)挖掘的時域波形如圖2所示。
圖2 數(shù)據(jù)挖掘的時域波形
以云服務組合大數(shù)據(jù)為研究對象,采用模糊卷積神經(jīng)網(wǎng)絡分類器進行屬性分類。結合特征壓縮方法對分類輸出的云服務組合大數(shù)據(jù)進行降維處理,得到特征提取結果如圖3所示。
分析圖3得知:采用本文方法進行云服務組合大數(shù)據(jù)挖掘對各類數(shù)據(jù)的圖譜分辨能力較好,數(shù)據(jù)屬性聚類性能較高,特征分辨能力較強。采用不同方法測試數(shù)據(jù)挖掘的準確性,在相同的數(shù)據(jù)仿真條件下,以文獻[5]和文獻[6]的方法為對比。上述方法分別采用FCM方法和普通的神經(jīng)外網(wǎng)絡方法進行數(shù)據(jù)挖掘,本文方法建立在對上述兩種方法融合改進的基礎上,因此具有對比性。通過仿真得到對比結果如圖4所示。分析仿真結果發(fā)現(xiàn):本文方法進行數(shù)據(jù)挖掘的精度比傳統(tǒng)方法分別提升了12.43%和21.76%,且迭代步數(shù)較短,說明挖掘的時效性較高。
圖3 大數(shù)據(jù)分類挖掘的特征提取結果
圖4 數(shù)據(jù)挖掘準確性對比
云服務組合大數(shù)據(jù)的準確挖掘和分類管理是保障云服務質量的關鍵。根據(jù)云服務組合大數(shù)據(jù)的挖掘結果構成最優(yōu)的服務組合,提高數(shù)據(jù)的自適應檢索和調度性能。本文提出一種基于模糊卷積神經(jīng)網(wǎng)絡的大數(shù)據(jù)分類挖掘技術,結合匹配相關檢測方法進行云服務組合大數(shù)據(jù)的信息融合處理,對高維融合數(shù)據(jù)進行頻繁項檢測和關聯(lián)規(guī)則特征提取。采用模糊卷積神經(jīng)網(wǎng)絡分類器進行屬性分類,結合特征壓縮方法對分類輸出的云服務組合大數(shù)據(jù)進行降維處理,采用模糊聚類方法實現(xiàn)對云服務組合大數(shù)據(jù)的分類挖掘。仿真分析結果表明,采用本文方法的大數(shù)據(jù)挖掘的分類性能較好,數(shù)據(jù)挖掘精度較高。