鄭倩倩+劉靜靜
摘 要:提出一種基于大數據存儲區(qū)域自動篩選的數據庫優(yōu)化存儲和訪問技術,首先進行數據庫中數據分布存儲模型設計和數據結構分析,采用模糊C均值聚類算法進行大數據的存儲區(qū)域優(yōu)化聚類,提高數據聚斂能力。采用濾波算法進行數據庫中的干擾濾波處理,對濾波輸出的數據進行存儲區(qū)域的自動篩選控制,實現數據庫存儲空間優(yōu)化,提高數據庫訪問的指向性和配準性。仿真結果表明,利用該方法進行數據庫優(yōu)化設計,對大數據的存儲和調度性能都有較大改善。
關鍵詞關鍵詞:大數據存儲;數據庫優(yōu)化;聚類;濾波
DOIDOI:10.11907/rjdk.161795
中圖分類號:TP392
文獻標識碼:A 文章編號:1672-7800(2016)008-0165-03
0 引言
近年來,隨著大數據處理技術的快速發(fā)展,對大數據的存儲和調度成為大數據信息處理的關鍵。隨著人們對分布式數據庫的逐步關注、深入研究與常態(tài)化應用,采用分布式級聯數據庫進行大數據存儲成為大數據處理應用的重要方向。研究大數據的分布式級聯數據庫優(yōu)化設計,將在云存儲和大數據智能信息處理等領域具有較高的應用價值[1]。
通過對數據庫存儲結構和數據訪問技術的優(yōu)化設計,提高數據庫對大數據的存儲和調度控制能力。傳統的數據庫存儲采用堆棧列表控制方法進行大數據存儲,隨著存儲量和干擾的增大,導致數據庫的調度和訪問準確性不高。在數據庫訪問中,目前主要有基于語義信息特征提取的數據庫訪問技術、基于詞頻特征分布的數據庫訪問技術和基于關鍵字的數據庫訪問技術等[2,3]。其中,文獻[4]提出一種基于語義數據集特征提取的數據庫優(yōu)化設計方法,以實現數據庫的優(yōu)化存儲和大數據處理。首先找出兩個最不相關的語義數據集合,考查詞頻準確性和樣本記錄數量之間的關系,通過有向圖模型設計方法,提高數據庫的調度和訪問指向性能力。但是該方法計算開銷較大,收斂性不好[5]。針對上述問題,本文提出一種基于大數據存儲區(qū)域自動篩選的數據庫優(yōu)化存儲和訪問技術,首先進行數據庫中數據分布存儲模型設計和數據結構分析,采用模糊C均值聚類算法進行大數據的存儲區(qū)域優(yōu)化聚類,提高數據聚斂能力。采用濾波算法進行數據庫中的干擾濾波處理,對濾波輸出的數據進行存儲區(qū)域的自動篩選控制,實現數據庫存儲空間優(yōu)化,提高數據庫訪問的指向性和配準性。最后通過仿真實驗進行了性能測試,得出有效性結論,展示了較高的應用價值。
1 預備知識及數據庫中大數據存儲數據結構分析
1.1 數據庫中數據分布存儲模型設計
為了實現對大型網絡級聯數據庫的優(yōu)化設計和存儲訪問控制,首先采用分布式存儲調度方法,對大型網絡級聯數據庫的存儲數據采集結構進行存儲數據的數據結構分析,再用有向圖表示云計算環(huán)境下大型網絡級聯數據庫的數據分布存儲模型,如圖1所示,以此為基礎進行數據的存儲結構優(yōu)化設計[6]。
1.2 數據結構分析與信息流時間序列分析
在上述構建了數據庫中數據分布存儲模型的基礎上,為了實現對數據存儲區(qū)域的自動篩選和訪問控制,進行數據庫結構和數據信息流時間序列分析及信號模型構建。求大型網絡級聯數據庫存儲數據每類樣本的模糊神經網絡控制的隸屬度函數,先求得隸屬度函數的特征采樣均值Ej=∑FijKj(i∈Kj,j=1,2,…,N),Kj為第j類樣本符合K個分配因子的帶寬,并抽取數據庫訪問特征序列的相空間模糊度點集作為數據庫訪問控制訓練集的聚類中心S,取其最大值si作為資源帶寬差值控制的第一個聚類中心,采用自適應波束形成進行特征采樣和資源訪問控制,假設訪問控制函數為:
在數據庫訪問過程中,假設時間函數為一個非線性的時間序列,得到數據庫訪問過程的不確定干擾項為:
其中,U為數據庫訪問控制中的特征采樣數據論域。這里采用粒子群算法進行數據庫的訪問時間序列分析,粒子群在搜索過程中經常會陷入局部最優(yōu)解,采用混沌映射方法,帶領粒子逃離局部最優(yōu)解,混沌映射的狀態(tài)空間更新迭代過程為:
依據混沌映射搜索的最小積分準則,當粒子群在搜索過程中簇的中心點收斂到數據庫的資源聚類中心時,求得數據庫的資源聚類訓練集的功率譜密度函數作為特征,進行特征提取和時間序列分析,得到數據的特征向量為:
通過上述處理,實現對大型數據庫數據結構和信息流時間序列的分析,為實現數據庫的優(yōu)化設計奠定基礎。
2 大數據存儲區(qū)域自動篩選及數據庫優(yōu)化
在上述進行了數據結構分析和信息流時間序列分析的基礎上,進行數據庫優(yōu)化設計改進。提出一種基于大數據存儲區(qū)域自動篩選的數據庫優(yōu)化存儲和訪問技術,采用模糊C均值聚類算法進行大數據的存儲區(qū)域優(yōu)化聚類,提高數據聚斂能力。模糊C均值聚類算法的實現過程如下,對大型網絡級聯數據庫存儲數據的結構特征優(yōu)選的C均值聚類中心為:
通過上述算法改進設計,實現數據庫優(yōu)化存儲的調度控制。
3 仿真實驗與結果分析
為了測試本文算法在實現數據庫優(yōu)化存儲中的性能,進行仿真實驗。仿真的硬件CPU為Intel CoreTM i7-2600,采用Matlab仿真工具進行數學仿真。大型網絡級聯數據庫存儲數據的云存儲節(jié)點分布在均勻線列陣存儲區(qū)域,存儲數據的數據格式為vmdk、exe等。進行大型網絡級聯數據庫存儲數據的原始信息采集,大數據特征采樣頻率為21kHz,存儲數據的頻率范圍為12~24kHz。根據上述仿真環(huán)境和參數設定,得到大數據存儲區(qū)域的采樣輸出如圖2所示,采用本文方法進行存儲區(qū)域自動篩選后的輸出如圖3所示。
由圖3可見,采用本文方法實現數據庫存儲空間優(yōu)化,可提高數據庫訪問的指向性和配準性。仿真結果表明,利用該方法進行數據庫優(yōu)化設計,對大數據的存儲和調度性能都有較大改善。
參考文獻:
[1] 周濤.基于改進神經網絡的電力系統中長期負荷預測研究[J].電氣應用,2013,32(4):26-29.
[2] 耿忠,劉三陽,齊小剛.基于非合作博弈的無線傳感器網絡功率控制研究[J].控制與決策,2011,26(7):1014-1018.
[3] 張磊,王鵬,黃焱,等.基于相空間的云計算仿真系統研究與設計[J].計算機科學,2013,40(2):84-86.
[4] 文天柱,許愛強,程恭.基于改進ENN2 聚類算法的多故障診斷方法[J].控制與決策,2015,30(6):1021-1026.
[5] 余曉東,雷英杰,岳韶華,等.基于粒子群優(yōu)化的直覺模糊核聚類算法研究[J].通信學報,2015 (5):74-80.
[6] 關學忠,皇甫旭,李欣,等.基于正態(tài)云模型的自適應變異量子粒子群優(yōu)化算法[J].電子設計工程,2016(8):64-67.
(責任編輯:黃 ?。?