戚 斌
(陜西國防工業(yè)職業(yè)技術(shù)學(xué)院,西安 710300)
基于分布結(jié)構(gòu)自適應(yīng)篩選的數(shù)據(jù)庫存儲優(yōu)化設(shè)計
戚 斌
(陜西國防工業(yè)職業(yè)技術(shù)學(xué)院,西安 710300)
通過對數(shù)據(jù)庫的存儲結(jié)構(gòu)優(yōu)化設(shè)計,提高數(shù)據(jù)庫的吞吐量。傳統(tǒng)方法采用存儲節(jié)點(diǎn)校驗數(shù)據(jù)適應(yīng)度分區(qū)的數(shù)據(jù)庫存儲模型,數(shù)據(jù)庫中存在重復(fù)冗余數(shù)據(jù),不能自適應(yīng)濾除,導(dǎo)致數(shù)據(jù)存儲開銷較大;提出了一種基于分布結(jié)構(gòu)自適應(yīng)篩選的數(shù)據(jù)庫存儲優(yōu)化模型,首先進(jìn)行數(shù)據(jù)庫的存儲機(jī)制和分布式數(shù)據(jù)結(jié)構(gòu)分析,采用相空間重構(gòu)方法進(jìn)行存儲空間的結(jié)構(gòu)分布重組,采用分布結(jié)構(gòu)自適應(yīng)篩選方法對提取的數(shù)據(jù)信息流進(jìn)行重復(fù)冗余數(shù)據(jù)濾波處理,改善數(shù)據(jù)在數(shù)據(jù)庫存儲空間中的結(jié)構(gòu)分布,實(shí)現(xiàn)數(shù)據(jù)庫存儲優(yōu)化;仿真結(jié)果表明,采用改進(jìn)的方法進(jìn)行數(shù)據(jù)庫構(gòu)建,能提高數(shù)據(jù)庫存儲吞吐量,降低數(shù)據(jù)存儲開銷,提高數(shù)據(jù)庫的訪問和調(diào)度性能,展示較好的應(yīng)用價值。
分布結(jié)構(gòu);自適應(yīng);數(shù)據(jù)庫;存儲;相空間重構(gòu)
在信息化社會,隨著網(wǎng)絡(luò)信息和大數(shù)據(jù)信息規(guī)模的擴(kuò)大,大量的數(shù)據(jù)信息需要存儲和優(yōu)化調(diào)度管理,數(shù)據(jù)庫是按照數(shù)據(jù)結(jié)構(gòu)來組織、存儲和管理數(shù)據(jù)的倉庫,充分有效地利用數(shù)據(jù)庫進(jìn)行信息管理和訪問,能提高對各類信息資源的利用和調(diào)度能力。數(shù)據(jù)庫的種類很多,比如網(wǎng)絡(luò)數(shù)據(jù)庫、本地數(shù)據(jù)庫、DeepWeb數(shù)據(jù)庫等,數(shù)據(jù)庫的規(guī)模大小根據(jù)需要處理的數(shù)據(jù)規(guī)模而有差異性,從最簡單的存儲有各種數(shù)據(jù)表格到能夠進(jìn)行海量數(shù)據(jù)存儲的大型數(shù)據(jù)庫系統(tǒng),在數(shù)據(jù)管理中都發(fā)揮著重要的價值。數(shù)據(jù)庫的存儲性能是評價數(shù)據(jù)庫有效性的重要指標(biāo),通過對數(shù)據(jù)庫存儲結(jié)構(gòu)優(yōu)化設(shè)計,提高數(shù)據(jù)庫吞吐量,研究數(shù)據(jù)庫的優(yōu)化存儲設(shè)計具有重要意義[1-4]。
數(shù)據(jù)庫的優(yōu)化存儲設(shè)計,對實(shí)現(xiàn)管理信息系統(tǒng)、辦公自動化系統(tǒng)、決策支持系統(tǒng)等各類信息系統(tǒng)的優(yōu)化具有重要意義,傳統(tǒng)方法中,對數(shù)據(jù)庫的存儲設(shè)計采用的方法主要有基于分布式建模的數(shù)據(jù)庫存儲模型、基于決策樹模型的數(shù)據(jù)庫存儲方法和基于語義本地模型的數(shù)據(jù)庫存儲方法等,分布式網(wǎng)絡(luò)數(shù)據(jù)庫實(shí)體模型挖掘和存儲算法采用的是支持向量回歸機(jī)學(xué)習(xí)方法,通過構(gòu)建模糊決策模型,實(shí)現(xiàn)對分布式網(wǎng)絡(luò)數(shù)據(jù)庫的實(shí)體模型構(gòu)建方法,參數(shù)設(shè)置復(fù)雜,具有不穩(wěn)定性。為此,相關(guān)文獻(xiàn)進(jìn)行數(shù)據(jù)庫存儲模型的改進(jìn)設(shè)計。其中,文獻(xiàn)[5]提出一種基于關(guān)聯(lián)為特征分析和最大Lyapunove指數(shù)譜分解的調(diào)數(shù)據(jù)庫訪問和存儲優(yōu)化設(shè)計,實(shí)現(xiàn)對數(shù)據(jù)庫中的關(guān)鍵字的自適應(yīng)分區(qū)調(diào)度和存儲,提高數(shù)據(jù)庫存儲的吞吐量,但是該算法計算開銷較大,數(shù)據(jù)庫占有的冗余空間較多;文獻(xiàn)[6]提出一種基于關(guān)鍵詞分區(qū)調(diào)度額的數(shù)據(jù)庫存儲技術(shù),在數(shù)據(jù)庫訪問實(shí)驗中,通過關(guān)鍵字有向圖模型和語義特征的兩個特征矢量進(jìn)行線性自適應(yīng)特征提取,對Web數(shù)據(jù)庫并集處理,實(shí)現(xiàn)對數(shù)據(jù)庫中的兩個相關(guān)度最低的Web數(shù)據(jù)集屬性提取,提高數(shù)據(jù)庫存儲性能,但是該方法的抗干擾性能不好,需要進(jìn)行數(shù)據(jù)庫的優(yōu)化設(shè)計和改進(jìn);文獻(xiàn)[7]采用存儲節(jié)點(diǎn)校驗數(shù)據(jù)適應(yīng)度分區(qū)方法構(gòu)建數(shù)據(jù)庫存儲模型,數(shù)據(jù)庫中存在重復(fù)冗余數(shù)據(jù)時,不能自適應(yīng)濾除,導(dǎo)致數(shù)據(jù)存儲開銷較大。針對上述問題,本文提出一種基于分布結(jié)構(gòu)自適應(yīng)篩選的數(shù)據(jù)庫存儲優(yōu)化模型設(shè)計方法,首先進(jìn)行數(shù)據(jù)庫存儲機(jī)制和分布式數(shù)據(jù)結(jié)構(gòu)分析,采用相空間重構(gòu)方法進(jìn)行存儲空間的結(jié)構(gòu)分布重組,采用分布結(jié)構(gòu)自適應(yīng)篩選方法,對提取的數(shù)據(jù)信息流進(jìn)行重復(fù)冗余數(shù)據(jù)濾波處理,改善數(shù)據(jù)在數(shù)據(jù)庫存儲空間中的結(jié)構(gòu)分布,實(shí)現(xiàn)數(shù)據(jù)庫存儲優(yōu)化,最后通過仿真實(shí)驗進(jìn)行性能測試,展示本文方法在優(yōu)化數(shù)據(jù)庫存儲優(yōu)化設(shè)計中的優(yōu)越性能,得出有效性結(jié)論。
1.1 數(shù)據(jù)庫的存儲機(jī)制及模型總體構(gòu)建
通過構(gòu)建分布式環(huán)境下數(shù)據(jù)庫的存儲機(jī)制模型,對數(shù)據(jù)庫中數(shù)據(jù)結(jié)構(gòu)信息特征進(jìn)行采樣,實(shí)現(xiàn)數(shù)據(jù)庫存儲優(yōu)化,設(shè)A?V,B?V且A∩B=φ,進(jìn)行分布式環(huán)境下散亂點(diǎn)云數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)分析,假設(shè)分布式數(shù)據(jù)庫中的特征空間采樣數(shù)據(jù)集X={x1,x2,…,xn},進(jìn)行分布式數(shù)據(jù)庫的數(shù)據(jù)存儲機(jī)制體系分析,采用子圖近似同構(gòu)的本體模型A、B,進(jìn)行數(shù)據(jù)存儲結(jié)構(gòu)的自動篩選和自相關(guān)特匹配,設(shè)滿足待匹配本體的關(guān)系模型G(A)、G(B)的數(shù)據(jù)庫分布特征點(diǎn)
圖1 大型分布式的數(shù)據(jù)庫存儲結(jié)構(gòu)模型
分布式數(shù)據(jù)庫存儲結(jié)構(gòu)中,數(shù)據(jù)庫有向圖的邊(u,v)∈E,分布式數(shù)據(jù)庫存儲陣列節(jié)點(diǎn)都有相同的存儲介質(zhì)特征,記為r,設(shè)A?V,B?V且A∩B=φ,進(jìn)行數(shù)據(jù)結(jié)構(gòu)分析,抽取數(shù)據(jù)庫訪問特征序列的相空間模糊度點(diǎn)集,把數(shù)據(jù)隊列當(dāng)作一個Chunk來進(jìn)行分塊,得到數(shù)據(jù)信息流時間序列的多用戶隊列支持集為:
(1)
其中:t0和tg分別表示大數(shù)據(jù)特征分類的調(diào)度時長和存儲開銷;T0和Tg分別表示分布式數(shù)據(jù)庫中的數(shù)據(jù)云存儲停滯步數(shù)及閾值。采用分?jǐn)?shù)階Fourier變換進(jìn)行分布式數(shù)據(jù)庫存儲結(jié)構(gòu)特征提取和大數(shù)據(jù)特征匹配,此實(shí)現(xiàn)對數(shù)據(jù)的結(jié)構(gòu)分析,對于數(shù)據(jù)庫存儲結(jié)構(gòu)中的散布陣列,數(shù)據(jù)庫存儲的分布特征子集Si(i=1,2,…,L)滿足以下條件:
Si∩Sj=φ,?i≠j
(2)
(3)
其中:i為大型分布式網(wǎng)絡(luò)級聯(lián)數(shù)據(jù)庫的存儲節(jié)點(diǎn)個數(shù);Sink表示數(shù)據(jù)庫中根節(jié)點(diǎn)。在對數(shù)據(jù)庫中的存儲數(shù)據(jù)特征分類過程中,假設(shè)在決策樹模型上任意分枝Ti(i=1,2…,m,m為sink根節(jié)點(diǎn))長度為Ni(Ni≥1),在鄰近點(diǎn)(t-t′,f-f′)上通過相空間重構(gòu)和自適應(yīng)尋優(yōu),實(shí)現(xiàn)對數(shù)據(jù)庫的優(yōu)化存儲。
1.2 數(shù)據(jù)庫中存儲數(shù)據(jù)信息流模型構(gòu)建和時間序列分析
在上述進(jìn)行數(shù)據(jù)庫的存儲機(jī)制及分布式數(shù)據(jù)結(jié)構(gòu)分析的基礎(chǔ)上,進(jìn)行數(shù)據(jù)庫中存儲數(shù)據(jù)信息流模型構(gòu)建,采用非線性時間序列分析方法進(jìn)行數(shù)據(jù)庫的優(yōu)化存儲結(jié)構(gòu)設(shè)計,在分布式數(shù)據(jù)庫存儲結(jié)構(gòu)中,數(shù)據(jù)存儲和調(diào)度信息流時間序列模型為:
(4)
其中:amn稱作分布式數(shù)據(jù)庫存儲結(jié)構(gòu)中的存儲空見包絡(luò)幅值,在數(shù)據(jù)庫存儲介質(zhì)中,為適應(yīng)數(shù)據(jù)結(jié)構(gòu)的特征分布需求,采用多元自回歸模型構(gòu)建數(shù)據(jù)庫數(shù)據(jù)存儲點(diǎn)的適應(yīng)度函數(shù)如下:
fij=wtδt+wcδc+wqδq+wsδs
(5)
其中:wt+wc+wq+ws=1;t代表數(shù)據(jù)庫存儲和訪問的調(diào)度時間(time);c代表數(shù)據(jù)庫存儲的開銷代價(cost);q代表數(shù)據(jù)庫進(jìn)行數(shù)據(jù)存儲的質(zhì)量(quality);s代表數(shù)據(jù)庫的安全性能(security)。采用相空間重構(gòu)模型,對數(shù)據(jù)庫中的各個存儲子集進(jìn)行空間特征重組,得到數(shù)據(jù)庫存儲節(jié)點(diǎn)滿足適應(yīng)度函數(shù)的概率分布為:
Xp(u) =
(6)
其中:p為分布式數(shù)據(jù)庫存儲結(jié)構(gòu)的階數(shù);數(shù)據(jù)庫中的數(shù)據(jù)信息流特征分類為a=pπ/2(π/2的非整數(shù)倍,即p為分?jǐn)?shù))。在此基礎(chǔ)上,采用非線性時間序列分析方法進(jìn)行數(shù)據(jù)庫存儲系統(tǒng)中信息流時間序列重構(gòu),重構(gòu)表達(dá)式為:
(Fp)-1=F-p
(7)
Fc1p1+4[f(t)]=Fc1p1F4[f(t)]=Fc1p1[f(t)]
(8)
其中:f(t)為存儲空間內(nèi)的特征匹配傅里葉系數(shù);Fc1p1為數(shù)據(jù)庫中分布結(jié)構(gòu)對數(shù)據(jù)的分類輸出。設(shè)任意兩個聚類簇Mi與Mj中心距離為Clustdist(Mi,Mj),當(dāng)(i≠j,1≤i≤q,1≤j≤q),數(shù)據(jù)庫中存儲數(shù)據(jù)信息流模型能唯一映射數(shù)據(jù)庫中的存儲結(jié)構(gòu)多普勒頻移,以此為基礎(chǔ),得到數(shù)據(jù)庫中重構(gòu)的相空間為:
Fp[x(t)ejwτ]=Xp(u-vsina)
(9)
其中:Xp為數(shù)據(jù)庫中存儲數(shù)據(jù)使得譜分析特征;u為數(shù)據(jù)庫的分布結(jié)構(gòu)尺度特性;v為分?jǐn)?shù)階Fourier變換的正交基函數(shù)。通過上述對數(shù)據(jù)庫的分布式存儲結(jié)構(gòu)分析和重組,進(jìn)行數(shù)據(jù)庫的優(yōu)化存儲設(shè)計。
2.1 問題的提出和數(shù)據(jù)信息流重復(fù)冗余數(shù)據(jù)濾波處理
在上述進(jìn)行數(shù)據(jù)庫中存儲數(shù)據(jù)信息流模型構(gòu)建和時間序列分析基礎(chǔ)上,通過對數(shù)據(jù)庫的存儲結(jié)構(gòu)優(yōu)化設(shè)計,提高數(shù)據(jù)庫的吞吐量,分析得出,傳統(tǒng)方法采用存儲節(jié)點(diǎn)校驗數(shù)據(jù)適應(yīng)度分區(qū)的數(shù)據(jù)庫存儲模型,數(shù)據(jù)庫中存在重復(fù)冗余數(shù)據(jù)時,不能自適應(yīng)濾除,導(dǎo)致數(shù)據(jù)存儲開銷較大。為克服傳統(tǒng)方法的弊端,本文提出一種基于分布結(jié)構(gòu)自適應(yīng)篩選的數(shù)據(jù)庫存儲優(yōu)化模型,采用相空間重構(gòu)方法進(jìn)行存儲空間的結(jié)構(gòu)分布重組的基礎(chǔ)上,采用分布結(jié)構(gòu)自適應(yīng)篩選方法對提取的數(shù)據(jù)信息流進(jìn)行重復(fù)冗余數(shù)據(jù)濾波處理,在存儲空間中,大數(shù)據(jù)分布重復(fù)冗余數(shù)據(jù)矢量為:
f(x)=βe-βx
(10)
數(shù)據(jù)庫存儲結(jié)構(gòu)內(nèi)部的任意組存儲節(jié)點(diǎn)樣本i,vi,采用最小競爭集來描述一個存儲節(jié)點(diǎn)對數(shù)據(jù)庫的存儲開銷,得到最優(yōu)競爭節(jié)點(diǎn)u對冗余數(shù)據(jù)的特征衰減函數(shù)為:
CS(u)=N(p(u))∪(∪v∈N(u)Ch(u)CH(v)){u,p(u)}
(11)
對于分布式數(shù)據(jù)庫鏈路中的兩個節(jié)點(diǎn)C1(Ex1,En1,He1),C2(Ex2,En2,He2) ,通過分?jǐn)?shù)階Fourier域特征重組產(chǎn)生出n個結(jié)構(gòu)分布區(qū)域,構(gòu)建模糊隸屬函數(shù),在重組的多徑特征空間中進(jìn)行數(shù)據(jù)庫的存儲機(jī)制索引,索引映射為:
xn=[x(0),x(1),…,x(N-1)]T
(12)
存儲空間內(nèi)數(shù)據(jù)分布的訓(xùn)練樣本集為X=[X1,X2,…,Xk,…,XN]T,其中任一訓(xùn)練樣本為Xk=[xk1,xk2,…,xkm,…,xkM],把數(shù)據(jù)庫中的冗余數(shù)據(jù)和重復(fù)數(shù)據(jù)的文件塊及文件塊的標(biāo)簽信息通過自適應(yīng)匹配濾波進(jìn)行刪除處理,假設(shè)自適應(yīng)匹配濾波的檢測函數(shù)為:
-3[x(n)x(n+τ)][x2(n+τ)]
(13)
其中:[g(n)]表示對存儲結(jié)構(gòu)中的冗余數(shù)據(jù)取均值,假設(shè)h(·)為沖激響應(yīng)特征函數(shù)。定義分?jǐn)?shù)階Fourier變換實(shí)現(xiàn)對重復(fù)冗余數(shù)據(jù)濾波和寬頻帶數(shù)據(jù)特征壓縮,得到數(shù)據(jù)庫中的存儲數(shù)據(jù)進(jìn)行重復(fù)冗余數(shù)據(jù)濾波后的輸出向量集為:
X=Fα·x
(14)
其中:
X=[Xα(0),Xα(1),…,Xα(N-1)]T
(15)
采用分布式結(jié)構(gòu)自適應(yīng)篩選,進(jìn)行數(shù)據(jù)存儲區(qū)域的自動分區(qū),得到分區(qū)后的數(shù)據(jù)分布信息流矩陣為:
(16)
由此實(shí)現(xiàn)對數(shù)據(jù)庫存儲系統(tǒng)中的重復(fù)數(shù)據(jù)信息流濾波處理,提高數(shù)據(jù)庫存儲的效能的同時,降低數(shù)據(jù)庫存儲的開銷。
2.2 數(shù)據(jù)庫存儲結(jié)構(gòu)優(yōu)化設(shè)計與實(shí)現(xiàn)
在上述進(jìn)行數(shù)據(jù)信息流的重復(fù)冗余數(shù)據(jù)濾波處理的基礎(chǔ)上,進(jìn)行數(shù)據(jù)庫的存儲機(jī)制和分布式數(shù)據(jù)結(jié)構(gòu)分析,改善數(shù)據(jù)在數(shù)據(jù)庫存儲空間中的結(jié)構(gòu)分布,實(shí)現(xiàn)數(shù)據(jù)庫存儲優(yōu)化。在分布式數(shù)據(jù)庫中,由于數(shù)據(jù)存儲空間的結(jié)構(gòu)特性和存儲介質(zhì)的物理特性,導(dǎo)致各個存儲節(jié)點(diǎn)之間存在干擾特征向量,采用分布結(jié)構(gòu)自適應(yīng)篩選方法進(jìn)行數(shù)據(jù)庫存儲優(yōu)化,假設(shè)在數(shù)據(jù)庫存儲空間內(nèi)的存儲介質(zhì)的性能衰減函數(shù)為:
(17)
其中:k表示分布式數(shù)據(jù)庫的特征融合中心,由數(shù)據(jù)信息流的IMF分量進(jìn)行數(shù)據(jù)信息融合,得到數(shù)據(jù)庫中存儲數(shù)據(jù)的信息融合集合為:
P={p1,p2,…pm},m∈N
(18)
其中:m為數(shù)據(jù)信息流融合的嵌入維,N為數(shù)據(jù)采樣個數(shù),對融合后的數(shù)據(jù)進(jìn)行自適應(yīng)校驗,進(jìn)行數(shù)據(jù)存儲空間的自適應(yīng)特征提取,得到提取結(jié)果為:
flowk={n1,n2,…,nq},q∈N
(19)
式中,q表示數(shù)據(jù)的分布時寬,nq表示數(shù)據(jù)庫存儲信息流的時間序列單元,N表示信息位總數(shù)。數(shù)據(jù)庫存儲結(jié)構(gòu)內(nèi)部的任意組存儲節(jié)點(diǎn)樣本xi,i=1,2,...,n的發(fā)散幅值表達(dá)式為:
(20)
其中:數(shù)據(jù)的多普勒頻率散布函數(shù)簇ψa,b是由ψ(t)通過自適應(yīng)平滑更新得到,對各寬頻帶分量采用能量檢測和波束形成實(shí)現(xiàn)數(shù)據(jù)庫的分布式存儲結(jié)構(gòu)的自適應(yīng)篩選和分區(qū),其中,數(shù)據(jù)結(jié)構(gòu)中的頻率散布(頻率標(biāo)準(zhǔn)差)為:
(21)
為了測試本文算法在實(shí)現(xiàn)數(shù)據(jù)庫存儲結(jié)構(gòu)優(yōu)化,降低存儲開銷中的性能,進(jìn)行仿真實(shí)驗。仿真硬件的CPU為Intel? CoreTMi7-2600,采用Matlab仿真工具進(jìn)行數(shù)學(xué)仿真。分布式數(shù)據(jù)庫中存儲數(shù)據(jù)的數(shù)據(jù)格式為VMDK、EXE等格式,首先對分布式數(shù)據(jù)庫中的數(shù)據(jù)存儲資源信息及冗余數(shù)據(jù)集進(jìn)行特征采樣,分布式數(shù)據(jù)庫中數(shù)據(jù)信息流的測試數(shù)據(jù)采集的樣本個數(shù)為1024,數(shù)據(jù)存儲的開銷從100 MB到1 GB遞增,特征采樣的頻率為12 kHz,采樣帶寬為16.3 dB,數(shù)據(jù)庫中雜質(zhì)數(shù)據(jù)干擾強(qiáng)度為19 dB,數(shù)據(jù)信息流的最小融合閾值為2.24,進(jìn)行相空間重構(gòu)的嵌入維數(shù)為m=12,數(shù)據(jù)集采樣的時間延遲為τ=1.45,根據(jù)上述參數(shù)設(shè)定,進(jìn)行數(shù)據(jù)庫存儲性能仿真,通過對數(shù)據(jù)庫1 000次訪問,得到數(shù)據(jù)庫中存儲數(shù)據(jù)的采樣信息流時域波形如圖2所示。
圖2 數(shù)據(jù)庫中存儲數(shù)據(jù)的采樣信息流時域波形
上述數(shù)據(jù)庫中存儲數(shù)據(jù)的采樣信息流時域波形描述了各個存儲分布區(qū)間上的特征采樣,以此為測試樣本數(shù)據(jù)集,采用相空間重構(gòu)方法進(jìn)行存儲空間的結(jié)構(gòu)分布重組,采用分布結(jié)構(gòu)自適應(yīng)篩選方法,對提取的數(shù)據(jù)信息流進(jìn)行重復(fù)冗余數(shù)據(jù)濾波處理,得到濾波處理后輸出的存儲數(shù)據(jù)在數(shù)據(jù)庫存儲空間中的特征分布如圖3(a)所示,為了對比算法性能,給出沒有進(jìn)行重復(fù)冗余數(shù)據(jù)濾波處理的數(shù)據(jù)庫存儲結(jié)構(gòu)特征分布如圖3(b)所示。
圖3 數(shù)據(jù)庫存儲空間特征分布
從圖可見,采用本文方法進(jìn)行數(shù)據(jù)庫存儲空間優(yōu)化,通過分布結(jié)構(gòu)自適應(yīng)篩選和重復(fù)冗余數(shù)據(jù)濾波,提高對干擾數(shù)據(jù)的抑制能力,增強(qiáng)了數(shù)據(jù)庫的存儲吞吐性能,降低了存儲開銷,為定量分析算法性能,采用本文方法和傳統(tǒng)方法,以數(shù)據(jù)庫存儲開銷為測試技術(shù)指標(biāo),得到仿真結(jié)果如圖4所示,從圖可見,采用本文方法進(jìn)行數(shù)據(jù)庫存儲,存儲開銷比傳統(tǒng)方法降低效果顯著,提高了數(shù)據(jù)庫的訪問和調(diào)度性能。
圖4 數(shù)據(jù)庫存儲性能對比分析
本文研究數(shù)據(jù)庫的優(yōu)化存儲問題,通過對數(shù)據(jù)庫的存儲結(jié)構(gòu)優(yōu)化設(shè)計,提高數(shù)據(jù)庫的吞吐量,提出一種基于分布結(jié)構(gòu)自適應(yīng)篩選的數(shù)據(jù)庫存儲優(yōu)化模型,首先進(jìn)行了數(shù)據(jù)庫的存儲機(jī)制和分布式數(shù)據(jù)結(jié)構(gòu)分析,采用相空間重構(gòu)方法進(jìn)行存儲空間的結(jié)構(gòu)分布重組,采用分布結(jié)構(gòu)自適應(yīng)篩選方法,對提取的數(shù)據(jù)信息流進(jìn)行重復(fù)冗余數(shù)據(jù)濾波處理,改善數(shù)據(jù)在數(shù)據(jù)庫存儲空間中的結(jié)構(gòu)分布,實(shí)現(xiàn)數(shù)據(jù)庫存儲優(yōu)化。仿真結(jié)果表明,采用該方法進(jìn)行數(shù)據(jù)庫構(gòu)建,能提高數(shù)據(jù)庫存儲吞吐量,降低數(shù)據(jù)存儲開銷,提高數(shù)據(jù)庫的訪問和調(diào)度性能,測試指標(biāo)優(yōu)于傳統(tǒng)方法。
[1] 張 磊,王 鵬,黃 焱,等.基于相空間的云計算仿真系統(tǒng)研究與設(shè)計[J].計算機(jī)科學(xué),2013,40(2):84-86.
[2] 文天柱,許愛強(qiáng),程 恭.基于改進(jìn)ENN2聚類算法的多故障診斷方法[J].控制與決策,2015,30(6):1021-1026.
[3] 余曉東,雷英杰,岳韶華,等.基于粒子群優(yōu)化的直覺模糊核聚類算法研究[J].通信學(xué)報,2015,20(5):99.
[4] 關(guān)學(xué)忠,皇甫旭,李 欣,等.基于正態(tài)云模型的自適應(yīng)變異量子粒子群優(yōu)化算法[J].電子設(shè)計工程,2016,23(8):64-67.
[5] 閻 芳,李元章,張全新,等.基于對象的OpenXML復(fù)合文件去重方法研究[J].計算機(jī)研究與發(fā)展,2015,52(7):1546-1557.
[6] Kareem I A, Duaimi M G.Improved accuracy for decision tree algorithm based on unsupervised discretization[J].Int. J.of Computer Science and Mobile Computing,2014,3(6):176-183.
[7] Kumar A,Pooja R, Singh G K.Design and performance of closed form method for cosine modulated filter bank using different windows functions[J].International Journal of Speech Technology,2014,17(4):427-441.
[8] 衣曉蕾,彭思龍,欒世超.基于算子和局部正交約束的信號自適應(yīng)分解方法[J].電子與信息學(xué)報,2015,37(11):2613-2620.
[9] 田 剛,何克清,王 健,等.面向領(lǐng)域標(biāo)簽輔助的服務(wù)聚類方法[J].電子學(xué)報,2015,43(7):1266-1274.
[10] Rajapaksha N,Madanayake A,Bruton L T.2D space-time wave-digital multi-fan filter banks for signals consisting of multiple plane waves[J].Multidimensional Systems and Signal Processing,2014,25(1):17-39.
Database Storage Optimization Design Based on Adaptive Filtering of Distributed Structure
Qi Bin
(Shaanxi Institute of Technology,Xi′an 710300,China)
Through optimizal designing the database storage structure, to improve the throughput of the database.Traditional methods use database storage model of storage nodes calibration data fitness divisional, repeat redundant data exists in the database, can not self-adaptive filter, resulting data storage pay expensive. Based on the distribution structure self-adaptive filter, put forward a database storage optimization model , firstly analysis database storage mechanism and the distributed data structure, use phase space reconstruction method to realize storage space reconstruction of structure distribution,to use distributed data structure self-adaptive filter to extract the data flow to repeat redundant data filtering processing,to improve the structure distribution of data in the database storage space, to realize database storage optimization.The simulation results show that the improved method of database construction can improve the database storage throughput and reduce data storage spending,to improve the interview and schedule performance of database ,to show good application value.
distributed structure; adaptive; database; storage; phase space reconstruction
2016-07-01;
2016-07-22。
戚 斌(1983-),男,陜西戶縣人,講師,碩士,主要從事軟件開發(fā)、數(shù)據(jù)庫設(shè)計及高等職業(yè)教育方向的研究。
1671-4598(2016)12-0184-04DOI:10.16526/j.cnki.11-4762/tp
TP
A