陳國艷
摘 要: 提出基于有向圖模型設(shè)計的網(wǎng)絡(luò)數(shù)據(jù)庫高效檢索節(jié)點分布設(shè)計方法。首先構(gòu)建網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點的分布模型,分析數(shù)據(jù)結(jié)構(gòu),對檢索節(jié)點的存儲數(shù)據(jù)語義特征進(jìn)行信息融合處理;然后采用有向圖模型分析方法檢索網(wǎng)絡(luò)數(shù)據(jù)庫節(jié)點屬性聚類和自適應(yīng)調(diào)度,實現(xiàn)數(shù)據(jù)庫的高效檢索節(jié)點有向圖模型設(shè)計;最后設(shè)計仿真實驗進(jìn)行性能測試,實驗結(jié)果表明,該方法有效提高了網(wǎng)絡(luò)數(shù)據(jù)庫的檢索效率,尤其對超大規(guī)模數(shù)據(jù)庫檢索的執(zhí)行效率更高。
關(guān)鍵詞: 網(wǎng)絡(luò)數(shù)據(jù)庫; 數(shù)據(jù)庫檢索; 節(jié)點分布設(shè)計; 有向圖模型
中圖分類號: TN911?34; TP391 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2017)05?0139?04
Abstract: A directed graph model based design method of the network database efficient retrieval mode distribution is proposed. The distribution model of the network database retrieval node was constructed to analyze the data structure, and perform the information fusion for the storage data semantic feature of the retrieval mode. The analysis method of the directed graph model is used to retrieve the node attribute clustering and adaptive dispatching of the network database to design the directed graph model of the database efficient retrieve node. The performance was tested with simulation experiment. The experiment results show this method has improved the retrieval efficiency of the network database effectively, and has high execution efficiency especially for the super?large scale database retrieval.
Keywords: network database; database retrieval; node distribution design; directed graph model
0 引 言
網(wǎng)絡(luò)數(shù)據(jù)庫是存儲網(wǎng)絡(luò)數(shù)據(jù)的重要載體,網(wǎng)絡(luò)數(shù)據(jù)庫的檢索效率高低決定了大數(shù)據(jù)的訪問與調(diào)度性能,研究網(wǎng)絡(luò)數(shù)據(jù)庫的高效檢索方法具有重要意義,相關(guān)的模型研究受到人們的重視[1?2]。
構(gòu)建網(wǎng)絡(luò)數(shù)據(jù)庫信息管理系統(tǒng)的基礎(chǔ)是優(yōu)化設(shè)計網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型。通過對網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖優(yōu)化,提高數(shù)據(jù)訪問效能。網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型設(shè)計方法主要有支持向量機(jī)算法[3]、ARMA模型算法[4]、混合高斯模型算法以及分布式結(jié)構(gòu)控制算法[5],優(yōu)化采集網(wǎng)絡(luò)數(shù)據(jù)庫存儲節(jié)點的輸入輸出數(shù)據(jù),進(jìn)行數(shù)據(jù)信息流的特征提取,實現(xiàn)數(shù)據(jù)訪問,取得了較好的訪問精度。文獻(xiàn)[6]提出大型電氣數(shù)據(jù)庫的云存儲資源與服務(wù)高效調(diào)配機(jī)制,實現(xiàn)對網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型中的自適應(yīng)分區(qū)調(diào)度與訪問,提高網(wǎng)絡(luò)大數(shù)據(jù)訪問吞吐量,降低訪問開銷,但是該算法計算開銷較大,網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型占有的冗余空間較多。文獻(xiàn)[7]采用基于語義相似度的數(shù)據(jù)庫自適應(yīng)查詢松弛方法,提高網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型的訪問性能,但該方法的抗干擾性能不好。文獻(xiàn)[8]提出基于統(tǒng)計特征分析實現(xiàn)對云格環(huán)境的網(wǎng)絡(luò)數(shù)據(jù)訪問機(jī)制,檢索節(jié)點分布較合理。但是該方法對網(wǎng)絡(luò)數(shù)據(jù)庫檢索精度不高、數(shù)據(jù)收斂性不好。
針對上述問題,提出基于有向圖模型設(shè)計的網(wǎng)絡(luò)數(shù)據(jù)庫高效檢索節(jié)點分布設(shè)計方法。結(jié)果表明,該方法有效地提高了網(wǎng)絡(luò)數(shù)據(jù)庫的檢索效率,特別是對超大規(guī)模數(shù)據(jù)庫檢索的執(zhí)行效率尤為突出。
1 數(shù)據(jù)結(jié)構(gòu)的分析
1.1 構(gòu)建網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點的分布模型
假設(shè)分布式網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型中的特征空間采樣數(shù)據(jù)集為[X=x1,x2,…,xn,]進(jìn)行分布式網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型的數(shù)據(jù)訪問機(jī)制體系分析時,采用有向圖和語義本體結(jié)構(gòu)模型構(gòu)建分布式多層網(wǎng)絡(luò)空間中的網(wǎng)絡(luò)數(shù)據(jù)庫存儲結(jié)構(gòu)模型,如圖1所示。
采用SN,sink和跳數(shù)hop?Count進(jìn)行分布式多層網(wǎng)絡(luò)空間中數(shù)據(jù)節(jié)點圖的設(shè)計以及建模。網(wǎng)絡(luò)數(shù)據(jù)庫檢索結(jié)構(gòu)中,大數(shù)據(jù)分布有向圖的邊[(u,v)∈E,]設(shè)分布式多層網(wǎng)絡(luò)數(shù)據(jù)庫數(shù)據(jù)檢索陣列節(jié)點[A?V,][B?V]且[A?B=?,]抽取網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型訪問特征序列的相空間模糊度點集,在網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型設(shè)計中,用戶節(jié)點通過云服務(wù)器進(jìn)行模糊隸屬度匹配。網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型采樣的時間序列為[{x(t0+iΔt)},][i=0,1,2,…,N-1,]數(shù)據(jù)信息流矢量長度為[N,]得到網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型采集輸出的狀態(tài)矢量表達(dá)式為:
式中:[x(t)]表示分布式多層網(wǎng)絡(luò)空間中網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型采集數(shù)據(jù)信息流的時間序列;[J]是時間窗函數(shù);[m]是網(wǎng)絡(luò)數(shù)據(jù)庫的嵌入維數(shù);[Δt]表示數(shù)據(jù)采集的時間間隔。
令[A=a1,a2,…,an]為分布式多層網(wǎng)絡(luò)數(shù)據(jù)庫信息流的初始向量,訓(xùn)練集的屬性集為[B=b1,b2,…,bm,]分布式多層網(wǎng)絡(luò)數(shù)據(jù)庫時態(tài)屬性[ai]的屬性值為[c1,c2,…,ck。]分布式多層網(wǎng)絡(luò)數(shù)據(jù)庫信息流矢量長度為[N。]在數(shù)據(jù)庫檢索節(jié)點分布的圖模型中,通過屬性集分類得到檢索信息特征的表達(dá)式為:
通過構(gòu)建高效檢索節(jié)點圖模型,進(jìn)行數(shù)據(jù)采集,優(yōu)化設(shè)計云訪問。
1.2 網(wǎng)絡(luò)數(shù)據(jù)庫數(shù)據(jù)存儲結(jié)構(gòu)分析
為了提高數(shù)據(jù)的檢索性能,在進(jìn)行節(jié)點圖優(yōu)化設(shè)計之前,需要分析數(shù)據(jù)存儲結(jié)構(gòu),用非線性時間序列分析方法設(shè)計網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型的優(yōu)化訪問結(jié)構(gòu),網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型采集輸出的信息流時間序列模型為:
采用模糊迭代算法使數(shù)據(jù)的融合中心不斷更替,進(jìn)行檢索節(jié)點的尋優(yōu)。
2 算法的具體設(shè)計
2.1 存儲數(shù)據(jù)語義特征信息融合
設(shè)網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型中任意兩個聚類簇[Mi]與[Mj]的數(shù)據(jù)融合中心距離分布為[Clustdist(Mi,Mj),]當(dāng)[(i≠j,1≤i≤q,1≤j≤q),]網(wǎng)絡(luò)大數(shù)據(jù)中訪問數(shù)據(jù)信息流模型能惟一地描述語義本體信息[9]。采用語義本體模型構(gòu)建方法得到網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型的語義融合分布空間向量為:
式中:[Xp]為網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖的調(diào)配狀態(tài)系數(shù);[u]為網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型的尺度系數(shù);[v]為數(shù)據(jù)檢索語義信息的正交基函數(shù)。
采用匹配投影法進(jìn)行數(shù)據(jù)庫檢索過程中的干擾抑制,數(shù)據(jù)庫檢索的均衡控制矩陣為[q,][n]表示自適應(yīng)加權(quán)權(quán)重,選定迭代變量[k=0,]進(jìn)行語義信息特征提取,假設(shè)數(shù)據(jù)庫的檢索語義差異度范圍為[2≤z≤m。]計算第[k+1]次迭代的數(shù)據(jù)庫語義信息差異性特征函數(shù)隸屬度矩陣[v,]即有:
3 性能測試
采用Cloudsim平臺來模擬網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型的分布結(jié)構(gòu),數(shù)據(jù)檢索節(jié)點分布為均勻分布,檢索節(jié)點的個數(shù)設(shè)定為250,網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型的特征采集時間間隔為0.1 s,存儲數(shù)據(jù)的結(jié)構(gòu)長度為5 000;網(wǎng)絡(luò)空間中信息干擾為高斯白噪聲干擾,信噪比為?10 dB;分布式多層網(wǎng)絡(luò)數(shù)據(jù)訪問負(fù)荷復(fù)雜度大小為10 GB;數(shù)據(jù)檢索的信道帶寬[B=1 028]Hz。首先進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)庫的數(shù)據(jù)信息檢索時間序列采樣,得到的采樣時序波形如圖3所示。
采樣的網(wǎng)絡(luò)數(shù)據(jù)庫檢索時間序列為測試樣本集,融合處理存儲數(shù)據(jù)語義特征信息,得到數(shù)據(jù)融合輸出,如圖4所示,從圖4可知網(wǎng)絡(luò)數(shù)據(jù)庫語義特征信息融合結(jié)果,以此作為信息特征輸入,進(jìn)行檢索節(jié)點的有向圖分析,構(gòu)建檢索節(jié)點圖模型,實現(xiàn)數(shù)據(jù)庫高效檢索。
采用本文算法和傳統(tǒng)算法進(jìn)行不同數(shù)據(jù)規(guī)模下網(wǎng)絡(luò)數(shù)據(jù)庫檢索的耗時對比如圖5所示。由圖5可知,當(dāng)數(shù)據(jù)量低于10 000 GB時,兩種算法的執(zhí)行效能相當(dāng)。隨著數(shù)據(jù)量的進(jìn)一步增大,本文方法的執(zhí)行耗時明顯低于傳統(tǒng)方法,說明采用本文算法進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖模型優(yōu)化設(shè)計可提高檢索效率,減少執(zhí)行耗時,特別是在對大規(guī)模數(shù)據(jù)檢索的效率方面表現(xiàn)出明顯的優(yōu)勢。
4 結(jié) 語
為了優(yōu)化網(wǎng)絡(luò)數(shù)據(jù)庫檢索節(jié)點圖,提高數(shù)據(jù)訪問效能,提出基于有向圖模型設(shè)計的網(wǎng)絡(luò)數(shù)據(jù)庫高效檢索節(jié)點分布設(shè)計方法,仿真結(jié)果表明,該方法可以有效提高網(wǎng)絡(luò)數(shù)據(jù)庫的檢索效率,特別是對超大規(guī)模數(shù)據(jù)庫檢索的執(zhí)行效率優(yōu)越性比較突出。
參考文獻(xiàn)
[1] 楊照峰,王啟明,呂海蓮.基于任務(wù)延遲的云計算資源調(diào)度算法研究[J].計算機(jī)測量與控制,2014,22(2):499?502.
[2] 騰書華,魯敏,楊阿峰,等.基于一般二元關(guān)系的粗糙集加權(quán)不確定性度量[J].計算機(jī)學(xué)報,2014,37(3):649?665.
[3] 何倩,胡啟偉,王勇,等.基于軟件定義網(wǎng)絡(luò)的反飽和分組云負(fù)載均衡[J].計算機(jī)應(yīng)用,2016,36(6):1520?1525.
[4] EL?MEZOUAR M C, KPALMA K, TALEB N, et al. A pan?sharpening based on the non?subsampled contourlet transform: application to WorldView?2 imagery [J]. IEEE journal of selected topics in applied earth observations and remote sensing, 2014, 7(5): 1806?1815.
[5] XU L, JIA J Y, MATSUSHITA Y. Motion detail preserving optical flow estimation [J]. IEEE transactions on pattern analysis and machine intelligence, 2012, 34(9): 1744?1757.
[6] 曾志,王晉,杜震洪,等.一種云格環(huán)境下可計算資源與服務(wù)高效調(diào)配機(jī)制[J].浙江大學(xué)學(xué)報(理學(xué)版),2014,41(3):353?357.
[7] 孟祥福,嚴(yán)麗,馬宗民,等.基于語義相似度的數(shù)據(jù)庫自適應(yīng)查詢松弛方法[J].計算機(jī)學(xué)報,2011,34(5):812?824.
[8] 陸興華,李國恒,余文權(quán).基于模糊C均值聚類的科研管理數(shù)據(jù)庫調(diào)度算法[J].計算機(jī)與數(shù)字工程,2016,44(6):1011?1015.
[9] 劉俊,劉瑜,何友,等.雜波環(huán)境下基于全鄰模糊聚類的聯(lián)合概率數(shù)據(jù)互聯(lián)算法[J].電子與信息學(xué)報,2016,38(6):1438?1445.
[10] JIANG X, HARISHAN K, THAMARASA R, et al. Integra?ted track initialization and maintenance in heavy clutter using probabilistic data association [J]. Signal processing, 2014, 94(1): 241?250.