李淑蘭 王景珊
(景德鎮(zhèn)學(xué)院 江西景德鎮(zhèn) 335100)
分布式數(shù)據(jù)庫(kù)是一種運(yùn)用物理存儲(chǔ)介質(zhì)的分散單元存儲(chǔ)方式進(jìn)行數(shù)據(jù)的存儲(chǔ)及耦合性融合的數(shù)據(jù)庫(kù),具有儲(chǔ)存空間大、數(shù)據(jù)整合能力強(qiáng)等特征,能夠滿足規(guī)模較大及云數(shù)據(jù)的存儲(chǔ)需求。在云計(jì)算等技術(shù)不斷發(fā)展的情況下,分布式數(shù)據(jù)可能夠發(fā)揮出更大的優(yōu)勢(shì)。但隨著儲(chǔ)存量的不斷增加,分布式數(shù)據(jù)在數(shù)據(jù)查詢上可能會(huì)受數(shù)據(jù)耦合關(guān)系的影響而出現(xiàn)誤差問(wèn)題。因此,為了有效保障分布式數(shù)據(jù)庫(kù)在查詢數(shù)據(jù)上的準(zhǔn)確性,必須要對(duì)其查詢技術(shù)進(jìn)行優(yōu)化。本文將對(duì)分片關(guān)系變化為基礎(chǔ)的自適應(yīng)查詢技術(shù)在分布式數(shù)據(jù)庫(kù)中的實(shí)現(xiàn)進(jìn)行簡(jiǎn)單探討,通過(guò)建立模型、數(shù)據(jù)提取、仿真測(cè)試等方式檢驗(yàn)自適應(yīng)查詢技術(shù)的運(yùn)用效果。
要做到分布式數(shù)據(jù)可分片關(guān)系變化自適應(yīng)查詢,首先需要對(duì)分布式數(shù)據(jù)庫(kù)在數(shù)據(jù)存儲(chǔ)方面的結(jié)構(gòu)展開(kāi)分析,分析方式主要以數(shù)據(jù)分段屬性辨識(shí)與特征分解兩種為主。此時(shí)需要對(duì)分布式數(shù)據(jù)庫(kù)的存儲(chǔ)樣本集及數(shù)據(jù)庫(kù)中存儲(chǔ)數(shù)據(jù)的種類(lèi)進(jìn)行定義,同時(shí)對(duì)分布式數(shù)據(jù)庫(kù)中需要查詢的樣本和分簇聚類(lèi)模型進(jìn)行定義,并列出定義式。之后將定義式中分布式數(shù)據(jù)庫(kù)存儲(chǔ)數(shù)據(jù)樣本采樣幅值和樣本集維數(shù)利用分段融合方法進(jìn)行模糊聚類(lèi),得出數(shù)據(jù)庫(kù)的存儲(chǔ)向量空間,并得出幾何矩。將幾何矩中的分片中心點(diǎn)用自適應(yīng)特征分解法進(jìn)行信息整合,得出數(shù)據(jù)庫(kù)樣本查詢的聚類(lèi)中心式。運(yùn)用領(lǐng)域搜索法對(duì)分布式數(shù)據(jù)庫(kù)中所存儲(chǔ)信息的詞語(yǔ)、節(jié)點(diǎn)等特加以分解,得出特征分解的目標(biāo)函數(shù)式。在該目標(biāo)函數(shù)中設(shè)定一個(gè)數(shù)據(jù)圖和一組查詢關(guān)鍵詞,利用查詢節(jié)點(diǎn)權(quán)重自適應(yīng)法得出模糊度點(diǎn)集以及數(shù)據(jù)庫(kù)查詢的聚類(lèi)交叉項(xiàng)。由此構(gòu)建出數(shù)據(jù)庫(kù)結(jié)構(gòu)模型,結(jié)合數(shù)據(jù)庫(kù)結(jié)構(gòu)及查詢節(jié)點(diǎn)對(duì)其查詢方法進(jìn)行設(shè)計(jì)。
在分簇聚類(lèi)模型構(gòu)建的前提下,利用數(shù)據(jù)關(guān)系集特征融合方式完成數(shù)據(jù)庫(kù)的狀態(tài)向量空間組合,并得出本體特征分布式。利用向量量化分解法進(jìn)行分片處理,得出分片變換輸出式。利用自適應(yīng)融合對(duì)數(shù)據(jù)集的分片結(jié)果進(jìn)行處理,得出數(shù)據(jù)融合聚類(lèi)結(jié)果。結(jié)合數(shù)據(jù)庫(kù)中關(guān)系元組的梳理得出數(shù)據(jù)查詢的模糊聚類(lèi)中心向量,結(jié)合分片屬性分解自適應(yīng)特征和改進(jìn)型耦合關(guān)系的變換,得出兩個(gè)聚類(lèi)簇,用數(shù)據(jù)關(guān)系集的本體特征分量提取出二階、三階以及中心距,最終實(shí)現(xiàn)通分布式數(shù)據(jù)庫(kù)自適應(yīng)查詢效果。
在完成分簇聚類(lèi)模型構(gòu)建以及狀態(tài)向量空間組合、特征提取之后,需要對(duì)數(shù)據(jù)庫(kù)查詢技術(shù)進(jìn)行優(yōu)化。首先列出數(shù)據(jù)特征分部向量集的分片關(guān)系變換式,并根據(jù)分片屬性對(duì)自適應(yīng)特征進(jìn)行分解,得出分布式,在該式中,具有絕不是數(shù)據(jù)庫(kù)查詢數(shù)據(jù)集的規(guī)范正交基,提取出互信息熵特征量。在進(jìn)行分片屬性、門(mén)限值設(shè)置時(shí),需要通過(guò)對(duì)提出的信息熵進(jìn)行自適應(yīng)配置,自聚類(lèi)中心就能得出數(shù)據(jù)庫(kù)查詢輸出式。可利用自適應(yīng)全局概率搜索法對(duì)其中的最優(yōu)迭代步長(zhǎng)進(jìn)行數(shù)據(jù)集搜索,搜索后得出查詢數(shù)據(jù)集的中心分量。在輸出查詢的樣本值中選擇適應(yīng)度最高的作為訓(xùn)練集。結(jié)合數(shù)據(jù)的指向性聚類(lèi)結(jié)果得出數(shù)據(jù)庫(kù)查詢的輸出特征融合向量集,迭代步長(zhǎng)增量出現(xiàn)。由此實(shí)現(xiàn)分布式數(shù)據(jù)庫(kù)的優(yōu)化查詢。
要確保查詢技術(shù)的應(yīng)用效果,需要通過(guò)仿真實(shí)驗(yàn)加以驗(yàn)證。首先,確定實(shí)驗(yàn)所用的查詢數(shù)據(jù)庫(kù)類(lèi)型、分布式數(shù)據(jù)庫(kù)中待查詢的數(shù)據(jù)樣本集數(shù)量、數(shù)據(jù)的規(guī)模長(zhǎng)度、數(shù)據(jù)集采樣帶寬、數(shù)據(jù)庫(kù)查詢節(jié)點(diǎn)連接關(guān)系數(shù)量,進(jìn)行多次查詢實(shí)驗(yàn)后得出查詢數(shù)據(jù)集的時(shí)域波形圖。將時(shí)域波形圖的數(shù)據(jù)集作為樣本,進(jìn)行數(shù)據(jù)分片變換處理及信息融合處理,得出特征分布圖。最后,根據(jù)特征分布圖的數(shù)據(jù)分布情況對(duì)融合聚類(lèi)、特征進(jìn)行提取,完成對(duì)數(shù)據(jù)庫(kù)查詢的優(yōu)化,利用多種方式對(duì)其查詢準(zhǔn)確率進(jìn)行檢測(cè),得出檢測(cè)結(jié)果。從檢測(cè)結(jié)果中可以看出,利用分片關(guān)系變換自適應(yīng)查詢技術(shù)進(jìn)行數(shù)據(jù)庫(kù)查詢,準(zhǔn)確率會(huì)隨著分片尺度的增加而增加,同時(shí)可以看出其準(zhǔn)確率在特定分片尺度情況下可以達(dá)到100%,這比傳統(tǒng)查詢技術(shù)要高出很多。由此可見(jiàn),在分布式數(shù)據(jù)庫(kù)查詢中利用分片關(guān)系變換自適應(yīng)查詢技術(shù)進(jìn)行數(shù)據(jù)查詢,能夠有效提高查詢結(jié)果的準(zhǔn)確性,同時(shí)也說(shuō)明了現(xiàn)有的數(shù)據(jù)庫(kù)查詢技術(shù)有待完善。[1-3]
隨著互聯(lián)網(wǎng)與計(jì)算機(jī)技術(shù)的飛速發(fā)展,信息數(shù)據(jù)的儲(chǔ)存需求越來(lái)越大,數(shù)據(jù)庫(kù)的應(yīng)用需求也隨之不斷增加。分布式數(shù)據(jù)庫(kù)具有存儲(chǔ)量大等優(yōu)點(diǎn),在很多具有大規(guī)模存儲(chǔ)需求中得到了廣泛運(yùn)用,但因?yàn)槠浯鎯?chǔ)數(shù)據(jù)量巨大,在數(shù)據(jù)查詢上會(huì)存在效率及準(zhǔn)確率問(wèn)題。加強(qiáng)對(duì)分布式數(shù)據(jù)庫(kù)數(shù)據(jù)查詢技術(shù)的進(jìn)一步研究,是保障數(shù)據(jù)查詢準(zhǔn)確性的重要途徑,同時(shí)也是提高分布式數(shù)據(jù)庫(kù)運(yùn)用效果的重要方式。通過(guò)研究,分片關(guān)系變換自適應(yīng)查詢技術(shù)能夠有效改善分布式數(shù)據(jù)庫(kù)在查詢準(zhǔn)確率方面的問(wèn)題,在分布式數(shù)據(jù)庫(kù)查詢中開(kāi)應(yīng)該加強(qiáng)對(duì)此查詢技術(shù)的運(yùn)用。