蔡媛媛
摘 要:目前的計(jì)算機(jī)信息技術(shù)已經(jīng)進(jìn)入了大數(shù)據(jù)和云時(shí)代,企業(yè)和單位都在追求海量信息處理的高效性,而盡量避免分裂式的信息孤島,故而出現(xiàn)了分布式數(shù)據(jù)庫(kù)的概念,這種具備時(shí)代需求的數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng),結(jié)合了當(dāng)代前沿互聯(lián)網(wǎng)技術(shù)和數(shù)字通信技術(shù),在更新計(jì)算機(jī)硬件配置的基礎(chǔ)上,更關(guān)注局域網(wǎng)、廣域網(wǎng)、蜂窩通信和衛(wèi)星通信的科學(xué)聯(lián)合管理,并具有針對(duì)性地解決企業(yè)實(shí)際問(wèn)題。本文主要討論的是分布式數(shù)據(jù)庫(kù)的研究現(xiàn)狀和原理介紹,并對(duì)目前尚且存在的一些問(wèn)題和未來(lái)的行業(yè)發(fā)展趨勢(shì)進(jìn)行總結(jié)性分析。
關(guān)鍵詞:分布式;數(shù)據(jù)庫(kù);系統(tǒng);概述
數(shù)據(jù)庫(kù)系統(tǒng)的主要作用就是對(duì)數(shù)據(jù)的儲(chǔ)存和管理,評(píng)判某個(gè)數(shù)據(jù)庫(kù)優(yōu)劣與否,重要標(biāo)準(zhǔn)就是數(shù)據(jù)庫(kù)在分層儲(chǔ)存和管理信息方面的實(shí)用性。近年來(lái),移動(dòng)互聯(lián)網(wǎng)和移動(dòng)智能終端發(fā)展迅猛,用戶(hù)對(duì)信息的交互性尤為重視,所以在數(shù)據(jù)庫(kù)建立上,必須滿(mǎn)足信息儲(chǔ)存量大,不同信息不同程度處理的要求,而分布式數(shù)據(jù)庫(kù)系統(tǒng)就是這類(lèi)數(shù)據(jù)庫(kù)系統(tǒng)的典型代表。
1 分布式數(shù)據(jù)庫(kù)的系統(tǒng)原理
分布式數(shù)據(jù)庫(kù)本質(zhì)意義上是對(duì)集中式數(shù)據(jù)庫(kù)的擴(kuò)充,只是增添了地理分布結(jié)點(diǎn)上各個(gè)數(shù)據(jù)庫(kù)的邏輯集合。所以一個(gè)完整的分布式數(shù)據(jù)庫(kù)系統(tǒng)首先離不開(kāi)本身的一些計(jì)算機(jī)軟硬件,比如操作系統(tǒng)和編程編譯程序,還有關(guān)鍵的兩部分,其一是應(yīng)用數(shù)據(jù)庫(kù),其二是描述數(shù)據(jù)庫(kù)。
值得重點(diǎn)討論的是,分布式數(shù)據(jù)庫(kù)系統(tǒng)的數(shù)據(jù)分片和分布,也是分布式數(shù)據(jù)庫(kù)得以解決企業(yè)實(shí)際問(wèn)題的關(guān)鍵。通俗來(lái)講,數(shù)據(jù)分片就是將一個(gè)整體劃分為多個(gè)存在邏輯關(guān)系的獨(dú)立個(gè)體,分布于網(wǎng)絡(luò)環(huán)境下的各個(gè)主機(jī)。這個(gè)整體就是應(yīng)用數(shù)據(jù)庫(kù)里面的海量數(shù)據(jù)。數(shù)據(jù)分片應(yīng)當(dāng)遵循一定的原則,比如完整性原則,分片并不是打亂原有的數(shù)據(jù)結(jié)構(gòu)和內(nèi)容,而是進(jìn)行規(guī)劃性的屬性分片和結(jié)構(gòu)分片,每個(gè)片段內(nèi)容仍然是獨(dú)立的,并能進(jìn)行特征表達(dá)。同時(shí),對(duì)已完成分片的數(shù)據(jù),還必須要求能夠隨時(shí)進(jìn)行重組,也就是說(shuō)分片過(guò)程必須是可逆性的,否則一旦分片內(nèi)容不能夠進(jìn)行重組,那么設(shè)計(jì)者的工作壓力將會(huì)大增,從而加大了數(shù)據(jù)庫(kù)系統(tǒng)的開(kāi)發(fā)周期和成本。分片的模式主要分3種,分別為水平分片、垂直分片和混合分片。水平分片主要是按照應(yīng)用數(shù)據(jù)庫(kù)下不相關(guān)的數(shù)據(jù)子集進(jìn)行劃分的,每個(gè)子集都可視作一段片段,通過(guò)關(guān)鍵詞檢索即可完成這些子集的水平分片。垂直分片是在水平分片的基礎(chǔ)上對(duì)數(shù)據(jù)屬性進(jìn)行劃分的一種模式,分片的原則當(dāng)然是避免數(shù)據(jù)片段內(nèi)容的重復(fù),但很多重復(fù)也是非常有必要的,所以按照屬性劃分,是保證某些固定表達(dá)特征片段不輕易改動(dòng)的原則而進(jìn)行的?;旌戏制褪菍?duì)以上垂直分片和水平分片的綜合運(yùn)用?;旌戏制枰詳?shù)據(jù)庫(kù)的應(yīng)用目標(biāo)作為定位,從而決定水平分片和垂直分片的操作順序和比例,因?yàn)椴煌樞虿煌壤碌幕旌戏制?,其結(jié)果往往是大不相同的。
2 分布式數(shù)據(jù)庫(kù)的特點(diǎn)
首先,分布式數(shù)據(jù)系統(tǒng)具備多個(gè)子系統(tǒng),這些子系統(tǒng)分布于不同計(jì)算機(jī)結(jié)點(diǎn)上,都具備獨(dú)立運(yùn)行的功能,子系統(tǒng)在配置上也擁有自己的數(shù)據(jù)庫(kù),包括中央處理機(jī)、終端和數(shù)據(jù)庫(kù)管理系統(tǒng)。從整體上看,分布式數(shù)據(jù)系統(tǒng)是一個(gè)非常龐大的,含有多個(gè)子系統(tǒng)的母系統(tǒng),其子系統(tǒng)呈地理位置結(jié)點(diǎn)分散,并且邏輯相關(guān)。舉個(gè)簡(jiǎn)單的例子,某企業(yè)不同行業(yè)部門(mén)所配備的計(jì)算機(jī)軟件和硬件都有所差異,不同的軟硬件對(duì)數(shù)據(jù)庫(kù)的類(lèi)型和功能有不同的要求,如果可以設(shè)計(jì)一款分布式數(shù)據(jù)庫(kù)系統(tǒng),能夠兼容整個(gè)企業(yè)所有軟硬件的資源調(diào)用,那么就可以實(shí)現(xiàn)在同一模塊管理操作下,對(duì)數(shù)據(jù)的自由查詢(xún)、修改、插入和刪除,這在軟件維護(hù)和開(kāi)發(fā)上,就節(jié)約了不少資金和時(shí)間成本,而且使用起來(lái)也更加方便快捷。結(jié)合當(dāng)前互聯(lián)網(wǎng)信息爆炸的發(fā)展現(xiàn)狀,分布式數(shù)據(jù)庫(kù)系統(tǒng)顯然滿(mǎn)足集約型企業(yè)發(fā)展的需要。
分布式數(shù)據(jù)庫(kù)的模型可以簡(jiǎn)單地通過(guò)實(shí)際企業(yè)來(lái)進(jìn)行其可用性、實(shí)用性、適用性特點(diǎn)的展現(xiàn)。所以每個(gè)支行其實(shí)就相當(dāng)于一個(gè)數(shù)據(jù)庫(kù)子集,局部數(shù)據(jù)庫(kù)只針對(duì)局部地區(qū)的信息進(jìn)行儲(chǔ)存和管理,這樣就能滿(mǎn)足企業(yè)管理層對(duì)不同支行的業(yè)績(jī)進(jìn)行監(jiān)督和考核,同時(shí)對(duì)企業(yè)整體的績(jī)效和規(guī)劃也能有一個(gè)清晰的判斷。相同類(lèi)型的集團(tuán)式企業(yè)、事業(yè)單位、教育機(jī)構(gòu)也是相同的道理,利用分布式數(shù)據(jù)庫(kù),在儲(chǔ)存和管理數(shù)據(jù)上顯然效率更高,并且更符合實(shí)際情況。
3 分布式數(shù)據(jù)庫(kù)系統(tǒng)現(xiàn)存問(wèn)題和發(fā)展趨勢(shì)
目前的分布式數(shù)據(jù)庫(kù)尚處于行業(yè)攻堅(jiān)時(shí)期,存在著不小的挑戰(zhàn),其中有3個(gè)難題是研究的重點(diǎn),分別是數(shù)據(jù)分片、分布與冗余度問(wèn)題;分布式數(shù)據(jù)庫(kù)的事務(wù)管理問(wèn)題和分布式數(shù)據(jù)庫(kù)的安全問(wèn)題。首先,數(shù)據(jù)的分片和分布是一個(gè)要求極其嚴(yán)苛,操作極其煩瑣的過(guò)程,因?yàn)楹A繑?shù)據(jù)的重復(fù)性、冗余性是顯然的,而且這些數(shù)據(jù)還是實(shí)時(shí)更新的,所以就更加考驗(yàn)設(shè)計(jì)團(tuán)隊(duì)的整體布局。一旦出現(xiàn)了一些數(shù)據(jù)片段劃分不合理,就會(huì)引發(fā)不少的實(shí)際操作故障,常見(jiàn)的有分布式查詢(xún)故障、分布式數(shù)據(jù)檢索故障和分布式數(shù)據(jù)修改故障等。其次是分布式數(shù)據(jù)庫(kù)的事務(wù)管理問(wèn)題,分布式數(shù)據(jù)庫(kù)把數(shù)據(jù)分散到多個(gè)網(wǎng)絡(luò)結(jié)點(diǎn)上,所以為了調(diào)配在幾個(gè)位置上的活動(dòng),事務(wù)管理的性能比在中心數(shù)據(jù)庫(kù)時(shí)花費(fèi)更高,甚至可能抵消許多其他的優(yōu)點(diǎn)。另外,分布式數(shù)據(jù)庫(kù)如果出現(xiàn)子集過(guò)多,數(shù)據(jù)庫(kù)之間經(jīng)常會(huì)存在數(shù)據(jù)拷貝、數(shù)據(jù)共享的流程,這給整個(gè)數(shù)據(jù)的安全問(wèn)題埋下了不容忽視的隱患。如果某一個(gè)地理分布結(jié)點(diǎn)被外方力量侵入,將會(huì)泄漏與這個(gè)結(jié)點(diǎn)相關(guān)的所有數(shù)據(jù)記錄,后果實(shí)在是不堪設(shè)想。不過(guò)隨著業(yè)內(nèi)專(zhuān)業(yè)人士不斷的研究和實(shí)踐,筆者堅(jiān)信上述難題也將會(huì)一一得到改善。
從發(fā)展的眼光看,全球第一個(gè)分布式數(shù)據(jù)庫(kù)是由CCA在1976年左右設(shè)計(jì)完成的,到今日其發(fā)展也不過(guò)40年歷史。分布式數(shù)據(jù)庫(kù)實(shí)質(zhì)上有一定初級(jí)人工智能的特性,整體數(shù)據(jù)庫(kù)的設(shè)計(jì)和發(fā)展也是沿著高效智能處理海量信息的方向的,所以通過(guò)不斷的技術(shù)優(yōu)化和功能改善,分布式數(shù)據(jù)庫(kù)在未來(lái)必然能得到廣泛的應(yīng)用。
4 結(jié)語(yǔ)
隨著大數(shù)據(jù)和云時(shí)代的到來(lái),面對(duì)海量的數(shù)據(jù),在未來(lái)的計(jì)算機(jī)發(fā)展歷程中分布式數(shù)據(jù)庫(kù)系統(tǒng)將會(huì)越來(lái)越重要,我們也相信在不久的將來(lái),分布式數(shù)據(jù)庫(kù)系統(tǒng)會(huì)給我們的生活帶來(lái)更多的便捷。
參考文獻(xiàn)
[1]陳爭(zhēng)航.分布式數(shù)據(jù)庫(kù)系統(tǒng)研究與應(yīng)用[D].西南交通大學(xué),2002.
(作者單位:無(wú)錫師范學(xué)院)