崔英輝
(安徽理工大學(xué),安徽 淮南 232001)
隨著計算機技術(shù)與網(wǎng)絡(luò)通信技術(shù)的發(fā)展,數(shù)據(jù)庫技術(shù)已成為信息社會中對大量數(shù)據(jù)進行組織與管理的重要技術(shù)手段及軟件技術(shù),是網(wǎng)絡(luò)信息化管理系統(tǒng)的基礎(chǔ)。數(shù)據(jù)庫的應(yīng)用領(lǐng)域非常廣泛,不管是家庭、公司或大型企業(yè),還是政府部門,都需要使用數(shù)據(jù)庫來存儲信息。隨著信息時代的發(fā)展,數(shù)據(jù)庫也相應(yīng)產(chǎn)生了一些新的應(yīng)用領(lǐng)域,主要有多媒體數(shù)據(jù)庫、移動數(shù)據(jù)庫、空間數(shù)據(jù)庫等。
多媒體數(shù)據(jù)庫是數(shù)據(jù)庫技術(shù)與多媒體技術(shù)結(jié)合的產(chǎn)物。這類數(shù)據(jù)庫主要存儲與多媒體相關(guān)的數(shù)據(jù),如聲音、圖像和視頻等數(shù)據(jù)。多媒體數(shù)據(jù)庫不是對現(xiàn)有的數(shù)據(jù)進行界面上的包裝,而是從多媒體數(shù)據(jù)與信息本身的特性出發(fā),考慮將其引入到數(shù)據(jù)庫中之后而帶來的有關(guān)問題。多媒體數(shù)據(jù)庫從本質(zhì)上來說,要解決三個難題。第一是信息媒體的多樣化,不僅僅是數(shù)值數(shù)據(jù)和字符數(shù)據(jù),要擴大到多媒體數(shù)據(jù)的存儲、組織、使用和管理。第二要解決多媒體數(shù)據(jù)集成或表現(xiàn)集成,實現(xiàn)多媒體數(shù)據(jù)之間的交叉調(diào)用和融合,集成粒度越細,多媒體一體化表現(xiàn)才越強,應(yīng)用的價值也才越大。第三是多媒體數(shù)據(jù)與人之間的交互性。
多媒體數(shù)據(jù)庫的設(shè)計比較復(fù)雜,面臨的問題也很多,主要表現(xiàn)在以下方面。
(1)數(shù)據(jù)庫的組織和存儲:媒體數(shù)據(jù)的數(shù)據(jù)量大,而且媒體間的差異也極大,從而影響數(shù)據(jù)庫的組織和存儲方法。
(2)媒體種類的增加:每一種多媒體數(shù)據(jù)類型除了都要有自己的一組最基本的操作和功能、適當?shù)臄?shù)據(jù)結(jié)構(gòu)以及存取方式等外,還要有一些標準的操作,包括各種多媒體數(shù)據(jù)通用的操作及多種新類型的集成。不同媒體類型對應(yīng)不同數(shù)據(jù)處理方法,這就要求多媒體數(shù)據(jù)庫管理系統(tǒng)能夠不斷擴充新的媒體類型及其相應(yīng)的操作方法。
(3)數(shù)據(jù)庫的查詢問題:傳統(tǒng)的數(shù)據(jù)庫查詢只處理精確的概念和查詢。但在多媒體數(shù)據(jù)庫中非精確匹配和相似性查詢將占相當大的比重。提取的復(fù)合、分散,及其形象化的特點,注定要使數(shù)據(jù)庫不再是只通過字符進行查詢,而應(yīng)該是通過媒體的語義進行查詢。然而,我們卻很難了解并且正確處理多媒體的語義信息。
(4)用戶接口的支持:多媒體數(shù)據(jù)庫的用戶接口肯定不能用一個表格來描述,對于媒體的公共性質(zhì)和每一種媒體的特殊性質(zhì),都要在用戶接口上、在查詢的過程中加以體現(xiàn)。
(5)信息的分布對多媒體數(shù)據(jù)庫體系的影響:因特網(wǎng)的迅速發(fā)展,使得網(wǎng)上的資源日益豐富,傳統(tǒng)的那種固定模式的數(shù)據(jù)庫形式已經(jīng)顯得力不從心。多媒體數(shù)據(jù)庫系統(tǒng)要考慮如何從萬維網(wǎng)的信息空間中尋找信息,查詢所要的數(shù)據(jù)。
(6)處理長事務(wù)增多:傳統(tǒng)的事務(wù)一般是短小精悍的,在多媒體數(shù)據(jù)庫管理體系中也應(yīng)該盡可能采取短事務(wù)。但有些場合,短事務(wù)不能滿足需要,如從動態(tài)視頻庫中提取并播放一段數(shù)字化影片,往往需要長達幾個小時的時間,作為良好的數(shù)據(jù)庫管理系統(tǒng),應(yīng)該保證播放過程中不會發(fā)生中斷,因此不得不增加處理長事務(wù)的能力。
(7)多媒體數(shù)據(jù)庫對服務(wù)質(zhì)量的要求:許多應(yīng)用對多媒體數(shù)據(jù)庫的傳輸、表現(xiàn)和存儲方式的質(zhì)量要求是不一樣的。系統(tǒng)能提供的資源也要根據(jù)系統(tǒng)運行的情況進行控制。
(8)多媒體數(shù)據(jù)管理還要考慮版本控制的問題
移動數(shù)據(jù)庫是能夠支持移動式計算環(huán)境的數(shù)據(jù)庫,其數(shù)據(jù)在物理上分散而邏輯上集中。與傳統(tǒng)的數(shù)據(jù)庫相比,移動數(shù)據(jù)庫具有移動性,位置相關(guān)性,頻繁的斷接性,網(wǎng)絡(luò)通訊的非對稱性等特征。該數(shù)據(jù)庫最大的特點是通過無線數(shù)字通信網(wǎng)絡(luò)傳的。移動數(shù)據(jù)庫可以隨時隨地地獲取和訪問數(shù)據(jù),為一些商務(wù)應(yīng)用和一些緊急情況帶來了很大的便利。
(1)復(fù)制和緩存技術(shù)。移動數(shù)據(jù)庫環(huán)境中,通過采用一種弱一致性服務(wù)器級復(fù)制機制,提高了響應(yīng)時間。緩存技術(shù)是通過在客戶機上緩存數(shù)據(jù)服務(wù)器上的部分數(shù)據(jù),降低客戶訪問數(shù)據(jù)庫服務(wù)器的頻率。
(2)數(shù)據(jù)廣播技術(shù)。利用從服務(wù)器到移動客戶機的下行帶寬遠遠大于從移動客戶機到服務(wù)器的上行帶寬的這種網(wǎng)絡(luò)費對稱性,把大多數(shù)移動用戶頻繁訪問的數(shù)據(jù)組織起來,以周期性的廣播形式提供給移動客戶機。
(3)位置管理。移動用戶的位置管理主要集中在兩個方面:一是如何確定移動用戶的當前位置,二是如何存儲,管理和更新位置信息??梢圆捎靡苿佑嬎銠C都在自己的宿主服務(wù)器上作永久登記,當它移動到任何其它區(qū)域是,向其宿主服務(wù)器通報其當前位置。
(4)查詢處理及優(yōu)化。在移動數(shù)據(jù)庫環(huán)境中,由于用戶的移動,頻繁的斷接以及用戶所處網(wǎng)絡(luò)環(huán)境的多樣性,移動查詢優(yōu)化必須采用動態(tài)策略,以適應(yīng)不斷變化的畫境。
(5)移動事務(wù)處理。
(1)內(nèi)核結(jié)構(gòu)微小化。(2)對標準的SQL支持。(3)事務(wù)管理功能的強化。(4)完善的數(shù)據(jù)同步機制。(5)支持串行通信,TCP/IP通信,紅外線,藍牙等多種連接協(xié)議。(6)完備的嵌入式數(shù)據(jù)庫管理功能。(7)支持Windows CE,Palm OS等多種目前流行的嵌入式操作系統(tǒng)。
(1)數(shù)據(jù)的分布和復(fù)制。(2)事務(wù)模型。(3)查詢處理。(4)回復(fù)和容錯。(5)移動數(shù)據(jù)庫設(shè)計。(6)基于位置的服務(wù)。(7)安全。
空間數(shù)據(jù)庫指的是地理信息系統(tǒng)在計算機物理存儲介質(zhì)上存儲的與應(yīng)用相關(guān)的地理空間數(shù)據(jù)的總和,一般是以一系列特定結(jié)構(gòu)的文件的形式組織在存儲介質(zhì)之上的??臻g數(shù)據(jù)庫的研究始于20世紀 70年代的地圖制圖與遙感圖像處理領(lǐng)域,其目的是為了有效地利用衛(wèi)星遙感資源迅速繪制出各種經(jīng)濟專題地圖。由于傳統(tǒng)的關(guān)系數(shù)據(jù)庫在空間數(shù)據(jù)的表示、存儲、管理、檢索上存在許多缺陷,從而形成了空間數(shù)據(jù)庫這一數(shù)據(jù)庫研究領(lǐng)域。而傳統(tǒng)數(shù)據(jù)庫系統(tǒng)只針對簡單對象,無法有效的支持復(fù)雜對象(如圖形、圖像)。
(1)數(shù)據(jù)量龐大。
空間數(shù)據(jù)庫面向的是地學(xué)及其相關(guān)對象,而在客觀世界中它們所涉及的往往都是地球表面信息、地質(zhì)信息、大氣信息等及其復(fù)雜的現(xiàn)象和信息,所以描述這些信息的數(shù)據(jù)容量很大,容量通常達到 GB級。
(2)具有高可訪問性 。
空間信息系統(tǒng)要求具有強大的信息檢索和分析能力,這是建立在空間數(shù)據(jù)庫基礎(chǔ)上的,需要高效訪問大量數(shù)據(jù)。
(3)空間數(shù)據(jù)模型復(fù)雜
空間數(shù)據(jù)庫存儲的不是單一性質(zhì)的數(shù)據(jù),而是涵蓋了幾乎所有與地理相關(guān)的數(shù)據(jù)類型,這些數(shù)據(jù)類型主要可以分為 3類:(1)屬性數(shù)據(jù):與通用數(shù)據(jù)庫基本一致,主要用來描述地學(xué)現(xiàn)象的各種屬性,一般包括數(shù)字、文本、日期類型。(2)圖形圖像數(shù)據(jù):與通用數(shù)據(jù)庫不同,空間數(shù)據(jù)庫系統(tǒng)中大量的數(shù)據(jù)借助于圖形圖像來描述。(3)空間關(guān)系數(shù)據(jù):存儲拓撲關(guān)系的數(shù)據(jù),通常與圖形數(shù)據(jù)是合二為一的。(4)屬性數(shù)據(jù)和空間數(shù)據(jù)聯(lián)合管理。(5)應(yīng)用范圍廣泛。
信息檢索就是根據(jù)用戶輸入的信息,從數(shù)據(jù)庫中查找相關(guān)的文檔或信息,并把查找的信息反饋給用戶。信息檢索領(lǐng)域和數(shù)據(jù)庫是同步發(fā)展的,它是一種典型的聯(lián)機文檔管理系統(tǒng)或者聯(lián)機圖書目錄。
這類數(shù)據(jù)庫是隨著Internet的發(fā)展而產(chǎn)生的數(shù)據(jù)庫。它一般用于因特網(wǎng)及遠距離計算機網(wǎng)絡(luò)系統(tǒng)中。特別是隨著電子商務(wù)的發(fā)展,這類數(shù)據(jù)庫發(fā)展更加迅猛。許多網(wǎng)絡(luò)用戶(如個人、公司或企業(yè)等)在自己的計算機中存儲信息,同時希望通過網(wǎng)絡(luò)使用發(fā)送電子郵件、文件傳輸、遠程登錄方式和別人共享這些信息。分布式信息檢索滿足了這一要求。
專家決策系統(tǒng)也是數(shù)據(jù)庫應(yīng)用的一部分。由于越來越多的數(shù)據(jù)可以聯(lián)機獲取,特別是企業(yè)通過這些數(shù)據(jù)可以對企業(yè)的發(fā)展作出更好的決策,以使企業(yè)更好地運行。由于人工智能的發(fā)展,使得專家決策系統(tǒng)的應(yīng)用更加廣泛。
[1]湯庸.多媒體數(shù)據(jù)庫與網(wǎng)絡(luò)應(yīng)用.人民郵電出版社,2000.6.
[2]吳信才.空間數(shù)據(jù)庫技術(shù).科學(xué)出版社,2009.5.
[3]劉曉強.信息系統(tǒng)與數(shù)據(jù)庫技術(shù).機械工業(yè)出版社,2008.7.