孫 遜
摘要:文章首先對檔案專題數(shù)據(jù)庫的內(nèi)涵作一界定,然后分析檔案數(shù)據(jù)庫的特點(diǎn),重點(diǎn)提出有關(guān)檔案專題數(shù)據(jù)庫建設(shè)的宏觀政策、開發(fā)程序及安全問題等方面的幾點(diǎn)思考,以期能夠更好地服務(wù)于檔案專題數(shù)據(jù)庫建設(shè)的良好前景。
關(guān)鍵詞:檔案專題數(shù)據(jù)庫信息化政策問題開發(fā)程序需求分析
欄案專題數(shù)據(jù)庫建設(shè)是信息化時(shí)代下檔案信息資源開發(fā)與利用的一項(xiàng)創(chuàng)新手段與重要途徑,也是檔案數(shù)字化建設(shè)的目標(biāo)和任務(wù)之一。研究信息化時(shí)代下的檔案專題數(shù)據(jù)庫建設(shè),對其內(nèi)涵與特點(diǎn)加以歸納,有針對性地對其建設(shè)現(xiàn)狀及問題作以思考,有利于實(shí)現(xiàn)檔案信息資源社會(huì)共享的目標(biāo)。
1檔案專題數(shù)據(jù)庫的內(nèi)涵界定
關(guān)于檔案數(shù)據(jù)庫的概念,早在1987年孫淑揚(yáng)就指出:“檔案數(shù)據(jù)庫屬于文獻(xiàn)數(shù)據(jù)庫,是檔案自動(dòng)化的重要內(nèi)容,它是經(jīng)過整理組織以機(jī)讀形式出現(xiàn)的檔案信息集合?!倍鴻n案專題數(shù)據(jù)庫作為檔案數(shù)據(jù)庫的一個(gè)重要形式,它是以各類檔案基礎(chǔ)數(shù)據(jù)庫為主要數(shù)據(jù)來源,通過檔案信息管理系統(tǒng),按照某一專門題材內(nèi)容編制而成的各類檔案數(shù)據(jù)集合。檔案專題數(shù)據(jù)庫是跨全宗、多類別的檔案數(shù)據(jù)鏈接組合,是系統(tǒng)性的檔案數(shù)字化綜合開發(fā)成果,在提供利用方面具有較強(qiáng)的針對性、實(shí)用性。作為互聯(lián)互通、共建共享的檔案資源網(wǎng)絡(luò)與服務(wù)平臺(tái),建立檔案專題數(shù)據(jù)庫可以確保檔案的完整收集、長期保存與充分開發(fā)。
檔案專題數(shù)據(jù)庫的分類方法有多種。從開發(fā)層次上,檔案專題數(shù)據(jù)庫包括專題目錄數(shù)據(jù)庫和全文數(shù)據(jù)庫兩種類型:就目前的技術(shù)手段而言,檔案專題數(shù)據(jù)庫可以分為四種類型:一是文獻(xiàn)數(shù)據(jù)庫,二是多媒體數(shù)據(jù)庫,三是數(shù)值型數(shù)據(jù)庫,四是事實(shí)型數(shù)據(jù)庫。這四種類型的數(shù)據(jù)庫都是基于檔案內(nèi)容信息,通過對檔案信息內(nèi)容的分析、過濾、加工、編排而產(chǎn)生的。
2檔案專題數(shù)據(jù)庫的特點(diǎn)分析
與傳統(tǒng)館藏?cái)?shù)據(jù)庫相比,檔案專題數(shù)據(jù)庫主要涉及的是檔案信息資源開發(fā)方面,具有多元性、系統(tǒng)性、針對性等特點(diǎn)。兩者在數(shù)據(jù)信息、產(chǎn)生過程、目的作用及使用范圍等方面均存在著差異。
①多元性。檔案專題數(shù)據(jù)庫是跨全宗、多類別的檔案數(shù)據(jù)鏈接組合。它包括目錄數(shù)據(jù)、圖像數(shù)據(jù)、視音頻數(shù)據(jù)等不同數(shù)據(jù)形式,有著豐富多彩的數(shù)字復(fù)合視聽效果。檔案專題數(shù)據(jù)庫能夠更為全面、直觀地向利用者揭示編纂主題相關(guān)的內(nèi)容,打破了傳統(tǒng)紙質(zhì)編纂成果只有文字和圖片的限制。同時(shí),在來源上,檔案專題數(shù)據(jù)庫不僅局限于館(室)藏檔案,還可以補(bǔ)充采集、鏈接相關(guān)的數(shù)字化材料。
②系統(tǒng)性。傳統(tǒng)檔案管理中,根據(jù)檔案的專題屬性,按照用戶的需求來編制檔案目錄或報(bào)道性檢索工具,其目的在于系統(tǒng)地揭示館(室)藏的某一專門題材檔案的內(nèi)容。但檔案專題數(shù)據(jù)庫不僅是數(shù)據(jù)庫形式的檢索工具,而且是檔案目錄和內(nèi)容數(shù)據(jù)——對應(yīng)鏈接、反映某一專題內(nèi)容的檔案數(shù)據(jù)集合。無論是形式上還是內(nèi)容上,檔案專題數(shù)據(jù)庫都具有相對系統(tǒng)性,能夠比較完整地揭示和反映某一專題檔案的內(nèi)容。
③針對性。與檔案館藏?cái)?shù)據(jù)庫相比,檔案專題數(shù)據(jù)庫注重將館藏中與專題相關(guān)的檔案信息提取并揭示出來,為了說明問題,通常需要對檔案館藏?cái)?shù)據(jù)庫中的相關(guān)數(shù)據(jù)信息進(jìn)行整合,更為強(qiáng)調(diào)的是“精”和“準(zhǔn)”。這樣有針對性的開發(fā)不但有利于揭示紛繁復(fù)雜的館(室)藏內(nèi)容,也有利于利用者系統(tǒng)、完整地了解和利用某方面的檔案信息,對于有效地開發(fā)利用檔案信息資源也具有重要的意義。
3關(guān)于檔案專題數(shù)據(jù)庫建設(shè)的幾點(diǎn)思考
3.1加強(qiáng)建立檔案專題數(shù)據(jù)庫的宏觀政策。檔案專題數(shù)據(jù)庫建設(shè)是新時(shí)期檔案事業(yè)實(shí)現(xiàn)跨越式創(chuàng)新發(fā)展的關(guān)鍵所在。國家檔案局站在戰(zhàn)略的高度,認(rèn)真規(guī)劃檔案專題數(shù)據(jù)庫建設(shè)是很有必要的舉措。通過統(tǒng)一規(guī)劃、統(tǒng)一組織,統(tǒng)一領(lǐng)導(dǎo)全國檔案專題數(shù)據(jù)庫建設(shè),將其納入檔案數(shù)據(jù)庫建設(shè)范疇,制訂出更多完善的檔案專題數(shù)據(jù)庫建設(shè)綱要及細(xì)則,以指導(dǎo)全國檔案專題數(shù)據(jù)庫的開發(fā)與建設(shè)。
目前,檔案專題數(shù)據(jù)庫主要集中在沿海發(fā)達(dá)地區(qū)且發(fā)展較快,如福建、浙江等地,內(nèi)地多數(shù)尚未建成檔案專題數(shù)據(jù)資源庫。可以說,檔案專題數(shù)據(jù)庫建設(shè)存在著區(qū)域發(fā)展不平衡的現(xiàn)象。國家及地方應(yīng)積極推進(jìn)檔案專題數(shù)據(jù)庫建設(shè),將其納入到檔案信息化建設(shè)規(guī)劃當(dāng)中,全面統(tǒng)籌,規(guī)范標(biāo)準(zhǔn)建設(shè),在已取得試點(diǎn)突破的基礎(chǔ)上,總結(jié)可行性及發(fā)展規(guī)律,為早日建成國家檔案信息資源專題數(shù)據(jù)庫創(chuàng)造良好的條件與堅(jiān)厚的基礎(chǔ)。
檔案專題數(shù)據(jù)庫建設(shè)是信息化時(shí)代檔案信息資源開發(fā)利用的新途徑,通過對檔案專題數(shù)據(jù)庫進(jìn)行開發(fā),從人們最關(guān)心、最直接的問題出發(fā),有效整合相關(guān)的檔案數(shù)據(jù)庫資源,特別是在民生檔案建設(shè)的熱潮時(shí)期,加強(qiáng)對民生方面的檔案專題的關(guān)注,將會(huì)很大程度上有利于以后檔案事業(yè)的長效可持續(xù)發(fā)展。如福建省檔案局建設(shè)的知青檔案專題數(shù)據(jù)庫,其規(guī)模及效應(yīng)在全國范圍內(nèi)仍不多見。
3.2注重開發(fā)檔案專題數(shù)據(jù)庫的科學(xué)程序。檔案專題數(shù)據(jù)庫開發(fā)程序的科學(xué)與否,直接關(guān)系到檔案信息資源開發(fā)利用成果質(zhì)量的高低,建立良好的檔案專題數(shù)據(jù)庫開發(fā)程序,將有助于檔案信息資源的獲取,最終實(shí)現(xiàn)檔案信息資源的社會(huì)共享。
一般而言,檔案專題數(shù)據(jù)庫開發(fā)需要經(jīng)過分析主題、研究專題、收集數(shù)據(jù)和整合編排等環(huán)節(jié)。所謂分析主題,即通過了解各級黨政機(jī)關(guān)和人民大眾所關(guān)心的熱點(diǎn)問題,圍繞服務(wù)大局,結(jié)合館(室)藏檔案內(nèi)容,遴選出有現(xiàn)實(shí)利用價(jià)值和潛在利用價(jià)值的檔案主題。在遴選出的檔案主題中,結(jié)合時(shí)事宣傳和檔案利用的工作需要,確定專題內(nèi)容,即所謂的研究專題環(huán)節(jié)。然后,在圍繞某一專題的基礎(chǔ)上,首先設(shè)立項(xiàng)目,通過查找本館的檔案資料,也包括館外的其他文獻(xiàn)資料,集中相關(guān)檔案信息數(shù)據(jù),再經(jīng)過加工編排而產(chǎn)生檔案專題信息資源。這里有必要提出的是,關(guān)于采集數(shù)據(jù)的過程,不妨通過關(guān)鍵詞檢索、全文內(nèi)容檢索等手段,在海量的檔案基礎(chǔ)數(shù)據(jù)庫中查找所需的專題數(shù)據(jù)材料。有時(shí)也可通過補(bǔ)充采集一些數(shù)據(jù)資料,進(jìn)一步充實(shí)和完善檔案專題數(shù)據(jù)庫的內(nèi)容。在選題時(shí):需要注意的是要求盡量使得體系完備、分類合理,力求使整個(gè)目錄收集的內(nèi)容涵蓋整個(gè)專題的范圍。
對數(shù)據(jù)的加工整合也是檔案專題數(shù)據(jù)庫科學(xué)程序必不可少的環(huán)節(jié),要針對不同的專題數(shù)據(jù)形式制定統(tǒng)一的數(shù)據(jù)庫字段和數(shù)據(jù)格式,確保整個(gè)專題數(shù)據(jù)庫的規(guī)范性、標(biāo)準(zhǔn)性和可共享性,有必要時(shí)統(tǒng)一開發(fā)相應(yīng)的建庫軟件。最后,要對采集到的專題數(shù)據(jù)進(jìn)行編排處理,特別是有不同數(shù)據(jù)形式的,要?dú)w類排序,形成一個(gè)內(nèi)容介紹,用以概述該專題數(shù)據(jù)庫的簡要內(nèi)容。
盡管以上幾個(gè)環(huán)節(jié)均必不可
少,但我們必須分清輕重緩急,適當(dāng)?shù)胤峙涔ぷ鞯闹攸c(diǎn),要始終以利用者需求為導(dǎo)向,實(shí)現(xiàn)科學(xué)的檔案專題數(shù)據(jù)庫開發(fā)程序的目標(biāo)。適時(shí)地進(jìn)行利用者需求的調(diào)研,將其作為檔案專題數(shù)據(jù)庫建設(shè)的環(huán)節(jié)也不是不可以考慮的,這對于檔案專題數(shù)據(jù)庫開發(fā)的效果將起到十分關(guān)鍵的作用。
3.3重視研究檔案專題數(shù)據(jù)庫的安全問題。在諸多關(guān)于檔案數(shù)據(jù)庫的文章中,有不少談及到檔案數(shù)據(jù)庫的安全問題。對于檔案專題數(shù)據(jù)庫也不例外,同樣需要重視其安全問題,這樣才能保證檔案專題數(shù)據(jù)庫更加穩(wěn)健地發(fā)展。
檔案專題數(shù)據(jù)庫的安全問題主要涉及介質(zhì)安全與數(shù)據(jù)安全兩方面。介質(zhì)安全是指檔案專題數(shù)據(jù)庫的存儲(chǔ)介質(zhì),因?yàn)檫@些介質(zhì)可能隨著時(shí)間流逝,出現(xiàn)老化、失效等問題,繼而導(dǎo)致數(shù)據(jù)庫的數(shù)據(jù)缺失,這對檔案專題數(shù)據(jù)庫來說是一個(gè)致命的問題。另外,檔案專題數(shù)據(jù)庫經(jīng)常通過網(wǎng)絡(luò)發(fā)布,很容易受到網(wǎng)絡(luò)黑客的攻擊,這就面臨數(shù)據(jù)被篡改,甚至數(shù)據(jù)異常等問題。在這樣的情況下,研究檔案專題數(shù)據(jù)庫的安全問題顯得十分必要。
因此,首先要改良檔案專題數(shù)據(jù)庫的存儲(chǔ)介質(zhì),發(fā)展更優(yōu)良的存儲(chǔ)形式,從硬件上保護(hù)檔案專題數(shù)據(jù)庫的安全。在系統(tǒng)設(shè)計(jì)階段,應(yīng)加強(qiáng)權(quán)限設(shè)置,一方面要對系統(tǒng)中各個(gè)功能模塊的操作權(quán)限進(jìn)行定義,另一方面是對系統(tǒng)數(shù)據(jù)的分層管理和操作權(quán)限的定義。比如,數(shù)據(jù)庫的管理人員可以看到后臺(tái)的數(shù)據(jù),可以對數(shù)據(jù)庫進(jìn)行編輯和管理,高級用戶可以看到編纂完成之后的所有檔案信息,普通用戶則只能看到一部分信息等。就目前檔案專題數(shù)據(jù)庫網(wǎng)絡(luò)化的趨勢而言,還要加強(qiáng)數(shù)據(jù)庫的反黑客能力。檔案專題數(shù)據(jù)庫的安全問題能否順利解決與否,關(guān)系到檔案專題數(shù)據(jù)庫運(yùn)行與發(fā)展的水平與趨勢,我們必須對其高度重視,在實(shí)現(xiàn)其物理安全的同時(shí),更加注重研究其網(wǎng)絡(luò)環(huán)境下的安全隱患,如對于著作權(quán)的研究也應(yīng)該是檔案專題數(shù)據(jù)庫建設(shè)中值得深思的問題。
在信息化時(shí)代下,要以滿足人民群眾日益增長的檔案信息需求為導(dǎo)向,對檔案專題數(shù)據(jù)庫的開發(fā)與應(yīng)用是檔案信息資源開發(fā)利用的重要形式與創(chuàng)新手段,因此,立足于地方特色、館藏特色及本館特色的基礎(chǔ)上,對利用者的需求分析成了檔案專題數(shù)據(jù)庫建設(shè)的新任務(wù)。這就需要對利用者的需求進(jìn)行分析,提煉出人們所關(guān)心的檔案資源,經(jīng)過對其進(jìn)行分類,開發(fā)出各類利用價(jià)值高、有針對性的檔案專題數(shù)據(jù)庫,以滿足不同利用者對檔案信息資源的需求。