王麗曼
[摘 要]檔案數(shù)據(jù)庫是檔案信息資源建設的主流組織形式,通過構建檔案數(shù)據(jù)庫標準體系及主要基于該體系構建的質(zhì)量控制體系,為檔案數(shù)據(jù)庫的建設提供具有實踐意義的指導。
[關鍵詞]檔案數(shù)據(jù)庫;結(jié)構;質(zhì)量
檔案數(shù)據(jù)庫是檔案信息資源的高級組織形式,是適應當今信息化技術和管理需求的最佳形式,作為檔案信息資源一個組成部分。它起著舉足輕重的作用。因此,影響檔案數(shù)據(jù)庫質(zhì)量的因素也必將從整體上制約著檔案信息資源的質(zhì)量。只有將檔案數(shù)據(jù)庫的質(zhì)量控制好,才能構建高質(zhì)量的檔案信息資源,從而加快檔案信息化的進程。
檔案信息數(shù)據(jù)庫建設,意味著在信息社會中檔案管理工作開始涉及各類相關的技術問題,檔案工作開始大規(guī)模引進現(xiàn)代技術。從長遠看,檔案信息數(shù)據(jù)庫建設的發(fā)展就是檔案信息化建設的推進,其間涉及數(shù)字檔案信息的形成、收集、歸檔、整理、鑒定,存儲、保管、保護,檢索、傳遞、利用、統(tǒng)計、銷毀等全過程。檔案信息數(shù)據(jù)庫建設將對相應的檔案管理工作產(chǎn)生各種影響,使之在一定程度上發(fā)生某些變化。
怎樣建設系統(tǒng)性能高、效益好的檔案數(shù)據(jù)庫,是檔案數(shù)據(jù)庫建設的關鍵,也是保證檔案數(shù)據(jù)庫質(zhì)量的重點。筆者主要從以下幾個方面進行探討:
1、定位檔案數(shù)據(jù)庫,按標準體系進行檔案數(shù)據(jù)庫的統(tǒng)籌規(guī)劃
建設檔案數(shù)據(jù)庫。首先要明確建設什么樣的數(shù)據(jù)庫。明確建庫的目的和要求。從總體上對檔案數(shù)據(jù)庫進行定位,這樣才能有的放矢,從而進行具體的、細節(jié)的規(guī)劃。檔案數(shù)據(jù)庫的定位也就直接影響了數(shù)據(jù)庫建設的規(guī)模、成本、性能和效益等。所以首先要抓住這個基本出發(fā)點。其次,應當采用標準體系來進行檔案數(shù)據(jù)庫的綜合質(zhì)量控制。目前我國國家和行業(yè)標準中尚無直接針對檔案數(shù)據(jù)庫建設的標準,而是間接分散在指導類和操作類標準中。有的地方檔案部門自主開發(fā)了各自的數(shù)據(jù)庫結(jié)構標準,但標準之間的差異很大,有成為信息孤島的可能。因此,必須就檔案數(shù)據(jù)庫建設過程中所涉及到的各類標準規(guī)范進行系統(tǒng)管理,構建科學、合理的標準體系。
2、檔案數(shù)據(jù)庫系統(tǒng)的選擇
檔案數(shù)據(jù)庫采用何種系統(tǒng)組織數(shù)據(jù)直接關系到檔案信息資源能否被方便的開發(fā)和利用,能否滿足檔案利用者的需求,必須根據(jù)檔案部門的經(jīng)濟狀況和檔案數(shù)量,合理選擇檔案數(shù)據(jù)庫,不能盲目追求高標準、高要求。當前具有代表性的檔案數(shù)據(jù)庫系統(tǒng)主要有兩種:一是關系型數(shù)據(jù)庫;二是Lotus Notes數(shù)據(jù)庫。Notes數(shù)據(jù)庫作為面向文檔的數(shù)據(jù)庫,對于用戶在網(wǎng)絡上處理各種不同的文檔信息來說非常方便和快捷,但在開發(fā)檔案管理系統(tǒng)方面不足,容易形成一些信息孤島。目前大多數(shù)檔案部門還是利用關系型檔案數(shù)據(jù)庫組織檔案信息資源,當前,應用比較廣泛的大中型關系型數(shù)據(jù)庫系統(tǒng)有SQLServer和Oracle,這兩種數(shù)據(jù)庫系統(tǒng)都具有很好的安全機制,其中前者是基于Win-dows開發(fā)平臺上最標準、最普遍的數(shù)據(jù)庫系統(tǒng)。開發(fā)人員可以按照用戶的標準來選擇數(shù)據(jù)庫。具體考慮數(shù)據(jù)庫系統(tǒng)的自動更新、查詢、統(tǒng)計功能,構建與各部門相應的檔案數(shù)據(jù)庫系統(tǒng)。
3、檔案數(shù)據(jù)庫結(jié)構的設計
檔案數(shù)據(jù)庫系統(tǒng)選定之后,接下來的關鍵步驟就要設計合理的檔案數(shù)據(jù)庫結(jié)構,它對系統(tǒng)性能的好壞起著決定性的作用。在設計的過程中要充分考慮其可行性和實用性,除了要采用先進的科學技術和管理手段外,更重要的是要立足檔案信息資源的特點,不能片面追求數(shù)據(jù)庫的功能而忽視檔案的特性。眾所周知,數(shù)據(jù)庫系統(tǒng)的響應時間隨著庫內(nèi)記錄條數(shù)和字段數(shù)量的增加而降低,而記錄的數(shù)量多少與檔案分類標準有關。分類中的檔案數(shù)量越少,系統(tǒng)響應越快,詳細劃分檔案的類別可以減少每一類檔案的數(shù)量,但分得太細又會給用戶的查找?guī)砝щy,大多數(shù)用戶對檔案的分類還不是很了解。同樣,字段長度太短,檔案利用比較困難,因此在設置前需要仔細分析每個字段的長度,力求簡單實用。綜合考慮檔案用戶的實際需求和系統(tǒng)的實時性,找出兩者最佳的結(jié)合點。
4、檔案數(shù)據(jù)庫的安全問題
檔案數(shù)據(jù)庫的網(wǎng)絡化的應用,也為其帶來了傳統(tǒng)檔案信息資源管理時沒有的安全性問題。檔案信息易于修改而不易被發(fā)現(xiàn),且容易受到網(wǎng)絡黑客和計算機病毒的入侵,安全如果不能保證,檔案數(shù)據(jù)庫的質(zhì)量也就無法保證。近年來信息系統(tǒng)的安全技術日臻成熟,檔案信息資源也屬于信息資源的范疇,因此,可以相互借鑒,如數(shù)字加密、身份認證、數(shù)字簽名、PKI認證技術等。但無論綜合運用多少種信息安全技術,信息安全隱患依然存在,所以,在檔案數(shù)據(jù)庫的建設過程中和動態(tài)的管理過程中都要進行安全防范。
5、檔案數(shù)據(jù)庫的質(zhì)量控制
檔案數(shù)據(jù)庫質(zhì)量問題是目前檔案數(shù)據(jù)庫建設中亟待重視和解決的關鍵問題。由于檔案數(shù)據(jù)庫是包括檔案實體信息、管理信息、應用環(huán)境信息在內(nèi)的各種類型數(shù)據(jù)按照特定數(shù)據(jù)模型進行組織的數(shù)據(jù)集合,本身就是一個由多種對象組成的復雜體,其質(zhì)量問題具有多種來源和表現(xiàn)形式。從數(shù)據(jù)庫角度看,一方面應采用軟件產(chǎn)品質(zhì)量控制的方法對檔案數(shù)據(jù)庫進行質(zhì)量控制,另一方面需要對檔案數(shù)據(jù)庫構建依賴的標準體系進行分析把握。
檔案數(shù)據(jù)庫的質(zhì)量評價是對數(shù)據(jù)庫的質(zhì)量及其運行效率和價值進行科學測定,它本身也是數(shù)據(jù)庫建設生命周期的一個重要環(huán)節(jié),使得數(shù)據(jù)庫建設形成螺旋型上升的回路結(jié)構,是形成有效的檔案信息系統(tǒng)的必需的工作環(huán)節(jié)。
總之,數(shù)據(jù)庫是信息資源存儲和開發(fā)利用的基礎,是信息資源共享的先決條件,是信息系統(tǒng)的核心。檔案數(shù)據(jù)庫建設是實現(xiàn)檔案信息化管理的基礎。是實現(xiàn)檔案信息網(wǎng)絡化服務的根本保障。因此把數(shù)據(jù)庫建設作為當前檔案信息發(fā)布的核心工作,檔案數(shù)據(jù)庫建設越有成效,檔案信息管理與服務也就越有保證。只有切實控制好檔案數(shù)據(jù)庫的質(zhì)量,才能更好的開發(fā)和利用檔案信息資源,加快檔案的信息化進程。