南拉才讓,完么措
(1.西藏大學圖書館,西藏拉薩 850000;2.西北民族大學社會科學院,甘肅蘭州 730000)
藏文距今有著近1 300年的歷史,通過藏文記錄的古籍文獻、古籍著作或譯作等也成了重要的歷史參考資料。藏文古籍文獻作為記錄藏族文化、歷史、科技以及宗教內(nèi)容的重要載體,無論是現(xiàn)在還是將來都將成為研究與傳承藏族文化的重要資料[1]。因此,為保護藏族文化的更好傳承,建立藏文古籍文獻資源庫顯得十分必要。藏文古籍文獻資源庫的建設(shè),能夠有利于充分挖掘藏文古籍文獻中豐富的科學文化資源,并對藏族歷史上的思想文化與科學成就充分進行體現(xiàn)。利用科學手段對藏文古籍文獻進行開發(fā)處理, 能夠加深人們對藏族文化的理解。同時藏文古籍文獻數(shù)據(jù)庫的建立,也是對藏文古籍文獻資料現(xiàn)代化管理與開發(fā)利用的基礎(chǔ)[2]。數(shù)據(jù)庫作為藏文古籍文獻信息開發(fā)最有效的形式,數(shù)據(jù)庫的建立讓藏文古籍文獻真正走向數(shù)字化與網(wǎng)絡(luò)化,與現(xiàn)代電子信息技術(shù)資源融為一體。在各行各業(yè)信息管理開發(fā)利用向著數(shù)字化發(fā)展的今天,藏文古籍文獻的信息資源也需要滿足這一發(fā)展趨勢。藏文古籍文獻資源庫的建立,有利于對珍貴孤本、善本古籍文獻資料的搶救。
藏文古籍文獻資源的屬性, 主要以描述該資源的相關(guān)屬性為主。因此,藏文古籍文獻資源屬性主要以資料學習對象元數(shù)數(shù)據(jù)規(guī)格為中心,同時針對不同類型藏文古籍文獻特性建立拓展屬性集,其結(jié)構(gòu)如圖1所示。
圖1 藏文古籍文獻資源庫屬性結(jié)構(gòu)
藏文古籍文獻數(shù)據(jù)庫根據(jù)數(shù)據(jù)類型可分為必須數(shù)據(jù)元素、通用可選數(shù)據(jù)元素、分類數(shù)據(jù)元素三大類。必須數(shù)據(jù)元素在要求中需要與查詢對象元素保持數(shù)據(jù)元素相一致。必須數(shù)據(jù)元素也是其他類型資源必需的屬性標注[3]。其中主要包括:標示、標題、內(nèi)容描述、關(guān)鍵字、貢獻、格式等多類屬性;通用可選數(shù)據(jù)元素主要是針對各類藏文古籍文獻資源的屬性集合。此類數(shù)據(jù)元素主要根據(jù)使用者與開發(fā)者在工作過程中參考屬性選擇為基礎(chǔ)進行選擇使用。其中主要包括古籍文獻版本狀態(tài)、古籍文獻資源字節(jié)數(shù)、古籍文獻資源使用條件描述、適用對象、位置等屬性描述;分類數(shù)據(jù)元素主要根據(jù)藏文古籍文獻各類資源特點, 對其中某些資源技術(shù)與資源特征密切相關(guān)的數(shù)據(jù)進行制定, 并對其中部分基礎(chǔ)特殊資源進行屬性分類。在藏文古籍文獻對象元數(shù)據(jù)規(guī)范中的最后一個分類中, 為使用者提供任意資源分類結(jié)構(gòu)。由于無法被任何分類法應(yīng)用,因此這個分類提供了一個簡單有效的擴展機制。這可以作為藏文古籍文獻資源的主要分類標準,并逐層進行細化。
根據(jù)藏文古籍文獻資源庫屬性結(jié)構(gòu), 整體資源庫采用多層結(jié)構(gòu),且每層結(jié)構(gòu)相對獨立。每層結(jié)構(gòu)中相互留有標準接口, 這種結(jié)構(gòu)模式不僅可以確保系統(tǒng)的靈活性、開放性以及可擴展性,同時也更加方便系統(tǒng)整體的接入與管理工作。藏文古籍文獻資源庫系統(tǒng)結(jié)構(gòu),如圖2所示。
圖2 藏文古籍文獻資源庫系統(tǒng)結(jié)構(gòu)
其中, 藏文古籍文獻數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)服務(wù)層主要負責數(shù)據(jù)的物理存儲、 數(shù)據(jù)讀取以及數(shù)據(jù)內(nèi)部維護工作; 系統(tǒng)中存取層主要負責對數(shù)字化藏文古籍文獻獲取、 檢索數(shù)據(jù)庫以及資源調(diào)度等上層服務(wù)進行支持; 應(yīng)用服務(wù)層主要負責對包括信息推送、 使用者認證、網(wǎng)上參考查詢等網(wǎng)絡(luò)環(huán)境下的應(yīng)用服務(wù)進行處理;系統(tǒng)結(jié)構(gòu)中最上層的表示層則主要負責使用者檢索與交互,使用者可以通過其界面連接數(shù)據(jù)庫系統(tǒng),同樣也可以通過客戶端軟件進行接入。在系統(tǒng)結(jié)構(gòu)設(shè)計中,需要保持系統(tǒng)開放性[4]。在系統(tǒng)對藏文古籍文獻進行數(shù)字化處理過程中, 根據(jù)制訂的相關(guān)元數(shù)標準以及數(shù)字化處理規(guī)范,對藏文古籍文獻資源進行分裝與標引,讓其成為合格的數(shù)字處理對象。通過數(shù)據(jù)管理工具對藏文古籍文獻元數(shù)據(jù)、數(shù)字化對象進行存儲與管理。因此,只需要將藏文古籍文獻資源在系統(tǒng)某一層上符合規(guī)定的結(jié)構(gòu)標準進行處理, 就能夠?qū)⒉匚墓偶墨I資料與數(shù)據(jù)庫進行整合[5]。
以藏文古籍文獻資源庫建設(shè)為基礎(chǔ), 為更加方便使用者使用, 對藏文古籍文獻資源庫檢索系統(tǒng)進行構(gòu)建。以藏文古籍文獻資源庫結(jié)構(gòu)為基礎(chǔ),從而建立一個智能化信息檢索體系結(jié)構(gòu)模型。模型中主要以使用者界面為基礎(chǔ),從而實現(xiàn)查詢轉(zhuǎn)換、文檔處理、檢索代理以及處理定制等多種功能[6]。
整體查詢結(jié)構(gòu)系統(tǒng)中主要分為本體文檔預(yù)處理與本體文檔檢索兩部分。本體文檔處理主要包括數(shù)據(jù)源、信息庫、文檔處理器以及本體服務(wù)器等項功能;本體文檔檢索主要包括信息庫、定制處理模塊、本體服務(wù)器、檢索代理、查詢轉(zhuǎn)換器等多項功能。
藏文古籍文獻資源庫的建設(shè)其主要目的是為今后文獻查詢提供便利, 因此無論在內(nèi)容與功能上都應(yīng)以考慮實際需求為主, 讓使用者能夠更加精準與方便地進行信息獲取,增加其可利用性。在藏文古籍文獻數(shù)據(jù)庫信息檢索模塊中,主要包含輸入模塊、查詢匹配模塊以及查詢結(jié)果輸出三個子模塊[7]。
查詢輸入模塊主要為根據(jù)使用者需求, 為使用者提供精準藏文古籍文獻資源定位。其查詢系統(tǒng)主要按照關(guān)鍵詞、 素材內(nèi)容以及內(nèi)容概述三項功能對資源進行綜合查詢。內(nèi)容概述功能中,主要提供使用者利用中文自然語言進行需求查詢, 避免了藏文古籍文獻系統(tǒng)與使用者之間的交流障礙,減輕使用者負擔。同時在查詢輸入模塊中, 使用者可對查詢結(jié)果進行文件格式與素材類型分類, 讓使用者能夠?qū)λ栀Y源進行更加精準的定位,有效提高查詢范圍。
查詢匹配模塊主要提供使用者輸入查詢要求改進的正向最大匹配法, 從而進行有效信息提取以及自動分詞與處理。通過對各項查詢條件進行綜合后利用加權(quán)算法與查詢結(jié)果之間的相關(guān)度進行對比, 按照相關(guān)度進行排序[8]。
查詢結(jié)果輸出模塊主要功能為按照使用者需求將查詢結(jié)果按照相關(guān)度大小順序輸出給使用者。在查詢結(jié)果中,系統(tǒng)按照用戶素材對資源實現(xiàn)超鏈接功能,提供使用者在線瀏覽與下載功能。
藏文古籍文獻資源庫建設(shè)及其檢索研究, 能夠有效實現(xiàn)藏文古籍文獻資源數(shù)字化,保護藏文文獻資源。結(jié)合藏文古籍文獻資源特點, 建設(shè)資源庫并對其查詢系統(tǒng)進行分析, 實現(xiàn)對藏文古籍文獻資源的快速查詢與檢索,更好地滿足使用者需求。