張 戍
(長春師范大學(xué)圖書館,吉林長春 130032)
Access 是由微軟發(fā)布的關(guān)聯(lián)式數(shù)據(jù)庫管理系統(tǒng)。它結(jié)合了Microsoft Jet Database Engine和圖形用戶界面兩項特點,是Microsoft Office 的系統(tǒng)程式之一。Access 以它自己的格式將數(shù)據(jù)存儲在基于Access Jet 的數(shù)據(jù)庫引擎里。它還可以直接導(dǎo)入或者鏈接數(shù)據(jù)(這些數(shù)據(jù)存儲在其他應(yīng)用程序和數(shù)據(jù)庫)[1]。TPI 系統(tǒng)是一個新興的數(shù)字化圖書館解決方案,完全是由同方知網(wǎng)自主研發(fā)的,是一套依托網(wǎng)絡(luò)平臺,利用KBASE檢索服務(wù)器,實現(xiàn)知識倉庫的創(chuàng)建、生產(chǎn)、維護、管理以及發(fā)布的工具軟件系統(tǒng)。其主要優(yōu)點是:TPI 完全實現(xiàn)了信息的先期組織,中期的存儲與檢索,再到后期的由CPS 內(nèi)容發(fā)布系統(tǒng)、檢索網(wǎng)關(guān)和TPI 檢索服務(wù)器一起完成的資源發(fā)布。筆者所在的長春師范大學(xué)圖書館,于2009年起開始了利用Access 軟件和TPI 系統(tǒng)建設(shè)特色數(shù)據(jù)庫的嘗試,取得了一些經(jīng)驗成果。
國內(nèi)滿語文研究取得了豐碩的成果,在滿語文研究文獻的整理方面也取得了一定的成績,但是目前還沒有專門的能夠檢索滿語文研究論文的數(shù)據(jù)庫或者索引,大多數(shù)的滿語文研究人員在對滿語文進行研究時,只能參照一些綜合性數(shù)據(jù)庫,如維普、中國知網(wǎng)、讀秀、E 讀等進行檢索,或者參考有關(guān)研究東北民族史方面的索引。而現(xiàn)有的這些數(shù)據(jù)庫及索引對于查找滿語文方面的研究論文卻存在著諸多盲點。
1.1.1 收錄范圍窄
現(xiàn)有的綜合性數(shù)據(jù)庫在文獻收錄范圍方面都有一定的局限性,收錄的范圍不夠廣,如對學(xué)術(shù)會議論文集的收錄,由于學(xué)術(shù)論文集涉及領(lǐng)域相對狹窄,讀者范圍有限,發(fā)行量較小等特點,綜合性數(shù)據(jù)庫對它們的收錄難免存在缺失和遺漏,如果之后沒有進行補充和擴充,就無法及時反映該學(xué)科學(xué)術(shù)研究工作的進展。
1.1.2 檢索結(jié)果不精確
多數(shù)現(xiàn)有的綜合性數(shù)據(jù)庫,針對的讀者范圍較廣,專業(yè)性不強,往往檢索出來一些不符合相關(guān)研究領(lǐng)域的數(shù)據(jù)結(jié)果,容易影響從事專門學(xué)科研究的專家的研究效率。比如,筆者在知網(wǎng)上以“滿語文”為題名檢索詞,只檢索出一篇題為“讓美育的鮮花開滿語文課堂”的文章,與滿語文的研究一點不沾邊。
滿學(xué)作為一門國際性的綜合性學(xué)科,已成為國際四大(滿、漢、藏、蒙)顯學(xué)之一。滿語文研究作為滿學(xué)研究的重要分支,其累累碩果在一定程度上推動了滿學(xué)研究的繁榮和發(fā)展,一方面,滿語文數(shù)據(jù)庫的建設(shè)研究屬于滿學(xué)研究領(lǐng)域的基礎(chǔ)、服務(wù)工作,是對前人研究成果的總結(jié)性歸納和梳理,從而為研究者了解滿語文研究水平和現(xiàn)狀提供了便利;另一方面,結(jié)合現(xiàn)代計算機技術(shù),對這些論文進行編輯整理,實現(xiàn)文獻檢索的數(shù)字化,開創(chuàng)了國內(nèi)滿語文研究領(lǐng)域的先河,對推動滿學(xué)研究向新的高度和廣度發(fā)展具有重要的現(xiàn)實意義。
滿語文特色數(shù)據(jù)庫建設(shè)研究的最終目的是:通過對滿語文特色數(shù)據(jù)庫建設(shè)的研究,構(gòu)建一個較為完善的有自己特色的數(shù)據(jù)庫平臺,為研究者提供便利,為滿語文研究向更高層次與更廣領(lǐng)域發(fā)展奠定基礎(chǔ)。
為確保數(shù)據(jù)庫建設(shè)中少走彎路,建庫初期就制定了建庫的基本思路。
2.2.1 聘請專家指導(dǎo)
數(shù)據(jù)庫建設(shè)前期,即聘請滿語文研究專家,東北師范大學(xué)歷史文化學(xué)院博士生導(dǎo)師劉厚生教授,就數(shù)據(jù)庫的收錄和采集范圍等提供意見,以期使數(shù)據(jù)庫成果更具專業(yè)性。
2.2.2 編寫輔助表
嚴格按照數(shù)據(jù)庫建設(shè)要求編寫輔助表,如關(guān)鍵詞、重點作者、專業(yè)期刊等輔助表,便于數(shù)據(jù)庫的數(shù)據(jù)采集、錄入更專業(yè)、更精準。并且,擴大數(shù)據(jù)庫的覆蓋面,如將搜索范圍擴大至論文注釋,深入挖掘論文注釋中隱含的數(shù)據(jù)信息,保證數(shù)據(jù)庫中數(shù)據(jù)的完整性和收錄的廣泛性。
2.2.3 數(shù)據(jù)采集、整理更科學(xué)、全面
數(shù)據(jù)采集在準確的基礎(chǔ)上確保全面。然后對采集到的數(shù)據(jù)信息進行鑒別、篩選、剔除重復(fù),利用計算機技術(shù)及網(wǎng)絡(luò)信息技術(shù),進行科學(xué)的分類、排序,標引和著錄。
數(shù)據(jù)的整合發(fā)布采用清華同方的TPI 系統(tǒng),TPI 是一款性能先進的工具軟件系統(tǒng),能兼容普遍使用的MARC 標準和最新的Dublin Core 標準,完全兼容支持XML 文件格式,支持Z39.50 標準協(xié)議及最新的OAI協(xié)議、METS 協(xié)議,支持統(tǒng)一認證和單點登錄等。
數(shù)據(jù)庫建庫軟件采用微軟的Access,Access 數(shù)據(jù)庫具有操作靈活、轉(zhuǎn)移方便、運行環(huán)境簡單等優(yōu)點。該軟件的通用性強,無論在校園網(wǎng)上架設(shè)單獨的網(wǎng)站或?qū)碚先隩PI 都能方便、快捷地實現(xiàn)[3]。
利用Microsoft Office 的系統(tǒng)套裝軟件Access2003,可簡單、快速地建立滿語文特色數(shù)據(jù)庫。
3.1.1 數(shù)據(jù)庫具體結(jié)構(gòu)
數(shù)據(jù)庫的整體框架結(jié)構(gòu)在建庫初期就已確定,多方聽取數(shù)據(jù)庫建設(shè)專家的意見,經(jīng)過認真的研究、討論,根據(jù)建設(shè)數(shù)據(jù)庫的用途和實際需要,我們把數(shù)據(jù)庫定義為11個字段(模塊),它們是:分類號、題名項、責(zé)任者、機構(gòu)、文獻來源、年月、卷期、起止頁碼以及備注,據(jù)此確定滿語文研究論文全文數(shù)據(jù)庫的整體結(jié)構(gòu)(圖1)。
3.1.2 建庫步驟
3.1.2.1 打開一個新建庫
打開Access 2003中的新建庫后看到如下界面,在這個界面的對象欄中包含7個對象(表、查詢、窗體、報表、頁、宏、模塊),通過對表的創(chuàng)建來完成數(shù)據(jù)庫子模塊的創(chuàng)建(圖2)。
圖1 數(shù)據(jù)庫具體結(jié)構(gòu)
圖2 打開新建庫
圖3 創(chuàng)建表
3.1.2.2 創(chuàng)建表
Access 2003中所有對象的基礎(chǔ)就是表,因為表存儲的數(shù)據(jù)是其他對象用來執(zhí)行活動任務(wù)的。設(shè)計一個數(shù)據(jù)庫的關(guān)鍵,就集中在建立數(shù)據(jù)庫中的基本表上。Access 2003中的每個表都是由若干個記錄組成的,而每條記錄又都對應(yīng)一個實體,并且相同表中的所有記錄也都具有相同的字段定義,且每個字段都存儲著相對應(yīng)于實體的不同屬性的數(shù)據(jù)信息。在打開的對話框里選擇“使用設(shè)計器創(chuàng)建表”,按照預(yù)先設(shè)定的依次創(chuàng)建表(圖3),給表命名,并設(shè)定出表與表之間的關(guān)系、表的索引,在確定表的主鍵之后,打開已創(chuàng)建的表,在各個字段下添加著錄內(nèi)容(圖4),至此,一個完整的Access 數(shù)據(jù)庫就基本建成了(圖5)。
圖4 著錄內(nèi)容
圖5 完成Access 數(shù)據(jù)庫
3.2.1 數(shù)據(jù)轉(zhuǎn)換引入
利用TPI6.0 系統(tǒng)的數(shù)據(jù)轉(zhuǎn)換工具(Data Tran)將Access 數(shù)據(jù)庫的數(shù)據(jù)導(dǎo)入。不用登錄服務(wù)器,直接選擇“導(dǎo)入數(shù)據(jù)或?qū)С鰯?shù)據(jù)”的分頁項,單擊“確定”按鈕,依照TPI6.0 系統(tǒng)使用說明完成數(shù)據(jù)導(dǎo)入,然后再把PDF 格式的論文逐個鏈接至數(shù)據(jù)庫中,選擇設(shè)置數(shù)據(jù)庫的發(fā)布項目,完成數(shù)字對象的命名,整個數(shù)據(jù)庫才算真正建起來了。
3.2.2 數(shù)據(jù)的分類、標引
數(shù)據(jù)導(dǎo)入后要進行數(shù)據(jù)的分類與標引。數(shù)據(jù)的分類是指按照《中國圖書館圖書分類法》的分類規(guī)則,把論文分別歸納到相對應(yīng)的類目里,一般只分類到二級類目。數(shù)據(jù)庫中都設(shè)有“分類檢索”選項,只有論文正確分類了,使用“分類檢索”才能夠精準、全面。數(shù)據(jù)的標引則是指把論文中設(shè)定的每一個字段都作為檢索內(nèi)容標示出來,并指示計算機每一個字段所檢索出來的內(nèi)容對應(yīng)論文的哪一部分。標引的文件格式有很多種,如:*.TXT 格式文件,*.PDF 格式文件,*.CAJ 格式文件,*.KDH 格式文件,*.DOC 格式文件,*.XML 格式文件,*.HTML 格式文件等,我們的數(shù)據(jù)標引格式采用的是*.HTML 格式文件。
3.2.3 內(nèi)容發(fā)布
利用TPI6.0 系統(tǒng)的內(nèi)容發(fā)布平臺(CPS)可完成多種不同需求的發(fā)布,加工好的數(shù)據(jù)發(fā)布到網(wǎng)上后,用戶可以方便、快捷地瀏覽和檢索。CPS 有多種數(shù)據(jù)發(fā)布模板,如知網(wǎng)的期刊風(fēng)格、谷歌搜索風(fēng)格、工程索引風(fēng)格、OCLC 風(fēng)格、圖片風(fēng)格等。支持用戶數(shù)據(jù)庫多字段的個性化定制發(fā)布;支持各個數(shù)據(jù)庫間及數(shù)據(jù)記錄之間的關(guān)聯(lián)、跳轉(zhuǎn)、校驗等功能;可以為數(shù)據(jù)庫同時建立多種導(dǎo)航樹,并支持多種分類體系;支持一條記錄關(guān)聯(lián)多個全文數(shù)據(jù)以及多種數(shù)據(jù)間的連接??傊瑪?shù)據(jù)的發(fā)布既簡便又易操作,在數(shù)據(jù)庫管理一欄里選擇要發(fā)布的數(shù)據(jù)庫(一個或多個),選好要發(fā)布的數(shù)據(jù)庫模板以及檢索字段、概覽字段和細覽字段、排序字段、關(guān)聯(lián)數(shù)據(jù)庫字段等項目的發(fā)布設(shè)置,就可以開始Web 發(fā)布了。
特色數(shù)據(jù)庫建設(shè)是一項長期工程,需要全國范圍內(nèi)的合作。但是,目前國內(nèi)特色數(shù)據(jù)庫的建設(shè)很分散,運行也相對獨立,大規(guī)模聯(lián)合運營的方式在國內(nèi)很少見。我們對滿語文特色數(shù)據(jù)庫的建設(shè)探索,其宗旨與目的不外乎滿語文資源的共享,以期為國內(nèi)外滿語文研究盡微薄綿力,資源只有實現(xiàn)了實實在在的共享,才不失我們辛苦工作的初衷。
[1]百度百科.Microsoft Office Access[EB/OL].(2013-09-08)[2013-09-10].http://baike.baidu.com/view/1162845.htm?fromId=433649.
[2]同方知網(wǎng)(北京)技術(shù)有限公司.清華同方TPI V6.0 信息資源建設(shè)與管理平臺使用說明書[Z].2012.
[3]韓鋼.中國東北民族史論文數(shù)據(jù)庫的建設(shè)[J].長春師范學(xué)院學(xué)報:自然科學(xué)版,2010(6):156-158.