韓 鋼
(長春師范學院圖書館,吉林長春 130032)
自先秦以來,中國東北地區(qū)就是多民族聚居地,是中華民族多元一體大家庭的重要組成部分。生活在這里的人們,通過血緣、文化和政治上的不斷滲透、融合,逐漸形成了穢貊、東胡和肅慎三大族系。這些民族的產(chǎn)生與活動,對中華民族的歷史產(chǎn)生了深遠的影響,因此,歷代統(tǒng)治階層和文人學者都給予充分關注。但歷史發(fā)展到近代,東北民族史的研究工作卻一度陷入歧途和低谷。
中日甲午戰(zhàn)后,日本開始覬覦朝鮮半島和中國東北。為配合其“大陸政策”的推進,以白鳥庫吉、內(nèi)滕虎次郎為代表的一些御用文人,在滿鐵株式會社的資助下,開始了“滿鮮”歷史研究,以所謂“滿鮮一體”為宗旨,在文獻研究上大做文章,割裂部分東北民族與中華民族的密切關系,為其侵略戰(zhàn)爭張目。我國的一些愛國學者如金毓黻、傅斯年、凌純聲等人對這種肆意歪曲歷史原貌的行為予以反擊。在這種情況下,一大批關于東北民族歷史的研究成果相繼出現(xiàn),掀起了東北民族史地研究的第一次熱潮。
第二次世界大戰(zhàn)結束后,日本對中國東北民族歷史研究逐漸降溫,但朝鮮半島的學者在批判日本軍國主義擴張理論的同時,也繼承了日本學者的錯誤觀點,開始了滿鮮歷史的研究。由于歷史原因,我國在相當長的一個時期內(nèi),對于東北民族歷史研究中的一些敏感問題采取回避政策,在一定程度上抑制了學術研究工作的展開,只是日本軍國主義的遺毒沒有得到有效的肅清。
20世紀80年代以來,隨著學術研究氛圍的不斷寬松,我國對東北民族歷史研究不斷加強,研究成果大量涌現(xiàn),形成了中國東北民族史研究的第二次熱潮。此間出版的與東北民族史有關的論文索引主要有:中央民族學院科研處1982年編印的《中國少數(shù)民族史論文資料索引》;孫進己等編,四平市博物館1985出版的《東北古代民族史論著索引》;黃定天主編,黑龍江人民出版社1987年出版的《東北史論文資料索引》;中國社會科學院民族研究所圖書資料室1988年編印的《中國民族研究報紙資料目錄索引》;任萬舉、喬釗編,長春出版社1992年出版的《九十年東北地方史研究資料索引大全》;劉浦江編,上海辭書出版社2002年出版的《二十世紀遼金史論著目錄》等。2002年以來,我校圖書館致力于東北民族史研究成果的搜集和整理工作,已經(jīng)編印了三種索引,分別是郭淑琴主編的《高句麗歷史研究論文索引》、曾憲麗主編的《渤海歷史研究論文索引》和筆者編寫的《中朝韓關系史論文索引》,以上三種索引均由吉林文史出版社出版。
盡管近來年陸續(xù)出版了一批論著索引,網(wǎng)絡技術的發(fā)展也使知網(wǎng)、萬方、維普等網(wǎng)絡數(shù)據(jù)庫成為學者手中越來越重要的工具,但由于種種原因,這些已有的檢索方式仍然存在著諸多不足。首先,覆蓋面不夠寬。各種索引編成之后沒有進行補充和擴充,無法及時反映學術研究工作的進展,而大陸各網(wǎng)絡數(shù)據(jù)庫關于1982年以前和港臺出版的論著仍付諸闕如。其次,檢索效率不高?,F(xiàn)有的大多數(shù)索引或網(wǎng)絡數(shù)據(jù)庫,都是面向范圍較廣的讀者編寫的,專業(yè)性不足,其檢索結果中必然包含著大量與東北歷史民族問題無關的數(shù)據(jù),無法使從事專門史研究的專家學者高效地利用。最后,數(shù)據(jù)加工不夠深入。由于人名、地名以及其他專有名詞具有多樣性和復雜性,如果不能建立相應的對照詞表,則不能在一名多人、一地多名等復雜情況下,提供行之有效的檢索方式。
在當前情況下,要將學術研究不斷推向深入,有必要對20世紀以來東北民族史研究成果進行充分的搜集與系統(tǒng)的整理。因而我們建設了中國東北民族史論文數(shù)據(jù)庫。
數(shù)據(jù)采集工作看似簡單,但其完成的質量,卻直接決定著一個數(shù)據(jù)庫的實用性和有效性。[1]因此,應該花大氣力,廣開渠道,采取靈活多樣的方法對這一學科的研究成果進行深入挖掘,更為全面地反映東北民族史研究的發(fā)展脈絡,切實體現(xiàn)最新的研究成果。為此,我們采用了多種手段開展數(shù)據(jù)采集工作。
第一,編寫關鍵詞表和重點作者表,使其成為我們開展網(wǎng)絡檢索和手工檢索的重要依據(jù)。為了保證論文收錄的廣泛性,我們專門編寫了關鍵詞表,其內(nèi)容主要包括與中國東北民族史有關的人名 (含字、號、別號、室名、齋名等異稱)、地名、事件和書籍等專有名詞,力爭達到覆蓋全面的目的。同時,為了更高效地反映該方向最具代表性的論著,保證數(shù)據(jù)庫的權威性,我們也編制了“重點作者表”,涵蓋了百年來從事這一方面研究的中國、日本、朝鮮、韓國、俄羅斯以及歐美諸國的主要專家學者,以免在建庫過程中遺漏這一部分學者的成果。
第二,整合知網(wǎng)、萬方、維普等網(wǎng)絡數(shù)據(jù)庫和已出諸索引的數(shù)據(jù),輔以手工檢索館藏過刊等方式,保證20世紀80年代以來國內(nèi)大多數(shù)期刊、報紙和學位論文數(shù)據(jù)的完整性。對于手工檢索所得的論文,自行制作PDF文檔。
第三,充分利用港臺網(wǎng)絡數(shù)據(jù)庫,廣泛搜集相關研究成果。在檢索過程中,我們有針對性地選用了部分臺灣網(wǎng)絡數(shù)據(jù)庫來補充臺灣、香港的研究成果。其中,臺北“國家圖書館”的“臺灣期刊論文索引系統(tǒng)”和“中華文化研究論文目錄”、華藝數(shù)位股份有限公司的“中文電子期刊服務”(CEPS)用于檢索臺灣地區(qū)出版的期刊;臺北“國家圖書館”的“臺灣文史哲論文集篇目索引系統(tǒng)”用于檢索港臺地區(qū)出版的論文集細目;臺北“國家圖書館”的“臺灣博碩士論文系統(tǒng)”、華藝數(shù)位股份有限公司的“中文電子學位論文服務”(CETD)和臺北中山大學的“OAI博碩士論文聯(lián)邦查詢系統(tǒng)”用于檢索港臺地區(qū)發(fā)表的博碩士學位論文。
第四,加大文集論文的搜集整理工作,擴大特色數(shù)據(jù)庫覆蓋范圍,使其更具專業(yè)性。在期刊論文和學位論文方面,現(xiàn)有的網(wǎng)絡數(shù)據(jù)庫都做得比較好,需要我們補充的范圍并不大,而文集論文則沒有得到他們足夠的重視,需要我們自己去補充的內(nèi)容較多。為此,我們采用網(wǎng)絡采購和走訪專家學者與各高校圖書館相結合的方式,搜集了一批針對性較強的論文集,并掃描、制作成PDF文件,同時著錄入庫。通過這項工作,使數(shù)據(jù)庫條目數(shù)量上升了接近30%,極大地豐富了數(shù)據(jù)庫內(nèi)容,也使得該數(shù)據(jù)庫獲得了不可替代的優(yōu)勢。
第五,挖掘論文注釋,擴大收錄范圍。指定專人詳查“重點作者”發(fā)表于核心期刊的論文,尋找為其引述而數(shù)據(jù)庫失載者。有的論文或因發(fā)表時間較早,或因所載出版物流傳不廣,所受關注不多,以致各種索引、數(shù)據(jù)庫都未著錄。而專家學者往往畢生浸淫東北史研究,常見他人所未見,為其引述者,必有其存世價值。
建庫前,我館在選題策劃、設計開發(fā)、采集建庫等方面制訂了詳細的計劃,確立“精品意識”,堅持“實用價值”。在建庫方式上,突出標準化、規(guī)范化,確保數(shù)據(jù)庫運行狀態(tài)穩(wěn)定、檢索功能強大、網(wǎng)絡連接通暢。建庫軟件采用微軟Access,該軟件的通用性強,無論在校園網(wǎng)上架設單獨的網(wǎng)站或將來整合入TPI都能方便、快捷地實現(xiàn)。為顯示、檢索大量的非常用字,數(shù)據(jù)庫編碼選用Unicode(又稱統(tǒng)一碼、萬國碼、單一碼),該編碼采用十六進制編碼,包含了中、日、韓漢字六萬余個字形[2],能夠基本滿足需要。
我館建庫人員在框架結構的設計開發(fā)上,綜合了從事專門史研究的多位專家的意見,經(jīng)過長時間的研究和討論才最終確定。對于東胡族系,雖然以孫進己先生為代表的一批學者不贊成將其納入東北民族史范疇[3],但我們認為,要更全面地反映東北民族史的研究狀況,仍應部分采納金毓黻先生的觀點[4],將蒙元滅宋前有關東北史的內(nèi)容收入。至于清入關后的內(nèi)容,則已經(jīng)脫離東北民族史的范疇,不予采錄。
目前該庫下設穢貊族系、東胡族系、肅慎族系和其他民族四個子庫,在子庫基礎上,又以各族系在不同時代的民族政權為線索,延伸出次一級共14個版塊,從而形成了較為完整的“中國東北民族史論文數(shù)據(jù)庫”,具體結構如下圖所示。數(shù)據(jù)庫的著錄項目主要包括:題名、責任者、責任者單位、出版物、年、月、卷期、另見、譯自、起止頁、備注等項。
圖1
由于數(shù)據(jù)庫收錄論文眾多,受人員、資金等方面條件的限制,目前該庫僅提供題名、責任者和出版物三種檢索方式。在電子論文制作方面,統(tǒng)一采用PDF格式,分辨率定為300dpi。對于發(fā)表多次的論文,在制作電子論文時統(tǒng)一選用其最終版本。
在擬定之初,我們就確定了兩種成果應用形式,即在校園網(wǎng)架設網(wǎng)站和整理出版《中國東北民族史論文索引》。
建成后的“中國東北民族史論文數(shù)據(jù)庫”收錄20世紀初以來中國、日本、朝鮮、韓國、俄羅斯以及歐美諸國公開或內(nèi)部出版的中國東北民族史論文一萬五千余篇,其中包含大量的知網(wǎng)等網(wǎng)絡數(shù)據(jù)庫未收數(shù)據(jù)。課題結項后,在校園網(wǎng)建立相關網(wǎng)絡檢索平臺,面向校內(nèi)用戶提供題名、責任者和發(fā)表出版物三種檢索方式。為保護知識產(chǎn)權,網(wǎng)絡檢索平臺暫時不提供全文下載服務。
《中國東北民族史論文索引》已經(jīng)完成初稿,全書分為總論、東胡族系、穢貊族系、肅慎族系和其他民族,共五大部分。各部分又以民族政權為脈絡分為若干章,每章下設總論、政治、經(jīng)濟、文化、軍事、地理、對外關系、民族與民俗、人物、考古、書評等11大類,每類下設若干細目。條目依發(fā)表年代和題名漢語拼音為序。后附作者索引和題中所見人名地名索引。
特色數(shù)據(jù)庫的維護與更新,是確保數(shù)據(jù)庫生命力,保證數(shù)據(jù)庫正常運行,獲得社會效益和經(jīng)濟效益的前提。數(shù)據(jù)庫建成后,數(shù)據(jù)的修正、維護和更新是一項長期的工作,不可輕視。[5]對于數(shù)據(jù)庫建設中出現(xiàn)的一些錯誤必須給予更正,而學術研究的不斷發(fā)展,必然會有更多的成果陸續(xù)涌現(xiàn),必須對數(shù)據(jù)庫進行定期更新。只有這樣才能保證數(shù)據(jù)庫的及時性、有效性和權威性,否則數(shù)據(jù)庫將成為數(shù)據(jù)孤島或死庫。
[1]楊昌順.基于OPAC的圖書館館藏資源整合[J].貴州教育學院學報:社會科學版,2006(5):102-104.
[2]王玉然.圖書館信息采集數(shù)字化處理的基本技術[J].農(nóng)業(yè)圖書情報學刊,2008(7):25-26.
[3]孫進己.關于東北民族史研究的一些問題[J].民族研究,1999(5):70-80.
[4]金毓黻.東北通史[M].長春:社會科學戰(zhàn)線雜志社,1980:23-32.
[5]于麗濱.關于高校圖書館自建特色數(shù)據(jù)庫的探討[J].圖書館建設,2007(5):44-46.