秦 冕
(渤海大學 文學院,遼寧 錦州 121013)
字料庫這一概念是漢字學與信息科學交叉融合后形成的嶄新事物,最早由李國英、周曉文于2009年提出[1]。21世紀以來,學科交叉的研究方法在學界得到廣泛應用,語料庫及語料庫語言學的建設為字料庫研究提供了大量可資借鑒的成熟經(jīng)驗,加之信息化的發(fā)展對漢字的整理研究提出了更高的要求,字料庫作為一種以真實文本為基礎的大規(guī)模文字資源庫,其建設已是箭在弦上,蓄勢待發(fā)。在此背景下,柳建鈺以李國英、周曉文關于字料庫建構的設想為基礎,將語料庫建設的相關經(jīng)驗與自身深厚的文字學理論基礎相結合,逐步形成了字料庫建設的整體構想,并于2014年成功研發(fā)出渤海大學CCFD字書字料庫。從最初的1.0版本到目前正在研發(fā)的4.0版本,字書字料庫經(jīng)歷了從無到有、從有到精的逐步完善的過程。近10年來,柳建鈺一直深耕于漢字字料庫研究的相關領域,將多年心血匯聚成《字書字料庫的理論、實踐與應用》一書,堪稱字料庫研究領域中一項具有重大意義的最新研究成果。筆者將從特點、內容和語言三個方面來評述《字書字料庫的理論、實踐與應用》的重要價值。
《字書字料庫的理論、實踐與應用》扉頁題有陳寅恪在《陳垣〈敦煌劫余錄〉序》中的名言:“一時代之學術,必有其新材料與新問題。取用此材料,以研究問題,則為此時代學術之新潮流。治學之士,得預于此潮流者,謂之預流?!盵2]1此語是《字書字料庫的理論、實踐與應用》最核心的特點——預流于新——的真實寫照?!蹲謺至蠋斓睦碚?、實踐與應用》作為第一部系統(tǒng)研究漢字字料庫及字料庫漢字學理論的著作,其創(chuàng)新之處主要表現(xiàn)在以下幾個方面。
縱觀中國兩千年學術發(fā)展史,可以發(fā)現(xiàn),以文字、音韻、訓詁為核心的小學研究成果汗牛充棟,研究材料更是浩如煙海。但隨著研究的深入發(fā)展,文字、音韻、訓詁三科之間的壁壘漸厚,繼續(xù)運用以往的研究手段與研究方法已經(jīng)很難產生新的突破,基于信息技術的漢字整理與漢字學理論研究勢在必行。在這種背景下,柳建鈺提出應當建立一門嶄新的交叉學科——字料庫漢字學。
字料庫漢字學既有社會科學和自然科學的雙重屬性,又有理論科學和應用科學的雙重屬性。字料庫漢字學的出現(xiàn),標志著漢字學與信息科學之間的邊界被打破,實現(xiàn)了知識的跨學科流動。
語言學研究主要依靠三種方法:內省法、誘導法、基于語料庫的方法[3]6-10。其中內省法、基于字料庫的研究方法同樣適用于漢字學研究。
依賴直覺的內省法雖是傳統(tǒng)研究的主要方法,但其弊端是顯而易見的。 Francis Gill與Sinclair John曾指出:“語言學家的直覺一經(jīng)提出,常常給人一種似乎合理的感覺,然而正是這種語言直覺使得我們無法觀察到一些重要的語言事實?!盵4]文字學中亦是如此。此外,學者自身經(jīng)驗的局限性亦會對其研究成果的可靠性產生或多或少的損害。而字料庫以大批量數(shù)據(jù)為支撐,既可以使以往內省式研究成果所遺漏的現(xiàn)象浮出水面,又可以削弱研究結論的主觀色彩。
以往由于技術的限制,學者只能依靠卡片式的整理方式從浩如煙海的文獻中擇取和處理文字材料,難以做到全數(shù)采集,只能依靠內省。隨著計算機技術的日臻成熟,字料的采集、貯存、整理、加工都變得十分容易,這是現(xiàn)代化社會賦予學者的天然優(yōu)勢。當然,我們亦不能否定內省方法,畢竟內省是發(fā)現(xiàn)問題的基礎,沒有內省我們可能連問題都沒有了。因此字料庫漢字學采用字料庫與內省相結合的研究方法,不主張單純依靠內省理論或單純依靠事實數(shù)據(jù)進行漢字學研究。
《字書字料庫的理論、實踐與應用》指出,字料庫的研究內容主要包括4個方面,每個方面下又可細分出數(shù)個不同的研究方向,具體總結如圖1所示。
可見,字料庫漢字學的研究內容不僅可以涵蓋傳統(tǒng)漢字學研究的各個方面,而且具有獨特與創(chuàng)新之處。既為以往的漢字學研究提供更為科學高效的研究手段,又進一步拓寬了漢字學的研究領域,豐富漢字學的研究內容,促進漢字學向縱深化發(fā)展。
《字書字料庫的理論、實踐與應用》全書近30萬字,除緒論外共13章,可分為三大部分:理論篇、實踐篇和應用篇。全書內容細致全面,具有鮮明的“三結合”“兩支撐”的特色。
《字書字料庫的理論、實踐與應用》的三大部分并不是論文集式的簡單羅列或疊加,而是三位一體,有機結合,從而形成了嚴密的三結合體系。
理論篇主要對字料庫的一系列相關概念、理論成果進行闡釋。在對當前字料庫的主要理論成果進行綜述之后,該書介紹字料庫及其相關概念,討論字料庫與語料庫的區(qū)別,闡明字料庫理論的提出背景及主要價值,并提出一門嶄新的交叉學科——字料庫漢字學,對字料庫漢字學的相關理論進行了全面闡述。
在實踐篇中,首先,作者對當前國內外12個主要字料庫及類字料庫進行簡要介紹;其次,作者總結字書字料庫系統(tǒng)建設的主要原則與基本流程以及字書字料庫軟件的設計與實現(xiàn)方案;再次,作者對字書字料庫的4個功能界面進行全面介紹,對不同字料的標注原則、內容、方式、層次進行詳細的討論,并對字料庫的字際關系系聯(lián)工作進行闡釋;最后,作者論述字書字料庫的日常維護管理問題。
在應用篇中,作者舉例展示基于字書字料庫而產生的一系列研究新成果,包括基于字書字料庫進行的疑難字考辨、字書漢字基層流變狀況的調查研究以及通用規(guī)范漢字構形屬性調查研究,證明了字書字料庫在解決漢字學實際問題方面的巨大潛力。
總體來說,《字書字料庫的理論、實踐與應用》的內容既注重理論又崇尚實踐,形成了理論實踐互相支撐的特色。
一方面,作者重視理論基礎的建設,這一點可以從理論篇與實踐篇中得以體現(xiàn)。例如,在理論篇的《字料庫漢字學概說》一章中,作者為字料庫漢字學這一嶄新的學科建設了系統(tǒng)全面的理論體系,涵蓋了字料庫漢字學的學科定義、研究領域等7個方面,將一門具體學科需要滿足的基本條件囊括在內;再如,在實踐篇《字料字際關系界面屬性庫》一節(jié)中,作者根據(jù)漢字的形、音、義、用將字際關系分為異體關系、同源關系等7類,每一字際關系界面字段的設計都廣泛參考了學界的優(yōu)秀理論成果。
另一方面,作者在實踐方面亦有突出的成就。總體上說,整本書的形成均來源于字料庫的實體建構經(jīng)驗。具體來說,實踐篇是依據(jù)理論篇的相關理論而進行的字料庫建設的實踐,并由此證明了字料庫理論的可行性;應用篇又是依據(jù)實踐篇的建設成果“字書字料庫”而進行的一系列文字學研究,驗證了實踐篇成果的可用性以及科學性。
實踐出真知,《字書字料庫的理論、實踐與應用》的相關理論既來源于字料庫建設的實踐經(jīng)驗,反過來又能指導運用字書字料庫解決實際問題,真正地將“理”與“實”結合起來,推動漢字學的縱深化發(fā)展。
作為一部探索和總結字料庫基礎理論的專著,《字書字料庫的理論、實踐與應用》不但在內容上具備科學性和技術性,而且在語言的錘煉上用力尤勤,使全書內容兼具可讀性。
王寧曾說:總結基礎理論是一種不易被承認的工作……凡是總結得成功的規(guī)律都是十分平易的,不像解讀一個生僻字那樣顯得功夫深[5]。實際上,若沒有豐厚的知識儲備與實踐經(jīng)驗,是做不好基礎理論的總結工作的。
語言文字的古今巨變,賦予漢字學艱澀難通的特性,再加上計算機科學是一門專業(yè)性極強的學科,這兩門學科融合在一起所形成的理論必然難以為常人所理解,如果不在語言表達上去其艱澀、求其平易,那么字料庫漢字學的相關理論恐怕只能待在象牙塔中,離普通民眾越來越遠。故而,《字書字料庫的理論、實踐與應用》在總結漢字字料庫相關理論的同時,盡可能地將基礎的理論與方法講明白、說通透,讓字料庫漢字學放下身段,盡量貼近普通讀者,這有利于字書字料庫及字料庫漢字學的理論體系被學界普遍接受。
漢字字料庫是一個嶄新的研究領域,從產生至今不過十幾年。要想使字料庫及字料庫漢字學的相關理論經(jīng)得起時間檢驗,其每一步建設均要有理可依,要充分借鑒語料庫及語料庫語言學的成熟經(jīng)驗,避免走彎路、走錯路,但又不能完全照搬語料庫,需將語料庫的建設經(jīng)驗與文字學的理論體系相融合,才能避免語料庫的相關經(jīng)驗應用在字料庫建設時產生“水土不服”的現(xiàn)象。因此,《字書字料庫的理論、實踐與應用》中每一個觀點的提出,均有切實的例證為支撐,并嚴格遵守語料庫語言學以及文字學的重要理論成果。
《字書字料庫的理論、實踐與應用》的服務對象,主要為對字料庫基本理論及建設經(jīng)驗存在需求的文字學學者,因此對書中計算機科學的相關理論以及內容十分龐雜的論述部分均有較高的表達需求。要使內容簡單易懂,除了在語言表達上下功夫外,該書還制作了大量圖表,用來拆解那些或艱深或龐雜的文本內容,圖文結合,舉重若輕,使表達更具藝術性。此外,該書對圖表的觀賞性與設計感要求很高,在表達明晰的同時能給讀者帶來賞心悅目之感。
總體來看,在語言表達上,該書能夠采取論述平易、例論相宜、圖文結合等方式來克服文本內容的艱深龐雜,真正地做到了述而不艱,有如混成。
在那個漢字學研究被打壓為“厚古薄今”、漢在字學理論尚未與現(xiàn)代科學的理論總結方法接軌、研究材料浩如煙海卻只能依靠手工整理來獲取的年代,尚有一批前輩先生心懷守護傳統(tǒng)文化的高度責任感,奮不顧身地投入漢字學研究中。如今,漢字學理論體系逐漸科學化與系統(tǒng)化,研究方法、研究手段都獲得了長足進步,這一切都為現(xiàn)代漢字學研究奠定了堅實的基礎,搭建了前所未有的新平臺。在這個平臺上,亦不乏踏踏實實治學之人,他們以一己之力繼續(xù)深耕于漢字學的沃土之中,推動漢字學不斷向縱深化、細密化、科學化發(fā)展。柳建鈺《字書字料庫的理論、實踐與應用》一書的出版,是現(xiàn)代漢字學者持續(xù)探索并推動漢字學產生新突破的重要成果之一,符合漢字學與計算機科學深度融合的學科發(fā)展大趨勢,預示著漢字字料庫研究的光明前景和強大生命力。謹以此文表達對柳建鈺及《字書字料庫的理論、實踐與應用》的敬意,同時熱切盼望學界能有更多優(yōu)秀的學者投身到字料庫漢字學的研究當中,推動字料庫漢字學的深入良性發(fā)展。