科技與人文似乎是人類智力活動(dòng)的兩個(gè)極端,但電子信息技術(shù)的發(fā)展,已經(jīng)出現(xiàn)了所謂“數(shù)碼化人文研究”(digital humanities)這一新名詞和新領(lǐng)域。早在計(jì)算機(jī)和數(shù)碼技術(shù)出現(xiàn)之前,語(yǔ)言學(xué)和人文研究就已經(jīng)開(kāi)始使用數(shù)據(jù)統(tǒng)計(jì)的方法。這種方法一個(gè)基本的應(yīng)用就是書(shū)籍的引得,index,現(xiàn)在一般譯為索引。西方出版的學(xué)術(shù)著作往往有詳略程度不等的參考書(shū)目和索引,對(duì)學(xué)術(shù)研究很有幫助。1930年哈佛燕京學(xué)社成立引得編纂處,以洪業(yè)主持其事,從二十世紀(jì)三十年代開(kāi)始,前后出版了六十多種引得,對(duì)于海外的漢學(xué)研究起了很大作用,對(duì)中國(guó)學(xué)者研究自己的古籍也非常有用。誠(chéng)如陳毓賢女士在其所著《洪業(yè)傳》里所說(shuō),“這些引得在中國(guó)研究古籍的學(xué)術(shù)上創(chuàng)立了新紀(jì)元”〔1〕。在傳統(tǒng)學(xué)術(shù)研究中,雖然博聞強(qiáng)記非常重要,卻沒(méi)有以具體字句的統(tǒng)計(jì)為基礎(chǔ)的科學(xué)方法,而由西方引進(jìn)的索引,就開(kāi)創(chuàng)了一種全新的研究方法和研究工具,使學(xué)術(shù)研究得以離開(kāi)印象式的評(píng)論而具有更扎實(shí)的文本基礎(chǔ)。到電子數(shù)碼技術(shù)出現(xiàn)之后,很快就有了更精確而且大型的引得如Shakespeare Concordance之類的參考書(shū)。香港中文大學(xué)中國(guó)古籍研究中心出版的先秦兩漢古籍逐字索引和魏晉南北朝古籍逐字索引,在中國(guó)古代典籍索引方面,也是非常重要的參考書(shū)。這些引得或索引對(duì)于檢索某個(gè)字句的來(lái)源出處非常方便,也可以幫助我們了解各個(gè)詞匯在不同時(shí)代、不同典籍里相關(guān)但有時(shí)不盡相同的用法。
數(shù)據(jù)統(tǒng)計(jì)方法的另一個(gè)應(yīng)用就是語(yǔ)言詞匯出現(xiàn)頻率的統(tǒng)計(jì)。美國(guó)教育心理學(xué)家桑戴克(Edward L. Thorndike, 1874—1949)以詞匯出現(xiàn)頻率編制最常用詞匯表,語(yǔ)言學(xué)家高名凱先生就依據(jù)桑戴克的理論,編過(guò)一部《英語(yǔ)常用詞匯》,1961年由北京商務(wù)印書(shū)館出版。學(xué)習(xí)一種語(yǔ)言,掌握常用詞匯相當(dāng)重要,而常用詞的定義就是以詞匯使用頻率為科學(xué)的依據(jù)。詞匯頻率和索引結(jié)合起來(lái),往往可以產(chǎn)生在具體材料上有確切依據(jù)的觀點(diǎn)和看法,對(duì)于學(xué)術(shù)研究產(chǎn)生很大影響。具體就文學(xué)研究而言,一個(gè)作家或詩(shī)人使用詞匯的頻率,往往可以告訴我們這位作家或詩(shī)人文體風(fēng)格的特點(diǎn),并且由此引導(dǎo)我們窺見(jiàn)其思想情感的隱秘,在文學(xué)批評(píng)和研究方面有很大幫助。錢鐘書(shū)先生在《談藝錄》里就曾用數(shù)節(jié)文字來(lái)討論唐代詩(shī)人李賀詩(shī)中用字,他雖然沒(méi)有嚴(yán)格統(tǒng)計(jì)用字的頻率,但依據(jù)長(zhǎng)吉詩(shī)中用字多少來(lái)立論,其實(shí)和計(jì)算詞匯頻率是同一個(gè)道理。錢鐘書(shū)說(shuō)法國(guó)詩(shī)人“戈蒂埃(Gautier)作詩(shī)文,好鏤金刻玉。其談藝篇(L’Art)亦謂詩(shī)如寶石精镠,堅(jiān)不受刃(le bloc résistant)乃佳,故當(dāng)時(shí)人有至寶丹之譏(le matérialisme du style)?!?近人論赫貝爾(F. Hebbel)之歌詞、愛(ài)倫坡(E. A. Poe)之文、波德萊爾(Baudelaire)之詩(shī),各謂三子好取金石硬性物作比喻。…… 竊以為求之吾國(guó)古作者,則長(zhǎng)吉或其倫乎”。接下去他引了李賀詩(shī)中許多例證:“如《李憑箜篌引》之‘昆山玉碎鳳凰叫’,‘石破天驚逗秋雨’;《殘絲曲》之‘縹粉壺中沉琥珀’;《夢(mèng)天》之‘玉輪軋露濕團(tuán)光’;《唐兒歌》之‘頭玉磽磽眉刷翠’;《南園》之‘曉月當(dāng)簾掛玉弓’;《十二月樂(lè)詞》之‘香汗沾寶粟,夜天如玉砌’;《秦王飲酒》之‘羲和敲日玻璃聲’;《馬詩(shī)》之‘向前敲瘦骨,猶自帶銅聲’;《勉愛(ài)行》之‘荒溝古水光如刀’;《春歸昌谷》之‘誰(shuí)揭赪玉盤(pán),東方發(fā)紅照’;《江南弄》之‘酒中倒臥南山綠,江上團(tuán)團(tuán)貼寒玉’;《北中寒》之‘山濕無(wú)聲玉虹寒’;《溪晚涼》之‘玉煙青濕白如幢’;《將進(jìn)酒》之‘琥珀濃,小槽酒滴珍珠紅’等等”。后面錢鐘書(shū)還說(shuō),李賀詩(shī)里常用“凝”字,“至其用‘骨’字、‘死’字、‘寒’字、‘冷’字句,多不勝舉,而作用適與‘凝’字相通”〔2〕。再后面他又說(shuō)李賀詩(shī)中“好用青白紫紅等顏色字”,那是一般讀者都容易注意到的現(xiàn)象,錢鐘書(shū)則認(rèn)為“尚是描畫(huà)皮毛,非命脈所在也”〔3〕。可見(jiàn)通過(guò)李賀詩(shī)中常用的金、石、玉、琥珀等字,可以概括出他的作品語(yǔ)言給讀者一種冷峻、剛硬的感覺(jué),其中有許多詩(shī)句想象奇巧疊出,如《秦王飲酒》之“羲和敲日玻璃聲”,《馬詩(shī)》之“向前敲瘦骨,猶自帶銅聲”,用“敲”字帶出玻璃和金屬的聲音,給人裂冰碎玉那種硬而脆的感覺(jué),就造成李賀詩(shī)特有風(fēng)格的印象,使我們意識(shí)到李賀的確像戈蒂埃等歐美詩(shī)人一樣,“好取金石硬性物作比喻”,在風(fēng)格上可以相比。這一概括以具體詞語(yǔ)的使用頻率為基礎(chǔ),就很有說(shuō)服力。如果我們現(xiàn)在用電子信息技術(shù)對(duì)李賀的文本做一個(gè)詞匯頻率統(tǒng)計(jì),就更能夠證明這一點(diǎn)。
在西方文學(xué)研究中,卡洛淋·斯佩琴(Caroline Spurgeon)在1935年發(fā)表了《莎士比亞的意象及其意義》(Shakespeare’s Imagery and What It Tells Us)一書(shū),就是以統(tǒng)計(jì)的方法來(lái)研究莎士比亞的文體風(fēng)格,并由此探討作家的思想。這在當(dāng)時(shí)的文學(xué)研究中很有新意,曾引起一陣轟動(dòng),而且這本書(shū)歷年來(lái)一直重印再版。雖然斯佩琴主要研究《坎特伯雷故事集》(Canterbury Tales)的作者喬叟(Geoffrey Chaucer, 1343—1400),她現(xiàn)在還被人記得的卻是這部研究莎士比亞意象的書(shū),在六十多年之后,劍橋大學(xué)出版社于1993年還重印了此書(shū)。這本書(shū)除了一般學(xué)術(shù)著作的文字?jǐn)⑹鲋?,在?shū)后有六個(gè)圖表,把莎士比亞作品中一些重要意象使用頻率用圖表標(biāo)示出來(lái),還把他同時(shí)代幾位作家使用的意象繪成圖表,以比較他們的異同。斯佩琴認(rèn)為,有時(shí)候一個(gè)突出的意象貫穿莎劇整部作品,例如《李爾王》全劇都給人掙扎、痛苦,甚至一種肉體的、肌膚煎熬之痛的感覺(jué),而這一感覺(jué)就來(lái)自劇中不斷使用身體受苦的動(dòng)詞和相關(guān)意象?!爸灰蜷_(kāi)這個(gè)劇本任何一頁(yè),都很難不被這些意象和動(dòng)詞所震撼,因?yàn)槊恳环N身體的動(dòng)作,往往是痛苦的身體動(dòng)作,都用來(lái)表現(xiàn)不止于實(shí)際上肉體的疼痛,而且也表現(xiàn)精神和抽象的痛苦”〔4〕。許多人讀《李爾王》等莎士比亞作品,都會(huì)形成一定的印象,但這種印象是籠統(tǒng)而不明確的,斯佩琴用統(tǒng)計(jì)方法把這些印象落實(shí)到具體的意象和詞匯,就使印象式批評(píng)有了具體文本的依據(jù),造成一種類似科學(xué)式的批評(píng),在文學(xué)研究中獨(dú)辟蹊徑,很有影響。雖然后來(lái)的研究者們大都沒(méi)有嚴(yán)格計(jì)算意象頻率,但注重意象成為文學(xué)研究中一個(gè)十分重要的方法。這就是說(shuō),對(duì)具體詞匯和意象的把握是討論文學(xué)作品一個(gè)非常重要的方面,而在這方面,現(xiàn)代飛速發(fā)展的信息科技就可以為文學(xué)研究提供更多更便利的研究工具。
十年前電子版《四庫(kù)全書(shū)》的出版,可以說(shuō)是數(shù)碼化技術(shù)一個(gè)新的里程碑。這項(xiàng)大工程把文淵閣四庫(kù)全書(shū)全部數(shù)碼化,使之成為可以搜索的電子文本。美國(guó)加州大學(xué)圣塔芭芭拉分校艾朗諾教授曾撰文詳細(xì)談?wù)撍褂秒娮影妗端膸?kù)全書(shū)》的經(jīng)驗(yàn),認(rèn)為“就其極大規(guī)模和多種用途而言,這電子版《四庫(kù)全書(shū)》勢(shì)必在我們古代中國(guó)研究這一人文領(lǐng)域的研究方法上,留下它的印跡”〔5〕。首先是其規(guī)模,其次是其搜尋速度,兩者加在一起,就可以在過(guò)去不可能想象的速度和范圍內(nèi),搜尋具體的詞句和意象,而且可以根據(jù)搜索的結(jié)果,看出某個(gè)主題或關(guān)鍵詞在各種書(shū)籍里出現(xiàn)的頻率。艾朗諾教授是研究宋代文學(xué)的知名學(xué)者,他舉例說(shuō)明在他的研究中,電子版《四庫(kù)全書(shū)》如何給他提供許多幫助。例如他通過(guò)查詢電子版《四庫(kù)全書(shū)》,對(duì)瓷器在宋詩(shī)中出現(xiàn)的情形就得出了可靠而出乎意料的結(jié)論。雖然宋瓷非常雅致精美,在宋人生活中應(yīng)該是日常所用所見(jiàn),也應(yīng)該是宋代文人所把玩的,可是通過(guò)查詢電子版《四庫(kù)全書(shū)》,艾朗諾很快發(fā)現(xiàn)宋詩(shī)里很少寫(xiě)到瓷器,只是偶爾提到茶碗。他說(shuō)﹕“沒(méi)有電子查詢,我絕不可能察覺(jué)到瓷器在宋詩(shī)里這出乎意料的分布情形,即有時(shí)候提到,卻并沒(méi)有特別注意。同樣重要的是,沒(méi)有電子數(shù)據(jù)庫(kù)的依據(jù),就須花費(fèi)數(shù)月甚至數(shù)年時(shí)間的閱讀,才可能對(duì)自己作出的結(jié)論產(chǎn)生信心,而有電子搜尋技術(shù)的幫助,就很快可以做到這一點(diǎn)。有了電子版《四庫(kù)全書(shū)》的幫助,我們就可以減少我們結(jié)論當(dāng)中憑印象得來(lái)的方面,而更接近在統(tǒng)計(jì)上有依據(jù)的、可以客觀驗(yàn)證的結(jié)果?!薄?〕對(duì)于人文學(xué)者說(shuō)來(lái),電子信息技術(shù)的應(yīng)用使人文研究在某些方面減少了隨意性質(zhì),而似乎更近于科學(xué),這是人文學(xué)者非常重視的一點(diǎn)。
不過(guò)艾朗諾教授也指出一些在使用電子版《四庫(kù)全書(shū)》當(dāng)中發(fā)現(xiàn)的問(wèn)題,最主要是搜索范圍的問(wèn)題。以關(guān)鍵詞為單位得出的結(jié)果往往太多,無(wú)法對(duì)一個(gè)具體詞語(yǔ)出現(xiàn)的環(huán)境做進(jìn)一步限定,于是出現(xiàn)成百上千太多的“匹配”而變得沒(méi)有什么用處〔7〕。對(duì)于文學(xué)研究或廣義的人文研究而言,確定語(yǔ)言詞匯的意義在研究中具有核心作用,而詞匯的意義在任何一個(gè)文本(text)中,都取決于上下文的語(yǔ)境(context),于是語(yǔ)境非常重要,而語(yǔ)境總是具體的,對(duì)意義的確定具有限定作用。電子文本的好處是可以快速搜索任何詞語(yǔ),但怎樣使搜索范圍接近具體的、對(duì)一個(gè)具體詞語(yǔ)的意義有限定作用的語(yǔ)境和范圍,則是現(xiàn)在仍然有待解決的問(wèn)題。就以編制書(shū)籍索引為例,簡(jiǎn)單的索引只列出書(shū)中提到的人名或其它關(guān)鍵詞語(yǔ),那種索引大概比較容易用計(jì)算機(jī)完成,但那種索引對(duì)讀者并沒(méi)有很大幫助。更詳盡的多層次索引才更有幫助,但那就涉及對(duì)關(guān)鍵詞語(yǔ)及其相互關(guān)聯(lián)的判斷,是作者本人最能夠知道和制作的,用機(jī)械的方法就很難做這樣的索引。
與此相關(guān)的機(jī)器翻譯問(wèn)題,也可以說(shuō)明這一點(diǎn)。到目前為止,機(jī)器翻譯較能應(yīng)付的是比較簡(jiǎn)單、程序化的語(yǔ)句,而比較復(fù)雜的文本,尤其是文學(xué)作品,就不可能用機(jī)器來(lái)翻譯。我想這其中原因,就是讀者可以以自己的語(yǔ)言能力、閱讀經(jīng)驗(yàn)和文學(xué)常識(shí)為基礎(chǔ),判斷在一個(gè)上下文的具體語(yǔ)境里,一個(gè)詞語(yǔ)和意象具有什么意義,應(yīng)該如何理解。這當(dāng)中很難歸納出一條普遍適用的規(guī)律,也就很難設(shè)計(jì)出可以機(jī)械操作的程序,再轉(zhuǎn)換成計(jì)算機(jī)的語(yǔ)言。文學(xué)語(yǔ)言往往不是只有一種理解,一種解釋,尤其是詩(shī)的語(yǔ)言,往往利用意義的含蓄多義,造成多種理解的可能,那正是文學(xué)豐富意蘊(yùn)之所在。從這個(gè)意義上說(shuō),文學(xué)和科學(xué)之間,大概總存在一種緊張的關(guān)系。作為使用工具的動(dòng)物,可以說(shuō)人從一開(kāi)始就在制造各種器具來(lái)代替人工,尤其在近代大工業(yè)機(jī)械化生產(chǎn)出現(xiàn)以來(lái),機(jī)器的作用越來(lái)越大,從工業(yè)、農(nóng)業(yè)、軍事、建筑、旅行、通訊直到我們的日常生活,機(jī)器取代人工都成為普遍趨勢(shì)。尤其進(jìn)入二十一世紀(jì)以來(lái),電子技術(shù)的發(fā)展和所謂數(shù)碼革命,使機(jī)器取代人本身已經(jīng)在人們的想象中以各種形式呈現(xiàn)。恰恰在文學(xué)的領(lǐng)域,各種科幻小說(shuō)已經(jīng)想象cyborg的出現(xiàn),打破了人和機(jī)械的界限,幻想各種比人更有智慧、更強(qiáng)壯、有更高文明程度的機(jī)器人。這種幻想與現(xiàn)實(shí)之間的關(guān)系,也隨著技術(shù)的發(fā)展而縮小。
然而一般說(shuō)72805f1d2a17ccc41448fca7fb933bf2a71f634fa786f930d579e8a653701fa6來(lái),人文學(xué)者對(duì)機(jī)器(包括現(xiàn)在越來(lái)越發(fā)展的計(jì)算機(jī)和數(shù)碼技術(shù))能夠達(dá)到甚至超越人腦的綜合分析能力,總是抱著懷疑態(tài)度。在人的身體活動(dòng)能力方面,機(jī)器的確往往可以代替人,而且比人更迅速有效。人沒(méi)有虎豹的獠牙利爪,卻可以制造武器比任何動(dòng)物都更具殺傷力;人沒(méi)有鷂鷹的羽翼,卻可以制造飛機(jī)比任何禽鳥(niǎo)飛得更高更快,環(huán)球旅行。我們?nèi)粘I钪杏懈鞣N機(jī)器幫助我們做各種事情,那往往是靠人的體力很難、甚至根本無(wú)法完成的任務(wù)。然而在人的智力和思想方面,在想象和審美經(jīng)驗(yàn)方面,我們卻總相信人是不可以取代的。因此,一個(gè)人文學(xué)者希望于科學(xué)技術(shù)的是研究工具和研究方法的更加豐富完善,但不是取代人的腦力勞動(dòng),也不可能取代人的現(xiàn)實(shí)感和想象。有人認(rèn)為有了計(jì)算機(jī),有了數(shù)據(jù)庫(kù),過(guò)去強(qiáng)調(diào)那種博聞強(qiáng)記已經(jīng)毫無(wú)意義,這還是言之過(guò)早,而且是言過(guò)其實(shí)。尤其就人文研究而言,記憶不是機(jī)械的,而是在思考問(wèn)題時(shí)可以產(chǎn)生聯(lián)想、見(jiàn)出事物之間聯(lián)系的基礎(chǔ),而計(jì)算機(jī)和機(jī)器不可能輕易取代。至于計(jì)算機(jī)信息技術(shù)究竟能為我們提供什么,則有待科技專家們?yōu)槿宋膶W(xué)者展示我們還遠(yuǎn)遠(yuǎn)不知道、不了解的科學(xué)的奇觀。
注釋:
〔1〕陳毓賢,《洪業(yè)傳》,臺(tái)北:聯(lián)經(jīng)1992年版,第171頁(yè)。
〔2〕〔3〕錢鐘書(shū):《談藝錄(補(bǔ)訂本)》,中華書(shū)局1984年版,第48—49、51頁(yè)。
〔4〕Caroline Spurg