王保碩
(杜克大學(xué) 電子與計(jì)算機(jī)工程系,美國(guó)北卡羅來納州 達(dá)勒姆,NC27708-0271)
漢字的科學(xué)化
王保碩
(杜克大學(xué) 電子與計(jì)算機(jī)工程系,美國(guó)北卡羅來納州 達(dá)勒姆,NC27708-0271)
漢字具有悠久的歷史,在漫長(zhǎng)的發(fā)展過程中,漢字與中國(guó)歷史文化產(chǎn)生了難以分割的關(guān)系,承載著豐富的民族文化信息。在全球化、信息化的時(shí)代語(yǔ)境下,漢字形體結(jié)構(gòu)復(fù)雜、同音字多、漢字?jǐn)?shù)量比較多等特點(diǎn)使得漢字教學(xué)成為漢語(yǔ)國(guó)際教育的瓶頸;同時(shí)漢字在信息處理方面存在諸多不便。當(dāng)下漢字的科學(xué)化研究能對(duì)推動(dòng)國(guó)家與民族的振興和中國(guó)傳統(tǒng)文化的現(xiàn)代化產(chǎn)生重要影響,應(yīng)得到更多的關(guān)注與支持。
漢字;科學(xué)化;中文信息處理;生物信息學(xué)
非常感謝華中師范大學(xué)讓我有這樣一個(gè)寶貴的機(jī)會(huì)來跟大家一起來討論有關(guān)我們漢字科學(xué)化的一些問題。毫無疑問,作為中華文明主要載體的漢字在整個(gè)國(guó)家中的地位非常重要。今天我來演講的身份并不是專家,而只是一個(gè)非常熱愛中華文明與中華漢字并熱忱希望能實(shí)現(xiàn)“漢字理想”的人。換一句話說,我是想把一個(gè)海外炎黃子孫的理想拿出來跟同學(xué)們討論。漢字的命運(yùn)與中華文明發(fā)展的前途由你們決定,我非常高興與你們交流也是因?yàn)槟銈儗砜梢园褲h字與中華文明發(fā)揚(yáng)光大。這是一個(gè)非常深廣的題目,在這里由于時(shí)間的關(guān)系我可能沒有辦法做很詳細(xì)的解釋,有些問題講得不夠充分也希望大家諒解。
我們首先要討論的就是語(yǔ)言的變化性,也就是說語(yǔ)言是隨時(shí)代的發(fā)展變化而不斷發(fā)展和改變的。即使在外國(guó)也是一樣,比如莎士比亞在幾百年前的語(yǔ)言讓我們今天去看、去理解,是非常困難的,也只有專家才能弄懂。我們接觸的語(yǔ)言從一年、兩年來看,沒有什么太大變化,但是幾百年后會(huì)變化很大??v觀我們的歷史,我想談的第一個(gè)話題就是反省,我們需要反省之前中國(guó)文字的改革對(duì)我們的社會(huì)做出了什么樣的改變以及貢獻(xiàn)。第一個(gè)例子就是“五四”運(yùn)動(dòng)。“五四”運(yùn)動(dòng)發(fā)生在一個(gè)動(dòng)蕩的時(shí)代,那時(shí)中國(guó)的國(guó)際地位很低。第一次世界大戰(zhàn)結(jié)束后,中國(guó)的仁人志士意識(shí)到我們的民族和國(guó)家必須要改革,即我們需要用“科學(xué)”和“民主”來重構(gòu)中華文明,其中就包括文字的改革。在這我要提到的一個(gè)人是胡適,他是美國(guó)哥倫比亞大學(xué)的博士,他受到了西方文化的熏陶,然后回來審視國(guó)內(nèi)的情況。我現(xiàn)在就希望自己能模仿胡適去做這樣的工作。當(dāng)時(shí)他領(lǐng)導(dǎo)的“白話文運(yùn)動(dòng)”是非常重要的,因?yàn)槲淖忠m用于生活,文言文太繁太難,一般老百姓受益甚少。當(dāng)時(shí),書面文字(文言文)無法記錄日常生活用語(yǔ),書面文字是那些受過特殊訓(xùn)練的人(也就是人們所說的讀書人)才能讀懂,所以白話文代替文言文的改革對(duì)當(dāng)時(shí)及后來中國(guó)的發(fā)展貢獻(xiàn)很大。在中國(guó)那樣內(nèi)外交困的時(shí)期所提倡的“白話文運(yùn)動(dòng)”,雖然當(dāng)時(shí)并沒有很多普通的中國(guó)人參加,但效果很好。第二個(gè)例子就是簡(jiǎn)體字。我個(gè)人覺得簡(jiǎn)體字優(yōu)點(diǎn)很多,因?yàn)闈h字太復(fù)雜了,其中許多為象形文字。最初漢字的形體來源于相應(yīng)事物的形象,隨著時(shí)間的推移,漢字慢慢就失去了與原有形象之間的聯(lián)系,變得復(fù)雜抽象。英文只有26個(gè)字母,是一種密碼文字,用一個(gè)密碼符號(hào)來代表一個(gè)意思。正因?yàn)橄笮挝淖钟蟹爆嶋y辨的缺點(diǎn),所以有必要進(jìn)行簡(jiǎn)化。我的基本建議就是要有1000個(gè)頂尖的專家來支持中華漢字的科學(xué)化,盡量爭(zhēng)取國(guó)家的支持,個(gè)人有錢的話應(yīng)組成一個(gè)統(tǒng)一的機(jī)構(gòu)去支持。我深深體會(huì)到,任何講中國(guó)話的地方對(duì)中文研究的投資過少。為什么一個(gè)這么重要的方面卻被忽略了?因?yàn)橐话闳送荒芰私馕淖值闹匾裕胀ɡ习傩諘?huì)認(rèn)為我漢語(yǔ)說得很好,漢字也用得不錯(cuò),日常的溝通和社交都沒有問題,為什么要改進(jìn)中文?但是他們沒有想到,通過改進(jìn),中文能變得越來越好。
語(yǔ)言是人類最主要的交流工具,漢語(yǔ)同樣也是全球華人最主要的交流工具。一直以來,對(duì)于漢語(yǔ)方言的去留,存在兩種不同的觀點(diǎn):一種認(rèn)為方言體現(xiàn)了文化的多樣性,人人有講方言的自由;另一種認(rèn)為,講方言也許對(duì)經(jīng)濟(jì)發(fā)展不利。對(duì)此我的感受是,如果我去新加坡,我就很高興,因?yàn)樾录悠轮v普通話不存在溝通上的障礙。但如果我去香港,尤其是幾十年前我去香港的時(shí)候,那就非常不方便,因?yàn)樵S多香港的中國(guó)人講的全部是廣東話,我根本聽不懂,不利于溝通和交流。我非常關(guān)注中央電視臺(tái)國(guó)際頻道的一檔節(jié)目“客家足跡行”,它是一檔全面介紹客家人遷徙歷史與生活現(xiàn)狀的大型紀(jì)實(shí)性節(jié)目。福建是客家人的主要居住地之一,我也是福建人。福建方言非常多,福建境內(nèi)不同方言區(qū)的居民之間的交流都存在障礙。我深深體會(huì)到方言給交流帶來的不便。例如,第二次世界大戰(zhàn)結(jié)束,內(nèi)戰(zhàn)烽煙再起,那時(shí)候我算是逃難,從仙游到福州,我印象很深刻。從仙游到福州,聽到的方言差不多有十幾種,走過一段路又變了一點(diǎn),完全不一樣。我當(dāng)時(shí)覺得這種狀態(tài)不是太好,因?yàn)榻y(tǒng)一就是力量,方言在語(yǔ)音上的較大差異導(dǎo)致同屬于炎黃子孫的人們彼此間難以交流。對(duì)客家人而言,客家方言就是他們團(tuán)結(jié)的一個(gè)重要載體,現(xiàn)在全球都有客家人,他們要保存他們自己的文化,方言是其中重要的部分,這本無可厚非。但是另一方面,如果我們都不愿意放棄自己的方言,那結(jié)果就是炎黃子孫之間不能很好地交流與溝通。當(dāng)然,目前中國(guó)境內(nèi)的普通話推廣工作開展得很好,在許多公共領(lǐng)域普通話替代了方言,被高頻地使用。這樣更有利于中華民族的團(tuán)結(jié)和共造中華文明之輝煌。但從文明的發(fā)展來看,一種語(yǔ)言或方言沒有被保存下來,不能不說是一個(gè)遺憾,但事情總是利弊共生。
研究漢字一定要追溯它的起源,了解其演變過程。我們認(rèn)為漢字的演變并不是非常理想的,尤其是以今天科學(xué)的觀點(diǎn)來看,應(yīng)該考慮是否能夠重新再安排或者改變。漢字有許多個(gè)偏旁部首,漢字偏旁部首的數(shù)量在幾百年間的變化并不大。之前的偏旁部首對(duì)今天來講就不是完全合適的,也就是說文字也應(yīng)與時(shí)俱進(jìn),但是問題就在這里。我們好像沒有一個(gè)專門的科學(xué)機(jī)構(gòu)組織研究人員從事漢字的研究與改進(jìn)。漢字是象形文字,世界上本來有很多象形文字,但大多都消失了。目前,我們的漢字是世界上保存象形性最完好的一種文字,是我們?nèi)A夏民族智慧的結(jié)晶。英文是一種代碼或編碼語(yǔ)言,從科學(xué)角度看,代碼或編碼是比較有效率的,但是象形文字也有其自身價(jià)值。我們知道古埃及文也是象形文字,但它最后沒有辦法生存,所以埃及人放棄象形文字而改用阿拉伯文,阿拉伯文跟英文、中文都不一樣。中華文化對(duì)東南亞國(guó)家特別是日本與韓國(guó)的影響很深。日本、韓國(guó)等國(guó)曾經(jīng)借用漢字來記錄其語(yǔ)言,19世紀(jì)這些國(guó)家先后出現(xiàn)要廢止?jié)h字使用的文字改革思潮,后來日本和韓國(guó)用表音體系文字逐漸替代了表意體系的文字,實(shí)現(xiàn)了文字改革的目標(biāo),文字的使用效率得到較大提高。
另外,漢字中同音但是不同義的字太多了。跟我一起進(jìn)行漢字科學(xué)化研究的是河北師范大學(xué)的孫兆豪教授,目前他在澳洲教書,在這個(gè)問題上他跟我有很多相同的看法。同音不同義的好處之一就是幽默,同音詞除了在不同語(yǔ)境中產(chǎn)生很多笑話外,沒有更多的好處。例如“yú”這個(gè)音節(jié)可以對(duì)應(yīng)很多個(gè)不同的漢字,在不用語(yǔ)境中使用時(shí),要用到不同的漢字,這樣無形中就增加了人的記憶負(fù)擔(dān)。
語(yǔ)言跟基因有非常密切的關(guān)系。現(xiàn)在科學(xué)非常先進(jìn),生物信息學(xué)非常熱門,表面上看起來生物信息跟中文沒什么關(guān)系,但中文的研究到最后就要涉及到生物信息學(xué)。假如有個(gè)基因,如“FOHP2”有問題,那將來就會(huì)影響小孩的語(yǔ)言能力。在腦神經(jīng)里面,人的記憶分為兩種,一種是長(zhǎng)期記憶,一種是短期記憶。比如說,“我今天非常高興”這個(gè)信息,字在一個(gè)地方,把字拼在一起,記憶在腦子里面又是在另一個(gè)地方。換句話說,這些字的信息都要從不同的地方來,并組織在一起,然后才能夠被完全理解。那么,為什么可以教胎兒學(xué)語(yǔ)言?因?yàn)樘涸趮寢尪亲永锩嫣焯炻爧寢尩穆曇艟鸵呀?jīng)開始在學(xué)語(yǔ)言了,聽著媽媽的話,自然而然,胎兒腦子里不同部分的神經(jīng)就會(huì)開始構(gòu)造文法,所以這是天生就有的語(yǔ)言能力。大家都知道,越年輕學(xué)語(yǔ)言越容易。為什么?因?yàn)槿四X是中性的,像一張白紙,越早學(xué)就越容易學(xué)會(huì),就像著名的心理學(xué)家巴普洛夫所做的“狗鈴實(shí)驗(yàn)”。其實(shí),嬰兒學(xué)習(xí)語(yǔ)言,在很小的時(shí)候就開始了,隨著年齡的增長(zhǎng),腦部構(gòu)造逐漸定型,學(xué)習(xí)語(yǔ)言就自然非常困難了,可見研究語(yǔ)言必須要研究生物信息學(xué)。
語(yǔ)言和文字都應(yīng)該隨著社會(huì)和時(shí)代的發(fā)展而改變。語(yǔ)言本質(zhì)上是一套符號(hào)系統(tǒng),研究語(yǔ)言的符號(hào)性非常重要。我的主要研究領(lǐng)域是人工智能和機(jī)器人學(xué)。我們花了半個(gè)多世紀(jì)的時(shí)間來研究人工智能,在這個(gè)領(lǐng)域最關(guān)鍵的環(huán)節(jié)就是自然語(yǔ)音的問題。我們并不要求機(jī)器人有感情,懂得喜怒哀樂,這肯定不太容易。但是如果希望機(jī)器人在某種程度上與人更加接近,其中最重要的問題是自然語(yǔ)言的問題。
自然語(yǔ)言的組成部分特別復(fù)雜,其一是句法,其二是語(yǔ)義。比如,一個(gè)漢字可以有幾個(gè)不同的意義,假如有7個(gè)字,每個(gè)字有5個(gè)意義的話,那不同的字?jǐn)?shù)、意義再加上不同的排列,所形成的意思就太多了,電腦沒有辦法那么聰明,去理解這許多不同的意義。因?yàn)殡娔X實(shí)際上是一個(gè)非常愚蠢的機(jī)器,很笨,但它的力量在哪里?它的速度非常快,而且電腦善于交互。語(yǔ)言本身就是非常有力的,所以外國(guó)人叫它雙刃劍,一方面是優(yōu)點(diǎn),另一方面是缺點(diǎn)。因?yàn)槿说闹腔壑械囊粋€(gè)重要的方面就是集中注意力。比如,外界的信息非常多,但是如果要注意樹上一只鳥,那就需要集中注意力,這是人腦的第一個(gè)優(yōu)勢(shì)。人腦的第二個(gè)優(yōu)勢(shì)就是組合,能將小的語(yǔ)言單位進(jìn)行不同的排列組合形成大的語(yǔ)言單位,來表達(dá)豐富的含義。所以,自然語(yǔ)言本身是很有力量的。自然語(yǔ)言的優(yōu)點(diǎn)在人工智能領(lǐng)域中就變成了缺點(diǎn),要想實(shí)現(xiàn)自然語(yǔ)言的識(shí)別,需要對(duì)語(yǔ)言結(jié)構(gòu)本身進(jìn)行很多深入的研究。
最后,我想談?wù)務(wù)Z言的推廣問題。如果想要有更多的外國(guó)人能夠?qū)W會(huì)并使用漢字,最好的辦法就是改進(jìn)漢字,使?jié)h字學(xué)起來非常容易。對(duì)外國(guó)人來講,現(xiàn)在學(xué)漢字并不是一件很容易的事情。因此成立一個(gè)專門的組織,研究怎樣讓學(xué)習(xí)漢字變得容易,這件事情非常重要。
我們的這個(gè)學(xué)術(shù)期刊:《新數(shù)學(xué)與自然計(jì)算》(New Mathematics and Natural Computation)就是我們的努力,希望它能在漢字科學(xué)化方面成為我們的橋梁,希望同學(xué)們能夠支持,也希望更多的其他學(xué)校的有志于漢字科學(xué)化研究的同學(xué)能夠支持我們。我們的網(wǎng)站需要同學(xué)們來幫忙做中文方面的翻譯,因?yàn)楝F(xiàn)在的網(wǎng)站在杜克大學(xué),全部是純英文的,志愿者們也沒有拿任何報(bào)酬,只是認(rèn)為中文很重要,愿意做種種犧牲。如果能夠翻譯成中文,就會(huì)有更多的人知道中文科學(xué)化的重要性與緊迫性。這個(gè)期刊的發(fā)行是由新加坡的一家出版社來承擔(dān)的,本來我以前的合作伙伴大都是荷蘭、美國(guó)的出版社,這個(gè)工作我之所以特別找了新加坡的出版社,就是因?yàn)樾录悠聦?duì)中文及中華文化的研究十分支持。我們的期刊已經(jīng)出版8年了,非常不容易,因?yàn)槌霭嫔缫恢痹谔澅局С?,所以我們希望盡量能夠發(fā)展下去。
我和孫兆豪教授已經(jīng)合作寫了一本書,目前還沒有確定下來由哪一個(gè)出版社出版我們的專著。專著研究的主要方向是中國(guó)文字的科學(xué)化、中國(guó)語(yǔ)言的科學(xué)化和中國(guó)文化的科學(xué)化。就是我今天所講的,生物信息學(xué)、符號(hào)學(xué)都與中文科學(xué)化有關(guān)。主要目的就是要使外國(guó)人學(xué)中文變得容易,從而使中華文明發(fā)揚(yáng)光大。我和孫教授的專著目前已寫了差不多200頁(yè),還在修改加工。希望同學(xué)們能夠給我們的網(wǎng)站多提意見及建議,也可以對(duì)相關(guān)的問題進(jìn)行討論,我們也會(huì)把所有具有建設(shè)性的觀點(diǎn)收集在一起進(jìn)行進(jìn)一步的研究。漢字的科學(xué)化不僅僅是語(yǔ)言的問題,其對(duì)互聯(lián)網(wǎng)、中國(guó)文化以及中國(guó)的國(guó)際地位和影響力,都有非常重要的意義。
(本文根據(jù)本人2013年11月5日在華中師范大學(xué)的演講整理而成。衷心感謝孫兆豪教授的建議及其夫人霍艷霞博士在文字上的修改,感謝姚雙云教授和周璐女士的鼎力協(xié)助。沒有他們的無私幫助,我的演講整理成文章的工作將無法實(shí)現(xiàn))
(責(zé)任編輯:劉英玲)
H125
A
1674-9014(2015)01-0080-03
2014-07-28
王保碩,男,福建仙游人,美國(guó)杜克大學(xué)電子與計(jì)算機(jī)工程系教授,研究方向?yàn)橛?jì)算語(yǔ)言學(xué)。