李露 張婷
2013年11月,一張阿里星計(jì)劃的 HR面試結(jié)果截圖在網(wǎng)絡(luò)上瘋傳,引起許多大學(xué)生的驚嘆。雖然主人公低調(diào)回應(yīng),截圖上的信息部分并不準(zhǔn)確,不希望被大肆宣傳,但仍擋不住眾多大學(xué)生對(duì)于主人公——郭家寶的IT水平的驚嘆。然而這一位IT大牛,不僅在編程領(lǐng)域成績(jī)斐然,他對(duì)和計(jì)算機(jī)編程似乎毫無(wú)聯(lián)系的漢語(yǔ)音韻、字形字體也有相當(dāng)專(zhuān)業(yè)的研究。帶著對(duì)語(yǔ)言學(xué)深沉的熱愛(ài)和希望將其發(fā)揚(yáng)光大的信念,他借助了自己高超的編程技術(shù),用代碼實(shí)現(xiàn)理想,用程序傳播信念。
當(dāng)編程大牛愛(ài)上古典音韻
韻典網(wǎng)是郭家寶大學(xué)時(shí)期開(kāi)發(fā)的音韻查詢系統(tǒng),這款匯集了《廣韻》《中原音韻》《洪武正韻》《分韻撮要》和《上古音系》的查詢系統(tǒng),為很多語(yǔ)音學(xué)研究者、愛(ài)好者提供了極大的便利。使用其中的“高級(jí)檢索系統(tǒng)”,你輸入任一字詞后,能迅速獲得從以上不同詞典的網(wǎng)絡(luò)版摘取下的讀音、簡(jiǎn)單解釋、范例等信息。這個(gè)查詢網(wǎng)站設(shè)計(jì)得大方、簡(jiǎn)潔,查詢得到的信息清楚、全面,搜索過(guò)程更是高速便捷。創(chuàng)建韻典網(wǎng)的背后是郭家寶多年積累的語(yǔ)音知識(shí)和搜索技術(shù)的完美結(jié)合。
郭家寶從小就有一大愛(ài)好——看字典。高中時(shí)他在書(shū)店第一次看到王力編纂的《漢語(yǔ)史稿》,便挪不開(kāi)腳步了,從此一頭扎進(jìn)古漢語(yǔ)學(xué)研究的汪洋大海。別人看《新白娘子傳奇》看的是許仙與白蛇的愛(ài)情,郭家寶則專(zhuān)注于臺(tái)灣演員對(duì)臺(tái)詞的吐字發(fā)音上。比如,第38集中,許嬌娘道:“你娘我懷胎十月哺(pu)乳三年,千辛萬(wàn)苦風(fēng)里來(lái)云里去,辛辛苦苦養(yǎng)下你這個(gè)不孝的畜生。早知道你這樣子,我就不要生下你了?!边@個(gè)“哺”字就屬于異音字。在臺(tái)灣念“pu”,在大陸發(fā)音為“bu”,被郭家寶歸為“異音集”。在這劇中郭家寶發(fā)現(xiàn)了數(shù)千個(gè)與自己所學(xué)發(fā)音不同的字詞,查閱資料后,從50集連續(xù)劇中,他整理出189個(gè)字“異音字”和“錯(cuò)音字”,并把整理結(jié)果列在了博客中。
大一起,郭家寶選修了賴(lài)靜如老師語(yǔ)言學(xué)的課程,他開(kāi)始系統(tǒng)地接觸語(yǔ)言學(xué)研究的學(xué)術(shù)方法。在其他課上,郭家寶看見(jiàn)老師用著一個(gè)笨拙的輸入工具,效率極其低下,他問(wèn)老師為什么不學(xué)習(xí)一下國(guó)際音標(biāo)輸入法?可以又快又準(zhǔn)地錄入。老師說(shuō)太麻煩了,不想學(xué),而且安裝輸入法很麻煩,換一臺(tái)電腦就要重裝,還需要管理員授權(quán)。于是,郭家寶編制了一個(gè)更簡(jiǎn)易的國(guó)際音標(biāo)輸入工具。
郭家寶學(xué)習(xí)了很多語(yǔ)言學(xué)家、歷史學(xué)家在音韻方面的理論,比如王力、高本漢、鄭張尚芳、紹榮范。光學(xué)理論還不解渴,郭家寶想實(shí)際接觸活著的、更實(shí)際的例證。
郭家寶在假期跟隨清華大學(xué)中國(guó)語(yǔ)言文學(xué)系的趙麗明老師,參加了川滇少數(shù)民族語(yǔ)言考察項(xiàng)目。他負(fù)責(zé)將查訪到的少數(shù)民族(比如普米族和一些藏族支系)的語(yǔ)言記錄、整理出來(lái)。郭家寶很興奮,“原來(lái)世界上還有這么多稀奇的語(yǔ)音!原來(lái)我所學(xué)的那些發(fā)音是真的、實(shí)實(shí)在在存在的!”隨即一聲嘆息,“只可惜,不少部族的語(yǔ)言只有部落里幾百個(gè)老人會(huì),比如‘月亮,他們的發(fā)音是‘ximi,這種發(fā)音方式是氣流從舌頭兩邊經(jīng)過(guò)??傻人麄冞^(guò)世以后,這樣的語(yǔ)言也許就滅絕了。”深入少數(shù)民族腹地,他慢慢縷出自己對(duì)古漢語(yǔ)的看法。郭家寶認(rèn)同一萬(wàn)年前漢語(yǔ)藏語(yǔ)是同源的,漢語(yǔ)表意,音不斷變化;藏語(yǔ)表音,從藏語(yǔ)或藏族支系發(fā)音或可推測(cè)古漢語(yǔ)語(yǔ)音。再根據(jù)分子人類(lèi)學(xué)、考古學(xué)中DNA比對(duì)結(jié)果、人類(lèi)遷徙歷史等等,郭家寶認(rèn)為川滇等現(xiàn)今閉塞地區(qū)的古老語(yǔ)言實(shí)在是珍貴的語(yǔ)言學(xué)研究的活化石。
除了自己研究古漢語(yǔ),郭家寶也樂(lè)于跟一群志同道合的師友討論。他希望他們的研究能夠部分復(fù)原古漢語(yǔ),明白古代人如何說(shuō)話,明白李白怎么讀詩(shī),明白唐詩(shī)為何有絕句、律詩(shī)等規(guī)則。郭家寶發(fā)現(xiàn)曹操曹植父子在押韻方面相差極大,他打趣道:“曹操就是上古漢語(yǔ)末端的代表,曹植便是中古漢語(yǔ)開(kāi)端的代表吧?!鄙瞎艥h語(yǔ)沒(méi)有去聲,音韻區(qū)分依靠于類(lèi)似于現(xiàn)今歐洲語(yǔ)言韻尾的變化。比如“俄”與“餓”這兩個(gè)字,在上古漢語(yǔ)中,后者比前者多一個(gè)類(lèi)似于輕輔音s的韻尾。而加入了平仄四聲的中古漢語(yǔ),使得人們讀出的詩(shī)句有抑揚(yáng)頓挫的效果,十分好聽(tīng)。
郭家寶對(duì)于古代至現(xiàn)代漢語(yǔ)音韻的探索,一部分出于從小以來(lái)內(nèi)心的熱愛(ài),另一部分則源于傳承、推崇中國(guó)古漢語(yǔ)文化的使命感。他清楚,開(kāi)發(fā)“韻典網(wǎng)”、利用大量課余時(shí)間一個(gè)假期一個(gè)假期地?fù)湓阢@研古漢語(yǔ)上,并不能如在IT巨頭里的實(shí)習(xí)那樣,給他帶來(lái)相應(yīng)的經(jīng)濟(jì)回報(bào),但他就是深深地沉浸在中國(guó)傳統(tǒng)音韻文化的世界中,尋得一方天地。他在自得其樂(lè)的同時(shí),不僅給中國(guó)漢語(yǔ)音韻學(xué)的愛(ài)好者、研究者的工作帶來(lái)極大的便利,也感染著身邊的人。在他的博客關(guān)于漢語(yǔ)學(xué)的互動(dòng)中,大家討論得很熱鬧,一位來(lái)自臺(tái)灣的研究者還邀請(qǐng)郭家寶一起進(jìn)行專(zhuān)業(yè)性漢語(yǔ)研究。
OpenCC——漢字的簡(jiǎn)繁轉(zhuǎn)換系統(tǒng)
郭家寶在漢字的簡(jiǎn)體繁體轉(zhuǎn)換方式方面,也有令人驚喜的成果。OpenCC(Open Chinese Convert)堪稱(chēng)國(guó)內(nèi)第一個(gè)開(kāi)源的漢語(yǔ)詞匯簡(jiǎn)繁轉(zhuǎn)換系統(tǒng),可以兼容Windows、Linux、Mac等多種操作系統(tǒng)平臺(tái)。因其開(kāi)源的特性,OpenCC這一簡(jiǎn)繁轉(zhuǎn)換系統(tǒng)在大量的網(wǎng)站、輸入法和應(yīng)用程序中被廣泛使用,例如知乎上的文藝輸入法RIME、微信上的豆瓣機(jī)器人、新浪網(wǎng)國(guó)際版的繁體字系統(tǒng)等等。
詞源充實(shí)、信息豐富、功能完善的OpenCC背后,是郭家寶整理出的20萬(wàn)簡(jiǎn)繁詞匯對(duì)應(yīng)表。這方面工作的難點(diǎn)在于,有深厚繁體字功底的語(yǔ)言學(xué)研究者,不會(huì)用編程手段將自己的研究程序化,而擅長(zhǎng)編程的IT精英對(duì)漢字簡(jiǎn)繁體系知之甚少。
開(kāi)發(fā)、維護(hù)OpenCC很困難,繁體漢語(yǔ)十分復(fù)雜,語(yǔ)言學(xué)的專(zhuān)業(yè)性極強(qiáng),需要郭家寶小心翼翼求證。讓他遺憾的是,因?yàn)闀r(shí)間有限,他沒(méi)有更多的精力用于更加深入、全面地學(xué)習(xí)和探究博大精深的祖國(guó)語(yǔ)言體系。下一個(gè)階段,郭家寶會(huì)將代碼寫(xiě)得更好,為用戶提供更多的功能,同時(shí)進(jìn)一步擴(kuò)充繁體字的數(shù)據(jù)庫(kù)。
郭家寶在IT學(xué)生界被稱(chēng)為“BYvoid大神”,因?yàn)樗⒘嗣麨锽Yvoid的博客,分享自己在各類(lèi)IT公司面試的情況、開(kāi)發(fā)的工程或是在世界各地旅游的見(jiàn)聞。這個(gè)博客也成為許多語(yǔ)言學(xué)愛(ài)好者的聚集地,大家一起探討專(zhuān)業(yè)知識(shí)。
無(wú)論是做編程,寫(xiě)博客,做語(yǔ)言學(xué)網(wǎng)站,還是做開(kāi)源的漢語(yǔ)繁簡(jiǎn)轉(zhuǎn)換系統(tǒng),郭家寶認(rèn)為只要熱愛(ài),去做就夠了,別考慮更多其他的。郭家寶喜歡與所有感興趣的人共同分享自己高技術(shù)的研究成果,“我的熱愛(ài),吸引和點(diǎn)燃更多人的熱愛(ài)”。這個(gè)表面上有點(diǎn)木訥少言,略顯刻板的理工男,在跟我們談詩(shī)論道時(shí)神采飛揚(yáng)。當(dāng)他激情地用中古漢語(yǔ)音韻朗誦《將進(jìn)酒》時(shí),可愛(ài)又可敬。