李仕春
(西南大學(xué) 文學(xué)院,重慶 400715)
?
基于語(yǔ)料庫(kù)的現(xiàn)代漢語(yǔ)“黃”字義項(xiàng)分布研究*
李仕春
(西南大學(xué) 文學(xué)院,重慶 400715)
《現(xiàn)代漢語(yǔ)詞典》以往版本中常用詞的釋義基本依靠語(yǔ)感通過做卡片的方式編纂,每個(gè)詞占有的語(yǔ)料非常有限,因此多數(shù)常用詞義項(xiàng)的劃分比較粗疏、存在義項(xiàng)漏收的情況。相對(duì)于過去靠人工搜集語(yǔ)料,用語(yǔ)料庫(kù)技術(shù)搜集語(yǔ)料的優(yōu)勢(shì)在于可以在極短的時(shí)間內(nèi)搜集到幾百萬(wàn)字的語(yǔ)料,這在詞典學(xué)史上具有里程碑式的、劃時(shí)代的方法論意義。文章運(yùn)用語(yǔ)料庫(kù)技術(shù)的方法,以個(gè)案研究的形式對(duì)“黃”字在現(xiàn)代漢語(yǔ)中的義項(xiàng)分布情況進(jìn)行了描寫,認(rèn)為按照《現(xiàn)代漢語(yǔ)詞典》的釋義原則,《現(xiàn)代漢語(yǔ)詞典》(第6版)中“黃”字的義項(xiàng)漏收了7個(gè)!由此可見,把語(yǔ)料庫(kù)技術(shù)和詞典編纂結(jié)合起來(lái),豐富并補(bǔ)充常用詞的義項(xiàng)是一項(xiàng)刻不容緩的工作。
語(yǔ)料庫(kù);語(yǔ)料;方法;新義項(xiàng)
語(yǔ)言學(xué)作為科學(xué)的最基本信條之一就是語(yǔ)言研究過程具有可操作性、研究結(jié)果具有可驗(yàn)證性。為了客觀地反映“黃”字在現(xiàn)代漢語(yǔ)中的義項(xiàng)分布情況,本文首先設(shè)計(jì)了運(yùn)用語(yǔ)料庫(kù)技術(shù)的方法研究現(xiàn)代漢語(yǔ)中“黃”字義項(xiàng)分布的一系列操作程序,繼而在《現(xiàn)代漢語(yǔ)詞典》第6版(本文簡(jiǎn)稱《現(xiàn)漢》)對(duì)“黃”字釋義的基礎(chǔ)上,得出了“黃”字在現(xiàn)代漢語(yǔ)中的義項(xiàng)分布情況,我們相信如果其他學(xué)者按照本文的操作程序也會(huì)得出類似的結(jié)論。
截止2016年1月18日,北京大學(xué)中國(guó)語(yǔ)言學(xué)研究中心研制的CCL語(yǔ)料庫(kù)的語(yǔ)料規(guī)模已達(dá)783,463,175字,該語(yǔ)料庫(kù)首先分為現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)(581,794,456字)和古代漢語(yǔ)語(yǔ)料庫(kù)(201,668,719字)。一方面,北大CCL現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)共涵蓋18種不同語(yǔ)體的語(yǔ)料;另一方面,從時(shí)間上來(lái)看,該語(yǔ)料庫(kù)涵蓋了從20世紀(jì)初魯迅、茅盾、老舍的文學(xué)作品到當(dāng)代的人民日?qǐng)?bào)、百家講壇等語(yǔ)料,跨越了整個(gè)20世紀(jì)。因此,我們?cè)谙螺d預(yù)料時(shí)首先要注意保證所取語(yǔ)料在量上具有充足性,*根據(jù)我們研究,對(duì)于常用詞來(lái)說,要保證所抽取語(yǔ)料在量上的充足性最適宜的條數(shù)就是30000條共計(jì)160多萬(wàn)字,如果低于這個(gè)數(shù)字常用詞的新義項(xiàng)則不宜發(fā)現(xiàn),如果高于這個(gè)數(shù)字就會(huì)做一些無(wú)用功。同時(shí)還要保證所取語(yǔ)料的均衡性,這就要求我們?cè)跈z索并下載“黃”字條目的每類語(yǔ)料后,還要抽取不同時(shí)間段的同類語(yǔ)料,最終建立“黃”字語(yǔ)料庫(kù)。我們所建“黃”字語(yǔ)料庫(kù)的具體語(yǔ)料情況如下:
當(dāng)代|口語(yǔ)“黃”有456條語(yǔ)料.
當(dāng)代|史傳“黃”有1046條語(yǔ)料。
當(dāng)代|應(yīng)用文“黃”有2170條語(yǔ)料。
當(dāng)代|報(bào)刊|人民日?qǐng)?bào)“黃”有3739條語(yǔ)料。
當(dāng)代|報(bào)刊|作家文摘“黃”有4494條語(yǔ)料。
當(dāng)代|報(bào)刊|市場(chǎng)報(bào)“黃”有2309條語(yǔ)料。
當(dāng)代|報(bào)刊|故事會(huì)“黃”有96條語(yǔ)料。
當(dāng)代|報(bào)刊|讀書“黃”有3156條語(yǔ)料。
當(dāng)代|報(bào)刊|讀者“黃”有2872條語(yǔ)料。
當(dāng)代|報(bào)刊|青年文摘“黃”有28條語(yǔ)料。
當(dāng)代|文學(xué)“黃”有3083條語(yǔ)料。
當(dāng)代|電視電影“黃”有1001條語(yǔ)料。
當(dāng)代|網(wǎng)文“黃”有2907條語(yǔ)料。
現(xiàn)代下面“黃”有2643條語(yǔ)料:
現(xiàn)代|戲劇“黃”有233條語(yǔ)料。
現(xiàn)代|文學(xué)“黃”有2410條語(yǔ)料。
首先,建立Access數(shù)據(jù)庫(kù)。打開Access數(shù)據(jù)庫(kù),在【文件】→【獲取外部數(shù)據(jù)】→【導(dǎo)入】項(xiàng)目下,將準(zhǔn)備好的語(yǔ)料導(dǎo)入Access中,建立“黃”字語(yǔ)料庫(kù)。
接著,對(duì)語(yǔ)料庫(kù)進(jìn)行相應(yīng)的設(shè)置。打開“黃”字語(yǔ)料庫(kù),點(diǎn)擊【設(shè)計(jì)】,在“字段名稱”欄中,把字段名稱依次改為“例句”、“專名”、“義項(xiàng)”、“備注”、“復(fù)字詞”、“出處”、“文章類別”及“作者”。再次打開“黃”字語(yǔ)料庫(kù),便出現(xiàn)下表。
上表中各欄目具體標(biāo)注說明如下:
1、《現(xiàn)漢》中已有義項(xiàng)的標(biāo)注
以上義項(xiàng)在語(yǔ)料庫(kù)“義項(xiàng)”一欄分別標(biāo)注為1、2、3、4、5、6、7、8。
新義項(xiàng)也標(biāo)注在“義項(xiàng)”一欄,“黃”的新義項(xiàng)(指《現(xiàn)漢》沒有的義項(xiàng))標(biāo)注:“嬌嫩”標(biāo)為9,“年齡小,涉世淺”標(biāo)為10,“成熟”標(biāo)為11,“枯萎”標(biāo)為12,“(人臉)干枯、無(wú)光彩”標(biāo)為13,“警告,預(yù)警”標(biāo)為14,“膿”標(biāo)為15。
2、語(yǔ)料庫(kù)“專名”一欄的標(biāo)注:“人名”標(biāo)為1,“地名”標(biāo)為2,“官職名”標(biāo)為3“其他專有名詞”標(biāo)為4。
3、復(fù)字詞的標(biāo)注
凡語(yǔ)料中第一次出現(xiàn)的復(fù)字詞都標(biāo)注于此欄的對(duì)應(yīng)位置。
4、語(yǔ)料庫(kù)“備注”、“出處”、“文章類別”及“作者”等欄做相應(yīng)的標(biāo)注。
通過語(yǔ)料標(biāo)注,我們初步確定“黃”字義項(xiàng)在現(xiàn)代漢語(yǔ)中的分布情況如下:
①操場(chǎng)四周的白楊,綠柳,紫丁香,紅玫瑰,花壇里的馬蘭,黃花,郁郁蔥蔥,次第開放。(人民日?qǐng)?bào)/1993年)
②地是光光的,冰硬的,灰黃的,城墻是灰黑的,堅(jiān)硬的,光光的。(老舍《四世同堂》)*本文全部語(yǔ)料取自北大CCL語(yǔ)料庫(kù)中的現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)。
2、指黃金。在我們建的語(yǔ)料庫(kù)中,共2465條,約占8.217%。例句:
③岳父說,他年初過商州下漢口時(shí),花了黃貨才弄到手這包罌粟種子。(陳忠實(shí)《白鹿原》)
④內(nèi)急,走進(jìn)公廁撒了一泡尿,出來(lái)以后,猛然想到自己剛才滿眼都對(duì)黃白之物,居然能站住了不倒,覺得自己很了不起,就急忙來(lái)告訴我。(王小波《個(gè)人尊嚴(yán)》)
⑤上四味先煮三味去滓,內(nèi)阿膠烊化盡,后內(nèi)雞子黃,溫服。(《歷代古方驗(yàn)案按》)
⑥也是在母體中受精,排出以后,這種小的受精卵在它的母體里得到卵黃的營(yíng)養(yǎng),使它發(fā)育長(zhǎng)大,這是卵胎生。(曹玉茹《“狂”鯊》)
⑦領(lǐng)導(dǎo)親自出面跟彭鋼談,都沒談成。當(dāng)然,這事黃了。(作家文摘/1995年)
⑧鹿子霖原以為嘉軒事到臨頭要反悔要變卦了,單怕到手的二畝水地又黃了。(陳忠實(shí)《白鹿原》)
⑨應(yīng)該說,這些年來(lái)政府狠抓掃黃、整頓服務(wù)行業(yè)取得了很大成效。(人民日?qǐng)?bào)/1993年)
⑩科長(zhǎng)便說:“好呀,看黃色片,黨員記大過,干部要撤職?!?方方《埋伏》)
6、指黃河。在我們建的語(yǔ)料庫(kù)中,共2174條,約占7.246%。例句:
7、指黃帝,我國(guó)古代傳說中的帝王。該義項(xiàng)只出現(xiàn)在“炎黃”、“黃老”、“黃陵”等搭配中,在我們建的語(yǔ)料庫(kù)中,共521條,約占1.73%。例句:
10、年齡小,涉世淺。在我們建的語(yǔ)料庫(kù)中,共91條,約占0.303%。例句:
13、(人臉)干枯、無(wú)光彩。在我們建的語(yǔ)料庫(kù)中,共190條,約占0.633%。例句:
14、警告、預(yù)警。在我們建的語(yǔ)料庫(kù)中,共181條,約占0.603%。例句:
15、指膿。在我們建的語(yǔ)料庫(kù)中,共11條,約占0.037%。例句:
16、專有名詞。除了姓有7872條外,在我們建的語(yǔ)料庫(kù)中,其他專名共6534條(包括地名1908條,官職名17條,其他專有名詞有4609條)約占21.78%,以下是“黃”字組成的專有名詞簡(jiǎn)單舉例:
黃巢起義、黃檗、黃道帶、黃道、黃道吉日、黃歷、黃教、黃龍、黃連、黃曲霉菌、黃梅戲、黃熱病、黃芽菜。
把上文對(duì)“黃”字在現(xiàn)代漢語(yǔ)中的義項(xiàng)分布情況與《現(xiàn)漢》對(duì)顏色詞“黃”的釋義進(jìn)行比較,可以看出《現(xiàn)漢》漏收了以下7個(gè)義項(xiàng):“嬌嫩”、“年齡小,涉世淺”、“成熟”、“枯萎”、“(人臉)干枯、無(wú)光彩”、“警告,預(yù)警”、“膿”等。我們認(rèn)為《現(xiàn)漢》應(yīng)補(bǔ)錄以上義項(xiàng),這一建議既有客觀依據(jù)又有理論依據(jù),下文主要從共時(shí)和歷時(shí)兩個(gè)方面來(lái)解釋上述義項(xiàng)成立的原因。共時(shí)依據(jù)是指“黃”的上述義項(xiàng)客觀存在于現(xiàn)代漢語(yǔ)中,歷時(shí)依據(jù)是指“黃”的上述某些義項(xiàng)也客觀存在于古代漢語(yǔ)中。
(一)共時(shí)依據(jù)
1、“黃”在現(xiàn)代漢語(yǔ)中有“嬌嫩”義。植物的幼苗或植物的嫩芽一般是嫩黃色的,剛出生的鳥類的嘴或一些剛出生的動(dòng)物的絨毛一般也是黃色的,張志毅、張慶云先生指出,“一些形容詞的意義常是由所形容者決定的。”[1](P198)由于“黃”經(jīng)常用來(lái)修飾它們,自然“黃”字就有了“嬌嫩”義,該義項(xiàng)不僅經(jīng)常出現(xiàn)在“新黃”、“黃芽”、“鵝黃”、“嫩黃”、“嬌黃”等搭配中,而且還經(jīng)常單獨(dú)運(yùn)用。例如:
2、“黃”在現(xiàn)代漢語(yǔ)中有“年齡小,涉世淺”義。該義項(xiàng)經(jīng)常出現(xiàn)在“黃花姑娘”、“黃口小兒”、“黃毛丫頭”等搭配中。例如:
幼兒的頭發(fā)或少年剛長(zhǎng)出的胡須是黃色的,由于他們年齡小不懂世故,因此,“黃”在表示“年齡小”的同時(shí)還有了“涉世淺”義?!包S”的這一義項(xiàng)不能單獨(dú)使用,多出現(xiàn)在固定搭配中,該義項(xiàng)在我們建的語(yǔ)料庫(kù)中共91條,約占0.280%,由于使用穩(wěn)定,頻次較高并且生命力較強(qiáng),人們已經(jīng)接受了“黃”的這一義項(xiàng),所以《現(xiàn)漢》應(yīng)收“黃”的義項(xiàng)“年齡小,涉世淺”。
3、“黃”在現(xiàn)代漢語(yǔ)中有“成熟”義,該義項(xiàng)經(jīng)常單獨(dú)使用。例如:
在生活實(shí)踐中,一些植物成熟后常常變黃,人們就用“黃”來(lái)形容這些植物成熟時(shí)的顏色,因此“黃”自然就沾染了“成熟”的意義。“黃”表示“成熟”義的語(yǔ)義范圍只局限于植物域中的部分成員,但是它在表達(dá)上直觀形象,增強(qiáng)了視覺效果,正因?yàn)檫@種獨(dú)特的語(yǔ)義價(jià)值,“黃”的“成熟”義使用比較普遍穩(wěn)定,所以《現(xiàn)漢》應(yīng)收“黃”的“成熟”義。
4、“黃”在現(xiàn)代漢語(yǔ)中有“枯萎”義。例如:
隨著秋天的來(lái)臨,草本植物或木本植物的葉子通常會(huì)因枯萎而變黃,自然“黃”也就有了“枯萎”的意義。例如:
從大量語(yǔ)料可以看出,“黃”的這一義使用頻次較高,非常穩(wěn)定,而且已經(jīng)約定俗成了,因此,《現(xiàn)漢》應(yīng)收“黃”的“枯萎”義。植物葉子變黃枯萎,最終的結(jié)果是標(biāo)志它們“衰老、死亡”,在隱喻認(rèn)知機(jī)制的作用下“黃”的“枯萎”義可以進(jìn)一步引申出“事情失敗或計(jì)劃不能實(shí)現(xiàn)”義,如:
5、“黃”在現(xiàn)代漢語(yǔ)中也有“(人臉)干枯、無(wú)光彩”義。“黃”有“枯萎”義,自然又可以由物喻人,轉(zhuǎn)指人臉的干枯和缺乏光彩,“黃”的這一義項(xiàng)不能單獨(dú)運(yùn)用是語(yǔ)素義。例如:
6、“黃”在現(xiàn)代漢語(yǔ)中還有“警告,預(yù)警”義。
現(xiàn)代生活中,幾乎每個(gè)城市都有指示交通的信號(hào)燈,一律用“黃燈”表示短暫時(shí)間的等待,有預(yù)警的意思;體育競(jìng)賽以及其他生活中常用“黃牌”表示對(duì)違規(guī)者進(jìn)行警告;天氣預(yù)報(bào)中用“黃色”對(duì)災(zāi)害性天氣進(jìn)行提前預(yù)警;另外日常生活中還經(jīng)常使用“黃線”來(lái)“警告”人們不要侵犯某些事物,等等。上述現(xiàn)象都使“黃”有了“警告,預(yù)警”的含義?!包S”的這一義項(xiàng)在現(xiàn)代生活中應(yīng)用的廣泛而又普遍,所以我們認(rèn)為《現(xiàn)漢》應(yīng)收該義。“黃”的這一義項(xiàng)同樣不能單獨(dú)運(yùn)用,所以它是語(yǔ)素義。
7、“黃”在現(xiàn)代漢語(yǔ)中還有“膿”的意義。
某些炎癥病變所形成的汁液的顏色是黃色的,而“黃”在現(xiàn)代漢語(yǔ)中又經(jīng)常來(lái)形容這些汁液,所以“黃”有了“膿”意義,該義項(xiàng)在我們建的語(yǔ)料庫(kù)中有11條,約占我們所建語(yǔ)料庫(kù)語(yǔ)料總數(shù)的0.034%,這說明“黃”的這一義項(xiàng)已固定于常見用法之中,例如:
《現(xiàn)漢》未收“黃”的“膿”意義,我們建議收。*我們以《現(xiàn)漢》中“黃”字義項(xiàng)的最低使用頻率作為標(biāo)準(zhǔn),凡是使用頻率高于最低使用頻率的就定為義項(xiàng),例如在我們建的"黃"字語(yǔ)料庫(kù)中,《現(xiàn)漢》第三個(gè)義項(xiàng)“指蛋黃等黃顏色的可食用的東西”共8條,使用頻率是8÷30000≈0.026%,其使用頻率最低,我們新發(fā)現(xiàn)的義項(xiàng)“嬌嫩”、“年齡小,涉世淺”、“成熟”、“枯萎”、“(人臉)干枯,(年齡)大”等的使用頻率都高于0.026%,所以我們把它們就定為義項(xiàng)。雖然“黃”的義項(xiàng)“膿”在我們建的語(yǔ)料庫(kù)中只有11條語(yǔ)料,但其使用頻率約為0.034%,還是高于“黃”字的最低使用頻率,所以我們也把它定為義項(xiàng)。
(二)歷時(shí)依據(jù)
“黃”字不但在現(xiàn)代漢語(yǔ)中有“嬌嫩”、“年齡小,涉世淺”、“成熟”、“枯萎”、“(人臉)干枯、無(wú)光彩”等義項(xiàng),而且“黃”字的上述義項(xiàng)也同樣大量存在于古代漢語(yǔ)中。根據(jù)我們對(duì)北京大學(xué)CCL古代漢語(yǔ)語(yǔ)料庫(kù)中“黃”字語(yǔ)料的統(tǒng)計(jì),發(fā)現(xiàn)古代漢語(yǔ)中存在大量類似語(yǔ)料。例如:
1、“黃”在古代漢語(yǔ)中有“嬌嫩”義。同現(xiàn)代漢語(yǔ)中一樣,古代漢語(yǔ)中“黃”字表示“(植物、動(dòng)物等)嬌嫩”義分布很廣。例如:
2、“黃”的表示人“年齡小、涉世淺”義在古代漢語(yǔ)中分布也很廣,例如:
3、“黃”在古代漢語(yǔ)中也有“成熟”義。例句如下:
4、“黃”在古代漢語(yǔ)中也有“枯萎”義。例句如下:
5、“黃”在古代漢語(yǔ)中也有“(人臉)干枯、無(wú)光彩”義。例句如下:
在中國(guó)辭書史上,一詞多義的現(xiàn)象首先見于漢代《說文解字》,其釋義特點(diǎn)主要是據(jù)形釋義、一詞一義,僅僅是偶爾涉及到一詞多義,多義詞和單義詞的區(qū)分并不明顯。此后,經(jīng)歷代字書、韻書的發(fā)展,漢語(yǔ)詞典中多義詞和單義詞的區(qū)分越來(lái)越明顯,清代《康熙字典》則已收錄了大量多義詞。古代辭書對(duì)多義詞的釋義基本是隨文釋義性質(zhì)的,很不科學(xué)。20世紀(jì)以后,中國(guó)出現(xiàn)了以《現(xiàn)代漢語(yǔ)詞典》為代表的一批具有現(xiàn)代意義的詞典,這一時(shí)期多義詞義項(xiàng)的劃分比較科學(xué)、合理,缺點(diǎn)是由于靠語(yǔ)感確定多義詞的義項(xiàng),因此詞典中存在多義詞義項(xiàng)收錄不全的情況。以上便是漢語(yǔ)多義詞義項(xiàng)劃分在中國(guó)歷代辭書中的縮影,也可以說它是20世紀(jì)50年代以前,世界各國(guó)詞典對(duì)多義詞義項(xiàng)劃分從無(wú)到有的一個(gè)縮影。世界語(yǔ)言學(xué)自20世紀(jì)50、60年代進(jìn)入語(yǔ)料庫(kù)時(shí)代后,詞典編纂發(fā)生了革命性的變化。
國(guó)外:從20世紀(jì)80年代開始,語(yǔ)料庫(kù)技術(shù)就已經(jīng)廣泛應(yīng)用于詞典編纂與研究中了,目前,占據(jù)英語(yǔ)辭書主要市場(chǎng)的牛津、韋氏、朗文與麥克米倫等英語(yǔ)詞典,都是在語(yǔ)料庫(kù)的基礎(chǔ)上編成的。英語(yǔ)詞典編纂者非常重視用語(yǔ)料庫(kù)技術(shù)發(fā)現(xiàn)英語(yǔ)多義詞的新義項(xiàng)。
國(guó)內(nèi):20世紀(jì)90年代以來(lái),中國(guó)相繼建設(shè)了一批漢語(yǔ)語(yǔ)料庫(kù),最有代表性的如北京大學(xué)中國(guó)語(yǔ)言學(xué)研究中心研制的“CCL語(yǔ)料庫(kù)”,截止2016年1月18日現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)規(guī)模已達(dá)5.81億字,可以說,目前我國(guó)的語(yǔ)料庫(kù)已經(jīng)初步具備了詞典編纂所需要的規(guī)模。盡管如此,在當(dāng)今中國(guó),用語(yǔ)料庫(kù)技術(shù)研究漢語(yǔ)多義詞新義項(xiàng)的方法還沒有引起漢語(yǔ)詞典編纂者的足夠重視,誠(chéng)如章宜華先生所言:“詞典語(yǔ)料庫(kù)是西方上世紀(jì)70-80年代的產(chǎn)物,而我們直到90年代才有這方面的成果發(fā)表,而至今大多仍只限于紙上談兵,沒有投入商業(yè)運(yùn)營(yíng)的大型詞典語(yǔ)料庫(kù);而在西方談?wù)Z料庫(kù)的建設(shè)和重要性已經(jīng)是個(gè)過時(shí)的話題。這些都值得學(xué)術(shù)界和出版界注意。”[2]因此,李仕春指出:“漢語(yǔ)類中型語(yǔ)文性詞典中常用多義詞的義項(xiàng)精細(xì)度至今依然處在20世紀(jì)50、60年代靠語(yǔ)感確定義項(xiàng)的編纂水準(zhǔn),從而導(dǎo)致漢語(yǔ)類中型語(yǔ)文性詞典義項(xiàng)的劃分比較粗疏、存在義項(xiàng)漏收的情況?!盵3]
用語(yǔ)料庫(kù)技術(shù)研究漢語(yǔ)多義詞新義項(xiàng)的優(yōu)點(diǎn)主要在于用語(yǔ)料庫(kù)搜集語(yǔ)料具有里程碑式的、劃時(shí)代的方法論意義,以“黃”為例:用語(yǔ)料庫(kù)檢索的方法可以在16毫秒的時(shí)間內(nèi)得出“黃”在北京大學(xué)CCL現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)中有146077條。假設(shè)用人工閱讀的方法查找1條含有“黃”字的語(yǔ)句需要用1小時(shí)(實(shí)際上有時(shí)候不止1小時(shí)),那么要找146077條含有“黃”字語(yǔ)料約用146077小時(shí)。
1小時(shí)=3600秒
1秒=1000毫秒
146077小時(shí)=146077×3600×1000≈5.258772×1011毫秒
5.258772×1011÷16﹦3.28625×1010倍
經(jīng)過計(jì)算可以知道查找同樣多的語(yǔ)料,用語(yǔ)料庫(kù)技術(shù)的方法的是人工閱讀的300多億倍,簡(jiǎn)直是神速。
與傳統(tǒng)憑借語(yǔ)感編纂的詞典相比,建立在語(yǔ)料庫(kù)技術(shù)基礎(chǔ)上的語(yǔ)文性詞典在多義詞的義項(xiàng)劃分方面更加細(xì)化、義項(xiàng)收錄更加全面,在詞典編纂史上實(shí)現(xiàn)了里程碑式的跨越發(fā)展。因此,張志毅、長(zhǎng)召其先生指出:“今天的語(yǔ)料庫(kù)已經(jīng)成為能量巨大的語(yǔ)言樣本集。它正在印證、充實(shí)、修訂、改寫甚至顛覆以往的辭書釋語(yǔ)。它也正孕育出、孕育著更現(xiàn)代,更可信的辭書。”[4]我們翹首以待。
[1] 張志毅,張慶云.詞匯語(yǔ)義學(xué)[M].北京:商務(wù)印書館,2005.
[2] 章宜華.與新時(shí)期詞典學(xué)理論和編纂方法的創(chuàng)新[J].辭書研究,2010,(1):57-69.
[3] 李仕春.漢英中型語(yǔ)文詞典義項(xiàng)精細(xì)度對(duì)比研究[J].長(zhǎng)江學(xué)術(shù), 2016,(3):115-121.
[4] 張志毅,長(zhǎng)召其.辭書編纂現(xiàn)代化的新理念——人機(jī)接口工具使用的智能發(fā)揮[A].樂嘉民,亢世勇.辭書編纂現(xiàn)代化研究[C].上海:上海辭書出版社,2009.42.
責(zé)任編輯:周延云
The Distribution of Meaning Items of "Huang" in Modern Chinese Based on Corpus
Li Shichun
(College of Liberal Arts, Southwest University, Chongqing 400715, China)
Compared with the past artificial collecting corpus, corpus technology is used to collect the linguistic data which is made up of millions of words in a very short time. The method is a milestone in the dictionary history. Using CCL corpus, the paper analyzes the distribution of meaning items of "Huang" in modern Chinese. The research results indicate that Modern Chinese Dictionary needs to be added seven meaning items.
corpora; corpus; method; new meaning item
2016-05-08
國(guó)家社會(huì)科學(xué)基金重點(diǎn)項(xiàng)目“語(yǔ)料庫(kù)視野下的現(xiàn)代漢語(yǔ)單音多義詞義項(xiàng)分布研究”(14AYY018);西南大學(xué)中央高?;緲I(yè)務(wù)費(fèi)專項(xiàng)資金創(chuàng)新團(tuán)隊(duì)項(xiàng)目(SWU1609105);西南大學(xué)科研基金人才引進(jìn)項(xiàng)目(SWU1509502)
李仕春(1973-),男,山東莒縣人,西南大學(xué)文學(xué)院教授,主要從事語(yǔ)言學(xué)史和詞匯學(xué)、詞典學(xué)研究。
H02
A
1672-335X(2016)05-0103-07
中國(guó)海洋大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2016年5期