張永偉
《年度媒體新詞語(yǔ)表》(以下簡(jiǎn)稱(chēng)《新詞語(yǔ)表》)是《中國(guó)語(yǔ)言生活狀況報(bào)告》年度媒體用字用語(yǔ)調(diào)查的重要組成部分,連續(xù)多年由國(guó)家語(yǔ)言資源監(jiān)測(cè)與研究中心研制并由教育部語(yǔ)言文字信息管理司組織發(fā)布?!缎略~語(yǔ)表》基于大規(guī)模媒體語(yǔ)料庫(kù)研制,具有權(quán)威性、代表性?!缎略~語(yǔ)表》在研制過(guò)程中結(jié)合新詞語(yǔ)候選集的計(jì)算機(jī)自動(dòng)提取和人工排查、確認(rèn)的方法,得到的新詞語(yǔ)具有典型性、全面性,可視為新詞語(yǔ)在當(dāng)年使用情況的真實(shí)描寫(xiě)。
蘇新春(2003)指出,新詞語(yǔ)產(chǎn)生后有三種生存可能: 一是問(wèn)世后不久就無(wú)人使用,消退、“夭折”了;二是繼續(xù)不穩(wěn)定地、小范圍地存在;三是被普遍使用、廣泛流傳而逐漸穩(wěn)定,進(jìn)入民族共同語(yǔ)詞匯系統(tǒng)而成為其中一分子。蘇文參照新詞語(yǔ)的這三種生存可能將新詞語(yǔ)的產(chǎn)生過(guò)程劃分為初生、發(fā)展和成熟三個(gè)階段。
《新詞語(yǔ)表》研制的目的是如實(shí)記錄當(dāng)年出現(xiàn)的新詞語(yǔ),即記錄初生后發(fā)展了一段時(shí)間的新詞語(yǔ)。而一般辭書(shū)[1]在編纂修訂時(shí),除收錄一般詞條外,也需要緊跟時(shí)代,增補(bǔ)新詞新義。一般辭書(shū)收錄新詞,除了詞“新”之外,還要兼顧穩(wěn)定性、通用性,即更傾向收錄成熟階段的新詞語(yǔ)。
本文在分析新詞語(yǔ)基本面貌和形成特點(diǎn)的基礎(chǔ)上,結(jié)合《現(xiàn)代漢語(yǔ)詞典》(以下簡(jiǎn)稱(chēng)《現(xiàn)漢》)第7版對(duì)《新詞語(yǔ)表》的收錄情況,總結(jié)了新詞語(yǔ)進(jìn)入成熟階段的靜態(tài)特征。然后根據(jù)新詞語(yǔ)在《中國(guó)語(yǔ)言生活狀況報(bào)告》每年發(fā)布的《年度媒體高頻詞語(yǔ)表》(以下簡(jiǎn)稱(chēng)《高頻詞表》)及《人民日?qǐng)?bào)》中的收錄、使用情況,對(duì)新詞語(yǔ)進(jìn)入成熟階段的動(dòng)態(tài)特征進(jìn)行分析,并進(jìn)一步說(shuō)明《新詞語(yǔ)表》對(duì)辭書(shū)編纂的價(jià)值。
《新詞語(yǔ)表》是當(dāng)年媒體語(yǔ)料中新出現(xiàn)詞語(yǔ)的集合,如實(shí)記錄了初生后得到一定程度發(fā)展的新詞語(yǔ)。從新詞語(yǔ)用字看,新詞語(yǔ)分為完全由漢字組成的詞語(yǔ)和包含非漢字符號(hào)組成的詞語(yǔ)(以下稱(chēng)“非完全漢字新詞語(yǔ)”)兩種類(lèi)型;從詞語(yǔ)“新舊”看,包括“新詞新義”和“舊詞新義”兩種情況。將2010年—2017年的《新詞語(yǔ)表》匯總,得到8年的新詞語(yǔ)總表。本節(jié)基于該總表進(jìn)行分析,分別從詞長(zhǎng)和詞語(yǔ)“新舊”兩個(gè)方面闡釋當(dāng)今漢語(yǔ)新詞語(yǔ)的基本面貌。
8年《新詞語(yǔ)表》的新詞語(yǔ)整體收詞規(guī)模及詞語(yǔ)長(zhǎng)度分布情況如表1所示:
表1 《新詞語(yǔ)表》整體收詞規(guī)模及詞語(yǔ)長(zhǎng)度分布情況
2010年—2017年共發(fā)布新詞語(yǔ)3601個(gè)[2],其中三字新詞語(yǔ)總數(shù)最多,其次是四字和二字新詞語(yǔ),單字和五字及以上的新詞語(yǔ)總數(shù)最少。具體到每個(gè)年度,所有年份的三字新詞語(yǔ)數(shù)量都最多,除2013年以外的大部分年份的四字新詞語(yǔ)數(shù)量都比二字新詞語(yǔ)數(shù)量多,這說(shuō)明初生、發(fā)展階段的新詞語(yǔ)主要以三、四字為主。
8年中《新詞語(yǔ)表》收錄的“新詞新義”新詞語(yǔ)和“舊詞新義”新詞語(yǔ)的數(shù)量和比例如表2所示:
表2 《新詞語(yǔ)表》“新詞新義”和“舊詞新義”新詞語(yǔ)情況
所有年份的“新詞新義”新詞語(yǔ)比例都超過(guò)了96%,平均97.17%,占絕對(duì)優(yōu)勢(shì)。這說(shuō)明人們創(chuàng)造新詞語(yǔ)時(shí)更傾向于全新造詞,盡量避免給現(xiàn)有詞語(yǔ)賦予新的含義。
《新詞語(yǔ)表》中的新詞語(yǔ)可能經(jīng)過(guò)一段時(shí)間后就無(wú)人使用、逐步消退,可能被持續(xù)使用一段時(shí)間但使用范圍受到局限,也可能被普遍接受并常規(guī)使用。為了分析《新詞語(yǔ)表》中新詞語(yǔ)的后續(xù)生存情況及最終是否更傾向于被辭書(shū)收錄,需要先對(duì)新詞語(yǔ)的形成特點(diǎn)進(jìn)行分析。本文主要從6個(gè)方面進(jìn)行分析。
《新詞語(yǔ)表》共收錄5個(gè)單字詞,分別為“粉、壕、撕、污、尬”,它們可以視為單字新詞語(yǔ)的最典型代表。單字詞均具有相對(duì)較高的使用頻次,由于所有單字詞都不涉及全新創(chuàng)造新字形,因此所有單字詞均可視為“舊詞新義”。雖然單字詞的數(shù)量少,但形成模式多樣,包含音譯、縮寫(xiě)、合寫(xiě)、脫離聯(lián)綿詞而獨(dú)立等多種方式[3],其形成具有很大的偶然性。
《新詞語(yǔ)表》共收錄49個(gè)諧音新詞語(yǔ),包括漢語(yǔ)諧音、英語(yǔ)諧音和日期諧音三種類(lèi)型。其中,漢語(yǔ)諧音產(chǎn)生的新詞語(yǔ)數(shù)量最多,為39個(gè),比如“神馬、香菇、藍(lán)瘦”等。英語(yǔ)諧音新詞語(yǔ)數(shù)量比較少,為8個(gè),比如“U站、UV行動(dòng)、鬧太套”等。日期諧音新詞語(yǔ)數(shù)量最少,只有2個(gè),分別為“分手節(jié)”9月13日(913諧音為“就要散”)和“1314結(jié)婚潮”。諧音新詞語(yǔ)在2010年收錄數(shù)量最多,為20個(gè);在2015年和2017年收錄數(shù)量最少,均只有1個(gè)。諧音方式產(chǎn)生的新詞語(yǔ)一般規(guī)范性較差,數(shù)量整體呈現(xiàn)減少的趨勢(shì)。
《新詞語(yǔ)表》共收錄音譯新詞語(yǔ)28個(gè),每年收錄2—7個(gè),數(shù)量較少。音譯新詞語(yǔ)主要源自英語(yǔ),數(shù)量為23個(gè),占比82.1%。比如,“拜客”音譯自“bike”,“慕課”音譯自“MOOC”,“八困”音譯自“Bug Queen”等。除英語(yǔ)外,還有個(gè)別音譯來(lái)自祖魯語(yǔ)、印尼語(yǔ)、韓語(yǔ)、烏干達(dá)語(yǔ)、土耳其語(yǔ)等。比如,“嗚嗚祖拉”來(lái)自祖魯語(yǔ)“vuvuzela”,“安代克”來(lái)自印尼語(yǔ)“endek”,“辛奇”來(lái)自韓語(yǔ)“kimchi”等。
雖然《新詞語(yǔ)表》音譯詞語(yǔ)數(shù)量少,但每年收錄情況相對(duì)穩(wěn)定,是新詞語(yǔ)較為穩(wěn)定的來(lái)源方式之一。
《新詞語(yǔ)表》共收錄119個(gè)非完全漢字新詞語(yǔ),每年收錄9—26個(gè),占比為1.88%—5.54%,平均占比3.3%,非完全漢字新詞語(yǔ)的構(gòu)詞形式多樣,具體包括“漢字+字母”“漢字+數(shù)字”“純字母”“漢字+字母+數(shù)字”“漢字+字符”“字母+數(shù)字”“漢字+字符+數(shù)字”“漢字+字母+字符+數(shù)字”“純字符”等9種形式。其中,“漢字+字母“形式數(shù)量最多,高達(dá)62個(gè),占比為52.1%;“純字母”或“純字符”的新詞語(yǔ)數(shù)量較少,一共只有17個(gè)。這說(shuō)明包含非漢字字符組成的新詞語(yǔ)中,漢字依然是最常用的組成元素。
《新詞語(yǔ)表》包含大量詞綴、類(lèi)詞綴參與構(gòu)成的新詞語(yǔ),形成詞族效應(yīng)。以構(gòu)成二、三字新詞語(yǔ)的單音節(jié)類(lèi)詞綴為例,本文考察了23個(gè)后附加的類(lèi)詞綴和4個(gè)前附加的類(lèi)詞綴的構(gòu)詞情況[4]。統(tǒng)計(jì)發(fā)現(xiàn),27個(gè)類(lèi)詞綴共構(gòu)成《新詞語(yǔ)表》中的新詞語(yǔ)480個(gè),占全部二、三字新詞語(yǔ)總數(shù)的21.35%。其中,447個(gè)新詞語(yǔ)由后附加類(lèi)詞綴參與構(gòu)成,33個(gè)新詞語(yǔ)由前附加類(lèi)詞綴參與構(gòu)成。此外,由類(lèi)詞綴構(gòu)成的新詞語(yǔ)的使用頻率也相對(duì)較高。
簡(jiǎn)縮本文指簡(jiǎn)稱(chēng)、縮寫(xiě)或者縮略。統(tǒng)計(jì)《新詞語(yǔ)表》釋義發(fā)現(xiàn),約145個(gè)新詞語(yǔ)以縮簡(jiǎn)的方式構(gòu)成,占比為4.03%。比如,“超導(dǎo)”是“超級(jí)導(dǎo)演”的簡(jiǎn)稱(chēng),“藥Q”指正確使用藥物的能力(其中“Q”是英文quotient的縮寫(xiě)),“講懂守”是“講誠(chéng)信、懂規(guī)矩、守紀(jì)律”的縮略。非完全漢字新詞語(yǔ)雖然總數(shù)較少,但通過(guò)縮簡(jiǎn)方式形成的比例非常高,119個(gè)非完全漢字新詞語(yǔ)中縮簡(jiǎn)方式構(gòu)成的新詞語(yǔ)有39個(gè),占比32.77%。
與縮略相對(duì)應(yīng)的是合稱(chēng)方式構(gòu)成的新詞語(yǔ),比如“三房”是“廉租房、經(jīng)濟(jì)適用房和限價(jià)房”的合稱(chēng)?!缎略~語(yǔ)表》共收錄合稱(chēng)方式構(gòu)成的新詞語(yǔ)約40個(gè),占比較少,只有1.11%。
《現(xiàn)漢》以確定詞匯規(guī)范為目的,以推廣普通話、促進(jìn)漢語(yǔ)規(guī)范化為宗旨,被視為現(xiàn)代漢語(yǔ)的規(guī)范型辭書(shū)?!坝捎凇冬F(xiàn)漢》的性質(zhì),它對(duì)新詞語(yǔ)的收錄往往反映出這些詞語(yǔ)正在進(jìn)入或已經(jīng)進(jìn)入了民族共同語(yǔ),等于給新詞語(yǔ)發(fā)放了一張社會(huì)認(rèn)可證,同時(shí)也反映出研究界對(duì)新詞語(yǔ)的處理原則與方法?!?蘇新春 2003)規(guī)范型辭書(shū)對(duì)新詞語(yǔ)的收錄,需要建立統(tǒng)一的原則,區(qū)分新詞語(yǔ)所處的發(fā)展階段,收集初生、發(fā)展階段的新詞語(yǔ),擇優(yōu)收錄成熟階段的新詞語(yǔ)。本文將以《現(xiàn)漢》第7版為例說(shuō)明《新詞語(yǔ)表》對(duì)辭書(shū)編纂的價(jià)值。
《新詞語(yǔ)表》為規(guī)范型辭書(shū)處理新詞語(yǔ)提供了初生后發(fā)展到一定階段的新詞語(yǔ)候選集合。總結(jié)規(guī)范型辭書(shū)對(duì)新詞語(yǔ)處理的原則規(guī)范,可以變相得到新詞語(yǔ)成熟的標(biāo)記特征,標(biāo)記特征反過(guò)來(lái)可以指導(dǎo)規(guī)范型辭書(shū)中其他新詞語(yǔ)的收錄。《新詞語(yǔ)表》對(duì)辭書(shū)編纂的價(jià)值主要體現(xiàn)在以下幾個(gè)方面。
規(guī)范型辭書(shū)只收錄成熟階段的新詞語(yǔ),數(shù)量較少,而初生、發(fā)展階段的新詞語(yǔ)數(shù)量較多,結(jié)合初生、發(fā)展階段的新詞語(yǔ)特點(diǎn)分析新詞語(yǔ)可以了解哪些特點(diǎn)的新詞語(yǔ)更容易成熟、更應(yīng)該被辭書(shū)收錄,構(gòu)成一個(gè)漸進(jìn)序列。我們對(duì)《現(xiàn)漢》第7版收錄的《新詞語(yǔ)表》中新詞語(yǔ)進(jìn)行分析以便了解規(guī)范型辭書(shū)對(duì)新詞語(yǔ)的收錄情況及處理原則。
《現(xiàn)漢》第7版共收錄《新詞語(yǔ)表》中的新詞語(yǔ)30個(gè),分別為:“悲催、給力、吐槽、微信、備胎、創(chuàng)客、逆襲、躺槍、正能量、中國(guó)夢(mèng)、爆表、點(diǎn)贊、光盤(pán)行動(dòng)、女漢子、四風(fēng)、土豪、細(xì)顆粒物、學(xué)霸、眾籌、任性、三嚴(yán)三實(shí)、新常態(tài)、互聯(lián)網(wǎng)+、顏值、一帶一路、雙創(chuàng)、四個(gè)全面、工匠精神、私信、五大發(fā)展理念”。這30個(gè)新詞語(yǔ)的使用經(jīng)歷了初生、發(fā)展及成熟三個(gè)階段,最終被規(guī)范型辭書(shū)認(rèn)可并收錄。
1. “舊詞新義”新詞語(yǔ)更容易成熟
《現(xiàn)漢》第7版收錄的30個(gè)表中新詞語(yǔ)中有8個(gè)是“舊詞新義”[5],占比為26.67%,遠(yuǎn)遠(yuǎn)高于《新詞語(yǔ)表》中“舊詞新義”新詞語(yǔ)平均占比2.83%的比例?!芭f詞新義”的新詞語(yǔ)一般已經(jīng)比較穩(wěn)定,新義項(xiàng)被普遍接受以后,規(guī)范型辭書(shū)也更應(yīng)該對(duì)新義項(xiàng)進(jìn)行補(bǔ)充。
2. 二字新詞語(yǔ)更容易成熟
《現(xiàn)漢》第7版收錄的30個(gè)表中新詞語(yǔ)包含18個(gè)二字詞、4個(gè)三字詞、6個(gè)四字詞及1個(gè)六字詞。其中,二字詞的數(shù)量最多,占比高達(dá)60%,這與《新詞語(yǔ)表》中三、四字新詞語(yǔ)數(shù)量多、占比高形成了鮮明的對(duì)比。這說(shuō)明二字詞依然是辭書(shū)編纂者更容易認(rèn)可的詞匯形式,使用更穩(wěn)定,也更容易成熟。相比之下,雖然初生的三、四字新詞語(yǔ)數(shù)量比較多,但能存活下來(lái)的并且最終適合辭書(shū)收錄的比例非常小。
《現(xiàn)漢》第7版未收錄表中的任何單字詞,這與《新詞語(yǔ)表》中的單字詞數(shù)量少密不可分。另一方面也與單字詞形成模式多樣、偶然性強(qiáng)、規(guī)律性較差的特點(diǎn)有關(guān)。
3. 合稱(chēng)新詞語(yǔ)更容易成熟
《新詞語(yǔ)表》中合稱(chēng)新詞語(yǔ)只有40個(gè),數(shù)量少,占比僅為1.11%。但是《現(xiàn)漢》第7版中收錄的表中新詞語(yǔ)中有5個(gè)是合稱(chēng)新詞語(yǔ),分別為“四風(fēng)、三嚴(yán)三實(shí)、一帶一路、四個(gè)全面、五大發(fā)展理念”,占比高達(dá)16.67%,這與《新詞語(yǔ)表》中的合稱(chēng)新詞語(yǔ)占比低亦形成鮮明對(duì)比。合稱(chēng)新詞語(yǔ)往往由數(shù)詞連同依據(jù)不同詞語(yǔ)或句子之間的共性提取得到的關(guān)鍵詞組合而成,如果不詳細(xì)解釋?zhuān)瑑H看詞形難以猜測(cè)詞語(yǔ)的具體含義。合稱(chēng)新詞語(yǔ)的構(gòu)詞方式符合人們一般認(rèn)知規(guī)律,一旦達(dá)到一定的使用頻率和通用性,就更有可能被規(guī)范型辭書(shū)收錄。
4. 反映社會(huì)、政治生活的新詞語(yǔ)更容易成熟
“創(chuàng)客、爆表、光盤(pán)行動(dòng)、工匠精神、中國(guó)夢(mèng)、四風(fēng)、三嚴(yán)三實(shí)、新常態(tài)、互聯(lián)網(wǎng)+、一帶一路、四個(gè)全面、五大發(fā)展理念”是反映社會(huì)、政治生活的新詞語(yǔ)?!冬F(xiàn)漢》第7版中收錄了大量反映社會(huì)、政治生活的新詞語(yǔ)。這說(shuō)明反映社會(huì)、政治生活的新詞語(yǔ)更容易成熟、更容易被辭書(shū)收錄。王利、張珊(2018)對(duì)比《現(xiàn)漢》第7版相比《現(xiàn)漢》第6版新增的詞語(yǔ)情況時(shí)也發(fā)現(xiàn)新增的詞語(yǔ)中源于社會(huì)生活、政治的新詞語(yǔ)數(shù)量最多?!罢Z(yǔ)文辭書(shū)作為特定時(shí)代編纂的工具書(shū),必然具有時(shí)代的烙??;作為文化的載體,必然傳播當(dāng)時(shí)的精神文明成果,也就必然帶有一定的思想性?!?潘雪蓮 2018)反映社會(huì)、政治生活的新詞語(yǔ)的收錄正是規(guī)范型辭書(shū)思想性在收詞方面的體現(xiàn)。
5. 新詞語(yǔ)其他特征及新詞語(yǔ)成熟難易性
諧音新詞語(yǔ)規(guī)范性普遍較差,數(shù)量也在逐年減少,大多難以發(fā)展到成熟階段,所以規(guī)范型辭書(shū)應(yīng)該慎收諧音新詞語(yǔ)。
雖然《新詞語(yǔ)表》中二、三字新詞語(yǔ)中類(lèi)詞綴構(gòu)詞占比很高,但《現(xiàn)漢》第7版只收錄了“創(chuàng)客”“學(xué)霸”這兩個(gè)類(lèi)詞綴構(gòu)成的詞,并且都是二字新詞語(yǔ),未收錄三字新詞語(yǔ)。此外,“~客”和“~霸”也不是構(gòu)詞能力最強(qiáng)的類(lèi)詞綴。我們可以大膽推斷,新詞語(yǔ)是否成熟和是否是類(lèi)詞綴構(gòu)詞關(guān)系并不大,類(lèi)詞綴參與構(gòu)成的新詞語(yǔ)除非特殊需要收錄的,一般都不是規(guī)范型辭書(shū)傾向收錄的詞語(yǔ)。
一些科技專(zhuān)有名詞,比如艾欣瞳(指我國(guó)科學(xué)家自主研發(fā)的全球首個(gè)完成臨床試驗(yàn)的生物工程角膜產(chǎn)品),疑似“愛(ài)心的瞳孔”的縮寫(xiě)和諧音,但難以查找其準(zhǔn)確出處。這樣的新詞語(yǔ)因?yàn)榉从钞?dāng)年科技新進(jìn)展而具有較高的使用頻次,但隨后如果沒(méi)有被持續(xù)普遍使用,也難以成熟。
除《現(xiàn)漢》第7版已經(jīng)收錄的新詞語(yǔ)外,還有許多《新詞語(yǔ)表》中的新詞語(yǔ)可以被收錄。僅僅依據(jù)詞語(yǔ)是否更容易成熟的靜態(tài)特征尚不能從《新詞語(yǔ)表》中挑出成熟的新詞語(yǔ),還需要能反映詞語(yǔ)是否穩(wěn)定成熟的動(dòng)態(tài)特征。我們需要用發(fā)展的眼光判斷初生、發(fā)展的新詞語(yǔ)是否在《新詞語(yǔ)表》收錄以后被廣泛接納、普遍使用。我們可以結(jié)合《高頻詞表》的數(shù)據(jù)并通過(guò)考察它們?cè)凇度嗣袢請(qǐng)?bào)》語(yǔ)料庫(kù)中的使用情況來(lái)對(duì)新詞語(yǔ)是否可以進(jìn)入辭書(shū)做出判斷。
1. 與《高頻詞表》對(duì)比增補(bǔ)新詞語(yǔ)
《新詞語(yǔ)表》中部分詞語(yǔ)也被《高頻詞表》收錄?!陡哳l詞表》記錄當(dāng)年媒體語(yǔ)料中出現(xiàn)頻率較高的詞語(yǔ),其研制使用的調(diào)查語(yǔ)料與研制《新詞語(yǔ)表》使用的調(diào)查語(yǔ)料接近,對(duì)比性高。新詞語(yǔ)被《高頻詞表》收錄,說(shuō)明詞語(yǔ)在當(dāng)年被高頻使用。因此,將《新詞語(yǔ)表》和歷年《高頻詞表》進(jìn)行對(duì)比,可以最準(zhǔn)確、最直接地反映新詞語(yǔ)的動(dòng)態(tài)使用情況。
以“奇葩”“套路”為例,“奇葩”“套路”分別在2011年和2010年開(kāi)始被《高頻詞表》收錄,但其使用頻次分別在2013年和2016年迎來(lái)大幅增長(zhǎng),在2013年和2016年被《新詞語(yǔ)表》收錄?!捌孑狻薄疤茁贰痹凇陡哳l詞表》中頻次大幅增長(zhǎng)的時(shí)間剛好與被《新詞語(yǔ)表》收錄的時(shí)間吻合。因此,這兩個(gè)詞應(yīng)該是“舊詞新義”的新詞,在賦予新的含義并大量使用后導(dǎo)致頻次發(fā)生了劇烈變化。“奇葩”“套路”均是二字詞、屬于“舊詞新義”,從靜態(tài)特征上看也屬于更容易成熟穩(wěn)定的類(lèi)型,規(guī)范型辭書(shū)可以考慮收錄。類(lèi)似的詞語(yǔ)還有“風(fēng)口、慕課、打賞、單獨(dú)、區(qū)塊鏈、精準(zhǔn)扶貧、兩學(xué)一做、四個(gè)意識(shí)”等。
“奇葩”“套路”在《高頻詞表》中的歷年頻次變化如圖1所示。
圖1 “奇葩”“套路”在《高頻詞表》中歷年頻次變化[6]
有的詞語(yǔ)雖然詞頻符合上述變化趨勢(shì),但由于不滿足易成熟新詞語(yǔ)的靜態(tài)特征,建議暫不收錄,比如“單獨(dú)二胎、微電影、校園貸、微信紅包”等。
2. 結(jié)合語(yǔ)料庫(kù)增補(bǔ)新詞語(yǔ)
《新詞語(yǔ)表》中大部分新詞語(yǔ)并未被《高頻詞表》收錄。為了檢測(cè)這部分新詞語(yǔ)的生存情況,可以借助語(yǔ)料庫(kù)對(duì)它們的使用情況進(jìn)行分析。蘇新春(2003)認(rèn)為《人民日?qǐng)?bào)》雖然偏于新聞?wù)Z體,且屬較正式的書(shū)面語(yǔ),但它覆蓋領(lǐng)域?qū)拸V,涵納內(nèi)容豐富,是其他語(yǔ)料難以相比的,更重要的是這些正好符合規(guī)范性辭書(shū)收詞的要求。本文選擇2009年—2018年《人民日?qǐng)?bào)》圖文數(shù)據(jù)庫(kù)中的文字部分作為語(yǔ)料進(jìn)行統(tǒng)計(jì)。
我們使用哈工大社會(huì)計(jì)算與信息檢索研究中心研發(fā)的“語(yǔ)言技術(shù)平臺(tái)(LTP)”[7]對(duì)《人民日?qǐng)?bào)》語(yǔ)料進(jìn)行分詞,為了更準(zhǔn)確地切分新詞語(yǔ),切分時(shí)將《新詞語(yǔ)表》作為分詞工具的用戶自定義詞表。分詞后進(jìn)行詞頻統(tǒng)計(jì),對(duì)《新詞語(yǔ)表》中新詞語(yǔ)在2010年—2018年《人民日?qǐng)?bào)》中出現(xiàn)的總頻次由大到小排序。排序結(jié)果顯示,排位前30名的新詞語(yǔ)有11個(gè)已經(jīng)被《現(xiàn)漢》第7版收錄[8],剩下的19個(gè)新詞語(yǔ)為:“新時(shí)代、擔(dān)當(dāng)、高原、小微、十三五、北約、精準(zhǔn)扶貧、獲得感、單獨(dú)、美麗中國(guó)、打電話、新征程、亞投行、飛躍、兩學(xué)一做、戰(zhàn)區(qū)、四個(gè)意識(shí)、數(shù)字經(jīng)濟(jì)、雄安新區(qū)”。
對(duì)比新詞語(yǔ)在《人民日?qǐng)?bào)》中歷年頻次變化可以獲知新詞語(yǔ)成熟的動(dòng)態(tài)特征。以頻次最高的“新時(shí)代”“擔(dān)當(dāng)”為例。
“新時(shí)代”是新詞新義,于2017年被《新詞語(yǔ)表》收錄,標(biāo)志著其進(jìn)入初生、發(fā)展階段。圖2也明確印證了這一點(diǎn),它的使用頻次在2017年急劇增長(zhǎng),隨后在2018年持續(xù)增長(zhǎng)。“新時(shí)代”雖然是三字詞,但卻是反映政治生活的新詞語(yǔ),因此可以對(duì)其使用情況持續(xù)觀察。如果其使用頻次依然持續(xù)較高,規(guī)范型辭書(shū)可以考慮收錄。
“擔(dān)當(dāng)”是舊詞新義,從《現(xiàn)漢》試用本起就被收錄,《現(xiàn)漢》第7版標(biāo)記其為動(dòng)詞,含義是“接受并負(fù)起責(zé)任”,新的含義是名詞,指在某方面承擔(dān)、負(fù)責(zé),起主要作用的人或物?!皳?dān)當(dāng)”于2015年被《新詞語(yǔ)表》收錄。從圖2的曲線變化也可以看到“擔(dān)當(dāng)”的頻次在2014年首次迎來(lái)較大幅度增長(zhǎng),疑似“擔(dān)當(dāng)”在更早的2014年就已經(jīng)進(jìn)入“初生”階段,隨后進(jìn)入長(zhǎng)期穩(wěn)定發(fā)展的階段,目前可視為具有一定成熟度的新詞語(yǔ)。最后,鑒于“擔(dān)當(dāng)”在近年《人民日?qǐng)?bào)》語(yǔ)料中使用的總頻次較高,歷年使用頻次趨于穩(wěn)定,也符合更容易成熟的新詞語(yǔ)的靜態(tài)特征,建議規(guī)范型辭書(shū)補(bǔ)充“擔(dān)當(dāng)”名詞用法的新義項(xiàng)。
“新時(shí)代”“擔(dān)當(dāng)”在《人民日?qǐng)?bào)》中的歷年頻次變化如圖2所示。
圖2 “新時(shí)代”“擔(dān)當(dāng)”在《人民日?qǐng)?bào)》中歷年頻次變化
依據(jù)語(yǔ)料庫(kù)統(tǒng)計(jì)新詞語(yǔ)頻次變化,可以作為詞語(yǔ)成熟的動(dòng)態(tài)特征,輔助辭書(shū)編纂中收錄新詞語(yǔ)。
《新詞語(yǔ)表》記錄當(dāng)年初生并發(fā)展到一定階段的新詞語(yǔ),辭書(shū)一般收錄某一段時(shí)間內(nèi)使用相對(duì)成熟的新詞語(yǔ)。雖然《新詞語(yǔ)表》收錄的新詞語(yǔ)不能直接進(jìn)入辭書(shū),但依然對(duì)辭書(shū)編纂尤其是增補(bǔ)新詞新義有參考價(jià)值,主要體現(xiàn)在以下幾個(gè)方面: (1) 《新詞語(yǔ)表》收錄新詞語(yǔ)數(shù)量較多,為整體分析當(dāng)今新詞語(yǔ)的基本面貌及形成特點(diǎn)提供了數(shù)據(jù)支持;(2) 《新詞語(yǔ)表》可以直接為辭書(shū)增補(bǔ)新詞新義提供候選詞;(3) 通過(guò)分析《現(xiàn)漢》第7版對(duì)《新詞語(yǔ)表》中新詞語(yǔ)的收錄情況,可以結(jié)合新詞語(yǔ)的形成特點(diǎn),了解具備哪些特點(diǎn)的新詞語(yǔ)更容易成熟,即有助于總結(jié)規(guī)范型辭書(shū)對(duì)新詞語(yǔ)的處理原則;(4) 借助《高頻詞表》或者加工處理后的文本語(yǔ)料庫(kù),不僅可以檢測(cè)新詞語(yǔ)歷年使用的頻次變化,印證新詞語(yǔ)的生存發(fā)展過(guò)程,也為辭書(shū)編纂中新詞新義的增補(bǔ)提供了新的思路和方法。
附 注
[1] 一般辭書(shū)相對(duì)于專(zhuān)門(mén)收錄新詞語(yǔ)的詞典而言。
[2] “習(xí)馬會(huì)”在2013年和2015年均有發(fā)布,釋義分別為“人們猜測(cè)、期待中的中國(guó)國(guó)家主席習(xí)近平與中國(guó)臺(tái)灣地區(qū)領(lǐng)導(dǎo)人馬英九之間的會(huì)晤”和“兩岸領(lǐng)導(dǎo)人習(xí)近平、馬英九于2015年11月7日在新加坡的會(huì)面”。本文將其視為2個(gè)不同的新詞語(yǔ)進(jìn)行處理。此外,2014年發(fā)布的“拼臉”“微拍”也存在類(lèi)似情況。
[3] 比如,“粉”是“粉絲”的簡(jiǎn)稱(chēng),而“粉絲”是英語(yǔ)單詞“fans”的音譯;“壕”是“土”和“豪”兩個(gè)字的合寫(xiě);“尬”原本只用在聯(lián)綿詞“尷尬”中,現(xiàn)已獨(dú)立為語(yǔ)素,指比較、比試,也指尷尬。
[4] 23個(gè)后附加類(lèi)詞綴為“~哥、~體、~門(mén)、~領(lǐng)、~客、~控、~奴、~族、~姐、~爺、~手、~日、~友、~商、~叔、~者、~熱、~吧、~霸、~東、~齡、~星、~系”,4個(gè)前附加的類(lèi)詞綴為“被~、零~、后~、亞~等”。
[5] 8個(gè)“舊詞新義”新詞語(yǔ)分別為“吐槽、備胎、逆襲、爆表、土豪、學(xué)霸、任性、工匠精神”,界定依據(jù)為《新詞語(yǔ)表》對(duì)新詞語(yǔ)的釋義。
[6] 這里的百萬(wàn)詞頻次=詞語(yǔ)的頻次×1000000/總頻次,下同。
[7] 語(yǔ)言技術(shù)平臺(tái)主頁(yè): http: ∥ltp.ai/,本文使用的版本為3.4.0。
[8] 被《現(xiàn)漢》第7版收錄的11個(gè)新詞語(yǔ)分別為“一帶一路、中國(guó)夢(mèng)、微信、新常態(tài)、互聯(lián)網(wǎng)+、正能量、四風(fēng)、四個(gè)全面、點(diǎn)贊、三嚴(yán)三實(shí)、創(chuàng)客”。