亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        辭書編纂現(xiàn)代化趨勢下的新詞語詞典編纂——評《2007漢語新詞語》《2008漢語新詞語》

        2011-04-02 02:28:13周明海
        辭書研究 2011年4期
        關(guān)鍵詞:編年新義辭書

        周明海

        國家語委于2005年啟動的“新詞語編年本”課題目前已推出了《2006漢語新詞語》《2007漢語新詞語》《2008漢語新詞語》三本編年本漢語新詞語,今后還將繼續(xù)推出更多的系列研究成果。這三本詞典是繼于根元等編纂的四本新詞語編年本(1991-1994)之后的又一編年本新詞語系列詞典。其中《2007漢語新詞語》《2008漢語新詞語》(下文簡稱“07、08漢語新詞語”)由教育部語言文字信息管理司策劃,侯敏、周薦主編,商務(wù)印書館出版,屬于中國語言生活綠皮書B卷系列。

        一、普通意義上的新詞語詞典

        “07、08漢語新詞語”具有普通新詞語詞典及其他編年本新詞語詞典所具有的作用和意義:

        (一)“07、08漢語新詞語”是社會變化的晴雨表,是思維認知動向的鏡子

        《2008漢語新詞語》中的“范跑跑”、“郭跳跳”看似只是兩個很普通的新詞語,卻記錄了“5.12”汶川地震這一歷史災難,記錄了此次災難催生的社會現(xiàn)象——“范跑跑”事件、“郭跳跳”事件,是社會現(xiàn)象、社會變化的忠實記錄者。同時這兩個新詞語也折射了人們對社會現(xiàn)象的認識態(tài)度,范美忠臨震一“跑”和挑戰(zhàn)國民容忍度的言論,引發(fā)了一場道德倫理大討論,用“范跑跑”來“泛指那些標榜自由主義,遇到險境不顧他人、一心自保的人”明顯可以看出國人對此事的認知評價態(tài)度。

        (二)“07、08漢語新詞語”的編寫不僅具有詞典學上的意義,而且還具有詞源學、歷史學、文化學、心理學等方面的意義

        “07、08漢語新詞語”作為新詞語詞典,可以為人們查解困難提供幫助,具有詞典學的意義,但同其他新詞語詞典一樣,“07、08漢語新詞語”的意義絕非僅限于此。雖然“07、08漢語新詞語”收錄的很多新詞不為大眾所熟知,也有很多新詞只是曇花一現(xiàn),但其卻記錄了新詞產(chǎn)生的背景、原因、所指等一系列內(nèi)容,這些知識是后人了解我們這個時代的重要線索,具有詞源學意義?!?7、08漢語新詞語”中有一些新詞語是記錄社會時事的,如“3.14”事件、“5.12”汶川大地震、“三鹿”事件等,這些事件有的不會進入正規(guī)的歷史書,但“07、08漢語新詞語”收錄了,可以作為歷史書的補充。從這個角度來看,“07、08漢語新詞語”具有歷史學的意義,是小部頭的編年史,有一定的時效性。同時,“07、08漢語新詞語”也傳承著人類文化,折射著人們的認知心理,如“山寨”反映了當下人們?nèi)遮呁ㄋ谆痛蟊娀膶徝廊∠?代表了基層人民的心聲,形成了一種特殊的草根文化,同時也反映了民眾“去主流化”的心理狀態(tài),具有心理學上的意義。

        二、辭書編纂現(xiàn)代化下的新詞語詞典

        李宇明(2006)在《關(guān)于辭書現(xiàn)代化的思考》中指出,“辭書編纂手段現(xiàn)代化其現(xiàn)實含義就是在整個辭書編纂過程中充分使用數(shù)字技術(shù)和各種數(shù)據(jù)庫,具體說,就是開發(fā)功能強大的語料庫、知識庫和適用于辭書編纂的軟件系統(tǒng)”。其中特別強調(diào)了辭書編纂手段的現(xiàn)代化。我們認為辭書編纂現(xiàn)代化還應包括辭書編纂理念的現(xiàn)代化,即以讀者為中心,提供更多和更準確的詞目、釋義、例句和背景知識。作為新世紀具有真正意義的編年本新詞語,“07、08漢語新詞語”是辭書編纂現(xiàn)代化趨勢下的新成果,在編纂過程中充分體現(xiàn)了辭書編纂手段和辭書編纂理念的現(xiàn)代化,具體表現(xiàn)如下:

        (一)巨型、動態(tài)語料庫的運用

        詞典編纂語料庫是現(xiàn)代化辭書編纂的基礎(chǔ),而編年本新詞語的編纂對此要求則更高:一方面要求有足夠大的語料庫,這樣得出的新詞語才能全面、權(quán)威;另一方面要求語料庫必須能夠得到及時更新,這樣才能實現(xiàn)編年,才能得到真正的“新”詞語,而國家語言監(jiān)測中心的動態(tài)語料庫恰好滿足了這一要求。

        “07、08漢語新詞語”正是在巨型、動態(tài)語料庫基礎(chǔ)上進行編纂的?!?007漢語新詞語》所用語料均來自國家語言資源監(jiān)測語料庫(包括平面媒體、有聲媒體、網(wǎng)絡(luò)媒體),共計1 363 747個文本文件,1 236 120 162字符次,1 007 053 180字次。其中平面媒體選擇了2007年《北京青年報》《北京日報》《南方周末》等15種報紙作為調(diào)查語料,廣播電視語料包括中央電視臺、北京電視臺等媒體的282個欄目,網(wǎng)絡(luò)媒體語料選擇了新浪、騰訊兩個網(wǎng)站的全部年度新聞?wù)Z料。[1]

        《2008漢語新詞語》所使用的語料庫在原有語料來源的基礎(chǔ)上增加了《新民晚報》2008年全年語料,廣播電視語料、網(wǎng)絡(luò)媒體語料基本維持了2007年的風格,共計1 441 090個文本文件,1 273 286 677字符次,1 032 847 155字次,如此規(guī)模的語料庫和最及時的動態(tài)更新是傳統(tǒng)新詞語詞典和其他新詞語詞典難以做到的。[2]

        (二)計算機自動提取新詞語技術(shù)的應用

        王鐵琨在《2006漢語新詞語》序言中指出“抽選年度漢語新詞語詞條,最理想的方式是利用現(xiàn)代信息技術(shù)手段,在已經(jīng)建立的國家語言資源動態(tài)流通語料庫中自動提取。但囿于目前研究和技術(shù)手段的某些局限,計算機自動提取漢語新詞語的研究尚未取得明顯的進展和實質(zhì)性的突破。”而“07、08漢語新詞語”在這方面有了長足的進步。

        “07、08漢語新詞語”的調(diào)查采用的是“機器+人工”的方法,07年的編纂程序大致如下:語料全切分(保留2-9字的符號串)※計算符號串的歸一化使用率※重復上兩步的方法生成2004、2005、2006各年度數(shù)據(jù)表(即參照底表,也稱為背景詞表)※計算年使用率差并進行比較※按條件對符號串進行過濾※回查過濾掉的符號串※使用網(wǎng)絡(luò)自動搜集的方法從網(wǎng)絡(luò)(新聞)提取候選新詞語※形成新詞語候選集※人工排除非詞條目和專有名詞※利用百度、谷歌等搜索工具確認最初出現(xiàn)的時間等※放到新浪網(wǎng)上,面向社會廣泛征求意見※專家審定,剔除偶發(fā)的、不易確定時間的以及品位低下的詞語※與周薦教授及其團隊所做的新詞語合并起來,去除重復者,又經(jīng)過若干調(diào)整※《2007漢語新詞語》。

        《2008漢語新詞語》在上述技術(shù)路線的基礎(chǔ)上,又增加了特征對比法。當一個詞語或一個意義剛剛產(chǎn)生的時候,人們使用它時往往會有一些形式上的特征,如用引號或括號標記出來,在提取2008年新詞語時,他們充分利用這一點,彌補了“全切分對比法”過濾掉一些低頻新詞的不足。

        與《2006漢語新詞語》及其他新詞語詞典主要由人工進行編纂的方法相比,“07、08漢語新詞語”編纂考察的語料更多、得出的候選集也更大,再輔以人工排查,質(zhì)量高、權(quán)威性強。

        (三)“07、08漢語新詞語”收詞更加全面,釋義更加準確,例句更為豐富,提供的知識更為廣闊

        “07、08漢語新詞語”真實地記錄這一年內(nèi)出現(xiàn)的新詞、新語和舊有詞的新義與新用法,分別給予注音,給出詞類、釋義和用例,具有一般新詞語詞典的特點。但由于其編寫是在“寬容、全面、前瞻”的原則指引下,建立在巨型、動態(tài)語料庫的基礎(chǔ)上,并輔以先進的計算機編纂技術(shù),因而其收詞更全面,尤其是“相關(guān)詞語”這一模塊,它鏈接了相關(guān)詞語,擴大了所收詞語的規(guī)模,也為詞群、詞族研究提供了素材。(侯敏2010)在巨型、動態(tài)語料庫的基礎(chǔ)上考察新詞語,也使“07、08漢語新詞語”釋義更準確,選用的例句也更為豐富、恰當。除此之外,“07、08漢語新詞語”給出了“知識窗”,該模塊進一步補充解釋新詞語,給人們提供了更多的背景知識,為后人考察我們這個時代留下了“痕跡”。

        此外,《2008漢語新詞語》附錄中給出了新詞語的頻次、文本數(shù),這是其編纂體例上的又一大閃光點。人們利用這些信息可以更加深入地了解新詞語的使用情況,還可以做進一步的跟蹤研究。

        (四)編纂者態(tài)度嚴謹,充分發(fā)揮群眾的力量

        《2008漢語新詞語》附錄中補收了2007年產(chǎn)生的新詞、新語和舊有詞語的新義與新用法72條,一方面這是運用新技術(shù)、新方法的成果,另一方面也說明項目工作者本著為讀者服務(wù)的態(tài)度不回避先前存在的問題,將以前沒發(fā)現(xiàn)的新詞、新語、新義或新用法補上,這是學界值得提倡的精神。

        專家、網(wǎng)友互動也是“07、08漢語新詞語”的一個創(chuàng)新?!?7、08漢語新詞語”項目組將收集到的新詞語先放在新浪等網(wǎng)站上讓網(wǎng)民進行評議,經(jīng)過評議后,再把大家認可的、品位較高的詞語收錄到“07、08漢語新詞語”里。這不僅讓廣大網(wǎng)民發(fā)揮了話語權(quán),也使得最終的結(jié)果充分體現(xiàn)網(wǎng)民的意愿,所得結(jié)果也更容易為廣大群眾接受。

        三、有待提高之處

        “07、08漢語新詞語”在編纂手段、編纂理念等方面都有了長足的進步,但也存在需要進一步提高的地方。

        (一)如何提高提取速度

        “全切分對比法”雖然保證了新詞語全部都在切出的符號串中,但這是以犧牲時間為代價的。我們選取2010年《每日新聞》1萬字的語料進行全切分實驗,共切出約5.4萬個符號串,據(jù)此估算,《2007漢語新詞語》所用的10億多字的語料會切分出約54億個符號串,這樣,無論是在全切分階段還是在歸一化使用率和年使用率差計算階段都必然要耗費大量的時間。如何使基數(shù)變小或是在全切分后先去掉一部分必然不是新詞的符號串是提高提取速度亟待解決的問題。

        (二)如何提高自動化程度

        由于基數(shù)大的緣故,經(jīng)過年使用率差計算和對垃圾串過濾后得到的新詞語候選集還有近5萬條,從中篩選出不到500條的新詞語,工作量之大可想而知,這就需要項目組進一步提高自動化程度。目前項目組新詞語提取走的是概率統(tǒng)計的路線,如何在后期加入規(guī)則進行機器篩選是提高自動化程度應關(guān)注的又一方面。

        (三)如何提取舊詞新義詞語

        “07、08漢語新詞語”所走的技術(shù)路線能提取到的依然是新詞形,對于新詞義的自動提取還需要進一步的深入研究(侯敏2010)。通過分析發(fā)現(xiàn),《2008漢語新詞語》所用的“特征對比法”從理論上來說是可以提取舊詞新義詞語的。2008年共收19個舊詞新義詞語,有15個在例句中帶有引號,占總數(shù)的78.95%,剩余的4個也都能從網(wǎng)上檢索到帶引號的例子。這說明舊詞新義詞語開始出現(xiàn)的時候一般是帶有引號等特征的,而原義一般是沒有特征標記的,這樣,將前景詞表中帶特征的符號串和底表中不帶特征的符號串進行比較,共有的部分就是舊詞新義詞語的候選集。

        (四)如何更全面地保留新詞語

        有學者認為,漢語每年產(chǎn)生的新詞有一千個左右;我們對亢世勇的《新詞語大詞典》進行統(tǒng)計發(fā)現(xiàn)平均每年大約有八百條新詞語產(chǎn)生?!?7、08漢語新詞語”受原則、標準、篇幅等方面的規(guī)約,每年收詞400多條,約為統(tǒng)計平均值的一半。筆者認為,對于使用率低、格調(diào)有爭議的詞,可以為其專辟版塊,這樣一方面可以更加如實地記錄新詞語,另一方面也為后續(xù)研究留下鮮活的資料。畢竟,新詞語是記載、傳承歷史文化的一條重要途徑,是國家重要的語言資源,完整地加以保留不失為一個明智的嘗試。

        四、結(jié) 語

        李宇明(2009)在教育部、魯東大學共建漢語辭書研究中心揭牌儀式上的講話中指出“語料庫、知識庫和一套軟件系統(tǒng),可以稱之為辭書編纂的`三大法寶'”。侯敏、周薦先生很大程度上擁有了這“三大法寶”,我們期待著更多的編年本漢語新詞語詞典的出版,從而學習到最新的編纂理念,借鑒到最成功的技術(shù)手段,吸收到最豐富的編纂經(jīng)驗。

        附 注

        [1] 參見:王鐵琨主編.中國語言生活狀況報告2007.北京:商務(wù)印書館,2008.

        [2] 參見:侯敏,周薦.2008漢語新詞語.北京:商務(wù)印書館,2009.

        1.侯敏.關(guān)于新詞語編年本編纂的思考.辭書研究,2010(2).

        2.侯敏,周薦.2007漢語新詞語.北京:商務(wù)印書館,2008.

        3.樂嘉民,亢世勇.辭書編纂現(xiàn)代化研究.上海:上海辭書出版社,2009.

        4.李宇明.關(guān)于辭書現(xiàn)代化的思考.語文研究,2006(3).

        5.周薦,侯敏.2006漢語新詞語.北京:商務(wù)印書館,2007.

        猜你喜歡
        編年新義辭書
        貴州土司史籍編年系列總序
        尋根(2022年2期)2022-04-17 11:01:38
        CISHU YANJIU LEXICOGRAPHICAL STUDIES
        辭書研究(2022年2期)2022-03-19 23:04:19
        大型辭書疑難字考釋七則
        索尼微單TM相機編年冊
        攝影世界(2020年12期)2020-12-06 10:48:57
        舊裙新義
        從異解看成語新義的形成
        “奇葩”一詞的發(fā)展變化及原因
        文學教育(2017年11期)2017-10-23 13:19:58
        蘇詞編年百年回顧與反思
        影像編年:色彩美學、造型風格與跨界追求——論導演張藝謀
        電影新作(2016年1期)2016-02-27 09:15:44
        あたらずといえどもとおからず
        蜜臀久久久精品国产亚洲av| 国产亚洲av综合人人澡精品| 精品国产成人亚洲午夜福利| 26uuu欧美日本在线播放| 国产亚洲精品在线播放| 人妻少妇精品久久久久久| 国产一线二线三线女| 久久99精品久久久66| 少妇高潮免费在线观看| 大尺度无遮挡激烈床震网站| 国产精品18久久久久久麻辣| 毛片无码高潮喷白浆视频| 亚洲综合新区一区二区| 亚洲av不卡无码国产| 亚洲精品国产av成拍色拍| 久久天天躁狠狠躁夜夜中文字幕 | 91制服丝袜| 男女在线免费视频网站| 一级黄色一区二区三区| 国产一区二区三区乱码| 四虎影永久在线观看精品| 人妻丰满少妇一二三区| 国产在线一区二区三区四区不卡| 黑色丝袜秘书夹住巨龙摩擦| 国产精品入口牛牛影视| av网站在线观看二区| 伊人久久大香线蕉av不变影院| 蜜臀av在线一区二区尤物| 亚洲av无码乱码在线观看牲色| 国产深夜男女无套内射| 中文人成影院| 综合久久加勒比天然素人| 无码喷潮a片无码高潮| 人成午夜免费大片| 欧洲一级无码AV毛片免费| 扒开美女内裤舔出白水| 国产av综合影院| 亚洲国产欧美另类va在线观看| 天堂一区二区三区精品| 女的扒开尿口让男人桶30分钟| 国产爽爽视频在线|