佟玉平 汪琳
摘要:計(jì)量文體學(xué)作為一種新的文體學(xué)研究方法,將語(yǔ)言學(xué)與計(jì)算機(jī)技術(shù)密切結(jié)合,對(duì)文章的語(yǔ)言特色進(jìn)行定量分析,對(duì)文章的語(yǔ)言用詞方式、語(yǔ)言規(guī)律進(jìn)行描述。總統(tǒng)就職演講作為一種典型的政治性文體,對(duì)其語(yǔ)言規(guī)律進(jìn)行歷時(shí)性探索可以看出,在美國(guó)兩百多年的歷史里演講這種文體的語(yǔ)言進(jìn)化過(guò)程。從最開(kāi)始的探索過(guò)程到逐漸意識(shí)到演講對(duì)群眾的煽動(dòng)作用,演講的用詞開(kāi)始形成一個(gè)整體的規(guī)律。
關(guān)鍵詞:計(jì)量文體學(xué) 總統(tǒng)就職演講 語(yǔ)料庫(kù)
中圖分類(lèi)號(hào):H315 ?文獻(xiàn)標(biāo)識(shí)碼:A ?文章編號(hào):1009—5349(2019)19—0116—02
總統(tǒng)的就職演講實(shí)際上是借用演講的語(yǔ)言技巧來(lái)塑造新總統(tǒng)的良好形象,甚至向觀眾展示語(yǔ)言背后隱藏的意識(shí)形態(tài)。目前國(guó)內(nèi)學(xué)者對(duì)總統(tǒng)就職演講的研究涉及語(yǔ)法隱喻、人際意義分析、文體分析、中美領(lǐng)導(dǎo)人語(yǔ)言特色分析、話語(yǔ)策略研究,以及系統(tǒng)功能語(yǔ)法框架下的批評(píng)話語(yǔ)分析、評(píng)價(jià)理論分析等多個(gè)領(lǐng)域。本文將從文章的用詞風(fēng)格和文體特征這一方向出發(fā),通過(guò)計(jì)量文體學(xué)理論從歷時(shí)分析的角度對(duì)總統(tǒng)就職演講這一文體進(jìn)行概括總結(jié)。
一、文獻(xiàn)綜述
計(jì)量文體學(xué)基于語(yǔ)料庫(kù)的研究,以計(jì)量的方式定量地分析文本,在語(yǔ)料庫(kù)語(yǔ)言學(xué)的基礎(chǔ)上對(duì)文本進(jìn)行更深入的統(tǒng)計(jì)與分析。Leech和Short早就認(rèn)為文體學(xué)需要統(tǒng)計(jì)這種定量分析來(lái)獲得客觀的分析結(jié)果,以支撐對(duì)語(yǔ)篇文體特征的主觀判斷。[1]Enkvist也曾認(rèn)定文體特征具有統(tǒng)計(jì)學(xué)原理。他認(rèn)為文體標(biāo)記在不同文本內(nèi)出現(xiàn)的密度顯著不同,這就是語(yǔ)言文體學(xué)被稱(chēng)為定量科學(xué)的原因。[2]計(jì)量文體學(xué)中一項(xiàng)流行的研究是測(cè)定文體。它研究不同語(yǔ)篇中的詞長(zhǎng)、句長(zhǎng)等特征以確定其作用。[3]
本文將對(duì)美國(guó)總統(tǒng)就職演講這一特殊文體進(jìn)行計(jì)量文體學(xué)分析,以一種全新的角度觀察總統(tǒng)就職演講這一文體的歷時(shí)發(fā)展過(guò)程,觀察隨著時(shí)間的變化對(duì)語(yǔ)言發(fā)展的影響。計(jì)量文體學(xué)、語(yǔ)料庫(kù)語(yǔ)言學(xué)等研究中經(jīng)常以AntConc,Wordsmith等語(yǔ)料庫(kù)工具進(jìn)行分析。本文在分析工具方面大膽創(chuàng)新,將語(yǔ)言學(xué)與計(jì)算機(jī)更深入地結(jié)合,用人工智能領(lǐng)域的編程語(yǔ)言python的文本分析功能對(duì)總統(tǒng)就職演講進(jìn)行計(jì)量文體學(xué)分析。
二、整個(gè)就職演講語(yǔ)料庫(kù)的語(yǔ)言特征
首先,使用python中的nltk(自然語(yǔ)言工具包)下載所有的語(yǔ)料庫(kù)資源。它包含了大量語(yǔ)料庫(kù)資源,如古登堡語(yǔ)料庫(kù)、布朗語(yǔ)料庫(kù)、就職演講語(yǔ)料庫(kù)、路透社語(yǔ)料庫(kù)等,python也有第三方庫(kù),科學(xué)計(jì)算包numpy和scipy可以幫助計(jì)算語(yǔ)料庫(kù)翻譯中常用的定量指標(biāo)。計(jì)算完成后,利用統(tǒng)計(jì)模塊對(duì)數(shù)據(jù)進(jìn)行均勻性檢驗(yàn)、方差分析和卡方分析。描述性統(tǒng)計(jì)也可以通過(guò)繪圖庫(kù)matplotlib可視化。[4]
總統(tǒng)就職演講的總形符數(shù)是135689;總類(lèi)符數(shù)是9097。這意味著總統(tǒng)就職演講語(yǔ)料庫(kù)中有135689個(gè)單詞和9097個(gè)詞匯。形符數(shù)除以類(lèi)符數(shù)的百分比為13.99%,標(biāo)準(zhǔn)百分比為42.4%。從這個(gè)判斷來(lái)看,詞匯密度應(yīng)該是一般的。在總統(tǒng)就職演講中共有4191個(gè)低頻詞。如果我們不看上下文,就很難用低頻詞來(lái)理解文本主題。就職演說(shuō)語(yǔ)料庫(kù)中最常見(jiàn)的詞是3個(gè)字母的詞。接下來(lái)是2個(gè)字母的單詞,第三個(gè)是4個(gè)字母的單詞,然后是1個(gè)字母的單詞。超過(guò)一半的單詞不超過(guò)4個(gè)字母。最長(zhǎng)的單詞有17個(gè)字母,最短的單詞有1個(gè)字母。
還可以看出,只有4906個(gè)詞重復(fù)使用,起著重要的語(yǔ)義作用。因此對(duì)文本的分析研究實(shí)際上是集中在這些重復(fù)和經(jīng)常使用的4906個(gè)詞上。
三、歷時(shí)性語(yǔ)言特征
不同的總統(tǒng)在演講時(shí)可能有自己的語(yǔ)言風(fēng)格和習(xí)慣。因此,在總結(jié)就職演說(shuō)語(yǔ)料庫(kù)整體語(yǔ)言特征的基礎(chǔ)上,從不同總統(tǒng)語(yǔ)言習(xí)慣的角度分析其語(yǔ)言特征。
使用python編程,可以方便地獲取總字符數(shù)、單詞平均長(zhǎng)度、英語(yǔ)單詞總數(shù)、句子數(shù)、平均句子長(zhǎng)度、詞匯數(shù)和單詞重復(fù)次數(shù)等數(shù)據(jù)。根據(jù)單詞和句子的因素,獲得的數(shù)據(jù)將重新整合到表1中。
表1可以看出,單詞數(shù)最多的年份是1841年,而單詞數(shù)最少的年份是1793年。據(jù)統(tǒng)計(jì),在長(zhǎng)度上有四個(gè)不同的階段:(1)建國(guó)初期,從第一任總統(tǒng)到第四任總統(tǒng),大部分演講都是有接近一萬(wàn)的字符數(shù)。此時(shí),話題相對(duì)有限。例如,華盛頓的第二次演講只說(shuō)我來(lái)這里向你們宣誓。(2)從第五屆到第十六屆總統(tǒng)林肯,演講字?jǐn)?shù)急劇增加,增加了一倍多,有超過(guò)5000字的演講,以第九屆總統(tǒng)哈里斯為代表。他的演講共8464個(gè)字。這是從“門(mén)羅派”到內(nèi)戰(zhàn)結(jié)束的時(shí)期。(3)內(nèi)戰(zhàn)后,胡佛第31次大蕭條是美國(guó)經(jīng)濟(jì)發(fā)展成為世界強(qiáng)國(guó)時(shí)期。這一時(shí)期的講話時(shí)間較長(zhǎng),但總體上減少了。(4)從第32位羅斯福到現(xiàn)在的特朗普,篇幅大大縮短了。隨著時(shí)間的變化,總統(tǒng)就職演說(shuō)越來(lái)越多地使用了簡(jiǎn)短的詞語(yǔ),這似乎與時(shí)代的變化是一致的,演說(shuō)越來(lái)越簡(jiǎn)潔。
從“平均句子長(zhǎng)度”和“單詞重復(fù)次數(shù)”兩列來(lái)看,近百年來(lái),句子越來(lái)越短,單詞越來(lái)越短,詞匯重復(fù)次數(shù)也越來(lái)越多,這一點(diǎn)更為明顯。
總統(tǒng)的講話通常是1個(gè)小時(shí)左右。最長(zhǎng)的是1841年威廉哈里森總統(tǒng)的演講,長(zhǎng)達(dá)2小時(shí)。但是總統(tǒng)演講的時(shí)間越來(lái)越短,基本上大約是20分鐘。
四、結(jié)語(yǔ)
作為一種特殊的政治性演講,總統(tǒng)就職演講是一種非常具有代表性的珍貴語(yǔ)料。本文從計(jì)量文體學(xué)角度出發(fā)對(duì)總統(tǒng)就職演講的語(yǔ)言特征進(jìn)行分析。得到結(jié)論為總統(tǒng)就職演講的詞匯密度一般。近百年來(lái),句子越來(lái)越短,單詞越來(lái)越短,詞匯重復(fù)次數(shù)也越來(lái)越多。作為一種政治性演講,其規(guī)律性越來(lái)越強(qiáng),在語(yǔ)言使用層面也趨向規(guī)律性和簡(jiǎn)潔性。
參考文獻(xiàn):
[1]McEnery,Tony& Andrew W.CorpusLinguistics.An Introduction[M].Edingburgh:Edingburgh University Press,2006.
[2]桂詩(shī)春,寧春巖.語(yǔ)言學(xué)研究方法[M].北京:外語(yǔ)教學(xué)與研究出版社,2005.
[3]胡壯麟,劉世生.西方文體學(xué)辭典[Z].北京:清華大學(xué)出版社,2004.
[4]王天奇,管新潮.語(yǔ)料庫(kù)語(yǔ)言學(xué)研究的技術(shù)拓展——“Python文本分析:用可實(shí)現(xiàn)的方法挖掘數(shù)據(jù)價(jià)值”[J].評(píng)外語(yǔ)電化教學(xué),2017(10):177. ? ? ? ? ? ? ?責(zé)任編輯:趙慧敏