王楠
摘 要:本文利用個(gè)人文學(xué)作品語料庫,借助FOXPRO程序和SPSS軟件,對(duì)西奧多·德萊塞和簡(jiǎn)·奧斯汀的文學(xué)作品進(jìn)行類符/形符比和平均句子長(zhǎng)度的統(tǒng)計(jì)分析,以期通過文學(xué)作品的語料庫檢索結(jié)果,挖掘作品背后的文化差異。
關(guān)鍵詞:形符 類符 平均句子長(zhǎng)度 文化差異
中圖分類號(hào):G4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1673-9795(2014)03(a)-0115-02
隨著語料庫語言學(xué)在我國(guó)的興起,越來越多的學(xué)者開始采用語料庫語言學(xué)的研究方法和手段對(duì)英美文學(xué)作品進(jìn)行語料檢索和文本解讀。由于語料庫具有容量大、語料真實(shí)、檢索準(zhǔn)確快捷等獨(dú)特的優(yōu)勢(shì),運(yùn)用語料庫手段來分析文學(xué)作品可以減少研究者主觀因素的影響,為研究結(jié)論提供更為客觀、科學(xué)的數(shù)據(jù)支撐?;谡Z料庫的文學(xué)作品研究大多是運(yùn)用語料庫檢索軟件,從詞匯分布,句子特征,人物刻畫和修辭手法等角度對(duì)文本進(jìn)行檢索分析,從而更直觀地了解作品的主題內(nèi)涵和作家的寫作風(fēng)格。本文借助語料庫技術(shù)和計(jì)算機(jī)程序(FOXPRO),以文本的類符/形符比和平均句子長(zhǎng)度為切入點(diǎn),從一個(gè)全新的角度來挖掘作品背后的文化差異。
1 語料來源和研究方法
本文采用定量和定性相結(jié)合的方法,自建語料庫,對(duì)西奧多·德萊塞和簡(jiǎn)·奧斯汀這兩位作家文學(xué)作品的類符/形符比和平均句子長(zhǎng)度進(jìn)行比較分析。語料庫的建構(gòu)主要包括文本收集、文本整理以及文本的標(biāo)注等步驟。本研究分別選取西奧多·德萊塞和簡(jiǎn)·奧斯汀兩位作家的小說類作品為語料建立小型的個(gè)人文學(xué)作品語料庫A和B,包括了《嘉莉妹妹》、《珍妮姑娘》、《理智與情感》、《傲慢與偏見》等著名英語文學(xué)作品。在文本處理中,刪除所有冗余信息,只保留文章的題目和正文。運(yùn)行FOXPRO程序1,得到兩位作家文學(xué)作品庫的形符數(shù)和類符數(shù),分別計(jì)算出文本的類符/形符比。然后,運(yùn)行FOXPRO程序2,將兩個(gè)文學(xué)作品庫中的文本分成句子,每個(gè)句子占一行,得到每個(gè)文學(xué)作品庫中文本所含句子的總數(shù),分別計(jì)算出語料庫A和B中文本的平均句子長(zhǎng)度。最后,用SPSS對(duì)所得數(shù)據(jù)進(jìn)行差異的顯著性檢驗(yàn)。
2 研究結(jié)果
兩個(gè)作品庫的文本檢索統(tǒng)計(jì)結(jié)果顯示:西奧多·德萊塞作品庫(A)的形符數(shù)為266552,類符數(shù)為8792,類符/形符比為3.30。簡(jiǎn)·奧斯汀作品庫(B)的形符數(shù)為167296,類符數(shù)為5088,類符/形符比為3.04。根據(jù)梁茂成等(2010)對(duì)形符、類符的定義:“形符(token)是一個(gè)語言單位,類似于我們?nèi)粘Kf的詞,文本有多少個(gè)詞,就有多少個(gè)形符。總形符數(shù)是語料庫容量的最常用的測(cè)量單位。類符(type)是一個(gè)統(tǒng)計(jì)單位,指不重復(fù)計(jì)算的形符數(shù)。在一個(gè)文本中,重復(fù)出現(xiàn)的形符只能看作一個(gè)類符。一個(gè)文本的類符數(shù)就是該文本不同詞形的數(shù)量。”類符/形符比常用來計(jì)算文本的詞匯密度。詞匯密度在一定程度上反映了文本的某種本質(zhì)特征,即用詞的多樣性。通過卡方檢驗(yàn),對(duì)于形符數(shù)、類符數(shù)以及類符/形符比在0.05的顯著性水平上只是接近具有顯著意義的水平。由以上統(tǒng)計(jì)數(shù)據(jù)可以看出,兩個(gè)作品庫在詞匯密度上的差異并不顯著,西奧多·德萊塞作品庫(A)的詞匯量相對(duì)豐富,詞匯使用相對(duì)靈活。運(yùn)行FOXPRO程序2,得到西奧多·德萊塞作品庫(A)的句子總數(shù)為22752,平均句子長(zhǎng)度為12個(gè)詞,屬于中短句范疇;而簡(jiǎn)·奧斯汀作品庫(B)的句子總數(shù)為7380,平均句子長(zhǎng)度為23個(gè)詞,屬于中長(zhǎng)句范疇。最后,用SPSS進(jìn)行統(tǒng)計(jì)得到作品庫A和B中最長(zhǎng)句分別為75詞和128詞,標(biāo)準(zhǔn)差分別是8.36和19.40。標(biāo)準(zhǔn)差是各數(shù)據(jù)偏離平均數(shù)的距離平方的平均數(shù),它能反映出一個(gè)數(shù)據(jù)集的離散程度。兩組數(shù)據(jù)的標(biāo)準(zhǔn)差反映了A組數(shù)據(jù)分布相對(duì)集中,而B組數(shù)據(jù)分布離散,即簡(jiǎn)·奧斯汀作品庫(B)中句子較長(zhǎng),且句子長(zhǎng)度的差異較大。
3 結(jié)果分析
由以上統(tǒng)計(jì)結(jié)果,兩個(gè)作品庫文本的平均句子長(zhǎng)度和最長(zhǎng)句子長(zhǎng)度差異顯著,即西奧多·德萊塞作品庫的平均句子長(zhǎng)度要小于簡(jiǎn)·奧斯汀作品庫的平均句子長(zhǎng)度。中短句并不是德萊塞作品的風(fēng)格。同其它美國(guó)文學(xué)作品相比,德萊賽的作品充滿長(zhǎng)句,對(duì)細(xì)節(jié)有著極大的關(guān)注。然而,同英國(guó)作家簡(jiǎn)·奧斯汀的作品相比,美國(guó)文學(xué)中以長(zhǎng)句著稱的德萊賽作品的句子似乎短了許多。本文嘗試從兩位作家所屬文化和生活時(shí)代這兩個(gè)方面來解讀其作品句子長(zhǎng)度的顯著差異。首先,西奧多·德萊塞和簡(jiǎn)·奧斯汀有著不同的文化背景,即英美文化差異。在不同的文化背景下,人們的觀念各不相同,而觀念的差異又會(huì)造成語言使用方面的差異。比起美國(guó)人快速緊張的生活,英國(guó)人的生活節(jié)奏相對(duì)悠閑,做事情喜歡按部就班、不緊不慢。英國(guó)人喝下午茶的習(xí)慣就是一個(gè)很好的體現(xiàn)。有著很強(qiáng)的時(shí)間觀念的美國(guó)人在使用語言上往往簡(jiǎn)明扼要、直截了當(dāng)。無論是日常交際還是書面表達(dá),他們都主張開門見山、直接切題。他們認(rèn)為時(shí)間是一種有限的資源,要想方設(shè)法在有限的時(shí)間里完成更多的工作,甚至覺得花過長(zhǎng)的時(shí)間對(duì)話是一種浪費(fèi)。受各自觀念的影響,美國(guó)人更喜歡簡(jiǎn)短易懂的短句表達(dá),而英國(guó)人偏愛華麗復(fù)雜的長(zhǎng)句表達(dá)。其次,作家所處的時(shí)代也會(huì)影響作品風(fēng)格。奧斯汀所處的年代正是浪漫主義方興未艾之際,但是她的作品比較接近新古典主義風(fēng)格。新古典主義推崇理性,強(qiáng)調(diào)明晰、對(duì)稱、節(jié)制、優(yōu)雅,追求藝術(shù)形式的完美與和諧。德萊塞是美國(guó)自然主義文學(xué)的代表人物。由于受自然主義創(chuàng)作原則的影響,其作品的語言相對(duì)樸實(shí),缺少藝術(shù)的加工與提煉。因此,不同的時(shí)代背景也是一個(gè)造成兩個(gè)作品庫的語料庫檢索結(jié)果差異的可能原因。
4 結(jié)語
通過上述分析可以看出,不同的文化及時(shí)代背景所造成的文學(xué)作品語言特點(diǎn)的差異在其語料庫的檢索結(jié)果中都會(huì)有所體現(xiàn)?;谡Z料庫的文學(xué)作品語言特點(diǎn)的對(duì)比分析具有獨(dú)特的優(yōu)勢(shì).為我們更加客觀、科學(xué)的分析、欣賞作品提供了便捷的操作工作,也為該領(lǐng)域的學(xué)術(shù)研究開辟了一個(gè)獨(dú)特的視角。無論是作品的語言特點(diǎn)、情節(jié)構(gòu)建、思想內(nèi)涵還是藝術(shù)風(fēng)格,在語料庫檢索分析中都能一目了然。本文通過對(duì)比分析西奧多·德萊塞和簡(jiǎn)·奧斯汀文學(xué)作品的語料庫檢索結(jié)果來挖掘造成差異的可能因,也從另一個(gè)角度印證了使用語料庫分析文化差異的可行性。
參考文獻(xiàn)
[1] 楊惠忠.英語語料庫語言學(xué)導(dǎo)論[M].上海:上海外語教育出版社,2008.
[2] 梁茂成,李文中,許家金.語料庫應(yīng)用教程[M].北京:外語教學(xué)與研究出版社,2010.
[3] 王立非.計(jì)算機(jī)輔助第二語言研究方淺與應(yīng)用[M].北京:外語教學(xué)與研究出版社,2007.
[4] 徐欣.基于多譯本語料庫的譯文對(duì)比研究——對(duì)《傲慢與偏見》三譯本的對(duì)比分析[J].外國(guó)語,2010(2):53-59.
[5] Graeme Kennedy. An Introduction to Corpus Linguistics [M]. Beijing: Foreign Language Teaching and Research Press, 2000.
[6] Lillian H. Chaney & Jeanette S. Martin. Intercultural Business Communication [M]. Beijing: Higher Education Press, 2002.
[7] Zhang, B. X. Selected Readings in English and American Literatures [M]. Beijing: Foreign Language Teaching and Research Press, 1998.