江西 劉 洋
基于RANGE工具對(duì)文學(xué)作品的語料分析——以《飄》為例
江西劉洋
本研究從RANGE工具的基本原理和使用方法出發(fā),利用RANGE軟件分析經(jīng)典作品《飄》,從語料庫的角度對(duì)這部優(yōu)秀的經(jīng)典文學(xué)作品的語料進(jìn)行詞匯和文體分析,在分析這部經(jīng)典作品的詞匯和文體的特征的同時(shí),更從實(shí)踐中對(duì)具體的文學(xué)作品語料進(jìn)行難易程度的估評(píng),促進(jìn)對(duì)這部經(jīng)典作品的理解。
RANGE詞匯分析《飄》
瑪格麗特·米歇爾于1936發(fā)表了長篇小說《飄》(Gone With the Wind),小說以美國南北戰(zhàn)爭為背景,主線是女主人斯佳麗的愛恨情仇?!讹h》既是一首人類愛情的絕唱,又是一幅反映社會(huì)政治、經(jīng)濟(jì)、道德諸多方面巨大而深刻變化的歷史畫卷。作品一經(jīng)出版就取得了巨大的轟動(dòng),受到世人的矚目。小說作家瑪格麗特·米歇爾也因這部作品名聲四揚(yáng)。而學(xué)者們對(duì)這部作品的研究非常之多。其研究涉及到對(duì)作品《飄》的女性價(jià)值觀,女性生態(tài)主義等文學(xué)理論研究。而本文將從語料庫語言學(xué)視角對(duì)這部經(jīng)典的文學(xué)作品的詞匯和文體進(jìn)行分析和解構(gòu)。
RANGE是由新西蘭維多利亞大學(xué)語言學(xué)及應(yīng)用語言學(xué)的Paul Nation和Averil Coxhead共同研發(fā)的計(jì)算機(jī)語言分析軟件。它能夠迅速地幫助我們科學(xué)地判斷某文本語料情況。它是基于詞頻為基礎(chǔ)設(shè)計(jì)出的詞匯統(tǒng)計(jì)軟件程序。RANGE為詞匯的自動(dòng)評(píng)估提供了一個(gè)有效的手段。RANGE在分析文本語料過程中的具體作用主要表現(xiàn)在四個(gè)方面:第一,分析比較不同文本的詞匯量大小、措辭的異同和詞匯的過度使用傾向。第二,能分析出閱讀該文本所需的總詞匯量;第三,該學(xué)習(xí)者對(duì)該文本中的詞匯量有多少是熟悉的,多少是陌生的;第四,通過對(duì)詞匯的量化對(duì)比分析,可以文本語料庫的詞匯重復(fù)性和某類動(dòng)詞使用的特點(diǎn)從而對(duì)文本進(jìn)行文體分析。
RANGE軟件自身含有三個(gè)基礎(chǔ)詞表,將要研究的語料文本中的詞匯與自身的參照詞表進(jìn)行對(duì)照比較,詞表一包含約1000個(gè)最常用的詞族;詞表二包含約1000個(gè)次常用詞族;詞表三不僅包括了詞表一和詞表二的詞族,還包含了高中的和大學(xué)各科教材中最常用的學(xué)術(shù)詞匯,共計(jì)570個(gè)詞族。一個(gè)詞族包含主詞及其派生和屈折形式。RANGE軟件在處理輸入的純文本時(shí)就會(huì)自動(dòng)以這3個(gè)詞頻表為參照,輸出研究文本的詞頻相關(guān)信息以供學(xué)習(xí)和研究之用。
首先將《飄》轉(zhuǎn)化成純文本文件。運(yùn)行軟件RANGR,點(diǎn)擊菜單中的文件,打開《飄》文件的純文本信息,運(yùn)行之后馬上可以RANGE對(duì)《飄》這部作品給出的一個(gè)分析內(nèi)容。
表1 《飄》作品中語料詞匯統(tǒng)計(jì)表
根據(jù)表1數(shù)據(jù)可以發(fā)現(xiàn),第二個(gè)單詞TOKENS(形符),反映的是語料中詞數(shù),反應(yīng)整部作品中有431756個(gè)詞,第一級(jí)形符343377,占了79.53%;第二級(jí)形符25477,占了5.9%;第一級(jí)形符13684,占了3.17%;其中3238個(gè)詞屬于,占全文的18.84%屬于基礎(chǔ)詞表1;2376個(gè)詞屬于基礎(chǔ)詞表2,;1764個(gè)詞屬于基礎(chǔ)詞表3,另有9806個(gè)詞在3個(gè)詞表之外。這596個(gè)詞匯共出現(xiàn)了1609次。第三個(gè)單詞TYPES(類符),它反映語料中的用詞數(shù)
剔除重復(fù)計(jì)算的詞數(shù),如全文用詞是17184個(gè),也就是掌握了這些,整篇文章就沒有一個(gè)生詞。第四個(gè)單詞是詞簇,第五行的not是not in the list的省略,統(tǒng)計(jì)上面三個(gè)詞表外的詞數(shù),
一定程度上可反映詞匯的難度。最后一行Total為各列數(shù)據(jù)的總數(shù)。
此外,通過RANGE的截詞詞表( Stop List)功能觀察詞匯的復(fù)現(xiàn)。發(fā)現(xiàn)排名在前面的靠前的有SCARLETT、EYES、FIGHT、FACE、KNEW、MONEY、MAKE、ASHLEY 等,這些高頻出現(xiàn)的實(shí)意詞,說明《飄》這部作品著力塑造了斯嘉麗的人物形象,SCARLETT是整部作品出現(xiàn)頻率最高詞匯。同時(shí),F(xiàn)IGHT的高頻使用,說明了作品的戰(zhàn)爭背景。EYES、FACE、MONEY的高頻使用,說明作品在真實(shí)地塑造人物所生活的環(huán)境。從這些詞匯中我們可知,《飄》還是一部現(xiàn)實(shí)主義文學(xué)力作。
全文通過使用語料庫語言處理工具RANGE對(duì)外文經(jīng)典文學(xué)作品《飄》進(jìn)行研究,主要是對(duì)作品得最常用詞匯,而次常用詞匯,學(xué)術(shù)詞匯以及其它詞匯的對(duì)比研究發(fā)現(xiàn),這些詞匯中占主導(dǎo)地位的是常用詞匯,這為讀者閱讀外文經(jīng)典作品掃除了心里障礙。此外對(duì)RANGE對(duì)文本進(jìn)行分析后,所得出的詞匯特征和文體特征,表面使用RANGE工具對(duì)文學(xué)作品的研究是客觀的,可行的。
[1]瑪格麗特·米歇爾.飄[M].戴侃,李野光,莊繹傳譯。北京∶人民文學(xué)出版社,1990.
[2]鮑 貴,王 霞∶RANGE在二語產(chǎn)出性詞匯評(píng)估中的應(yīng)用[J].外語電化教學(xué).2005(8).
[3]劉艷芹,李搖卓,孫承榮:中外大學(xué)生英語詞匯學(xué)習(xí)的語料庫研究[J]..中國石油大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2015(2)
(作者單位:九江學(xué)院外國語學(xué)院講師)
劉 洋(1978—),女,九江,九江學(xué)院外國語學(xué)院講師,研究方向:英語教育。