摘 要:本文介紹了文本詞匯分析軟件RANGE的原理和基本操作方法,并通過分析兩篇非英語專業(yè)大二學生的作文展示了該軟件在詞匯分析方面的強大功能。本文認為RANGE軟件對于英語寫作評估具有重要意義,應引起國內學界的進一步重視。
關鍵詞:RANGE;詞匯分析;英語寫作評估
1.引言
英語寫作是英語學習者綜合語言能力的體現(xiàn),也是大學英語教與學的重點。經了解發(fā)現(xiàn),大學英語教師用大量時間批改作文中的語法和結構,然而語法和詞匯都是語言能力的重要組成部分(Wilkins ,1972),因此對掌握好詞匯有助于提高英語寫作水平。
RANGE(http://www.vuw.ac.nz/lals/staff/Paul_Nation)是由新西蘭維多利亞大學語言學及應用語言學的Paul Nation和Averil Coxhead研發(fā)的。這是一款能夠幫助我們科學、迅速地判斷某文本用詞情況的電腦軟件,RANGE可以處理多達32個不同的輸入文本。該軟件可以回答如下問題:(1)所有文本中共有的詞匯;(2)閱讀該文本所需的詞匯量;(3)該文本中有多少詞匯是學習者所熟悉的;(4)該文本中有多少詞匯是學習者不知道的(5)教科書中的詞匯在多大程度上為學習者閱讀報紙打好了詞匯基礎;(6)學習者在自由寫作中的用詞情況。
本文通過分析兩篇非英語專業(yè)大二年級學生的習作,進而更好的理解RANGE的基本原理和基本操作。參與本研究的兩名學生均完成了三個學期的大學英語的學習,準備參加大學英語四級考試,所選兩篇習作是從四級模擬試卷中選取的。
2. 基本原理
RANGE分析詞匯的基本原理為:將要分析的文本中的詞匯與參照詞表進行比較,分析文本的用詞情況。RANGE內置三個基礎詞表:BASEWORD1、BASEWORD2、BASEWORD3。BASEWORD1包含約1000個最常用的詞族,BASEWORD2包含約1000個次常用詞族,BASEWORD3包括前兩個詞表之外的、高中的和大學各科教材中最常用的學術詞匯。這三個基礎詞表包括基本單詞和衍生單詞,因此,BASEWORD1包含有大約4000個類符。前兩個詞表來源于Michael West的“A General Service List of English Words”,而包含有570個詞族的學術詞表是Coxhead(2000)編制的。詞族(Families)是指中心詞加上其屈折形式和衍生形式,;類符(Type)是指單詞計數單位,形符(Token)是指的是單詞的標記例,在“To be or not to be , that is a question”中,共有7個詞族,8個類符,10個形符。
3. 習作實例分析
在安裝之后,直接雙擊RANGE圖標,軟件即可運行。
RANGE只能識別純文本文件,所以將兩篇習作進行整理后分別保存并命名為1.txt和2.txt。運行RANGE,點擊菜單中的File/Open/1.txt選中該文本,然后點擊File/Save輸入需要保存的文件名(本文分別命名為習作分析1和習作分析2)。
RANGE可以分析文本中的詞頻,其結果可按字母順序,頻率以及幅度的順序輸出,本文將詞匯按詞頻順序輸出。RANGE將分析結果自動生成為習作分析1_range.txt和習作分析2_range.txt兩個文件,可用“記事本”程序打開閱讀。習作分析文本首先給出的是詞匯的分布情況:哪些詞屬于三個基礎詞表以及哪些詞超出了三個基礎詞表。具體見表1和表2。
對比觀察表1和表2可發(fā)現(xiàn),學生習作中使用的單詞主要分布在BASEWORD1中,習作1和習作2 中的形符分布在BASEWORD1里的分別達到了82.28%和81.60%。根據Ringbon(1998),以英語為母語的學生習作的詞匯中,分布在BASEWORD1、BASEWORD2和BASEWORD3中的詞匯所占的比例分別為70%、10%和10%,其他10%為不在詞表中所占比例。通過對比發(fā)現(xiàn),我們所選的兩篇習作存在過度使用最常用1000詞傾向,對次常用1000詞和學術詞匯的掌握還不夠。
習作分析1_range.txt和習作分析2_range.txt文件還給出了作文中每個單詞的詞頻及其分布情況,表3和表4分別列舉了前十個類符的信息。
從表3和表4中可看出,前十個類符中大部分是常用的功能詞,這與常見大型語料庫的檢索結果基本相符(楊惠中,2002)。通常情況下,高頻詞較低頻詞更容易被習得,高頻詞出現(xiàn)在書面語和口語中的頻率高,更容易引起注意(Gass Selinker, 2001)。此外,最常用的功能詞(the,to,of,a,can and et al)是分布在BASEWORD 1中,這就解釋了為什么習作中詞匯集中分布在BASEWORD1中及前十個類符中有較多的功能詞。
最后,對比分析兩篇習作。從習作分析1_range.txt和習作分析2_range.txt兩個分析文件來看,習作1的詞匯水平是比習作2的高的,不管從形符、類符還是詞族上看,習作1都比習作2要高,因此,習作2應注意其詞匯的運用情況。
4. 結語
通過對RANGE的系統(tǒng)性操作和運用,讓我們理解到其在詞匯分析方面的強大功能。本文認為RANGE軟件對英語寫作詞匯分析具有重要意義,是教師批改作文的得力助手,應引起國內學屆的重視。但英語寫作的主觀性強,該軟件僅提供一個相對客觀的詞匯指標,教師不能完全依賴該軟件。
參考文獻
Coxhead, A.(2000).A new academic word list. TESOL Quarterly, 34 (2), 213-238.
Gass, S. Selinker, L. (2001). Second Language Acquisition: An Introductory Course. Mahwah, NJ: Brlbaum.
Wilkins, D. A. (1972). Linguistics in language teaching. Cambridge, MA: The MIT Press.
楊惠中.(2000)語料庫語言學導論[M]. 上海:上海外語教育出版社.
作者簡介:
智玉英(1989-),女,漢族,山東菏澤人,研究生,主要研究方向:語料庫語言學、詞匯研究;
董革非(1974-),女,漢族,遼寧沈陽人,副教授,工作單位:東北大學外國語學院,主要研究方向:認知語言學,對比語言學,英語教學。