摘 要:本文運用語料庫語言學(xué)的方法,自建超過250萬詞的英專本科畢業(yè)論文語料庫,并按照論文質(zhì)量將其分為高水平,中水平和低水平論文三個子語料庫。通過分析語料庫中的詞頻、句長、關(guān)鍵詞列表、搭配列表等,發(fā)現(xiàn)了高中低分組論文的相同和相異特征。此研究對準(zhǔn)確了解當(dāng)前英專學(xué)生學(xué)術(shù)論文寫作質(zhì)量,以及提高英語學(xué)術(shù)寫作水平具有較強的實踐意義。
關(guān)鍵詞:英語專業(yè);本科畢業(yè)論文;論文質(zhì)量差異;對比研究;語料庫語言學(xué)
基金項目:本文為安徽省省級質(zhì)量工程項目“基于分析性評價體系的英專本科畢業(yè)論文質(zhì)量評估研究”(項目編號:2017jyxm0039)的階段性成果。同時,本文也受到教育部人文社會科學(xué)研究青年基金項目(項目編號:14YJCZH148)的經(jīng)費支持。
1 引言
《英語類專業(yè)本科教學(xué)質(zhì)量國家標(biāo)準(zhǔn)》要求本科生要具有“學(xué)習(xí)能力以及思辨、創(chuàng)新和科學(xué)研究的能力”,而這種能力突出的在畢業(yè)論文課程中得以檢驗(仲偉合, 2015:5)。針對英專本科畢業(yè)論文的研究有很多,既有微觀層面的選題、摘要、語言和格式問題,也有涉及宏觀層面的現(xiàn)狀分析、意義分析、課程改革、論文指導(dǎo)體系和評估機制、利用網(wǎng)絡(luò)資源的寫作指導(dǎo)模式、論文指導(dǎo)和管理的網(wǎng)絡(luò)平臺建設(shè)問題以及論文寫作動機研究(如孫文抗 2004;郭玉鑫 2010;顧佩婭等2010;盛國強,周永模 2011;陳正倫2012)。研究方法多采用文獻資料法,問卷調(diào)查法,個案分析法,內(nèi)省法及實驗法。同時,出于研究者的研究目的,多選用少量文本或者僅僅是教師針對畢業(yè)論文寫作的直覺反饋,帶有強烈的主觀性、片段性和闡述性,無法真實全面反應(yīng)目前英語專業(yè)本科生的論文質(zhì)量。因此,已有研究者建議運用語料庫大數(shù)據(jù)進行英語寫作方面的研究,因為語料庫技術(shù)能展示那些并非一目了然的現(xiàn)象(Baker 2005:197)。但是學(xué)者們的研究對象主要針對大學(xué)英語或英專低年級的短篇英語作文寫作(如袁昌萬,金雙軍2015;丁永久 2013)。本研究自建超過250萬詞的英專本科畢業(yè)論文語料庫,并按照質(zhì)量將其分為高水平,中水平和低水平論文三個子語料庫,擬運用語料庫技術(shù),從詞數(shù)、詞頻列表、關(guān)鍵詞列表、搭配等方面去探討各類水平論文的相同和相異特征。這是一次將語料庫技術(shù)應(yīng)用于英語寫作質(zhì)量分析的實踐,其研究結(jié)果可幫助教師準(zhǔn)確了解當(dāng)前本科學(xué)生英語論文寫作質(zhì)量,對提高英語學(xué)術(shù)寫作教學(xué)水平具有較強的實踐意義。
2 研究問題與研究方法
本研究嘗試回答以下問題:1)通過語料庫手段能發(fā)現(xiàn)不同水平論文的差異體現(xiàn)在哪些方面?2)高分、中分、低分的英專畢業(yè)論文有什么樣的相同特征以及差異性特征?
首先,筆者收集了合肥工業(yè)大學(xué)近4年英語專業(yè)本科畢業(yè)論文,共計541篇。按照論文分數(shù),分為高分組(85分及以上)105篇、中分組(75分—84分)329篇、低分組(74分及以下)107篇,建立了約250萬詞的英專本科畢業(yè)論文語料庫,如表1。
第二,運用wordsmith tools 6.0,針對英專本科畢業(yè)論文,以英國學(xué)術(shù)英語語料庫為參照語料庫,列出了以關(guān)鍵性(keyness)為標(biāo)準(zhǔn)排序的關(guān)鍵詞列表。然后通過分析關(guān)鍵詞的搭配詞以及上下文,來討論三組論文的選題特點。
最后,分析詞頻列表(如表3)以及索引行來討論論文研究對象,口語化程度,感性和理性的側(cè)重點以及論文主客觀程度等。
3 結(jié)果與討論
3.1 高中低分組畢業(yè)論文在選題上的異同
畢業(yè)論文的選題會直接影響畢業(yè)論文的整體語篇的質(zhì)量。通過觀察關(guān)鍵詞列表發(fā)現(xiàn),整體來說文學(xué)、翻譯方向的論文數(shù)量高居第1,2位。其原因在于文學(xué)和翻譯方向的論文參考資料相對來說比較豐富,理論也比較容易看懂。此外,高中低分三組的高頻詞中都有“English”、“Chinese”、“culture”等,這說明英漢語言對比和中西文化對比等,也是較高頻率選題。
進一步分析表2,發(fā)現(xiàn)高中低分組選題的側(cè)重點是不同的:第一,低分組和中分組相比,低分組文學(xué)選題更為分散,而中分組選取的作品更為集中。低分組的論文關(guān)鍵詞大多與文學(xué)作品中的人物名稱或是作者有關(guān),例如Blanche、Oliver、Riley、 Sula、 Lawrence、Stella等。由此可見,低分組的同學(xué)們更多的關(guān)注文學(xué)題材。而中分組的關(guān)鍵詞有百分之八十是人名,這些人名中包括文學(xué)作品中的主人公,例如《白鯨記》中的Moby Dick、《德伯家的苔絲》中的Tess、《哈利·波特》中的Harry、《呼嘯山莊》中的Heathcliff。中分組與低分組相比,選取的文學(xué)類的作品更為集中。第二,高分組選題大多和翻譯有關(guān),和其他兩組區(qū)別較大。高分組明顯與其他兩組不同,排在第一位的關(guān)鍵詞是“Japan”,且排名第十位的是“Diaoyu”,這反映了高分組的同學(xué)更加關(guān)注于時事政治,或更貼近當(dāng)代的生活,更加注重新聞方面的搜集與分析。從 “translation”、“corpus”、 “text”等詞可以看出高分組的畢業(yè)論文大多與翻譯有關(guān),并且大多以語料庫為手段對文本進行比較;又或者偏重時政新聞的話語分析。
3.2 高中低分組畢業(yè)論文在詞匯句法層面的異同
第一,詞匯數(shù)量上高分組最多。英語書面語長度與其英語水平呈顯著性正相關(guān),相關(guān)系數(shù)高達0.7以上(丁言仁,戚焱2005)。因為高中低分三個子語料庫庫的篇目數(shù)量不對等,故只有總詞數(shù)除以篇目數(shù)所得的平均詞數(shù)較有可比性。觀察表1發(fā)現(xiàn),高分組的平均詞數(shù)為5428,中分組的是4587,低分組的是4037。進一步推算,高分論文的詞數(shù)遠超中分論文和低分論文,超出中分論文詞數(shù)18.3%,超出低分論文詞數(shù)34.5%,而中分論文超出低分論文詞數(shù)13.6%。即從詞匯數(shù)量上說,高分論文、中分論文和低分論文形成三個梯度,梯度之間的距離差不多。中分論文要想往高分論文上提升,需增加將近1/5的詞數(shù);低分論文要想往中分論文上提升,則需增加大約1/7的詞數(shù),這個應(yīng)該不難做到;而低分論文要想直接往高分論文上提升,就需增加超過1/3的詞數(shù),這對于學(xué)習(xí)者來說就具有一定的難度。
第二,語塊上高分組更擅長寫?yīng)毩⒎志洹UZ塊通常是作為一整體儲存在記憶中,使用時直接提取,無需根據(jù)語法規(guī)則生成和分析。語塊的分類多種多樣(如Becker 1975;Michel Lewis 1997;Nattinger,Decarrico 1992等)。本文選擇表述較為簡潔直觀的Altenberg(1998)的語塊分類法,將詞塊分為完整分句、分句成分和不完全詞組。完整分句具有獨立的主謂結(jié)構(gòu),可細分為獨立分句及非獨立分句;分句成分可分為多樣分句成分及單一分句成分;不完全詞組指缺乏實意詞的詞組。為了數(shù)據(jù)的可比性,筆者從高中低三個子庫中各抽取了20篇論文,共計60篇,建立一個小型平衡語料庫,然后抽取其中的3-6字符,進行語塊分析。
分析結(jié)果表明,三組論文的共同點在于:第一,從3-6字符的語塊數(shù)量上看,3字符語塊數(shù)量最多,隨著字符數(shù)的增加,三組語塊的數(shù)量呈明顯遞減趨勢,6字符語塊數(shù)量最少。第二,從語塊分類上看,完整分句的頻數(shù)明顯低于分句成分頻數(shù)。進一步細化,單一成分的所占比例始終保持高,其次為多樣成分和不完全詞組所占比例。這表明在英專學(xué)生論文寫作中,多使用分詞成分或詞組來組合文字。而三組論文的不同點在于:高分組中獨立分句頻數(shù)始終高于中、低分組,這說明高分組論文更擅長寫?yīng)毩⒎志?,擅長撰寫長句。
3.3 高中低分組畢業(yè)論文在研究對象、口語化程度、理性感性側(cè)重點及實例數(shù)量上的異同
通過分析詞頻列表(表3),可以發(fā)現(xiàn)以下四點不同。首先,三組論文的研究對象關(guān)注點不同,這一點可以從人稱代詞(he, she, it等)的使用來發(fā)現(xiàn)。分析詞頻列表的前幾個人稱代詞時,都是男性人稱代詞多于女性人稱代詞和中性代詞。這說明三組論文所研究的男性作家作品,或者作品中的男性人物,或者男性話語,會相對較多一些。不同點在于,高分組的代詞詞頻為:中性代詞使用頻率>男性人稱代詞>女性人稱代詞,其中男性人稱代詞和女性人稱代詞詞頻數(shù)目差距很小。而中分組和低分組步調(diào)幾乎一致地呈現(xiàn)出:男性人稱代詞使用頻率>女性人稱代詞>中性代詞。這就意味著,三組論文寫作者的思維方式和關(guān)注點有所不同。高分組所用中性代詞較之最多,是因為更多時候都在討論作家作品本身,或者翻譯文本本身,而較少涉及作家或者作品中的人物。
其次,三組論文的口語化程度不盡相同,中分組和低分組論文的口語化程度更高,高分組則相對較低。這主要體現(xiàn)在“I”等第一人稱代詞的使用頻率上?!癐”在高中低分組的詞頻出現(xiàn)排位分別是第29,16,14位。低分組過度使用第一人稱代詞,即過分強化作者的顯現(xiàn)度,不符合科研論文要求的嚴謹客觀,而更接近口語的直接和主觀。
第三,三組論文的理性和感性側(cè)重點不同。例如,“l(fā)ife”也是三組論文數(shù)據(jù)庫共同具有的高頻詞之一,人生和生活確實是每個人窮盡一生要思考的問題。按照詞頻列表的單詞排序,高分組論文語料庫的“l(fā)ife”一詞出現(xiàn)在語言對比等詞之后,而在中分組和低分組論文語料庫中則是出現(xiàn)在之前。進一步觀察索引行發(fā)現(xiàn),高分組論文更多時候是在比較客觀地對比語言,而不是以探求人生哲學(xué)為主。這就使得高分組論文更加理性和務(wù)實,言之有物,邏輯更加清晰,更容易被理解接受。中分組和低分組論文顯得更加感性一些,容易陷入言之無物的境況,有些思想不太好用語言組織,很難準(zhǔn)確地表達,從而影響論文質(zhì)量。
第四,三組論文的主觀和客觀程度不同,這可以從表3中的“translation”一詞看出來。高分組中,“translation”一詞出現(xiàn)頻率位居第1,中分組和低分組位居第6位和第7位。這就說明,三組論文中“翻譯”的研究都是一個重要選題。而英漢互譯的研究離不開中英文的舉例,此類論文中就會出現(xiàn)漢語詞匯。三組論文中的翻譯類論文的平均中文詞數(shù)(如表1所示)就體現(xiàn)出漢語例子的數(shù)量。研究發(fā)現(xiàn),在涉及翻譯的選題時,高分組的中文詞數(shù)比例明顯比中分組和低分組多,這說明高分組舉了大量的實例,使研究更具說服力,也使論證的推導(dǎo)過程更加嚴密,學(xué)術(shù)客觀性得以提升。
4 結(jié)論
本文運用語料庫的手段,發(fā)現(xiàn)了高中低分組論文在選題、詞匯層面、句子層面、研究對象、口語化程度、感性理性分析側(cè)重點、主客觀程度層面都有異同點,其中差異性特征得到了特別的關(guān)注。此研究希望借助語料庫語言學(xué)的相關(guān)手段,較為客觀的展現(xiàn)當(dāng)前本科學(xué)生英語學(xué)術(shù)論文寫作的質(zhì)量差異點,從而有利于教師有的放矢地提高英語學(xué)術(shù)寫作教學(xué)水平。
參考文獻
[1]Altenberg, B. and M. Tapper. The use of adverbial connectors in advanced Swedish learners written English [A]. In S. Granger (ed.). Learner English on Computer [C], 1998: 80-89.
[2]Baker, P. and Tony McEnery. A corpus-based approach to discourses of refugees and asylum seekers in UN and newspaper texts [J]. Language and Politics, 2005, 4(2): 197.
[3]Becker, J. The Phase Lexicon [A]. In Nash B W, Schank R.Theoretical Issues in Natural Language Processing [C]. Cambridge, Mass: Bolt, Beranek and Newman, 1975: 55-74.
[4]Lewis, M. Implementing the Lexical Approach [M]. London: Language Teaching Publications, 1997.
[5]陳正倫.英語碩士畢業(yè)論文寫作的動機研究及其啟示[J].外語界,2012(6):81.
[6]丁永久.基于語料庫的高職英語專業(yè)一、二年級學(xué)生寫作能力的分析[J].中國民航飛行學(xué)院學(xué)報,2013(4):51-53.
[7]顧佩婭,張燁,,古海波.英語專業(yè)本科畢業(yè)論文課研究性教學(xué)設(shè)計與實踐[J].外語教學(xué)理論與實踐,2010(4):44-51.
[8]郭玉鑫.英語專業(yè)畢業(yè)論文與課程設(shè)置、教學(xué)模式的關(guān)系研究[J].中國科技博覽,2010(7):39.
[9]盛國強,周永模.英語專業(yè)本科畢業(yè)論文存在問題的分析和對策[J].上海海洋大學(xué)學(xué)報,2011(4):636-640.
[10]孫文抗.英語專業(yè)學(xué)士論文寫作現(xiàn)狀分析[J].外語界,2004(3):59-64.
[11]袁昌萬,金雙軍.基于語料庫大數(shù)據(jù)的英語寫作實證研究[J].重慶交通大學(xué)學(xué)報(社會科學(xué)版),2015(4):126-129.
[12]仲偉合.《英語類專業(yè)本科教學(xué)質(zhì)量國家標(biāo)準(zhǔn)》指導(dǎo)下的英語類專業(yè)創(chuàng)新發(fā)展[J].外語界,2015(3):2-8.
作者簡介
王麗君(1981-),安徽淮南,文學(xué)碩士,合肥工業(yè)大學(xué)外國語言學(xué)院講師,研究方向:語料庫語言學(xué),話語分析。