王帆
摘? 要:在第二語言寫作考試中,寫作評分是研究者們頗為關(guān)心的問題。其影響因素包括主客觀兩個(gè)方面,涉及命題式作文本身存在的誤差問題和評分標(biāo)準(zhǔn)問題。提高第二語言寫作評分的客觀化,首先要提高評分標(biāo)準(zhǔn)的科學(xué)性和合理性,其次要盡量避免或最大程度降低評分員效應(yīng)。機(jī)改作文能夠較好地解決這個(gè)問題,與此相伴的則是如何量化指標(biāo)。因此,評分標(biāo)準(zhǔn)不僅應(yīng)該與寫作和寫作水平相對應(yīng),還應(yīng)該盡量提出更多客觀的可量化標(biāo)準(zhǔn)。
關(guān)鍵詞:寫作評分;客觀化;詞匯影響
一、問題的提出
寫作屬于學(xué)習(xí)者的產(chǎn)出性技能。在第二語言寫作考試中,評分問題是研究者們頗為關(guān)心的。影響寫作評分結(jié)果的因素主要有以下兩個(gè)方面:
一是命題式作文本身存在的誤差問題。首先是題目取樣誤差問題,不同考生由于個(gè)人背景和知識結(jié)構(gòu)等方面的不同,對同一話題的熟悉度、興趣和知識背景等都存在著較大的差異,而這種差異有時(shí)會導(dǎo)致測試的內(nèi)容發(fā)生改變,即測試的真正內(nèi)容脫離了對學(xué)生語言能力測試的目的。其次是評分人的誤差問題,該誤差產(chǎn)生的主要原因是由于評分人個(gè)人偏好及態(tài)度而帶來的測試誤差。
二是評分標(biāo)準(zhǔn)的問題,包括評分標(biāo)準(zhǔn)的制定和使用兩個(gè)方面。在主觀性題型中,評分者需要根據(jù)一定的評分標(biāo)準(zhǔn)進(jìn)行評分,一個(gè)科學(xué)合理、具有可操作性的評分標(biāo)準(zhǔn)是寫作評分能夠達(dá)到較高信度的首要保障,也是評分工作的指南。評分標(biāo)準(zhǔn)若是制定不清楚就會導(dǎo)致評分員的主觀區(qū)間被放大,評分工作也會因此受到影響。同時(shí),評分員對評分標(biāo)準(zhǔn)的把握也是影響寫作評分結(jié)果的主要因素。因此,從評分標(biāo)準(zhǔn)上來說,寫作的評分標(biāo)準(zhǔn)的制定需要依據(jù)一定的原則以確保其科學(xué)性,標(biāo)準(zhǔn)的使用則需要經(jīng)過一定的培訓(xùn),以最大限度地減少寫作評分中的主觀性。如用第一語言進(jìn)行寫作的學(xué)習(xí)者與用第二語言寫作的學(xué)習(xí)者是不能也不適合用同樣的標(biāo)準(zhǔn)進(jìn)行評分的,而未經(jīng)培訓(xùn)的評分人員對評分標(biāo)準(zhǔn)的理解也會因個(gè)體因素而不同。
綜上可知,影響寫作評分結(jié)果的因素包括主客觀兩個(gè)方面。寫作本身就是一種主觀型試題,完全抹去命題的誤差問題和評分過程中評分員的主觀性是不現(xiàn)實(shí)的,但通過制定更加科學(xué)合理的評分標(biāo)準(zhǔn),挖掘評分標(biāo)準(zhǔn)中客觀化的可量化因素則可以進(jìn)一步提高寫作評分的信度。
漢語寫作評分的客觀化并非完全排斥寫作過程中的主觀性,而是要最大限度地減少寫作評分的隨意性,這主要在于評分標(biāo)準(zhǔn)的制定和理解上。制定評分標(biāo)準(zhǔn)時(shí),要注意在關(guān)注測試目標(biāo)的基礎(chǔ)上,盡量選取可量化的指標(biāo),在描述上需具有較強(qiáng)的明確性和區(qū)別性,以確保該標(biāo)準(zhǔn)在實(shí)施中具有可操作性。寫作本身是一種產(chǎn)出性的交際,因此,評分標(biāo)準(zhǔn)應(yīng)以交際任務(wù)為準(zhǔn)繩,以便于評分員理解和操作為原則;在評分標(biāo)準(zhǔn)的把握上,應(yīng)當(dāng)以是否便于評分員理解為標(biāo)準(zhǔn),即評分標(biāo)準(zhǔn)的理解不應(yīng)該因人而異,而應(yīng)基本一致。
寫作評分的詞匯影響是對評分標(biāo)準(zhǔn)的量化指標(biāo)方面所做出的初步嘗試,主要是通過考察學(xué)生作文中所使用詞匯的數(shù)量及其所體現(xiàn)的詞匯水平與其最終成績之間的關(guān)系,對寫作評分的客觀化進(jìn)行一定的補(bǔ)充。在具體操作中,寫作評分的詞匯影響建立在評分員對詞匯的不自覺關(guān)注上。通過對寫作測試和寫作能力的探討,我們擬提出一套漢語作為第二語言寫作的評分標(biāo)準(zhǔn),并對該標(biāo)準(zhǔn)進(jìn)行實(shí)際操作檢驗(yàn),進(jìn)一步探究詞匯使用與寫作水平之間的關(guān)系,為寫作評分的客觀化提供新的思路。
二、客觀化評分標(biāo)準(zhǔn)的提出及詞匯影響
(一)寫作的理論定義
Hamp-Lyons & Kroll指出,“寫作是發(fā)生在一定情境下,完成某一特定目標(biāo),并要為預(yù)期讀者做出適當(dāng)調(diào)整的行為?!盵1]李慶本認(rèn)為,“一般而言,學(xué)習(xí)一種非母語的語言,首先需要掌握這種語言一定數(shù)量的語音、詞匯和語句,然后才能運(yùn)用這些語言知識進(jìn)行交際。前者是基礎(chǔ),后者是提高?!盵2](272-276)作者指出,前者是語言能力,后者屬于言語能力,是用某種語言進(jìn)行交際的能力。由此可見,寫作是一種社會性交際活動,其基礎(chǔ)固然是在于對于語言要素的掌握,但更重要的應(yīng)該是完成特定的交際性任務(wù)。
(二)寫作水平的操作性定義
寫作測試的主要目的是考察應(yīng)試者的寫作能力,但對于寫作能力是什么,目前學(xué)界并沒有統(tǒng)一的結(jié)論[3]。在操作性定義上,體現(xiàn)寫作能力的寫作水平集中體現(xiàn)在不同的等級水平量表中。從目前有關(guān)第二語言寫作能力量表來看,它主要分為總體量表和分項(xiàng)量表兩種,每一量表之下又分為若干等級。在歐洲語言共同參考框架中,將寫作能力分為總體寫作能力、創(chuàng)造性的寫作能力、寫報(bào)告和作文的能力,對于每一個(gè)部分又采用“能夠做什么”的方式進(jìn)行描述[4]。美國外語教學(xué)委員會(ACTFL)大綱以語言的表達(dá)和交際任務(wù)為目的,將寫作能力劃分為四個(gè)等級,四個(gè)等級之間依次以詞和短語的表達(dá)、句子表達(dá)、成段表達(dá)和不受拘束的篇章表達(dá)為區(qū)別性特征。《國際漢語能力標(biāo)準(zhǔn)》則將寫作能力分為五個(gè)等級,在每個(gè)等級中以詞、短語和篇章等為特征,以滿足不同場景的交際任務(wù)為目的進(jìn)行細(xì)致劃分。現(xiàn)行HSK考試與國際漢語能力標(biāo)準(zhǔn)相對應(yīng),寫作部分大多圍繞交際任務(wù)開展,形成了話題式作文、材料式作文、縮寫、改寫等測試形式[5]。總的來說,目前寫作能力等級量表普遍將寫作作為一種產(chǎn)出型技能對其進(jìn)行描述,不僅關(guān)注其語言要素,更關(guān)注其言語要素,并以運(yùn)用該語言進(jìn)行交際以解決實(shí)際問題為目的。不過,量表本身對每一等級的描述較為含糊,無法完全擺脫寫作評分過程中的主觀性影響。
在評分方式上,寫作能力的等級量表體現(xiàn)為綜合式和分項(xiàng)式兩種評分方式,即究竟是從整體寫作水平出發(fā)進(jìn)行評分,還是從寫作的不同表現(xiàn)方式出發(fā)進(jìn)行評分。一般來說,綜合式評分是評分員基于考生作文的整體印象進(jìn)行打分;分項(xiàng)式評分則是將寫作成績劃分為多個(gè)維度,并對每個(gè)維度下的具體內(nèi)容和權(quán)重進(jìn)行規(guī)定,評分者根據(jù)具體內(nèi)容進(jìn)行評分后,依據(jù)權(quán)重得出最終成績??偟膩碚f,綜合式評分效率高,但分?jǐn)?shù)解釋性較弱;分項(xiàng)式評分信度高,但效率低,效度難以保證。因此,一般大型考試在寫作評分中會將二者有機(jī)結(jié)合,形成以綜合評分為主、分項(xiàng)評分為輔的評分方式,即對評分標(biāo)準(zhǔn)進(jìn)行分項(xiàng)描述,但不賦予每個(gè)分項(xiàng)具體權(quán)重與分值,要求評分員基于整體印象打分的同時(shí),充分考慮每一個(gè)分項(xiàng)的具體要求。
筆者認(rèn)為,寫作評分客觀化重在定義,首先是對于寫作的定義,即怎樣的寫作算是達(dá)到了掌握一門語言的要求;其次是對于寫作測量的定義,即什么樣的測量工具能夠測出學(xué)習(xí)者是真正的掌握了一門語言。因此,在評分標(biāo)準(zhǔn)上,筆者傾向于采取綜合式評分和分項(xiàng)式評分相結(jié)合的方法,既規(guī)定寫作評分中每個(gè)分項(xiàng)的具體內(nèi)容,又對每個(gè)分項(xiàng)賦予具體權(quán)重。同時(shí),評分員只需基于整體進(jìn)行評分,不需要對每個(gè)分項(xiàng)評分,使得評分標(biāo)準(zhǔn)在詳細(xì)化、集中化的同時(shí),不會過多加重評分任務(wù)負(fù)擔(dān)。
寫作評分標(biāo)準(zhǔn)確定后,需要進(jìn)一步考慮的是究竟哪些分項(xiàng)可以說明寫作水平,這是另外一個(gè)值得思考的問題??偟膩碚f,現(xiàn)行的分項(xiàng)式評分標(biāo)準(zhǔn)主要分為以下三種:首先是將評價(jià)內(nèi)容分為切題、內(nèi)容、語篇、語言要素和語用五個(gè)部分,忽略具體文本所存在的差異,對寫作交際性作用關(guān)注不夠,如GRE、SET、A-LEVEL等考試均屬于這種類型;其次是基于任務(wù)型的評價(jià),這種評價(jià)方式主要強(qiáng)調(diào)的是考生是否向特定讀者明確地傳達(dá)了所需傳達(dá)的信息,該評價(jià)方式立足于寫作的交際性,而不僅僅是將評價(jià)范圍局限在語言要素本身,如BEC、IELTS等寫作考試均采用這種評分方式;最后一種則是基于整體印象進(jìn)行評分,該評分方式是以綜合式為主、分項(xiàng)式為輔的測驗(yàn)方式,評分標(biāo)準(zhǔn)往往會對交際性、表達(dá)性、語言要素等多個(gè)角度進(jìn)行規(guī)定,但考生最終所得成績是評分員基于對作文的主觀性印象而給出的,現(xiàn)行HSK作文評分就是采用這種評分機(jī)制。
(三)客觀化評分標(biāo)準(zhǔn)及其權(quán)重
根據(jù)國內(nèi)外各項(xiàng)寫作的評分標(biāo)準(zhǔn)內(nèi)容及其權(quán)重,筆者擬采用準(zhǔn)確性、豐富性、流暢性、得體性、規(guī)范性,對漢語寫作的評分標(biāo)準(zhǔn)進(jìn)行衡量。具體如表1所示:
準(zhǔn)確性 15% 準(zhǔn)確性包含詞匯和語法兩個(gè)方面。其中,詞匯方面主要包括考生在具體使用過程中詞形是否正確,詞義使用是否合理;語法方面則主要指句式及語法點(diǎn)的使用是否符合語言規(guī)范。
豐富性 15% 豐富性包含詞匯和語法兩個(gè)方面。其中,詞匯方面主要包括考生在寫作中所使用詞匯對應(yīng)的HSK詞匯等級及詞匯量大小;語法方面主要包括考生所使用語法的豐富性和多樣性。
流暢性 40% 流暢性指考生所產(chǎn)出的語句及篇章整體上符合事理邏輯,前后銜接自然,條理清楚,層次分明。
得體性 20% 得體性主要是指考生所產(chǎn)出的語言內(nèi)容符合交際任務(wù)要求,與特定的社會文化和交際行為要求相一致,符合考試內(nèi)容所規(guī)定的交際話題及自身行文過程中所產(chǎn)生的語境。
規(guī)范性 10% 規(guī)范性主要是指考生所寫篇章符合文體要求,書寫格式規(guī)范,標(biāo)點(diǎn)符號使用得當(dāng)。
如前所述,寫作測試是對一門語言掌握程度的測試,也是對考生使用該語言完成交際任務(wù)的能力測試。因此,評分標(biāo)準(zhǔn)不僅要關(guān)注語言能力,更要關(guān)注言語能力,且重點(diǎn)應(yīng)放在對言語能力的測試上。方緒軍認(rèn)為,“對說和寫的技能測試有許多共性,兩者都需要以交際任務(wù)分析為前提,兩者通常涉及書寫和格式的規(guī)范性、語言使用的準(zhǔn)確性和豐富性、語言組織的條理性和連貫性、語言使用的靈活性和得體性以及書面表達(dá)的有效性等方面。”[6](P131)其中,語言組織的條理性和連貫性與語言的流暢性息息相關(guān),語言使用流暢,必然要求邏輯上的條理性和連接上的連貫性;從一定程度上來說,語言使用的靈活性和得體性則是在面對具體交際環(huán)境和交際任務(wù)時(shí)產(chǎn)出適當(dāng)?shù)恼Z言,可以總體概括為語言使用的得體性。流暢性和得體性這兩個(gè)分項(xiàng)歸根究底是為了達(dá)到交際目的,實(shí)現(xiàn)書面表達(dá)的有效性。語言的準(zhǔn)確性和豐富性是從語言要素的角度出發(fā)的;語言的流暢性和得體性則是從言語要素出發(fā)的。同時(shí),由于寫作測試與聽力及閱讀測試不同,其本身對于考生所使用的文體及格式有一定要求,所以將規(guī)范性單獨(dú)列出。
在各項(xiàng)內(nèi)容的權(quán)重上,筆者考慮到寫作測試的目的是體現(xiàn)寫作能力,突出考生的言語能力,因此,在評分標(biāo)準(zhǔn)的制定過程中,優(yōu)先突出言語要素,其次考慮語言要素,再次考慮寫作特點(diǎn)。在突出寫作要求的流暢性,并對其得體性進(jìn)行關(guān)注的同時(shí),對寫作的準(zhǔn)確性和豐富性給予同等權(quán)重,并將寫作測試本身的特點(diǎn)納入考量。
三、實(shí)驗(yàn)方法、過程及結(jié)果
(一)實(shí)驗(yàn)方法
1.被試的樣本數(shù)量及分布
這次實(shí)驗(yàn)的樣本取自于上海交通大學(xué)人文學(xué)院高一年級與高二年級語言進(jìn)修生于2019年6月所進(jìn)行的期末寫作試卷,其中,高一年級試卷24份,高二年級試卷18份。
根據(jù)上海交通大學(xué)所制定的《語言生層級與HSK對應(yīng)情況》,可以得知受試學(xué)生的漢語水平能力。具體如表2所示:
2.試卷結(jié)構(gòu)
本次測試評采取百分制計(jì)分,高一年級與高二年級的作文均為話題式作文。其話題分布如表3所示:
3.實(shí)驗(yàn)方案
本次實(shí)驗(yàn)采取定量分析與定性分析相結(jié)合的方法。在實(shí)驗(yàn)前,研究人員根據(jù)評分標(biāo)準(zhǔn)對試卷進(jìn)行整理,初步將試卷分為優(yōu)秀、中等、一般三個(gè)等級,并給出每個(gè)等級試卷中的標(biāo)桿試卷,即最能代表該水平的試卷。根據(jù)上文所提出的評分標(biāo)準(zhǔn),選取三名均為語言學(xué)背景并具有一定經(jīng)驗(yàn)的評分員,對他們統(tǒng)一進(jìn)行評分標(biāo)準(zhǔn)的培訓(xùn)。
培訓(xùn)結(jié)束后,為防止評分員個(gè)人主觀因素對實(shí)驗(yàn)結(jié)果造成偏差,要求評分員在一天之內(nèi)完成評分,并提交成績。為防止光環(huán)效應(yīng),兩周后,打亂實(shí)驗(yàn)材料順序,讓評分員根據(jù)考生作文中所使用的詞匯進(jìn)行單獨(dú)評分。這次評分不做具體要求,只需要評分員根據(jù)自己的把握給出詞匯成績。等到得出實(shí)驗(yàn)數(shù)據(jù)后,再與三位評分員分別進(jìn)行訪談,了解評分員在評分標(biāo)準(zhǔn)的具體實(shí)施過程中所出現(xiàn)的問題。
(二)評分員間信度檢驗(yàn)
為探究三名評分員對評分標(biāo)準(zhǔn)的把握是否一致,將三名評分員所給出的原始成績進(jìn)行等級轉(zhuǎn)換,使用肯德爾和諧系數(shù)對評分員間的信度進(jìn)行檢驗(yàn)。具體如表4所示:
從spss23.0檢驗(yàn)結(jié)果來看,其概率P小于0.05,由此可知學(xué)生試卷成績的平均值存在顯著差異,即W檢驗(yàn)的假設(shè)不成立;W協(xié)同系數(shù)為0.710,較接近于1,可見,三位評分員對評分標(biāo)準(zhǔn)的把握是較為一致的。
(三)詞匯與成績的關(guān)聯(lián)
為進(jìn)一步探討詞匯與作文評分之間的聯(lián)系,筆者采用皮爾遜相關(guān)系數(shù),分別對三位評分員各自給出的總成績與詞匯成績進(jìn)行分析,從而得到詞匯成績和總成績的相關(guān)性。具體如表5~表7所示:
從表5~表7可以看出,三位評分員的**.均在0.01級別(雙尾),這表明詞匯成績和總成績的相關(guān)性顯著。
(四)訪談結(jié)果
對三位評分員的訪談,可以歸結(jié)為三個(gè)方面:
1.三位評分員在第一次打分時(shí),均未單獨(dú)將學(xué)生的詞匯使用作為評分標(biāo)準(zhǔn)。
2.三位評分員在第二次單獨(dú)對詞匯進(jìn)行打分時(shí),所依據(jù)的主要標(biāo)準(zhǔn)是詞匯量、是否使用高級詞匯及詞匯使用是否正確,其中,評分員2表示自己特別關(guān)注詞語語法的使用。
3.有評分員認(rèn)為,本次評分標(biāo)準(zhǔn)在具體項(xiàng)目上,雖然都采用了客觀化標(biāo)準(zhǔn),但是在具體評分過程中,個(gè)人主觀判斷區(qū)域仍然較大,從而導(dǎo)致評分過程中出現(xiàn)部分難以把握的問題,進(jìn)而出現(xiàn)評分誤差。
四、討論
(一)客觀化評分標(biāo)準(zhǔn)的可行性
從三位評分員的成績數(shù)據(jù)與評分員間信度的檢驗(yàn)來看,肯德爾和諧系數(shù)達(dá)到了0.710,這說明評分員對評分標(biāo)準(zhǔn)的把握具有一定的一致性;同時(shí),其指數(shù)未達(dá)到0.90以上,這說明該評分仍然缺乏一定的客觀性。這可能是由兩個(gè)方面的原因所導(dǎo)致的:
第一,如果僅僅是從寫作測試目的和寫作水平出發(fā),來制定評分標(biāo)準(zhǔn)的話,就會缺乏一定的可量化的標(biāo)準(zhǔn)。在第二語言寫作領(lǐng)域內(nèi),從最早的以內(nèi)容、組織、詞匯、語言運(yùn)用、技巧等五個(gè)部分,到通過實(shí)證提出無錯(cuò)誤的T-unit個(gè)數(shù)、無錯(cuò)誤的T-unit所含的字?jǐn)?shù)、每個(gè)T-unit的錯(cuò)誤總數(shù)和總的錯(cuò)誤個(gè)數(shù)這四項(xiàng)可量化指標(biāo)來測量被試寫作能力,分項(xiàng)式評分亦經(jīng)歷了從主觀性較強(qiáng)到客觀化、可量化的發(fā)展過程[8],說明了作文評分的客觀化是具有一定可行性的。筆者雖然對所提出的評分標(biāo)準(zhǔn)進(jìn)行了規(guī)定與描述,并選取了相對易于量化的指標(biāo)作為分項(xiàng)式評分的依據(jù),不過,這一評分體系仍缺乏具體的量化標(biāo)準(zhǔn),導(dǎo)致評分員在具體評分過程中的主觀發(fā)揮空間略大。
第二,評分權(quán)重不夠細(xì)致,缺乏一定的實(shí)踐支撐。筆者雖然對所提出的評分標(biāo)準(zhǔn)進(jìn)行了一定說明,并對每一分項(xiàng)進(jìn)行了權(quán)重衡量,但這一權(quán)重大多是基于理論之上的主觀性劃分,缺乏實(shí)踐的反復(fù)驗(yàn)證和支撐。
總的來說,以本次實(shí)驗(yàn)結(jié)果為依據(jù),根據(jù)前人對于寫作評分客觀化的研究,對實(shí)驗(yàn)中各分項(xiàng)評分內(nèi)容及權(quán)重進(jìn)行調(diào)整,在語言要素和言語要素之間尋求平衡的同時(shí),加大可量化指標(biāo)的權(quán)重,盡可能減少評分員個(gè)人主觀區(qū)間是今后實(shí)驗(yàn)需要改進(jìn)的地方。
(二)詞匯與客觀化評分之間的關(guān)系
通過訪談,我們發(fā)現(xiàn),三位評分員均對詞匯給予了一定的關(guān)注。在量化分析中,三位評分員所給出的總成績和詞匯成績的相關(guān)性均達(dá)到顯著水平,這說明考生的詞匯水平對其作文整體成績具有較大的影響。彭星源等通過實(shí)驗(yàn)證明,基于詞匯的作文評分是一項(xiàng)有效的評分方式[8]。黃志娥等通過對1992—2005年HSK作文答卷的分析,認(rèn)為作文長度、詞匯使用和成段表達(dá)三個(gè)特征與考生作文成績之間相關(guān)性較強(qiáng)[9]。由此可知,在漢語作為第二外語的寫作中,利用詞匯來預(yù)測考生作文成績是具有一定的可行性的。不過,選取哪些可量化的詞匯標(biāo)準(zhǔn),如何科學(xué)地制定相關(guān)標(biāo)準(zhǔn),以提高寫作評分的客觀化水平,是今后寫作評分研究中應(yīng)當(dāng)關(guān)注的內(nèi)容。
除詞匯水平外,是否還存在其他可量化的指標(biāo),以更好地提高寫作評分的客觀化?就目前的現(xiàn)狀來看,在以英語為第二外語的寫作中,存在一些機(jī)改作文的成功案例,如句酷批改網(wǎng)就是在基于語料庫的大背景下,對文本的各項(xiàng)內(nèi)容進(jìn)行量化,以突出寫作評分的客觀化。在漢語作為第二外語的寫作中,是否可以通過可量化的指標(biāo)來制定寫作評分標(biāo)準(zhǔn),這也是今后應(yīng)當(dāng)關(guān)注的方向。
寫作作為一項(xiàng)重要的產(chǎn)出型技能,反映著一個(gè)人語言習(xí)得水平的高低,就此而言,寫作評分的客觀化研究是具有深遠(yuǎn)意義和廣闊前景的。提高第二語言寫作評分的客觀化,首先要提高評分標(biāo)準(zhǔn)的科學(xué)性和合理性。從這一點(diǎn)上來說,尋求可量化的指標(biāo),研究它們與考生寫作能力之間的相關(guān)性,是一個(gè)很好的解決辦法。其次是評分員的問題,亦即如何降低或盡量避免評分員效應(yīng)的問題。筆者發(fā)現(xiàn),機(jī)改作文能夠較好地解決這一問題,但是與此相伴的問題仍然是量化指標(biāo)的問題。筆者認(rèn)為,在第二語言寫作中,評分標(biāo)準(zhǔn)不僅應(yīng)該與寫作和寫作水平相對應(yīng),還應(yīng)該盡量提出更多客觀的可量化標(biāo)準(zhǔn)。
參考文獻(xiàn):
[1]Hamp-Lyons,L. & Kroll,B.Issues in ESL Writing Assessmnet:An Overview[J].College ESL,1996,(1).
[2]李慶本.作文作為高等漢語水平主觀性考試?yán)碚撘罁?jù)和命題原則[A].劉鐮力主編.漢語水平測試研究[C].北京:北京語言文化大學(xué)出版社,1997.
[3]馬明霞.對外漢語三種寫作測驗(yàn)方式的效度實(shí)證研究[D].上海:復(fù)旦大學(xué)碩士學(xué)位論文,2012.
[4]歐洲理事會文化合作教育委員會.歐洲語言共同參考框架:學(xué)習(xí)、教學(xué)、評估[S].劉駿,傅榮譯.北京:外語教學(xué)與研究出版社,2008.
[5]國家漢語國際推廣領(lǐng)導(dǎo)小組辦公室.國際漢語能力標(biāo)準(zhǔn)[S].北京:外語教學(xué)與研究出版社,2007.
[6]方緒軍.漢語測試與評估[M].上海:復(fù)旦大學(xué)出版社, 2013.
[7]劉國偉.留學(xué)生漢語短文寫作中的客觀性成分及其對評分影響的分析[D].上海:華東師范大學(xué)碩士學(xué)位論文, 2005.
[8]彭星源,柯登峰,趙知,陳振標(biāo),徐波.基于詞匯評分的漢語作文自動評分[J].中文信息學(xué)報(bào),2012,(2).
[9]黃志娥,謝佳莉,荀恩東.HSK自動作文評分的特征選取研究[J].計(jì)算機(jī)工程與應(yīng)用,2014,(6).
A Study on Objectification of Writing Grading and Its Lexical Influence
Wang Fan
(School of Humanities, Shanghai Jiao Tong University, Shanghai 200030, China)
Abstract:In the second language writing test, writing grading is the most important issue for researchers. The influencing factors include subjective and objective aspects, including the error of the propositional composition itself and the scoring standard. First, it is necessary to improve the scientificity and rationality of the scoring standard to improve the objectification of second language writing, and secondly, it is necessary to avoid or minimize the grader effect. This problem can be solved better by correcting the composition by machine, but the problem is how to quantify the index. Therefore, the grading criteria should not only correspond to the writing and writing level, but also try to present more objective and quantifiable criteria.
Key words:writing grading;objectification;lexical influence