彭云帆 隋 雯
計算機輔助普通話水平測試(PSC)中,命題說話測試項的錄音出現(xiàn)了與應試人面對測試員人工測試不同的一些情況。例如,機測命題說話中不時出現(xiàn)應試人看錯了話題或說錯了話題,以及背稿或離題等情況。這些情況在人工測試時有測試員及時提醒而能盡量避免,現(xiàn)在機測評分應當如何處理這些情況?又如,前三項即單音節(jié)、多音節(jié)和朗讀短文由計算機評分,命題說話則由兩位測試員背對背獨立評分,若兩位測試員評分的差異超過規(guī)定范圍的3分,評分則為不合格,需請第三位測試員復聽。有些測試員對沒有前三項評判印象而給命題說話評分能否準確心存疑慮。如何在評分細則上全面準確地區(qū)分機測說話項錄音答題出現(xiàn)的有關情況?如何將測試員之間的評分差異控制在合理的范圍?這要求對計算機輔助普通話水平測試及其評分細則實施情況深入進行調(diào)查及研討,在國家語委《普通話水平測試實施綱要》(以下簡稱《綱要》)的基礎上,進一步明確計算機輔助普通話水平測試的目的,對評分細則進行相應的科學的修訂。廣西語委辦多次組織不同層面的測試員,對《廣西普通話水平測試評分細則》(修改稿)(以下簡稱《細則》)反復進行實驗、研討及修改,我們參與了實驗、研討和修訂,制定出現(xiàn)行的機測命題說話評分細則,力求使其具有科學性、操作性和公平性。
一、語音標準程度
語音標準程度評分項分為音節(jié)的準確度和方音的表現(xiàn)程度。廣西評分細則對“方音”的解釋主要是指與方言有關的語音錯誤,在說話項中主要指聲韻缺陷和語調(diào)偏誤。對這一評分項中的語調(diào)與自然流暢程度評分項中的語調(diào)如何分別把握?我們認為,這里的“方音”評判設置,主要是在語音標準程度量化的基礎上歸檔操作后進行微調(diào)的依據(jù)。如《綱要》中“語音標準程度”中二檔、三檔的設置,當語音錯誤數(shù)量相同時,方音表現(xiàn)程度的不同是分數(shù)高低調(diào)整的依據(jù)。
對說話中失誤音節(jié)的定量累計,是取得評判準確性、縮小評分差異的重要保證。這里的定量包含著定性,是在定性的基礎上形成的量化記錄。說話中出現(xiàn)了什么性質(zhì)的失誤,是錯誤還是缺陷,是什么錯誤,是什么缺陷,測試員都要在瞬間做出判斷,這就是定性;及時把錯誤和缺陷分類累計下來,這就是定量。同時,在評判過程中,還應對應試人說話中非音質(zhì)的表現(xiàn)作出判斷。這樣有依據(jù)地作出語音標準程度歸檔和評分,可以由任何一位合格的測試員得出相同結果。因此,它是科學的、可控的和準確的。
對說話中失誤音節(jié)的定量累計,是測試員判分的基本依據(jù)。過去有四項或五項的人工測試評分,有的測試員憑著對前三項的印象,在應試人開始說話不足2分鐘時就對整個說話項作出判分。這樣判分不能說都不準確,確實有不少測試員當應試人一開口就能大致判斷其普通話水平等級,但從科學的角度來講,判定普通話水平高低應以確鑿的定量記錄作為事實依據(jù),不能用“大致”判定代替準確評分。當判分的依據(jù)有較大差異時,測試員之間的評分差異就難以控制。這樣不依據(jù)完整測試過程來判分,就會對應試人作出不夠公正的判分,使普通話水平測試工作的信度降低。因此,機測要求測試員脫離前三項評分而對應試人說話進行單獨評分,有些測試員產(chǎn)生“單判說話不好判”的顧慮。國家測試員培訓班反復強調(diào):沒有經(jīng)過測試評判,誰也不能確定應試人的等級。因此,測試員對機測說話項的準確評判,必須采取語音標準程度的量化工作方式。語音標準程度的準確定量,是說話項準確評分和縮小評分差距不可或缺的重要依據(jù)。
二、詞匯、語法規(guī)范程度
詞匯、語法規(guī)范程度評分項,應檢測不符合普通話規(guī)范的方言詞語和語法,不包括偶爾出現(xiàn)的口誤。從原則上講,應當主要考查應試人對普通話詞匯、語法這些語言成分的應用水平;對于言語成分應當從寬評判。如果3分鐘說話期間反復出現(xiàn)話不成句的情況,應當在詞匯、語法規(guī)范程度評分項中考慮適當扣分。語言成分指已經(jīng)進入普通話靜態(tài)系統(tǒng)中的語言的成分,詞典收錄的是詞匯部分,語法教材講解的是普通話的語法規(guī)范。從人的語感來講,對方言詞語的評判主要指意義很難理解,普通話從來不這么說的詞語。例如,桂林話中的詞語“把爺”,非西南方言區(qū)的人乍一聽是不會理解其詞義的。又如,粵方言的“吃茶”、“吃煙”、“那個人很肥”,普通話就不這么說。關于詞匯、語法的規(guī)范與方言詞語句式的對比材料,測試培訓教材應當進行詳細的收集和系統(tǒng)的整理。
三、自然流暢程度
自然流暢程度評分項主要分為語調(diào)自然程度和言語流暢程度兩方面。命題說話是一個整體,語流中的各項要素比如語調(diào)在各項評分中會有交叉出現(xiàn)的現(xiàn)象,“細則”及其實施應讓各項評分分工合作?!白匀涣鲿吵潭取迸c“語音標準程度”在語調(diào)上有交叉,與“缺時”在“言語流暢程度”上有交叉,但是它們各有分工。自然流暢程度評分項對語調(diào)的考查,是對3分鐘說話語流態(tài)勢的整體考查,是在“語音標準程度”之外對語流的流暢和樣態(tài)的評分;“語音標準程度”中的“方音”,只是音節(jié)量化歸檔的輔助性微調(diào)要素,幾乎不單獨占分值?!白匀涣鲿吵潭取敝械恼Z調(diào),與方音中的語調(diào)評分著眼點不同,所占分值也不同。
對說話自然流暢程度的考查,是對語言能力的考查。這種考查也體現(xiàn)在朗讀以及多音節(jié)、單音節(jié)測試項。語言學習的目標可以分為語言能力的獲得和語言應用能力的獲得。語言能力是語言學習過程中的基礎能力,是前一階段的學習目標。是對語音、詞匯、語法各語言要素掌握的能力,也就是說話時能否正確地發(fā)音、用詞和造句的能力。假如說話中語流不順暢,磕磕絆絆,反復出現(xiàn)糾正字音、方音和方言句式等現(xiàn)象,說明應試人普通話語言能力不過關。評分時,即使不在“語音標準程度”定量上記為語音錯誤,也應在“自然流暢程度”上適當扣分。
語言應用能力是應用普通話生動自如地表達思想感情的能力,是普通話語言學習的高級目標,也是普通話水平測試的側(cè)重點?!毒V要》二檔中有“類似背稿子的表現(xiàn)”,三檔中有“語調(diào)生硬”的描寫。這里“類似背稿子的表現(xiàn)”,是指語調(diào)或腔調(diào)上的表現(xiàn),“語調(diào)生硬”是“類似背稿子的表現(xiàn)”的程度加深。就目前的認識來講,語調(diào)主要包括聲調(diào)、句調(diào)、重音、停連以及音節(jié)長短等超音段的節(jié)律特征?!邦愃票掣遄拥谋憩F(xiàn)”語調(diào)用漢語拼音無法記錄,用文字只能做大致的描寫:停連機械、高低無據(jù)、沒有輕重之分或輕重不當、語音形式與語言內(nèi)容不一致。這樣的表現(xiàn)徒有語音形式的“順溜”,而無言語形式與言語內(nèi)容之間諧調(diào),所以語調(diào)生硬。應試人說話全過程采用背稿子腔調(diào)或語調(diào)生硬,說明他(她)只掌握普通話語言形式,具備普通話語言發(fā)音能力,尚未達到普通話應用能力的目標,未能用標準普通話流暢生動地表達豐富的思想感情。學生們在課堂上齊讀唱讀的訓練
方式對他們學習普通話語流起到了誤導作用,這些學生用普通話說話時就會自覺不自覺地采用那些生硬腔調(diào)、背誦語調(diào)、念書腔調(diào),禁錮語言應用能力的發(fā)展。對背誦語調(diào)、生硬語調(diào)等現(xiàn)象,我們在評分工作中不可忽視。
四、缺時
缺時指說話中出現(xiàn)持續(xù)性的空白,是人工測試和機測共有的現(xiàn)象?!毒V要》規(guī)定缺時1分鐘以內(nèi)有3個分數(shù)?!都殑t》具體規(guī)定為“錄音開頭空白10秒不扣分,以后出現(xiàn)空白每持續(xù)10秒扣0.5分。說話不滿30秒,本測試項扣40分。”以10秒為計量單位來扣分,以縮小測試員之間的評分差異,并跟“自然流暢程度”的評判相區(qū)分。
錄音開頭空白10秒不扣分,是出于對機測錄音常見情況的考慮。應試人朗讀結束后接著點擊說話題,用10秒時間調(diào)整思路應該是合理的。有的應試人操作計算機時會耽擱一點兒時間,用10秒時間也是合理的。此后缺時從10秒起扣,我區(qū)把網(wǎng)絡評分頁面可以開始記錄扣分的時間設置為2分51秒,提示測試員對應試人說話的聽判時間不可以隨意減少,以保證對應試人評分的真實可信,減少測試員評分之間差異。
缺時與自然流暢程度的評分區(qū)別在于,缺時評分項是指說話出現(xiàn)持續(xù)性空白,自然流暢程度評分項考查言語是否磕巴、不流利、反復糾錯、停頓時間較長,而不包括10秒以上的空白?!都殑t》把“缺時”扣分界定為空白持續(xù)10秒起扣缺時分,對持續(xù)不到10秒鐘的空白,不必累計扣分,而在自然流暢程度加以評判。這樣區(qū)分兩項評分,便于操作,減少測試員之間的評分差異。
五、無效話語
無效話語是安徽、上海機測命題說話測試中提出來的概念。廣西《細則》中,無效話語包括“與測試話題毫不相關的話語,多次簡單重復相同的語句,以背誦他人文本代替說話”等。這幾條都是從內(nèi)容方面考查應試人普通話應用能力,可以歸為一個評分項。比如,應試人在說話時間內(nèi)長長地數(shù)數(shù),或反復叨嘮同一句話,或反復地念說話題目,或背誦他人作品等。
命題說話測試中出現(xiàn)無效話語的原因很多。應試人準備的內(nèi)容說完了不知再說些什么,或一時心理緊張造成思維短路,或擔心無話說,就用與說話題目無關的一些話語應對測試。這些無效話語未能表現(xiàn)出應試人普通話應用能力和水平。
廣西《細則》中無效話語評分項以占時扣分,每10秒加扣0.5分,便于操作。所謂“加扣”,就是在“語音標準程度”扣分之外再扣分,即先對應試人普通話語言能力進行考量,再對其普通話語言應用能力進行評判。
六、離題
普通話水平測試中的離題評判與高考作文的離題評判不一樣。高考作文測查考生的寫作水平,包括思維水平和語言表達水平。語言表達水平在作文評分中大約只占六分之一。普通話說話水平固然與思維水平密切相關,但它側(cè)重于指應試人普通話口頭應用能力,能否用普通話流暢地表達思想感情,而不是側(cè)重于指應試人思維水平的高低。
普通話水平測試不是側(cè)重評判應試人的思維水平,并且不容易準確判斷其說話是否離題,所以對離題的扣分應當從寬?!都殑t》修訂為:“說話內(nèi)容與話題多少有些聯(lián)系的一般不扣離題分。離題持續(xù)1分鐘扣2分,以后每30秒加扣1分,全程離題加扣6分。”比如,把話題“我喜歡的節(jié)日”錯說成“我喜歡的節(jié)目”,在語音標準程度、詞匯語法規(guī)范程度、自然流暢程度等評分項上照??鄯?,再在離題項扣6分,而不是將命題說話的40分全扣掉,因為應試人畢竟用普通話表達自己的思想。應試人以事先準備的內(nèi)容應對命題說話的題目,被扣離題的6分就不能提高普通話等級。這樣的分數(shù)設置,有利于準確反映應試人普通話真實水平,緩解他們臨場的心理壓力,也減輕測試員評分的壓力?!罢f話內(nèi)容與話題多少有些聯(lián)系而不扣分”與離題扣分之間漸降的坡度不要太陡,才符合普通話水平測試側(cè)重于考查應試人普通話應用水平這一目的。
離題與無效話語都是對命題的偏離,為何分兩項扣分?《細則》規(guī)定無效話語起扣時間是10秒鐘,離題起扣時間是1分鐘。從錄音材料中,無效話語其語言形式明顯,短時間就可以判定的;離題是內(nèi)容的偏離,短時間內(nèi)不好判斷,其起扣時間比無效話語起扣時間要長。因此,這兩項不能合并,不重復、不累計扣分,以便于操作。
命題說話評分項目共有這六條。這六條相互配合,構成一個完整的合理的普通話說話評價系統(tǒng),供測試員獨立評分使用。對《細則》的實施,可增加測試員獨立評分的可信度。命題說話測試項沒有前三項評分的印象,避免兩名或三名測試員評分之間相互參考,每位測試員完全憑借個人聽力獨立評分,與其他測試員評分差異控制在規(guī)定的3分以內(nèi),其評分就是真實性的可信的。
《廣西普通話水平測試評分細則》是技術性的操作規(guī)則。我們期望測試員依據(jù)修訂后的《細則》。在相同條件下能得出相同的評分結果,并在命題說話測試中不斷發(fā)現(xiàn)新問題,以便今后進一步完善命題說話測試項評分細則。
[作者簡介]
彭云帆,女,漢族。廣西師范學院副教授,國家級測試員,應用語言學方向。
隋雯,女,漢族,廣西幼兒師專副教授,國家級測試員,現(xiàn)代漢語口語方向。
(責編李景和)