劉冬冰,魏海棠,趙思達
(1.南京林業(yè)大學語言應用研究中心,江蘇南京 210037;2.南京曉莊學院新聞與傳播學院,江蘇南京 211171;3.北京師范大學文學院,北京 100875)
論普通話水平測試中的評分誤差
劉冬冰1,魏海棠2,趙思達3
(1.南京林業(yè)大學語言應用研究中心,江蘇南京 210037;2.南京曉莊學院新聞與傳播學院,江蘇南京 211171;3.北京師范大學文學院,北京 100875)
對普通話水平測試的復審表明,評分中“朗讀”與“說話”的誤差較大,其原因涉及試卷構成與隊伍建設等多個方面。為提高普通話水平測試的信度,以普通話語音知識和方言學、音位學的基本知識作為內容的測試員后期培訓應盡快付諸實施。
普通話;水平測試;評分誤差
普通話水平測試作為一項較新的語言測試,涉及到語言學中的實驗語音學、言語聲學、心理語言學、統(tǒng)計語言學和語言教學與測試等領域。因其新,故在測試的理論和方法上有待完善。目前,一些省份已經利用計算機輔助測試,對前三項進行評分,取得了較好的效果。但是,第四項“說話”仍然為人工打分。就筆者調查情況來看,測試員在實際操作中,由于主觀因素的影響,對標準的把握不盡相同,測試誤差在所難免。為了把因主觀性評定而產生的測評誤差降到最低限度,許多省份采取了復審制度??梢哉f,復審制度是普通話水平測試的補充和延續(xù),是其重要的輔助部分。筆者近些年參與了江蘇省普通話水平測試的復審工作,發(fā)現(xiàn)一些測試點的音檔中存在著評分過松過緊現(xiàn)象,其中過松占多數(shù)。打分誤差集中表現(xiàn)在第三項“朗讀”和第四項“說話”上。即使是同一組測試員,在對同一個被測對象打分時前兩項非常接近,而第三項“朗讀”和第四項“說話”的打分卻相差較大。本文擬以江蘇省為例,就復審中發(fā)現(xiàn)的測試誤差現(xiàn)象進行分析。
通過考察我們發(fā)現(xiàn),造成評分誤差的原因大致有這樣幾個方面。
第一、二項的測試內容基本上處于一個較穩(wěn)定的狀態(tài),對相對穩(wěn)定狀態(tài)中的錯誤和缺陷的認識容易取得一致;而第三、第四項的內容處于動態(tài)的語流中,對其語音錯誤與缺陷的認識不易取得一致。相對來說,測試第一、二項時,由于字詞之間的間隔使應試人的語速也相對緩慢,測試員判定正誤的時間較充分;而第三、第四兩項中,漢語音節(jié)是以動態(tài)的形態(tài)出現(xiàn)在語流中的,被測的語速相對較快,發(fā)音不易穩(wěn)定,這是造成判分誤差的原因之一。
語言習得理論顯示:同一個音位在不同的語流中出現(xiàn)時,被試者需用不同的音位去替換。這說明語音的靜態(tài)難度和動態(tài)難度是不同的,對發(fā)音器官協(xié)調能力的要求也是不同的。現(xiàn)場測試也證明了這一點——被測的語速、詞語在句子中的地位都可能使一個音節(jié)在音質上和韻律特征上發(fā)生改變。例如“很高興”中的“很”如果發(fā)成“哼”的上聲,既不應定為錯誤,也不應判為缺陷,因為“高”的聲母是個舌根音,很容易同化“很”的韻尾。所以,測試不僅要求測試員的聽覺高度靈敏,注意語音學上不同音素的分析,而且還要注意從音位學的角度進行分辨與歸納,即測試員應具備必要的音位學知識和對語流音變把握的能力,確認漢語普通話每一音位常見的條件變體,這樣才可能不放過一個“錯誤”或“缺陷”,不冤枉一個正確的發(fā)音,才可能將錯誤與缺陷區(qū)分開來。
錯誤和缺陷的判定應該以音位理論為參照系,理由是,以能否區(qū)別意義為依據(jù)比較合理,也比較容易控制。所以,不能簡單地認為凡把甲音素發(fā)成了乙音素或把甲調值發(fā)成了乙調值都為錯誤。例如:徐州方言區(qū)的人往往把[a]鼻化,失去韻尾,近乎[~a];南京方言區(qū)的人則易把[α]發(fā)成[ε],盡管把甲音素發(fā)成了乙音素,但并未造成意義的混淆,所以,應定為缺陷;另外,許多人把第一項中的上聲也發(fā)成半上,調值為 21或 211,也由于并未產生歧義而只能算作缺陷。前鼻音與后鼻音的音質差別盡管在二者相混的方言區(qū)聽來幾乎為零,但從普通話音位系統(tǒng)的角度分析就特別重要了,倘若相混就是錯誤。都是相似,有的為錯誤,有的為缺陷,衡量標準是能否區(qū)別意義。就目前復審的結果看,有些測試員對音位理論的把握不甚到位,因此把一些缺陷判為了錯誤。這對第四項的評分尤為重要,因為“說話”是按照讀錯的音節(jié)的數(shù)量為主要參照系來定檔的。
有時候,測試員判定錯誤與缺陷的標準會從一個角度偏向另一個角度,從而造成誤判。我們注意到,在第一項讀單音節(jié)字詞時,不論漢語普通話中有無 B音節(jié),被試者若把 A音節(jié)發(fā)成 B音節(jié),盡管 B音節(jié)并不存在,測試員很容易將其定為錯誤 ,例如 :把“騰 ”讀成“[t?n]”或讀成上聲、去聲。但是,在第二、三、四項測試中,如果把 A音節(jié)發(fā)成 B音節(jié),B音節(jié)在普通話中本不存在,測試員卻很容易將其定為缺陷。例如:把“沸騰”之“騰”發(fā)成[t?n]。為什么同一種語音現(xiàn)象時而被認為是錯誤,時而被認為是缺陷呢?原因很可能就是:這時候,測試員判定正誤的標準已經從“某個音素能否區(qū)別意義”變成“在語流中是否造成意義的誤解”了。
“語調偏誤”在江蘇省的《細則》中被界定為重音不當、詞的輕重格式不對、聲調有系統(tǒng)性缺陷、句調不自然和語速不當?shù)葞讉€方面。由于測試員本人在朗讀方面的理論知識和實踐能力有差異,因此對以上語調偏誤的種種表現(xiàn)理解起來就出現(xiàn)了一些差別,或者對一些明顯的語調偏誤能夠正確處理,而對一些不大常見的語調偏誤則因難以識別而不加處理。下面針對處理語調偏誤的諸要素逐一進行討論。
關于對重音不當?shù)奶幚韱栴}。重音可分為詞重音和語句重音兩類。詞重音我們后邊討論。語句重音,是指句子中讀得較重的詞語,又分語法重音和邏輯重音兩種。語法重音根據(jù)語法結構的需要把句子的某些部分重讀。大致規(guī)律是:謂語比主語讀得稍重,賓語比動詞讀得稍重;表性狀和程度的狀語、表結果或程度的補語、表疑問和指示的代詞、名詞前面的定語等常讀重音。邏輯重音也叫強調重音,是為了強調語意重點或為表達強烈感情而把句子某些部分讀得特別重。這種重音主要是由說話人的意圖和情感決定的,沒有固定的規(guī)律。[1]普通話水平測試 60篇朗讀作品中沒有重音標志,被測人完全憑著自己對作品的理解做不同處理。如果測試員對以上重音的基本規(guī)律有所了解,就會對被測者做出比較正確的評判;否則,就無法正確地進行判分,從而與其他測試員的評判結果出現(xiàn)較明顯的差異。
至于輕重格式問題,主要是就復音詞說的。這種重音大都有固定的格式,例如:帶輕聲的雙音詞,一般是重輕式。有一部分詞語雖未明確標注要讀輕聲,但將其后一個音節(jié)輕讀語感較自然,這些往往屬于重次輕式。雙音節(jié)的人名、帶前綴的雙音詞、疊音形容詞或副詞、動賓式、主謂式、偏正式以及大部分聯(lián)合式雙音節(jié)合成詞等常常是輕重式。三個音節(jié)的人名、地名、音譯詞、尾部疊音形容詞、前正后偏的合成詞,是中輕重式。而四個音節(jié)的專有名詞、疊音形容詞、象聲詞,為中輕中重式。雙音動詞重疊為重輕中輕式。[2]對于以上規(guī)律性的知識,并非每一個測試員都了解或掌握得恰如其分;同時,到底哪些詞語為中-重格、哪些詞語為重-中格,目前還沒有可靠的言語聲學數(shù)據(jù)支持和權威性依據(jù)。所以在測評時,測試員往往只能根據(jù)自己的感覺或者對漢語詞語輕重格式的一般特征去把握,因此就必然出現(xiàn)評判不一的情況。
在“說話”或“朗讀”中,發(fā)音是否清楚明白,是否生動中聽,句調也是個重要條件。語句的這種高低升降的變化,應隨著句子語氣的不同而區(qū)別,或隨說話者特殊的感情需要而變化。否則就會給人一種呆板、單調或句調不自然的感覺。[2]高等級的人員應該對此有明確的反應。但復審中發(fā)現(xiàn),有相當多的測試員對此沒有反應。
該問題容易忽略的是陰平偏低,有的被測者把 55發(fā)成 33還容易引起注意,但發(fā)成 44就不容易發(fā)現(xiàn);[3]再有就是保留入聲調方言區(qū)的測試員對聲調不完整不敏感;對單音節(jié)字詞中上聲不到位容易發(fā)現(xiàn),而對朗讀中位于句末的上聲調值是否到位則容易忽略。
在“句調自然”和語速的理解方面,筆者認為,自然流暢中的“自然”除了要求被測者不拿腔拿調、不生硬外,還應包括對作品基調的把握和感情的處理。尤其是對二甲和一級的人員,更要重視這一點。在測試中,被測者對于作品內容、層次的理解以及對作品風格的把握和感情基調的處理都存在著差別,從另一方面體現(xiàn)其朗讀的自然度。意識到這一點的測試員可能在“語調偏誤”的評分上予以顯示,例如從自然、流暢度等方面處理。意識不到的測試員則可能對此恝然置之,于是就有了標準上的不一致。
朗讀時,根據(jù)內容表達的需要或作者思想感情的變化,語速該快則快、該慢就慢、有快有慢,才能真實而生動地表達不同的內容和情境。[4]快慢沒有一個絕對標準,只能以同一語境或文章中的各部分相互比較為依據(jù)。但是,有的被測者能夠做到快慢適度,或快中有慢,或慢中有快,段與段之間,一般都有一個較長的停歇,處理得層次分明;有的則一味地快,看似流暢,卻削弱了作品的藝術價值。這些在評分中本應考慮進去,但由于部分測試員的關注點過度集中在語音失誤上,而對此不加考慮,也會出現(xiàn)判分不當?shù)那闆r。
有的測試員對“自然流暢程度”僅停留在口語化程度的識別層面或說話中斷的次數(shù)上,忽略了其他要素。第三項朗讀和第四項說話旨在檢測應試者運用普通話的水平,但由于朗讀是借助于文字材料的作者說普通話,文字材料的作者對詞匯、語法已進行過斟酌推敲,因此對應試者來說,主要就剩下語音問題了。說話顯然不那么簡單,它是對普通話口語能力的綜合性考察,它要求在較短的時間內審清題意,確定主題,選擇材料,構思層次,遣詞造句,適當修辭,因而應試者的語音、詞匯、語法各方面的熟練程度和規(guī)范程度都同時受到檢驗,其思維的敏捷性、語言與交際的能力也能得到一定程度的顯現(xiàn)?!毒V要》和江蘇省《細則》均要求從語音面貌、流暢程度和詞匯語法運用的規(guī)范三個方面評分。[2]15但在實際操作中,說話部分在評定成績時伸縮性較大。有的測試員給分缺乏足夠的依據(jù),帶有較大的隨意性。如對應試者在某一話題上偏離主題或結構混亂,機械呆板、喜怒不聞于聲、好惡不留于音、哀樂不見于調的,卻按字詞發(fā)音規(guī)范的標準評定為較好的等級;對輕重音、語調、停連、語流停頓、語速徐疾等表情達意的手段幾乎無所顯現(xiàn)的,有的測試員卻本著錯誤不多的原則不予扣分。
我們認為,在朗讀中,由于連貫的語流已經形成,所以要特別重視對被測者語感的宏觀把握,在定量分析的基礎上加大定性分析的力度。在說話項中,則應更重視對語流的動態(tài)的把握,以一種宏觀的視角進行分析和評價,而不宜將注意力過多地放到單個的語音單位上,不宜將語音問題簡單地累計或量化,而是將個別語音單位的表現(xiàn)作為判定整體語流規(guī)范程度的依據(jù)。
測試的結果是否合乎被測的實際水平,在一定程度上與測試員心理注意密切相關。桂詩春先生在《實驗心理語言學綱要》中科學地論證了“注意”在測試中的種種表現(xiàn):每個音位都有著不同的區(qū)別性特征和非區(qū)別性特征,當區(qū)別性特征受注意時,測評的誤差就小;而當非區(qū)別性特征受注意時,評價誤差就大。注意的容量有限是聽覺不能處理所有語音的根本原因。[5]在第三、第四兩項中,當連續(xù)的語流中區(qū)別性特征與非區(qū)別性特征數(shù)量不斷增多且頻率加快時,每個區(qū)別性特征引起注意的心理幾率便會減少,于是評價誤差也會增大。另外,注意存在選擇性,一方面,測試員自身方言基礎難以擺脫注意,另一方面,審音水平差異也會影響注意力集中。于是,測試員就會出現(xiàn)顧此失彼的現(xiàn)象,在語音關鍵特征與無關特征中來回轉換注意,而發(fā)生注意的位移或逆轉,造成心理評價誤差顯著。
首先,對朗讀篇目的熟悉程度不一。有的測試員對作品沒有做到爛熟于心,所以對添字、漏字意識不到,導致漏扣分;尤其是遇到朗讀過快者就更跟不上打分,或分辨不清錯誤與缺陷了。其次,對詞匯、語法錯誤的敏感度不同。詞匯、語法問題只有在說話項中才得以暴露。最常見的語法失誤是動詞與賓語搭配不當、主語與謂語搭配不當、狀語與中心詞不搭配,等等。有的測試員則只關注前者,不留意后者;另有測試員不僅本身對方言詞語不敏感,對諸如“蠻好的!”甚至“好好耶!”之類見怪不怪,對一些方言句式無所知覺,而且對病句不加扣分。對該項打分的差別之大,就可想而知了。其三,在“朗讀”項重復扣分。有的測試員在“朗讀”中既扣了聲母或韻母的系統(tǒng)性缺陷的分,又在錯誤中重復扣分。在實際操作中,這一點比較難掌握。除了錯誤與缺陷的界限本來就難以分清外,對同一個難點音,被測者可能時而讀錯,時而不完全錯,錯誤與缺陷的量也不好計算。其四,把“說話”中的缺陷算成了錯誤。按照普通話水平測試的打分原則,“說話”中錯誤的個數(shù)要量化,而缺陷只幫助定性,可以用來衡量被測方音是否明顯。但是,有的測試員過于苛刻,把“缺陷”算成“錯誤”,自然造成打分的不公允。
普通話水平測試不僅存在著提高試卷信度的問題,也存在著提高評分者信度的問題。以往的測試員培訓主要側重于測試能力,這對于一部分具有較高專業(yè)水平的測試員來說不失為一種多快好省的培訓,但對于那些沒有受過正規(guī)語音學訓練的測試員來說,似乎有些治標不治本。據(jù)了解,有的省份已經意識到這一點,擬在首次培訓后進行后續(xù)培訓,把普通話語音知識和方言學、音位學的基本知識作為后續(xù)培訓的內容,但因《綱要》的頒布和測評內容的調整,需要在后續(xù)培訓中學習,這一想法未能落實。
總之,從復審的結果看,測試員的后續(xù)培訓問題需要盡快付諸實施。
[1]李曉華.普通話口語教程[M].開封:河南大學出版社,1996:142.
[2]國家語委普通話培訓測試中心.首屆全國普通話水平測試學術研討會論文集[C].北京:語文出版社,2003.
[3]林燾,王理嘉.語音學教程[M].北京:北京大學出版社:1992:143-145.
[4]李曉華.普通話口語教程[M].開封:河南大學出版社,1996:266.
[5]桂詩春:實驗心理語言學綱要[M].長沙:湖南人民出版社,1991:99,215.
The Rating Error in Putonghua Proficiency Test
LIU Dong-bing1,WEIHai-tang2,ZHAO Si-da3
(1.Language Application Research Centre,Nanjing Forestry University,Nanjing210037,China;2.School of Journalism&Comm unication,Nanjing Xiaozhuang University,Nanjing211171,China;3.School of Chinese Language and Literature,Beijing Normal University,Beijing100875,China)
It is shown in the reexamination of Putonghua Proficiency Test that the reason why the error in rating of“reading”and “speaking” is greater is concerned with a wide range of problems of the test paper structuring,the tester team constructing,and so on.Consequently,the post training of the testers focusing on the basic knowledge of the phonetics in Putonghua,dialectology and phonemics should be implemented as soon as possible to improve the reliability of Putonghua Proficiency Test.
Putonghua;proficiency test;rating error
H102
A
1672-3910(2010)02-0037-04
2009-09-10
江蘇省教育廳課題(07SJD740009)
劉冬冰(1954-),女,河南開封人,教授,國家級普通話水平測試員。