普通話水平測試工作在全國已經(jīng)開展了近二十年,它對普通話的推廣發(fā)揮了巨大的作用。但是近年來,普通話水平測試步入了一個上下波動甚至瓶頸時期,主要表現(xiàn)為以下兩大方面:
眾所周知,近年來,為了更好地推進普通話水平測試現(xiàn)代化建設(shè),國家語言文字部門會同相關(guān)科研單位開發(fā)了計算機輔助普通話水平測試系統(tǒng)(以下簡稱“機測系統(tǒng)”),經(jīng)過驗證和試點后,已經(jīng)在全國范圍內(nèi)使用,基本替代了人工測試的方式。但是令人遺憾的是,使用之初所發(fā)現(xiàn)的不足,如對于高分數(shù)段達到一級甲等和低分數(shù)段三級乙等及以下的樣本評判的準(zhǔn)確度等不夠理想;對于港澳地區(qū)考生的測評也不適應(yīng)等問題依舊未能很好地改進。另外,機測系統(tǒng)是根據(jù)人工測試評分細則來進行開發(fā)設(shè)計,但實際運行中,卻采用模糊綜合評價方式來打分,對考生在每道題目測試中所反映的語音語調(diào)等問題不能很好地描述統(tǒng)計,以備需要時準(zhǔn)確全面地反饋給考生,為日后進一步學(xué)習(xí)提高普通話水平提供參考。
除此之外,在全國各地推廣機測系統(tǒng)過程中,還遇到了以下一些問題:
(1)機測系統(tǒng)運行不穩(wěn)定。隨著越來越多的測試站和測試員使用機測系統(tǒng),機測系統(tǒng)不斷出現(xiàn)擁塞或者頁面異常等現(xiàn)象。盡管造成這樣的問題有多種原因,可能是公眾互聯(lián)網(wǎng)的問題,也可能是測試員使用的電腦配置等軟硬件問題,但一個不爭的事實是,機測系統(tǒng)使用的不穩(wěn)定頻率越來越高,這極大影響了測試的效率。測試員經(jīng)常會遇到這樣的情況:別的頁面打開都正常,但唯獨機測界面無法打開,或者打開極慢;有時候機測系統(tǒng)的登錄界面很快打開,但輸入用戶賬號、密碼及驗證碼等信息后,卻反復(fù)提示錯誤信息;最令人難以忍受的情況是,當(dāng)聽完一個考生錄音,填寫完所有測評信息后,尤其是復(fù)審全部四題時,頁面崩潰,白白浪費了測試員精力,需要反復(fù)重新進入,重新聽評,重新填寫信息。每當(dāng)遇到類似異常情況時,卻得不到及時的技術(shù)支持,嚴重影響了普通話水平測試工作的進程。
(2)機測系統(tǒng)評分界面設(shè)計仍有諸多不合理之處。機測系統(tǒng)評分界面目前主要分第四題說話項聽評和全四題復(fù)審兩種。盡管大部分信息填寫和分數(shù)輸入都設(shè)計較友好,但有一些細節(jié)雖幾經(jīng)改進卻仍有不合理之處。比如,評分細則特別是針對計算機輔助測試中出現(xiàn)的新問題所制定的補充細則里提到的“朗讀文本”等現(xiàn)象未設(shè)置打分區(qū)域(見圖1,P92),只能借用別的評分項填寫。有時在填寫一些備注信息說明考生問題時,提供的文本框可錄入字數(shù)有限,不能完整表述。
另外,之前的機測版本比較好的功能卻因故取消,比如對第四題說話項自動統(tǒng)計考生缺時時間,供測試員參考。取消之后,很多說話不流暢考生斷斷續(xù)續(xù)地停頓,需要測試員人工反復(fù)回聽,在遇到網(wǎng)絡(luò)不暢,經(jīng)常因為緩沖而暫停播放錄音時,還要眼睛不離屏幕地去關(guān)注?;ㄙM大量的精力來做這種沒有技術(shù)含量的工作,非常不值。
打分對象框的字號大小和醒目程度也存在一定問題,每道題扣分的數(shù)值通常是最重要的信息,而記錄錯誤個數(shù)信息僅是參考。但目前的界面卻把語音錯誤個數(shù)、缺時等信息凸顯出來,經(jīng)常造成測試員在操作填寫信息時,忘記了輸入扣分項,出現(xiàn)失誤。
圖1
除此之外,在提交評分前的確認提示框里所顯示的各項扣分信息也很不醒目,同樣容易造成誤操作。
盡管該系統(tǒng)對每位擁有機測帳號的測試員都設(shè)計了工作量統(tǒng)計等管理信息。但是在分類排序、測試信息的顯示上非常不直觀,不能簡明清晰地反應(yīng)一段時期測試員完成的工作量情況,對各測試站發(fā)放薪酬、評價測評誤差等業(yè)務(wù)水平帶來了很大的困難。同時很多任務(wù)編號(見圖2)在顯示的時候,完全雷同,例如“測試任務(wù)名稱”“測試任務(wù)編號”等不能明顯區(qū)別各測試錄音文件,這些對測試員而言意義不大的信息完全可以屏蔽,取而代之顯示一些對測試員有幫助的文字信息。
圖2
第四題說話項是兩位測試員背對背打分,會出現(xiàn)一些分差較大的結(jié)果,只能將這批錄音再發(fā)送給另一批測試員重聽。盡管這樣的方式有助于更公平公正評價成績,但一批數(shù)據(jù)只要有一例成績異常,就會影響整批成績的確定,大大延長了成績確認的周期,這種現(xiàn)象亟待改善。
盡管從中央到地方,早就開展了很多語言文字科研工作,也取得了很多令人矚目的成果。但相比之下,普通話水平測試領(lǐng)域的科研則一直處于不太被看重的地位。特別是近些年,計算機輔助普通話水平測試系統(tǒng)的開發(fā)和使用,更加暴露了科技攻關(guān)、抱團發(fā)展的不足。目前只有安徽科大訊飛一家技術(shù)公司在進行普通話水平測試智能化的科研及市場化運作。但是在使用過程中,技術(shù)人員和一線測試員之間的信息互通明顯不夠,造成了很多實際測試中遇到的特殊問題沒有能夠及時應(yīng)對。而基層測試員在測試過程中記錄的考生情況,相關(guān)的數(shù)據(jù)上傳到主服務(wù)器后也無法共享并開展對比研究。掌握大量機測數(shù)據(jù)的技術(shù)部門沒有精力和能力去做進一步的研究改進,而一線測試隊伍想開展相關(guān)研究,卻無法得到詳盡的數(shù)據(jù),甚至是本測試站的數(shù)據(jù)也無法獲取。這極大挫傷了各基層測試站開展科研工作的積極性,降低了出高質(zhì)量實用性強的科研成果的可能性,嚴重阻礙了普通話水平測試現(xiàn)代化手段改革的步伐。
在實行機測的過程中,出現(xiàn)了一些新的情況,盡管一些地區(qū)測試管理部門積極出臺了一些應(yīng)對措施,但還沒有統(tǒng)一上升到全國一把尺子的地步。各種補充規(guī)定,隨著機測工作的不斷深入,還需要不斷改善,但這些工作明顯滯后。比如,目前機測中,不少考生為了走捷徑,通過網(wǎng)絡(luò)平臺或者其他社會輔導(dǎo)途徑,將很多說話話題照搬套用,一個“番茄炒雞蛋”過程被很牽強地用于多個話題中,并出現(xiàn)大量重復(fù)雷同的語料。但從現(xiàn)有的離題和無效語料的判定依據(jù)上,很多爭議未能得到及時解決,思想認識未統(tǒng)一。
自從上世紀(jì)90年代以來,國家語委普通話培訓(xùn)測試中心已舉辦了50多期國家級普通話水平測試員培訓(xùn)班,培養(yǎng)了數(shù)千名國家級普通話水平測試員。同時各省市自治區(qū)測試中心也分別培養(yǎng)了數(shù)倍于國家級測試員數(shù)量的省級普通話水平測試員。他們?yōu)槲覈胀ㄔ捤綔y試工作做了大量的艱苦工作,為在全社會推廣使用普通話作出了重大貢獻。取得測試員資格的過程是嚴格規(guī)范、公平公正的。但是近年來,隨著機測工作的普及,測試員在測試工作中所扮演的角色越來越不重要,測試員幾乎成了機測系統(tǒng)的陪襯,各級測試員都沒有權(quán)限在測試中掌握一些相關(guān)信息,十分被動和不透明地執(zhí)行評分任務(wù)。盡管這樣的方式在一定程度上有助于公平客觀的評判,但是對于臨界情況,以及復(fù)審時骨干測試員無法掌握出現(xiàn)問題的全貌,可能會造成一些重復(fù)冗長的再審過程。加上測試工作的繁重,以及所得到的勞動薪酬過低,造成了大量優(yōu)秀測試員的轉(zhuǎn)型和流失,經(jīng)常遇到在分配測試任務(wù)時,看起來很龐大的測試員隊伍,但是測試水平穩(wěn)定的可用人數(shù)卻捉襟見肘,現(xiàn)狀堪憂。
目前經(jīng)過國測中心培訓(xùn)合格的國家級測試員,在回到各地后,并沒有被跟蹤了解測試業(yè)務(wù)水平。不少省級測試中心對省級測試員則有3年一回爐,省內(nèi)骨干測試員1-2年進行業(yè)務(wù)培訓(xùn)考核等后續(xù)業(yè)務(wù)監(jiān)管措施,基本能保證測試能力不出現(xiàn)大的波動。但是對于國家級測試員,各省沒有權(quán)限進行考核和管理。導(dǎo)致少數(shù)獲得了國家級測試員資格但之后長久不參加測試工作,業(yè)務(wù)生疏的測試員難以管理的局面。
盡管目前國測中心和各省一級測試中心,幾乎每年都舉辦新測試員培訓(xùn),不斷壯大測試員隊伍。但是隨著機測手段的全面推廣,實際參與測試工作的人數(shù)越來越少,大批測試員工作量嚴重不足,業(yè)務(wù)能力自然容易生疏下降。并且,實行機測后,測試員平時接觸的機會變得稀少,彼此在一起對業(yè)務(wù)進行交流探討變得不可能,不利于保持測試員群體對評分認識的統(tǒng)一。盡管目前有各種網(wǎng)絡(luò)通訊交流平臺,但是語言的面對面交流所產(chǎn)生的作用是無法替代的。同時,一個不爭的事實是,無論之前的人工測試還是機測中只聽第四題,支付測試員的勞動報酬都非常低廉,這在一定程度上,也挫傷了一些優(yōu)秀測試員繼續(xù)從事該項工作的積極性,轉(zhuǎn)而把精力放在其他更有前途的學(xué)科領(lǐng)域研究和實踐上去了。尤其對于經(jīng)常復(fù)審機測錄音的骨干測試員而言,同樣聽第四題,但往往聽到的都是評分有較大爭議、錄音比較特別的樣本,所花的精力和時間會更多,對應(yīng)的勞動所得卻和普通聽評錄音樣本一樣,明顯有失公允。
盡管早在2000年國家就頒布了《中華人民共和國國家通用語言文字法》,給新時期的語言文字工作帶來了極大的促進作用。但是隨著這些年語言文字相關(guān)法規(guī)的具體實施,逐漸遇到了不少無奈和擔(dān)憂:
作為語言文字工作的重要示范窗口和表率,廣播電視電影表演行業(yè)在上世紀(jì)90年代曾一度掀起了學(xué)習(xí)強化普通話水平的熱潮,相關(guān)領(lǐng)域的法規(guī)、辦法也提及各級媒體從業(yè)人員應(yīng)該達到的等級,對應(yīng)的獎懲待遇等。比如省級及以上廣播電視媒體播音員主持人上崗前,普通話水平必須達到一級甲等。通過一甲送審情況可以看出,在1999年全國廣電系統(tǒng)等送國家語委普通話水平測試中心復(fù)審數(shù)達到了高峰,那時廣電系統(tǒng)對普通話的要求也最嚴格。但是隨著當(dāng)時的廣電從業(yè)人員整體參加了普通話水平測試之后,陸陸續(xù)續(xù)加入廣電行業(yè)的新從業(yè)人員參加普通話水平測試的積極性和組織性都大幅下降,而近年來,從中央到各地方媒體,廣播電視播音員、主持人以及影視劇演員的普通話水平呈明顯滑坡狀態(tài),各級主管部門也沒有進一步強化相應(yīng)的管理措施,普通話水平在專業(yè)考核中所占比重越來越低。并且廣電文化系統(tǒng)在普通話業(yè)務(wù)交流上同語言文字部門的合作也不夠理想,長此以往,對整個社會的示范作用將帶來極大的負面影響。
在語言文字法頒布實施的頭幾年,各級政府和企事業(yè)單位都很積極地響應(yīng)法律法規(guī)中的要求,在各自領(lǐng)域中開展了一系列推普及普通話測試工作。但是測試高潮過后,就沒有后續(xù)的跟進,測試工作和學(xué)習(xí)提高普通話的工作沒有持續(xù)地結(jié)合起來,造成了為了測試而測試,測試過后無事可做的局面。
普通話水平測試工作開展這么多年來,高校測試站扮演了主力軍的作用。無論是測試人次還是測試工作的持久性,學(xué)校的先天條件和氛圍,都能保證測試工作源源不斷地開展。尤其是一些非師范專業(yè)類別的高校,如武漢理工大學(xué),在國家語言文字法的大框架下,修訂了自己的培養(yǎng)計劃,將普通話學(xué)習(xí)和達標(biāo)列入必修素質(zhì)學(xué)分范疇,極大地促進了校園普通話的推廣工作。但是令人惋惜的是,從全國范圍來看,這樣的高校太少,以至于七八年過去了,大多數(shù)高校,甚至文科比重占多數(shù)的高校,一直未能跟進,普通話水平培訓(xùn)和測試的新局面始終未能進一步打開。甚至一些先期采取了普通話學(xué)習(xí)硬性舉措的高校,不斷受到考生和社會的質(zhì)疑,解釋說服工作重復(fù)開展,令人無奈。
上世紀(jì)90年代開始施行的普通話水平測試,在發(fā)放的等級證書里,存在一個越來越引起爭議的環(huán)節(jié):沒有有效期,這樣很容易產(chǎn)生一證管終身的弊端。我們知道,很多技能,特別是語言的學(xué)習(xí)和提高,是一個循序漸進、不斷使用不斷鞏固提高的過程,這樣才能保證水平的穩(wěn)定。而現(xiàn)行的普通話水平等級證書,可以考多次,拿多本證書,但是卻沒有有效期。這樣對普通話培訓(xùn)和測試事業(yè)將不可避免地帶來阻礙,無法保證可持續(xù)發(fā)展。為獲得普通話水平證書容易產(chǎn)生集中突擊、急功近利的行為。
綜上所述,普通話水平測試工作開展了近二十年,盡管取得了令人矚目的成就,開創(chuàng)了語言文字工作的新局面。但是在發(fā)展中遇到的各種問題,也必須正視,并且需要各方通力合作、統(tǒng)一步調(diào),及時處理好這些問題,保證普通話推廣事業(yè)能穩(wěn)步、健康地持續(xù)發(fā)展!
[1]宋欣橋:《普通話水平測試員實用手冊》,商務(wù)印書館2005年版。
[2]齊影:《普通話水平測試一級甲等復(fù)審十年》,第四屆全國普通話培訓(xùn)測試學(xué)術(shù)研討會論文集2009年版。