鄒 淵
(重慶第二師范學院,重慶400067)
重慶市自1994年開展普通話水平測試,到2012年5月,全市參測總人數(shù)達到106.9875萬人次,年測試量由1994年3萬余人次,增加到2011年的14.5萬余人次;[1]重慶市2007年10月啟用計算機輔助普通話水平測試系統(tǒng),自此人工測試和機輔測試并行;2010年以后,大面積采用機輔測試;2011年,基本實現(xiàn)了人工測試向機輔測試的轉變。
1.首個測試站建設情況
2007年,重慶市語言文字工作委員會作出批復,同意在重慶教育學院設立“重慶市國家普通話水平智能測試基地”,對全市機輔測試進行指導和管理,本測試基地也成為重慶首個啟用機輔測試的地方。
測試基地建有候測室、備測室和標準化測試室,三室毗鄰。測試室有10個獨立機房,并備有15臺筆記本電腦,網(wǎng)絡版與單機版并用?;剡€建有多功能培訓室,智能模擬測試室,為考前培訓和模擬測試提供了場所。為確保普通話水平測試數(shù)據(jù)傳輸,基地搭建了相關的網(wǎng)絡平臺,配備了專用服務器,供數(shù)據(jù)有效傳輸。[2]
以此為出發(fā)點和技術依托,重慶市陸續(xù)開展機輔測試的推廣和建站工作。
2.人機測試對比情況
在啟用初期,本著大膽推進、小心求證的原則,重慶市在2007年進行了兩次大規(guī)模人機評測對比實驗,由測試員和計算機同時對參測者進行評測。具體做法是:測試員根據(jù)PSC測試規(guī)范對測試者現(xiàn)場打分;智能評測系統(tǒng)對測試者除命題說話外的其它所有部分進行自動評測,自動評測所得各題分數(shù)再加上測試員對命題說話部分的分數(shù)得到最終機測成績;最后,對本次測試的測試員打分和機測成績進行分析。從分析結果來看,兩次對比的平均總分誤差為2.46和0.163,等級一致率分別為100%和81.5%。最后認為:機輔測試結果客觀公正,可信度高,并極大地降低了測試員和工作人員的勞動強度,規(guī)范和減化了管理程序。[3]
3.相關培訓情況
自2007年10月以來,共開展測試員培訓14次(含骨干測試員培訓3次),培訓人數(shù)達600余人次(含測試員重復參加培訓的情況)。培訓內容涉及評分標準解析,在線評分操作示范,測試實例研討及考核4部分。培訓人員從核心骨干測試員拓展到一般測試員,送培單位覆蓋全市所有區(qū)縣及有測試機構的單位。開展測試站站長培訓和管理人員培訓6期,培訓人數(shù)200余人,培訓內容包括測試系統(tǒng)介紹、建站要求、系統(tǒng)操作要領等,為規(guī)范建站提供了人員保障。
以下數(shù)據(jù)均為截至2012年5月,據(jù)國家普通話水平測試信息管理系統(tǒng)查詢統(tǒng)計得出。
1.測試站數(shù)量
全市建成63個基層測試站,其中區(qū)縣測試站40個,高校測試站17個,其他機構測試站3個,未開展測試工作的測試站3個。固定考試機數(shù)量500余臺。
2.測試數(shù)量
流程結束的測試總人數(shù)183029人,人數(shù)逐年遞增。2012年1月至5月已測試308批次,28256人。高校測試站表現(xiàn)活躍,測試總人數(shù)已突破10萬人。
與測試站測試人數(shù)分布相適應的是,從測試者的職業(yè)構成看,教育系統(tǒng)參測人數(shù)為143647人,占測試總數(shù)的 78.48%,其中教師占19.4%,學生占55.08%。
3.測試質量
從測試總人數(shù)上看,二級乙等所占比例最高,達46.66%。從測試者職業(yè)構成來看,演播人員總體水平最高,成績大都在一級乙等及以上,其次為教育系統(tǒng)人員,其中學生序列略高于教師序列,公務員序列水平列第三。
4.評測情況
全市在編測試員共1078人左右[4],進入機輔測試測試員庫的314人,有工作量記載的232人,直接參與在線評分并活躍在測試中的測試員只占20%左右。
1.測試系統(tǒng)運作不夠穩(wěn)定,檢測工具靈敏度不夠
測試系統(tǒng)對于硬件設施存在兼容不確定性。比如,同一批次計算機,雖然都能通過系統(tǒng)“環(huán)境檢測”,但系統(tǒng)在有的機器上運轉正常,在有的機器上則表現(xiàn)不穩(wěn)定;再如在移動測試中,筆記本品牌IBM和DELL相當配置也都可通過檢測,但實際測試中DELL重測或異常復審的機率遠高于IBM。
另外,系統(tǒng)對考生聲音的包容也不確定。有的考生能夠試音成功,并在規(guī)定時間內完成相應題目,但卻無法評測成功,有的甚至連續(xù)幾次都不能通過。系統(tǒng)無法給出準確的出錯原因(比如聲音模糊、過高、過低、頻繁讀錯等等)。遇到這種情況,網(wǎng)絡版尚可當異常數(shù)據(jù)復審,但單機版則顯得比較尷尬,只能不斷嘗試直到通過評測。
2.系統(tǒng)無法給出失分詳情,評分數(shù)據(jù)庫不夠豐富
機輔測試采用整體映射比較,無法給出各項失分詳細情況,不利于查找考生語音問題及彰顯測試的客觀公正。在測試中我們還發(fā)現(xiàn):系統(tǒng)對于華北、東北方言等與普通話相近的方言區(qū)考生評測較容易成功;對于文化水平較高的考生評測也容易成功;在評測成功前,屢屢測評失敗的考生等級往往較低。
1.測試機構在布設考場時硬件設施不達標
測試室的布局通常有兩種,一種是獨立封閉互有分隔的測試機房,一種是開放空間內互有間隔但不獨立封閉的測試機位。按規(guī)定,測試機房應為2平方米以上并具有良好隔音效果,開放式機位機器之間間隔至少2米以上。測試機房應安裝攝像監(jiān)控和監(jiān)控通話設備。測試機構往往因為種種原因,減少機房面積,縮小機器距離或者未安裝監(jiān)控和通話設備等等,加大了測試系統(tǒng)正常運行的難度。
有的測試機構則對計算機配置進行減配或降低配置,如對系統(tǒng)極為重要的網(wǎng)卡、聲卡、耳機等配置不達標,就有可能造成測試不穩(wěn)定。
2.工作人員不能定崗定位,考試操作不規(guī)范
1個標準考場通常只需要考場負責人1人、候測室1人、備測室1人、測試室1人。有的測試機構工作人員職責不明,人員配置隨意,有的甚至為每個測試室配備1人,專門輔助考生操作電腦。如果考生未提出輔助操作請求而貿(mào)然為考生操作電腦,可能會妨礙考生考試。
部分測試機構力量薄弱,少數(shù)單位重視不夠,沒有專門的甚至固定的工作人員,考前臨時聘用工作人員,致使部分人員工作不熟練。部分機構人員流動性太強,有時核心技術人員或管理人員工作調整,造成資料、技術、任務移交不到位,也導致了操作上的不規(guī)范。
在獨立分隔且未安裝監(jiān)控設備的考場,考生不遵守考場規(guī)則的行為難以得到最有效的監(jiān)督,替考、夾帶、背稿子的現(xiàn)象時有發(fā)生[5],有的考生甚至為了尋求再考一次的機會,在考試中途強行關機并謊稱機器故障要求重考。遇到上述情況,工作人員均很難發(fā)現(xiàn)并及時制止。
首先,提高軟件兼容性與穩(wěn)定性,加強環(huán)境檢測工具和試音軟件的準確性。豐富數(shù)據(jù)庫內容,尤其是充實南方方言語音數(shù)據(jù)量,以提高整體映射比較準確性;充實一級乙等和一級甲等語音數(shù)據(jù),以提高對高分段考生評測準確性;充實三級乙等及不入級語音數(shù)據(jù),以提高評測成功率。
其次,研發(fā)機構應及時公布最新版本以及操作技巧,積極搜集科研成果,整理成冊,定期發(fā)行,以供各地測試機構借鑒。如結合研發(fā)階段的評測程序設計和評判模式,對討論熱烈的單字復讀、字化朗讀現(xiàn)象作出說明解釋等。
1.加強測試站管理
嚴格執(zhí)行測試站管理相關規(guī)定,嚴格審查新建測試站,要求考場建設和測試管理不達標的測試站及時整改。促成測試站的對口幫扶關系,加強各測試站之間的交流學習。組織專家技術人員隊伍,定期監(jiān)督和指導測試站的建設和操作。
2.強化測試員管理
(1)加強測試員培訓:加緊對未參加培訓的測試員的培訓。測試員應嚴格執(zhí)行教育部、國家語委發(fā)布的《普通話水平測試大綱》“命題說話”測試項的評分標準,對測試員的培訓應“反復抓,抓反復”,培訓和考核均不能搞“終身有效制”。測試員的反復培訓和定期考核應該常抓不懈。
(2)建立測試員分級管理機制:將入庫測試員分為核心測試員和一般測試員兩級,定期統(tǒng)計測試員工作總量,公布測試員有效測試量,幫助測試員及時調整評分尺度。對有效測試量低于一定比例的測試員及時培訓,考核合格方可再次上崗。通過建立分級機制、考評機制、獎勵機制,完善薪酬發(fā)放制度,充分調動測試員參與測試的積極性。
3.加強教材開發(fā)
測試教材應增加機輔測試相關內容,除此之外,在傳統(tǒng)教材專注于語音知識、語音理論培訓的基礎上,應重視學生表達的培訓與指導,重視對考生失分嚴重的命題說話項進行專門梳理和拓展,以提高對考生說話項培訓的針對性和有效性。
《計算機輔助普通話水平測試規(guī)程》對于考務管理的諸多方面如組織報名、設置考點、試卷流轉、應試規(guī)則、證書發(fā)放、檔案保管以及工作人員崗位職責等都有明確規(guī)定,各測試機構應嚴格執(zhí)行,以最終實現(xiàn)各個測試機構操作規(guī)范一致、管理科學嚴密、結果客觀公正。
考前培訓和模擬測試對于考生迅速適應機輔測試、熟練操作步驟、提高測試效度與信度都有重要作用。培訓要通過介紹測試系統(tǒng)、分解應試各個環(huán)節(jié)、介紹應試技巧以及提高分數(shù)的策略[6]等,使考生認同并熟悉該系統(tǒng),最后對系統(tǒng)產(chǎn)生好感并樂意用這種方式進行考試??荚囍?,考試機構應充分發(fā)揮其監(jiān)控設備的作用并加強考場巡視,以消除考生臨場作弊的僥幸心理。
計算機輔助普通話水平測試系統(tǒng)的應用是普通話測試方式的歷史性飛躍,不斷優(yōu)化計算機輔助普通話水平測試系統(tǒng)、加大監(jiān)管力度、規(guī)范實施操作才能最大限度地維護普通話水平等級考試的嚴肅性、權威性和公正性,為推動普通話測試工作健康有序地持續(xù)發(fā)展做出新的貢獻。
[1][4]重慶市語委辦.重慶市普通話培訓測試調研報告[R].重慶:2010:11-15.
[2][3]國家語委普通話測試中心.計算機輔助普通話水平測試業(yè)務研討和質量分析會會議材料[Z].北京:2008:7-8.
[5][6]劉愛民.高校計算機輔助普通話水平測試中存在的問題及對策[J].重慶文理學院學報,2011,(6):90-92.