馬彥芳,馬美茹
(1.河北旅游職業(yè)學(xué)院,河北承德067000
2.河北省語言文字培訓(xùn)測試中心,河北承德067000)
論計算機輔助普通話測試的利與弊
馬彥芳1,馬美茹2
(1.河北旅游職業(yè)學(xué)院,河北承德067000
2.河北省語言文字培訓(xùn)測試中心,河北承德067000)
隨著科學(xué)技術(shù)水平的不斷改進發(fā)展,普通話水平測試也進入了一個嶄新的發(fā)展階段。為適應(yīng)時代的需求,計算機輔助普通話水平測試已經(jīng)成了廣泛認可的做法。計算機輔助普通話水平測試的出現(xiàn),為普通話測試掀開了嶄新的一頁,帶來了前所未有的變革,其優(yōu)勢有目共睹,無可否認,但在實際操作中仍然存在一些問題。
普通話測試;計算機輔助測試;問題;對策
計算機輔助普通話水平測試(以下簡稱“機輔測試”)是指國家普通話水平智能測試系統(tǒng),部分代替人工測評,通過考生上機方式參加測試。機輔測試主要由數(shù)字化信息采集、計算機輔助網(wǎng)絡(luò)評測、評測過程網(wǎng)絡(luò)監(jiān)控3個環(huán)節(jié)組成,讓考生在計算機前完成測試,對考生測試語音進行智能評測,相對于傳統(tǒng)的測試員評分來說,從技術(shù)上解決了人工測試效率相對較低的問題,在一定程度上體現(xiàn)了測試成績評判的科學(xué)、公正。[1]河北省機輔測試自2007年開展試點,到2010年在全省范圍內(nèi)推廣應(yīng)用以來,從測試規(guī)模、技術(shù)應(yīng)用等方面得到了長足的發(fā)展,成熟度不斷提升??傮w來說,機輔測試有一定的優(yōu)點,但也存在不足。
機輔測試適應(yīng)了全面推廣普通話、開展普通話測試的時代發(fā)展需要,和以往的人工測試相比較,機輔測試推動了普通話水平測試工作得以跨越式的發(fā)展,使普通話水平測試走向科學(xué)化、規(guī)范化,其優(yōu)勢主要體現(xiàn)在以下幾個方面:
(一)降低測試成本,提高測試數(shù)量。機輔測試不需要像過去那樣組織大規(guī)模的考場,可以降低組織的難度和測試成本,并在一定程度上解決了測試員不足的問題。另一方面,利用機輔系統(tǒng)進行測試,每天測試的人數(shù)從幾十人次提高到了上百甚至幾百人次,測試效率顯著提高。
(二)減輕測試員工作量,提高測試公正性。計算機智能測試引擎可以完成對前三題的評測,由系統(tǒng)采集考生的聲音,對照標(biāo)準(zhǔn)語音進行評分,其評分尺度全國統(tǒng)一,測試員只需要對第四題進行評測,大大減輕了測試員的工作量,提高了測試效率。測試員和考生不直接見面,杜絕了測試中“人情分”現(xiàn)象,使測試更公正。
(三)測試標(biāo)準(zhǔn)一致,時間控制統(tǒng)一。人工測試過程中,全部流程都是由測試員來完成,聽音、辨音、打分由測試員一人操作完成。長時間、高密度的集中測試會導(dǎo)致測試員判斷力的下降,再加上測試員之間的聽音、識音和辨音能力的差異,身體狀況的差異,針對不同考生的心理反映不同等因素,從而影響測評結(jié)果的一致性。[2]運用機輔測試,計算機智能系統(tǒng)對前三項自動打分,評判標(biāo)準(zhǔn)是一致的。另外,機輔測試系統(tǒng)對各試題的時間控制比人為控制更準(zhǔn)確。
機輔測試在給我們帶來諸多便利的同時,在某些方面也存在一些有待解決的問題,需要完善。
(一)目前的機測系統(tǒng)還有待完善
1.機輔測試軟件對語音評判差強人意
計算機測試評分對語調(diào)和協(xié)同發(fā)音現(xiàn)象識別不足。[3]漢語的聲調(diào)調(diào)值是相對的,同時漢語的語調(diào)不是簡單的音節(jié)聲調(diào)的堆疊,在重視音高的同時,也要注意停頓、音強、音長等因素。在聲學(xué)上,語調(diào)與音高、音長、音強有密切關(guān)系,在不同的語境中其主要作用的因素也有所不同。[4]很多語調(diào)是為了區(qū)別語言意義的,應(yīng)試者的發(fā)音各不相同,引起語調(diào)多種多樣,這與音質(zhì)本身無關(guān)。而機輔測試模式無法識別這一現(xiàn)象。此外,語音環(huán)境中的音素受前后語音的影響,體現(xiàn)協(xié)同發(fā)音的效果,聲學(xué)參數(shù)和生理參數(shù)都會產(chǎn)生擾動,協(xié)同發(fā)音不僅體現(xiàn)在音節(jié)之間,還體現(xiàn)在詞與詞之間,這也是機輔軟件無法做到的。
在以往的一級復(fù)審和偏差復(fù)審過程中,我們發(fā)現(xiàn),計算機對前三題的打分判定與人工打分存在著一定程度的偏差,經(jīng)過研究與推測,在一些細節(jié)標(biāo)準(zhǔn)的把握上,機器與人工存在著判別差異。具體表現(xiàn):
(1)單音節(jié)字詞:上聲音調(diào)值軌跡不準(zhǔn)確造成語音缺陷,個別考生發(fā)出“3-2”調(diào)值軌跡、“2-1”調(diào)值軌跡或“3-2-4”調(diào)值軌跡,缺陷存在但不明顯;因考生方音或發(fā)聲習(xí)慣等原因造成讀單音節(jié)詞出現(xiàn)兒化發(fā)音,造成語音錯誤但不明顯;陰平音調(diào)值不夠造成缺陷等。
(2)多音節(jié)字詞:輕聲、兒化發(fā)音不到位造成缺陷但不明顯;因考生方音發(fā)音習(xí)慣引起的語調(diào)問題不易被發(fā)現(xiàn)。
(3)朗讀:非兒化字的兒化讀音錯誤,不易被察覺,部分考生朗讀過于流利以至于忽略標(biāo)點符號,產(chǎn)生停連不當(dāng)問題;普通話發(fā)音較為標(biāo)準(zhǔn),但語氣過于僵硬或過于富有感情,也會產(chǎn)生語調(diào)偏誤問題,但又不易被察覺。
這些情況在人工測試中容易被測試員人腦神經(jīng)反射功能察覺并鎖定,但計算機的程序指令設(shè)計可能無法達到人腦的主觀判定效果,造成評定偏差。[5]
2.機輔測試系統(tǒng)與計算機硬件之間的矛盾
現(xiàn)階段,用于普通話水平測試的計算機系統(tǒng)已經(jīng)經(jīng)歷過多次改進和完善,其適應(yīng)程度在不斷地提高,為普通話測試發(fā)揮著重要作用,測試界面的“人性化”程度也逐步顯著,但是測試系統(tǒng)在實際運用過程中仍然存在一些不盡如人意的地方。例如,在調(diào)試過程中,計算機硬件不能適應(yīng)測試軟件的更高要求。出現(xiàn)這一狀況后,測試中心如果需要提高計算機硬件對測試軟件的適應(yīng)程度,必然要大幅度提高經(jīng)費的投入,但實際上,絕大多數(shù)測試中心的經(jīng)費都十分緊張。此外,現(xiàn)階段使用的測試系統(tǒng)對耳麥、聲卡等語音采樣設(shè)備的兼容性不夠,從而導(dǎo)致測評失敗的現(xiàn)象,這些因素都影響到普通話測試工作的順利開展,影響到測試結(jié)果的準(zhǔn)確性、公正性。解決這個問題的方法,只能是加大對測試中心經(jīng)費的投入,逐步改進和提升計算機硬件能力。
(二)機輔測試機制導(dǎo)致測試員之間的合作聯(lián)系割裂
由于采用機輔測試,測試員單獨測評,自主評分,測試員之間缺乏必要的了解、交流和協(xié)商,評分尺度寬緊不一。在沒有計算機參與測試的評測中,我們還可以通過召開測前會議培訓(xùn)、交流和現(xiàn)場討論來解決此類問題。但在機測環(huán)境下,測試時間不統(tǒng)一、測試地點不一致,測試員各自為戰(zhàn),通過網(wǎng)絡(luò)打分,無法有效互相監(jiān)控對方的測試效果,測試中的偏頗處自己無從得知,失誤會因此而加大。
(三)機輔測試導(dǎo)致考生應(yīng)試的極端功利性無法及時控制
《普通話水平測試大綱》(以下簡稱《大綱》)中規(guī)定:“說話的目的是考查應(yīng)試人在沒有文字憑借的情況下,說普通話的能力和所能達到的規(guī)范程度?!痹谄胀ㄔ捤綔y試中,唯一不需要機輔測試的就是“說話”測試?!罢f話”測試是唯一沒有文字憑借的測試項,最能反映出一個人的綜合語言素質(zhì),最能衡量出一個人的口頭語言水平,是普通話水平測試中分值最高的一項,在分值中“說話”占了整個測試的40%。因此,也成為普通話測試中存在問題最多的一項,從而導(dǎo)致測試結(jié)果與應(yīng)試者的實際語音面貌不一致。[6]
然而事實上,河北省的機測試題沿用多年,內(nèi)容已不再成為秘密,考生可以通過一些渠道提前獲得試題甚至答案,尤其最后“說話”測試,很多時候測試員在評分中可以反復(fù)聽到同一話題下的同一內(nèi)容的標(biāo)準(zhǔn)答案??忌鷳?yīng)試的極端功利性表現(xiàn)在對普通話水平測試的誤解,從而產(chǎn)生“為了考試而考試、考試就是為了得到證書”的心理。這主要體現(xiàn)在測試前集中培訓(xùn)、提前準(zhǔn)備稿子、背誦選題等,所以好多考生在這個題中說話內(nèi)容千篇一律、一字不差??忌膽?yīng)試心態(tài)致使考試完全背離了普通話測試工作的目的,背離了考試的初衷,失去了普通話測試的實際意義。如果是人工測試,背稿子等情況就能夠被測試員及時制止,而機輔測試卻不能做到這一點。
(四)機輔測試的人性化不足影響測試準(zhǔn)確性
機輔測試中錄音方式和絕對的測評分離,不能客觀反映出應(yīng)試者的語音面貌,考生的生理和心理問題也可能導(dǎo)致語音錄制的缺陷,但從實際上講考生的發(fā)音并不是完全錯誤的,而機輔測試就無法識別這種現(xiàn)象。如果是人工測試,測試員就會當(dāng)場發(fā)現(xiàn)考生的這些問題,在一定程度上糾正和提醒考生,給予考生一個比較公正的評測。例如有些考生因為牙齒缺損等原因?qū)е掳l(fā)音出現(xiàn)缺陷,測試員就會及時了解原因,調(diào)整考生情緒,測試員也會更加耐心仔細地辨識考生的發(fā)音,給考生一個公正的評價;再例如有的考生因為身體原因,如剛大病初愈、剛失去親人等,身體和心理都比較虛弱,他的發(fā)音必然存在某些缺陷,測試員可以交流引導(dǎo)測試;還有些考生因為緊張導(dǎo)致語言混亂、說不成完整的句子等,測試員可以雙向交流引導(dǎo)其說話。但機輔測試是非人性化的測試方式,根本無法解決上述問題,也就無法給考生一個客觀公正合理的評價結(jié)果。
雖然計算機輔助普通話測試還存在一些需要解決的實際問題,但不可否認,它具有一定的優(yōu)勢,也是信息技術(shù)發(fā)展和普通話測試的時代需要,具有深遠的意義和影響。我們要客觀地認識機輔測試存在的問題和不足,任何新生事物的產(chǎn)生和成長不可能是一帆風(fēng)順的,只要我們在使用過程中集思廣益,不斷探討,不斷完善,相信機輔測試一定會有更加廣闊和光明的前景。
[1]毛洪賁,殷德順.信息技術(shù)支持下普通話水平測試的實踐與研究[J],現(xiàn)代技術(shù)教育,2011,(06).
[2]王麗娜,王彩霞.影響普通話水平測試相關(guān)因素分析與思考[Z].http://w w w.6789.com.cn.
[3]宋欣橋.普通話水平測試中的評分差異[J].語文建設(shè),1998, (09).
[4]林燾,王理嘉.語音學(xué)教程[M].北京:北京大學(xué)出版社,2003.
[5]羅常培,王均.普通語音學(xué)綱要[M].上海:商務(wù)印書館,2002.
[6]國家語言文字工作委員會普通話培訓(xùn)測試中心,普通話水平測試實施綱要[M].上海:商務(wù)印書館,2004.
Advantages and Disadvantages of Computer-Aided Mandarin Test
MA Yan-fang1,MA Mei-ru2
(1.Hebei Tourism Vocational College,Chengde 06700,China 2.Hebei Language Training and Testing Center,Chengde 067000,China)
With the continuous improvement of science and technology,the Chinese Mandarin proficiency test has entered a new stage of development.In order to meet the needs of the time,the computer-aided Mandarin Proficiency Test has been accepted widely.Emergence of computer-aided Mandarin Proficiency Test has brought unprecedented change and its advantage is undeniable.But there are still some problems in practice.In this paper the advantages and disadvantages of the current computer-aided Mandarin Proficiency Test will be illustrated in detail and some specific measurements have been proposed which will hopefully play a certain reference value to computer-aided Mandarin testing.
Mandarin test;computer-aided testing;Problem;Measurement
I206
A
2095-3763(2015)03-0070-03
2015-04-06
馬彥芳(1974-),女,滿族,河北承德人,國家級普通話水平測試員,研究方向為方言與普通話對比研究。