吳俊宇
人工智能和大數(shù)據(jù)分析這幾年來(lái)一直都是科技行業(yè)最熱門的話題。小冰、小娜、小度等人工智能機(jī)器人也不斷在全社會(huì)引起一系列的討論。目前人們對(duì)于人工智能和大數(shù)據(jù)的理解還僅僅停留在和人工智能機(jī)器人聊天、利用語(yǔ)音助手做日程安排等。
如今,在各類考試系統(tǒng)中,客觀題閱卷技術(shù)已經(jīng)非常成熟,針對(duì)選擇題和填空題的自動(dòng)閱卷技術(shù)被廣泛應(yīng)用到各種考試系統(tǒng)中。但主觀題閱卷技術(shù)卻一直進(jìn)展緩慢,其主要原因是一些核心技術(shù)還在發(fā)展階段,例如:對(duì)自然語(yǔ)言的理解、模式識(shí)別、人工智能等一些技術(shù)還處于研究的初級(jí)階段。但在前沿技術(shù)上,實(shí)際上已經(jīng)有人對(duì)基于人工智能和大數(shù)據(jù)的主觀題智能閱卷技術(shù)進(jìn)行了研究。那我們是不是可以大膽猜想一下:人工智能和大數(shù)據(jù)分析如果用在主觀題智能閱卷上,將是一種怎樣的存在?
人工閱卷:一場(chǎng)“草菅人命”的審判
在傳統(tǒng)的語(yǔ)文閱卷中,題目基本都是按照要點(diǎn)給分,答的關(guān)鍵字越多,要點(diǎn)覆蓋則越全,分?jǐn)?shù)也隨之越高。現(xiàn)在實(shí)行網(wǎng)上閱卷,閱卷老師只需快速敲擊電腦鍵盤即可評(píng)卷,隨著對(duì)題目以及答案了解程度的不斷提升,最后兩道大題的閱卷速度幾乎達(dá)到了2秒每份。短短一個(gè)小時(shí)內(nèi),就能批閱700余份試卷。據(jù)悉,這只是高考閱卷的正常速度。不免有人會(huì)感慨人工閱卷的倉(cāng)促,那么,主觀題閱卷是不是可以運(yùn)用人工智能和大數(shù)據(jù)分析呢?
智能閱卷:一個(gè)真實(shí)存在的幻想
主觀題智能閱卷主要采用基于人工智能和大數(shù)據(jù)分析的自然語(yǔ)言處理技術(shù)。按照主觀題的評(píng)分流程,閱卷系統(tǒng)主要分為5個(gè)部分:分句、分詞、句法分析、詞語(yǔ)相似度計(jì)算以及句子的相似度計(jì)算。主觀題智能閱卷系統(tǒng)在進(jìn)行閱卷評(píng)分時(shí),通過(guò)對(duì)語(yǔ)句語(yǔ)法的相似度直接進(jìn)行機(jī)器打分。
智能閱卷技術(shù)擁有極大的優(yōu)勢(shì)。主觀題閱卷雖然在閱卷過(guò)程中有一套相對(duì)客觀的標(biāo)準(zhǔn),但是由于具體操作的不確定性,最后的評(píng)分結(jié)果往往受到閱卷老師的心情、考生書面整潔程度等第三方因素的影響。而在高強(qiáng)度、高密度的閱卷工作中,閱卷老師很容易由于眼疾手快而出現(xiàn)紕漏。
傳統(tǒng)的人工閱卷為了減小誤差往往還會(huì)出現(xiàn)三評(píng)卷、四評(píng)卷等人力成本極高的場(chǎng)景。但是,基于人工智能和大數(shù)據(jù)分析的主觀題智能閱卷方式不會(huì)存在這類弊端。主觀題智能閱卷系統(tǒng)評(píng)分結(jié)果比較客觀,不會(huì)受到人主觀因素的影響,同時(shí)使用計(jì)算機(jī)閱卷的效率遠(yuǎn)遠(yuǎn)高于人工閱卷。
更值得期待的是,通過(guò)智能閱卷還可以對(duì)學(xué)生的得分點(diǎn)失分點(diǎn)進(jìn)行大數(shù)據(jù)分析,以此全面分析學(xué)生試卷并得出診斷書,對(duì)學(xué)生改進(jìn)學(xué)習(xí)提出可行的解決方案。
以溫州市某中學(xué)試水的網(wǎng)上云閱卷平臺(tái)為例,雖然該平臺(tái)依舊依靠教師人工閱卷,但在閱卷結(jié)束之后,云閱卷平臺(tái)將發(fā)揮作用,對(duì)匯總的數(shù)據(jù)進(jìn)行挖掘分析,學(xué)生登錄系統(tǒng)后會(huì)收到一份類似賬單的成績(jī)?cè)\斷書,不僅可以幫助考生匯總保存錯(cuò)題,有針對(duì)性地制訂考前復(fù)習(xí)計(jì)劃,還可得出本次考試中相關(guān)科目的數(shù)據(jù)分析報(bào)告,為教師后續(xù)的學(xué)科教學(xué)提供參考。
當(dāng)然,該技術(shù)目前還存在一定的技術(shù)瓶頸和來(lái)自社會(huì)各階層的障礙。對(duì)于漢語(yǔ)來(lái)說(shuō),自然語(yǔ)言處理技術(shù)實(shí)現(xiàn)難度很大,迄今為止,在國(guó)內(nèi)還沒(méi)有一個(gè)實(shí)用化的、能真正實(shí)現(xiàn)的主觀題智能閱卷系統(tǒng)。由于漢語(yǔ)的復(fù)雜性,考生對(duì)于語(yǔ)言的發(fā)揮空間極大,一旦算法沒(méi)有將相關(guān)關(guān)鍵語(yǔ)意囊括在內(nèi)的話,將直接導(dǎo)致閱卷時(shí)的誤判。
更遺憾的是,由于考察方式和答題角度的不同,主觀題智能閱卷往往只能運(yùn)用在淺層信息結(jié)構(gòu)和語(yǔ)意結(jié)構(gòu)的題目之中,主觀題智能閱卷應(yīng)付簡(jiǎn)述題、名詞解釋馬馬虎虎,但在應(yīng)對(duì)相對(duì)復(fù)雜的主觀題(如小作文、大作文)時(shí),只能望洋興嘆。
即使主觀題智能閱卷系統(tǒng)成熟之后,強(qiáng)大的社會(huì)障礙也是影響推進(jìn)主觀題智能閱卷的一大因素。任何家長(zhǎng)和學(xué)生都不會(huì)將自己的命運(yùn)交給一套不成熟的機(jī)器。人對(duì)于人工智能的不信任將成為主觀題智能閱卷推行的最大難題。
實(shí)際運(yùn)用:“考試后市場(chǎng)”的初體驗(yàn)
目前來(lái)看,雖然沒(méi)有專門用于主觀題閱卷的人工智能和大數(shù)據(jù)技術(shù),但人工智能和大數(shù)據(jù)分析卻已經(jīng)初步運(yùn)用在了高考后的估分之中。
如今,已有互聯(lián)網(wǎng)巨頭針對(duì)高考推出了估分系統(tǒng)。該系統(tǒng)依托人工智能和大數(shù)據(jù)分析能力,采用OCR(光學(xué)字符識(shí)別)、語(yǔ)意分析、智能檢索等先進(jìn)技術(shù),針對(duì)試題場(chǎng)景進(jìn)行深度優(yōu)化,把往年試題、答案和得分點(diǎn)作為訓(xùn)練樣本,并根據(jù)今年的真題和答案,自動(dòng)識(shí)別題目類型,智能定位得分點(diǎn),可以為考生準(zhǔn)確估分提供重要依據(jù)。
按照人工智能和大數(shù)據(jù)分析技術(shù)目前發(fā)展的趨勢(shì)來(lái)看,在教育領(lǐng)域中,試卷自動(dòng)評(píng)閱是教育系統(tǒng)智能化必然的方向。一方面,計(jì)算機(jī)智能閱卷能避免人為的誤差,能夠更客觀地反映出評(píng)閱結(jié)果,保證了閱卷的客觀公正性。另一方面,電腦閱卷省去了老師在傳統(tǒng)閱卷模式中主觀題閱卷的體力勞動(dòng),讓老師省出更多時(shí)間和精力用在教學(xué)工作中。
由于技術(shù)目前依舊不夠成熟,這一天的到來(lái)恐怕還很遠(yuǎn),利用人工智能和大數(shù)據(jù)分析推動(dòng)自然語(yǔ)言處理技術(shù)的發(fā)展,進(jìn)一步完善主觀題智能閱卷系統(tǒng)在未來(lái)教育領(lǐng)域?qū)⑹且粋€(gè)非常重要的課題。
(轉(zhuǎn)自微信公眾號(hào)“深幾度”,微信號(hào):852405518,有刪改)