亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        英語作文自動評價系統(tǒng)技術(shù)的國內(nèi)研究與應(yīng)用

        2016-01-04 09:37:11雷曉東
        科技視界 2015年35期
        關(guān)鍵詞:自動作文評分

        雷曉東

        (淮海工學(xué)院外國語學(xué)院,江蘇 連云港 222005)

        1 研究背景

        國際上最早的寫作自動評價系統(tǒng) (Automated Essay Evaluation System,AEES;Automated Writing Assessment System,AWAS;Automated Essay Scoring System,AESS)產(chǎn)生于美國,此后,有關(guān)自動評價系統(tǒng)的研究也主要在美國進(jìn)行。綜觀國外寫作自動評價系統(tǒng)的發(fā)展歷程,大致可分為三個階段。第一階段發(fā)生于上世紀(jì)60年代,1966年,美國杜克大學(xué)(University of Duke)的Ellis Page等人開發(fā)了PEG(Project Essay Grade),它是世界上第一套作文自動評分軟件。第二階段在上世紀(jì)90年代,出現(xiàn)了基于自然語言處理技術(shù)的E-rater(Electronic Essay Rater)、基于人工智能技術(shù)(AI)的Intellimetri和基于潛伏語義技術(shù)的IEA(Intelligent Essay Assessor)三種自動評價系統(tǒng)。第三階段始于本世紀(jì)初,由以上評分引擎衍生的自動評價系統(tǒng)如Criterion、My Access!、Holt Online Essay Scoring、Writing Roadmap等則逐漸趨向于自動打分、個性化評語反饋、基于互聯(lián)網(wǎng)、提供寫作輔助功能等多種性能兼而有之。[1]

        在國內(nèi),業(yè)已頒布的《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》明確指出[2],信息技術(shù)對教育發(fā)展具有革命性的影響,必須給于高度重視。到2020年,全國范圍內(nèi)應(yīng)該力爭基本建成覆蓋城鄉(xiāng)各級各類學(xué)校的教育信息化體系,以促進(jìn)教育內(nèi)容、教學(xué)手段和方法現(xiàn)代化。就受眾群體龐大的英語教學(xué)領(lǐng)域而言,國內(nèi)關(guān)于英語作文自動評價系統(tǒng)的研究起步晚,缺乏系統(tǒng)性的綜述研究。

        2 國內(nèi)研究回顧

        2.1 理論研究

        國內(nèi)關(guān)于英語寫作自動評價系統(tǒng)方面的理論研究始于本世紀(jì)初,偏重于推介國外的相關(guān)理論、相關(guān)的寫作自動評價軟件,或者探討某一項(xiàng)技術(shù)、某一學(xué)科的理論觀點(diǎn)對于寫作自動評價系統(tǒng)信度、效度的影響,理論研究總體來說缺乏原創(chuàng)性和深度。部分研究的內(nèi)容帶有不徹底性,極少數(shù)的缺乏科學(xué)性,研究內(nèi)容之間具有較強(qiáng)的重復(fù)性。

        桂詩春[3]詳細(xì)介紹了潛伏語義分析(Latent Semantic Analysis,LSA)理論,通過舉例說明使用了奇異值分解的線性代數(shù)的方法,減少維數(shù)有助于揭示語義的潛伏關(guān)系,討論了應(yīng)用LSA來進(jìn)行寫作質(zhì)量評估,和根據(jù)LSA來開發(fā)訓(xùn)練學(xué)生寫作的軟件。該研究對于LSA的理據(jù)等分析較為透徹,但關(guān)于LSA理論的應(yīng)用的討論,仍然僅僅局限于對國外相關(guān)研究的介紹,但是它屬于國內(nèi)最早探索英語作文自動評價系統(tǒng)的研究。

        張梅[4]介紹了美國自動評分系統(tǒng)E-rater的工作原理,然后探討了其優(yōu)點(diǎn)和缺陷,以及在大學(xué)英語四、六級考試作文網(wǎng)上閱卷中的可行性。在其后續(xù)研究中,張梅,印勇[5]對英語作文計(jì)算機(jī)評分的相關(guān)概念進(jìn)行了概述,對4種主流技術(shù)原理進(jìn)行了綜述,并介紹了國外5個典型的英語作文計(jì)算機(jī)評分系統(tǒng)和國內(nèi)梁茂成教授主持研制的評分系統(tǒng)。最后,指出了有待進(jìn)一步研究的關(guān)鍵問題。但是,研究結(jié)果中的部分參考文獻(xiàn)有誤,因而研究的科學(xué)性在一定程度上受到削弱。

        梁茂成,文秋芳[6]從語言測試的角度,對國外具有代表性的三種作文自動評分系PEG、IEA和E-rater進(jìn)行了比較研究,分析了其對我國自主開發(fā)作文自動評分系統(tǒng)所帶來的啟示。

        葛詩利,陳瀟瀟[7]與陳瀟瀟,葛詩利[8]介紹了國外主要的幾種作文自動評價軟件及其工作原理等。其中,后者特別提到國內(nèi)對自動作文評分的需求和研究,以及EFL自動作文評分研究在國外和國內(nèi)的發(fā)展與不足之處。這些研究與梁茂成的同類研究,相比較其它的研究來說,內(nèi)容方面表現(xiàn)出更為詳細(xì)、全面、科學(xué)的特點(diǎn)。

        韓寧[9]介紹了當(dāng)時美國最流行的7個作文自動評價系統(tǒng)的原理,并對它們進(jìn)行了評述。

        唐錦蘭,吳一安[10]回顧和分析了迄今為止國內(nèi)外對英語寫作自動評價系統(tǒng)的相關(guān)應(yīng)用研究成果,發(fā)現(xiàn)教育技術(shù)的引進(jìn)不僅是技術(shù)層面的問題,它還意味著一場涉及到使用者理念、認(rèn)識、方法和行為等方面的系統(tǒng)變革。此研究系批評性文獻(xiàn)綜述,旨在梳理迄今為止國內(nèi)外對寫作自動評價系統(tǒng)的應(yīng)用研究脈絡(luò)和主要成果,提煉其中的啟示,進(jìn)而提出后續(xù)研究方向。

        劉建達(dá)[11]從現(xiàn)代網(wǎng)絡(luò)和計(jì)算機(jī)技術(shù)對語言測試與評估的影響的視角,指出隨著現(xiàn)代信息技術(shù)的發(fā)展,自動作文評價系統(tǒng)在語言測試中的應(yīng)用將不斷得到普及,其次簡要討論了國外幾種寫作自動評價系統(tǒng)的信度問題,對計(jì)算機(jī)自動評價系統(tǒng)應(yīng)用于語言測試提出了建議。

        2.2 實(shí)證研究

        萬鵬杰[12]在國內(nèi)率先使用某電子評估軟件(名稱不詳)對英語專業(yè)學(xué)生寫作進(jìn)行評估,并對評估的效果進(jìn)行研究,實(shí)驗(yàn)表明,人工評估與電子軟件評估具有較高相關(guān)性,但電子軟件評測語法錯誤時不如人工測評全面,而在文章結(jié)構(gòu)的評估方面,兩者各有優(yōu)勢,因此應(yīng)該更多地考慮如何使其更有效地輔助人工評估。

        一些研究者對國外的寫作自動評價軟件進(jìn)行了實(shí)驗(yàn)研究,研究內(nèi)容之間也同樣具有較強(qiáng)的重復(fù)性。蔣學(xué)清等[13]對寫作自動評價系統(tǒng)Writing Roadmap 2.0(WRM2.0)在大學(xué)英語寫作中的教學(xué)應(yīng)用研究發(fā)現(xiàn),通過一學(xué)期的教學(xué),實(shí)驗(yàn)組和對照組的英語寫作水平都有了明顯的進(jìn)步,而且實(shí)驗(yàn)組的進(jìn)步幅度更大。這說明形成性評價方式和具有自動反饋功能的在線寫作工具在發(fā)展EFL學(xué)習(xí)者的寫作能力方面可以發(fā)揮積極的作用。作者針對在線形成性評價工具在大學(xué)英語寫作教學(xué)中的應(yīng)用與研究提出建議。該研究成為WRM2.0系統(tǒng)應(yīng)用于中國大學(xué)生英語寫作學(xué)習(xí)的首批實(shí)驗(yàn)之一。另外,王淑雯[14]結(jié)合教學(xué)實(shí)踐,介紹了在寫作教學(xué)中如何使用WRM2.0為師生提供多元化反饋,最后闡述了該系統(tǒng)的優(yōu)勢和劣勢。楊玲[15]對WRM2.0在高水平學(xué)生英語寫作學(xué)習(xí)中的作用進(jìn)行了實(shí)驗(yàn)研究,分析了其利弊。周穎[16]通過WRM2.0的應(yīng)用實(shí)驗(yàn),總結(jié)了自動評分系統(tǒng)應(yīng)用過程的問題、原因和對策,分析較為透徹。

        作為國內(nèi)作文自動評價系統(tǒng)研究方面的著名學(xué)者,吳一安,唐錦蘭[17]考察英語實(shí)驗(yàn)寫作教學(xué)中融入自動評價系統(tǒng)Writing Roadmap(WRM)對于高校英語教師和寫作教學(xué)的影響。結(jié)果表明,寫作教學(xué)從關(guān)注語言錯誤轉(zhuǎn)化為關(guān)注內(nèi)容的挖掘和表達(dá),從關(guān)注寫作結(jié)果轉(zhuǎn)化為關(guān)注寫作過程。教師的教學(xué)理念、行為、角色有所變化。唐錦蘭[18]基于一項(xiàng)為期兩年有關(guān)現(xiàn)代信息技術(shù)的形成性評價工具WRM的應(yīng)用研究,論證影響信息技術(shù)應(yīng)用于教學(xué)的關(guān)鍵除了最重要的要素教師因素之外,還包括機(jī)構(gòu)管理層的認(rèn)識和態(tài)度、信息技術(shù)本身、教師、技術(shù)融入教學(xué)的模式和學(xué)生四個因素。唐錦蘭,吳一安[19]將WRM應(yīng)用于教學(xué)實(shí)驗(yàn),發(fā)現(xiàn)學(xué)生寫作能力、自主學(xué)習(xí)能力以及寫作教學(xué)過程都發(fā)生了積極性的變化。唐錦蘭[20]基于前人的研究成果,以WRM為例,提出一個基于寫作自動評價系統(tǒng)的集自主寫作、多維反饋以及修改于一體的系統(tǒng)的先導(dǎo)模式,并應(yīng)用于為期一學(xué)年的高中生英語寫作教學(xué)實(shí)驗(yàn)中,探討其在實(shí)際教學(xué)中的有效性。結(jié)果顯示,學(xué)生寫作能力的發(fā)展以及寫作教學(xué)過程的積極變化從一定程度上表明該先導(dǎo)模式的有效性。在教學(xué)實(shí)驗(yàn)過程中,先導(dǎo)模式也得到了優(yōu)化改進(jìn)。本研究的貢獻(xiàn)在于,提出并驗(yàn)證了現(xiàn)代信息技術(shù)應(yīng)用于寫作的有效模式,特別是它開創(chuàng)性的以高中生為實(shí)驗(yàn)對象,為未來相關(guān)的教學(xué)實(shí)踐和科研提供了重要參照。

        唐進(jìn)[21]分析了自動作文評分系統(tǒng)BETSY的工作原理,并且實(shí)證檢驗(yàn)該系統(tǒng)在英語作文自動評分中的效果。

        另一部分研究者則對國內(nèi)研發(fā)的作文自動評價軟件進(jìn)行了實(shí)驗(yàn),結(jié)果較為樂觀。白云[22]通過冰果英語智能作文評閱系統(tǒng)的教學(xué)實(shí)踐,對自動作文評分系統(tǒng)的使用提出了建議,展望了其未來。魯艷輝等[23]運(yùn)用調(diào)查和定量研究方法對冰果英語智能作文評閱系統(tǒng)在大學(xué)英語寫作教學(xué)中的運(yùn)用進(jìn)行反思性分析。研究表明,該系統(tǒng)在一定程度上提高了學(xué)習(xí)者的寫作策略能力,男生的寫作策略水平提高優(yōu)于女生,低水平組學(xué)習(xí)者的寫作策略和寫作能力提高優(yōu)于高水平組。

        王鶯鶯[24]用實(shí)驗(yàn)檢驗(yàn)了《新視野大學(xué)英語》作文自動評分系統(tǒng)的評分效度。結(jié)果顯示,系統(tǒng)作為一種適用于小規(guī)模語言測試和自我測試的通用評分模型,具有較高的測試效度,同時對于進(jìn)一步提高其效度提出了建議。

        石曉玲[25]以句酷批改網(wǎng)應(yīng)用為例,通過教學(xué)實(shí)驗(yàn),研究了在線寫作自動評價系統(tǒng)在英語寫作教學(xué)中的適切性與局限性,對于正確使用作文自動評價系統(tǒng)提出了建議。何旭良[26]從中國學(xué)習(xí)者語料庫(CLEC)中隨機(jī)抽出30篇英語作文作為樣本進(jìn)行研究,考察批改網(wǎng)的信度和效度。實(shí)驗(yàn)數(shù)據(jù)分析表明,批改網(wǎng)軟件有自身的優(yōu)點(diǎn),但由于技術(shù)的局限性,其信度和效度都不夠完美,需要結(jié)合其它評價方式。

        2.3 對本土化EFL寫作評估系統(tǒng)的探索

        曾用強(qiáng)[27]針對廣東外語外貿(mào)大學(xué)開設(shè)的“網(wǎng)上英語寫作過程化教學(xué)”實(shí)驗(yàn)課,開發(fā)了一套過程化作文評估系統(tǒng)(PWESys 1.00),該系統(tǒng)包括量表設(shè)置、作文提交、作文標(biāo)注、作文分析和評估檔案等五大功能。它根據(jù)設(shè)定的評估參數(shù)以及教師的標(biāo)注信息,對學(xué)生的作文作出統(tǒng)計(jì)分析,最后利用文字或圖表的形式顯示總評估、每個學(xué)生的評估結(jié)果以及寫作的發(fā)展過程等。本研究成果PWESys 1.00雖然僅僅是一個半自動化的評價工具,但作為國內(nèi)本土化EFL寫作評估系統(tǒng)探索方面的先鋒之作,其對于英語作文自動評價系統(tǒng)在國內(nèi)的研究與推廣應(yīng)用具有重要的促進(jìn)作用。

        作為國內(nèi)作文自動評價系統(tǒng)技術(shù)(AESS)研究領(lǐng)域非?;钴S的學(xué)者,葛詩利,陳瀟瀟[28]分析了AESS在二語作文和外語作文評價方面的表現(xiàn),只是初步提出了開發(fā)適合中國英語學(xué)習(xí)者的自動評價系統(tǒng)的構(gòu)想。在后續(xù)的研究中,李艷,葛詩利[29]以中國學(xué)生的作文作為語料,對于國際上通用的作文自動評分分級詞表的效度進(jìn)行了研究,結(jié)果表明,這一通用詞表應(yīng)用于中國學(xué)生的作文,評價效果不佳,進(jìn)而提出對該詞表的改進(jìn)方法與評測方式,并且有效性得到了初步驗(yàn)證。

        葛詩利[30]設(shè)計(jì)了一款面向大學(xué)非英語專業(yè)教學(xué)、非特定題目、一次訓(xùn)練多次使用的通用、帶反饋的作文自動評價系統(tǒng),探索計(jì)算機(jī)對于中介語作文自動查錯反饋的可行性和具體方法。利用詞匯特征(作文長度、詞匯多樣性、分級詞匯分布)、短語特征、一級詞語的二元接續(xù)特征等技術(shù)進(jìn)行作文語言方面的查錯反饋,運(yùn)用文本聚類方法檢查作文內(nèi)容是否跑題。研究發(fā)現(xiàn),該評分模型對于日常大學(xué)英語寫作教學(xué)具有一定的參考價值,但是中介語作文評價不能完全依靠計(jì)算機(jī)來完成。此后,葛詩利,陳瀟瀟[31]和葛詩利[32][33]分別針對研制本土化EFL寫作評估系統(tǒng)所涉及的文本聚類技術(shù)、詞匯接續(xù)錯誤自動識別技術(shù)、關(guān)于評價作文語言運(yùn)用的三種自動評分方法等相關(guān)技術(shù)方面的問題進(jìn)行了探討。另外,葛詩利,陳瀟瀟[34]還討論了本土化EFL自動評分研究中涉及的評分標(biāo)準(zhǔn)、針對性、通用性和人機(jī)界面的劃分等四大問題及對策。這些研究,在前人研究的基礎(chǔ)上更加全面、深入,逐漸具有數(shù)據(jù)確鑿、論證充分的特點(diǎn)。但同時也具有部分重復(fù)性。

        李金輝[35]根據(jù)潛伏語義分析理論(Latent Semantic Analysis)研制出中國學(xué)生英語作文自動評分系統(tǒng)LEES(LSA-based EFL Essay Scorer),對中國大學(xué)生四、六級英語作文樣本進(jìn)行評分,結(jié)果顯示,機(jī)器評分與人工評分結(jié)果成微弱的正相關(guān),因此,LSA還不能正式用于對中國學(xué)生英語四、六級作文進(jìn)行自動評分。該研究對將來研發(fā)理想的中國學(xué)生英語作文自動評分系統(tǒng)提供了啟示。

        李霞,劉建達(dá)[36]提出了一種能夠有效識別中國英語學(xué)習(xí)者寫作文本特點(diǎn)并能自動識別特征維數(shù)的特征選擇方法,并在此基礎(chǔ)上提出了一種適用于不平衡分布數(shù)據(jù)的集成分類評分算法。它相比傳統(tǒng)面向分布均勻數(shù)據(jù)的分類方法具有較高的準(zhǔn)確率,能夠有效地應(yīng)用于中國英語學(xué)習(xí)者的作文自動評分中。

        蔣艷,馬武林[37]通過軟件本身介紹、工作原理、應(yīng)用實(shí)例、效度分析、存在問題等幾方面介紹了句酷批改網(wǎng),為國內(nèi)迄今為止較為全面、詳細(xì)、深刻的批改網(wǎng)研究。有利于促進(jìn)國內(nèi)自動作文評價技術(shù)的不斷改進(jìn)完善,有助于其在國內(nèi)教育領(lǐng)域的推廣和普及。

        劉衛(wèi)忠,余力[38]設(shè)計(jì)了一種基于鏈語法(Link Grammar)的能為我國EFL學(xué)生提供實(shí)時訓(xùn)練的英語作文自動評分系統(tǒng)。系統(tǒng)首先根據(jù)Link Grammar對句子分析后的成本向量(cost vector)計(jì)算文章的語法權(quán)值,其次則利用文章核心詞、非核心詞熵值和有效句比例來對作文主題分檔,最后則是結(jié)合語法權(quán)值和主題分檔結(jié)果計(jì)算作文分?jǐn)?shù)。采用整體評分的方法對中國學(xué)生英語作文自動評分系統(tǒng)進(jìn)行了探索和研究。此研究的研究人員全部來自計(jì)算機(jī)技術(shù)專業(yè)領(lǐng)域,缺乏語言教師或語言研究專家的協(xié)同參與,因此,在選擇最能體現(xiàn)作文質(zhì)量的文本特征變量方面難以保證相對的有效性,研究結(jié)果的科學(xué)性有待于進(jìn)一步求證。

        3 國內(nèi)主要英語作文自動評價工具軟件

        3.1 句酷批改網(wǎng)

        由北京詞網(wǎng)科技有限公司研發(fā),于2011年4月開始展開大規(guī)模使用。它是一個基于語料庫和云計(jì)算技術(shù)的英語作文在線自動批改服務(wù)網(wǎng)站。批改網(wǎng)的核心算法是計(jì)算學(xué)生作文和標(biāo)準(zhǔn)語料庫之間的距離,再通過一個映射將距離轉(zhuǎn)化成作文分?jǐn)?shù)和評語。核心技術(shù)點(diǎn)是將每一篇輸入的作文分析成可測量的192個維度,分析過程充分利用了先進(jìn)的自然語言技術(shù)和機(jī)器學(xué)習(xí)的方法,每篇作文先被自動切分成句子,然后對每個句子進(jìn)行深度的語義分析,從中抽取詞、搭配、詞組等結(jié)構(gòu)化單元。[39]主要功能包括:分?jǐn)?shù)即刻顯現(xiàn)、圖文報表式作文分析結(jié)果、錯誤自動批改、點(diǎn)評細(xì)致入微、階段性進(jìn)度報告、抄襲檢測等[40]。

        批改網(wǎng)是完全自主研發(fā)的國產(chǎn)軟件,從核心引擎到批改應(yīng)用都是完全自主知識產(chǎn)權(quán)的[41]。它體現(xiàn)寫作教學(xué)的多樣性,鼓勵學(xué)生的自主性學(xué)習(xí)、探索性學(xué)習(xí)、團(tuán)隊(duì)式學(xué)習(xí)、研究型學(xué)習(xí)等教與學(xué)新模式。

        3.2 冰果英語智能作文評閱系統(tǒng)

        杭州增慧網(wǎng)絡(luò)科技有限公司聯(lián)合浙江大學(xué)、外語教學(xué)與研究出版社,以及中外人工智能專家隊(duì)伍,依據(jù)語言教學(xué)理論、計(jì)算機(jī)網(wǎng)絡(luò)教育技術(shù)、大規(guī)模數(shù)據(jù)挖掘技術(shù),研發(fā)出這一個性化智能化的作文評閱軟件。它可以即時給出作文評分,并從詞匯、語法、文風(fēng)、內(nèi)容等方面給出反饋。但是,該系統(tǒng)目前無法做到用戶同一篇作文多次反復(fù)修改,多次提交給系統(tǒng),并得到系統(tǒng)的即時評閱和反饋。

        3.3 TRP教學(xué)資源平臺

        經(jīng)過對一線教師的調(diào)研及需求分析,高等教育出版社與清華大學(xué)楊永林教授的科研團(tuán)隊(duì)合作研究,2010年10月正式對外發(fā)布了《體驗(yàn)英語寫作教學(xué)資源平臺》。

        2012年3月,該平臺的升級版產(chǎn)品《TRP教學(xué)資源平臺》面世。它根據(jù)寫作教學(xué)需求,將數(shù)字化、網(wǎng)絡(luò)化與區(qū)域化教學(xué)平臺進(jìn)行了有機(jī)的整合,并涵蓋了資源建設(shè)、平臺構(gòu)建、寫作學(xué)習(xí)、句型練習(xí)、語法測驗(yàn)、作文評分、寫作研究、評語生成、作為考試等功能。為高校英語教學(xué)的進(jìn)一步改革提供了“專本碩博,四級貫通”的可操作平臺。特別一提的是,學(xué)術(shù)寫作是該寫作軟件系統(tǒng)的特色版塊,從這一點(diǎn)來講,TRP教學(xué)資源平臺似乎對于研究型高校的學(xué)習(xí)者來說具有更加特殊的意義。

        3.4 “易改”

        由杭州硅易科技有限公司(Greedy Intelligence)利用先進(jìn)的人工智能(AI)、自然語言處理(NLP)技術(shù),自主研發(fā)的一款基于云計(jì)算的免費(fèi)英語寫作輔助軟件。用戶可以免費(fèi)注冊使用該網(wǎng)站。其主要功能包括:(1)一鍵檢查:檢查英語文本拼寫、語法糾錯和文章風(fēng)格等;(2)錯誤解釋:對錯誤類型和錯誤原因給予詳盡的解釋和說明;(3)寫作潤色:可在不更改原意的情況下為用戶潤色詞語。不同于傳統(tǒng)的糾錯算法,易改創(chuàng)新性地采用了基于NLP與機(jī)器學(xué)習(xí)的糾錯方法,通過讓機(jī)器學(xué)習(xí)模型大量閱讀(一萬億詞級別)“正確的”英語,訓(xùn)練出一個精確性非常高的模型。每遇到一個輸入的句子,易改的后端模型會首先分析每個句子結(jié)構(gòu)并根據(jù)在機(jī)器學(xué)習(xí)訓(xùn)練集中“正確的英語”及句子中的上下文來判斷寫作是否有誤。1Checker(易改)獨(dú)創(chuàng)性地基于人工智能開發(fā)了糾錯和智能潤色引擎,可以智能地發(fā)現(xiàn)英語文本中的錯誤,提出潤色建議,提高了寫作準(zhǔn)確率的成文質(zhì)量。另外,其客戶端集成了詞典、翻譯、搜索、分析解釋和寫作模板等輔助功能,方便用戶寫作時使用。

        3.5 大規(guī)??荚囉⒄Z作文自動評分系統(tǒng) (EFL Essay Evaluator 1.0;EEE1.0)

        北京外國語大學(xué)梁茂成教授的研究團(tuán)隊(duì),在前期的研究成果——中國學(xué)生英語作文自動評分模型的基礎(chǔ)上[42][43],對其中的變量進(jìn)行了更大規(guī)模的驗(yàn)證,進(jìn)一步確定其中對作文質(zhì)量具有穩(wěn)定預(yù)測能力的文本特征,同時結(jié)合第二語言習(xí)得理論、語料庫語言學(xué)理論、測試學(xué)、統(tǒng)計(jì)學(xué),利用自然語言處理技術(shù),挖掘出更多更穩(wěn)定的文本特征變量,最終使原有評分模型得到了優(yōu)化。于2012年研制出了大規(guī)模考試英語作文自動評分系統(tǒng)。經(jīng)過多輪多次隨機(jī)抽樣組建不同的訓(xùn)練集,驗(yàn)證了該系統(tǒng)的評分信度已經(jīng)達(dá)到了可操作可推廣水平。[44]

        該評分軟件存在局限性。鑒于我國大規(guī)模英語考試考生數(shù)量十分龐大,而該軟件研制過程中僅使用了1000多篇學(xué)生作文作為實(shí)驗(yàn)樣本,[45]總體樣本量距離大規(guī)??荚囍械淖魑目傮w樣本量差距較大,其評分信度未免受到一定影響;對于極具創(chuàng)新性的學(xué)生作文的質(zhì)量優(yōu)劣缺乏判斷能力;僅僅適用于對議論文和說明文體的作文進(jìn)行評價。

        4 小結(jié)

        與國外作文自動評價系統(tǒng)的研究已經(jīng)有60多年的歷史相比,國內(nèi)在這一領(lǐng)域的研究相對滯后,且以漢語作文的自動評分系統(tǒng)研究為主流。國內(nèi)關(guān)于英語作文自動評價系統(tǒng)的研究起步更晚,數(shù)量更少。理論研究多為介紹西方的成果和技術(shù),相關(guān)的實(shí)證研究數(shù)量有限,只是最近幾年才有所增加,對于開發(fā)適合中國國情的EFL寫作評估系統(tǒng)的研究也較為匱乏,實(shí)際可以用于實(shí)踐的英語作文自動評估軟件較少。這一領(lǐng)域的研究面臨著巨大的機(jī)遇和挑戰(zhàn)。

        開發(fā)作文自動評價系統(tǒng)(AEES)是一項(xiàng)全新而復(fù)雜的技術(shù),涉及諸多領(lǐng)域的知識,應(yīng)該遵循跨學(xué)科的理念,特別強(qiáng)調(diào)文理滲透、多學(xué)科交叉協(xié)作的研究方法,企業(yè)、高校、技術(shù)提供商三者深度聯(lián)袂,以英語寫作教學(xué)現(xiàn)實(shí)為基礎(chǔ),以問題為導(dǎo)向,同時,理論研究、技術(shù)開發(fā)、教學(xué)應(yīng)用及反饋三方面緊密聯(lián)合,積極互動,共克難關(guān)。鑒于現(xiàn)代科技的日新月異,應(yīng)該密切關(guān)注并結(jié)合最新的自然語言處理技術(shù)、人工智能技術(shù)、統(tǒng)計(jì)學(xué)、信息檢索技術(shù)、語料庫技術(shù)及相關(guān)的第二語言習(xí)得、語言學(xué)(語義學(xué)、計(jì)算語言學(xué)、語料庫語言學(xué)等)等研究成果,不斷努力,糾正并深入挖掘最能體現(xiàn)英語作文水平的文本特征變量,優(yōu)化現(xiàn)有的作文自動評估軟件,開發(fā)新的更為先進(jìn)的評估軟件。

        由于自然語言本身的極端復(fù)雜性,加上現(xiàn)有技術(shù)的局限性,現(xiàn)階段的英語作文自動評價系統(tǒng)軟件尚存在諸多缺陷,英語寫作教學(xué)或測試中單獨(dú)依賴機(jī)器的做法不可取。實(shí)際寫作訓(xùn)練中,教師適時合理的人工評閱和指導(dǎo)、學(xué)生自我評價、同儕互評等不可或缺?,F(xiàn)代科技的日益迅猛發(fā)展,使得根據(jù)不同歷史時期技術(shù)的發(fā)展水平,合理確定機(jī)器和人的分工,動態(tài)推進(jìn),取長補(bǔ)短,最大限度地發(fā)揮二者的優(yōu)勢顯得十分必要。這樣才有助于保證作文評價過程的信度。

        特別致謝:該論文在寫作過程中,高等教育出版社、句酷批改網(wǎng)等相關(guān)部門技術(shù)人員協(xié)助提供相關(guān)數(shù)據(jù)。謹(jǐn)表謝忱。

        [1][10]唐錦蘭,吳一安.在線英語寫作自動評價系統(tǒng)應(yīng)用研究述評[J].外語教學(xué)與研究,2011(2):273-282.

        [2]國家中長期教育發(fā)展規(guī)劃(2010-2020).[DB/OL].http://www.china.com.cn/policy/txt/2010-03/01/content_19492625_3.htm,2015-01-15.

        [3]桂詩春.潛伏語義分析的理論及其應(yīng)用[J].現(xiàn)代外語,2003(1):76-84.

        [4]張梅.英語論文自動評分系統(tǒng)探索[J].重慶大學(xué)學(xué)報:社會科學(xué)版,2005(3):95-97.

        [5]張梅,印勇.英語作文計(jì)算機(jī)評分技術(shù)綜述[J].外語電化教學(xué),2010(6):44-47.

        [6]梁茂成,文秋芳.國外作文自動評分系統(tǒng)評述及啟示[J].外語電化教學(xué),2007(5):18-24.

        [7]葛詩利,陳瀟瀟.國外自動作文評分技術(shù)研究[J].外語電化教學(xué),2007(5):25-29.

        [8]陳瀟瀟,葛詩利.自動作文評分研究綜述[J].解放軍外國語學(xué)院學(xué)報,2008(05):78-83.

        [9]韓寧.幾個英語作文自動評分系統(tǒng)的原理與評述[J].中國考試(研究版),2009(3):37-44.

        [11]劉建達(dá).現(xiàn)代技術(shù)與語言測試——應(yīng)用、影響及發(fā)展方向[J].外語電化教學(xué),2013(4):46-51.

        [12]萬鵬杰.電子軟件評估系統(tǒng)測試大學(xué)英語寫作的研究報告[J].外語電化教學(xué),2005(3):11-13.

        [13]蔣學(xué)清,等.探析自動作文評價系統(tǒng)對大學(xué)生英語寫作能力發(fā)展的影響[J].山東外語教學(xué),2011(6):36-43.

        [14]王淑雯.如何利用Writing Roadmap 2.0進(jìn)行在線英語寫作反饋[J].現(xiàn)代教育技,2011(3):76-81.

        [15]楊玲.作文自動評價系統(tǒng)在高水平學(xué)生英語寫作學(xué)習(xí)中的應(yīng)用[J].現(xiàn)代教育技術(shù),2013(5):76-81.

        [16]周穎.在線形成性評價工具在英語寫作中的應(yīng)用——困難及對策探究[J].現(xiàn)代教育技術(shù),2011(9):88-93.

        [17]吳一安,唐錦蘭.融入自動評價系統(tǒng)的英語寫作實(shí)驗(yàn)教學(xué)對高校英語教師的影響研究[J].外語電化教學(xué),2012(4):3-10.

        [18]唐錦蘭.信息技術(shù)應(yīng)用于教學(xué)的關(guān)鍵要素探究——項(xiàng)教學(xué)實(shí)驗(yàn)的啟示[J].中國遠(yuǎn)程教育,2012(7):75-80.

        [19]唐錦蘭,吳一安.寫作自動評價系統(tǒng)在大學(xué)英語教學(xué)中的應(yīng)用研究[J].外語與外語教學(xué),2012(4):53-59.

        [20]唐錦蘭.探究寫作自動評價系統(tǒng)在英語教學(xué)中的應(yīng)用模式[J].外語教學(xué)理論與實(shí)踐,2014(1):49-57.

        [21]唐進(jìn).BETSY在自動作文評分中的原理與應(yīng)用[J].當(dāng)代外語研究,2011(1):44-47.

        [22]白云.自動作文評分在大學(xué)英語教學(xué)中的應(yīng)用與前景[J].中國成人教育,2011(18):185-187.

        [23]魯艷輝,等.智能寫作評分系統(tǒng)在大學(xué)英語寫作中的實(shí)證研究[J].現(xiàn)代教育技術(shù),2010(6):56-58.

        [24]王鶯鶯.《新視野大學(xué)英語》作文自動評分系統(tǒng)的效度研究[J].當(dāng)代教育理論與實(shí)踐,2012(12):139-142.

        [25]石曉玲.在線寫作自動評改系統(tǒng)在大學(xué)英語寫作教學(xué)中的應(yīng)用研究——以句酷批改網(wǎng)為例[J].現(xiàn)代教育技術(shù),2012(10):67-71.

        [26]何旭良.句酷批改網(wǎng)英語作文評分的信度和效度研究[J].現(xiàn)代教育技術(shù),2013(5):64-67.

        [27]曾用強(qiáng).過程化的寫作評估模式[J].福建外語,2002(3):26-31.

        [28]葛詩利,陳瀟瀟.中國 EFL 學(xué)習(xí)者自動作文評分探索[J].外語界,2007(5):42-50.

        [29]李艷,葛詩利.大學(xué)英語作文自動評分中分級詞表的效度研究[J].外語與外語教學(xué),2008(10):47-52.

        [30]葛詩利.面向大學(xué)英語教學(xué)的通用計(jì)算機(jī)作文評分和反饋方法研究[D].北京語言大學(xué),2008.

        [31]葛詩利,陳瀟瀟.文本聚類在大學(xué)英語作文自動評分中應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2009(6):145-148.

        [32]葛詩利.大學(xué)英語作文自動評分方法比較研究[J].廣東外語外貿(mào)大學(xué)學(xué)報,2010(3):87-90.

        [33]葛詩利.自動作文評分中詞匯接續(xù)錯誤自動識別研究[J].外語電化教學(xué),2010(4):15-20.

        [34]葛詩利,陳瀟瀟.大學(xué)英語作文自動評分研究中的問題及對策[J].山東外語教學(xué),2009(3):21-26.

        [35]李金輝.使用潛伏語義分析理論研究計(jì)算機(jī)改中國學(xué)生英語作文[D].廣東外語外貿(mào)大學(xué),2009.

        [36]李霞,劉建達(dá).適用于中國外語學(xué)習(xí)者的英文作文全自動集成評分算法[J].中文信息學(xué)報,2013(5):100-106.

        [37]蔣艷,馬武林.中國英語寫作教學(xué)智能導(dǎo)師系統(tǒng):成就與挑戰(zhàn)——以句酷批改網(wǎng)為例[J].電化教育研究,2013(7):76-81.

        [38]劉衛(wèi)忠,余力.基于鏈語法的英語作文自動評分研究[J].電腦知識與技術(shù),2014(2):283-287.

        [39][41]CSDN.專訪批改網(wǎng)創(chuàng)始人張躍:設(shè)計(jì)產(chǎn)品一定要遵循兩個“凡是”[DB/OL].http://www.csdn.net/article/2011-07-31/302431,2014-09-10.

        [40]百度百科.句酷批改網(wǎng)[DB/OL].http://baike.baidu.com/view/5162723.htm.2013-10-25,2014-09-10.

        [42]梁茂成.中國學(xué)生英語作文自動評分模型的構(gòu)建[D].南京大學(xué),2005.

        [43]梁茂成.中國學(xué)生英語作文自動評分模型的構(gòu)建[M].北京:外語教學(xué)與研究出版社,2011.

        [44][45]梁茂成.大規(guī)??荚囉⒄Z作文自動評分系統(tǒng)的研制[M].北京:外語教學(xué)與研究出版社,2012.

        猜你喜歡
        自動作文評分
        Disorders of the brain-gut interaction and eating disorders
        自動捕盜機(jī)
        我給爸爸評分
        A2DS2評分與AIS-APS評分在預(yù)測卒中相關(guān)肺炎中的表現(xiàn)
        Castleman disease in the hepatic-gastric space: A case report
        基于STM32的自動喂養(yǎng)機(jī)控制系統(tǒng)
        電子測試(2018年10期)2018-06-26 05:53:36
        紅批有聲作文
        紅批有聲作文
        紅批作文
        紅批作文
        AV教师一区高清| 大奶白浆视频在线观看| 精品国产精品三级精品av网址| 国产精品爽爽v在线观看无码| 午夜亚洲av永久无码精品| 亚洲VA欧美VA国产VA综合| 亚洲精品在线观看一区二区 | 男吃奶玩乳尖高潮视频| 亚瑟国产精品久久| 日本少妇人妻xxxxx18| 91色婷婷成人精品亚洲| 青青草视频在线观看精品在线| 欧美激情视频一区二区三区免费 | 亚洲第一区无码专区| 日本女优爱爱中文字幕| 久久精品av在线观看| 日本最新免费二区| 国产a v无码专区亚洲av| 亚洲AV无码一区二区一二区教师| 国产一区二区三区在线影院| 色佬精品免费在线视频| 无码av一区二区大桥久未| 四虎影视在线观看2413| 蜜桃视频色版在线观看| 国产精品女主播在线播放| 国产又黄又硬又粗| 日韩插啊免费视频在线观看| 欧美日韩中文字幕日韩欧美| 中文字幕亚洲精品综合| 国产精品一区二区日本| av无码人妻中文字幕| 久久久AV无码精品免费| 国产在线精彩自拍视频| 爆操丝袜美女在线观看| 日产亚洲一区二区三区| 国产白丝网站精品污在线入口| 日本一区二区在线看看| 国产亚洲av看码精品永久| 挺进朋友人妻雪白的身体韩国电影| 麻豆变态另类视频在线观看| 亚洲一区二区三区新视频|