亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        集中趨勢自適應(yīng)增強(qiáng)的英語作文評分算法

        2018-05-08 07:51:54張景祥
        關(guān)鍵詞:分類器準(zhǔn)確性指標(biāo)體系

        李 婷,張景祥

        LI Ting,ZHANG Jingxiang

        濟(jì)南大學(xué) 信息科學(xué)與工程學(xué)院,濟(jì)南 250022

        School of Information Science and Engineering,University of Jinan,Jinan 250022,China

        1 引言

        眾所周知,作文評分對教師來說是一項(xiàng)極其繁重的任務(wù)[1],且人工閱卷存在差異性大等突出問題。自動(dòng)作文評分系統(tǒng)結(jié)合了計(jì)算語言學(xué)、統(tǒng)計(jì)建模和自然語言處理技術(shù),便成為人工評閱的一種很好的替代或替補(bǔ)。早期如Page等[2]采用淺層文本特征分析法評定作文質(zhì)量和寫作風(fēng)格(PEG系統(tǒng))。后來的研究增加了內(nèi)容質(zhì)量上的分析,如Burstein等[3]開發(fā)的E-rater和Rudner等[4]開發(fā)的BETSY都采用了自然語言處理技術(shù)和統(tǒng)計(jì)建模相結(jié)合的技術(shù)路線。這雖然對考察作文的內(nèi)容質(zhì)量和語言表達(dá)形式方面有很多提高,但某些表達(dá)形式屬于上等的作文其內(nèi)容上卻可能空泛無物。Deerwester團(tuán)隊(duì)[5]利用自然語言處理的經(jīng)典模型提出了基于潛在語義分析(Latent Semantic Analysis,LSA)方法,也被應(yīng)用到作文評閱之中[6]。但目前的自動(dòng)閱卷系統(tǒng)依然存在一些不足,如體裁多樣性和內(nèi)容邏輯性比較局限;并且國外的評測系統(tǒng)大多是針對英語母語寫作來進(jìn)行評分的。

        至于國內(nèi)的英語考試,考慮到考生和閱卷老師母語都不是英語,且對英語寫作能力的要求也不同于英語作為母語的要求。以上系統(tǒng)雖可借鑒,但也亟待完善和適應(yīng)國內(nèi)的教育需求。另外考試還具有導(dǎo)向作用,考試的組織者可以通過考試標(biāo)準(zhǔn)的制定來引導(dǎo)學(xué)生朝哪個(gè)方向努力。本文所設(shè)計(jì)的系統(tǒng),允許教師(考試系統(tǒng)的出題人和評卷標(biāo)準(zhǔn)設(shè)定人)有傾向性地調(diào)整評閱參數(shù)和系數(shù),引導(dǎo)學(xué)生注重某些語言知識與能力的提升。

        本文基于國內(nèi)英語教育提出了自動(dòng)作文評分的指標(biāo)體系與改進(jìn)的Adaboost算法,將弱分類器提升為強(qiáng)分類器,實(shí)現(xiàn)了評分的客觀性、高效性、可靠性和導(dǎo)向性。

        2 指標(biāo)體系

        2.1 研究工具和指標(biāo)體系

        首先以國內(nèi)英語六級作文評分細(xì)則(表1)為例。雖然閱卷老師熟悉該評分細(xì)則,但在具體評閱時(shí)人工評閱很難做到與細(xì)則能很好地吻合。

        表1 英語六級作文評分細(xì)則

        本文將這些細(xì)則轉(zhuǎn)化為三大指標(biāo)體系。

        2.1.1 單詞

        單詞是組成作文的一個(gè)最基本的單位。單詞細(xì)分為以下幾個(gè)小的指標(biāo),包括總詞數(shù)、單詞等級、錯(cuò)誤單詞數(shù)、詞匯多樣性、動(dòng)詞相關(guān)特性等方面。

        在作文的題干中,一般會有字?jǐn)?shù)的要求,這也是作文不容忽視的硬性要求。字?jǐn)?shù)不達(dá)標(biāo),作文分?jǐn)?shù)一般來說不會很高。

        單詞能否正確使用也是度量作文得分的一個(gè)因素,作文中常見的錯(cuò)誤單詞有非單詞錯(cuò)誤和單詞變形錯(cuò)誤。有研究表明,寫作水平越高,寫作中出現(xiàn)錯(cuò)誤數(shù)越少[7]。

        本文統(tǒng)計(jì)了各個(gè)詞性(名詞、實(shí)義動(dòng)詞、形容詞、代詞、介詞短語等)的使用比率,并著重統(tǒng)計(jì)了動(dòng)詞密度、動(dòng)詞語義、動(dòng)詞詞形,包括:動(dòng)詞使用率、助動(dòng)詞使用率、分詞和動(dòng)詞原形使用率。有文獻(xiàn)表明[8],寫作水平低的考生,動(dòng)詞原形和現(xiàn)在時(shí)使用多;寫作水平高的考生,過去分詞使用多。

        單詞進(jìn)行分級后,以詞匯的等級高低和數(shù)量作為判分的一個(gè)依據(jù)。作文中使用一些單詞等級比較高的詞匯,會相應(yīng)地提高整篇文章的質(zhì)量。

        此外,本文計(jì)算了詞匯多樣性,它是指一種類型的單詞在文章中總詞數(shù)的出現(xiàn)比例(從0到1),越接近于1,詞匯多樣性越高,當(dāng)文章中全部單詞都不一樣時(shí)或者單詞的個(gè)數(shù)等于詞庫的單詞數(shù)時(shí)詞匯多樣性達(dá)到最大值。

        2.1.2 句子

        在某種程度上,句子的長度意味著應(yīng)試者靈活運(yùn)用語法知識能力的強(qiáng)弱,而平均句長作為一種評測語言發(fā)展的非標(biāo)準(zhǔn)化工具,在第二語言習(xí)得研究中有重要作用,有研究表明,中國中學(xué)生的作文平均句長低于美國中學(xué)生的作文平均句長,主要原因在于句子中的復(fù)雜結(jié)構(gòu)較少、功能詞的使用能力較差以及缺乏語體意識[9]。

        在英文寫作中,單詞所發(fā)揮的作用固然重要,然而能夠在考場上迅速寫出復(fù)雜結(jié)構(gòu)的句式顯得尤為重要,復(fù)雜句式的有無與多寡,直接反映了作文的質(zhì)量。在英語作文教學(xué)過程中,需要更多的幫助學(xué)生獲得使用更為復(fù)雜句式結(jié)構(gòu)的語言能力、在一個(gè)句子中包含更多結(jié)構(gòu)的能力。

        2.1.3 整體結(jié)構(gòu)

        文章主題相關(guān)性是判定一篇文章是否跑題的重要依據(jù)。本文通過參考所給話題和評分標(biāo)準(zhǔn),找到最能凸顯文章主題的相關(guān)單詞,并計(jì)算主題相關(guān)性系數(shù),值越大,代表與題目越吻合。

        連貫性在連詞成句、連句成篇方面上發(fā)揮著重要的紐帶作用。英語作文質(zhì)量與語篇的連貫性有著千絲萬縷的聯(lián)系,“好”作文中的銜接手段遠(yuǎn)比“差”作文中運(yùn)用的多,這種差異主要源于詞匯銜接的不同運(yùn)用[10]。起到銜接作用的有連接詞、詞匯重疊、時(shí)體性和所有句子LSA。

        連接詞增強(qiáng)了作文的邏輯性,在文本銜接中起到了不容小覷的作用,使得表達(dá)更加豐富、過渡更加自然。本文計(jì)算了每篇作文出現(xiàn)的連詞比率,并分別統(tǒng)計(jì)五類連接詞出現(xiàn)的次數(shù)。這五類連接詞包括:并列連接詞、轉(zhuǎn)折連接詞、因果連接詞、時(shí)間連接詞、邏輯連接詞。

        詞匯重疊是語篇連貫的一種重要銜接手段[11]。詞匯重疊主要考慮四種形式的語義重疊:名詞重疊、論點(diǎn)重疊、詞干重疊和實(shí)義動(dòng)詞的重疊。詞匯重疊的計(jì)算是以上四種形式在句子中重疊的百分比。

        時(shí)體性是指在一個(gè)段落里,時(shí)態(tài)和體態(tài)的一致性。它的計(jì)算公式是時(shí)態(tài)與體態(tài)重復(fù)出現(xiàn)次數(shù)的加權(quán)平均和。

        潛在語義分析(LSA)是用于測量語篇中句子和段落之間的語義同指,是評價(jià)語義水平上的一種更深層次的統(tǒng)計(jì)學(xué)方法。LSA在大量的文本上構(gòu)建一個(gè)矩陣,矩陣的一行表示一個(gè)單詞,一列表示一個(gè)文檔,矩陣?yán)锏脑卮碓搯卧~在文檔中出現(xiàn)的次數(shù),使用奇異值分解實(shí)現(xiàn)在保留列的情況下減少矩陣的行數(shù),則兩個(gè)單詞的相似性計(jì)算公式是其行向量的余弦值,余弦值越接近于1,相似性越大,反之亦然。

        3 算法描述與改進(jìn)

        3.1 Adaboost算法

        算法Adaboost是Freud和Schapire提出的一種迭代算法[12-15]。它是由Adaptive和Boosting兩個(gè)單詞組合起來的,按照字面意思就是自適應(yīng)地增強(qiáng)算法。說它是自適應(yīng),源于它選用的學(xué)習(xí)算法的準(zhǔn)確率只要稍高于隨機(jī)猜測的準(zhǔn)確率就可以被當(dāng)做弱分類器;它又是增強(qiáng)的表現(xiàn)在可以通過訓(xùn)練若干弱分類器從而得到一個(gè)強(qiáng)分類器。算法Adaboost的核心思想也已經(jīng)很明確了,即選用準(zhǔn)確率稍高于隨機(jī)猜測的若干弱分類器,將它們集合起來,構(gòu)造一個(gè)最終的強(qiáng)分類器,當(dāng)弱分類器的數(shù)量足夠多時(shí),最終的強(qiáng)分類器的錯(cuò)誤率將趨于零。它的優(yōu)點(diǎn)表現(xiàn)在算法所提供的是框架,可以使用各種方法構(gòu)建弱分類器;算法應(yīng)用起來比較簡單,不用做特征篩選,也不用擔(dān)心過擬合問題;最重要的一點(diǎn),它是有很高精度的分類器。

        Adaboost算法的應(yīng)用越來越廣泛[16-17],已成功應(yīng)用于人臉識別、目標(biāo)檢測和多分類問題等領(lǐng)域。當(dāng)Adaboost算法應(yīng)用于作文評分時(shí),在弱分類器重復(fù)分錯(cuò)的情況下,算法Adaboost失去了它原有的優(yōu)勢。如何既能發(fā)揮Adaboost算法的優(yōu)勢,又可以避免弱分類器的重復(fù)分錯(cuò),于是本文提出了Adaboost/CT算法。

        3.2 Adaboost/CT算法

        在歌唱比賽、舞蹈比賽或者其他比賽的過程中,通過去掉最高分和最低分確保最后的得分是公平公正的,也就是排除一些極端數(shù)據(jù)。集中趨勢自適應(yīng)增強(qiáng)算法Adaboost/CT借鑒了專家團(tuán)體智能的不穩(wěn)定性,將偏離集中趨勢的數(shù)據(jù)排除。

        反映集中趨勢的兩個(gè)主要因素是平均數(shù)和中位數(shù)[18],雖然平均數(shù)字面上的意思代表平均,當(dāng)有極端數(shù)據(jù)出現(xiàn)時(shí),它不再代表平均水平,比如在一個(gè)小型考試中,有兩位同學(xué)因缺考試卷成績得分為0,在算平均成績時(shí),由于平均數(shù)是每一個(gè)數(shù)集中起來作用的結(jié)果,很顯然,得分為0的成績是極端數(shù)據(jù),已不能說明平均水平,而中位數(shù)是取按分?jǐn)?shù)大小排序后的最中間的那個(gè)數(shù),去掉最高分和最低分正好綜合了這兩者的優(yōu)勢,既能去除不良數(shù)據(jù),又能發(fā)揮大部分?jǐn)?shù)據(jù)的作用。

        改進(jìn)后的Adaboost/CT算法中,數(shù)據(jù)集為指標(biāo)體系集合;樣本集為指標(biāo)值X與分類Y,yi∈Y={-1,+1}分別對應(yīng)于分類失敗與成功。Stump()為樹樁弱分類器算法。當(dāng)出現(xiàn)疊加錯(cuò)誤,即錯(cuò)誤數(shù)大于2時(shí),對數(shù)據(jù)集進(jìn)行集中趨勢映射,D′t為Dt排除重疊錯(cuò)誤的映射,該算法流程如下:

        輸入:

        (1)數(shù)據(jù)集 S={D1,D2,…,DK};樣本集 Dt={(x1,y1),(x2,y2),…,(xm,ym)};

        (2)循環(huán)次數(shù)t={1,2,…,K};

        (3)弱分類器ht的基學(xué)習(xí)器L。

        過程:

        (1)D1(i)=1/M;//樣本權(quán)重初始化

        (2)fort=1toK :

        (a)用分布Dt訓(xùn)練弱分類器ht

        (a1)yi=Stump(xi);

        (a2)ht=L(S,Dt);

        (a3)if(yi!=ht)errFlag++;

        (a4)if(errFlag>2)Dt→ D′t;

        (b)誤差 εt=Prx~Dt,yI[ht≠y]

        (d)更新權(quán)重

        采用改進(jìn)的Adaboost/CT算法,基本上保持了經(jīng)典AdaBoost算法不出現(xiàn)過度擬合的優(yōu)點(diǎn),同時(shí)集中整體樣本趨勢,排除不良數(shù)據(jù),解決了弱分類器疊加錯(cuò)誤陷阱。

        4 統(tǒng)計(jì)分析

        在分層分類之前要進(jìn)行預(yù)處理,對比較極端的作文(如篇幅非常小的作文)直接按字?jǐn)?shù)線性評定為1~4分,不再參與下述分類。

        為了選出最有“影響力”的指標(biāo),本文首先參考了作文的評分標(biāo)準(zhǔn),提取考試的一般規(guī)律,指標(biāo)的選擇從硬到軟,從大到小。比如作文的字?jǐn)?shù)要求、是否跑題、是否有錯(cuò)誤的單詞等一些硬性要求;文章的連貫性、選用單詞的級別、修辭等一些軟要求。

        通過使用Adaboost/CT算法分層分類,得到了兩種準(zhǔn)確性,精確準(zhǔn)確性和鄰接準(zhǔn)確性。精確準(zhǔn)確性是指算法評閱的分?jǐn)?shù)和人工評閱分?jǐn)?shù)相一致的準(zhǔn)確性。鄰接準(zhǔn)確性是指算法評閱的分?jǐn)?shù)與人工評閱分?jǐn)?shù)鄰近或者相一致的分?jǐn)?shù)。因此,在人工評閱的成績?yōu)?分的前提下,如果算法評閱的分?jǐn)?shù)為7分,則精確準(zhǔn)確性和鄰接準(zhǔn)確性都為1;如果算法評閱的分?jǐn)?shù)為6分(或8分),則精確準(zhǔn)確性為0而鄰接準(zhǔn)確性為1;如果算法評閱的成績?yōu)?分(或9分),則精確準(zhǔn)確性和鄰接準(zhǔn)確性都為0。

        本文通過對作文進(jìn)行粗分做到大致分類、中分進(jìn)一步分類和細(xì)分具體分類,分層進(jìn)行,逐步求精,使用的指標(biāo)越來越細(xì)致,并使用不同的指標(biāo)體系對粗分后的作文進(jìn)行分類。首先,作文被分為高于硬性指標(biāo)體系要求的高質(zhì)量類作文(H組)和低于硬性指標(biāo)體系要求的低質(zhì)量類作文(L組),如圖1所示。在中分和細(xì)分階段使用不同的指標(biāo)體系標(biāo)準(zhǔn)進(jìn)行進(jìn)一步的分類,直到被分為一個(gè)具體的分?jǐn)?shù)為止。

        圖1 分層指標(biāo)體系用例

        4.1 粗分

        所謂粗分,就是先定性地劃分大類,標(biāo)定一篇作文屬于高分段作文還是低分段作文。

        該過程采用硬性指標(biāo)、大指標(biāo)進(jìn)行分。所謂硬性指標(biāo)是指非含糊性指標(biāo),各方均能接受的指標(biāo)。本文選用作文總詞數(shù)、錯(cuò)誤單詞個(gè)數(shù)和話題相關(guān)性這些硬性指標(biāo)作為粗分的指標(biāo),指標(biāo)體系如表2所示。假設(shè)作文總詞數(shù)滿足題目要求并超過一定的字?jǐn)?shù)(118),錯(cuò)誤單詞個(gè)數(shù)少(1~2個(gè)錯(cuò)誤),話題相關(guān)性高(r>0.68)為高質(zhì)量類作文(8、9、10),否則為低質(zhì)量類作文(5、6、7)。

        表2 粗分指標(biāo)體系

        本文以我校大一和大二的學(xué)生的300篇英語作文作為分析樣本。其中,有132(44%)篇樣本被分為低質(zhì)量類,168(56%)篇樣本被分為高質(zhì)量類。其中,被正確分類高低質(zhì)量作文的精確準(zhǔn)確性為87.66%,鄰接準(zhǔn)確性為95.33%。匹配矩陣見表3所示。匹配矩陣表明有22篇作文(占14.01%)智能評閱為高質(zhì)量類的作文被劃分為低質(zhì)量類,15篇作文(占12%)智能評閱為低質(zhì)量類的作文被劃分為高質(zhì)量類。

        表3 匹配矩陣

        4.2 中分

        在經(jīng)過前面高低質(zhì)量粗分分類后,再分別使用兩套不同的指標(biāo)體系進(jìn)行進(jìn)一步的分類。也就是說,中分是在粗分的基礎(chǔ)上進(jìn)一步分類,分為低中分(低質(zhì)量類中進(jìn)一步分類)和高中分(高質(zhì)量類中進(jìn)一步分類)。

        被評閱為5、6、7分的為低中分,使用的指標(biāo):整句數(shù)、3~4級單詞數(shù)、語法錯(cuò)誤數(shù)。低中分的指標(biāo)體系見表4所示。被評閱為8、9、10分的為高中分,使用不同于低中分的指標(biāo):所有句子LSA、5~6級單詞數(shù)、語法銜接。高中分的指標(biāo)體系見表5所示。

        表4 低中分指標(biāo)體系

        表5 高中分指標(biāo)體系

        在低中分中,結(jié)果證明,107篇作文被Adaboost/CT算法正確分類,精確準(zhǔn)確性達(dá)到81.06%,鄰接準(zhǔn)確性為97.72%,其中,3篇人工評閱為5分的作文被算法劃分到7分的作文中,14篇人工評閱為6分的作文被算法劃分到7分的作文中,8篇人工評閱為7分的作文被算法劃分到5分的作文中。

        在高中分中,結(jié)果證明,132篇作文被Adaboost/CT算法正確分類,精確準(zhǔn)確性達(dá)到78.57%,鄰接準(zhǔn)確性為91.07%,其中,14篇被人工評閱為8分的作文被算法劃分到9分的作文中,2篇被人工評閱為8分的作文被算法劃分到10分的作文中,7篇被人工評閱為9分的作文被算法劃分到8分的作文中,13篇被人工評閱為10分的作文被算法劃分到8分的作文中。

        4.3 細(xì)分

        在此之前是由大致的分類到更進(jìn)一步的分類,到了細(xì)分階段,就是分類到具體的分?jǐn)?shù)。假設(shè)細(xì)分中的5、6分為A組,9、10分的為B組。在A組中,通過篩選指標(biāo),本文選用了指標(biāo)體系:句子離散度、標(biāo)點(diǎn)頻率和各個(gè)詞性(名詞、實(shí)義動(dòng)詞、形容詞、介詞短語)的比率,結(jié)果證明,40篇作文被Adaboost/CT算法正確分類,準(zhǔn)確率達(dá)80%。A組指標(biāo)體檢見表6所示。在B組中,通過篩選指標(biāo),本文選用了指標(biāo)體系:詞匯銜接、復(fù)雜句式和動(dòng)詞相關(guān)特性,結(jié)果證明,40篇作文被Adaboost/CT算法正確分類,準(zhǔn)確率達(dá)61.54%。B組指標(biāo)體系見表7所示。

        表6 A組指標(biāo)體系

        表7 B組指標(biāo)體系

        從算法的性能上看,改進(jìn)后的Adaboost/CT與Adaboost和DFA(判別函數(shù)分析)相比,不但可以解決奇異值帶來的干擾,并且通過實(shí)驗(yàn)證明了Adaboost/CT算法在精確率上優(yōu)于Adaboost和DFA,結(jié)果見表8和表9所示,并且有文獻(xiàn)[19]證明DFA的性能要優(yōu)于機(jī)器學(xué)習(xí)方法(如:支持向量機(jī)、樸素貝葉斯分類器、分類與回歸樹分類器),見表10所示。

        表8 算法精確性比較%

        表9 不同參數(shù)下的分類結(jié)果比較

        表10 各算法在性能上的分析比較

        4.4 討論

        綜上所述,從整體上來看,經(jīng)過改進(jìn)后的Adaboost/CT算法,300篇作文樣本中有239篇在算法預(yù)測和人工評閱上達(dá)到了一致,預(yù)測的精確準(zhǔn)確性為79.66%,鄰接準(zhǔn)確性為94%。

        本文使用的方法是一種類似于“基于閾值的迭代法”,基層學(xué)習(xí)器選用了最簡單的決策樹,作為基學(xué)習(xí)器,簡單分類器的效果更好,并且計(jì)算復(fù)雜度不高,對中間值的缺失不敏感,可用于不連續(xù)的數(shù)據(jù)集中。每一層(粗分、中分和細(xì)分)所選用的指標(biāo)都是經(jīng)過多輪的篩選,找出最合適的閾值,通過線性擬合率的高低逐次選取。

        在粗分階段,作文被分為兩類:低質(zhì)量類和高質(zhì)量類,對于低質(zhì)量類,準(zhǔn)確率較高,這給出的啟示是:高質(zhì)量類的文章更加注重內(nèi)容,而不僅僅是語言。中分階段通過第一層的硬性指標(biāo)分為兩小部分,在此階段,并沒有選用同一套指標(biāo)體系,而是選用了適合高低質(zhì)量類的兩套指標(biāo)。從結(jié)果來看,改進(jìn)后的Adaboost/CT算法還是令人滿意的。在細(xì)分階段,已經(jīng)分到具體的分?jǐn)?shù),準(zhǔn)確率比粗分和中分的要低一些,一般來說,主觀題沒有固定的正確答案,多一分或者少一分也不是嚴(yán)格意義上的錯(cuò)誤。

        本文所采用的分層指標(biāo)體系,公開后可能會導(dǎo)致某種應(yīng)對機(jī)器閱卷的作弊手法。比如,在單詞方面,為了所謂的“高等級詞匯比率”而刻意使用冷僻詞匯等。這超出了本文的范疇,另文討論。

        5 結(jié)論

        本文所采用的Adaboost/CT進(jìn)行分層預(yù)測,其預(yù)測準(zhǔn)確性與其他同時(shí)考慮各個(gè)因素的算法是相當(dāng)?shù)?。雖然改進(jìn)后的算法依然存在一些不足,但其顯著優(yōu)點(diǎn)是:系統(tǒng)自動(dòng)逐層地對作文進(jìn)行評分,最大限度地降低了指標(biāo)標(biāo)準(zhǔn)對于不同層次水平得分的干擾。本算法雖然以話題論文為例進(jìn)行研究,但也可以用于簡答題、論文評審等的自然語言分析中。

        參考文獻(xiàn):

        [1]劉博超,張小蓮.每一張?jiān)嚲硪捕加姓婧捅趁鎇J].課堂內(nèi)外,2016(3):18.

        [2]McNamara D S,Crossley S A,Roscoe R D,et al.A hierarchical classification approach to automated essay scoring[J].Assessing Writing,2015,23:35-59.

        [3]Burstein J,Tetreault J,Madnani N.The e-rater automated essay scoring system[M]//Shermis M D,Burstein J.Handbook of automated essay scoring:Current applications and future directions.New York:Routledge,2013,55-67.

        [4]Rudner L M,Garcia V,Welch C.An evaluation of the IntelliMetric essay scoring system[J].Journal of Technology,Learning,and Assessment,2006,3(4):3-21.

        [5]Landauer T K,F(xiàn)oltz P W,Laham D.Introduction to latent semantic analysis[J].Discourse Processes,1998,25(2/3):259-284.

        [6]Olmos R,Jorge-Botana G,Luzón J M,et al.Transforming LSA space dimensions into a rubric for an automatic assessment and feedback system[J].Information Processing&Management,2016,52(3):359-373.

        [7]汪順玉.大學(xué)英語四級寫作樣卷的詞匯復(fù)雜度分析[J].重慶郵電大學(xué)學(xué)報(bào),2011,23(6):104-110.

        [8]李夢驍,劉永兵.基于語料庫的中學(xué)英語學(xué)習(xí)者寫作句法復(fù)雜性變化研究[J].東北師大學(xué)報(bào),2016(1):140-145.

        [9]李建平,張曉菡.中美中學(xué)生英語寫作句子長度對比分析—一項(xiàng)基于高考英語作文的研究[J].教育測量與評價(jià),2015(7):50-53.

        [10]Tejada M á Z,Gallardo C N,F(xiàn)erradá M C M,et al.2L English texts and cohesion in upper CEFR levels:A corpus-based approach[J].Procedia-Social and Behavioral Sciences,2015,212:192-197.

        [11]McNamara D S,Crossley S A,Roscoe R D.Natural language processing in an intelligent writing strategy tutoring system[J].Behavior Research Methods,2013,45:499-515.

        [12]Freud Y,Schapire R E.A decision-theoretic generalization of on-line learning and an application to boosting[J].Journal of Computer and System Sciences,1997,55(1):119-139.

        [13]吳信東,庫瑪爾.數(shù)據(jù)挖掘十大算法[M].李文波,吳素研,譯.北京:清華大學(xué)出版社,2013.

        [14]Sun J,F(xiàn)ujita H,Chen P,et al.Dynamic financial distress prediction with concept drift based on time weighting combined withAdaboostsupportvectormachine ensemble[J].Knowledge-Based Systems,2017,120:4-14.

        [15]Harrington P.機(jī)器學(xué)習(xí)實(shí)戰(zhàn)[M].李銳,李鵬,曲亞東,等譯.北京:人民郵電出版社,2013.

        [16]劉王勝,馮瑞.一種基于AdaBoost的人臉檢測算法[J].計(jì)算機(jī)工程與應(yīng)用,2016,52(11):209-214.

        [17]楊新武,馬壯,袁順.基于弱分類器調(diào)整的多分類Adaboost算法[J].電子與信息學(xué)報(bào),2016,38(2):373-380.

        [18]張曉宇,徐付霞.基于Copula理論的學(xué)生成績平均值和中位數(shù)的分布特征研究[J].大學(xué)數(shù)學(xué),2016,32(1):56-60.

        [19]Jurafsky D,Martin J H.自然語言處理綜論[M].馮志偉,孫樂,譯.北京:電子工業(yè)出版社,2005.

        猜你喜歡
        分類器準(zhǔn)確性指標(biāo)體系
        淺談如何提高建筑安裝工程預(yù)算的準(zhǔn)確性
        BP-GA光照分類器在車道線識別中的應(yīng)用
        電子測試(2018年1期)2018-04-18 11:52:35
        層次分析法在生態(tài)系統(tǒng)健康評價(jià)指標(biāo)體系中的應(yīng)用
        供給側(cè)改革指標(biāo)體系初探
        加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
        結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
        美劇翻譯中的“神翻譯”:準(zhǔn)確性和趣味性的平衡
        論股票價(jià)格準(zhǔn)確性的社會效益
        基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識別
        超聲引導(dǎo)在腎組織活檢中的準(zhǔn)確性和安全性分析
        精品五月天| 亚洲人成网线在线播放va蜜芽| 国产精品人妻一码二码| 国产精品亚洲日韩欧美色窝窝色欲 | 日韩人妻ol丝袜av一二区| 无码熟妇人妻av在线影片| 国产精品原创av片国产日韩| 国产三级视频在线观看国产| 成人午夜高潮a∨猛片| 中文国产日韩欧美二视频| 亚洲av无码专区在线| 日日碰狠狠添天天爽| 亚洲第一网站免费视频| 国产综合一区二区三区av| 成人自拍一二在线观看| 免费视频爱爱太爽了| 99re这里只有热视频| 亚洲视频中文字幕更新| 丝袜美腿亚洲第一免费| 99亚洲男女激情在线观看| 色偷偷久久一区二区三区| 国产美女69视频免费观看| 中文字幕一区二区三区精品在线| 超碰国产精品久久国产精品99| 久久久精品456亚洲影院| 五月婷婷影视| 国产自拍视频免费在线观看| 精品乱人伦一区二区三区| 波多野结衣免费一区视频| 中日韩字幕中文字幕一区| 国产在线观看黄片视频免费| 高清日韩av在线免费观看| 免费网站看v片在线18禁无码| 亚州少妇无套内射激情视频| 狠狠久久精品中文字幕无码| 免费高清日本一区二区| 97久久婷婷五月综合色d啪蜜芽| 午夜精品久久久久久中宇| 国产在线高清无码不卡| 女同性恋一区二区三区av| 末发育娇小性色xxxx|