亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向SELL語(yǔ)料庫(kù)的AI虛擬英語(yǔ)教育訓(xùn)練系統(tǒng)研究

        2020-12-26 08:22:44田燁
        微型電腦應(yīng)用 2020年12期
        關(guān)鍵詞:母語(yǔ)語(yǔ)料庫(kù)短語(yǔ)

        田燁

        (咸陽(yáng)師范學(xué)院 外國(guó)語(yǔ)學(xué)院, 陜西 咸陽(yáng) 712000)

        0 引言

        英語(yǔ)學(xué)習(xí)一直是當(dāng)前社會(huì)各界的熱點(diǎn),與此同時(shí),各培訓(xùn)機(jī)構(gòu)也開(kāi)展了英語(yǔ)在線(xiàn)學(xué)習(xí)業(yè)務(wù)。由于英語(yǔ)語(yǔ)法的特點(diǎn),導(dǎo)致英語(yǔ)學(xué)習(xí)者普遍缺乏英語(yǔ)語(yǔ)感,口語(yǔ)、寫(xiě)作能力欠佳。近些年,隨著虛擬現(xiàn)實(shí)技術(shù)和人工智能的發(fā)展,利用VR技術(shù)和AI技術(shù)來(lái)構(gòu)建一個(gè)符合中國(guó)英語(yǔ)學(xué)習(xí)者的學(xué)習(xí)氛圍,成為英語(yǔ)學(xué)習(xí)教育的重要發(fā)展方向[1-3]。如基于VR技術(shù)和AI技術(shù)開(kāi)發(fā)的語(yǔ)音識(shí)別[4]、文字轉(zhuǎn)換語(yǔ)音[5]、基于對(duì)話(huà)管理的聊天機(jī)器人等[6-7],通過(guò)構(gòu)建浸入式的學(xué)習(xí)環(huán)境能有效激發(fā)學(xué)習(xí)者的興趣和動(dòng)力[8];如基于TLTS游戲系統(tǒng)讓學(xué)習(xí)者在A(yíng)I虛擬角色下進(jìn)行交互性學(xué)習(xí),獲得真實(shí)的語(yǔ)境對(duì)話(huà)環(huán)境等[9]。本文在相關(guān)研究基礎(chǔ)上,針對(duì)國(guó)內(nèi)英語(yǔ)學(xué)習(xí)者的現(xiàn)狀,首先構(gòu)建了基于國(guó)內(nèi)學(xué)習(xí)者的SELL語(yǔ)料庫(kù),并通過(guò)利用AI技術(shù),設(shè)計(jì)一套語(yǔ)言驅(qū)動(dòng)的英語(yǔ)學(xué)習(xí)系統(tǒng),實(shí)現(xiàn)不同應(yīng)用場(chǎng)景下的英語(yǔ)交流。

        1 SELL語(yǔ)料庫(kù)構(gòu)建

        語(yǔ)言學(xué)習(xí)過(guò)程中,語(yǔ)料庫(kù)是在真實(shí)語(yǔ)料基礎(chǔ)上,通過(guò)專(zhuān)門(mén)加工形成的一組大型結(jié)構(gòu)化文本。根據(jù)形式不同,語(yǔ)料庫(kù)主要有口語(yǔ)語(yǔ)料庫(kù)、書(shū)面語(yǔ)料庫(kù)、通用語(yǔ)料庫(kù)、專(zhuān)用語(yǔ)料庫(kù)等。本文在考慮到英語(yǔ)動(dòng)結(jié)構(gòu)作為構(gòu)式語(yǔ)法框架,同時(shí)也是眾多英語(yǔ)學(xué)習(xí)者在學(xué)習(xí)過(guò)程中存在的難點(diǎn),借助語(yǔ)料庫(kù)語(yǔ)言學(xué)分析方法來(lái)建立英語(yǔ)動(dòng)結(jié)構(gòu)句法和語(yǔ)義特征的語(yǔ)料庫(kù)。

        1.1 語(yǔ)料選取

        選擇中國(guó)學(xué)生英語(yǔ)口語(yǔ)語(yǔ)料庫(kù)WECCL[10]。WECCL中包括了20多所高校英語(yǔ)文獻(xiàn)共計(jì)4 950篇,27余種不同類(lèi)型英語(yǔ)作文,形符數(shù)約125萬(wàn)個(gè),能夠較好地提高大學(xué)生的英語(yǔ)寫(xiě)作水平。英語(yǔ)母語(yǔ)語(yǔ)料庫(kù)采用目前流行的COCA語(yǔ)料庫(kù),其中包括了學(xué)術(shù)期刊、新聞、流行雜志、口語(yǔ)、小說(shuō)幾大類(lèi),形符數(shù)約2 000余萬(wàn)個(gè)[11]。WECCL用于分析學(xué)習(xí)者動(dòng)結(jié)構(gòu)語(yǔ)言特色,分析英語(yǔ)母語(yǔ)者的中動(dòng)結(jié)構(gòu)特點(diǎn),并進(jìn)行相互間比較,如表1所示。

        表1 WECCL和COCA語(yǔ)料庫(kù)基本信息

        從表1中可以看出,COCA語(yǔ)料庫(kù)的總形符數(shù)較WECCL多達(dá)16倍。由于不同語(yǔ)料庫(kù)間存在較大的容量差異,為降低比較誤差,在對(duì)單庫(kù)檢索匯總時(shí)將使用標(biāo)準(zhǔn)化頻數(shù)或百分比率來(lái)保證不同語(yǔ)料庫(kù)的可比性。

        在WECCL語(yǔ)料庫(kù)數(shù)據(jù)檢索中,以Simargool中的171個(gè)動(dòng)詞或短語(yǔ)作為檢索詞,AntConc在WECCL庫(kù)中檢索該類(lèi)動(dòng)詞和短語(yǔ)句子,其中包括動(dòng)詞的五種形式,即動(dòng)詞原型,時(shí)態(tài)等,提取數(shù)據(jù)并篩選,得到34個(gè)動(dòng)結(jié)構(gòu)例子,包括12個(gè)動(dòng)詞和短語(yǔ)。動(dòng)詞形式以及出現(xiàn)的頻數(shù),如表2所示。

        表2 WECCL動(dòng)結(jié)構(gòu)中動(dòng)詞或短語(yǔ)頻次

        以WECCL語(yǔ)料庫(kù)中得到的12個(gè)動(dòng)詞和動(dòng)詞短語(yǔ)作為檢索詞,在COCA中進(jìn)行檢索。由于COCA語(yǔ)料庫(kù)中數(shù)據(jù)量龐大,從語(yǔ)料中進(jìn)行數(shù)據(jù)提取并篩選,檢索到630余個(gè)動(dòng)結(jié)構(gòu)句子,應(yīng)用頻率高的單詞為open、extend、melt,而bath、feed、finish的應(yīng)用頻率低于10次,應(yīng)用頻率較低,如表3所示。

        表3 COCA中動(dòng)結(jié)構(gòu)中動(dòng)詞或短語(yǔ)頻次

        1.2 動(dòng)結(jié)構(gòu)使用句法分析

        WECCL語(yǔ)料庫(kù)檢索的34個(gè)中動(dòng)句,其中包括了12個(gè)動(dòng)詞和動(dòng)詞短語(yǔ),相較于Simargool中涉及到的動(dòng)詞和中動(dòng)句使用方面存在明顯的差距[12],一方面是學(xué)習(xí)范圍存在一定差異性。Simargool中對(duì)于中動(dòng)結(jié)構(gòu)使用較少,是由于采用了大多數(shù)不具備延時(shí)狀態(tài)動(dòng)詞,因而不需要采用中動(dòng)結(jié)構(gòu)。

        采用treetagger對(duì)WECCL語(yǔ)料庫(kù)的34個(gè)中動(dòng)結(jié)構(gòu)進(jìn)行賦碼[13],英語(yǔ)用語(yǔ)中表現(xiàn)出以下幾個(gè)特征。主語(yǔ):采用名詞為主語(yǔ)句子有23個(gè),11個(gè)采用代詞做主語(yǔ);謂語(yǔ)動(dòng)詞:17個(gè)句子采用一般現(xiàn)在時(shí),13個(gè)句子采用其他時(shí)態(tài),表明學(xué)習(xí)者能較好的掌握典型的中動(dòng)結(jié)構(gòu),可利用多種謂語(yǔ)形式建立非典型中動(dòng)結(jié)構(gòu);修飾語(yǔ):介詞短語(yǔ)為修飾詞的句子20個(gè),6個(gè)句子采用副詞,5個(gè)句子采用不定式、復(fù)雜句式,3個(gè)句子未采用修飾,其中采用介詞短語(yǔ)和副詞作為修飾詞的占總修飾詞數(shù)量的76%,表明學(xué)習(xí)者在掌握中動(dòng)結(jié)構(gòu)使用多類(lèi)修飾語(yǔ)中,除介詞和副詞的使用外,其他修飾語(yǔ)應(yīng)用并不多。

        對(duì)COCA語(yǔ)料庫(kù)檢索的636個(gè)中動(dòng)結(jié)構(gòu)句子采用treetagger賦碼,分析英語(yǔ)母語(yǔ)者的表現(xiàn)形式。主語(yǔ):593個(gè)名詞或名詞短語(yǔ)做主語(yǔ),占總用詞的93%,43個(gè)代詞做主語(yǔ),不定代詞為主語(yǔ)的有3個(gè),表明英語(yǔ)母語(yǔ)者在中動(dòng)句的使用方面更多的是采用名詞來(lái)引出的;謂語(yǔ)動(dòng)詞:一般現(xiàn)在時(shí)的句子有255個(gè),361個(gè)句子采用其他時(shí)態(tài),表明英語(yǔ)母語(yǔ)者采用謂語(yǔ)動(dòng)詞更為豐富,能采用肯定句、否定句等多樣化的謂語(yǔ)形式實(shí)現(xiàn)中動(dòng)結(jié)構(gòu);修飾語(yǔ):其中共有289個(gè)句子使用了介詞短語(yǔ),71個(gè)句子采用副詞,61個(gè)句子采用不定式、復(fù)雜句式,介詞短語(yǔ)或不采用修飾語(yǔ)占句子數(shù)量達(dá)到79%。

        針對(duì)WECCL和COCA中檢索的中動(dòng)句檢索結(jié)果進(jìn)行比較,由于兩庫(kù)存容量差異較大,因此先對(duì)語(yǔ)料庫(kù)進(jìn)行標(biāo)準(zhǔn)化頻數(shù)計(jì)算,由卡方檢驗(yàn)進(jìn)行差異顯著性評(píng)價(jià),如表4所示。

        表4 不同語(yǔ)料庫(kù)中動(dòng)句總頻統(tǒng)計(jì)

        可以看出,英語(yǔ)學(xué)習(xí)者和母語(yǔ)者的結(jié)構(gòu)頻數(shù)地域顯著性值(L>3,P<0.05),因此,二者間不存在顯著差異。

        從上述針對(duì)中介語(yǔ)語(yǔ)料庫(kù)分析發(fā)現(xiàn),英語(yǔ)學(xué)習(xí)者在應(yīng)用英語(yǔ)過(guò)程中,對(duì)中動(dòng)結(jié)構(gòu)使用較為接近,但受限于詞匯量的局限,中國(guó)學(xué)生使用extend、crumble類(lèi)型詞匯較低,在謂語(yǔ)動(dòng)詞形式方面,英語(yǔ)母語(yǔ)使用者更多的采用零修飾詞進(jìn)行寫(xiě)作交流,而中國(guó)學(xué)習(xí)者較多的采用修飾詞,但很少采用非典型的中動(dòng)結(jié)構(gòu)形式,而這部分復(fù)雜句式在英語(yǔ)母語(yǔ)者中應(yīng)用的較為頻繁。

        2 英語(yǔ)教學(xué)訓(xùn)練系統(tǒng)

        本節(jié)中針對(duì)中國(guó)學(xué)習(xí)者和外語(yǔ)母語(yǔ)使用者間在英語(yǔ)閱讀、寫(xiě)作和交流中存在的差異,將SELL語(yǔ)料庫(kù)融合虛擬現(xiàn)實(shí)技術(shù)來(lái)構(gòu)建英語(yǔ)學(xué)習(xí)交流在線(xiàn)系統(tǒng),營(yíng)造逼真外語(yǔ)學(xué)習(xí)環(huán)境。

        2.1 系統(tǒng)架構(gòu)

        系統(tǒng)采用三層式的架構(gòu)體系,分為表現(xiàn)層、邏輯層和數(shù)據(jù)層。通過(guò)三層結(jié)構(gòu)來(lái)構(gòu)建一個(gè)靈活的、可擴(kuò)充的平臺(tái),如圖1所示。

        圖1 系統(tǒng)三層體系框架

        表現(xiàn)層模塊實(shí)現(xiàn)管理系統(tǒng)和用戶(hù)的人機(jī)交互,初學(xué)者可通過(guò)智能穿戴設(shè)備進(jìn)入到虛擬的英語(yǔ)環(huán)境中,并通過(guò)模塊實(shí)現(xiàn)系統(tǒng)和用戶(hù)間的各種交互操作。注冊(cè)/登錄模塊提供用戶(hù)管理功能,學(xué)習(xí)者在系統(tǒng)注冊(cè)賬號(hào)后獲得分配的默認(rèn)配置文件,自行選擇模塊來(lái)進(jìn)行個(gè)性化定制。在虛擬環(huán)境下,學(xué)習(xí)者根據(jù)自身的學(xué)習(xí)進(jìn)程和興趣愛(ài)好參加課程。課程體系以樹(shù)狀結(jié)構(gòu)組織,一個(gè)大課程關(guān)聯(lián)多個(gè)子課程,每個(gè)子課程以樹(shù)狀連接至父課程中。各課程和系列課程采用標(biāo)簽標(biāo)記,方便學(xué)習(xí)者直接搜索選擇。學(xué)習(xí)者通過(guò)應(yīng)用界面的課程中心來(lái)確認(rèn)已經(jīng)選定的課程,并且用戶(hù)中心中提供了個(gè)人信息、個(gè)性化學(xué)習(xí)路徑以及往期的學(xué)習(xí)測(cè)試評(píng)估結(jié)果。

        中間邏輯層包括中間邏輯各項(xiàng)模塊,其中Language/AI模塊下包括部分英語(yǔ)語(yǔ)言框架和部分AI功能,如智能對(duì)話(huà)機(jī)器人、語(yǔ)音識(shí)別、寫(xiě)作評(píng)估。為高效組織故事路徑和訓(xùn)練場(chǎng)景,本文將系統(tǒng)邏輯層和實(shí)際功能應(yīng)用進(jìn)行拆分,引入腳本來(lái)實(shí)現(xiàn)對(duì)訓(xùn)練場(chǎng)的控制,保證系統(tǒng)靈活性。控制模塊主要管理3D環(huán)境、動(dòng)畫(huà)表情,虛擬工具包含了一些列虛擬工具,如利用白板、虛擬工具和視頻等,通過(guò)白板界面進(jìn)行仿真涂鴉,并將涂寫(xiě)內(nèi)容給實(shí)時(shí)共享給他人,支持多人同時(shí)書(shū)寫(xiě)。此外系統(tǒng)提供文檔和視頻方面學(xué)習(xí)者來(lái)進(jìn)行展示,社交模塊用于學(xué)習(xí)者的社交互動(dòng),其中添加了好友列表和具體的信息,能實(shí)現(xiàn)學(xué)習(xí)者間的互訪(fǎng)交流。其他功能模塊包括VR設(shè)備管理、聽(tīng)寫(xiě)通多控制模塊等。

        數(shù)據(jù)層包括數(shù)據(jù)服務(wù)器、文件服務(wù)器和同步服務(wù)器。數(shù)據(jù)服務(wù)器包含一個(gè)小型cache服務(wù)器,方便快速獲取數(shù)據(jù),營(yíng)造不同的場(chǎng)景環(huán)境,對(duì)話(huà)界面。文件服務(wù)器包括課程文檔、PPT、寫(xiě)作文檔,比較文檔等文件數(shù)據(jù),通過(guò)同步服務(wù)器實(shí)現(xiàn)各客戶(hù)端的實(shí)時(shí)數(shù)據(jù)同步,包括角色位置、動(dòng)作、模擬環(huán)境內(nèi)容等。

        2.2 浸入式學(xué)習(xí)平臺(tái)

        浸入式學(xué)習(xí)利用智能、互動(dòng)、有趣的虛擬環(huán)境提高學(xué)習(xí)者積極性,使學(xué)習(xí)室更貼近于英語(yǔ)母語(yǔ)使用者。系統(tǒng)主場(chǎng)景全方位模擬了一個(gè)虛擬小組,眾多學(xué)習(xí)者可同時(shí)進(jìn)入某一場(chǎng)景,并相互交流,場(chǎng)景中設(shè)計(jì)了多個(gè)AI角色,當(dāng)學(xué)習(xí)者接近AI角色后,AI角色主動(dòng)與學(xué)習(xí)者招呼,在不同場(chǎng)景下會(huì)有不同AI角色提供各種場(chǎng)景形式,如圖2所示。

        圖2 虛擬場(chǎng)景平面圖

        學(xué)習(xí)者根據(jù)自身需求,與相應(yīng)場(chǎng)景中AI角色互動(dòng),同時(shí),場(chǎng)景中各學(xué)習(xí)者都能看到其他學(xué)習(xí)者動(dòng)態(tài)。

        系統(tǒng)中設(shè)計(jì)了多個(gè)日常用語(yǔ)場(chǎng)景,如正式演講、辯論、廣播、面試等場(chǎng)景。以面試場(chǎng)景為例,如圖3所示。

        圖3 面試場(chǎng)景訓(xùn)練

        該場(chǎng)景設(shè)定學(xué)習(xí)者準(zhǔn)備赴美留學(xué),進(jìn)入到大使館申請(qǐng)簽證的面試場(chǎng)景。整個(gè)模擬場(chǎng)景在模擬面試房?jī)?nèi)進(jìn)行,面試官為通過(guò)AI技術(shù)構(gòu)建的虛擬人物。面試過(guò)程中,面試官會(huì)根據(jù)系統(tǒng)中預(yù)先給出的實(shí)際面試問(wèn)題向?qū)W習(xí)者詢(xún)問(wèn)關(guān)于簽證和留學(xué)的相關(guān)細(xì)節(jié),要求學(xué)習(xí)者做出正確回答,并根據(jù)學(xué)習(xí)者應(yīng)答做出不同反應(yīng),表示對(duì)面試者答案的認(rèn)可或疑惑,最后給出面試結(jié)果,并給出面試中存在的問(wèn)題和優(yōu)勢(shì),供學(xué)習(xí)者進(jìn)行修正。

        3 總結(jié)

        文章選擇中國(guó)學(xué)生英語(yǔ)口語(yǔ)WECCL和英語(yǔ)母語(yǔ)COCA作為語(yǔ)料庫(kù),比較分析中國(guó)英語(yǔ)學(xué)習(xí)者和英語(yǔ)母語(yǔ)者在使用中動(dòng)結(jié)構(gòu)間的差異性,并通過(guò)將SELL語(yǔ)料庫(kù)融合虛擬現(xiàn)實(shí)和AI技術(shù)來(lái)構(gòu)建英語(yǔ)學(xué)習(xí)在線(xiàn)交流系統(tǒng),營(yíng)造逼真外語(yǔ)學(xué)習(xí)環(huán)境,研究獲得的結(jié)論如下。

        (1) 在使用動(dòng)詞結(jié)構(gòu)頻率方面,中國(guó)英語(yǔ)學(xué)習(xí)者與英語(yǔ)母語(yǔ)者之間較為相似,但在復(fù)雜句式應(yīng)用、謂語(yǔ)動(dòng)詞形式以及修飾詞使用方面存在一差異,英語(yǔ)母語(yǔ)者更傾向于extend、crumble類(lèi)型詞匯,采用零修飾詞,通過(guò)復(fù)雜句式來(lái)表達(dá)。

        (2) 基于英語(yǔ)學(xué)習(xí)系統(tǒng)采用三層式的架構(gòu)體系,構(gòu)建一個(gè)靈活的、可擴(kuò)充的平臺(tái)。通過(guò)設(shè)計(jì)多維虛擬場(chǎng)景和智能AI角色,來(lái)實(shí)現(xiàn)不同場(chǎng)景下AI角色的交流和學(xué)習(xí)。

        猜你喜歡
        母語(yǔ)語(yǔ)料庫(kù)短語(yǔ)
        母語(yǔ)
        草原歌聲(2020年3期)2021-01-18 06:52:02
        《語(yǔ)料庫(kù)翻譯文體學(xué)》評(píng)介
        母語(yǔ)
        草原歌聲(2017年3期)2017-04-23 05:13:47
        把課文的優(yōu)美表達(dá)存進(jìn)語(yǔ)料庫(kù)
        基于JAVAEE的維吾爾中介語(yǔ)語(yǔ)料庫(kù)開(kāi)發(fā)與實(shí)現(xiàn)
        我有祖國(guó),我有母語(yǔ)
        母語(yǔ)寫(xiě)作的宿命——《圣天門(mén)口》未完的話(huà)
        語(yǔ)料庫(kù)語(yǔ)言學(xué)未來(lái)發(fā)展趨勢(shì)
        五月激情婷婷丁香| 免费观看a级片| 亚洲女初尝黑人巨高清| 97无码人妻Va一区二区三区| 精品999无码在线观看| 亚洲一区二区三区重口另类| 疯狂做受xxxx高潮视频免费| 在教室伦流澡到高潮h麻豆| 欧美激情国产亚州一区二区| av国产免费在线播放| 日本顶级metart裸体全部| 色视频www在线播放国产人成| 免费一区二区三区视频狠狠| 好看的中文字幕中文在线| 97在线视频人妻无码| 国产精品免费久久久久影院仙踪林 | 久久精品这里就是精品| 精品一区中文字幕在线观看| 性欧美老人牲交xxxxx视频| 亚洲最大在线精品| 亚洲男人在线天堂av| 免费毛儿一区二区十八岁| 精品人妻伦九区久久aaa片69| 免费一级黄色大片久久久| 91国内偷拍精品对白| 奇米影视7777久久精品| 四虎影视在线观看2413| 免费国产在线精品三区| 国产精品高潮呻吟av久久黄| 国产午夜无码片在线观看影院| 国产人澡人澡澡澡人碰视频| 久久亚洲国产高清av一级 | 国产av一区仑乱久久精品| 亚洲性无码av中文字幕| 国产精品免费大片| 久久国产精品老人性| 大香蕉国产av一区二区三区| 亚洲avav天堂av在线网毛片| 四虎成人精品无码永久在线| 国产女主播大秀在线观看| 中国妇女做爰视频|