關(guān)鍵詞: 人工智能 人機(jī)交互 智能對(duì)話(huà) 口語(yǔ)教學(xué)
1 技術(shù)發(fā)展現(xiàn)狀與可用模塊
自然語(yǔ)言處理是人工智能領(lǐng)域的重要分支。自然語(yǔ)言處理匯集了包括語(yǔ)言學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)、生物神經(jīng)學(xué)等在內(nèi)的多學(xué)科研究成果,在自動(dòng)分詞、詞性標(biāo)注、句法分析、文本分類(lèi)、信息抽取、文字校對(duì)、語(yǔ)音識(shí)別、語(yǔ)音合成、機(jī)器翻譯、自然語(yǔ)言生成、自動(dòng)摘要等方面均取得了顯著進(jìn)展。
迄今為止,自然語(yǔ)言處理的發(fā)展共經(jīng)歷了3 個(gè)關(guān)鍵階段,即基于規(guī)則的方法(1950—1970 年)、基于數(shù)學(xué)模型和統(tǒng)計(jì)的方法(1970—2008 年)以及基于深度神經(jīng)網(wǎng)絡(luò)的方法(2008 年至今)[1]。1950 年,阿蘭·圖靈提出了著名的“圖靈測(cè)試”,這一般被認(rèn)為是自然語(yǔ)言處理的開(kāi)端。在這個(gè)時(shí)期人們認(rèn)為自然語(yǔ)言處理的過(guò)程和人類(lèi)學(xué)習(xí)認(rèn)知一門(mén)語(yǔ)言的過(guò)程是類(lèi)似的,并依據(jù)這個(gè)觀(guān)點(diǎn)而采用了基于規(guī)則的方法,即在認(rèn)知語(yǔ)言學(xué)的基礎(chǔ)上制定了一系列的規(guī)則,通過(guò)計(jì)算機(jī)編程技術(shù)實(shí)現(xiàn)語(yǔ)言處理的相關(guān)問(wèn)題。但后續(xù)的發(fā)展證明基于規(guī)則的方法具有明顯的缺陷:首先,規(guī)則不能覆蓋所有語(yǔ)句,無(wú)法“觸類(lèi)旁通”;其次,這種方法對(duì)開(kāi)發(fā)者的要求極高,開(kāi)發(fā)者不僅需要精通計(jì)算機(jī),還要精通語(yǔ)言學(xué)。因此,這個(gè)階段無(wú)法從根本上將自然語(yǔ)言理解實(shí)用化,這個(gè)階段也被稱(chēng)為理性主義思潮。20 世紀(jì)70 年代以后,隨著豐富的語(yǔ)料庫(kù)成為現(xiàn)實(shí)以及計(jì)算機(jī)硬件設(shè)備不斷提升,自然語(yǔ)言思潮從理性主義過(guò)渡到經(jīng)驗(yàn)主義,基于數(shù)學(xué)模型和統(tǒng)計(jì)的方法逐漸取代了基于規(guī)則的方法,并取得了實(shí)質(zhì)性的突破。語(yǔ)音識(shí)別率從70% 跨越式提升到90%,宣告語(yǔ)言模型技術(shù)從實(shí)驗(yàn)室走向?qū)嶋H應(yīng)用。從2008 年開(kāi)始,計(jì)算機(jī)深度學(xué)習(xí)技術(shù)再次崛起,并且在計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、機(jī)器翻譯等領(lǐng)域明顯超越其他技術(shù)。人們也開(kāi)始將深度學(xué)習(xí)引入自然語(yǔ)言處理研究應(yīng)用中,并且在機(jī)器翻譯、閱讀理解、智能對(duì)話(huà)等領(lǐng)域取得了巨大的成果。
實(shí)現(xiàn)智能化的英語(yǔ)口語(yǔ)交互教學(xué)系統(tǒng)需要具備的核心技術(shù)包括語(yǔ)音識(shí)別、語(yǔ)義識(shí)別、對(duì)話(huà)管理、自然語(yǔ)言生成和語(yǔ)音合成。其中,語(yǔ)音識(shí)別讓機(jī)器人具備“聽(tīng)”的能力,語(yǔ)義識(shí)別讓機(jī)器人具備“理解”的能力,對(duì)話(huà)管理讓機(jī)器人具備“思考”的能力,自然語(yǔ)言生成和語(yǔ)音合成讓機(jī)器人具備“說(shuō)話(huà)”的能力。目前,自然語(yǔ)言處理中的突破性成果都是基于深度神經(jīng)網(wǎng)絡(luò)的方法實(shí)現(xiàn)的。例如:Facebook 最新公開(kāi)的基于卷積神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別模型wav2letter++準(zhǔn)確率超過(guò)95%,毫秒級(jí)的響應(yīng)時(shí)間;Google 公開(kāi)的語(yǔ)言模型BERT 及其衍生版本ALBERT 和XLnet 在BooksCropus 和英文維基百科共有超過(guò)33 億個(gè)詞的語(yǔ)料數(shù)據(jù)集上,用包含超過(guò)3 億個(gè)參數(shù)量的深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練而成,最新發(fā)布的模型在斯坦福大學(xué)的問(wèn)答數(shù)據(jù)集(SQuAD)上達(dá)到EM 超過(guò)87 分、F1 超過(guò)89.5 分的評(píng)測(cè)結(jié)果,均超過(guò)人類(lèi)表現(xiàn)的86.831 分(EM 評(píng)測(cè))和89.452 分(F1 評(píng)測(cè))。亞馬遜基于深度學(xué)習(xí)的語(yǔ)音合成技術(shù)Polly 可以生成幾十種逼真語(yǔ)音,在如仿真新聞主播、智能客服系統(tǒng)等項(xiàng)目上都有很成熟的應(yīng)用。這些數(shù)據(jù)表明智能交互口語(yǔ)教學(xué)具備較為成熟的技術(shù)條件。
2 設(shè)計(jì)思想和特點(diǎn)
2.1 設(shè)計(jì)思想
人工智能的效率和作用可以取代教師在英語(yǔ)教學(xué)中某些特定領(lǐng)域的地位和功能。例如:在教學(xué)管理方面,可以實(shí)現(xiàn)輔助備課、備教材、設(shè)計(jì)課堂活動(dòng)、布置和提醒作業(yè)、發(fā)送通知、記錄考勤;在學(xué)習(xí)內(nèi)容方面,基于龐大的數(shù)據(jù)庫(kù),練習(xí)的部分完全可以由人工智能技術(shù)來(lái)完成[2]??谡Z(yǔ)練習(xí)就是其中的重要一部分,現(xiàn)階段的人工智能可以評(píng)估學(xué)習(xí)者的語(yǔ)言能力,并且給予評(píng)分和反饋。
此交互系統(tǒng)的設(shè)計(jì)思想是通過(guò)整合目前已公開(kāi)的深度神經(jīng)網(wǎng)絡(luò)模型作為該機(jī)器人的核心技術(shù)骨干,搭建出一個(gè)具備“聽(tīng)”“理解”“說(shuō)話(huà)”能力的智能對(duì)話(huà)系統(tǒng)。此系統(tǒng)有別于普通智能問(wèn)答,須兼?zhèn)浣虒W(xué)性,可根據(jù)教學(xué)需求設(shè)計(jì)相關(guān)的對(duì)話(huà)場(chǎng)景,如預(yù)定餐館、對(duì)興趣愛(ài)好的討論等,并針對(duì)對(duì)話(huà)場(chǎng)景建設(shè)語(yǔ)料數(shù)據(jù),隨后將語(yǔ)料數(shù)據(jù)提供給對(duì)話(huà)系統(tǒng)完成訓(xùn)練,實(shí)現(xiàn)“說(shuō)話(huà)能力”。使用者可以選擇在不同的場(chǎng)景下和經(jīng)過(guò)訓(xùn)練的機(jī)器人進(jìn)行對(duì)話(huà),并且由機(jī)器人進(jìn)行評(píng)估和反饋。
2.2 基本特點(diǎn)
2.2.1 性能可靠的智能對(duì)話(huà)系統(tǒng)
采用已經(jīng)公開(kāi)并廣泛應(yīng)用的深度神經(jīng)網(wǎng)絡(luò)模型,其優(yōu)點(diǎn)是模型已經(jīng)經(jīng)過(guò)海量數(shù)據(jù)的預(yù)訓(xùn)練,可以即插即用并節(jié)約大量的計(jì)算資源和實(shí)施成本。對(duì)于特殊定制的需求,可以在預(yù)訓(xùn)練的基礎(chǔ)上通過(guò)自有數(shù)據(jù)的遷移學(xué)習(xí)對(duì)模型進(jìn)行迭代。文章采用Google Recognizer進(jìn)行語(yǔ)音識(shí)別,采用RASA 進(jìn)行自然語(yǔ)言理解、智能對(duì)話(huà)流程管理和對(duì)話(huà)生成,采用Amazon Polly 技術(shù)完成語(yǔ)音合成,得益于這些成熟的單點(diǎn)技術(shù),通過(guò)整合可以搭建出一個(gè)性能可靠的智能對(duì)話(huà)系統(tǒng)。同時(shí),基于深度學(xué)習(xí)的開(kāi)放領(lǐng)域?qū)υ?huà)系統(tǒng)的關(guān)鍵問(wèn)題在于回復(fù)的多樣性、話(huà)題控制、引入外部知識(shí)、融入情感、個(gè)性化回復(fù)等[3]。
2.2.2 具備多場(chǎng)景對(duì)話(huà)能力
為了實(shí)現(xiàn)教學(xué)功能,該機(jī)器人需要具備豐富的場(chǎng)景對(duì)話(huà)能力。例如:針對(duì)商務(wù)英語(yǔ)口語(yǔ)學(xué)習(xí)的需求,機(jī)器人需要就“電話(huà)預(yù)約”“商務(wù)參觀(guān)”“客戶(hù)接待”“會(huì)議交流”等各種和商務(wù)溝通相關(guān)的話(huà)題進(jìn)行對(duì)話(huà);對(duì)于少兒英語(yǔ)口語(yǔ)學(xué)習(xí)的需求,機(jī)器人需要就“旅行”“乘坐交通工具”“禮儀問(wèn)候”等有關(guān)的話(huà)題進(jìn)行對(duì)話(huà)。文章設(shè)計(jì)的機(jī)器人,是根據(jù)教學(xué)需求進(jìn)行語(yǔ)料設(shè)計(jì)然后訓(xùn)練機(jī)器人來(lái)豐富它的場(chǎng)景對(duì)話(huà)能力,這個(gè)過(guò)程不需要修改程序,不僅維護(hù)便捷、擴(kuò)充靈活,其方法就是針對(duì)每一個(gè)對(duì)話(huà)場(chǎng)景做專(zhuān)門(mén)的語(yǔ)料設(shè)計(jì),然后由機(jī)器人對(duì)數(shù)據(jù)進(jìn)行學(xué)習(xí)后學(xué)會(huì)某一個(gè)話(huà)題的對(duì)話(huà)能力。
2.2.3 智能評(píng)估和反饋
智能評(píng)估和反饋是該機(jī)器人具備的重要教學(xué)功能,包括整體對(duì)話(huà)能力評(píng)估、發(fā)音檢測(cè)和語(yǔ)法檢測(cè)。當(dāng)練習(xí)者選擇一個(gè)場(chǎng)景與該機(jī)器人進(jìn)行對(duì)話(huà)時(shí),練習(xí)者是否能夠完成該場(chǎng)景的對(duì)話(huà)目標(biāo)可以作為練習(xí)者在該主題中對(duì)話(huà)能力的重要評(píng)估依據(jù)。根據(jù)這個(gè)思想,設(shè)計(jì)一種整體對(duì)話(huà)能力評(píng)估的標(biāo)準(zhǔn)化方法:為每個(gè)對(duì)話(huà)場(chǎng)景設(shè)置“打卡任務(wù)”,這些“任務(wù)”包含了完成一個(gè)特定場(chǎng)景對(duì)話(huà)所必須要進(jìn)行的對(duì)話(huà),單個(gè)場(chǎng)景完成“任務(wù)”的數(shù)量將決定練習(xí)者在該場(chǎng)景中的對(duì)話(huà)能力分?jǐn)?shù),即與該機(jī)器人進(jìn)行的場(chǎng)景對(duì)話(huà)越多,越能反映該練習(xí)者英語(yǔ)口語(yǔ)的綜合水平。
在每個(gè)回合的對(duì)話(huà)中,機(jī)器人還會(huì)對(duì)發(fā)音和語(yǔ)法進(jìn)行評(píng)測(cè)并反饋糾正意見(jiàn),但不進(jìn)行評(píng)分,目的是幫助練習(xí)者提升表達(dá)的準(zhǔn)確性,進(jìn)行更地道的英語(yǔ)對(duì)話(huà)。需要說(shuō)明的是,這一設(shè)計(jì)思想側(cè)重于關(guān)注練習(xí)者的整體口語(yǔ)能力,因此僅將此項(xiàng)進(jìn)行評(píng)分作為練習(xí)者英語(yǔ)口語(yǔ)水平的判斷依據(jù)。
口語(yǔ)自動(dòng)評(píng)分系統(tǒng)最核心的技術(shù)是特征參數(shù)的提取,評(píng)分特征參數(shù)的提取大致可分為語(yǔ)音特征和內(nèi)容特征。前者包括發(fā)音、音調(diào)、語(yǔ)速、停頓、流利度等參數(shù);后者包括詞匯相關(guān)性、語(yǔ)法、搭配、語(yǔ)言準(zhǔn)確性和內(nèi)容相關(guān)性等參數(shù)[4]。智能評(píng)分技術(shù)也是當(dāng)前教育人工智能技術(shù)的研究熱點(diǎn),目前國(guó)外已開(kāi)發(fā)出較為成熟的作文評(píng)分系統(tǒng),但是口語(yǔ)自動(dòng)評(píng)分技術(shù)發(fā)展略顯滯后,主要有兩種方法:一種是題型設(shè)計(jì)(如朗讀等),避開(kāi)對(duì)自然交際話(huà)語(yǔ)識(shí)別的難題,用來(lái)預(yù)測(cè)考生的口語(yǔ)能力,如e-rater 評(píng)分系統(tǒng);另一種是采用交際性口語(yǔ)任務(wù)直接考查考生的交際能力,如SpeechRater 系統(tǒng)[5]。文章采用的第二種方法,即設(shè)置交際任務(wù),通過(guò)特征參數(shù)的提取,直接對(duì)考生的交際能力進(jìn)行評(píng)分。
2.2.4 科學(xué)分類(lèi),滿(mǎn)足個(gè)性化學(xué)習(xí)需求
文章將對(duì)話(huà)場(chǎng)景按難度和主題進(jìn)行分類(lèi)。通過(guò)設(shè)定規(guī)則將各種對(duì)話(huà)場(chǎng)景進(jìn)行分類(lèi),結(jié)合對(duì)話(huà)能力評(píng)估方法可以對(duì)練習(xí)者的綜合口語(yǔ)能力、專(zhuān)項(xiàng)口語(yǔ)能力(例如商務(wù)類(lèi)、生活類(lèi)等)、特定場(chǎng)景交流能力這3 個(gè)維度進(jìn)行評(píng)估。與機(jī)器人進(jìn)行的對(duì)話(huà)越多,數(shù)據(jù)積累越多,機(jī)器人就會(huì)越了解練習(xí)者的學(xué)習(xí)需求和水平,從而實(shí)現(xiàn)滿(mǎn)足個(gè)性化學(xué)習(xí)的教學(xué)功能。此機(jī)器人是一種以輔助英語(yǔ)口語(yǔ)教學(xué)為目的而專(zhuān)門(mén)設(shè)計(jì)的,在智能技術(shù)的基礎(chǔ)上滿(mǎn)足教學(xué)功能。正如上文所強(qiáng)調(diào),它和AI 助手、聊天機(jī)器人或者智能客服系統(tǒng)是有本質(zhì)區(qū)別的。
3 技術(shù)框架
用于實(shí)現(xiàn)交互教學(xué)系統(tǒng)(機(jī)器人)的技術(shù)架構(gòu)共分為4 層,包括基礎(chǔ)平臺(tái)環(huán)境、后端服務(wù)、通信接口和交互前端。
3.1 基礎(chǔ)平臺(tái)環(huán)境
采用AWS 亞馬遜云作為基礎(chǔ)平臺(tái)環(huán)境,主要原因是實(shí)現(xiàn)的機(jī)器人應(yīng)用于英語(yǔ)環(huán)境,使用AWS 與各種英語(yǔ)自然語(yǔ)言處理模型的整體兼容性會(huì)更優(yōu),除此之外,還因?yàn)锳WS 是目前最成熟的云計(jì)算平臺(tái)之一。
3.2 后端服務(wù)
后端服務(wù)是架構(gòu)的核心,負(fù)責(zé)實(shí)現(xiàn)機(jī)器人的語(yǔ)音識(shí)別、說(shuō)話(huà)、理解、學(xué)習(xí)、分類(lèi)、測(cè)評(píng)、數(shù)據(jù)分析等功能,如同機(jī)器人的大腦。本文將后端服務(wù)按功能劃分為三大模塊,分別是智能對(duì)話(huà)模塊、測(cè)評(píng)模塊和管理模塊。
智能對(duì)話(huà)模塊代替真人扮演英語(yǔ)對(duì)話(huà)時(shí)“交互對(duì)象”的角色,而測(cè)評(píng)模塊和管理模塊就像一個(gè)站在幕后的英語(yǔ)口語(yǔ)老師,它默默地旁聽(tīng)每一句對(duì)話(huà),并通過(guò)記錄和分析數(shù)據(jù)來(lái)了解學(xué)習(xí)者。
智能對(duì)話(huà)模塊是對(duì)目前已成熟應(yīng)用的深度神經(jīng)網(wǎng)絡(luò)模型的整合應(yīng)用,采用Google Recognizer 進(jìn)行語(yǔ)音識(shí)別,采用RASA 進(jìn)行自然語(yǔ)言理解、智能對(duì)話(huà)流程管理和對(duì)話(huà)生成,采用Amazon Polly 技術(shù)完成語(yǔ)音合成。
測(cè)評(píng)模塊的核心是基于“對(duì)話(huà)任務(wù)完成率”算法,系統(tǒng)會(huì)將每次對(duì)話(huà)的評(píng)估反饋給練習(xí)者并且保存在數(shù)據(jù)庫(kù)中,這是一個(gè)創(chuàng)新且簡(jiǎn)潔易于執(zhí)行的評(píng)價(jià)方法,區(qū)別目前普遍采用的單詞級(jí)別的發(fā)音檢測(cè),它的意義是可以從整體對(duì)話(huà)級(jí)別上更真實(shí)地反映練習(xí)者的口語(yǔ)水平。
管理模塊負(fù)責(zé)將對(duì)話(huà)場(chǎng)景按照規(guī)則進(jìn)行分類(lèi),對(duì)練習(xí)者對(duì)話(huà)數(shù)據(jù)和測(cè)評(píng)數(shù)據(jù)進(jìn)行分析來(lái)了解學(xué)習(xí)者,發(fā)揮個(gè)性化學(xué)習(xí)推薦的功能。管理模塊通過(guò)對(duì)話(huà)數(shù)據(jù)分析可以了解練習(xí)者的學(xué)習(xí)需求,如在職練習(xí)者更傾向于進(jìn)行商務(wù)英語(yǔ)對(duì)話(huà)、大學(xué)生更傾向于專(zhuān)業(yè)英語(yǔ)對(duì)話(huà)、寒暑假等旅游旺季練習(xí)者傾向于旅游英語(yǔ)對(duì)話(huà)等。
此外,管理模塊還通過(guò)測(cè)評(píng)數(shù)據(jù)分析了解練習(xí)者的對(duì)話(huà)水平。結(jié)合內(nèi)容分類(lèi)、練習(xí)者學(xué)習(xí)需求定位和能力水平測(cè)評(píng),系統(tǒng)就可以實(shí)現(xiàn)個(gè)性化學(xué)習(xí)。
3.3 通信接口
通信接口的功能是實(shí)現(xiàn)交互前端和后端服務(wù)的數(shù)據(jù)交互。練習(xí)者每一句對(duì)話(huà)會(huì)從前端傳到后端,由后端進(jìn)行處理并生成機(jī)器人要回應(yīng)的對(duì)話(huà),然后再由后端傳到前端,是系統(tǒng)最主要、最頻繁調(diào)用的通信內(nèi)容。這是一個(gè)必要而且常規(guī)的系統(tǒng)組件,技術(shù)上通過(guò)普遍采用的HTTP 技術(shù)實(shí)現(xiàn)。
3.4 交互前端
交互前端本質(zhì)上是一個(gè)載體,這個(gè)載體負(fù)責(zé)將練習(xí)者的語(yǔ)音傳到后端進(jìn)行處理、將機(jī)器人“想說(shuō)的話(huà)”以語(yǔ)音的形式播放出來(lái)。在標(biāo)準(zhǔn)化通信接口的支持下,可以搭建各種不同形式的交互前端,文章列舉了常用的前端包括微信小程序、App 應(yīng)用、Web 網(wǎng)頁(yè),覆蓋了手機(jī)端和PC 端。
4 消息處理機(jī)制
智能對(duì)話(huà)模塊采用管道(pipeline)的方法,將多個(gè)自然語(yǔ)言處理深度神經(jīng)網(wǎng)絡(luò)模型以組件的形式整合起來(lái),實(shí)現(xiàn)對(duì)話(huà)過(guò)程的流水線(xiàn)式處理。管道(pipeline)的方法是目前實(shí)現(xiàn)“任務(wù)型”智能對(duì)話(huà)系統(tǒng)的主流方案,本文引入這種方法來(lái)實(shí)現(xiàn)基于場(chǎng)景的智能對(duì)話(huà),并按照以下流程對(duì)消息進(jìn)行處理。具體敘述如下。
(1)練習(xí)者的一條口語(yǔ)語(yǔ)音數(shù)據(jù)從前端傳到后端,并由后端負(fù)責(zé)語(yǔ)音識(shí)別的組件Google Recoginzer 將語(yǔ)音轉(zhuǎn)成英語(yǔ)文本。
(2)由RASA 中負(fù)責(zé)自然語(yǔ)言處理的組件對(duì)上述轉(zhuǎn)換后的文本進(jìn)行語(yǔ)義解析,確定意圖(intent)和實(shí)體(entities),讓計(jì)算機(jī)理解對(duì)話(huà)的語(yǔ)義。需要說(shuō)明的是,系統(tǒng)是在使用標(biāo)注過(guò)的語(yǔ)料數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練后,具備特定場(chǎng)景對(duì)話(huà)中的意圖和實(shí)體識(shí)別能力的。意圖分類(lèi)是特殊的文本分類(lèi)問(wèn)題,傳統(tǒng)的分類(lèi)集中于特征工程、特征選擇和使用不同的機(jī)器學(xué)習(xí)算法模型這3個(gè)方面。而近期的研究表明,神經(jīng)網(wǎng)絡(luò)的效果遠(yuǎn)勝于傳統(tǒng)的方法[6]。
(3)將完成語(yǔ)義解析后的意圖和實(shí)體等信息傳給RASA 中負(fù)責(zé)管理對(duì)話(huà)狀態(tài)的組件,該組件會(huì)記錄諸如本輪對(duì)話(huà)的進(jìn)度、已完成的對(duì)話(huà)任務(wù),并將信息繼續(xù)向后傳遞。
(4)對(duì)話(huà)策略組件負(fù)責(zé)決定系統(tǒng)在本輪對(duì)話(huà)中做何響應(yīng)。通過(guò)上面?zhèn)鬟f來(lái)的信息,決策組件知道的信息包括練習(xí)者想要預(yù)定餐館的意圖和通過(guò)解析獲得的實(shí)體信息——“就餐人數(shù)”,因此不必再做出詢(xún)問(wèn)就餐人數(shù)這樣的響應(yīng),而是按照順序系統(tǒng)決定做出詢(xún)問(wèn)口味偏好的響應(yīng),并將決策向下傳遞。回復(fù)響應(yīng)機(jī)制可通過(guò)檢索與生成相結(jié)合的方法?;跈z索的對(duì)話(huà)回復(fù)是人的真實(shí)話(huà)語(yǔ),語(yǔ)料質(zhì)量高,是目前的主流技術(shù)。而基于生成的對(duì)話(huà)系統(tǒng)由于其創(chuàng)造性和主題任意性,也逐漸成為關(guān)注的熱點(diǎn)[3]。
(5)生成響應(yīng)組件根據(jù)決策信息生成對(duì)話(huà)文本“Which cuisine do you prefer?”。
(6)由Amazon Polly 將對(duì)話(huà)文本生成語(yǔ)音數(shù)據(jù)。
(7)最終,語(yǔ)音數(shù)據(jù)由服務(wù)后端經(jīng)過(guò)通信接口發(fā)送到交互前端,于是練習(xí)者聽(tīng)到了機(jī)器人的詢(xún)問(wèn)“Which cuisine do you prefer?”。
5 結(jié)語(yǔ)
文章以實(shí)現(xiàn)口語(yǔ)對(duì)話(huà)教學(xué)的智能化為目標(biāo),創(chuàng)新性地提出一種基于場(chǎng)景的智能對(duì)話(huà)機(jī)器人和對(duì)應(yīng)的綜合對(duì)話(huà)能力評(píng)估方法,很大程度上改善了目前各種英語(yǔ)口語(yǔ)應(yīng)用只能在詞句級(jí)別跟讀和測(cè)評(píng)的局限性。具體體現(xiàn)在兩方面的創(chuàng)新:(1)通過(guò)一個(gè)能夠“學(xué)習(xí)說(shuō)話(huà)”的智能機(jī)器人代替真人作為英語(yǔ)口語(yǔ)學(xué)習(xí)中必要的“交互對(duì)象”,練習(xí)者可以與機(jī)器人進(jìn)行基于主題場(chǎng)景的仿真對(duì)話(huà);(2)文章提出一種稱(chēng)為“對(duì)話(huà)任務(wù)完成率”的標(biāo)準(zhǔn)化評(píng)估方法,可以從整體上更有效、更真實(shí)地反映練習(xí)者的口語(yǔ)水平,并結(jié)合數(shù)據(jù)分析滿(mǎn)足個(gè)性化學(xué)習(xí)需求。人工智能還在不斷的發(fā)展中,它在英語(yǔ)口語(yǔ)教學(xué)中必定發(fā)揮越來(lái)越多的作用,讓更多的人在技術(shù)的幫助下擺脫“聾啞英語(yǔ)”的問(wèn)題。