王萍 王陳欣 朱璇
摘要:教育人工智能系統(tǒng)設計與應用研究的目標是推動教育與人工智能深度融合,促進人工智能在教育領域的落地,加速教育邁向智能化時代。文章從文獻分析、地平線報告分析、技術成熟度模型分析三個方面梳理了當前教育人工智能應用研究的現(xiàn)狀。接著,分析了教育人工智能系統(tǒng)的主要功能模塊,歸納了系統(tǒng)設計開發(fā)中存在的問題與面臨的困難。在此基礎上提出了基于自動化思想和學習理論支持的新型教育人工智能系統(tǒng)設計方法與模型,并進行了案例實踐研究?;谧詣踊椒ǖ慕逃斯ぶ悄芟到y(tǒng)設計有助于幫助教師實現(xiàn)智能教育應用,降低人工智能應用門檻,擴展教育應用場景,提高開發(fā)與更新效率。
關鍵詞:自動化;教育;人工智能;系統(tǒng)設計;學習理論
中圖分類號:G434
文獻標識碼:A
文章編號:1006-9860(2020)06-0007-09
一、引言
作為科技進步的核心驅(qū)動力,人工智能對社會發(fā)展帶來了深刻變革。教育領域也在積極探尋如何與人工智能深度融合,推動教育創(chuàng)新,構建智能時代下的教育新生態(tài)。但人工智能對教育的具體賦能并非是一蹴而就的,教育領域目前還面臨著缺少成熟應用模式、缺少人工智能專家、缺少技術平臺支撐等問題,人工智能尚未能夠有效的支持構建教育工具和教育系統(tǒng)。如何推動人工智能的落地應用、實現(xiàn)人工智能系統(tǒng)的便捷開發(fā)將是教育人工智能發(fā)展道路上的重要環(huán)節(jié)。
自動化是人類文明進步和社會現(xiàn)代化的標志。伴隨人類社會的進步,自動化技術在社會需求的推動下不斷發(fā)展。當前,通過自動化方法構建人工智能系統(tǒng)是人工智能領域開始關注的一個重要方向。作為一種新的研究方法,自動化機器學習、自動化深度學習等人工智能方法使用“以人工智能訓練人工智能”的設計思路,擴展人工智能研究和應用的范圍,實現(xiàn)開放普惠的人工智能目標。使用者只需給出輸入數(shù)據(jù)和任務類型,系統(tǒng)建模中的算法與模型構建等專業(yè)性任務由機器自動完成,從而有效降低人工智能應用與系統(tǒng)開發(fā)的門檻,推動人工智能應用的標準化、模塊化、自動化。
當前教育人工智能的研究總體上呈現(xiàn)理論探討多、落地應用少的現(xiàn)狀,自動化人工智能方法為教育領域的人工智能研究與應用提供了思路。本文在分析教育人工智能系統(tǒng)設計與應用已有研究與問題的基礎上,探討基于自動化思想的設計方法,以期為探索教育人工智能的應用與實踐提供參考。
二、相關研究分析
我們從文獻分析、地平線報告分析、Gartner技術趨勢分析三個方面,對教育人工智能的研究現(xiàn)狀進行梳理,并重點分析人工智能在應用層面的研究與進展。
(一)國內(nèi)教育人工智能研究現(xiàn)狀
為了深入分析國內(nèi)教育人工智能的研究現(xiàn)狀,我們選取了國內(nèi)教育技術領域7個主要CSSCI期刊中內(nèi)容關于人工智能的論文,從2017年1月至2019年12月共369篇,對文章主題進行了歸納與分類。分析結果可以發(fā)現(xiàn)當前國內(nèi)教育人工智能研究存在較為明顯的“理論研究豐富,場景討論充分,技術應用匱乏”的局面。
1.當前國內(nèi)教育人工智能的研究主題主要有三大類。(1)理論探討類。這類研究(174篇)主要從理論角度分析人工智能對教育、學習領域帶來的影響,討論智能化時代下對教育帶來的沖擊,具體又可分為綜述類、文件解讀類、理論分析類。這些研究為我們把握人工智能技術對教育的賦能,分析智能教育的內(nèi)涵與定位,了解世界各國與相關機構的人工智能政策與規(guī)劃,指導我國未來教育人工智能戰(zhàn)略的制定等方面具有積極的意義。(2)應用場景類。這類研究(169篇)主要從人工智能技術參與構建的教育應用場景展開討論。其中智慧課堂、智慧校園的內(nèi)涵與建設研究重點分析智能技術對于課堂、校園等學習空間帶來的變革。其他應用場景類研究,我們歸為“智能+”類,主要是探索人工智能視域下相關研究的融合,包括對“智能+5G”“智能+云計算”“智能+慕課”“智能+STEM”等的討論。人工智能技術融合其他信息技術正在構建全新的技術場域,從而賦能教育創(chuàng)新,構建新的智能應用場景。(3)技術開發(fā)類。當前,國內(nèi)教育人工智能中具體的技術開發(fā)類研究明顯落后于理論研究。在26項已有研究中,17項研究主題為智能系統(tǒng)設計類,9項研究探索了智能算法。這些研究基本上針對某一具體任務進行了教育人工智能系統(tǒng)的設計與算法設計研究。
2.通過對國內(nèi)已有研究的梳理,可以發(fā)現(xiàn)當前教育人工智能在理論分析和潛在應用場景的討論已較為全面,但具體應用實現(xiàn)和技術研究方面還較少,系統(tǒng)設計與算法研究還有待于深入。在教育人工智能的系統(tǒng)應用框架和實現(xiàn)流程方面,一些學者結合人工智能技術特征進行了分析,提出教育人工智能技術框架主要包括教育數(shù)據(jù)層、算法層、感知層、認知層和教育應用層。但研究也還主要停留在框架的建構層面,對于如何應用框架中的模塊和技術到具體的教育人工智能應用中,還缺少實踐研究。雖然如何推動并實現(xiàn)有效的落地應用已經(jīng)受到理論關注與討論,但探索如何有效落地應用的機制和方法還較為匱乏。
(二)地平線報告對人工智能的分析
地平線報告從2014年開始持續(xù)關注虛擬助理、自適應學習、自然用戶界面、機器人技術等智能技術在教育領域中的應用。2017年以來人工智能作為專項技術連續(xù)出現(xiàn)在地平線報告中。作為影響教育未來中長期發(fā)展的關鍵技術,智能技術的發(fā)展與應用成為地平線趨勢預測的重要部分(如圖1所示)。
圖1描述了地平線報告中近年對人工智能相關技術的教育應用分析,呈現(xiàn)如下特點。
1.關注點逐步擴散和全面。從關注學習(2017),到關注研究與技術(2018年),到關注人工智能在教育領域的全面應用(2019年)。2017年地平線報告指出人工智能技術可以“深入理解學習者特征,學習者思維模式,從而提升在線學習和自適應學習系統(tǒng)的性能”。2018年,在關注學習的基礎上,地平線報告開始關注人工智能作為有效的研究手段與教學工具,“增強在線學習、適應學習軟件和研究過程,與學生進行積極反饋與互動,是有效的教學工具和技術解決方案”。2019年地平線報告分析繼續(xù)指出,人工智能技術作用于教育教學的全過程,“可以提供個性化體驗,減少工作量和協(xié)作分析大型數(shù)據(jù)集,以為教學應用程序提供借鑒。支持自適應學習等教學方法,滿足個性化學習。通過數(shù)據(jù)建模分析輔助教學策略和教學管理”。
2.關注教育人工智能的具體應用。地平線報告將人工智能作為支持教育的基礎性技術和重大創(chuàng)新技術予以關注并重點關注人工智能的應用方式,即人工智能如何落地于具體的教育場景中,如何應用于教與學過程中。如近年地平線報告中關注的虛擬助理、自然用戶界面等是對話式人工智能的典型技術,自適應學習則體現(xiàn)了智能技術在學習系統(tǒng)中的典型應用。因此,地平線報告的分析從底層支持層到教學應用層,圍繞人工智能技術應用展開分析,體現(xiàn)了教育對技術的需求和技術對教育的支持。
(三)人工智能技術成熟度模型中的應用趨勢分析
Hype Cycle技術成熟度曲線模型是由Gartner提出的一個應用廣泛的發(fā)展周期預測模型,模型描述了一項技術從誕生到成熟,再到廣泛應用的過程。作為近年科技領域的核心技術,Gartner連續(xù)三年發(fā)布了人工智能Hype Cycle成熟度曲線,對人工智能中的細分技術、應用領域、發(fā)展現(xiàn)狀等項目進行分析與預測,為研究人工智能技術的創(chuàng)新和發(fā)展路徑提供了評估標準和分析工具。
我們對2017-2019年Gartner的人工智能成熟度曲線模型進行了分析,重點篩選與“促進應用”相關的人工智能項目,結合教育領域應用,得到如下分析,如圖2所示。
1.人工智能的應用落地需要從專家支持、技術支持和基礎設施支持等維度展開探索,這些技術和服務正處于快速發(fā)展中。2017年AI咨詢及系統(tǒng)整合服務(AI-related C&SI Services,ACSI)在技術成熟度模型中提出,旨在從專業(yè)人員支持的角度,為具有人工智能應用需求的領域提供咨詢、軟件實施及相關服務。人工智能開發(fā)工具包從技術支持維度,人工智能云服務從基礎設施支持維度,分別在2018和2019技術成熟度曲線中提出,并迅速發(fā)展,為人工智能的落地應用提供支撐。人工智能開發(fā)工具包包括數(shù)據(jù)平臺、框架和分析庫、軟件開發(fā)包等,能夠支持人工智能應用程序的快速開發(fā)和部署。服務于人工智能的云服務為人工智能提供了硬件設施和算法軟件層面的服務支持,幫助各種類型的應用者能夠使用到人工智能所需的算力和算法。
2.人工智能中的機器學習和深度學習算法研究已經(jīng)相對成熟,已經(jīng)度過技術快速發(fā)展期的頂端,開始走向下降期,這個時期也是技術應用模式探索的關鍵時期。在應用的探索中,作為降低機器學習和深度學習技術門檻的有效方法,推動人工智能應用的AUTOML(自動化機器學習)在2019年得到迅速發(fā)展。
(四)研究評述
1.國內(nèi)教育人工智能的研究需加強對人工智能落地應用的研究。當前對于如何將人工智能應用于教育場景的系統(tǒng)設計、開發(fā)和實現(xiàn)等研究還較少,包括人工智能技術的技術門檻、教育領域?qū)I(yè)人工智能人才的缺乏、教育大數(shù)據(jù)的不足等。因此,需要我們探索有效的方法解決面臨的問題,推動教育領域人工智能的落地應用研究。
2.地平線報告研究重點從技術維度對教育領域內(nèi)人工智能的應用進行了分析,關注重點也在逐步擴散和全面,包含了學習支持、研究手段、教學工具、數(shù)據(jù)策略等方面。這也說明對教育人工智能的研究正在更多的關注實踐。在人工智能應用落地的技術支持上,Gartner人工智能成熟度模型中對人員支持、軟件支持、服務支持、云支持、自動化框架支持等的預測和分析,對于人工智能的落地應用有著重要的指導價值。
3.雖然“關注應用”是地平線報告的核心思想,也是技術成熟模型分析中的重要趨勢,但人工智能在教育領域中的應用研究還是薄弱環(huán)節(jié)?!叭绾翁剿饔行У慕逃斯ぶ悄芟到y(tǒng)的設計與應用方法”是需要解決的關鍵問題。本文旨在研究解決該問題、探索新的教育人工智能應用的設計模型與方法,為教育人工智能系統(tǒng)應用的開展和落地提供參考和借鑒。
三、教育人工智能應用系統(tǒng)的功能模塊與問題分析
(一)教育人工智能應用系統(tǒng)的功能模塊
在人工智能的發(fā)展過程中,有符號主義、連接主義和行為主義三個主要研究范式和學派。三種范式對智能的產(chǎn)生有著不同的解釋與設計思想,也影響著人工智能應用的技術手段與設計模式。當前教育人工智能領域主要使用機器學習和深度學習算法構建系統(tǒng)應用,是一種基于連接主義的智能模型?;谶B接主義模式的特點是:需要通過學習高維數(shù)據(jù)來獲取高層語義表達;產(chǎn)生的是黑盒模型,通常具有較高的準確性,但模型的內(nèi)部工作機制無法準確得知;難以估計每個特征對模型預測結果的重要性,以及不同特征之間的相互作用關系。
在大數(shù)據(jù)與超強算力的支撐下,機器學習、深度學習已在計算機視覺、語音識別、自然語言處理等方面達到甚至超過人類水平,是實現(xiàn)人工智能成功的重要推動力之一?;谶B接主義思想的教育人工智能系統(tǒng)的設計模型與過程如圖3所示,可以分為教育需求、教育數(shù)據(jù)、教育特征、教育模型、教育應用五個主要功能模塊。
1.問題定義與需求分析
問題定義與需求分析是教育人工智能系統(tǒng)開發(fā)的出發(fā)點。我們所要解決的教育問題和系統(tǒng)需求應當是人工智能可以解決的。人工智能應用于教育有其邊界與定位,并非所有的教育問題都適合使用人工智能來解決。只有在恰當?shù)慕逃龍鼍芭c教學需求下,人工智能技術的應用才能產(chǎn)生正向的教育效果。我們需要明確人工智能適合解決哪些任務,哪些教育問題和需求適合人工智能解決。Science對適合機器學習和深度學習任務進行了總結,給出了關鍵評判標準,如需要有明確定義的輸入和輸出;存在或能夠創(chuàng)建大規(guī)模數(shù)據(jù)集;任務能提供明確的反饋,具有明確的目標和指標;任務不需要依靠復雜背景知識的長邏輯鏈;允許容錯性,不需要最佳的解決方案;功能不會出現(xiàn)快速變化;沒有特別的靈巧性、身體技能或機動性要求等。這些標準在我們進行教育人工智能應用設計時可以進行借鑒和參考。在問題定義與需求分析階段,需要教育工作者和技術人員的共同參與。人工智能技術與教育應用場景是相輔相成的,需要綜合考量和分析人工智能技術的成熟度與教育場景的復雜度。
2.教育數(shù)據(jù)收集與處理
以深度學習為核心的人工智能算法需要大規(guī)模數(shù)據(jù)進行訓練能得到更好效果,基礎數(shù)據(jù)服務是教育人工智能應用和智能系統(tǒng)開發(fā)的支撐。教育數(shù)據(jù)服務的發(fā)展要推動建設教育數(shù)據(jù)資源庫、標準測試數(shù)據(jù)集、基礎數(shù)據(jù)平臺,并構建科學高效的數(shù)據(jù)管理機制。教育大數(shù)據(jù)來源包括Web數(shù)據(jù)、云端數(shù)據(jù)、可穿戴設備傳感器數(shù)據(jù)等多種來源的學生學習數(shù)據(jù)、行為數(shù)據(jù)、教學管理數(shù)據(jù)等。在教育數(shù)據(jù)的收集過程中,需要考慮以下問題:智能教育系統(tǒng)的實現(xiàn)需要哪些數(shù)據(jù)?數(shù)據(jù)的存儲形式和介質(zhì)是什么?獲取數(shù)據(jù)的成本和難易度如何?數(shù)據(jù)是否覆蓋了應用的大部分情境?數(shù)據(jù)是否具有較高的可信度?當前大部分教育數(shù)據(jù)還處于數(shù)據(jù)碎片化、規(guī)則模糊的階段,教育數(shù)據(jù)的采集和處理還存在技術處理方式、管理機制不成熟等問題。
3.教育特征選擇與構建
在人工智能領域,特征是指使用領域知識對原始數(shù)據(jù)進行分析,從中抽取和構建有效的信息應用于智能算法的設計。在機器學習中,特征對于整個機器學習模型至關重要,并且有時會確定其性能的上限。教育特征工程是將教育數(shù)據(jù)與人工智能連接在一起的橋梁,是保證人工智能模型是否與教育目標問題匹配的關鍵制約因素。教育特征的好壞也直接決定了教育智能系統(tǒng)算法的靈活性和效果。如Gardner等通過數(shù)據(jù)與文獻分析等,給出了慕課研究中的教育特征類型,包括:學習活動、人口學特征、文本特征、社會化、認知特征等,在此基礎上構建了慕課學習者成功性的預測模型。
當前機器學習系統(tǒng)主要采用傳統(tǒng)方法構建特征,通過個人的專業(yè)知識和經(jīng)驗構建最佳的特征。一般來說,這是一個繁瑣耗時且容易出錯的過程,造成了效果和效率的局限性,并且經(jīng)驗的局限性使得難以為預測目標確定最具代表性的特征。深度學習減少了對手工特征工程的需求,正在教育人工智能研究中應用越來越廣泛。
4.教育智能系統(tǒng)模型構建
人工智能教育應用的核心目標是通過機器學習的方式建立人類學習的規(guī)則,也即構建有效的智能模型。人工智能模型的構建包括模型訓練與模型評估。教育人工智能系統(tǒng)中的模型一般結合問題和數(shù)據(jù),大多選擇當前通用的、成熟的機器學習和深度學習模型。機器學習模型根據(jù)可使用的數(shù)據(jù)類型可分為監(jiān)督學習和無監(jiān)督學習兩類。監(jiān)督學習主要包括分類和回歸,無監(jiān)督學習主要包括數(shù)據(jù)聚類、數(shù)據(jù)降維等。常用的深度學習模型有卷積神經(jīng)網(wǎng)絡(CNN)、回歸神經(jīng)網(wǎng)絡(RNN)、深度信念網(wǎng)絡(DBN)等。在模型選擇后進行模型的評估,對模型的效率、正確率等進行評價,一般使用與訓練數(shù)據(jù)集進行模型訓練,并用不同的測試數(shù)據(jù)集進行模型驗證從而明確模型在現(xiàn)實系統(tǒng)中的表現(xiàn),最終給出應用模型。
5.模型部署與應用
在智能模型確定后,將其部署到實際的教育應用場景中。模型部署將訓練的模型持久化,提供REST服務接口、設備端SDK等部署方式。模型部署的方式由教育應用的實際需求決定,根據(jù)系統(tǒng)應用規(guī)模的大小、性能要求等來綜合確定。部署成功的模型即可進入到教育應用過程。
(二)教育人工智能應用系統(tǒng)的問題分析
結合對教育人工智能系統(tǒng)設計中主要功能模塊的分析,一個成功的教育人工智能系統(tǒng)需要高質(zhì)量的教育數(shù)據(jù)支持,優(yōu)秀的數(shù)據(jù)預處理;合適的特征構建,恰當?shù)哪P徒Y構和功能;優(yōu)秀的訓練策略,嚴格的結果分析與靈活的應用部署等。當前教育人工智能系統(tǒng)設計開發(fā)中面臨的主要困難還較多,造成了教育人工智能落地難、應用研究落后的現(xiàn)狀。
1.技術層面:特征與模型構建問題
教育領域應用場景對教育特征的構建與模型構建帶來具體的要求。通常情況下,特征工程是一項復雜耗時的工作,需要經(jīng)過特征構建、特征選擇、特征壓縮等多個步驟,并需要應用者具有領域?qū)I(yè)知識和數(shù)據(jù)分析能力。當前教育特征的構建工作主要還是由缺乏領域知識背景的技術人員完成,并且存在傳統(tǒng)特征構建的效率低,可移植性差問題。在智能模型的構建與優(yōu)化上,還沒有系統(tǒng)的方法進行模型選擇和參數(shù)調(diào)節(jié),基本是依靠人工調(diào)試和選擇,所構建的模型難以進行衡量與對比。
2.人員層面:人員與復雜度問題
教育人工智能系統(tǒng)的構建過程是一個相對復雜的過程,較高的技術門檻使得大量一線教師難以直接運用人工智能到實際教學場景中。并且人工智能不僅僅只是技術問題,更面臨復雜的教育領域的業(yè)務問題,需要多領域?qū)<覉F隊的合作參與,包括教學專家,數(shù)據(jù)工程師,算法工程師等,但教育領域匱乏的人才難以與教育大數(shù)據(jù)的快速發(fā)展與人工智能應用的要求相匹配。
3.成本層面:成本與效率問題
當前,構建優(yōu)良的教育智能系統(tǒng)通常需要較長的時間和較為昂貴的成本。智能系統(tǒng)對算法算力的要求,需要一定的成本進行軟硬件設備的購買與維護。在效率方面,即使是有經(jīng)驗的人工智能專業(yè)人員,通常也需要花費大量時間來構建合適的智能模型。如果目標、特征或數(shù)據(jù)發(fā)生變化,則系統(tǒng)的設計還需要重新進行。在教育領域,由于缺少成熟應用,以及領域人員與技術人員的割裂性,所以在成本與效率方面面臨著更嚴峻的問題。
四、基于自動化方法的教育人工智能應用系統(tǒng)設計
在教育領域評判一項技術的價值,除了能夠有效提升學習效果和教育系統(tǒng)功能外,技術是否具有普適性也是重要的方面。人工智能的快速發(fā)展與人工智能實際應用中面臨的矛盾,需要我們探索有效的方法解決設計與開發(fā)過程中面臨的技術、人員、復雜性等問題,在人工智能的設計過程中引入自動化方法是一個有效的途徑。
如何以智能來設計智能,如何利用已有的機器學習知識和算法使人工智能能夠?qū)崿F(xiàn)部分處理過程的自動化,從而自主搭建適合教育領域應用場景的系統(tǒng)模型,是教育人工智能應用系統(tǒng)值得探索的領域。
(一)基本思想
1.自動化
自動化的概念跟隨時代也在發(fā)展,從最初的機器代替人完成操作或復雜的任務等體力工作,到進一步代替或輔助人的腦力勞動,以自動地完成特定的任務。在人工智能環(huán)境下,以智能訓練智能,是自動化思想的新發(fā)展。自動化人工智能,如自動化機器學習和自動化深度學習,是將人工智能應用中需要專家人工參與的特征提取、模型選擇、參數(shù)調(diào)節(jié)、優(yōu)化評價等重要步驟進行自動化實現(xiàn),使得智能模型無需人工干預即可被構建并具有超過人類專家的優(yōu)勢。這是自動化方法在軟件工程和人工智能領域的應用和發(fā)展,是將人工智能算法應用于問題解決的自動化過程,是探索人工智能的一種新的研究方法。
2.人工智能即服務
“人工智能即服務”由谷歌公司最早提出,其目標是將人工智能的解決方案和計算能力以云服務的形式提供,使云平臺承載人工智能的軟硬件資源。使用者無需購買維護高成本硬件設備,無需學習復雜的算法和技術即可創(chuàng)建和使用智能應用。人工智能即服務為自動化人工智能的設計模式提供方向,自動化人工智能是人工智能即服務的重要應用形式。兩者的目標都是為了更有效的降低人工智能的門檻,提高人工智能應用的便利與效率。
(二)學習理論基礎
1.學習圈理論
讓機器產(chǎn)生智能進行自動化學習的過程與人類思考學習的過程類似。美國社會心理學家、教育家?guī)觳膶W習圈理論認為,人類的學習過程是由四個適應性學習階段構成的環(huán)形結構,包括具體經(jīng)驗,反思性觀察,抽象概念化和主動實踐,即通過經(jīng)驗反思得出理論,再用理論指導行動,進一步從行動中歸納經(jīng)驗。人們在學習的“經(jīng)驗、反思、啟示和行動”中達到學習的螺旋式循環(huán)進步,獲取知識。自動化人工智能方法借鑒了人類學習的思想,從經(jīng)驗的升華和理論化中去獲取知識,如下頁圖4所示。其中“具體經(jīng)驗”對應獲得教育數(shù)據(jù),自動構建教育特征;“反思觀察”是智能模型訓練的過程,形成的“抽象概念”是模型的構建,進行“實驗和實踐”則是模型應用的過程。自動化人工智能方法遵循了人類學習的基本規(guī)律,將人的思考學習過程應用于智能系統(tǒng)的流程設計。通過收集行為數(shù)據(jù),得到反饋數(shù)據(jù)并自動構建特征,進行模型的自動化訓練,然后將模型應用,模型應用后又可以收集數(shù)據(jù),開始新的學習。
2.元學習
元學習起源于認知科學領域,比格斯(1985)將元學習定義為“意識到并控制自己的學習”。在人類的學習中,每次學習無論成功失敗,我們都收獲一定的經(jīng)驗。人類之所以能夠快速學習的關鍵是人類具備學會學習的能力,能夠充分的利用以往的知識經(jīng)驗來指導新任務的學習。在構建自動化智能系統(tǒng)時,也應該考慮充分利用已有的每一次的學習經(jīng)驗,逐步改進,提升系統(tǒng)的有效性。在人工智能領域借鑒元學習的思想,使機器學習或深度學習算法“學會如何學習”,目標是設計出靈活的機器學習模型,它可以基于過去的經(jīng)驗與知識,通過少量的訓練樣本快速學會新概念和技能。元學習使機器具有學會學習的能力,從而在面對新的任務時,可以利用已有的知識來加速人工智能的學習速度。
(三)基于自動化方法的設計模型
1.模型結構
基于學習理論和自動化思想支持,我們設計新的教育人工智能應用系統(tǒng)模型如圖5所示。在模型中,在教育業(yè)務領域只需要給出明確的教育需求,將教育數(shù)據(jù)提交到基于云端的自動化處理模塊,即可完成數(shù)據(jù)清理、特征構建、模型構建、評估與優(yōu)化的過程。這個過程對用戶是透明的,由系統(tǒng)自動完成,并將得出的最優(yōu)化模型應用提供給用戶。
使用自動化模型方法,在教育領域,只需關注教育需求,給出教育數(shù)據(jù),中間的過程由自動化過程處理。其中,自動化特征工程改進了傳統(tǒng)手工特征工程的標準流程,從數(shù)據(jù)中自動構建新的候選特征,并選擇最佳的特征進行模型的訓練,使得模型可以有最優(yōu)的表現(xiàn)。這不僅減少了特征工程所花費的時間,還可以根據(jù)數(shù)據(jù)特征進行自動組合,有效解決了人為組合特征不全面問題,創(chuàng)建了可解釋的特征,并且比手動特征工程更高效,可重復性更高。自動化模型構建可以基于數(shù)據(jù)集與自動化特征工程構建的特征,選擇適用于該數(shù)據(jù)集的模型,對多個模型進行自動訓練和調(diào)整,并對訓練后的模型進行評估,輸出效果最佳的模型,從而實現(xiàn)人工智能工作的流程自動化。
自動化人工智能處理的整個過程,從導入數(shù)據(jù)到模型訓練,可以通過拖放式交互界面完成。這種易用性、便捷性有效擴展了教育人工智能的應用場景和范圍,使普通教育者也可以用人工智能技術解決現(xiàn)實中的教育問題,為缺少專業(yè)技術知識的人員快速的構建人工智能應用提供了有效途徑。同時也有效縮短了智能應用的開發(fā)周期,推動教育人工智能應用的快速開發(fā)與迭代。
2.自動化人工智能平臺
自動化人工智能平臺是自動化系統(tǒng)的核心部分,目前正處于建設和發(fā)展階段。在教育人工智能的研發(fā)過程中,選擇適當?shù)淖詣踊脚_進行系統(tǒng)設計與開發(fā)是有效提升教育產(chǎn)品研發(fā)效率和擴展教育產(chǎn)品功能模塊的方式。當前自動化平臺主要有兩類,一類是主要科技公司提供的自動化平臺支持,另一類為開源自動化平臺。這些平臺具有不同的特點,如表1所示。
在教育領域中自動化平臺選用的標準應首先要遵循人工智能開發(fā)的普適原則,包括公平、可靠、安全、隱私、透明、責任等,在此基礎上從教育系統(tǒng)的特點出發(fā),考慮以下應用原則。
(1)服務于教育目標的整體性規(guī)劃。教育人工智能系統(tǒng)的設計是一項系統(tǒng)工程,在進行自動化平臺應用時,應從教育人工智能系統(tǒng)的整體設計角度出發(fā)。自動化平臺是整個系統(tǒng)的一個組成部分,要在教育系統(tǒng)功能的問題分析與目標分析上,從教學角度、功能角度、技術角度、環(huán)境角度等方面進行綜合考量,服務于教育目標,服務于教育應用的整體環(huán)境。
(2)服務于功能性的多維度分析。在自動化方法應用上,需要進行充分的調(diào)研分析,明確系統(tǒng)的功能模塊??蓛?yōu)先選用現(xiàn)有成熟的技術模塊進行教育功能的實現(xiàn),并兼顧技術的成熟性和前瞻性。在擴展性上,可選用開源技術以保證后期的持續(xù)性。在界面支持上,可選用適當?shù)目梢暬С峙c交互支持。在標準化方面,盡量兼顧到教育系統(tǒng)標準、學習標準、平臺標準等標準規(guī)范。
五、案例應用研究
(一)研究背景分析
慕課的應用產(chǎn)生了海量數(shù)據(jù),為學習分析與人工智能研究提供了大數(shù)據(jù)基礎。在慕課系統(tǒng)中,論壇數(shù)據(jù)中包含了大量的學習者學習過程、學習評價和學習體驗數(shù)據(jù),是一種典型的文本類教育大數(shù)據(jù)。對論壇數(shù)據(jù)進行分析將為慕課教學和管理提供有效的支持。吳林靜等提出了慕課評論的語義分析模型,將慕課評論分為內(nèi)容相關類、情感相關類和其他類。Liu等提出了一個非監(jiān)督模型,通過對論壇文本數(shù)據(jù)的挖掘,分析了學習者關注的論壇主題及學習者在學習過程中的情感狀態(tài)。Lan等使用概率模型對慕課論壇中的主題進行了建模研究。這些研究對于論壇數(shù)據(jù)的處理是通過機器學習或深度學習算法實現(xiàn)與分析,需要具有一定的技術基礎,由慕課教師和技術人員的合作完成。