于旭明
(山東省菏澤市教育科學(xué)研究院 山東省菏澤市 274000)
人工智能的出現(xiàn),打破了各行各業(yè)的傳統(tǒng)運(yùn)行模式。教育行業(yè)在此過(guò)程中也在積極探索人工智能的應(yīng)用方法,提出新的教育模式,打造智能化教育時(shí)代[1]。由于教育人工智能研發(fā)時(shí)間比較短,所以尚未形成有效的教育人工智能系統(tǒng),如何打造一套較為完善的教育智能系統(tǒng)是當(dāng)前重點(diǎn)解決問(wèn)題[2-3]。自動(dòng)化是時(shí)代發(fā)展的重要標(biāo)志,采用自動(dòng)化控制,加快作業(yè)效率,實(shí)現(xiàn)機(jī)器學(xué)習(xí),這是教育人工智能系統(tǒng)開發(fā)的一個(gè)重要方向,本文嘗試從該方向入手,探究系統(tǒng)設(shè)計(jì)方案。
教育人工智能應(yīng)用系統(tǒng)開發(fā)功能包括教育需求、教育數(shù)據(jù)、教育特征、智能模型、教育應(yīng)用5 個(gè)模塊,主要根據(jù)教育工作開展需求,對(duì)相關(guān)數(shù)據(jù)信息進(jìn)行整理,從中挖掘重要信息,利用提取的教育特征信息,構(gòu)建智能教育模型,將其投入到教育工作中。如圖1所示為系統(tǒng)功能框架結(jié)構(gòu)。
圖1:系統(tǒng)功能框架結(jié)構(gòu)
教育需求:由教育工作者和相關(guān)技術(shù)人員負(fù)責(zé)相關(guān)工作,根據(jù)當(dāng)前教育工作開展要求,設(shè)定相關(guān)問(wèn)題,列出教育需求信息列表。
教育數(shù)據(jù):由教育工作者和相關(guān)技術(shù)人員負(fù)責(zé)相關(guān)工作,針對(duì)教育需求信息,收集與這些信息相關(guān)的教育數(shù)據(jù),采用數(shù)據(jù)處理技術(shù),完成數(shù)據(jù)的清理和轉(zhuǎn)換操作。
教育特征:由教育專家和相關(guān)技術(shù)人員負(fù)責(zé)相關(guān)工作,從整理好的數(shù)據(jù)信息中提取教育特征,同時(shí)構(gòu)建教育特征體系[4]。
智能模型:由相關(guān)技術(shù)人員負(fù)責(zé)相關(guān)工作,構(gòu)建智能模型,并加以訓(xùn)練處理,根據(jù)模型評(píng)估結(jié)果,對(duì)當(dāng)前模型設(shè)計(jì)方案進(jìn)行優(yōu)化,得到最佳模型。
教育應(yīng)用:由教育工作者和相關(guān)技術(shù)人員負(fù)責(zé)相關(guān)工作,將優(yōu)化后的模型投入到使用當(dāng)中,從而發(fā)揮教育智能系統(tǒng)的作用[5]。
目前,我國(guó)針對(duì)教育人工智能系統(tǒng)的開發(fā)投入了較多研究資金,并且鼓勵(lì)各大科研機(jī)構(gòu)參加此類項(xiàng)目的研究,雖然獲取了一些研究成果,但是仍然存在很多問(wèn)題。
(1)技術(shù)層面問(wèn)題:系統(tǒng)可移植性較差,依靠人工調(diào)試,根據(jù)作業(yè)需求選擇相應(yīng)作業(yè)模式等,這些操控技術(shù)很難滿足模型作用發(fā)揮需求。
(2)系統(tǒng)開發(fā)成本問(wèn)題:系統(tǒng)開發(fā)需要耗費(fèi)大量的資金,除了系統(tǒng)硬件與軟件相關(guān)設(shè)備的采購(gòu)與租賃,還包括運(yùn)行維護(hù)、人力資源等多項(xiàng)費(fèi)用。從當(dāng)前發(fā)展?fàn)顩r來(lái)看,系統(tǒng)開發(fā)及運(yùn)行費(fèi)用超出了預(yù)期范圍。
(3)系統(tǒng)開發(fā)復(fù)雜度問(wèn)題:參與系統(tǒng)開發(fā)的人員較多,涉及到多個(gè)領(lǐng)域?qū)<液凸ぷ魅藛T,為了保證各個(gè)環(huán)節(jié)的有效銜接,幾乎每一個(gè)環(huán)節(jié)都需要所有工作人員的參與,加大了系統(tǒng)開發(fā)的復(fù)雜程度。
(4)系統(tǒng)作業(yè)受限及效率問(wèn)題:目前開發(fā)的大部分系統(tǒng)僅支持當(dāng)前參數(shù)設(shè)置要求,如果變更數(shù)據(jù)或者教育特征,需要重新調(diào)整系統(tǒng)作業(yè)程序,同時(shí)根據(jù)需求更換一些硬件設(shè)備,導(dǎo)致系統(tǒng)應(yīng)用范圍受限。測(cè)試中發(fā)現(xiàn),系統(tǒng)作業(yè)效率較低,缺少成熟系統(tǒng)開發(fā)方案。
本文針對(duì)當(dāng)前教育人工智能系統(tǒng)開發(fā)存在的問(wèn)題,引入自動(dòng)化思想和人工智能思想,對(duì)教育人工智能系統(tǒng)進(jìn)行設(shè)計(jì)。
2.1.1 自動(dòng)化思想的植入
自動(dòng)化思想最初指的是利用機(jī)器代替人類勞動(dòng)的一種作業(yè)方式,隨著時(shí)代的不斷進(jìn)步,當(dāng)前已經(jīng)延伸至輔助人腦勞動(dòng),按照作業(yè)需求,自動(dòng)化下達(dá)作業(yè)命令,從而在規(guī)定時(shí)間內(nèi)完成相關(guān)工作。該環(huán)境下,強(qiáng)調(diào)人工智能訓(xùn)練,在專家的參與下,完成特征信息的提取、參數(shù)設(shè)置、作業(yè)效果評(píng)價(jià)、系統(tǒng)優(yōu)化等。因此,本文提出的新型教育人工智能系統(tǒng)以自動(dòng)化控制為核心,在無(wú)人干擾的情況下,就可以完成教育工作。
2.1.2 人工智能思想的植入
為了向用戶提供云服務(wù),加快問(wèn)題解決速度,谷歌公司提出了人工智能服務(wù)。該服務(wù)主要借助云平臺(tái),采用人工智能操作方法解決問(wèn)題,不需要為其配備硬件成本較高的維護(hù)設(shè)備。關(guān)于系統(tǒng)程序的開發(fā),在算法上也進(jìn)行了簡(jiǎn)化,大大降低了復(fù)雜程度。
本系統(tǒng)建立在自行化思想和學(xué)習(xí)理論基礎(chǔ)上,在云端對(duì)教育需求信息采取自動(dòng)化處理,而后生成特征模型,利用該模型實(shí)施各項(xiàng)教育工作,從而實(shí)現(xiàn)自動(dòng)化教育,提升教育工作效率。其中,模型訓(xùn)練是改善教育工作的關(guān)鍵,以數(shù)據(jù)特征為依據(jù),對(duì)教育信息采取自動(dòng)組合,創(chuàng)建可解釋特征。當(dāng)教育特征發(fā)生改變時(shí),自動(dòng)調(diào)整教育模型,從而提高系統(tǒng)作業(yè)效率,擴(kuò)大系統(tǒng)應(yīng)用條件范圍。如圖2所示為系統(tǒng)模型設(shè)計(jì)方案。
圖2:系統(tǒng)模型設(shè)計(jì)方案
該系統(tǒng)模型主要由5 部分構(gòu)成,分別是需求分析與問(wèn)題定義、教育數(shù)據(jù)、自動(dòng)化平臺(tái)、應(yīng)用接口、教育系統(tǒng)。其中,需求分析與問(wèn)題定義模塊,是智能教育信息的提取和問(wèn)題的總結(jié),作為系統(tǒng)運(yùn)行數(shù)據(jù)輸入端口。教育數(shù)據(jù)模塊,是從第一個(gè)版塊中提取關(guān)于教育工作開展的重要信息,作為信息提取和傳輸工具,將此部分信息發(fā)送至自動(dòng)化平臺(tái)。自動(dòng)化平臺(tái)模塊,是系統(tǒng)作業(yè)的核心模塊,在云端完成各項(xiàng)操作,這些操作均采取自動(dòng)化處理技術(shù),清理數(shù)據(jù)、創(chuàng)建特征工程、構(gòu)建自動(dòng)化教育模型、評(píng)估模型作用與性能。自動(dòng)化平臺(tái)與教育系統(tǒng)之間的通信連接,通過(guò)應(yīng)用接口建立,通過(guò)該接口將自動(dòng)化平臺(tái)作業(yè)狀況信息發(fā)送至教育系統(tǒng),根據(jù)教育特征的變化情況,由教育系統(tǒng)調(diào)整自動(dòng)化平臺(tái)作業(yè)參數(shù),在云端完成自動(dòng)化更新。
目前,關(guān)于系統(tǒng)運(yùn)行平臺(tái)的創(chuàng)建,尚未給出成熟的方案。目前,應(yīng)用比較多的系統(tǒng)開發(fā)平臺(tái)包括TPOT、H2O AutoML、Auto-Sklearn、Auto-Keras、阿里PAI、百度Easy DL、微軟Azure AutoML、谷歌Cloud ML。這些平臺(tái)采用的訓(xùn)練框架,支持的操作功能、作業(yè)模型存在一定差異,應(yīng)用場(chǎng)景較為豐富。本文從系統(tǒng)開發(fā)成本、應(yīng)用場(chǎng)景需求、模型訓(xùn)練框架等多個(gè)方面需求出發(fā),綜合對(duì)比之下,選擇H2O AutoML 平臺(tái)作為系統(tǒng)運(yùn)行平臺(tái),該平臺(tái)支持回歸/聚類/分類/深度神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建,開源免費(fèi),并且支持云平臺(tái)的文本交互,可以應(yīng)用到圖像分類、自然語(yǔ)言處理、文本分類中。
本系統(tǒng)利用H2O AutoML 平臺(tái)創(chuàng)建多維度系統(tǒng)作業(yè)功能模塊,按照如圖2所示的框架結(jié)構(gòu),搭建系統(tǒng)模型,在該平臺(tái)內(nèi)開發(fā)自動(dòng)化平臺(tái)。按照系統(tǒng)開發(fā)需求,在此平臺(tái)中創(chuàng)建自動(dòng)數(shù)據(jù)清理、自動(dòng)特征工程、自動(dòng)模型構(gòu)建、自動(dòng)模型評(píng)估4 個(gè)模塊。
本研究將系統(tǒng)應(yīng)用至慕課,通過(guò)收集關(guān)于慕課的大量數(shù)據(jù),為系統(tǒng)測(cè)試分析提供數(shù)據(jù)來(lái)源。其中,數(shù)據(jù)信息主要包括學(xué)習(xí)過(guò)程、學(xué)習(xí)體驗(yàn)、學(xué)習(xí)評(píng)價(jià)。本系統(tǒng)主要為慕課學(xué)習(xí)和討論提供便利條件。在助教和教師的幫助下,對(duì)不同類型文本數(shù)據(jù)進(jìn)行了標(biāo)注,形成4類信息,分別是個(gè)人感觸、學(xué)習(xí)評(píng)價(jià)、內(nèi)容目標(biāo)、課程問(wèn)題。
關(guān)于系統(tǒng)作業(yè)性能的測(cè)試指標(biāo)包括信息分類精度、分類召回率、分類準(zhǔn)確率、分類F 值(F1-Score)4 項(xiàng)。課程論壇數(shù)據(jù)大約5000 條,其中作為訓(xùn)練集部分占比80%,系統(tǒng)作業(yè)驗(yàn)證集數(shù)據(jù)占比10%,剩余10%數(shù)據(jù)作為評(píng)估數(shù)據(jù)支撐。將這些數(shù)據(jù)帶入本文創(chuàng)建的系統(tǒng)中,測(cè)得各項(xiàng)指標(biāo)結(jié)果如表1所示。目前開發(fā)的系統(tǒng)各項(xiàng)指標(biāo)均在70%左右,不存在超過(guò)80%情況,如果本系統(tǒng)測(cè)試結(jié)果在80%以上,則認(rèn)為本系統(tǒng)較以往開發(fā)的系統(tǒng)性能有所改善。
表1:系統(tǒng)測(cè)試結(jié)果
從上述3 組測(cè)試結(jié)果來(lái)看,本系統(tǒng)作業(yè)性能較傳統(tǒng)系統(tǒng)作業(yè)性能有所改善,各項(xiàng)指標(biāo)數(shù)值均為90%以上,其中分類準(zhǔn)確率達(dá)到了92%以上。當(dāng)教育特征發(fā)生改變時(shí),本系統(tǒng)支持自動(dòng)化操控,在無(wú)人干擾情況下自動(dòng)調(diào)整了相關(guān)作業(yè)配制,使得系統(tǒng)得以正常作業(yè),較以往得出的系統(tǒng)作業(yè)效率數(shù)值提升了23%左右,符合系統(tǒng)開發(fā)需求。
本文圍繞教育人工智能系統(tǒng)的開發(fā)展開探究,針對(duì)當(dāng)前系統(tǒng)開發(fā)存在的問(wèn)題,從作業(yè)效率、成本、應(yīng)用范圍等多個(gè)角度出發(fā),選擇自動(dòng)化技術(shù)作為系統(tǒng)開發(fā)工具,提出新的系統(tǒng)設(shè)計(jì)方案。測(cè)試結(jié)果顯示,系統(tǒng)信息分類精度、分類召回率、分類準(zhǔn)確率、分類F 值(F1-Score)4 項(xiàng)性能均有所提升,并且支持教育特征改變作業(yè),作業(yè)效率提升幅度在23%左右。