劉 鑫,楊 娟
(蘇州大學(xué) 教育學(xué)院,江蘇 蘇州 215123)
人工智能(Artificial Intelligence)始于20世紀(jì)50年代,隨著大數(shù)據(jù)的積聚、理論算法的革新、計(jì)算能力的提升,人工智能在很多應(yīng)用領(lǐng)域取得了突破性進(jìn)展,迎來(lái)了又一個(gè)繁榮時(shí)期。而機(jī)器學(xué)習(xí)(Machine Learning)是人工智能技術(shù)的核心,是一門(mén)涉及統(tǒng)計(jì)學(xué)、系統(tǒng)辨識(shí)、逼近理論、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理論、計(jì)算機(jī)科學(xué)、腦科學(xué)等諸多領(lǐng)域的交叉學(xué)科,研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類(lèi)的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能[1]。作為人工智能領(lǐng)域下的一個(gè)重要的分支,機(jī)器學(xué)習(xí)是使計(jì)算機(jī)具有智能的根本途徑。目前,有關(guān)機(jī)器學(xué)習(xí)在教育領(lǐng)域的相關(guān)研究還比較缺乏,因此有必要對(duì)機(jī)器學(xué)習(xí)在其它領(lǐng)域的研究現(xiàn)狀進(jìn)行分析,進(jìn)而對(duì)其在教育領(lǐng)域的應(yīng)用前景進(jìn)行一個(gè)有效的探究。
文獻(xiàn)計(jì)量方法是利用數(shù)學(xué)或統(tǒng)計(jì)學(xué)方法,對(duì)文獻(xiàn)的外部特征數(shù)量進(jìn)行描述,繼而對(duì)科學(xué)技術(shù)的現(xiàn)狀與發(fā)展趨勢(shì)進(jìn)行評(píng)價(jià)和預(yù)測(cè)的研究方法[2]。通過(guò)文獻(xiàn)的年代分布、研究主題分布等方面對(duì)所收集到的文獻(xiàn)進(jìn)行系統(tǒng)分析。
共詞分析就是將文獻(xiàn)主題詞作為分析對(duì)象,利用包容系數(shù)、聚類(lèi)分析等多種統(tǒng)計(jì)分析方法,把眾多分析對(duì)象之間錯(cuò)綜復(fù)雜的共詞網(wǎng)狀關(guān)系簡(jiǎn)化為以數(shù)值、圖形直觀地表示出來(lái)的過(guò)程[3]。
文章選取中國(guó)知網(wǎng)(CNKI)收錄期刊為數(shù)據(jù)分析來(lái)源,對(duì)檢索條件進(jìn)行設(shè)置,其中檢索主題為“機(jī)器學(xué)習(xí)”,檢索年限為2007—2017年,期刊的來(lái)源類(lèi)別為全部期刊。經(jīng)過(guò)初步檢索得到3 687條結(jié)果,除去“編者按”、“開(kāi)欄語(yǔ)”、“會(huì)議”及其它不適合用于可視化分析的文獻(xiàn),共得到有效文獻(xiàn)3 334篇。
將有效文獻(xiàn)以EndNote格式導(dǎo)出,并且將導(dǎo)出的數(shù)據(jù)通過(guò)SATI轉(zhuǎn)換成相應(yīng)的矩陣,再利用SPSS對(duì)矩陣數(shù)據(jù)進(jìn)行系統(tǒng)聚類(lèi)分析與多維尺度分析。
進(jìn)行聚類(lèi)分析之前,需要去除核心關(guān)鍵詞“機(jī)器學(xué)習(xí)”,在SATI矩陣行列顯示關(guān)鍵詞數(shù)量設(shè)置為31,得到所需的機(jī)器學(xué)習(xí)關(guān)鍵詞31×31的相似矩陣(Co-Occurrence Matrix (Similarity))的excel文件,將“機(jī)器學(xué)習(xí)”所在的行列值進(jìn)行刪除。再將相似矩陣導(dǎo)入SPSS21.0中,采用“分析—分類(lèi)—系統(tǒng)聚類(lèi)”方法進(jìn)行聚類(lèi)分析,得到機(jī)器學(xué)習(xí)關(guān)鍵詞共詞聚類(lèi)樹(shù)狀圖,見(jiàn)圖1。
圖1 機(jī)器學(xué)習(xí)領(lǐng)域關(guān)鍵詞聚類(lèi)圖
通過(guò)聚類(lèi)圖可以將機(jī)器學(xué)習(xí)領(lǐng)域的關(guān)鍵詞劃分為以下幾個(gè)部分:分組1包括人工智能、學(xué)習(xí)(人工智能)領(lǐng)域、AI和算法;分組2包括數(shù)據(jù)挖掘、大數(shù)據(jù)分類(lèi)、半監(jiān)督學(xué)習(xí)和預(yù)測(cè);分組3包括深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)、遺傳算法、人工神經(jīng)網(wǎng)絡(luò)、入侵檢測(cè)、神經(jīng)網(wǎng)絡(luò)支持向量機(jī)、決策樹(shù)和隨機(jī)森林;分組4包括集成學(xué)習(xí)、流量分類(lèi)、情感分析、情感分類(lèi)和特征選擇;分組5包括自然語(yǔ)言處理、信息抽取、特征提取、模式識(shí)別、文本分類(lèi)和SVM。
根據(jù)關(guān)鍵詞聚類(lèi)圖的分析結(jié)果對(duì)多維尺度分析圖進(jìn)行描繪,可以進(jìn)一步得到深度學(xué)習(xí)研究熱點(diǎn)的知識(shí)圖譜。多維尺度分析是通過(guò)利用二維平面空間中點(diǎn)(對(duì)象)的距離反映研究個(gè)體(高頻關(guān)鍵詞)間的相似性或差異性,也能反映出相關(guān)研究領(lǐng)域的內(nèi)部聚合度[4]。將30×30關(guān)鍵詞相異矩陣導(dǎo)入SPSS21.0,利用方法“分析—度量—多維尺度(ALSCAI)”對(duì)相異矩陣進(jìn)行分析處理,得到機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)知識(shí)圖譜,見(jiàn)圖2。
圖2 機(jī)器學(xué)習(xí)領(lǐng)域研究熱點(diǎn)知識(shí)圖譜
通過(guò)結(jié)合圖1中機(jī)器學(xué)習(xí)關(guān)鍵詞聚類(lèi)圖和圖2中多維尺度分析所得的Euclidean距離模型散點(diǎn)圖,可將機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)概括為以下四個(gè)領(lǐng)域,具體為研究領(lǐng)域1:人工智能相關(guān)研究;領(lǐng)域2:大數(shù)據(jù)相關(guān)研究;領(lǐng)域3:機(jī)器學(xué)習(xí)相關(guān)算法及深度學(xué)習(xí);領(lǐng)域4:機(jī)器學(xué)習(xí)實(shí)際相關(guān)應(yīng)用。
從關(guān)鍵詞“人工智能”、這不也是“人工智能”嗎?等可以看出,領(lǐng)域1主要是與人工智能相關(guān)的研究,包括對(duì)于人工智能的相關(guān)研究概述以及在各個(gè)領(lǐng)域應(yīng)用現(xiàn)狀等。
從關(guān)鍵詞“大數(shù)據(jù)”、“數(shù)據(jù)挖掘”和“預(yù)測(cè)”等不難看出,領(lǐng)域2主要是在大數(shù)據(jù)背景下,利用機(jī)器學(xué)習(xí)對(duì)大量且繁雜的數(shù)據(jù)進(jìn)行挖掘,通過(guò)統(tǒng)計(jì)、在線分析處理、情報(bào)檢索、模式識(shí)別等諸多方法來(lái)實(shí)現(xiàn)從大量的數(shù)據(jù)中通過(guò)算法搜索隱藏于其中的信息以及將實(shí)例數(shù)據(jù)劃到合適的類(lèi)別中。
從關(guān)鍵詞“算法”、“神經(jīng)網(wǎng)絡(luò)”和“深度學(xué)習(xí)”等可以看出,領(lǐng)域3是關(guān)于機(jī)器學(xué)習(xí)的相關(guān)算法研究以及基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)的應(yīng)用發(fā)展。
從關(guān)鍵詞“特征提取”、“情感分析”和“文本分類(lèi)”等可以看出,領(lǐng)域4是關(guān)于機(jī)器學(xué)習(xí)在實(shí)際中具體應(yīng)用的相關(guān)研究,通過(guò)特征提取、特征選擇等手段,對(duì)文本進(jìn)行分類(lèi)和分析。
通過(guò)對(duì)機(jī)器學(xué)習(xí)總體的現(xiàn)狀研究有了一個(gè)了解后,可以看出機(jī)器學(xué)習(xí)目前在大多數(shù)領(lǐng)域的應(yīng)用是比較廣泛的,從這些已經(jīng)有了成熟應(yīng)用的領(lǐng)域中,可以預(yù)見(jiàn)機(jī)器學(xué)習(xí)在教育領(lǐng)域的應(yīng)用前景。
機(jī)器學(xué)習(xí)是人工智能的核心,而人工智能相關(guān)產(chǎn)品的推廣和應(yīng)用也是機(jī)器學(xué)習(xí)發(fā)展的重要體現(xiàn)之一?;谌斯ぶ悄艿南嚓P(guān)產(chǎn)品在教育領(lǐng)域中的應(yīng)用已經(jīng)有了不少?lài)L試,并且取得了不錯(cuò)的教學(xué)效果。
人工智能技術(shù)推動(dòng)了個(gè)性化教育從理念走向?qū)嵺`,在教育各場(chǎng)景中常態(tài)化應(yīng)用了科大訊飛的智能教學(xué)、智能學(xué)習(xí)和智能管理系統(tǒng),從而形成了一系列典型特色的人工智能教育應(yīng)用案例[5]。人工智能時(shí)代的來(lái)臨,不僅將改變學(xué)校教育的目標(biāo),也為實(shí)現(xiàn)新的教學(xué)形態(tài)提供了可能,這些體現(xiàn)到學(xué)習(xí)空間上,就是一些新的特征將得以凸顯,即人工智能時(shí)代的學(xué)習(xí)空間變革[6]。學(xué)習(xí)空間的設(shè)計(jì)在原有基礎(chǔ)上要凸顯出層次性、多樣性和協(xié)同性,比如在空間規(guī)劃方面可以參考AltSchool的學(xué)習(xí)空間布局,還有各種智能技術(shù)的有機(jī)整合等。TensorFlow等開(kāi)源人工智能系統(tǒng)為推動(dòng)教育人工智能的研究與應(yīng)用提供了新的思路和方法,其在教育領(lǐng)域可應(yīng)用于教育大數(shù)據(jù)分析、學(xué)習(xí)推薦系統(tǒng)、教學(xué)游戲和教育機(jī)器人等方面,助力智能教學(xué)應(yīng)用的設(shè)計(jì)與實(shí)現(xiàn)[7]。除此之外,人工智能在學(xué)校管理、校園安全、課堂管理、智能助教、自動(dòng)閱卷和自適應(yīng)教學(xué)等方面都有發(fā)揮作用。隨著機(jī)器學(xué)習(xí)的不斷發(fā)展,人工智能技術(shù)也會(huì)更加成熟,其在教育領(lǐng)域的應(yīng)用也會(huì)更加多樣化。
在日常生活中,無(wú)時(shí)無(wú)刻不在產(chǎn)生數(shù)據(jù),如何挖掘數(shù)據(jù)背后隱藏的知識(shí)信息并高效地利用,已成為各行各業(yè)考慮的一個(gè)重要因素。對(duì)教育過(guò)程中生成的大量數(shù)據(jù)進(jìn)行分析與探究,已經(jīng)成為當(dāng)前教育研究的熱點(diǎn)和趨勢(shì)。在此背景下,教育數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。
教育數(shù)據(jù)挖掘是匯集教育學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)等多學(xué)科知識(shí),能夠從海量教育數(shù)據(jù)中挖掘出蘊(yùn)藏的信息規(guī)律和數(shù)據(jù)價(jià)值[8]。通常教育數(shù)據(jù)挖掘的主要流程包括數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘和結(jié)果分析四個(gè)步驟,其中數(shù)據(jù)挖掘是整個(gè)過(guò)程的核心,主要運(yùn)用統(tǒng)計(jì)分析、人工智能、機(jī)器學(xué)習(xí)等方法,從學(xué)習(xí)者產(chǎn)生的大量的數(shù)據(jù)中挖掘出內(nèi)隱的、有價(jià)值的信息的過(guò)程[9]。通過(guò)數(shù)據(jù)挖掘技術(shù)能夠幫助課程管理者和教師分析學(xué)生的學(xué)習(xí)行為,刻畫(huà)學(xué)習(xí)者的學(xué)習(xí)風(fēng)格與學(xué)習(xí)肖像,為學(xué)生提供學(xué)習(xí)建議,從而能夠改善和提升課程教育質(zhì)量,預(yù)測(cè)學(xué)習(xí)者未來(lái)的學(xué)習(xí)趨勢(shì)。在當(dāng)今的遠(yuǎn)程網(wǎng)絡(luò)教學(xué)和混合學(xué)習(xí)中,教育數(shù)據(jù)挖掘技術(shù)能夠?yàn)閷W(xué)習(xí)者的個(gè)性化及自適應(yīng)學(xué)習(xí)提供有力的數(shù)據(jù)支持。
在教育領(lǐng)域深度學(xué)習(xí)已經(jīng)不再是一個(gè)陌生的名詞,信息時(shí)代把人們以前應(yīng)該重視但被忽略了的思考與實(shí)踐凸顯了出來(lái)。近年來(lái),隨著機(jī)器學(xué)習(xí)研究的不斷深入,深度學(xué)習(xí)作為人工智能領(lǐng)域中機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)新興研究方向,逐漸成為廣大研究者關(guān)注的焦點(diǎn)。深度學(xué)習(xí)架構(gòu)由多層非線性運(yùn)算單元組成,每個(gè)較低層的輸出作為更高層的輸入,可以從大量輸入數(shù)據(jù)中學(xué)習(xí)有效的特征表示[10]。2017年新媒體聯(lián)盟《地平線報(bào)告》(基礎(chǔ)教育版)中指出,深度學(xué)習(xí)策略在未來(lái)五年甚至更長(zhǎng)時(shí)間里都將是驅(qū)動(dòng)基礎(chǔ)教育應(yīng)用技術(shù)的關(guān)鍵要素[11]。
在當(dāng)今互聯(lián)網(wǎng)迅速發(fā)展的時(shí)代,碎片化、泛在學(xué)習(xí)、移動(dòng)學(xué)習(xí)等方式普遍受到了人們的關(guān)注,但是這些途徑獲得的知識(shí)往往是孤立的、雜亂的和被動(dòng)的,僅僅停留在淺層學(xué)習(xí)的層次。借鑒機(jī)器學(xué)習(xí)領(lǐng)域的深度學(xué)習(xí)理念,深度學(xué)習(xí)要求不僅僅只注重淺層次的知識(shí)學(xué)習(xí),要以淺層次的知識(shí)作為深層次內(nèi)容的輸入,從而有效掌握相關(guān)知識(shí)的深層表征。深度學(xué)習(xí)是在理解學(xué)習(xí)的基礎(chǔ)上,學(xué)習(xí)者能夠批判性地學(xué)習(xí)新的思想和事實(shí),并將它們?nèi)谌朐械恼J(rèn)知結(jié)構(gòu)中,能夠在眾多思想間進(jìn)行聯(lián)系,并能夠?qū)⒁延械闹R(shí)遷移到新的情境中,做出決策和解決問(wèn)題的學(xué)習(xí)[11]。那么機(jī)器學(xué)習(xí)或人工智能技術(shù)能否有效地促進(jìn)學(xué)生從淺層學(xué)習(xí)向深度學(xué)習(xí)過(guò)渡?研究者們進(jìn)行了大量的探究,如顧小清教授及其團(tuán)隊(duì)嘗試用“語(yǔ)義圖示工具模型”引發(fā)學(xué)生進(jìn)行深度學(xué)習(xí)[12],安富海教授基于我國(guó)目前中小學(xué)課堂學(xué)習(xí)的現(xiàn)狀提出了一系列促進(jìn)深度學(xué)習(xí)的教學(xué)策略,還有一些研究者通過(guò)改變翻轉(zhuǎn)課堂設(shè)計(jì)形式促進(jìn)學(xué)生的高級(jí)思維能力和創(chuàng)造力的發(fā)展等等,這些實(shí)踐都說(shuō)明了如何有效地促進(jìn)學(xué)習(xí)者深度學(xué)習(xí)是研究者們一直追求的目標(biāo)之一。
作為機(jī)器學(xué)習(xí)實(shí)際應(yīng)用中非常重要的兩個(gè)方面,通過(guò)對(duì)文本和圖像的特征提取以及情感分析,在教育領(lǐng)域中有著非常強(qiáng)大的實(shí)用性??梢岳迷诰€學(xué)習(xí)過(guò)程中學(xué)習(xí)者學(xué)習(xí)活動(dòng)所產(chǎn)生的大量數(shù)據(jù)對(duì)學(xué)習(xí)者產(chǎn)生形成性評(píng)價(jià)。首先基于認(rèn)知思維的要求作為在線學(xué)習(xí)的目標(biāo)分類(lèi),通過(guò)自動(dòng)分類(lèi)算法進(jìn)行聚類(lèi)分析區(qū)分學(xué)習(xí)者的應(yīng)用能力層次,在此基礎(chǔ)上,為提高數(shù)據(jù)的處理效率,加快對(duì)學(xué)習(xí)者的評(píng)價(jià),再采用三層自動(dòng)編碼器的神經(jīng)網(wǎng)絡(luò)降維提取關(guān)鍵特征,然后利用訓(xùn)練集中的數(shù)據(jù)訓(xùn)練學(xué)習(xí)器,并利用集成學(xué)習(xí)機(jī)制綜合單個(gè)學(xué)習(xí)器的結(jié)果,得到更為準(zhǔn)確的評(píng)價(jià)結(jié)果。由于多媒體畫(huà)面圖像的情感依賴(lài)學(xué)習(xí)者的主觀感受,主觀性很強(qiáng),利用計(jì)算機(jī)對(duì)多媒體畫(huà)面圖像的情感進(jìn)行自動(dòng)估計(jì),可以避免主觀性評(píng)價(jià)的片面性,實(shí)現(xiàn)對(duì)多媒體畫(huà)面圖像情感的大數(shù)據(jù)分析。
不論是線下學(xué)習(xí)還是線上學(xué)習(xí),都可以通過(guò)對(duì)學(xué)習(xí)者學(xué)習(xí)過(guò)程中產(chǎn)生的文本內(nèi)容和影像內(nèi)容進(jìn)行分析。通過(guò)對(duì)相應(yīng)文本和影像進(jìn)行特征提取,就可以對(duì)學(xué)習(xí)者的學(xué)習(xí)投入度、學(xué)習(xí)效果以及學(xué)習(xí)滿(mǎn)意度等做出相應(yīng)判斷,對(duì)學(xué)習(xí)者在整個(gè)學(xué)習(xí)過(guò)程中的學(xué)習(xí)情緒和狀態(tài)也能有一個(gè)清晰認(rèn)知。這些對(duì)于教學(xué)者對(duì)課程教學(xué)有效度的判斷、教學(xué)設(shè)計(jì)和教學(xué)方法的改進(jìn)都有很大的幫助。
首先,通過(guò)對(duì)機(jī)器學(xué)習(xí)近十年研究現(xiàn)狀進(jìn)行了分析,在此基礎(chǔ)上,對(duì)機(jī)器學(xué)習(xí)在教育領(lǐng)域的應(yīng)用前景做出了進(jìn)一步的探討研究,盡管上述幾個(gè)方面在當(dāng)前教育領(lǐng)域中有所涉獵,但是相較于其在計(jì)算機(jī)科學(xué)、商業(yè)等領(lǐng)域的應(yīng)用現(xiàn)狀來(lái)說(shuō)還是有一定差距的。無(wú)論是在理論認(rèn)知還是在實(shí)踐應(yīng)用方面,機(jī)器學(xué)習(xí)在教育領(lǐng)域的應(yīng)用都還有很大的發(fā)展空間。為了實(shí)現(xiàn)教育的信息化和智慧化,有必要提高對(duì)機(jī)器學(xué)習(xí)的重視,促進(jìn)機(jī)器學(xué)習(xí)在教育領(lǐng)域的實(shí)踐應(yīng)用。