張殿尉
(1.北京師范大學,北京 100875;2.河北對外經(jīng)貿(mào)職業(yè)學院,河北 秦皇島 066311)
2019年8月1日上午,北京師范大學校長董奇在2019人工智能與教育大數(shù)據(jù)峰會上做了題為“面向未來的智能化教育評價”的主題報告。他指出,隨著科技的進步和時代的發(fā)展,教育評價需要被重新賦能,使其能更好的反映出“五育并舉”的全面發(fā)展理念,積極推動素質(zhì)教育的實施。他從教育評價的目標、理念、功能、對象、信息源、任務、方式及結果反饋等層面分析了智能化教育評價的新趨勢,并介紹了智能化教育評價在情緒情感、社會技能、語言表達能力、信息素養(yǎng)、科學素養(yǎng)等方面的新進展[1]。
截至目前,歷史上共出現(xiàn)了4代教育評價體系,分別是測量、描述、判斷和建構,不同時代有不同內(nèi)涵,其方式也各有側重。大數(shù)據(jù)、云技術、教育現(xiàn)實呼喚著智能化教育評價政策的落地與方法的實施。而關于“智能化教育評價”究竟經(jīng)歷了怎樣的發(fā)展軌跡?什么契機促進了它的發(fā)展?當前研究的熱點和前沿是什么?筆者借助知識可視化技術對此進行探討,以期發(fā)現(xiàn)新線索,并為國內(nèi)研究學者在該領域研究提供有益啟示。
本文采用以引文分析和信息可視化技術為基礎的科學知識圖譜的方法,所用的工具選取美國德雷塞爾大學信息科學與技術學院陳超美博士開發(fā)的CiteSpace軟件(版本為CiteSpaceV),形象地展示出“智能化教育評價”領域研究的演進路徑、研究熱點與研究前沿[2]。
以Web of Science數(shù)據(jù)庫中的全部6個子庫(WoS核心合集、中國科學引文數(shù)據(jù)庫、KCIKorean Journal Database、Medline、Russian Science Citation Index和Scielo Citation Index)為數(shù)據(jù)來源,檢索策略為“主題 =Intelligent Education Evaluation”,時間跨度默認為所有年份,即1900—2019年,共檢索出806條論文記錄(檢索時間為2019年9月21日)。筆者考查該文獻數(shù)據(jù)集的出版時間分布,發(fā)現(xiàn)第1篇主題相關論文的發(fā)表時間為1934年,故選取1934—2019年的文獻數(shù)據(jù)做“智能化教育評價”領域的演進路徑分析。
筆者將1934—2019年所發(fā)表的以“智能化教育評價”為主題的806篇論文的全部data(包括標題、關鍵詞、摘要、參考文獻等)導入CiteSpace軟件中。時間分區(qū)設為每1年一個分區(qū)。分析節(jié)點選擇“reference”,默認調(diào)節(jié)閾值。運行軟件,首先可得到“智能化教育評價”研究共被引網(wǎng)絡分布圖,借此可析出關鍵節(jié)點文獻;其次,將主題詞設置為名詞短語(noun phrase)和“突變”詞(burst terms)2種,將其來源(terms sources)設置為標題(title)、摘要(abstract)、關鍵詞(keywords)、附加關鍵詞(keywords plus)[3]。借名詞短語和“突變”詞可析出“智能化教育評價”領域的研究熱點、研究前沿和發(fā)展趨勢。
通過生成圖譜發(fā)現(xiàn),相關文獻最早出現(xiàn)于2011年, 共 9篇;2012年 7篇;2013年 4篇;2014年 20篇;2015年 16篇;2016年 24篇;2017年22篇;2018年5篇;2019年1篇。共108篇,中心相關性文章37篇,相關度從0.01~0.29不等?!爸悄芑逃u價”領域的研究經(jīng)歷2014—2017年井噴式發(fā)展后開始逐漸呈劇烈下降趨勢。
時區(qū)視圖(time zone)顯示方式突出共引網(wǎng)絡節(jié)點隨時間變化的結構關系。運行軟件得到“智能化教育評價”領域文獻共引網(wǎng)絡節(jié)點的時區(qū)視圖(見圖1),中心性≥0.16的7篇關鍵節(jié)點文獻的詳細信息見表1、2,表2是經(jīng)過查詢WoS獲得。
圖1 “智能化教育評價”領域共引網(wǎng)絡節(jié)點時區(qū)視圖
綜合圖1和表1、2,按照時間順序分析這7篇關鍵節(jié)點文獻,可梳理出“智能化教育評價”研究的演進路徑。
第1篇 文 獻 是2014年,Srivastava,Nitish,Hinton, Geoffrey,Krizhevsky, Alex等人發(fā)表在《機器學習研究雜志》 (Journal of Machine Learning Research)上的《中止:一種防止神經(jīng)網(wǎng)絡過度擬合的簡單方法》(Dropout: A Simple Way to Prevent Neural Networks from Overfitting)一文。該文認為,過度擬合在強大的具有大量參數(shù)的深層神經(jīng)網(wǎng)絡機器學習系統(tǒng)中是一個亟待解決的嚴重問題。由于大型網(wǎng)絡使用速度過慢,即使在測試時將許多不同大型神經(jīng)網(wǎng)絡的預測組合起來,過度擬合問題也很難解決?!爸型就V埂笔墙鉀Q這個問題的一種技巧。關鍵是在訓練過程中從神經(jīng)網(wǎng)絡中隨機刪除單元(以及它們的連接)。這就防止了單元的過于適應問題。在訓練過程中,從指數(shù)級的不同“細化”網(wǎng)絡中剔除樣本。這大大減少了過度擬合,并比正統(tǒng)化方法有了更大進展。研究表明,中止提高了神經(jīng)網(wǎng)絡在視覺、語音識別、文檔分類和計算生物學等領域的具備監(jiān)督學習任務中的性能,在許多基準數(shù)據(jù)集上獲得了最新的結果[4]。
第2篇文獻是2014年,Da Silva, Per Goncalves,Ilic, Dejan,Karnouskos,Stamatis等人發(fā)表在《工業(yè)電子工程公司智能電網(wǎng)》(Ieee T Smart Grid)雜志上的《智能電網(wǎng)用戶分組對預測精度的影響及其對當?shù)仉娏κ袌鼋灰椎男б妗罚═he Impact of Smart Grid Prosumer Grouping on Forecasting Accuracy and Its Benefits for Local Electricity Market Trading)一文。該文基于Seasonal-Nave和holtwinters算法,選取一個團隊參與市場的個案,研究了群規(guī)模與預測精度之間的關系,以及預測誤差對由消費者和“散戶”組成的日內(nèi)本地電力市場交易的影響;得出了“創(chuàng)建組”這一策略即使面對不可預測的個人市場,也可以降低其成本,減少預測誤差[5]。
第3篇文獻是2015年,Chitsaz,Hamed, Shaker,Hamid, Zareipour, Hamidreza等人發(fā)表在《能源建筑》(Energ Buildings)雜志上的《微網(wǎng)建筑物短期電力負荷預測》(Short-term electricity load forecasting of buildings in microgrids)。該文認為,電力負荷預測是電力系統(tǒng)運行的關鍵。隨著分布式和可再生能源發(fā)電在許多國家的普及,微電網(wǎng)的短期負荷預測也成為一項重要的任務。微電網(wǎng)可以加強對可再生資源和常規(guī)資源的管理,提高與電力市場的能源交易經(jīng)濟性。由于微電網(wǎng)負荷時間序列具有高度的非平穩(wěn)性和波動性,其stlf甚至比電力系統(tǒng)的stlf更為復雜。為此,該文提出了一種新的預測方法,即采用自回歸小波神經(jīng)網(wǎng)絡(srwnn)作為預測引擎,實現(xiàn)了levenberg-marquardt(lm)學習算法,并對其進行了自適應訓練。作者在一個微網(wǎng)格中對一個教學樓的實際小時數(shù)據(jù)進行了檢驗。并與其它負荷預測方法進行了比較,驗證了所提方法的有效性[6]。
第4篇文獻是2016年,Chou, Jui-Sheng,Ngo,Ngoc-Tri等人發(fā)表在《應用能源》(Appl Energ)雜志上的《基于滑動窗口元啟發(fā)式優(yōu)化的時間序列分析機器學習系統(tǒng)識別建筑能耗模式》(Time series analytics using sliding window metaheuristic optimization-based machine learning system for identifying building energy consumption patterns)。該研究開發(fā)了一個新的基于時間序列滑動窗口元啟發(fā)式優(yōu)化的機器學習系統(tǒng),提出了一種基于滑動窗口的時間序列預測方法,用于預測智能電網(wǎng)收集到的實時建筑能耗數(shù)據(jù)。此種方法可以使終端用戶進一步預測信息,尤其是在高峰時期提高能源利用效率,潛在地擴大大數(shù)據(jù)在預測建筑能耗中的作用,從而降低建筑能耗[7]。
第5篇文獻是2017年,Liu Weibo, Wang Zidong,Liu Xiaohui等發(fā)表在《神經(jīng)計算》(Neurocomputing)雜志上的《深層神經(jīng)網(wǎng)絡結構及其應用綜述》(A survey of deep neural network architectures and their applications)。該文討論了廣泛應用的深度學習結構及其實際應用;介紹了4種深度學習結構,即自動編碼器、卷積神經(jīng)網(wǎng)絡、深度信念網(wǎng)絡和限制玻爾茲曼機;綜述了不同類型的深層神經(jīng)網(wǎng)絡,總結了近年來的研究進展;重點介紹了深度學習技術在語音識別、模式識別和計算機視覺等領域的應用[8]。
第6篇文獻是2018年,Zhang Qingchen,Chen Zhikui等人發(fā)表在《信息融合》(Inform Fusion)雜志上的《大數(shù)據(jù)深度學習調(diào)查》(A survey on deep learning for big data)。該文認為,深度學習作為目前最引人注目的機器學習技術之一,在圖像分析、語音識別和文本理解等領域取得了巨大的成功。它使用有監(jiān)督和無監(jiān)督的策略來展現(xiàn)學習層次結構中的多級表示和特征,以完成分類和模式識別任務。傳感器網(wǎng)絡和通信技術的最新發(fā)展使大數(shù)據(jù)的收集成為可能。雖然大數(shù)據(jù)為電子商務、工業(yè)控制、智能醫(yī)療等領域提供了巨大的發(fā)展機遇,但由于其海量、多樣、速度快、準確性高等特點,給數(shù)據(jù)挖掘和信息處理帶來了諸多挑戰(zhàn)。近年來,深度學習在大數(shù)據(jù)分析解決方案中發(fā)揮了重要作用。該文綜述了基于大數(shù)據(jù)特征的深度學習模型的研究進展,并指出了大數(shù)據(jù)深度學習的挑戰(zhàn)[9]。
表1 “智能化教育評價”研究的7篇關鍵節(jié)點文獻(按中心性排序)
表2 “智能化教育評價”研究的7篇關鍵節(jié)點文獻詳情、頻次與中心性(按時間排序)
第7篇文獻是2019年,Kong Weicong,Dong Zhao Yang,Jia Youwei等人發(fā)表在《工業(yè)電子工程公司智能電網(wǎng)》(Ieee T Smart Grid)雜志上的《基于LSTM遞歸神經(jīng)網(wǎng)絡的短期住宅負荷預測》(Short-Term Residential Load Forecasting Based on LSTM Recurrent Neural Network)。該文認為,隨著電力系統(tǒng)正面臨向更智能、更靈活、更互動的系統(tǒng)過渡,可再生能源發(fā)電、負荷預測、電力市場化的趨勢日益明顯;特別是對單個電力用戶的短期負荷預測在未來電網(wǎng)規(guī)劃和運行中發(fā)揮著越來越重要的作用。除了大規(guī)模的住宅總負荷外,由于涉及到高波動性和不確定性,預測單一能源用戶的電力負荷相當具有挑戰(zhàn)性。該文提出了一種基于長-短期記憶(lstm)遞歸神經(jīng)網(wǎng)絡的框架來解決這一棘手問題,該框架是最新也是最流行的深度學習技術之一。所提出的架構基于一組可公開獲取的真實住宅智能電表數(shù)據(jù)測試,作者把該組數(shù)據(jù)的性能與各種基準(包括負荷預測領域的最新技術)進行了全面比較。結果表明,該文提出的lstm方法在居民家庭短期負荷預測方面優(yōu)于其它同類算法[10]。
1)利用CiteSpaceV的術語自動聚類功能,確定“智能化教育評價”研究的主要領域和研究熱點,共發(fā)現(xiàn)7大明顯聚類(見圖2):分別是地理人工智能應用(geoai application),智能適應自 動 化(intelligent adaptive automation), 遠 程教育(distance education),基于物聯(lián)網(wǎng)的智能家居(iot-based smart home),基于深度學習的社會人口信息識別(deep learning-based sociodemographic information identification), 研 究方法(research approaches),監(jiān)督能量分解模型(supervised energy disaggregation model)。
圖2 “智能化教育評價”領域研究聚類圖譜
2)按照常規(guī)模式勾選Burst Terms,則可以析出“智能化教育評價”領域研究前沿。
圖3 “智能化教育評價”領域突變詞語圖譜
選 擇 export—network summary table將其 展開,“智能化教育評價”研究前沿見圖4。
圖4 “智能化教育評價”領域突變詞語圖譜展開圖
筆者結合圖3和圖4,整理出變化頻次最高的18個突現(xiàn)詞,見表3。
表3 “智能化教育評價”領域突變詞語中英文釋義(按頻次高低排序)
表3中,“機器學習”這一術語變化頻次最高,說明隨著科技、思維發(fā)展,人類越來越注重專門研究計算機如何模擬或實現(xiàn)人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。它是人工智能的核心,是使計算機具有智能的根本途徑,其應用遍及人工智能的各個領域,主要使用歸納、綜合而不是演繹。智能化教育評價要從其十大經(jīng)典算法中探索凝練,不斷提升、改善自身效能。
“深度學習”變化頻次排在第二位,智能化教育評價要注重學習樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,這樣有助于解釋學習過程中獲得的信息,諸如文字、圖像和聲音等數(shù)據(jù),從而將其識別,取得進展。
“系統(tǒng)”“模型”則呼喚智能化教育評價要注重自身內(nèi)部體系的構建,模型建立要科學,經(jīng)得起推敲論證。
排在5~18位的術語不再一一解釋與演繹,它們代表著與“智能化教育評價”相關的研究前沿,是今后研究的一些重點和需要突破的難點,也是容易在某一方面有所建樹的研究領域。
在分析學科演化、熱點與前沿領域等方面,CiteSpaceV可視化應用軟件所表現(xiàn)出來的較強探測和檢驗等輔助功能在“智能化教育評價”領域研究中得到了一定體現(xiàn),通過對WoS數(shù)據(jù)庫中收錄的所有以“智能化教育評價”主題的研究論文的可視化分析,可以得到以下研究結論:1)“智能化教育評價”涉及教育學、統(tǒng)計工學、理學、信息科學等多學科交叉領域,但應用并不明顯;2)“智能化教育評價”作為新生事物,其演進路徑并沒有在806篇歷史文獻中得到清晰的呈現(xiàn);3)“智能化教育評價”領域的研究熱點有7個,在此不再陳列;4)“智能化教育評價”領域的研究前沿有18個,一是與機器學習、深度學習的結合和相互借鑒,二是自身內(nèi)部體系的構建和指標體系的持續(xù)建立與不斷完善等。