朱雨萌 鈄蘭朵 許馨宸 吳 飛
教育研究中的計(jì)算驅(qū)動手段探究*
朱雨萌1鈄蘭朵2許馨宸3吳 飛4[通訊作者]
(1.浙江大學(xué) 教育學(xué)院,浙江杭州 310058;2.浙江大學(xué) 竺可楨學(xué)院,浙江杭州 310058;3.浙江工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,浙江杭州 310014;4.浙江大學(xué) 計(jì)算機(jī)學(xué)院,浙江杭州 310023)
近年來,人工智能和網(wǎng)絡(luò)通訊等技術(shù)的發(fā)展使高效分析和理解教育教學(xué)過程中涌現(xiàn)的海量數(shù)據(jù)成為可能。由此,研究數(shù)據(jù)驅(qū)動機(jī)器學(xué)習(xí)模式下有效的計(jì)算模型和手段,從數(shù)據(jù)中洞悉教育教學(xué)中客觀規(guī)律和模式,成為教育研究的熱點(diǎn)之一。為此,文章首先回顧了教育研究所屬范疇的歷史變化過程;然后,文章圍繞教育作為自然科學(xué)研究對象所具有的以實(shí)證經(jīng)驗(yàn)為基礎(chǔ)、以量化計(jì)算為手段的特點(diǎn),介紹了教育過程復(fù)雜性建模、教育效果由果溯因評測以及教育實(shí)驗(yàn)隨機(jī)對照分析三個問題中的若干計(jì)算手段;最后,文章根據(jù)現(xiàn)有人工智能模型解釋性不強(qiáng)這一局限性難以更好促進(jìn)教育研究進(jìn)展現(xiàn)狀,指出數(shù)據(jù)和知識雙輪驅(qū)動、閉環(huán)反饋回路、隨機(jī)對照實(shí)驗(yàn)前提假設(shè)等是教育研究技術(shù)手段今后發(fā)展的趨勢,以期建立解釋性更強(qiáng)教育研究理論和方法。
人工智能;數(shù)據(jù)驅(qū)動;反饋回路;可解釋
在人類文明發(fā)展歷程中,對教育研究范疇的定位經(jīng)歷了曲折的發(fā)展過程。1605年,Bacon[1]出版了《學(xué)術(shù)的進(jìn)展》()這一著作,雄心勃勃地繪制了“人類知識全貌”(The General Distribution of Human Knowledge)樹狀圖,嘗試對其所處時代人類知識進(jìn)行分類和規(guī)范化,其根據(jù)記憶、想象、理性三種人類能力將人類總體知識劃分為歷史、詩歌和哲學(xué)三個不同領(lǐng)域,其中歷史學(xué)被歸屬于記憶范疇、詩和藝術(shù)被歸屬為想象范疇、哲學(xué)則被歸屬為理性范疇。Bacon對人類知識的分類成為近代科學(xué)分類的先導(dǎo)。在Bacon給出的這一人類知識體系圖中,哲學(xué)包括了自然神學(xué)、自然哲學(xué)和人類哲學(xué)三個大類。其中,在人類哲學(xué)這一類別中,出現(xiàn)了閱讀??保═he Art of Criticism)和學(xué)校學(xué)習(xí)(School of Learning)兩個領(lǐng)域,用來表示教育中傳播和學(xué)習(xí)人類文明成果的兩種不同手段。從此,教育從哲學(xué)知識體系中分解出來,成為一門專門的科學(xué)。更為重要的是,與當(dāng)時詭辯哲學(xué)所采用的從理論到理論的演繹推理研究方法不同,Bacon開創(chuàng)性提出了歸納推理的研究方法,即從觀察和實(shí)驗(yàn)的事實(shí)出發(fā),通過排斥法來發(fā)現(xiàn)各種現(xiàn)象之間關(guān)系,這一“經(jīng)驗(yàn)的實(shí)驗(yàn)化”研究方法得到馬克思的認(rèn)同,稱其是“英國唯物主義和整個現(xiàn)代實(shí)驗(yàn)科學(xué)的真正始祖”。
在Bacon將教育從哲學(xué)中獨(dú)立出來且提出了以“理性和實(shí)驗(yàn)”為核心的現(xiàn)代科學(xué)思想后,人們就開始思考是否可以從實(shí)驗(yàn)觀察中發(fā)現(xiàn)提升教育效果的普遍化規(guī)律,進(jìn)而用計(jì)算手段來模擬這些規(guī)律,從而使任何地方、民族和國家所取得的任何新的知識和智能,都可以很快被大多數(shù)人所認(rèn)知,以便更加有效地傳承人類創(chuàng)造的積累知識與精神財(cái)富。遺憾的是,這個時期的教育雖然成為科學(xué)的一個分類,但人們還是僅僅將其視為知識傳遞的方式,缺乏發(fā)現(xiàn)教育中普遍規(guī)律的研究方法,遑論尋求合適計(jì)算手段來模擬這些規(guī)律。
表1 代表性知識圖譜中對教育歸屬分類的內(nèi)容(按時間順序)[2]
19世紀(jì)末,人們開始意識到教育中存在普遍規(guī)律,進(jìn)而對普遍規(guī)律研究加以重視。1891年,哈佛大學(xué)哲學(xué)家Royce[3]在《教育評論》()創(chuàng)刊號上發(fā)表了名為《教育是一門科學(xué)嗎?》()的文章,指出教育作為一門科學(xué),應(yīng)該研究普遍有效(Universally Valid)的規(guī)律,因?yàn)榭茖W(xué)本身所探討的是普遍規(guī)律。簡言之,教育遠(yuǎn)非最終和完全地告訴教師人性是什么、必須是什么以及如何處理它,其更應(yīng)該研究井然有序的秩序和性格形成的一般規(guī)則。顯然,教育要成為一門科學(xué),就需要研究教育過程中(如學(xué)習(xí)、評測等)存在的普遍客觀規(guī)律。但是,由于缺乏刻畫這些客觀規(guī)律的數(shù)據(jù),因此即使人們已經(jīng)認(rèn)識到教育是一門科學(xué),仍然很難通過計(jì)算手段對其開展相應(yīng)研究。
實(shí)際上,不同時代的研究者對教育研究范疇所包含的內(nèi)容有不同的認(rèn)識,因此在歷史上不同學(xué)者按照個人認(rèn)識將教育分類劃歸為不同領(lǐng)域進(jìn)行研究。瑞士國家科學(xué)基金會(Swiss National Science Foundation)和日內(nèi)瓦大學(xué)于2018年啟動了“學(xué)科互動歷史地圖集”(Interactive Historical Atlas of the Disciplines)項(xiàng)目,該項(xiàng)目收集了公元前360年~1967年之間近2000多年,由不同研究者提出的一共255個不同的人類知識圖譜。統(tǒng)計(jì)分析可知,這些知識圖譜總共包含了18393個知識領(lǐng)域[4]。分析這255個知識圖譜所包含的18393個知識領(lǐng)域,可以發(fā)現(xiàn)人類學(xué)科知識整體上由以哲學(xué)為原點(diǎn)向以科學(xué)為原點(diǎn)不斷演變發(fā)展。255個知識圖譜中有27個知識圖譜單列教育這一知識領(lǐng)域,代表性知識圖譜中對教育歸屬分類的內(nèi)容如表1所示。分析這些將教育單列的知識圖譜,可以發(fā)現(xiàn)教育首先被劃為哲學(xué)范疇(如Bacon的人類知識樹狀圖所示),然后歸屬于精神與實(shí)踐藝術(shù)范疇,再后來歸屬于人文科學(xué)范疇(具有代表性的學(xué)者及其提出的知識圖譜對教育的分類,如表1所示)。同時,教育與心理學(xué)、社會學(xué)以及歷史學(xué)聯(lián)系密切,呈現(xiàn)交叉性、實(shí)用性和主觀性等特點(diǎn)。
應(yīng)該承認(rèn),由于人們長期以來將教育劃分為人文科學(xué)和社會科學(xué)的范疇,因此相關(guān)研究多采用主觀性思辨與應(yīng)然性暢想等方法,忽略以自然科學(xué)研究范式來深化對教育和人的認(rèn)知,這極大地阻礙了教育的研究進(jìn)程。因此,本研究基于教育作為自然科學(xué)研究對象所具有的以實(shí)證經(jīng)驗(yàn)為基礎(chǔ)、以量化計(jì)算為手段的特點(diǎn),探究教育過程中復(fù)雜性建模、教育效果由果溯因評測以及教育實(shí)驗(yàn)隨機(jī)對照實(shí)踐三個問題的若干計(jì)算手段,提出數(shù)據(jù)和知識雙輪驅(qū)動、閉環(huán)反饋回路、隨機(jī)對照實(shí)驗(yàn)前提假設(shè)等將成為推動教育研究的發(fā)展趨勢,以期為計(jì)算驅(qū)動的教育學(xué)科學(xué)研究提供啟示。
計(jì)算驅(qū)動指把實(shí)際問題抽象為可形式化表達(dá)的數(shù)學(xué)問題,用計(jì)算機(jī)語言來編程,自動優(yōu)化求解數(shù)學(xué)問題所表達(dá)的模型,從而解決實(shí)際問題,即運(yùn)用計(jì)算機(jī)科學(xué)的基礎(chǔ)概念進(jìn)行問題模型設(shè)計(jì)、求解過程構(gòu)造和計(jì)算手段實(shí)現(xiàn)的一系列活動。如前所述,教育研究的核心是發(fā)現(xiàn)教與學(xué)過程中人的認(rèn)知客觀規(guī)律,需要從觀測所得現(xiàn)象出發(fā),以計(jì)算技術(shù)來實(shí)現(xiàn)這一科學(xué)研究。當(dāng)前,科學(xué)研究范式正在變革,繼實(shí)驗(yàn)觀測科學(xué)(從對自然現(xiàn)象的觀測中總結(jié)規(guī)律)、理論推導(dǎo)科學(xué)(從科學(xué)實(shí)驗(yàn)中推導(dǎo)規(guī)律)和仿真模擬科學(xué)(從對復(fù)雜現(xiàn)象的模擬中進(jìn)行科學(xué)研究)之后,正在邁向以數(shù)據(jù)洪流為核心的數(shù)據(jù)密集型科學(xué)[5]。數(shù)據(jù)密集型科學(xué)研究體現(xiàn)了計(jì)算驅(qū)動的特點(diǎn),其結(jié)合所觀測現(xiàn)象和已有領(lǐng)域?qū)I(yè)知識等數(shù)據(jù)、基于數(shù)學(xué)和統(tǒng)計(jì)等算法模型、應(yīng)用計(jì)算機(jī)科學(xué)方法,從海量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,以支持決策、發(fā)現(xiàn)知識和預(yù)測未知等。
數(shù)據(jù)密集型這一計(jì)算驅(qū)動的科學(xué)研究范式給教育研究帶來了新的機(jī)遇。早期教育研究始于古希臘哲學(xué)研究,彼時教育尚未從哲學(xué)、政治學(xué)、倫理學(xué)中分離成為獨(dú)立學(xué)科,因此對教育本身研究的方法論也大多呈現(xiàn)為主觀性的思辨與應(yīng)然性的暢想。隨著大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)、VR/AR和5G等技術(shù)的進(jìn)步,人類正進(jìn)入“信息空間、物理世界和人類社會”(Cyber Space, Physical World, Human Society,CPH)三元空間時代。在三元空間,收集與挖掘教育活動中學(xué)習(xí)者、學(xué)習(xí)資源、學(xué)習(xí)環(huán)境和學(xué)習(xí)過程等海量數(shù)據(jù)成為可能,從而可架構(gòu)數(shù)據(jù)密集型這一計(jì)算驅(qū)動模式來進(jìn)行教育研究。例如在“教師—學(xué)生—智能”體所構(gòu)成的協(xié)作學(xué)習(xí)環(huán)境中,個人學(xué)習(xí)能力和學(xué)習(xí)效果會受到學(xué)習(xí)資源(數(shù)據(jù)與服務(wù))、群體交互(行為)和探索反饋(獎勵)等影響,不同智能算法從對收集的觀測過程和結(jié)果等數(shù)據(jù)出發(fā),通過數(shù)據(jù)驅(qū)動下抽象歸納、知識引導(dǎo)下演繹推理和行為交互下探索反饋等機(jī)器學(xué)習(xí)方法,分析學(xué)習(xí)手段、學(xué)習(xí)途徑、交互模式、反饋獎勵等因素對學(xué)習(xí)效果的不同影響,甄別干預(yù)變量、消除混合變量,從而建立以因果推斷為核心的在線協(xié)同學(xué)習(xí)實(shí)證評估手段,以動態(tài)提升學(xué)習(xí)質(zhì)量。
顯然,一旦將教育作為自然科學(xué)研究對象,其科學(xué)內(nèi)稟就逐漸明晰,走出了原先基于形而上思辨與演繹推理的桎梏,可以將涌現(xiàn)數(shù)據(jù)作為實(shí)證研究基礎(chǔ)、以量化分析作為計(jì)算手段,建立數(shù)據(jù)驅(qū)動機(jī)器學(xué)習(xí)模式下有效的計(jì)算模型。接下來,本研究選取教育過程復(fù)雜性建模、教育效果由果溯因評測以及教育實(shí)驗(yàn)隨機(jī)對照分析三個方面為例,介紹數(shù)據(jù)驅(qū)動機(jī)器學(xué)習(xí)模式下計(jì)算模型,展示計(jì)算驅(qū)動下這些教育研究場景所采用的典型人工智能手段和方法。
教育是人類社會所特有的更新性再生巨復(fù)雜系統(tǒng),具有教育對象的主體性、教育過程的綜合性、教育資源的多樣性以及教育成效的潛在性等特點(diǎn)。
法國著名思想家、哲學(xué)家Morin[6]在2000年以法文出版了《未來教育所必需的七種復(fù)雜性經(jīng)驗(yàn)》()論著,后聯(lián)合國教科文組織將其翻譯為英文。Morin在論著中強(qiáng)調(diào)教育之所以復(fù)雜,是因?yàn)榻逃龑ο螅ㄈ祟惐旧恚┦鞘澜缟献顝?fù)雜的生命體。只有揭示人在教與學(xué)過程中的客觀認(rèn)知規(guī)律,才能提升教與學(xué)的效果。一般認(rèn)為,人的認(rèn)知規(guī)律具有非線性、群智涌現(xiàn)、回路反饋等特性,需要用可計(jì)算手段對教與學(xué)復(fù)雜過程中非線性映射、合作行為和反饋等行為進(jìn)行建模,以洞悉學(xué)習(xí)意圖和興趣偏好等認(rèn)知規(guī)律。在現(xiàn)實(shí)世界中,非線性是世界萬事萬物運(yùn)轉(zhuǎn)的魂魄,原子彈之父Fermi曾經(jīng)說過:“大自然的一切定律并非都可以用線性方程來表示”[7]。在教育研究中,通過將具有非線性映射能力函數(shù)(如核函數(shù)、稀疏編碼、卷積池化和矩陣分解等)引入有監(jiān)督學(xué)習(xí)模型(如深度神經(jīng)網(wǎng)絡(luò)、決策樹和支持向量機(jī)等)、無監(jiān)督學(xué)習(xí)模型(如聚類、主題建模和流形學(xué)習(xí)等)以及半監(jiān)督學(xué)習(xí)模型,就能從海量數(shù)據(jù)中識別、跟蹤和預(yù)測學(xué)習(xí)興趣點(diǎn)與知識點(diǎn)的演變等內(nèi)在模式,提升個性化學(xué)習(xí)效能。
此外,合作是進(jìn)化過程的架構(gòu)師,是人類社會的最大成功。與自然界一樣,在人類社會,我們可以觀察到這樣的現(xiàn)象:群體成員間通過協(xié)作、競爭和激勵等去中心化的方式,產(chǎn)生復(fù)雜的行為模式,體現(xiàn)群體所獨(dú)有的智能/智慧,具有“整體大于部分總和”的涌現(xiàn)性特點(diǎn),即群智涌現(xiàn)[8]。涌現(xiàn)群體智能與群體中個人成員之間的協(xié)作、競爭和激勵等要素密切相關(guān),而與成員平均或最高智能無關(guān)。在學(xué)習(xí)認(rèn)知過程中設(shè)計(jì)激勵機(jī)制能夠激發(fā)學(xué)生和學(xué)生、學(xué)生和教師之間在教學(xué)合作場景中的群智涌現(xiàn),促使學(xué)生提出創(chuàng)造性想法,解決學(xué)習(xí)過程中產(chǎn)生的困惑與難點(diǎn),形成學(xué)會學(xué)習(xí)的能力。
同時,個體在學(xué)習(xí)過程中會根據(jù)學(xué)習(xí)效果來糾正或調(diào)整學(xué)習(xí)方法,這可視為一種“試錯學(xué)習(xí)方法”。這種方法的本質(zhì)是在學(xué)習(xí)過程中建立“閉環(huán)反饋回路”,將輸出端結(jié)果反饋給輸入端,進(jìn)而對系統(tǒng)中相應(yīng)方法進(jìn)行調(diào)整。學(xué)習(xí)過程中的“閉環(huán)反饋回路”包含了人這一個體,2013年1月,雜志刊文呼吁建立“人在回路”(Human-in-the-loop)計(jì)算模式,指出在計(jì)算過程中要更加重視人的交互作用和參與程度,推動從以機(jī)器為中心計(jì)算模式到以人為中心計(jì)算模式的巨大演變[9]。在學(xué)生—教師—教學(xué)資源—教育環(huán)境所構(gòu)成的學(xué)習(xí)場景中,個人學(xué)習(xí)行為會受到學(xué)習(xí)資源(數(shù)據(jù)與服務(wù))、群體交互(行為)和探索反饋(獎勵)等影響,學(xué)習(xí)能力因此不斷演化。因此,如何對學(xué)習(xí)內(nèi)容、學(xué)習(xí)手段和學(xué)習(xí)目標(biāo)進(jìn)行不斷調(diào)整,建立解釋性強(qiáng)、自適應(yīng)好的行為交互探索反饋計(jì)算模型以刻畫學(xué)習(xí)的進(jìn)化與演化過程,從而提供更佳個性化學(xué)習(xí)輔助手段,是推動人工智能與在線教育深度融合要解決的重要挑戰(zhàn)之一。
為了實(shí)現(xiàn)教育效果由果溯因評測,需要使用因果效應(yīng)評估這一建模計(jì)算手段。因果效應(yīng)評估是洞悉觀測數(shù)據(jù)中因果關(guān)聯(lián)的重要途徑,其關(guān)鍵挑戰(zhàn)在于消除混淆變量(Confounder)對干預(yù)變量(Treatment)的影響,這方面的代表性建模計(jì)算方法有基于傾向值(Propensity Score)評估方法、非參數(shù)結(jié)構(gòu)方程(Nonparametric Structural Equations)、有向無環(huán)圖(Directed Acyclic Graph)以及復(fù)雜試驗(yàn)、工具變量法、因果勢理圖和因果干擾等計(jì)算方法[10]。
卡耐基梅隆大學(xué)和印第安納大學(xué)所進(jìn)行的面向教育的實(shí)驗(yàn)分析表明:學(xué)習(xí)習(xí)慣、教育手段、教育資源與學(xué)習(xí)效果改善存在一定的因果關(guān)系,而內(nèi)嵌(Embedding)實(shí)驗(yàn)是因果分析的有效手段[11]。范施·因德爾(van Schijndel)等[12]通過因果隱性模型來分析因?yàn)閷W(xué)習(xí)行為差異化而對學(xué)習(xí)性能的影響,提出了理性、聯(lián)想和不確定性規(guī)避三種策略來解釋學(xué)習(xí)行為差異化的原因。
不同于單純從數(shù)據(jù)中挖掘不同變量之間存在的潛在因果關(guān)系,在教育效果由果溯因評測中,因和果之間的關(guān)系由于人這一研究對象的引入而使計(jì)算建模方法變得異常復(fù)雜,需要對計(jì)算模型進(jìn)行如下三個方面的擴(kuò)展:①目前因果評測中干預(yù)變量往往只有二值變量(如好或不好等),需要將二值變量擴(kuò)展為連續(xù)干預(yù)變量,從而應(yīng)用合理的控制手段對個體、群體和行為進(jìn)行評價;②要重視教育場景中實(shí)現(xiàn)有效因果關(guān)系推斷所應(yīng)滿足的基本條件;③要準(zhǔn)確界定因和果所適用的學(xué)習(xí)范圍以及研究結(jié)論推及總體的一般化能力,形成可靠假設(shè)和知識的有效累積。以上三點(diǎn)是推動教育評價科學(xué)化發(fā)展的重要原生動力。
在測量與評估教學(xué)效果以指導(dǎo)并改善學(xué)習(xí)的研究手段和建模方法中,可以通過綜合質(zhì)性研究(依托評價量規(guī))和量化研究(協(xié)作計(jì)算),構(gòu)建面向多主體的協(xié)同學(xué)習(xí)因果網(wǎng)絡(luò),引入基于介入、反事實(shí)等推理手段的歸因分析機(jī)制,從學(xué)習(xí)手段、學(xué)習(xí)途徑、交互模式、反饋獎勵等因素中甄別干預(yù)變量、消除混合變量,建立以因果推斷為核心的教學(xué)效果實(shí)證評估方法,以計(jì)算驅(qū)動手段動態(tài)提升教育質(zhì)量。
教育是一項(xiàng)在現(xiàn)實(shí)世界中進(jìn)行的具體實(shí)踐活動,不同教學(xué)方法會對不同受教育者產(chǎn)生不同的影響。為了分析技術(shù)手段的優(yōu)劣好壞,需要使用自然科學(xué)中隨機(jī)對照實(shí)驗(yàn)(Randomized Controlled Trials,RCT)這一計(jì)算手段來進(jìn)行分析。所謂隨機(jī)對照實(shí)驗(yàn)是一種對醫(yī)療衛(wèi)生服務(wù)中某種療法或藥物的效果進(jìn)行檢測的方法,常用于醫(yī)學(xué)、生物學(xué)、農(nóng)學(xué)等方面。隨機(jī)對照實(shí)驗(yàn)的基本方法是,將研究對象隨機(jī)分組,對不同組實(shí)施不同的干預(yù),以對照效果的不同。
自20世紀(jì)初隨機(jī)對照實(shí)驗(yàn)這一計(jì)算手段被引入教育學(xué)研究以來,教育隨機(jī)對照實(shí)驗(yàn)的發(fā)展先后經(jīng)歷了高潮期和低谷期,其代表性研究如表2所示。其中,美國是最早使用隨機(jī)對照實(shí)驗(yàn)開展教育學(xué)研究的國家,其教育實(shí)驗(yàn)隨機(jī)對照分析經(jīng)歷了五個階段,分別是心理學(xué)實(shí)驗(yàn)賦能教育研究設(shè)計(jì)階段(1900~1940年)、費(fèi)希爾所著《實(shí)驗(yàn)設(shè)計(jì)》被引入教育研究設(shè)計(jì)階段(1940~1960年)、教育隨機(jī)對照實(shí)驗(yàn)第一次浪潮(1960~1980年)、美國教育實(shí)驗(yàn)的低谷(1980~2000年)以及教育科學(xué)研究時代(2002年至今)[13]。相較而言,英國、瑞典、挪威等國家起初以定性定質(zhì)研究為主,直到20世紀(jì)中后期才開始采用隨機(jī)對照實(shí)驗(yàn)開展教育研究。自21世紀(jì)以來,各國家政府對于教育政策效果的評估需求增加,通過隨機(jī)對照實(shí)驗(yàn)方法開展的教育研究由此受到了高度重視。此外,教育隨機(jī)對照實(shí)驗(yàn)呈現(xiàn)從小規(guī)模特殊群體洞察轉(zhuǎn)向大規(guī)模社會實(shí)驗(yàn)研究的趨勢[14][15][16]。
表2 隨機(jī)對照實(shí)驗(yàn)在教育中代表性研究
隨機(jī)對照實(shí)驗(yàn)方法的引入為教育研究打下了堅(jiān)實(shí)基礎(chǔ)。20世紀(jì)60年代中期到80年代,美國聯(lián)邦政府注重提升教育和社會福利,并通過“偉大社會計(jì)劃”改善教育。為了對這些政策實(shí)施效果進(jìn)行系統(tǒng)科學(xué)的評估,研究者開展了大量的隨機(jī)現(xiàn)場實(shí)驗(yàn)(Randomised Field Trials,RFT),即將單個個體隨機(jī)分配到兩個或多個組中的一個,每組都接受不同手段的教育干預(yù),來觀測得到的不同效果[28],為教育政策的決策提供參考依據(jù),并為教師培訓(xùn)方案、課程創(chuàng)新、技術(shù)在教育中的應(yīng)用、職業(yè)培訓(xùn)、職業(yè)教育、測試效果等提供決策參考。教育隨機(jī)對照實(shí)驗(yàn)中較著名的實(shí)驗(yàn)包括“高范圍”(HighScope)實(shí)驗(yàn)和“斯坦福棉花糖實(shí)驗(yàn)”(Stanford Marshmallow Experiment)。這一階段也被稱為美國教育隨機(jī)對照實(shí)驗(yàn)的黃金年代。
然而,盡管聯(lián)邦政府在教育實(shí)驗(yàn)中投入了大量資源,卻并未得出對實(shí)際教學(xué)實(shí)踐和學(xué)生成績產(chǎn)生巨大或可復(fù)制影響的結(jié)論,美國教育隨機(jī)對照實(shí)驗(yàn)研究在20世紀(jì)80年代~21世紀(jì)初進(jìn)入了低谷停滯期。在這個時期,雖然美國教育研究開始轉(zhuǎn)向其他定性研究方法,但美國政府部門在這一階段仍主導(dǎo)開展了少量教育社會實(shí)驗(yàn)研究,如田納西州小班化教育改革實(shí)驗(yàn),這項(xiàng)實(shí)驗(yàn)也被稱為STAR(Student-Teacher Achievement Ratio,學(xué)生—教師成就比)項(xiàng)目,于1985年由田納西州立法機(jī)構(gòu)委托田納西州大學(xué)和田納西州教育部聯(lián)合實(shí)施,以評估小班教學(xué)對學(xué)生成就的影響。在對田納西州所有學(xué)區(qū)學(xué)校進(jìn)行規(guī)模標(biāo)準(zhǔn)篩選后,其42個學(xué)區(qū)的79所小學(xué)成為STAR實(shí)驗(yàn)的場地,參與為期長達(dá)四年的教育隨機(jī)對照實(shí)驗(yàn)。該實(shí)驗(yàn)將幼兒園學(xué)生隨機(jī)分為小班(13~17名學(xué)生)、大班(22~26名學(xué)生)以及有全職助理大班三類。教師也被隨機(jī)分配到不同類型的班級。在實(shí)驗(yàn)期間研究團(tuán)隊(duì)會進(jìn)行實(shí)地考察(以核實(shí)班級規(guī)模)、訪談、數(shù)據(jù)收集與測試。實(shí)驗(yàn)結(jié)果表明被分配到小班的學(xué)生具有更高的學(xué)術(shù)成就(成績)[29],并且該優(yōu)勢會持續(xù)到整個小學(xué)八年級乃至高中[30]。田納西班級規(guī)模實(shí)驗(yàn)對美國教育政策產(chǎn)生了巨大影響。
2002年成立的美國教育科學(xué)研究所(Institute of Education Science,IES)提出了“什么干預(yù)是有效的”標(biāo)準(zhǔn),將隨機(jī)現(xiàn)場試驗(yàn)評為最嚴(yán)格的研究方法,隨機(jī)對照實(shí)驗(yàn)迎來第二次發(fā)展浪潮。本次浪潮中,歐洲國家也愈發(fā)重視教育研究中的隨機(jī)對照實(shí)驗(yàn)方法。英國于2011年成立教育捐贈基金會(England’s Education Endowment Foundation),重視并資助開展教育隨機(jī)對照實(shí)驗(yàn)[31]。20世紀(jì)下半葉石油危機(jī)后,丹麥、挪威和瑞典等國家遭遇財(cái)政危機(jī)。如何在有限的國家財(cái)政資助下,高效率地干預(yù)教育事業(yè)以提升教育質(zhì)量成為這些國家的重點(diǎn)關(guān)注問題。例如,瑞典國家教育署和勞動力市場與教育政策評估研究所在2016~2020年間針對6~18歲的學(xué)生開展了“提高新生教育質(zhì)量的干預(yù)措施”(Insatser f?r att st?rka utbildningens kvalitet f?r nyanl?nda elever)項(xiàng)目調(diào)研,通過對新生進(jìn)行知識檢測來分配合適的班級、為貧困學(xué)校的教師提供更高的工資、招聘更多教師等方式,提高新生教育的質(zhì)量[32]。
本研究于2022年10月6日以“隨機(jī)對照實(shí)驗(yàn)”為關(guān)鍵詞對Web of Science核心合集SCI(Science Citation Index Expanded)和SSCI(Social Sciences Citation Index)數(shù)據(jù)庫進(jìn)行檢索,得到教育類(Education & Educational Research)論文5365篇。分析發(fā)現(xiàn),隨機(jī)對照實(shí)驗(yàn)自1998年以來在教育領(lǐng)域的研究熱度持續(xù)上升;美國RCT相關(guān)論文發(fā)表數(shù)量自2010年起有著明顯上升趨勢并在論文發(fā)表數(shù)量上呈現(xiàn)研究主導(dǎo)地位;英國相關(guān)論文發(fā)表數(shù)量自2016年起快速增長;我國相關(guān)論文發(fā)表數(shù)量仍較少。對所有論文關(guān)鍵詞進(jìn)行詞頻統(tǒng)計(jì)后可以發(fā)現(xiàn),研究領(lǐng)域多聚焦于醫(yī)學(xué)教育(Medical education,72/5356)、干預(yù)(Intervention,43/5356)、專業(yè)發(fā)展(Professional Development,43/5356)、讀寫能力(Literacy,32/5356)、評估(Evaluation,26/5356)等方面。
在教育過程復(fù)雜性建模、教育效果由果溯因評測以及教育實(shí)驗(yàn)隨機(jī)對照分析等問題中引入計(jì)算手段,為教育研究提供了新的機(jī)遇,然而計(jì)算驅(qū)動的教育學(xué)研究仍處于發(fā)展初期,本研究總結(jié)了其未來趨勢,具體如下。
①建立數(shù)據(jù)和知識雙輪驅(qū)動下解釋性強(qiáng)的計(jì)算手段。當(dāng)前以深度學(xué)習(xí)為核心的人工智能模型存在解釋性不強(qiáng)的局限性。物理學(xué)家Feynman曾經(jīng)說過:“What I cannot create, I do not understand.”(不可造者,未能知也)[33]。為了能夠使用機(jī)器學(xué)習(xí)等計(jì)算手段來研究人的認(rèn)知過程,需對這一過程進(jìn)行清晰描述,從而用算法模型和機(jī)器學(xué)習(xí)系統(tǒng)來清晰模擬實(shí)現(xiàn)認(rèn)知過程。因此,在用知識、規(guī)則和邏輯等刻畫認(rèn)知學(xué)習(xí)過程基礎(chǔ)上,將知識與算法模型進(jìn)行結(jié)合,可使算法模型更具解釋性,而不是對一個“黑盒”進(jìn)行暴力優(yōu)化擬合。如何將教育領(lǐng)域中的專業(yè)知識(如學(xué)習(xí)理論、認(rèn)知發(fā)展理論等)引入人工智能算法模型,建立起數(shù)據(jù)和知識雙輪驅(qū)動下解釋性強(qiáng)的計(jì)算手段,是教育研究未來發(fā)展的趨勢。
②引入“人在回路”的協(xié)同學(xué)習(xí)方法。學(xué)習(xí)行為的發(fā)生不是孤立存在的,而是在學(xué)習(xí)者(學(xué)生)、學(xué)習(xí)構(gòu)成空間(如學(xué)習(xí)資源和算法模型等)和教育工作者(教師)之間所構(gòu)成的環(huán)路中發(fā)生。因此,研究人在回路模式中協(xié)同學(xué)習(xí)機(jī)理并建立適應(yīng)性學(xué)習(xí)方法是未來發(fā)展的一個趨勢。美國國家科學(xué)基金會(National Science Foundation,NSF)從2020年以來一共資助成立18個美國國家人工智能研究院,其中設(shè)立了一個面向教育的人工智能研究院“成人學(xué)習(xí)與在線教育研究院”(The National AI Institute for Adult Learning and Online Education,AI-ALOE)。該研究院是一個跨學(xué)科學(xué)術(shù)團(tuán)體,匯集了來自哈佛大學(xué)、喬治亞理工、北卡羅來納大學(xué)以及范德比爾特大學(xué)等大學(xué)聯(lián)盟中認(rèn)知科學(xué)、計(jì)算機(jī)和教育等領(lǐng)域?qū)<覍W(xué)者。AI-ALOE的研究重心是建立有效的數(shù)據(jù)驅(qū)動反饋回路(如以教師為中心回路和以學(xué)習(xí)者為中心回路),來提升個性化學(xué)習(xí)能力。在傳統(tǒng)以“數(shù)據(jù)、知識和模型”為中心的機(jī)器學(xué)習(xí)模型中,引入“人在回路”的閉環(huán)協(xié)同學(xué)習(xí)機(jī)制,形成數(shù)據(jù)驅(qū)動下歸納、知識指導(dǎo)中演繹以及反饋認(rèn)知中頓悟等相互結(jié)合計(jì)算理論模型,是在“人-機(jī)-物”耦合而成學(xué)習(xí)空間中進(jìn)行“教”與“學(xué)”今后的發(fā)展方向。
③設(shè)計(jì)教育隨機(jī)對照實(shí)驗(yàn)結(jié)果的全覆蓋指標(biāo)。現(xiàn)有教育實(shí)驗(yàn)研究往往會采取隨機(jī)對照實(shí)驗(yàn)的方法。美國國家教育研究基金會成員本·斯泰爾斯(Ben Styles)與約克大學(xué)教授卡羅爾·托格森(Carole Torgerson)在2018年所發(fā)表的論文《教育研究中的隨機(jī)對照實(shí)驗(yàn)(RCTs)——方法論辯論、問題、挑戰(zhàn)》()中指出,只有衡量隨機(jī)對照實(shí)驗(yàn)結(jié)果的指標(biāo)能夠覆蓋該教育評估所致結(jié)果多樣化內(nèi)涵,才能使用隨機(jī)對照實(shí)驗(yàn)來評估干預(yù)措施的結(jié)果[34]。為此,設(shè)計(jì)科學(xué)實(shí)驗(yàn)評價指標(biāo),加強(qiáng)對產(chǎn)生實(shí)驗(yàn)結(jié)果背景的理解,審慎辨析實(shí)驗(yàn)對于理論的影響與貢獻(xiàn),是今后教育隨機(jī)對照實(shí)驗(yàn)方法的發(fā)展方向。
更為根本的是,由于教育研究是與人相關(guān)的研究,教育研究呈現(xiàn)很強(qiáng)的學(xué)科交叉特點(diǎn),因此要采用的計(jì)算手段不僅僅來自某一學(xué)科。在教育研究過程中,以信息技術(shù)為手段,結(jié)合心理學(xué)、腦與神經(jīng)科學(xué)、語言學(xué)、認(rèn)知學(xué)等學(xué)科研究成果,才能在人類學(xué)習(xí)與發(fā)展的客觀規(guī)律等基礎(chǔ)研究方面取得突破。
本研究溯源了人類知識分類發(fā)展中教育研究范疇演變歷程,介紹以主觀性思辨與應(yīng)然性暢想等方法對教育進(jìn)行研究,正在轉(zhuǎn)向以數(shù)據(jù)驅(qū)動機(jī)器學(xué)習(xí)模式為核心的計(jì)算手段對教育進(jìn)行研究的轉(zhuǎn)變。隨后從教育過程的復(fù)雜性建模、教育由果朔因可評測與教育實(shí)驗(yàn)中隨機(jī)對照方法三個方面來探討計(jì)算驅(qū)動教育研究的具體方法并對計(jì)算驅(qū)動教育研究的局限性進(jìn)行思考,以期引發(fā)各界對科學(xué)屬性的思考以及計(jì)算驅(qū)動教育研究的進(jìn)一步關(guān)注。
人工智能是戰(zhàn)略性通用目的技術(shù),將人工智能算法和模型與教育場景中問題結(jié)合會推動教育研究跨越發(fā)展[35]。在現(xiàn)有以數(shù)據(jù)驅(qū)動下機(jī)器學(xué)習(xí)模型中引入刻畫教育教育客觀規(guī)律和機(jī)理的可計(jì)算模型,建立人在回路的閉環(huán)反饋機(jī)器學(xué)習(xí)框架,構(gòu)建由果溯因的學(xué)習(xí)效果評測方法,充分融合數(shù)據(jù)驅(qū)動、知識指導(dǎo)和反饋優(yōu)化等手段,推動自然科學(xué)和社會科學(xué)交叉融合,對于教育研究具有重大的科學(xué)研究價值和工程實(shí)踐意義。
[1]Bacon F, Montagu B.The works of Francis Bacon [M].London: J. Rivington, 1819:43.
[2][4]Sandoz R. Interactive historical atlas of the disciplines - university of geneva. Interactive historical atlas of the disciplines - university of geneva[OL].
[3]Royce J. Is there a science of education[J]. Educational Review, 1891,(1):23-24.
[5]Tansley S, Tolle K M. The fourth paradigm: data-intensive scientific discovery[M]. Washington: Microsoft Research, 2009: xvii.
[6]Morin E. Seven complex lessons in education for the future[M]. Paris: Unesco, 2002:2-3.
[7]Maglab. Enrico Fermi[OL].
[8]Michelucci P, Dickinson J L. The power of crowds[J]. Science, 2016,(6268):32-33.
[9]Schirner G, Erdogmus D, Chowdhury K, et al. The future of human-in-the-loop cyber-physical systems[J]. Computer, 2013,(1):36-45.
[10]Kuang K, Li L, Geng Z, et al. Causal inference[J]. Engineering, 2020,(3):253-263.
[11]Motz B A, Carvalho P F, de Leeuw J R, et al. Embedding experiments: Staking causal inference in authentic educational contexts[J]. Journal of Learning Analytics, 2018,(2):47-59.
[12]Van Schijndel T J P, Huijpen K, Visser I, et al. Investigating the development of causal inference by studying variability in 2-to 5-year-olds’ behavior[J]. Plos One, 2018,(4):e0195019.
[13][14][18][19][20][21][22][24]Hedges L V, Schauer J. Randomised trials in education in the USA[J]. Educational Research, 2018,(3):265-275.
[15][25][31]Dawson A, Yeomans E, Brown E R. Methodological challenges in education RCTs: Reflections from England’s education endowment foundation[J]. Educational Research, 2018,(3):292-310.
[16][26][27]Pontoppidan M, Keilow M, Dietrichson J, et al. Randomised controlled trials in Scandinavian educational research[J]. Educational Research, 2018,(3):311-335.
[17]Oakley A. Experimentation and social interventions: A forgotten but important history[J]. Bmj, 1998,(7167):1239-1242.
[28]Stufflebeam T K D L. International handbook of educational evaluation[M]. New York: Taylor & Francis, 2003:107-124.
[23]Wikipedia contributors. Oportunidades[OL].
[29]Nye B, Hedges L V, Konstantopoulos S. The long-term effects of small classes: A five-year follow-up of the Tennessee class size experiment[J]. Educational Evaluation and Policy Analysis, 1999,(2):127-142.
[30]Nye B, Hedges L V, Konstantopoulos S. The long-term effects of small classes in early grades: Lasting benefits in mathematics achievement at grade 9[J]. The Journal of Experimental Education, 2001,(3):245-257.
[32]Skolverket. Insatser f?r att st?rka utbildningens kvalitet f?r elever som ?r nyanl?nda eller har annat modersm?l ?n Svenska[OL].
[33]Way M. What I cannot create, I do not understand[J]. Journal of Cell Science, 2017,(18):2941-2942.
[34]Styles B, Torgerson C. Randomised controlled trials (RCTs) in education research-methodological debates, questions, challenges[J]. Educational Research, 2018,(3):255-264.
[35]吳飛.《走進(jìn)人工智能》[M].北京:高等教育出版社,2022:200-214.
An Inquiry into Computing-driven Methods in Educational Research
ZHU Yu-meng1DOU Lan-duo2XU Xin-chen3WU Fei4[Corresponding Author]
In recent years, the development of technologies such as artificial intelligence and communication network has made it possible to efficiently analyze and understand the massive data emerging in teaching and learning process. Therefore, studying the efficient computing models and means under the data-driven machine learning model and further gaining insight into the objective laws and patterns of education and teaching from data has become one of the hotspots in educational research. Therefore, this paper firstly reviewed the the historical change process of the category that education research belonged to. Further, focusing on the characteristics of taking on empirical experience as basis and quantitative calculation as the means belonging to education as a natural science research object, this paper introduced several computing methods in three problems of complexity modeling of educational process, causal inference evaluation in educational effect assessment and educational randomized controlled analysis. Finally, according to the limitation that the existing artificial intelligence models were not very explanatory, ipointed out in this paper that two-wheel drive of data and knowledge, closed-loop feedback, and presuppositioof randomized controlled trails were the trends of educational research in future, so as to establish educational research theories and methods with more explanatory.
artificial intelligence; data-driven; feedback loop; explanator
G40-057
A
1009—8097(2023)02—0033—10
10.3969/j.issn.1009-8097.2023.02.004
本文為國家自然科學(xué)基金重點(diǎn)項(xiàng)目“面向在線教育的群體智能支持下人機(jī)協(xié)同學(xué)習(xí)研究”(項(xiàng)目編號:62037001)的階段性研究成果。
朱雨萌,在讀博士,研究方向?yàn)橹悄芙逃?,郵箱為yumeng_zhu@zju.edu.cn。
2022年8月13日
編輯:小時