余勝泉 熊莎莎
(北京師范大學(xué)未來教育高精尖創(chuàng)新中心,北京 102206)
人工智能技術(shù)的教育應(yīng)用,不僅為教學(xué)活動注入新的活力,也提高了教師的專業(yè)水平。例如,人工智能教師可以利用機器學(xué)習(xí)、計算機視覺、自然語言處理、人機交互等技術(shù),分析學(xué)生學(xué)習(xí)和情感狀態(tài),自動批改和生成作業(yè)及試卷,輔助寫作和語音答題,模擬虛擬教師代理等。但是,傳統(tǒng)的人工智能教師只能針對特定的任務(wù)和數(shù)據(jù)集,設(shè)計和訓(xùn)練特定的模型,知識范圍有限,靈活性和適應(yīng)性差,互動性低。因此,通用人工智能教師研究一直受技術(shù)的限制,進展緩慢。2022 年,以ChatGPT 為代表的預(yù)訓(xùn)練大模型在教育界引起轟動,它們在通用語言理解和生成方面的優(yōu)勢,將推動教學(xué)模式、評價方式、內(nèi)容和目標(biāo)等變革。預(yù)訓(xùn)練大模型的出現(xiàn),也為通用人工智能教師開辟了新的可能。在預(yù)訓(xùn)練大模型的支持下,人工智能教師可以擔(dān)任多種角色,如智能導(dǎo)師、工作助手、協(xié)作伙伴、情感顧問、虛擬學(xué)伴等。這樣的人工智能教師,可以與人類教師相媲美,給教師的角色和能力帶來挑戰(zhàn),也會給教育帶來了深遠的影響。
預(yù)訓(xùn)練大模型(簡稱“大模型”)又稱基礎(chǔ)模型(foundation models)(Bommasani et al., 2021),它利用海量無標(biāo)簽語料數(shù)據(jù)庫進行自監(jiān)督或無監(jiān)督訓(xùn)練,不僅具有大規(guī)模參數(shù),還能適用于各種下游任務(wù)(盧宇等, 2023b)。大模型的基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu)沿用了自然語言處理領(lǐng)域較為熱門的Transformer。Transformer 結(jié)構(gòu)包含編碼器和解碼器兩部分,是一種基于自注意力機制的深度學(xué)習(xí)模型。得益于并行計算的特性,它能更好地處理長距離依賴關(guān)系,更有效地捕捉并處理上下文信息。
以ChatGPT 為代表的語言大模型利用多層神經(jīng)網(wǎng)絡(luò)模擬人類的學(xué)習(xí)過程,通過大量的語言數(shù)據(jù)訓(xùn)練,學(xué)習(xí)語言規(guī)律和知識,通過由許多節(jié)點和鏈接組成的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu),存儲和處理大量信息以表達詞句之間的概率關(guān)系。它可以在特定場景,面對給定的文本序列,通過預(yù)測下個詞或符號的概率生成與輸入的文本有關(guān)聯(lián)且沒有語法錯誤的文本。大模型的構(gòu)建包括兩個階段:預(yù)訓(xùn)練和下游任務(wù)適配。在預(yù)訓(xùn)練階段,模型通過訓(xùn)練海量無標(biāo)簽語料數(shù)據(jù),抽取數(shù)據(jù)內(nèi)部隱含的知識結(jié)構(gòu)和規(guī)律,獲得通用的語言理解能力。此過程通常采用諸如掩碼語言模型(Masked Language Modeling, MLM)等自監(jiān)督學(xué)習(xí)方法。它的核心思想是隨機遮蔽輸入文本的一些詞匯,訓(xùn)練模型理解和分析上下文的其他詞匯,以及這些詞匯與被遮蔽詞匯的潛在關(guān)系,從而習(xí)得該詞匯在不同語言場景概率化的關(guān)聯(lián)關(guān)系。此外,大模型中多層次Transformer結(jié)構(gòu)使模型能在不同層次建模輸入數(shù)據(jù),從而捕獲局部和全局的上下文信息,使模型能對詞匯特征、短語結(jié)構(gòu)和整體文本語境的關(guān)系等進行多層次的抽象表示。預(yù)訓(xùn)練階段后,大模型從無標(biāo)簽數(shù)據(jù)中學(xué)習(xí)到豐富的語境信息,形成對語言、圖像或其他輸入數(shù)據(jù)的深層理解,具備通用的上下文理解和知識提取能力。在下游任務(wù)適配階段,大模型沿用遷移學(xué)習(xí)的思想,基于預(yù)訓(xùn)練階段學(xué)到的知識、語境信息和通用語言表示等,在少量特定領(lǐng)域的有標(biāo)簽的數(shù)據(jù)上進行有監(jiān)督的訓(xùn)練學(xué)習(xí),從而適應(yīng)特定領(lǐng)域任務(wù),如學(xué)科問答、教案生成、自動化作文評分等。兩個階段的訓(xùn)練策略不僅增強了模型的靈活性和泛化性,還減少了對海量有標(biāo)簽數(shù)據(jù)的依賴。
大模型在自然語言理解、生成等方面的優(yōu)異能力,使它在客服、金融、藝術(shù)、教育等垂直領(lǐng)域得到關(guān)注和應(yīng)用。在教育領(lǐng)域,大模型在教師教學(xué)、學(xué)習(xí)過程、教育評價、學(xué)業(yè)輔導(dǎo)等方面也具有多層面的潛在應(yīng)用。在教師教學(xué)方面,大模型協(xié)助教師完成教案設(shè)計與潤色、教學(xué)資源生成、課程設(shè)計、個性化問題解答等,減輕教師負擔(dān);在學(xué)習(xí)過程方面,大模型通過理解學(xué)習(xí)意圖掌握學(xué)生學(xué)習(xí)需求,并提供個性化學(xué)習(xí)支架和反饋;在教育評價方面,大模型可以完成個性化作業(yè)自動評價、智能組卷等;在學(xué)業(yè)輔導(dǎo)方面,大模型通過多輪對話向?qū)W生提出啟發(fā)性、個性化的問題,引導(dǎo)學(xué)生并提供解決問題的思路。
大模型在教育領(lǐng)域呈現(xiàn)出的應(yīng)用前景雖然令人振奮,但關(guān)鍵問題也隨之浮出水面。比如,因訓(xùn)練數(shù)據(jù)的缺失與錯誤、不佳利用、訓(xùn)練過程過于迎合人類偏好、知識過時等原因,大模型生成的內(nèi)容會產(chǎn)生幻覺、深度邏輯缺失等現(xiàn)象?!盎糜X”問題通常有兩種:1)生成的內(nèi)容形式上看似正確,但與事實不符(Huang et al., 2023a)。例如,歷史教師使用大模型生成的歷史資料輔助教學(xué),如果訓(xùn)練數(shù)據(jù)集存在歷史錯誤或者偏見,生成的內(nèi)容就可能與歷史事實不符,導(dǎo)致學(xué)生理解歷史事件產(chǎn)生偏差。2)僅從文本相關(guān)性角度看待邏輯推理,不是嚴謹?shù)姆栠壿嬐评?,會出現(xiàn)與真實邏輯不一致的情況,當(dāng)進行深度推理時,出現(xiàn)多步驟錯誤累積概率很高。由于大模型更新知識不及時,教師通過大模型獲得的知識極可能與預(yù)設(shè)不一致,甚至錯誤。例如,教師使用大模型生成的內(nèi)容設(shè)計數(shù)學(xué)教學(xué)活動,如果模型的知識截止時間較早,未能包括最新的課程內(nèi)容和標(biāo)準(zhǔn),教師就可能沒有充分了解最新的教學(xué)要求和學(xué)科標(biāo)準(zhǔn),導(dǎo)致教學(xué)不符合要求。
大模型的“深度邏輯缺失”問題表現(xiàn)為:1)大模型雖然能夠生成流暢而連貫的語言,但不一定能理解和解釋它所說內(nèi)容的意義和邏輯,這可能會導(dǎo)致大模型無法有效地解決復(fù)雜或抽象的,如數(shù)學(xué)、科學(xué)或倫理等需要深度邏輯的問題;2)生成看起來推理過程合理,但結(jié)論或答案是錯誤的。大型模型出現(xiàn)“深度邏輯缺失”現(xiàn)象的原因有兩方面:1)模型可能在專業(yè)領(lǐng)域知識方面學(xué)習(xí)不夠。受數(shù)據(jù)訓(xùn)練的制約,對問題本質(zhì)理解不透。因此,生成的內(nèi)容表面上看似合理,實際上過于膚淺,缺乏深度的理解、分析和思考。2)大模型本身推理能力不足,無法進行深度的抽象和數(shù)理邏輯推理。例如,解決復(fù)雜數(shù)學(xué)問題,大模型時常會出現(xiàn)解答過程詳細答案錯誤的情況。這是因為推理任務(wù)中,大模型不依據(jù)理解邏輯關(guān)系,而是依賴于大量文本的相關(guān)性(Ma et al., 2023),缺乏對抽象邏輯和數(shù)理邏輯推理的深刻理解,導(dǎo)致生成的內(nèi)容缺乏邏輯關(guān)聯(lián)。
從人工智能教師的角度看,大模型存在的幻覺和深度邏輯缺失等關(guān)鍵問題,直接影響其教育應(yīng)用價值?;诖竽P偷娜斯ぶ悄芙處熭o助學(xué)生時,幻覺問題可能導(dǎo)致向?qū)W生傳遞錯誤、偏見或不準(zhǔn)確的信息,影響人工智能教師的可信度;深度邏輯缺失問題可能威脅學(xué)生的深度理解和思辨能力培養(yǎng),降低人工智能教師的可靠性。另外,大模型還有無法理解和處理多模態(tài)信息、缺失社會情感能力等不足,比如大模型雖然能夠模仿人類的情感和語氣,但不是真正有感情或意識的存在。這會導(dǎo)致大模型無法理解和關(guān)心學(xué)生的感受,讓學(xué)生感到缺乏親切感。如果不解決這些關(guān)鍵問題,大模型不可能得到真正有價值的教育應(yīng)用。
人工智能教師指基于人工智能技術(shù)輔助、協(xié)作或獨立實現(xiàn)教育教學(xué)活動的智能系統(tǒng)或機器人,它能夠在沒有人類教師的參與下,代替部分人類教師繁瑣、機械的工作,也能夠與人類教師共同參與教育教學(xué)活動,互相補充和支持,提高教學(xué)效率和質(zhì)量。人工智能教師可以根據(jù)學(xué)生的特點和需求,提供個性化、適應(yīng)性、交互性的教學(xué)服務(wù),可以在教育實踐中扮演自動出題和自動批閱作業(yè)的助教、學(xué)習(xí)障礙自動診斷與反饋的分析師、問題解決能力測評的素質(zhì)提升教練、學(xué)生心理素質(zhì)測評與改進的輔導(dǎo)員、體質(zhì)健康監(jiān)測與提升的保健醫(yī)生、反饋綜合素質(zhì)評價報告的班主任、個性化智能教學(xué)的指導(dǎo)顧問、學(xué)生個性化問題解決的智能導(dǎo)師、學(xué)生發(fā)展的生涯規(guī)劃師、精準(zhǔn)教研中的互助同伴、個性化學(xué)習(xí)內(nèi)容的生成與匯聚的智能代理、數(shù)據(jù)驅(qū)動的教育決策助手等多種角色(余勝泉, 2018)。
因此,基于大模型構(gòu)建人工智能教師,不僅需要從知識、認知、推理、感知、情感等方面增強大模型,還必須確保大模型輸出內(nèi)容的科學(xué)性、邏輯性和價值對齊性。增強的大模型能為人工智能教師注入與人類教師相比肩的功能和能力,能像人類教師一樣具有情感、能解決不同類型問題(見圖1)。在圖1 中,人工智能教師的具身形態(tài)多種多樣,可以是機器人、數(shù)字人、移動APP、應(yīng)用軟件等。這些形態(tài)增加了人工智能教師與學(xué)習(xí)者的互動途徑,使人工智能教師能適應(yīng)不同的教學(xué)環(huán)境和學(xué)習(xí)者需求,并通過多模態(tài)交互接口,有效地將信息傳遞給大模型。多模態(tài)交互接口方便人工智能教師接收和理解學(xué)習(xí)者的語言、表情和手勢等多種形式的反饋,還能使教師以視覺、聽覺和觸覺等方式輸出信息,創(chuàng)建互動性和沉浸感更強的學(xué)習(xí)環(huán)境。
圖1 基于大模型的通用人工智能教師架構(gòu)
教育知識圖譜在此架構(gòu)中用來指導(dǎo)和約束大模型的輸出,提高其準(zhǔn)確性、可靠性和科學(xué)性,實現(xiàn)隱含價值觀與國家意識形態(tài)對齊,扮演著把關(guān)人的角色,發(fā)揮外部監(jiān)督反饋作用。教育知識圖譜包含兩類信息:一是教育領(lǐng)域真實的、確切的知識和信息;另一類是應(yīng)當(dāng)避免的負面、不良的知識和信息。如果大模型的輸出符合第一類知識且不符合第二類知識,那么輸出將會被采用。如果大模型的輸出違背真實性或者包含不良負面信息,則會被禁止輸出,同時形成外部監(jiān)督反饋,指導(dǎo)模型的調(diào)整和改進。利用教育知識圖譜的檢索與推理監(jiān)督大模型輸出的形式有三種:1)知識蒸餾。將教育知識圖譜中的知識轉(zhuǎn)化為大模型可以理解和利用的形式,如將知識圖譜的三元組(實體—關(guān)系—實體)轉(zhuǎn)化為自然語言的句子,然后用這些句子訓(xùn)練或微調(diào)大模型,使其能夠?qū)W習(xí)和記憶知識圖譜中的知識。2)知識注入。大模型在生成過程中,動態(tài)地將知識圖譜中的知識嵌入大模型的輸出中,如大模型生成文本時,根據(jù)文本的主題和上下文,從知識圖譜中檢索和選擇相關(guān)的知識,然后將這些知識以合適的方式嵌入文本中,使其更加豐富和有說服力。3)知識對齊。大模型輸出后,用知識圖譜中的知識驗證和糾正大模型的輸出,如大模型生成文本后,根據(jù)文本中的實體和關(guān)系,從知識圖譜中查詢和比較相應(yīng)的知識,發(fā)現(xiàn)和修改文本中的錯誤或不一致處,使其變得正確和一致。
架構(gòu)的核心是增強大模型部分。它通過“大模型+精調(diào)”范式,將海量的教育場景知識融入預(yù)訓(xùn)練大模型,增強大模型教育場景知識;采用檢索增強方法更新大模型的知識、擴充能力和認知。同時,它通過編排外部智能組件增強大模型的邏輯推理能力,這些組件可能包括專門的邏輯推理算法引擎。多模態(tài)支持允許大模型處理并理解文本、圖像、語音等形式的輸入數(shù)據(jù),增強其感知能力。最后,情感計算賦予大模型解讀和響應(yīng)學(xué)習(xí)者情感需求的能力,以期實現(xiàn)更人性化的教學(xué)交互。
“大模型+精調(diào)(fine-tuning)”范式是解決將大模型應(yīng)用不同教育場景,提升大模型對教育領(lǐng)域場景知識理解的有效路徑。該范式通過“喂養(yǎng)”教育領(lǐng)域大規(guī)模知識庫和數(shù)據(jù),例如數(shù)字教材、數(shù)字教輔、數(shù)字教學(xué)資源、教學(xué)場景數(shù)據(jù)、在線學(xué)習(xí)數(shù)據(jù)等,形成教育領(lǐng)域通用大模型;然后再把它和不同的下游教育任務(wù)(如教案生成)適配精調(diào),從而得到多類教育大模型。與全參數(shù)微調(diào)不同,精調(diào)不會訓(xùn)練模型的全部參數(shù),僅微調(diào)模型的小部分參數(shù)。精調(diào)的性能在與全參數(shù)微調(diào)媲美的同時,還降低了計算成本(Ding et al., 2023)。
精調(diào)有三類方法:1)增量式方法。該方法的核心思想是在原始模型中引入額外的可訓(xùn)練神經(jīng)網(wǎng)絡(luò)模塊或參數(shù),它通過微調(diào)這一小部分參數(shù)達到模型的高效適配。例如,Prefix-tuning(Li et al., 2021)和Prompt-tuning(Liu et al., 2022)將可調(diào)向量插入輸入層或表示層進行微調(diào),Adapter-tuning(Houlsby et al., 2019)僅在每層添加簡單的神經(jīng)網(wǎng)絡(luò)。2)指定式方法。該方法指定原始模型的某些特定參數(shù)變得可訓(xùn)練,而凍結(jié)其他參數(shù)。這一方法操作簡單,但效果很好。例如,BitFit(Ben Zaken et al., 2021)方法僅優(yōu)化模型內(nèi)部的偏置并凍結(jié)其他參數(shù),在多個基準(zhǔn)測試中性能超過95%的全參數(shù)微調(diào)。3)重參數(shù)化方法。它可以在不改變大模型網(wǎng)絡(luò)結(jié)構(gòu)的情況下,通過重新調(diào)整網(wǎng)絡(luò)參數(shù)的分布,提高大模型的泛化能力和魯棒性。
我館廣播電視史志資料研究中心典藏的廣播電視史志資料是前任廣播學(xué)院副院長趙玉明所捐,比較完整且極其珍貴。該研究中心的建成,對相關(guān)學(xué)科的研究,具有極其重要的歷史和現(xiàn)實作用。它也為我校的新聞傳播學(xué)科評估和本科教學(xué)評估發(fā)揮了重要作用。2017年,我校新聞傳播學(xué)能入選國家一流學(xué)科建設(shè)名單,其功不可沒。
“大模型+精調(diào)”范式的教育應(yīng)用有兩種技術(shù)路線(見圖2):一是調(diào)用大規(guī)模通用數(shù)據(jù)預(yù)訓(xùn)練好的大模型,再根據(jù)不同的教育任務(wù)精調(diào);二是直接用教育專業(yè)數(shù)據(jù)專門訓(xùn)練解決教育任務(wù)的大模型,再進行精調(diào)。兩種技術(shù)路線都能增強大模型對教育場景知識的理解。不同的是,后者對計算資源、教育數(shù)據(jù)規(guī)模要求較高。目前,已推出的教育大模型多采用第一種技術(shù)方案,即以通用大模型為基礎(chǔ),再用教育領(lǐng)域?qū)I(yè)語料庫進行精調(diào)優(yōu)化以適配特定的下游教育任務(wù)。
圖2 “大模型+精調(diào)”技術(shù)路線
大模型的生成內(nèi)容通常依賴于訓(xùn)練過的數(shù)據(jù),對沒有訓(xùn)練的知識(如最新知識、領(lǐng)域特定知識、專有數(shù)據(jù)),大模型也許會給出與事實不符、虛構(gòu)或者編造的內(nèi)容,產(chǎn)生幻覺問題,無法滿足實際需求。為解決這一問題,檢索增強生成(Retrieval Augmented Generation, RAG)技術(shù)應(yīng)運而生。檢索增強生成技術(shù)由Meta AI 提出(Lewis et al., 2020),指將結(jié)構(gòu)化存儲的外部知識庫與帶有參數(shù)記憶的大模型結(jié)合起來,使大模型能夠通過外部知識源獲得額外的知識擴充,增強模型對背景知識的綜合理解,提高生成內(nèi)容的可信度與準(zhǔn)確度。
檢索增強生成包括三個階段(見圖3):檢索、增強和生成。1)檢索階段指用戶輸入問題與外部知識源的檢索匹配,獲取附加上下文。這一階段通常會使用嵌入模型,將用戶提問內(nèi)容和外部知識庫嵌入同一向量空間,并利用最近鄰搜索等相似度計算方法,返回用戶輸入與知識庫中最相似的結(jié)果,作為附加上下文。2)增強階段主要將上一階段附加的上下文,與角色扮演設(shè)計、用戶提問等內(nèi)容填充到提示模板中,從而得到增強知識的提示。3)生成階段是將增強知識的提示輸入大模型,生成更科學(xué)準(zhǔn)確的回答。檢索增強生成過程的外部資源可以是教育專家構(gòu)建的知識庫、學(xué)科知識圖譜、優(yōu)質(zhì)教學(xué)場景數(shù)據(jù)等。例如,楊等(Yang et al., 2022)構(gòu)建高質(zhì)量的數(shù)學(xué)單詞問題數(shù)據(jù)集作為外部知識庫,然后檢索高度相關(guān)的代數(shù)知識,并將其作為改進的語義表示輸入模型,提高答案的準(zhǔn)確率。
圖3 檢索增強實踐路徑
外部知識源的繼承,創(chuàng)建了動態(tài)數(shù)據(jù)環(huán)境:一是保證數(shù)據(jù)新鮮度,以應(yīng)對需要知識更新的場景。大模型學(xué)習(xí)的知識依賴于訓(xùn)練數(shù)據(jù),若面對知識時常更新的場景,如教師要了解教育政策變化,檢索增強提供的外部知識源可以動態(tài)擴充相關(guān)知識。因此,基于檢索增強的大模型尤其適用于知識密集型任務(wù),如課程設(shè)計、教學(xué)設(shè)計等。二是提供來源驗證,增強可解釋性和科學(xué)性。用基于檢索的相關(guān)知識進行生成,生成結(jié)果可與信息來源建立聯(lián)系,生成結(jié)果的參考來源可追溯,可解釋性也得到了增強。三是增強領(lǐng)域?qū)I(yè)化知識,提高生成內(nèi)容的準(zhǔn)確性。對于需要深度領(lǐng)域知識支持的場景,基于檢索增強的大模型可在外部知識源的幫助下,提供豐富且專業(yè)的背景信息支持決策,提高生成內(nèi)容的準(zhǔn)確性,且計算成本相對精調(diào)方法更低。四是避免數(shù)據(jù)泄露。用真實教育教學(xué)場景數(shù)據(jù)(如學(xué)生在線學(xué)習(xí)交互日志)訓(xùn)練大模型,也許會產(chǎn)生隱私泄露問題。檢索增強生成方法應(yīng)檢索已經(jīng)脫敏或處理過的信息,避免大模型通過訓(xùn)練記住這些敏感數(shù)據(jù),避免數(shù)據(jù)泄露風(fēng)險。
像ChatGPT 這樣的大模型在自然語言理解和生成方面展現(xiàn)出卓越的能力,尤其是在處理“類人范疇”任務(wù)上表現(xiàn)突出,因為這類任務(wù)往往缺乏明確定義的“正確答案”。然而,結(jié)構(gòu)化的計算任務(wù)需要模型準(zhǔn)確操作,而大模型依據(jù)概率化生成的原理通常顯得力不從心,效果時好時壞。例如,當(dāng)人們期待大模型解答復(fù)雜數(shù)學(xué)推理問題時,可能出現(xiàn)它給出的解題步驟看似沒有問題,但答案錯誤的現(xiàn)象。這是因為大模型本身的推理能力不足,看似學(xué)到很多通用知識,但沒有理解本質(zhì),生成的內(nèi)容缺乏深度邏輯關(guān)聯(lián)。利用外部智能組件彌補大模型推理方面的不足,不失為有效的解決路徑。
大模型可以與專門設(shè)計的外部智能組件進行編排組合,以增強其邏輯推理能力。大模型將復(fù)雜推理問題傳遞給外部智能組件進行處理,外部智能組件作為推理引擎,提供形式化的邏輯規(guī)則和推理算法,并將結(jié)果返回給大模型,最后由大模型決策生成結(jié)果。如智能知識引擎Wolfram Alpha,內(nèi)置了龐大的專業(yè)知識庫和算法,可以解決數(shù)學(xué)、科學(xué)技術(shù)、日常生活等1000 多個領(lǐng)域的問題,可以處理畫函數(shù)圖像、求解方程式等復(fù)雜問題和任務(wù)。大模型與Wolfram Alpha 智能組件結(jié)合,將推理部分交給專業(yè)的Wolfram Alpha,利用其內(nèi)置的計算知識能力將自然語言轉(zhuǎn)變?yōu)榫_的符號化計算語言,再轉(zhuǎn)為自然語言或圖形化方式呈現(xiàn),以計算的方式輔助增強大模型的推理能力。以智能輔導(dǎo)場景為例(見圖4),當(dāng)學(xué)生咨詢帶情境的邏輯性問題,大模型會先嘗試理解和分析問題,如發(fā)現(xiàn)這個問題需要精確的數(shù)理邏輯推理,就為Wolfram Alpha 制定查詢,即將學(xué)生提問發(fā)送到Wolfram Alpha 進行搜索計算。Wolfram Alpha 先對學(xué)生的提問進行自然語言處理,轉(zhuǎn)化為Wolfram Alpha 能夠理解的Wolfram 語言格式,接著將處理過的信息和其內(nèi)置的專業(yè)知識庫對比、鏈接,之后用內(nèi)置的大量算法執(zhí)行必要推理計算,最后結(jié)構(gòu)化展示結(jié)果,并返回給大模型。大模型基于返回的結(jié)果和學(xué)生的提問,進行決策生成并以自然語言或圖表等方式反饋給學(xué)生詳盡、直觀、準(zhǔn)確的答案。
圖4 大模型結(jié)合外部智能組件實踐案例
教學(xué)場景涉及文字、圖像、語音等多模態(tài)信息,其多樣性和復(fù)雜性要求大模型不僅能夠理解文本信息,還要考慮圖像中的場景、學(xué)生的語音反饋等數(shù)據(jù)。如果大模型無法全面把握這種多樣性,它處理復(fù)雜教育場景任務(wù)或問題,就可能理解不足從而產(chǎn)生生成內(nèi)容不佳、無關(guān)或混亂的問題。這是不可接受的。多模態(tài)大模型的引入成為其解決方案。多模態(tài)大模型指包含文本、圖片、視音頻等多種模態(tài)的大模型(盧宇等, 2023b)。多模態(tài)的引入,使大模型有更全面的感知、更豐富的生成和更靈活的交互能力,豐富了大模型教育場景的適用性。
多模態(tài)大模型整合和解析來自視聽覺等感知通道的數(shù)據(jù),通過跨模態(tài)學(xué)習(xí)技術(shù),學(xué)習(xí)這些多模態(tài)數(shù)據(jù)之間的復(fù)雜映射關(guān)系,使不同感知通道的信息相互補充,提高大模型對教育場景的綜合理解。另外,多模態(tài)大模型能理解和處理學(xué)生閱讀文本、觀看圖像、聆聽講座等多模態(tài)輸入數(shù)據(jù)的上下文信息,更好地理解學(xué)生意圖和需求。其次,多模態(tài)大模型能統(tǒng)合不同模態(tài)的信息,生成更有創(chuàng)意、生動的教學(xué)資源。最后,基于多模態(tài)大模型的“數(shù)字人”增強了教育場景的交互體驗。
多模態(tài)引入增強大模型感知的技術(shù)路線有三類(見圖5):第一類是直接使用多模態(tài)數(shù)據(jù)訓(xùn)練大模型,把它預(yù)訓(xùn)練后再適配下游多模態(tài)理解、生成和交互任務(wù)。開展自監(jiān)督學(xué)習(xí),通常使用文本、視覺、聽覺等感知通道編碼器對多模態(tài)數(shù)據(jù)編碼,完成多模態(tài)融合后再進行多模態(tài)解碼。這類多模態(tài)大模型表現(xiàn)優(yōu)異,但訓(xùn)練成本較高。第二類是以語言大模型為基底,通過人類指令調(diào)用語言、視覺、聽覺專用模型等外部功能模塊,再由語言大模型綜合完成不同的任務(wù)(劉學(xué)博等, 2023)。這類多模態(tài)大模型增強了對多模態(tài)數(shù)據(jù)的理解,但要調(diào)用多個外部功能模塊,效率可能降低且成本高。第三類是將多模態(tài)數(shù)據(jù)分別編碼后,通過跨模態(tài)特征轉(zhuǎn)化器轉(zhuǎn)化成語言大模型的輸入模態(tài),再結(jié)合人類指令,實現(xiàn)更廣義的多模態(tài)理解。
大模型的情感對話能力相對較弱,缺乏社會情感和交流等能力,也難以與人類建立深層次的情感鏈接,而人的情感又復(fù)雜,導(dǎo)致大模型可能在理解和回應(yīng)學(xué)生真實情感需求方面出現(xiàn)偏差,生成內(nèi)容缺乏人性的溫暖,限制了人工智能教師與學(xué)生的深層次互動。解決這一問題,需要提高增強大模型的情感理解與表達能力。
研究者推出了蘊含情感計算的大模型。東北大學(xué)某課題研發(fā)了面向中文心理健康支持問答的大模型PICA(Zhang, 2023),作為情感陪護助手給用戶情感支持。 Inflection AI 推出了情感聊天機器人Pi(personal intelligence)(Inflection AI, 2023),該機器人具備“高情商”,可以了解并安撫用戶的情感需求,成為值得信賴的“傾聽者”。圖6 是大模型增強情感的技術(shù)路徑,它先采集學(xué)生的語音、文本、生理信號、行為等情感信號數(shù)據(jù),構(gòu)建多模態(tài)情感信號語料庫;然后對這些數(shù)據(jù)進行一系列的特征工程處理,包括提取各類數(shù)據(jù)特征,再將提取的特征進行融合;接著進行自監(jiān)督學(xué)習(xí)預(yù)訓(xùn)練,形成具備通用情感理解能力的通用多模態(tài)大模型;最后再用有標(biāo)簽的特定情感任務(wù)數(shù)據(jù)集精調(diào)通用多模態(tài)大模型,形成適配情感任務(wù)的情感計算大模型。
圖6 大模型增強情感技術(shù)路徑
大模型等通用智能技術(shù)的進步使人工智能的潛力得到逐步釋放,未來的教育將由教師和人工智能共同協(xié)作和共存,教育將步入人機融合的新時代,人工智能教師和人類教師將互相補充,共同提高教育服務(wù)的質(zhì)量(余勝泉, 2018)。在以下情境中,通用人工智能教師將展現(xiàn)其獨有的優(yōu)勢。
在大規(guī)模教育領(lǐng)域語料庫的精調(diào)訓(xùn)練,以及及時更新的外部教育專業(yè)知識庫等的增強下,基于大模型的通用人工智能教師對教育知識有著更深入的理解,且擁有根據(jù)學(xué)生個性特征進行適應(yīng)性指導(dǎo)的教學(xué)方法。一方面,通用人工智能教師可以是幫助學(xué)生答疑解惑的智能導(dǎo)師(余勝泉, 2018)。在對學(xué)生進行一對一輔導(dǎo)、學(xué)科知識問答等情景中,通用人工智能教師可利用其深入的語言理解、上下文感知能力等,精準(zhǔn)把握和理解學(xué)生學(xué)習(xí)意圖,深度分析學(xué)生的提問后給出及時、引導(dǎo)性且翔實的回答。通用人工智能教師基于豐富海量的教育知識庫向?qū)W生提供所需的事實、分析、講解、故事信息等多層次服務(wù),能激發(fā)學(xué)生好奇心和動機,幫助學(xué)生探索新知。通用人工智能教師也可以智者的方式,采用問題導(dǎo)向式、啟發(fā)式教學(xué)方法,向?qū)W生提出開放性、啟發(fā)性問題,激發(fā)學(xué)生對某一主題、問題或知識的興趣,啟發(fā)學(xué)生主動思考某一主題、問題或知識背后的原理、關(guān)聯(lián)性和深層次意義。另一方面,通用人工智能教師也可以是教師專業(yè)發(fā)展提升的協(xié)助伙伴。基于大模型的通用人工智能教師能提供更新的教材知識、專業(yè)知識、教育研究文獻、領(lǐng)域?qū)<已杏憙?nèi)容等,幫助教師及時補充專業(yè)知識理解,了解教育領(lǐng)域前沿知識、教學(xué)方法、發(fā)展現(xiàn)狀等,提升專業(yè)素養(yǎng)。
基于大模型的通用人工智能教師可以提供對教育知識的廣泛理解與遷移,尤其是不太容易建立聯(lián)系的主題,如跨學(xué)科知識的理解。首先在提升洞察力方面,通用人工智能教師利用其多領(lǐng)域、跨學(xué)科知識儲備,能整合多個領(lǐng)域的信息,幫助學(xué)生建立全局視角,以跨學(xué)科方式,助力學(xué)生理解問題的多個方面,建立更全面的知識體系,培養(yǎng)學(xué)生整體性思維。例如,探討以“長征”為主題的課程思政教育,通用人工智能教師能巧妙地將學(xué)科教學(xué)與思政教育相結(jié)合,從歷史、道德與法治、語文、體育等學(xué)科挖掘思政教育元素,幫助學(xué)生從多個方面、不同角度理解“長征”及其背后的精神,拓寬思維邊界。其次在創(chuàng)意增強方面,通用人工智能教師可以是創(chuàng)意寫作助手,以協(xié)同共創(chuàng)方式輔助學(xué)生寫作。學(xué)生開展創(chuàng)意寫作時,通用人工智能教師不僅能基于寫作主題提供時效強、具有啟發(fā)性的相關(guān)或跨學(xué)科資源與材料,還能與學(xué)生基于寫作主題展開深度交互、進行頭腦風(fēng)暴、促進多樣開放的創(chuàng)意分享(汪靖等, 2023),激發(fā)學(xué)生創(chuàng)造性思維與靈感。通用人工智能教師也能為教師處理信息檢索、知識講解、課程設(shè)計、課件制作等復(fù)雜性工作提供創(chuàng)意思路和方法(楊宗凱等, 2023)。例如,備課時通用人工智能教師提供啟發(fā)性思路、結(jié)構(gòu)化框架以及多樣化的備選方案(盧宇等, 2023a),提升教師備課效率,擴充授課內(nèi)容的豐富度。
通用人工智能教師能夠像“班主任”一樣,了解和管理學(xué)生的學(xué)習(xí)。人工智能教師能夠從人類教師的育人實踐中學(xué)習(xí),并將人類教師育人中表現(xiàn)出的情感、協(xié)作和社交能力融入人工智能系統(tǒng),提升人工智能的社會協(xié)作和情感交流能力,使人工智能模仿教師的社會化育人方式,更加智能和準(zhǔn)確地感知和滿足學(xué)生需求,與各方協(xié)力高效地解決育人問題,提高服務(wù)的水平和效率(余勝泉等, 2019a)。未來,人工智能教師能利用學(xué)業(yè)數(shù)據(jù),分析學(xué)生的學(xué)習(xí)表現(xiàn)、學(xué)習(xí)傾向、學(xué)習(xí)動力、學(xué)習(xí)難點、情感狀態(tài)等,及時發(fā)現(xiàn)學(xué)習(xí)問題、心理需求、異常行為等,主動與學(xué)生開展雙向互動和交流,與教師、家長和學(xué)生溝通,在自然的交互溝通中自動獲取信息,并采取干預(yù)措施,在問題出現(xiàn)前預(yù)防和解決,以最大限度地關(guān)注和支持學(xué)生的全面發(fā)展。
通用人工智能教師具備監(jiān)測和預(yù)防大模型濫用的交互感知能力。它通過持續(xù)監(jiān)測學(xué)生與大模型的互動,識別并預(yù)警潛在的濫用行為,如將作業(yè)一股腦丟給大模型,不加自我思考,過度依賴大模型,甚至利用大模型進行不恰當(dāng)?shù)牟樵兊?。一旦檢測到這些行為,通用人工智能教師會及時向人類教師和學(xué)生發(fā)出善意提醒和反饋,解釋這些行為不利于學(xué)習(xí)和發(fā)展的原因,并提供正確使用的建議和指導(dǎo)。通用人工智能教師具備的這種能力,使其不僅能夠理解和管理學(xué)生學(xué)習(xí)過程,還能善意地提醒和預(yù)警學(xué)生。教師也能根據(jù)反饋告知學(xué)生使用大模型等工具應(yīng)當(dāng)遵循的標(biāo)準(zhǔn)和道德,指導(dǎo)學(xué)生正確、安全地使用大模型。
通用人工智能教師在社會情感互動場景可以擔(dān)任多種角色,為學(xué)生和教師提供多方面服務(wù)。作為情感支持導(dǎo)師,通用人工智能教師能夠理解和響應(yīng)學(xué)生的情感需求,為他們提供情感診斷、陪伴和反饋,幫助他們理解和表達自我情感,提高情感表達能力,促進同伴間的情感理解和支持。作為虛擬學(xué)習(xí)伙伴,通用人工智能教師能模擬互動學(xué)習(xí)場景,創(chuàng)建學(xué)習(xí)伙伴、學(xué)習(xí)助手等社會角色。作為教育智能代理,與學(xué)生進行互動、交流,幫助他們發(fā)現(xiàn)學(xué)習(xí)問題、理解知識,同時提供情感支持和陪伴。作為育人輔助助手,通用人工智能教師能對教育過程中存在的育人意識薄弱、育人知識欠缺、個性化輔導(dǎo)答疑缺乏等問題,借助人工智能技術(shù)實現(xiàn)經(jīng)驗隱性知識的顯性化,為教師提供個性化輔助,幫助教師樹立育人意識,掌握育人知識,提升育人能力,促進孩子健康成長(余勝泉等, 2019a)。作為精準(zhǔn)教研伙伴,通用人工智能教師能夠協(xié)助教師實現(xiàn)同伴間的教學(xué)問題發(fā)現(xiàn)與互助改進,采集并分析教師在備課、聽課、評課、學(xué)生成績等多維數(shù)據(jù),幫助教師了解自己的知識結(jié)構(gòu)、教學(xué)方法和存在問題,實現(xiàn)精準(zhǔn)導(dǎo)向的教研,提高教學(xué)質(zhì)量,促進教師之間的協(xié)作與共享。
通用人工智能教師的作用不僅限于傳統(tǒng)的知識傳授,還能依據(jù)學(xué)生的個性化需求提供定制化的學(xué)習(xí)體驗。通用人工智能教師采集和分析學(xué)生學(xué)習(xí)數(shù)據(jù),結(jié)合學(xué)生的知識背景、學(xué)習(xí)水平、學(xué)習(xí)風(fēng)格、學(xué)習(xí)能力、行為表現(xiàn)、情感態(tài)度等,深入理解學(xué)生個性化學(xué)習(xí)情境、學(xué)習(xí)特點和學(xué)習(xí)需求;再利用這些信息,進行自動化評估和反饋,從而推薦適合學(xué)生的學(xué)習(xí)主題,提供合適的幫助學(xué)生跨越最近發(fā)展區(qū)的動態(tài)教學(xué)支架(余勝泉等, 2019b),生成包含文本、圖像、視頻等形態(tài)的學(xué)習(xí)材料,推薦適宜的學(xué)習(xí)路徑,提出合理的學(xué)習(xí)意見和提供個性化的學(xué)習(xí)反饋等(楊宗凱等, 2023)。
通用人工智能教師可自動批閱作文并給予反饋。例如,通用人工智能教師批閱作文時,能自動檢查用詞、拼寫、標(biāo)點、表達和邏輯等,還能指出文中的錯誤,對作文進行系統(tǒng)性點評,提出具體的改進建議,幫助學(xué)生提高寫作能力。通用人工智能教師還能通過多角色扮演,提供多維度、多視角的反饋。例如,教師教學(xué)設(shè)計時,通用人工智能教師可以扮演教育專家、同行教師、學(xué)生。作為教育專家,通用人工智能教師可以從教學(xué)目標(biāo)的設(shè)定、課程結(jié)構(gòu)、課程內(nèi)容的深度與廣度等角度提出建議;作為同行教師,通用人工智能教師可以分享相似教學(xué)情境的成功案例,提供實用的經(jīng)驗方法和教學(xué)技巧;作為學(xué)生,通用人工智能教師可以提供課程內(nèi)容的吸引力、理解難度、興趣點等反饋。
通用人工智能教師可以有效整合和處理多種模態(tài)的教學(xué)資源,并用不同形式生成與呈現(xiàn),從而提高學(xué)習(xí)材料的生動性與直觀性和學(xué)生的學(xué)習(xí)興趣。例如,講授復(fù)雜學(xué)科概念時,通用人工智能教師可以作為輔助,生成圖像和視頻展示實驗過程,生成文本和音頻解釋實驗的原理步驟。通用人工智能教師還能依據(jù)學(xué)生的具體需求和學(xué)習(xí)環(huán)境,動態(tài)調(diào)整內(nèi)容的呈現(xiàn)模態(tài)。例如,對遠程學(xué)生,通用人工智能教師可以利用互動式圖表或模擬實驗,使其獲得沉浸式、準(zhǔn)實驗室的學(xué)習(xí)交互體驗。其次,通用人工智能教師可以為教師提供多模態(tài)的教學(xué)內(nèi)容設(shè)計生成服務(wù)。它利用多模態(tài)大模型,自動搜索和整理與教學(xué)內(nèi)容相關(guān)的資源,如教學(xué)背景知識、素材圖片、微課資源、教學(xué)PPT 等,為教師提供豐富的教學(xué)材料,節(jié)省教師的時間和精力。然后,它可以根據(jù)教師提供的教學(xué)內(nèi)容,生成教學(xué)設(shè)計框架,包括教學(xué)內(nèi)容分析、學(xué)情分析、教學(xué)目標(biāo)、教學(xué)重難點、教學(xué)過程、學(xué)習(xí)評價、課后作業(yè)等結(jié)構(gòu),以及設(shè)計探究式教學(xué)、講授式教學(xué)、協(xié)作式等模式。最后,它結(jié)合搜索到的資源,生成課件、學(xué)案、教學(xué)設(shè)計方案等的教學(xué)設(shè)計內(nèi)容,使教學(xué)設(shè)計更加完整、生動和多樣。在這個過程中,教師是教學(xué)內(nèi)容的設(shè)計者、使用者和監(jiān)督者,而通用人工智能教師是信息的處理者和呈現(xiàn)者,以及內(nèi)容的創(chuàng)造者和優(yōu)化者。
大模型等生成式人工智能技術(shù)的出現(xiàn)讓人們再次體驗到信息技術(shù)對教育的沖擊。新興智能技術(shù)的出現(xiàn),加速了教育變革,如注重高階思維與能力培養(yǎng)、推動個性化學(xué)習(xí)、促進教學(xué)評價多元化(宋萑等, 2023)、創(chuàng)新“師—生—機”三元結(jié)構(gòu)教學(xué)模式等,這對人類教師來說是機遇和挑戰(zhàn)并存。
大模型等智能技術(shù)的發(fā)展,將教師從低效、重復(fù)、繁瑣的知識傳授、事務(wù)性工作解放出來,轉(zhuǎn)移到提升自身教學(xué)能力,培養(yǎng)學(xué)生高階思維、能力、素養(yǎng)等。積極探索使用通用人工智能教師,最大限度減輕教師負擔(dān),增加教師服務(wù)的數(shù)量與質(zhì)量,這是破解當(dāng)前教育改革與發(fā)展難題的關(guān)鍵。增強大模型人工智能教師,能使教師的重復(fù)性、繁瑣的工作得到解決,如自動評估學(xué)生作業(yè),根據(jù)量化和質(zhì)性標(biāo)準(zhǔn),給出評價、反饋和建議,幫助學(xué)生改進學(xué)習(xí)效果;幫助部分教學(xué)環(huán)節(jié)實現(xiàn)自動化,如自動生成試卷、評價報告等;自動跟蹤學(xué)生學(xué)習(xí)進度和成果,提供個性化的問題解答和指導(dǎo),滿足學(xué)生的不同學(xué)習(xí)需求等。這些功能可以使教師高效地完成工作,減輕工作負擔(dān),讓教師把更多的時間放在培養(yǎng)學(xué)生社會情感、創(chuàng)造力和高階思維等方面。
智能技術(shù)解放教師的同時,也給教師能力帶來挑戰(zhàn),對教師的專業(yè)能力、教育教學(xué)能力等要求會更高。因此,教師可以以人機協(xié)同的理念思考如何與智能技術(shù)合作,增強自我能力。教師要主動學(xué)習(xí)智能技術(shù),了解智能技術(shù)的原理、利弊及其基礎(chǔ)應(yīng)用等,并將其應(yīng)用于日常教學(xué)中,讓技術(shù)幫助教師解決以往難以通過傳統(tǒng)方法解決的問題,如實現(xiàn)個性化教學(xué)、調(diào)整學(xué)習(xí)進度以符合學(xué)生需求,以及采用數(shù)據(jù)分析優(yōu)化教學(xué)策略等。大模型等智能技術(shù)能幫助教師實現(xiàn)對學(xué)生學(xué)習(xí)行為和風(fēng)格等的深度理解,精準(zhǔn)診斷學(xué)生的學(xué)習(xí)需求,并為其提供量身定制的解決方案。
智能技術(shù)對教師角色也帶來挑戰(zhàn)。通用智能時代下,教師工作形態(tài)將發(fā)生巨大改變,知識性教學(xué),大部分將由人工智能承擔(dān),教師更多的是負責(zé)學(xué)習(xí)的設(shè)計、督促、激勵與陪伴,教師更多的工作是育人與學(xué)生的情感交流等(余勝泉等, 2019b)。教師要學(xué)會駕馭智能技術(shù),將智能技術(shù)真正應(yīng)用到教學(xué)中。首先,智能技術(shù)的進化,對教師提出高智慧層次指導(dǎo)的要求。教師因此要提升智能素養(yǎng)、素質(zhì)素養(yǎng),適應(yīng)智能教育場景的需求。其次,教學(xué)方式、教學(xué)模式、教學(xué)內(nèi)容、教學(xué)評價要使用智能技術(shù)進行創(chuàng)新和調(diào)整。積極使用智能技術(shù)創(chuàng)新教學(xué)方式,設(shè)置以素養(yǎng)為導(dǎo)向的教學(xué)內(nèi)容,加入能夠促進學(xué)生深度思考和深度學(xué)習(xí)能力的活動,建立多元、質(zhì)性的教育評價方式。再次,教師要利用智能技術(shù)促進專業(yè)發(fā)展。智能技術(shù)可以為教師提供專業(yè)知識、教材知識、教育研究文獻等資源,擴充教師專業(yè)知識理解,開拓教師眼界,了解教育前沿發(fā)展,提升專業(yè)素養(yǎng)。最后,智能技術(shù)能為教師教研提供精準(zhǔn)輔助,分析教師教學(xué)問題與不足,并提出針對性建議。
通用智能時代下,教師的機遇和挑戰(zhàn)不是擔(dān)憂被智能技術(shù)取代,而是轉(zhuǎn)為人協(xié)協(xié)同的理念,更好地利用智能技術(shù)惠利教師教學(xué)。首先,教師要了解大模型等智能技術(shù)的可為與不可為。智能技術(shù)雖然可以輔助、增強教學(xué),卻不能代替深入的研究、分析和批判性思考,因此教師不能完全依賴智能技術(shù),要認識到思維的重要性。其次,教師可以向?qū)W生傳達智能技術(shù)的利弊,讓學(xué)生意識到使用智能技術(shù)中深度思考的意義與作用。教師要推進核心素養(yǎng)導(dǎo)向的深度教學(xué),幫助學(xué)生跨越人工智能應(yīng)用中認知外包可能導(dǎo)致的教育陷阱(余勝泉等, 2023)。再者,教師可以持續(xù)監(jiān)督并評估大模型的使用,高度關(guān)注大模型等智能技術(shù)帶來的倫理和數(shù)據(jù)隱私風(fēng)險。