羅江華 張玉柳
摘要:數(shù)字教育資源在推進(jìn)教育高質(zhì)量發(fā)展的過(guò)程中扮演著重要角色。人工智能時(shí)代,如何讓數(shù)字教育資源從之前的“讓人適應(yīng)”變?yōu)槟堋爸鲃?dòng)適應(yīng)人”,是數(shù)字教育資源建設(shè)亟待解決的關(guān)鍵問(wèn)題。隨著人工智能生成內(nèi)容(AIGC)應(yīng)用場(chǎng)景的持續(xù)拓展,跨模態(tài)理解與重構(gòu)技術(shù)為破解數(shù)字教育資源的適應(yīng)性問(wèn)題提供了可行的技術(shù)支持。具體而言,就是主張“人—境—機(jī)—物”多主體協(xié)同,利用跨模態(tài)理解與重構(gòu)技術(shù)對(duì)復(fù)雜教育情境中的多模態(tài)教學(xué)行為和多模態(tài)數(shù)字教育資源進(jìn)行智能挖掘和耦合計(jì)算,實(shí)現(xiàn)適用于人機(jī)協(xié)同環(huán)境的教育資源推薦,挖掘數(shù)字教育資源服務(wù)的供需適配關(guān)系,達(dá)成數(shù)字教育資源生成鏈的自我調(diào)度,由此即可構(gòu)建起適應(yīng)性數(shù)字教育資源模型。在實(shí)踐推進(jìn)層面,應(yīng)構(gòu)建起包括數(shù)據(jù)采集層、智能分析層、規(guī)則約束層、應(yīng)用服務(wù)層四個(gè)層次的適應(yīng)性數(shù)字教育資源實(shí)踐框架,以期在對(duì)多模態(tài)教育資源和師生行為進(jìn)行跨模態(tài)理解的基礎(chǔ)上,切實(shí)推進(jìn)對(duì)數(shù)字教育資源的智能管理和個(gè)性化服務(wù)。
關(guān)鍵詞:跨模態(tài)重構(gòu);跨模態(tài)理解;適應(yīng)性數(shù)字教育資源;人機(jī)協(xié)同;AIGC
中圖分類(lèi)號(hào):G434 ? 文獻(xiàn)標(biāo)識(shí)碼:A ? ?文章編號(hào):1009-5195(2023)06-0091-11 ?doi10.3969/j.issn.1009-5195.2023.06.011
基金項(xiàng)目:國(guó)家社會(huì)科學(xué)基金2021年度教育學(xué)重點(diǎn)課題“以教育新基建支撐高質(zhì)量教育體系建設(shè)研究”(ACA210010)。
作者簡(jiǎn)介:羅江華,博士,教授,博士生導(dǎo)師,西南大學(xué)西南民族教育與心理研究中心(重慶 400715);張玉柳,博士研究生,西南大學(xué)西南民族教育與心理研究中心(重慶 400715)。
一、引言
在我國(guó)推進(jìn)教育高質(zhì)量發(fā)展的過(guò)程中,數(shù)字教育資源扮演著重要角色。聚合起高質(zhì)量、體系化、多類(lèi)型的數(shù)字教育資源,能有效推動(dòng)教育資源的數(shù)字化與配置公平化,可滿足學(xué)習(xí)者個(gè)性化選擇的需求(懷進(jìn)鵬,2023)。這意味著要全面提升數(shù)字教育資源服務(wù)的適應(yīng)性能力(羅江華等,2023),以科技創(chuàng)新為基點(diǎn)推動(dòng)優(yōu)質(zhì)資源聚合,不斷提升數(shù)字教育資源的供需適配度(鄭永和等,2023),并加強(qiáng)對(duì)其的智能化組織管理和監(jiān)管評(píng)價(jià)(柯清超等,2023)。
跨模態(tài)理解與重構(gòu)是人工智能生成內(nèi)容(AI-Generated Content,AIGC)的關(guān)鍵技術(shù),其引領(lǐng)的AIGC應(yīng)用效果和質(zhì)量大幅提升,應(yīng)用模式從專(zhuān)用走向通用,應(yīng)用流程從分發(fā)走向生成,應(yīng)用場(chǎng)景從單一走向多元(吳砥等,2023)。這些突破不僅為數(shù)字教育資源個(gè)性化服務(wù)提供了技術(shù)支撐,而且為破解數(shù)字教育資源的適應(yīng)性生成難題提供了可能。傳統(tǒng)數(shù)字教育資源服務(wù)雖然具有“人工累積、標(biāo)準(zhǔn)化供給”的鮮明特征,但也存在效率低和制作成本高的缺陷(陳明選等,2021)。而應(yīng)用跨模態(tài)理解與重構(gòu)技術(shù),可幫助人機(jī)高質(zhì)量協(xié)作,更好地理解數(shù)字教育資源的屬性、資源關(guān)聯(lián)、語(yǔ)義信息,以及教學(xué)對(duì)象的行為意圖,處理和分析復(fù)雜教學(xué)過(guò)程中的多模態(tài)數(shù)據(jù),通過(guò)迭代優(yōu)化智能生成數(shù)字教育資源,進(jìn)而實(shí)現(xiàn)“知識(shí)魔法”,即根據(jù)師生的偏好和需求來(lái)提供個(gè)性化教育資源服務(wù)(楊欣,2023)。
本研究關(guān)注如何基于跨模態(tài)理解與重構(gòu)技術(shù)為師生生成適應(yīng)性數(shù)字教育資源。一方面,從多模態(tài)教學(xué)行為特征視角對(duì)數(shù)字教育資源應(yīng)用的復(fù)雜性進(jìn)行深入探究,利用跨模態(tài)理解與重構(gòu)技術(shù)實(shí)現(xiàn)對(duì)多模態(tài)教學(xué)行為和多模態(tài)數(shù)字教育資源的系統(tǒng)化建模分析,并探究適應(yīng)性數(shù)字教育資源形成要素之間的交互作用模式;另一方面,挖掘適應(yīng)性數(shù)字教育資源生成及應(yīng)用的適配機(jī)理,并分析其對(duì)于人機(jī)協(xié)同教育生態(tài)發(fā)展的核心價(jià)值。
二、相關(guān)概念詮釋
1.跨模態(tài)理解與重構(gòu)
多模態(tài)和跨模態(tài)技術(shù)經(jīng)常被同時(shí)使用,以實(shí)現(xiàn)更全面、更準(zhǔn)確和更高效的信息處理和分析。多模態(tài)技術(shù)(Multimodal Technology)是一種使不同信息形態(tài)相互作用和協(xié)同的技術(shù),旨在將文字、圖像、聲音和視頻等加以集成和融合,從而提供更豐富、靈活和個(gè)性化的交互體驗(yàn)和表達(dá)方式(吳友政等,2022)。而跨模態(tài)技術(shù)(Cross-Modal Technology)則是一種在不同感知模態(tài)之間進(jìn)行信息交換和處理的技術(shù),旨在將不同感知模態(tài)的信息進(jìn)行相互轉(zhuǎn)換和整合(陳寧等,2021)。由此可見(jiàn),多模態(tài)技術(shù)注重如何融合和整合不同模態(tài)的信息,而跨模態(tài)技術(shù)則側(cè)重如何建立不同模態(tài)數(shù)據(jù)之間的聯(lián)系和橋梁。
多模態(tài)與跨模態(tài)技術(shù)的持續(xù)發(fā)展和廣泛應(yīng)用催生了跨模態(tài)理解與重構(gòu)的進(jìn)化。跨模態(tài)理解(Cross-Modal Understanding)是指在多個(gè)不同的感知模態(tài)之間建立聯(lián)系,目的是將不同感知模態(tài)的信息進(jìn)行整合,以促進(jìn)更加全面、準(zhǔn)確的理解和推理(Liu et al.,2021)。例如,將文章中的圖片、視頻等多模態(tài)元素與文章內(nèi)容結(jié)合起來(lái),就可更好地把握文章主旨??缒B(tài)重構(gòu)(Cross-Modal Reconstruction)是指利用一種或多種感知模態(tài)的信息來(lái)生成另一種感知模態(tài)的信息,目的是利用不同感知模態(tài)之間的相互關(guān)系來(lái)彌補(bǔ)信息缺失或豐富信息表達(dá)(Choi et al.,2020)。例如,將音頻轉(zhuǎn)化為視頻,或?qū)D像轉(zhuǎn)化為三維模型。
2.適應(yīng)性數(shù)字教育資源
適應(yīng)性被認(rèn)為是數(shù)字資源服務(wù)的重要發(fā)展方向,旨在提升數(shù)字交互的匹配度和友好性,其重點(diǎn)是以師生興趣為導(dǎo)向(Mérida et al.,2010)。Rozo等(2019)認(rèn)為適應(yīng)性數(shù)字教育資源應(yīng)當(dāng)突出資源使用情境、內(nèi)容表示、界面呈現(xiàn)和流程提示,其設(shè)計(jì)目的是增強(qiáng)學(xué)習(xí)體驗(yàn),引導(dǎo)學(xué)生在學(xué)習(xí)活動(dòng)中自定步調(diào)進(jìn)行學(xué)習(xí)。羅江華等(2022)強(qiáng)調(diào)應(yīng)以師生真實(shí)需求和個(gè)性特征為數(shù)字教育資源服務(wù)的前提,重點(diǎn)提升數(shù)字教育資源生成與教學(xué)應(yīng)用之間的適配性。
從發(fā)展趨勢(shì)看,適應(yīng)性數(shù)字教育資源的建設(shè)和應(yīng)用已經(jīng)超越了作為“資源平臺(tái)和資源池”的初級(jí)階段,現(xiàn)已建立起多主體協(xié)同、跨模態(tài)耦合和適應(yīng)性增強(qiáng)的計(jì)算模型,并且強(qiáng)調(diào)“模型即服務(wù)”(楊洋等,2022)。在這個(gè)服務(wù)過(guò)程中,如何促進(jìn)多模態(tài)資源的有效識(shí)別、轉(zhuǎn)化與匯聚,是滿足師生對(duì)資源個(gè)性化需求的關(guān)鍵。這在本質(zhì)上是數(shù)字教育資源的跨模態(tài)生成,即將不同模態(tài)的資源進(jìn)行有機(jī)融合,以生成新的、具有豐富信息且適配于教學(xué)活動(dòng)的跨模態(tài)數(shù)據(jù)(?elaszczyk et al.,2023)。更為重要的是,適應(yīng)性數(shù)字教育資源的組織與應(yīng)用,需從跨模態(tài)實(shí)體語(yǔ)義關(guān)系知識(shí)模型出發(fā),引入面向教學(xué)場(chǎng)景的師生用戶模型與智能計(jì)算服務(wù)框架(林健等,2022);還需依據(jù)學(xué)習(xí)者特征實(shí)現(xiàn)資源的適應(yīng)性設(shè)計(jì)、生成與供給的智能服務(wù),尤其要重點(diǎn)設(shè)計(jì)“內(nèi)容”與“結(jié)構(gòu)”松耦合的適應(yīng)性學(xué)習(xí)資源模型(王琦等,2022)。
三、適應(yīng)性數(shù)字教育資源的價(jià)值定位
推進(jìn)適應(yīng)性數(shù)字教育資源建設(shè),已成為教育數(shù)字化行動(dòng)戰(zhàn)略的關(guān)鍵環(huán)節(jié)。具體來(lái)說(shuō),探究教育資源智能化服務(wù)過(guò)程中的人機(jī)交互規(guī)律,明確了解、理解和響應(yīng)師生需求,提升數(shù)字教育資源的交互性與適配程度,既是數(shù)字教育資源服務(wù)質(zhì)量提升的目標(biāo),也是適應(yīng)性數(shù)字教育資源的價(jià)值指向。
1.切實(shí)推進(jìn)人機(jī)協(xié)同環(huán)境下的教育資源推薦
伴隨智能技術(shù)深度介入教育情境,構(gòu)建人機(jī)協(xié)同學(xué)習(xí)的智慧教育情境(彭紅超等,2018)變得越來(lái)越容易。此種情境下,人和機(jī)之間的互動(dòng)不是簡(jiǎn)單的機(jī)械式操作,而是一種共軛共生的關(guān)系,即以人的價(jià)值為根本遵循,借助智能技術(shù)實(shí)現(xiàn)個(gè)體的自我發(fā)展(艾興等,2020)。適應(yīng)性數(shù)字教育資源模型的運(yùn)行機(jī)制便是一種借助技術(shù)的中介效應(yīng)打破人、機(jī)與物之間的邊界,探析“人—境—機(jī)—物”多主體之間復(fù)雜信息交換和多元交互的機(jī)制。其主要體現(xiàn)在三個(gè)方面:在適應(yīng)性數(shù)字教育資源的數(shù)據(jù)采集與理解階段,人機(jī)協(xié)同是師生主觀感知和智能傳感器采集信息的有效聚合。在信息處理階段,人機(jī)協(xié)同是將師生行為特征、教育資源與機(jī)器強(qiáng)大的算力結(jié)合起來(lái),進(jìn)而建構(gòu)新的資源適應(yīng)性推薦途徑。在數(shù)據(jù)輸出階段,人機(jī)協(xié)同是將教育教學(xué)的發(fā)展規(guī)律和機(jī)器的算法決策相聯(lián)結(jié),從而助益教育資源應(yīng)用的優(yōu)化與決策(劉偉,2021)。
2.精準(zhǔn)反饋數(shù)字教育資源服務(wù)的供需適配關(guān)系
由于“技術(shù)是工具”的論斷并沒(méi)有充分考慮教育對(duì)象的意向性,因而導(dǎo)致技術(shù)的情境適應(yīng)性缺失的問(wèn)題(蔡連玉等,2023)。近來(lái)已有研究關(guān)注到師生行為需求對(duì)于提升個(gè)性化教育資源服務(wù)效率具有積極作用,但領(lǐng)域知識(shí)組織架構(gòu)中知識(shí)來(lái)源類(lèi)型單一、更新緩慢以及師生特征識(shí)別率不高等問(wèn)題,已成為阻礙教育資源應(yīng)用效率提升的關(guān)鍵原因。而適應(yīng)性數(shù)字教育資源的研究正是依托數(shù)據(jù)科學(xué)和人工智能技術(shù)支持,利用先進(jìn)的感知技術(shù)和數(shù)據(jù)挖掘方法,對(duì)師生多模態(tài)教學(xué)行為和多模態(tài)數(shù)字教育資源進(jìn)行多層次、細(xì)粒度的精準(zhǔn)建模,即從師生需求側(cè)和資源供給側(cè)兩方面進(jìn)行耦合計(jì)算,動(dòng)態(tài)反饋數(shù)字教育資源服務(wù)的供需適配關(guān)系,以便在數(shù)字教育環(huán)境下實(shí)現(xiàn)資源的精準(zhǔn)適配和定制,推動(dòng)數(shù)字教育資源的形式多樣化、內(nèi)容境遇化、交互動(dòng)態(tài)化以及服務(wù)智能化。
3.真正實(shí)現(xiàn)數(shù)字教育資源生成鏈的自我調(diào)度
人工智能技術(shù)在很大程度上已變革了教育教學(xué)的組織方式,其技術(shù)整合范式強(qiáng)調(diào)多通道推送知識(shí)和技術(shù),重視利用數(shù)字技術(shù)賦能數(shù)字教育資源動(dòng)態(tài)、靈活地自我組織,以促進(jìn)學(xué)生對(duì)知識(shí)的深度習(xí)得(蔡連玉等,2023)。適應(yīng)性數(shù)字教育資源服務(wù)的核心是基于人工智能算法賦能數(shù)字教育資源生成、流轉(zhuǎn)和應(yīng)用等全流程智能化。從資源生成鏈的角度來(lái)看,適應(yīng)性數(shù)字教育資源提供了更加靈活的資源生成和管理方式,其優(yōu)點(diǎn)在于能夠?yàn)閿?shù)字教育資源生成提供更好的自我調(diào)度功能,提高數(shù)字教育資源的多模態(tài)融合度和復(fù)用性。同時(shí),適應(yīng)性數(shù)字教育資源也能更好地管理數(shù)字教育資源的生命周期,及時(shí)更新和優(yōu)化資源內(nèi)容和形式,實(shí)現(xiàn)對(duì)適應(yīng)性數(shù)字教育資源服務(wù)涉及的數(shù)據(jù)流、算法流、知識(shí)流等多層次和多維度的理解、優(yōu)化及數(shù)據(jù)化表征,提高數(shù)字教育資源的豐富性和實(shí)用性,滿足師生多樣化的教與學(xué)需求。
四、基于跨模態(tài)理解與重構(gòu)的適應(yīng)性數(shù)字教 育資源模型構(gòu)建
智慧教學(xué)是由“人—機(jī)—物”等多主體在“物理—信息—心理”等多空間相互作用的復(fù)雜過(guò)程,面臨多空間融合、多主體協(xié)同、多環(huán)節(jié)匯通、多模式適配等挑戰(zhàn)(劉三女牙等,2021)。同理,適應(yīng)性數(shù)字教育資源的生成亦可以認(rèn)為是在“人—境—機(jī)—物”等多主體協(xié)同下,有效實(shí)現(xiàn)資源多元化和師生意向性全面融合的過(guò)程(闕玉葉,2022)。為指導(dǎo)具體實(shí)踐活動(dòng),須建構(gòu)基于跨模態(tài)理解與重構(gòu)的適應(yīng)性數(shù)字教育資源模型,詮釋適應(yīng)性數(shù)字教育資源動(dòng)態(tài)生成的內(nèi)在機(jī)理。
1.設(shè)計(jì)理念:資源“適應(yīng)”人的意向性
迄今為止,對(duì)于人類(lèi)主體性的強(qiáng)調(diào)是人工智能時(shí)代的一個(gè)關(guān)鍵議題?!耙匀藶楸尽睒?biāo)尺下的人機(jī)協(xié)同,是現(xiàn)階段人工智能在教育領(lǐng)域內(nèi)“植入”式發(fā)展的必由之路(喻國(guó)明,2022)。傳統(tǒng)的教育資源供給通常是固定的、預(yù)設(shè)的,師生只能按照既定步驟和內(nèi)容進(jìn)行學(xué)習(xí)和實(shí)踐。隨著人工智能生成內(nèi)容技術(shù)的發(fā)展,有必要通過(guò)精準(zhǔn)理解師生多模態(tài)教學(xué)行為,探明其具體的資源需求,把握其資源意向與資源智能推送之間的適配關(guān)系。只有當(dāng)師生積極表達(dá)自己的資源需求,以及計(jì)劃如何發(fā)展新的知識(shí)時(shí),適應(yīng)性數(shù)字教育資源才能更好地進(jìn)行定制化生成。因此,適應(yīng)性數(shù)字教育資源模型應(yīng)當(dāng)遵循資源“適應(yīng)”人的設(shè)計(jì)理念,考慮如何依據(jù)師生的需求和反饋信息進(jìn)行資源的智能組織和推薦優(yōu)化,從而靈活、智能地為師生提供生成性教育資源。
2.要素篩選:適應(yīng)性數(shù)字教育資源模型分析
通過(guò)梳理和分析自2010年以來(lái)國(guó)際上主流的適應(yīng)性教育資源模型(見(jiàn)表1)發(fā)現(xiàn),其共同涉及的關(guān)鍵要素可以概括為:人(學(xué)生與老師)、境(教育情境)、機(jī)(智能設(shè)備與技術(shù))、物(教育資源)四個(gè)方面。厘清各關(guān)鍵要素的潛在特征及其交互作用機(jī)制,是適應(yīng)性數(shù)字教育資源有效生成的重要前提。
(1)人:學(xué)生與教師
人是教育的主體,本研究中主要指教師和學(xué)生。教師是教學(xué)活動(dòng)的組織者與指導(dǎo)者,其外顯行為主要包括話語(yǔ)、肢體動(dòng)作、教學(xué)設(shè)備使用以及與學(xué)生的互動(dòng)情況等。學(xué)生是學(xué)習(xí)活動(dòng)的主體,其外顯行為表現(xiàn)為表情、話語(yǔ)、學(xué)習(xí)風(fēng)格、學(xué)習(xí)日志、身體動(dòng)作,以及與學(xué)習(xí)終端、教師或其他感知設(shè)備的交互等;其內(nèi)隱行為表現(xiàn)為認(rèn)知、情感、動(dòng)機(jī)以及生理特征等。
(2)境:教育情境
“境”通常是指教育活動(dòng)所發(fā)生的場(chǎng)所和環(huán)境,包括傳統(tǒng)的課堂教學(xué)場(chǎng)景、實(shí)驗(yàn)室教學(xué)場(chǎng)景、實(shí)習(xí)教學(xué)場(chǎng)景、在線學(xué)習(xí)場(chǎng)景以及虛擬教學(xué)場(chǎng)景等,具有多樣性和復(fù)雜性。在教育情境中,師生通過(guò)進(jìn)行有效的教學(xué)和學(xué)習(xí)活動(dòng),可實(shí)現(xiàn)知識(shí)的傳遞和學(xué)習(xí)目標(biāo)的達(dá)成。
(3)機(jī):智能設(shè)備與技術(shù)
“機(jī)”是指支持教與學(xué)的智能技術(shù)或應(yīng)用設(shè)備,本研究中主要是指利用智能設(shè)備與技術(shù)等對(duì)多模態(tài)數(shù)據(jù)進(jìn)行挖掘分析。具體而言,智能設(shè)備主要是指通過(guò)計(jì)算機(jī)技術(shù)和傳感器技術(shù)實(shí)現(xiàn)自主智能的設(shè)備,如智能學(xué)習(xí)設(shè)備、VR頭盔、眼動(dòng)儀、高清攝像頭等,其通常擁有高度的聯(lián)網(wǎng)能力,可通過(guò)互聯(lián)網(wǎng)與其他設(shè)備及云端服務(wù)進(jìn)行交互,從而提供更加智能化的服務(wù)。而智能技術(shù)則是指利用人工智能、大數(shù)據(jù)、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理等技術(shù),對(duì)資源數(shù)據(jù)進(jìn)行處理和挖掘,從而實(shí)現(xiàn)智能化的資源組織與決策。
(4)物:適應(yīng)性數(shù)字教育資源
“物”主要是指適應(yīng)性數(shù)字教育資源,其能夠根據(jù)多模態(tài)教學(xué)行為特征,自動(dòng)適應(yīng)人的意向并生成智能化組織的數(shù)字教育資源。適應(yīng)性數(shù)字教育資源的應(yīng)用范圍非常廣泛,既可應(yīng)用于各級(jí)各類(lèi)教育階段和學(xué)科領(lǐng)域,為學(xué)生提供更加個(gè)性化的教育服務(wù),幫助學(xué)生更好地掌握知識(shí)和技能;同時(shí)也可為教師提供更具針對(duì)性的教學(xué)方案和資源,提高教學(xué)效果和質(zhì)量。適應(yīng)性數(shù)字教育資源具有三方面的特點(diǎn):一是通過(guò)改變內(nèi)容結(jié)構(gòu)邏輯及知識(shí)組織方式體現(xiàn)其復(fù)合性,二是通過(guò)提升多元化的內(nèi)容生產(chǎn)體現(xiàn)其多樣性,三是通過(guò)提升資源育人的功能效果體現(xiàn)其增值性。
3.模型構(gòu)建:基于跨模態(tài)理解與重構(gòu)的適應(yīng)性數(shù)字教育資源建模
結(jié)合馬海云等(2022)所設(shè)計(jì)的面向知識(shí)服務(wù)的領(lǐng)域知識(shí)結(jié)構(gòu),本研究首先對(duì)適應(yīng)性數(shù)字教育資源中的知識(shí)組織進(jìn)行了分層聚類(lèi),在此基礎(chǔ)上構(gòu)建了如圖1所示的基于跨模態(tài)理解與重構(gòu)的適應(yīng)性數(shù)字教育資源模型,以探析適應(yīng)性數(shù)字教育資源的動(dòng)態(tài)生成機(jī)制。
(1)多主體協(xié)同
在人工智能為教育領(lǐng)域全面賦能的背景下,傳統(tǒng)的“師生”二元關(guān)系逐漸被“人—境—機(jī)—物”多主體協(xié)同互動(dòng)的新型關(guān)系所取代,且貫穿當(dāng)前數(shù)字化教學(xué)的全過(guò)程(張樂(lè)樂(lè)等,2022)。在“人—境—機(jī)—物”多主體協(xié)同互動(dòng)的智慧教學(xué)中,只有實(shí)現(xiàn)了不同主體間數(shù)據(jù)的共享和互通,才能實(shí)現(xiàn)人與“機(jī)”、人與“物”之間的協(xié)同,即“機(jī)”要為不同“境”下的人提供智能化和個(gè)性化的“物”。
(2)跨模態(tài)耦合
適應(yīng)性數(shù)字教育資源的動(dòng)態(tài)能力形成需依據(jù)智能技術(shù)對(duì)多模態(tài)教育資源和多模態(tài)教學(xué)行為分別進(jìn)行理解和表征。如圖1所示,跨模態(tài)數(shù)據(jù)理解能力U可以分為跨模態(tài)師生行為理解能力U1和跨模態(tài)數(shù)字教育資源理解能力U2兩種子能力,耦合兩種理解能力能夠形成跨模態(tài)教育資源重構(gòu)能力R,R可表示為公式(1):
R=f(U1,U2) ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(1)
其中,f(·)表示跨模態(tài)數(shù)據(jù)理解能力對(duì)跨模態(tài)教育資源重構(gòu)能力的影響函數(shù)?;诳缒B(tài)重構(gòu)生成的數(shù)字教育資源可以有效反映出適應(yīng)性數(shù)字教育資源的動(dòng)態(tài)能力D,D可表示為公式(2):
D=g(R) ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(2)
其中,g(·)表示跨模態(tài)數(shù)字教育資源重構(gòu)能力對(duì)適應(yīng)性數(shù)字教育資源動(dòng)態(tài)能力的影響函數(shù)。由此適應(yīng)性數(shù)字教育資源的動(dòng)態(tài)能力可表示為公式(3):
D=g(R)=g(f(U1,U2)) ? ? ? ? ? ?(3)
跨模態(tài)師生行為理解能力與跨模態(tài)數(shù)字教育資源理解能力通過(guò)跨模態(tài)數(shù)字教育資源重構(gòu)能力相互耦合,形成適應(yīng)性數(shù)字教育資源的動(dòng)態(tài)能力,其生成機(jī)理符合楊現(xiàn)民等所提出的資源進(jìn)化模式(楊現(xiàn)民等,2011)。其中,跨模態(tài)資源理解屬于其“資源的內(nèi)容進(jìn)化”模式,即“量變”;跨模態(tài)資源重構(gòu)屬于其“資源的關(guān)聯(lián)進(jìn)化”模式,即“質(zhì)變”,“量質(zhì)并舉”形成了適應(yīng)性數(shù)字教育資源高效生成的動(dòng)態(tài)能力。
跨模態(tài)數(shù)據(jù)理解包括多模態(tài)教育資源和多模態(tài)教學(xué)行為理解兩種類(lèi)型,如圖2所示,其主要目的是對(duì)不同模態(tài)的數(shù)據(jù)進(jìn)行識(shí)別、理解與融合,以此作為后續(xù)數(shù)字教育資源適應(yīng)性重構(gòu)的基礎(chǔ)。跨模態(tài)數(shù)據(jù)理解類(lèi)似于企業(yè)中通常遵循的資源編排理論,根據(jù)發(fā)展需求對(duì)不同表現(xiàn)形式的資源進(jìn)行識(shí)別、理解后的拆解、重構(gòu),從而改變數(shù)字內(nèi)容的生產(chǎn)邏輯及形式。
跨模態(tài)資源理解是為了保障跨模態(tài)資源消除冗余,降低不必要的復(fù)雜度,以及提高數(shù)字資源的高韌性和可理解性。通常來(lái)說(shuō),一個(gè)知識(shí)點(diǎn)可以用含有其語(yǔ)義信息的圖片、文本、音視頻等不同模態(tài)的資源來(lái)表示。在對(duì)齊序列場(chǎng)景下,若干個(gè)多模態(tài)數(shù)據(jù)組成一組,使用單模態(tài)編碼器處理輸入文本、音頻、視頻和圖像等模態(tài)信息后,可得到初始文本嵌入T={t1,...,tn}、音頻嵌入A={a1,...,an},視頻嵌入V={v1,...,vn}和圖像嵌入I={i1,...,in}等。為了建模文本、視覺(jué)和音頻之間的跨模態(tài)交互,引入基于Transformer的跨模態(tài)編碼器將多模態(tài)表征的高維稀疏特征向量轉(zhuǎn)換為低維稠密特征向量,并映射到一個(gè)統(tǒng)一的表征空間。然后通過(guò)跨模態(tài)關(guān)聯(lián)建模獲取具有語(yǔ)義一致性的跨模態(tài)資源,進(jìn)而增強(qiáng)后續(xù)生成內(nèi)容的內(nèi)在邏輯性。此外,對(duì)于學(xué)習(xí)資源內(nèi)容的上下文表征M可用公式(4)表示,其中[;]表示組合操作(Liu et al.,2021)。
M=CrossEncoder([T;A;V;…;I]) ? ? ?(4)
除了綜合跨模態(tài)教育資源的語(yǔ)義關(guān)聯(lián),還需集約師生的資源需求,這是一個(gè)更復(fù)雜的多模態(tài)信息處理問(wèn)題。跨模態(tài)教學(xué)行為理解與跨模態(tài)資源理解的技術(shù)實(shí)現(xiàn)過(guò)程大體一致,既要正確理解師生資源需求,也要更好地表示和記錄師生的多模態(tài)教學(xué)行為數(shù)據(jù),尤其要重點(diǎn)關(guān)注師生的心理、認(rèn)知、情感狀態(tài),從而建立物理空間、生理空間、心理空間、數(shù)字空間四位一體的資源需求理解機(jī)制。
教育資源蘊(yùn)含著多元價(jià)值,跨模態(tài)資源重構(gòu)可以實(shí)現(xiàn)多種表現(xiàn)形式的學(xué)習(xí)資源的轉(zhuǎn)換、重構(gòu)和生成,為師生提供最適合他們需求的資源服務(wù)??缒B(tài)資源重構(gòu)更關(guān)注全局信息,其核心是“應(yīng)變”,需依據(jù)跨模態(tài)師生行為理解和跨模態(tài)教育資源理解的量化表征而生成適應(yīng)性教育資源。其中,資源重構(gòu)能力是教育資源動(dòng)態(tài)能力的低階構(gòu)成(Teece et al.,1997)。資源重構(gòu)具有兩個(gè)維度,即資源重組(Recombination)與資源重置(Reallocation)(Karim,2006)。資源重組涉及資源之間的相互作用,旨在使資源之間重新組合形成新的資源,類(lèi)似于資源之間所發(fā)生的“化學(xué)變化”。資源重置不涉及資源之間的相互作用,僅指通過(guò)融合或精簡(jiǎn)的方式對(duì)資源進(jìn)行重新分配,類(lèi)似于資源之間所發(fā)生的“物理變化”(Karim et al.,2004)。在本研究中,資源重構(gòu)是指對(duì)已有教育資源進(jìn)行優(yōu)化和重組并生成適應(yīng)性資源的技術(shù)。其流程如圖3所示。
鑒于不同模態(tài)的資源在具體事件和應(yīng)用中具有高度相關(guān)性,因此為了更好地以師生的意向性為導(dǎo)向從中抽取具有因果性、區(qū)分性、顯著性和魯棒性的有效特征,研究將跨模態(tài)資源語(yǔ)義圖譜假設(shè)為Gr=G(Vr,Er),其中Vr是節(jié)點(diǎn)集合,Er是邊集合;將跨模態(tài)師生特征圖譜假設(shè)為Gf=(Vf,Ef),其中Vf是節(jié)點(diǎn)集合,Ef是邊集合;通過(guò)利用Gr和Gf對(duì)多模態(tài)教育資源進(jìn)行跨模態(tài)重構(gòu),即可生成適應(yīng)性數(shù)字教育資源,步驟如下:
第一,將跨模態(tài)資源語(yǔ)義圖譜和跨模態(tài)師生特征圖譜進(jìn)行關(guān)聯(lián),以獲取耦合圖譜G=(V,E),其中V=Vr∪Vf,表示節(jié)點(diǎn)集合的并集;E=Er∪Ef,表示邊集合的并集。然后利用加權(quán)鄰接矩陣A∈Rn×n來(lái)表征耦合圖譜的結(jié)構(gòu),其中n=|V|,表示耦合圖譜中的節(jié)點(diǎn)數(shù)量。A中的每個(gè)元素aij表示節(jié)點(diǎn)i和節(jié)點(diǎn)j之間的連接權(quán)重。
第二,將耦合圖譜G中的節(jié)點(diǎn)特征表示為一個(gè)矩陣X∈Rn×d,其中d是節(jié)點(diǎn)特征的維度;再將節(jié)點(diǎn)i的特征表示為xi∈Rd。具體地,對(duì)于跨模態(tài)資源語(yǔ)義圖譜中的節(jié)點(diǎn),利用其語(yǔ)義信息來(lái)表示其特征;對(duì)于跨模態(tài)師生特征圖譜中的節(jié)點(diǎn),利用其教學(xué)行為和應(yīng)用語(yǔ)境信息來(lái)表示其特征。
第三,使用圖卷積神經(jīng)網(wǎng)絡(luò)(Graph Convolution Network,GCN)對(duì)耦合圖譜進(jìn)行表示和學(xué)習(xí)(Kipf et al.,2016),定義每個(gè)圖卷積層的傳播規(guī)則為公式(5):
第四,利用節(jié)點(diǎn)表示矩陣H(L),通過(guò)注意力機(jī)制、多層感知器等進(jìn)行資源內(nèi)容預(yù)選,對(duì)數(shù)值、時(shí)間等類(lèi)型數(shù)據(jù)進(jìn)行推理,實(shí)現(xiàn)聯(lián)合訓(xùn)練和優(yōu)化,從而克服多模態(tài)資源之間的異構(gòu)鴻溝。同時(shí)定義一個(gè)前向傳播函數(shù)f∶H(L)→Y,其中Y表示生成的適應(yīng)性數(shù)字教育資源的概率分布;f(·)定義為公式(6):
f(H(L))=softmax(MLP(ATT(H(L))))(6)
其中,ATT是注意力機(jī)制(Attention),它可以為每個(gè)節(jié)點(diǎn)計(jì)算一個(gè)權(quán)重向量,表示該節(jié)點(diǎn)在生成適應(yīng)性數(shù)字教育資源時(shí)的重要程度。對(duì)于節(jié)點(diǎn)i,其權(quán)重向量為ai。注意力機(jī)制的計(jì)算如公式(7)所示,Hi(L)表示第i個(gè)節(jié)點(diǎn)在GCN的第L層中學(xué)習(xí)得到的特征向量,softmax(ai)表示節(jié)點(diǎn)i的權(quán)重,可以通過(guò)一個(gè)多層感知器學(xué)習(xí)得到。
ATT(H(L))=∑i=1 softmax(ai)Hi(L)(7)
另外,MLP是多層感知器,用于將節(jié)點(diǎn)的上下文表示映射到適應(yīng)性數(shù)字教育資源的空間中。對(duì)于節(jié)點(diǎn)i,其上下文可表示為ci=MLP(ATT(H(L))||Hi(L)),其中||表示向量的拼接操作,MLP可以包含多個(gè)全連接層和激活函數(shù),也可通過(guò)反向傳播算法學(xué)習(xí)得到。
通過(guò)注意力機(jī)制,對(duì)節(jié)點(diǎn)表示矩陣H(L)進(jìn)行加權(quán)平均,還可得到每個(gè)節(jié)點(diǎn)的上下文表示。通過(guò)多層感知器,將節(jié)點(diǎn)的上下文表示映射到適應(yīng)性數(shù)字教育資源的空間中,最終通過(guò)softmax函數(shù)生成概率分布。softmax是一種激活函數(shù),可以將任意實(shí)數(shù)向量轉(zhuǎn)化為概率分布,即保證每個(gè)元素的概率都在[0,1]之間且概率和為1。
第五,使用交叉熵?fù)p失函數(shù)衡量基于模型生成的適應(yīng)性數(shù)字教育資源與其實(shí)際滿足師生資源需求之間的差異,以便對(duì)生成的適應(yīng)性數(shù)字教育資源進(jìn)行訓(xùn)練和優(yōu)化。交叉熵?fù)p失函數(shù)定義為公式(8):
綜上所述,我們可以利用公式(11)表示如何基于跨模態(tài)資源語(yǔ)義圖譜和跨模態(tài)師生特征圖譜對(duì)跨模態(tài)教育資源進(jìn)行重構(gòu),從而為師生生成適應(yīng)性數(shù)字教育資源。
Y=f(H(L))=softmax(MLP(ATT(H(L)) ?) ) (11)
其中,H(L)是耦合圖譜經(jīng)過(guò)多層GCN網(wǎng)絡(luò)學(xué)習(xí)得到的節(jié)點(diǎn)表示矩陣,f是前向傳播函數(shù)。
通過(guò)以上過(guò)程,可為師生提供的適應(yīng)性數(shù)字教育資源包括重新排列和組合的原始資源的不同部分、添加的新的圖像、音頻或視頻元素等,以使其更適合師生的特定需求,并在共享和復(fù)用過(guò)程中實(shí)現(xiàn)其價(jià)值增值(楊文正等,2018)。
(3)適應(yīng)性增強(qiáng)
動(dòng)態(tài)能力理論致力于研究一個(gè)組織面對(duì)一個(gè)快速變化的環(huán)境所擁有的改變、更新和創(chuàng)造新資源的能力(Teece,2000)。資源視角下的動(dòng)態(tài)能力主要由三個(gè)維度構(gòu)成:一是快速識(shí)別和理解有價(jià)值資源的能力,二是有效獲取有價(jià)值資源的能力,三是匯聚、重構(gòu)資源以維持優(yōu)勢(shì)的能力(Teece,2007)。教育資源具有動(dòng)態(tài)能力意味著教育領(lǐng)域能夠?qū)Y源進(jìn)行數(shù)智化組織與重新配置,進(jìn)而實(shí)現(xiàn)對(duì)資源智能服務(wù)模式的有效創(chuàng)新。簡(jiǎn)而言之,適應(yīng)性數(shù)字教育資源的適應(yīng)性增強(qiáng)體現(xiàn)了其動(dòng)態(tài)能力的高階性,以及對(duì)于師生教學(xué)行為需求特征挖掘的成熟度和資源理解與重構(gòu)的成熟度。
教育資源是知識(shí)的重要載體,學(xué)習(xí)資源與知識(shí)本體的結(jié)合是未來(lái)學(xué)習(xí)技術(shù)標(biāo)準(zhǔn)的一大發(fā)展趨勢(shì)(趙厚福等,2010)。適應(yīng)性教育資源的形成,即是以知識(shí)單元為單位的資源增值服務(wù),其知識(shí)組織分為四個(gè)層次:知識(shí)信息層、核心要素層、問(wèn)題求解層以及補(bǔ)全擴(kuò)展層。其中,知識(shí)信息層包含了知識(shí)的概念、屬性以及載體類(lèi)型等特征,完整地反映了某一領(lǐng)域資源的知識(shí)信息。知識(shí)信息層是構(gòu)成多模態(tài)領(lǐng)域知識(shí)的最小單位,也是領(lǐng)域知識(shí)結(jié)構(gòu)的基礎(chǔ)。核心要素層通過(guò)對(duì)多模態(tài)領(lǐng)域知識(shí)基礎(chǔ)細(xì)節(jié)層中的各個(gè)特征進(jìn)行編碼處理,篩選出領(lǐng)域知識(shí)的核心要素,由此構(gòu)成了反映多模態(tài)領(lǐng)域知識(shí)的核心內(nèi)容。問(wèn)題求解層是在核心要素層的基礎(chǔ)上,根據(jù)師生教學(xué)行為需求進(jìn)行跨模態(tài)知識(shí)單元的重構(gòu),以便形成能夠解決師生實(shí)際問(wèn)題的知識(shí)單元。補(bǔ)全擴(kuò)展層是在對(duì)多模態(tài)知識(shí)單元以及師生行為需求進(jìn)行匹配計(jì)算后,通過(guò)不斷更新和優(yōu)化資源以補(bǔ)全或擴(kuò)展教育資源庫(kù),使其更加貼近師生動(dòng)態(tài)變化的資源需求。在知識(shí)組織層次分類(lèi)技術(shù)的支撐下,適應(yīng)性數(shù)字教育資源服務(wù)不僅能為師生提供一份生成性的教育資源,還能從全流程視角觀照師生資源需求、進(jìn)行資源匹配、實(shí)現(xiàn)資源重構(gòu)以及個(gè)性化和智能化推送。當(dāng)對(duì)師生需求挖掘的成熟度和資源理解與重構(gòu)的成熟度越來(lái)越高時(shí),適應(yīng)性數(shù)字教育資源的動(dòng)態(tài)能力也會(huì)不斷增強(qiáng)。這種持續(xù)發(fā)展的能力可表示為:適應(yīng)性數(shù)字教育資源的動(dòng)態(tài)能力∝f(師生需求挖掘的成熟度,資源理解與重構(gòu)的成熟度)+ε,其中,f(·)在一般情況下是一個(gè)回歸函數(shù),ε表示適應(yīng)性數(shù)字教育資源動(dòng)態(tài)能力的基線水平。
五、基于跨模態(tài)理解與重構(gòu)的適應(yīng)性數(shù)字教 育資源實(shí)踐框架
在提升數(shù)字教育資源服務(wù)質(zhì)量的過(guò)程中,資源的智能組織和服務(wù)策略是同等重要的,因此還需要以適應(yīng)性為主旨構(gòu)建實(shí)踐框架。盡管已有學(xué)者從“數(shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)融合、數(shù)據(jù)利用”方面梳理了教育資源的實(shí)踐框架(Shankar et al.,2019);但如何融合師生多模態(tài)行為分析,有效提升數(shù)字教育資源的識(shí)別、理解、轉(zhuǎn)化、重構(gòu)、生成與高效應(yīng)用,仍是構(gòu)建數(shù)字教育資源實(shí)踐框架的關(guān)鍵(Hercheui et al.,2020;Mikalef et al.,2021)。本研究從數(shù)據(jù)采集、智能分析、規(guī)則約束和應(yīng)用服務(wù)四個(gè)方面,構(gòu)建了如圖4所示的基于跨模態(tài)理解與重構(gòu)的適應(yīng)性數(shù)字教育資源實(shí)踐框架。
1.數(shù)據(jù)采集層:多模態(tài)教育資源和師生行為采集
適應(yīng)性數(shù)字教育資源的智能呈現(xiàn)既需要對(duì)師生行為與教育資源的關(guān)聯(lián)表征,也需要大量師生內(nèi)隱與外顯行為,以及資源的多維數(shù)據(jù)指標(biāo)的支持。數(shù)據(jù)采集層主要針對(duì)教育情境下的多模態(tài)教育資源和多模態(tài)教學(xué)行為進(jìn)行全方位、伴隨式數(shù)據(jù)采集。針對(duì)師生行為數(shù)據(jù),主要利用多模態(tài)學(xué)習(xí)分析方法對(duì)“人—境—機(jī)—物”多主體協(xié)同進(jìn)行精準(zhǔn)分析,通過(guò)傳感器、監(jiān)控器、智能學(xué)習(xí)設(shè)備等方式采集不同學(xué)習(xí)空間的行為數(shù)據(jù),以便形成多模態(tài)行為可計(jì)算的表征模式。針對(duì)多模態(tài)教育資源,主要依托國(guó)家智慧教育公共服務(wù)體系,匯集多類(lèi)型、多尺度、多時(shí)相的多源異構(gòu)數(shù)據(jù)源(如文本、視頻、音頻和圖像等),通過(guò)爬蟲(chóng)或API等方式獲取。在數(shù)據(jù)采集的過(guò)程中,還需要保證數(shù)據(jù)的質(zhì)量、安全性和隱私。
2.智能分析層:基于多模態(tài)數(shù)據(jù)的理解與適應(yīng)性重構(gòu)
智能分析層主要通過(guò)人工智能等技術(shù)進(jìn)行模型訓(xùn)練和優(yōu)化,深度挖掘不同模態(tài)的師生行為需求和教育資源信息并對(duì)其進(jìn)行高效關(guān)聯(lián),以此對(duì)適應(yīng)性數(shù)字教育資源的動(dòng)態(tài)能力生成進(jìn)行深入分析。在應(yīng)用數(shù)字教育資源時(shí),應(yīng)充分考慮師生行為特征對(duì)于適應(yīng)性重構(gòu)的需求,跳出模式的“深井”,融合用戶行為需求與場(chǎng)景語(yǔ)義的資源分片、知識(shí)標(biāo)注、構(gòu)件裝配等深加工技術(shù)(劉三女牙等,2021)。研究采用Encoder-Decoder架構(gòu)對(duì)多模態(tài)數(shù)字教育資源進(jìn)行智能分析:首先,使用單模態(tài)編碼器提取輸入文本、圖像和音頻等的表示。其次,運(yùn)用Embedding處理/操作將不同模態(tài)的數(shù)據(jù)合并成一個(gè)張量。然后,使用Transformer編碼器處理文本、圖像和音頻等內(nèi)容之間的交互,得到多模態(tài)數(shù)字教育資源的統(tǒng)一表征。同理,多模態(tài)教學(xué)行為的智能分析亦使用Transformer編碼器,通過(guò)處理師生多模態(tài)教學(xué)行為之間的交互,可得到多模態(tài)行為數(shù)據(jù)的統(tǒng)一表征。最后,基于兩個(gè)跨模態(tài)解碼器對(duì)數(shù)字教育資源進(jìn)行適應(yīng)性重構(gòu),從而生成符合師生意向的教育資源。在適應(yīng)性重構(gòu)過(guò)程中,還可以使用不同的神經(jīng)網(wǎng)絡(luò)模型,根據(jù)需要設(shè)計(jì)合適的網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)配置,以實(shí)現(xiàn)對(duì)適應(yīng)性數(shù)字教育資源的智能推送。
3.規(guī)則約束層:資源生成中的質(zhì)量監(jiān)控與倫理安全
技術(shù)的邏輯在于成功與高效,即“成事”與“成物”,但教育的邏輯在于“成人”(李政濤,2020)?;诳缒B(tài)理解與重構(gòu)技術(shù)生成的適應(yīng)性數(shù)字教育資源依賴(lài)于多模態(tài)大模型的優(yōu)勢(shì)特征(Luo et al.,2020;Huang et al.,2023)。它在為師生的教與學(xué)提供諸多便利的同時(shí),也面臨如何在資源生成過(guò)程中發(fā)揮育人功能和保障數(shù)據(jù)安全等挑戰(zhàn)。而且適應(yīng)性數(shù)字教育資源的生成對(duì)數(shù)據(jù)的多樣性、時(shí)序性和層次性的要求很高。若對(duì)數(shù)據(jù)的采集、獲取和使用方式不加以約束,將在很大程度上造成師生隱私的泄露,并導(dǎo)致人在創(chuàng)新活動(dòng)中的主體地位出現(xiàn)階梯式消解(李建中,2019)。除此之外,適應(yīng)性數(shù)字教育資源的生成和應(yīng)用還涉及知識(shí)產(chǎn)權(quán)、認(rèn)證標(biāo)準(zhǔn)、內(nèi)容審查等方面的技術(shù)倫理問(wèn)題。規(guī)則約束層即是為了解決這些問(wèn)題,對(duì)技術(shù)應(yīng)用的場(chǎng)景和邊界進(jìn)行嚴(yán)格界定,開(kāi)展符合教育規(guī)律的人機(jī)協(xié)同審查(郭炯等,2019)。具體來(lái)說(shuō),就是要明確智能技術(shù)的應(yīng)用規(guī)范、倫理道德邊界,遵循教育資源服務(wù)的知識(shí)組織原理、教育教學(xué)規(guī)律與育人目標(biāo)定位,從技術(shù)檢測(cè)和專(zhuān)家測(cè)評(píng)兩個(gè)層面探析如何建構(gòu)適應(yīng)性數(shù)字教育資源的測(cè)評(píng)體系,實(shí)現(xiàn)資源質(zhì)量、育人、倫理等多維度的科學(xué)測(cè)評(píng)。
4.應(yīng)用服務(wù)層:推進(jìn)資源的智能管理和個(gè)性化服務(wù)
數(shù)字教育資源智能管理是指通過(guò)提升數(shù)字教育資源的組織和維護(hù)效率,以使其更好地支持教育活動(dòng)的過(guò)程?;诳缒B(tài)理解與重構(gòu)的適應(yīng)性數(shù)字教育資源能為數(shù)字教育資源組織與管理效率的提升提供學(xué)理基礎(chǔ),具有多源聚類(lèi)與知識(shí)重組等特點(diǎn)。適應(yīng)性數(shù)字教育資源的知識(shí)組織層次,能夠達(dá)到對(duì)教育資源知識(shí)單元的可控、可分目的,實(shí)現(xiàn)資源的共享優(yōu)化,并創(chuàng)新教育資源的粒度化管理。通過(guò)挖掘多模態(tài)資源間隱含的知識(shí)關(guān)聯(lián)進(jìn)而實(shí)現(xiàn)跨模態(tài)、多角度的資源重構(gòu),可以有效地對(duì)各類(lèi)數(shù)字教育資源進(jìn)行建序優(yōu)化,并促進(jìn)其由碎片化向集約化、智能化轉(zhuǎn)型。這將大大提升隱性知識(shí)識(shí)別、理解、轉(zhuǎn)化、創(chuàng)新應(yīng)用的效率,一定程度上滿足了數(shù)據(jù)驅(qū)動(dòng)與需求驅(qū)動(dòng)相結(jié)合的數(shù)字教育資源共享與重用,也拓展了資源價(jià)值的輻射邊界。
智慧教育服務(wù)是指應(yīng)用人工智能等技術(shù)為學(xué)生與教師提供更加智能化和個(gè)性化的教育服務(wù),并以提高教育質(zhì)量為目標(biāo)的一種服務(wù)形態(tài)。而適應(yīng)性數(shù)字教育資源具有多模態(tài)行為分析和跨模態(tài)資源生成的“雙元”特性,能夠根據(jù)師生需求進(jìn)行智能化調(diào)整和優(yōu)化,規(guī)避數(shù)字教育資源組織中的“路徑依賴(lài)”困境。學(xué)生可以根據(jù)適應(yīng)性數(shù)字教育資源的知識(shí)導(dǎo)航,基于多樣化的教學(xué)資源,實(shí)現(xiàn)個(gè)性化學(xué)習(xí)。教師可以利用適應(yīng)性數(shù)字教育資源更好地針對(duì)學(xué)生的學(xué)習(xí)需求和特點(diǎn)進(jìn)行教學(xué)設(shè)計(jì)和教學(xué)實(shí)施,通過(guò)優(yōu)化學(xué)習(xí)路徑不斷提高教學(xué)效率。這些服務(wù)不僅可以讓教育更加智能化和個(gè)性化,還可以大大拓展教育的覆蓋范圍,提高教育教學(xué)的質(zhì)量和效率,促進(jìn)教育的公平和包容。
六、結(jié)語(yǔ)
適應(yīng)性數(shù)字教育資源是數(shù)字教育資源生成、流轉(zhuǎn)和應(yīng)用等全鏈條智能化的結(jié)果,其核心是構(gòu)建基于跨模態(tài)理解與重構(gòu)的適應(yīng)性數(shù)字教育資源模型,目標(biāo)是動(dòng)態(tài)生成供需適配的資源鏈,即依托跨模態(tài)理解與重構(gòu)技術(shù)生成適用于復(fù)雜教育情境的多模態(tài)教育資源。未來(lái),我們將在現(xiàn)有研究的基礎(chǔ)上,進(jìn)一步結(jié)合多模態(tài)大模型的技術(shù)進(jìn)化,將該模型與適應(yīng)性數(shù)字教育資源的實(shí)踐框架相結(jié)合并驗(yàn)證其有效性,以實(shí)現(xiàn)復(fù)雜教育情境下人機(jī)協(xié)同學(xué)習(xí)的互惠共生。
參考文獻(xiàn):
[1]艾興,趙瑞雪(2020).人機(jī)協(xié)同視域下的智能學(xué)習(xí):邏輯起點(diǎn)與表征形態(tài)[J].遠(yuǎn)程教育雜志,38(1):69-75.
[2]蔡連玉,金明飛,周躍良(2023).教育數(shù)字化轉(zhuǎn)型的本質(zhì):從技術(shù)整合到人機(jī)融合[J].華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版),41(3):36-44.
[3]陳明選,李蘭(2021).我國(guó)數(shù)字教育平臺(tái)資源配置與服務(wù):?jiǎn)栴}與對(duì)策[J].中國(guó)遠(yuǎn)程教育,(1):17-26,77.
[4]陳寧,段友祥,孫歧峰(2021).跨模態(tài)檢索研究文獻(xiàn)綜述[J].計(jì)算機(jī)科學(xué)與探索,15(8):1390-1404.
[5]丁繼紅,劉華中(2017).影響教育資源選擇的學(xué)習(xí)者模型構(gòu)建[J].遠(yuǎn)程教育雜志,35(4):97-103.
[6]郭炯,郝建江(2019).人工智能環(huán)境下的學(xué)習(xí)發(fā)生機(jī)制[J].現(xiàn)代遠(yuǎn)程教育研究,31(5):32-38.
[7]懷進(jìn)鵬(2023).數(shù)字變革與教育未來(lái)——在世界數(shù)字教育大會(huì)上的主旨演講[N].中國(guó)教育報(bào),2023-02-14(001).
[8]柯清超,劉麗麗,鮑婷婷等(2023).國(guó)家智慧教育平臺(tái)賦能區(qū)域教育數(shù)字化轉(zhuǎn)型的四重機(jī)制[J].中國(guó)電化教育,(3):30-36.
[9]李寶,張文蘭(2015).智慧教育環(huán)境下學(xué)習(xí)資源推送服務(wù)模型的構(gòu)建[J].遠(yuǎn)程教育雜志,33(3):41-48.
[10]李建中(2019).人工智能時(shí)代的知識(shí)學(xué)習(xí)與創(chuàng)新教育的轉(zhuǎn)向[J].中國(guó)電化教育,(4):10-16.
[11]李政濤(2020).現(xiàn)代信息技術(shù)的“教育責(zé)任”[J].開(kāi)放教育研究,26(2):13-26.
[12]林健,柯清超,黃正華等(2022).學(xué)科知識(shí)圖譜的動(dòng)態(tài)生成及其在資源智能組織中的應(yīng)用[J].遠(yuǎn)程教育雜志,40(4):23-34.
[13]劉三女牙,孫建文(2021).人工智能時(shí)代的課堂創(chuàng)變:解構(gòu)與重構(gòu)[J].國(guó)家教育行政學(xué)院學(xué)報(bào),(9):16-22.
[14]劉偉(2021).人機(jī)融合:超越人工智能[M].北京:清華大學(xué)出版社:34.
[15]羅江華,馮瑞(2022).學(xué)習(xí)平臺(tái)的適應(yīng)性進(jìn)化及其對(duì)教育新基建的啟示[J].現(xiàn)代教育技術(shù),32(10):17-25.
[16]羅江華,王琳(2023).新基建賦能教育數(shù)字化轉(zhuǎn)型的邏輯、挑戰(zhàn)與實(shí)踐路向[J].中國(guó)電化教育,(3):37-45.
[17]馬海云,薛翔(2022).面向知識(shí)服務(wù)的領(lǐng)域知識(shí)結(jié)構(gòu)研究[J].情報(bào)學(xué)報(bào),41(1):73-82.
[18]彭紅超,祝智庭(2018).人機(jī)協(xié)同的數(shù)據(jù)智慧機(jī)制:智慧教育的數(shù)據(jù)價(jià)值煉金術(shù)[J].開(kāi)放教育研究,24(2):41-50.
[19]闕玉葉(2022).人工智能實(shí)現(xiàn)完全意向性何以可能?——人機(jī)融合智能:未來(lái)人工智能發(fā)展方向[J].自然辯證法研究,38(9):55-61.
[20]王琦,余勝泉,萬(wàn)海鵬(2022).內(nèi)容與結(jié)構(gòu)松耦合的適應(yīng)性學(xué)習(xí)資源模型及應(yīng)用研究[J].電化教育研究,43(3):51-59.
[21]吳砥,李環(huán),陳旭(2023).人工智能通用大模型教育應(yīng)用影響探析[J].開(kāi)放教育研究,29(2):19-25,45.
[22]吳友政,李浩然,姚霆等(2022).多模態(tài)信息處理前沿綜述:應(yīng)用、融合和預(yù)訓(xùn)練[J].中文信息學(xué)報(bào),36(5):1-20.
[23]楊文正,徐杰,李慧慧(2018).生態(tài)學(xué)視角下數(shù)字教育資源優(yōu)化配置模型構(gòu)建[J].現(xiàn)代遠(yuǎn)程教育研究,(2):94-102.
[24]楊現(xiàn)民,余勝泉(2010).泛在學(xué)習(xí)環(huán)境下的學(xué)習(xí)資源信息模型構(gòu)建[J].中國(guó)電化教育,(9):72-78.
[25]楊現(xiàn)民,余勝泉(2011).泛在學(xué)習(xí)環(huán)境下的學(xué)習(xí)資源進(jìn)化模型構(gòu)建[J].中國(guó)電化教育,296(09):80-86.
[26]楊欣(2023).基于生成式人工智能的教育轉(zhuǎn)型圖景——ChatGPT究竟對(duì)教育意味著什么[J].中國(guó)電化教育,(5):1-8,14.
[27]楊洋,況琨,陳政聿等(2022).基于端云協(xié)同體系的預(yù)訓(xùn)練大模型及其服務(wù)化[J].人工智能, (6):103-120.
[28]余平,管玨琪,徐顯龍等(2016).情境信息及其在智慧學(xué)習(xí)資源推薦中的應(yīng)用研究[J].電化教育研究,37(2):54-61.
[29]喻國(guó)明(2022).“以人為本”標(biāo)尺下的“人—機(jī)”協(xié)同[J].新聞與寫(xiě)作,(10):1.
[30]張進(jìn)良,葉求財(cái)(2019).大數(shù)據(jù)視閾下學(xué)習(xí)資源智能推薦模型構(gòu)建[J].湖南科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),22(4):178-184.
[31]張樂(lè)樂(lè),顧小清(2022).多模態(tài)數(shù)據(jù)支持的課堂教學(xué)行為分析模型與實(shí)踐框架[J].開(kāi)放教育研究,28(6):101-110.
[32]趙厚福,祝智庭,吳永和(2010).數(shù)字化學(xué)習(xí)技術(shù)標(biāo)準(zhǔn)發(fā)展的趨勢(shì)、框架和建議[J].中國(guó)遠(yuǎn)程教育,(2):69-75.
[33]鄭永和,王一巖(2023).科技賦能教育高質(zhì)量發(fā)展:價(jià)值內(nèi)涵、表征樣態(tài)與推進(jìn)策略[J].中國(guó)電化教育,(1):118-126.
[34]Choi, S., Lee, S., & Kim, Y. et al. (2020). Hi-CMD: Hierarchical Cross-Modality Disentanglement for Visible-Infrared
Person Re-Identification[C]// Proceedings of the 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition.WA: Seattle:10254-10263.
[35]Hercheui, M., & Ranjith, R. (2020). Improving Organization Dynamic Capabilities Using Artificial Intelligence[J]. Global Journal of Business Research, 14(1):87-96.
[36]Huang, S., Dong, L., & Wang, W. et al. (2023). Language Is Not All You Need: Aligning Perception with Language Models[J]. ArXiv:2302.14045.
[37]Karim, S. (2006). Modularity in Organizational Structure: The Reconfiguration of Internally Developed and Acquired Business Units[J]. Strategic Management Journal, 27:799-823.
[38]Karim, S., & Mitchell, W. (2004). Innovating Through Acquisition and Internal Development: A Quarter-Century of Boundary Evolution at Johnson & Johnson[J]. Long Range Planning, 37:525-547.
[39]Kipf, T. N., & Welling, M. (2016). Semi-Supervised Classification with Graph Convolutional Networks[J]. ArXiv:1609.02907.
[40]Liu, J., Zhu, X., & Liu, F. et al. (2021). OPT: Omni-Perception Pre-Trainer for Cross-Modal Understanding And Generation[J]. ArXiv:2107.00249.
[41]Luo, H., Ji, L., & Shi, B. et al. (2020). UniVL: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation[J]. ArXiv:2002.06353.
[42]Mérida, D., Fabregat, R., & Baldiris, S. (2010). Sistemas Heterogéneos Adaptativos Basados en el Contexto[J]. Revista Iberoamericana de Educacióon a Distancia, 13(2):73-105.
[43]Mikalef, P., Conboy, K., & Krogstie, J. (2021). Artificial Intelligence as an Enabler of B2B Marketing: A Dynamic Capabilities Micro-Foundations Approach[J]. Industrial Marketing Management, 98:80-92.
[44]Rozo, H., & Real, M. (2019). Pedagogical Guidelines for the Creation of Adaptive Digital Educational Resources: A Review of the Literature[J]. Journal of Technology and Science Education, 9(3):308-325.
[45]Sawadogo, D., Champagnat, R., & Estraillier, P. (2014). Adaptive Digital Resource Modelling for Interactive System[C]// Proceedings of the 2014 International Conference on Control, Decision and Information Technologies (CoDIT). IEEE:663-668.
[46]Shankar, S. K., Ruiz-Calleja, A., & Serrano-Iglesias, S. et al. (2019). A Data Value Chain to Model the Processing of Multimodal Evidence in Authentic Learning Scenarios[C]// Proceedings of CEUR Workshop LASI Spain. Vigo, Spain: CEUR:71-83.
[47]Teece, D. J. (2000). Strategies for Managing Knowledge Assets: The Role of Firm Structure and Industrial Context[J]. Long Range Planning, 33(1):35-54.
[48]Teece, D. J. (2007). Explicating Dynamic Capabilities: The Nature and Micro foundations of (Sustainable) Enterprise Performance[J]. Strategic Management Journal, 28(13):1319-1350.
[49]Teece, D. J., Pisano, G., & Shuen, A. (1997). Dynamic Capabilities and Strategic Management[J]. Strategic Management Journal, 18(7):509-533.
[50]Wei, X., Sun, S., & Wu, D. et al. (2021). Personalized Online Learning Resource Recommendation Based on Artificial Intelligence and Educational Psychology[J]. Frontiers in Psychology, 12:767837.
[51]?elaszczyk, M., & Mańdziuk, J. (2023). Cross-Modal Text and Visual Generation: A Systematic Review. Part 1: Image to Text[J]. Information Fusion, 93:302-329.
收稿日期 2023-06-05 責(zé)任編輯 劉選
Adaptive Digital Educational Resources Based on Cross-Modal Understanding and Reconstruction:
Model Construction and Practical Framework
LUO Jianghua, ZHANG Yuliu
Abstract: Digital educational resources play an important role in the process of promoting high-quality development of education. In the era of artificial intelligence, how to make digital educational resources change from “l(fā)etting human adapt” to “actively adapting to human” is the key issue to be solved urgently in the construction of digital educational resources. As the application scenarios of artificial intelligence-generated content continue to expand, cross-modal understanding and reconstruction technologies provide feasible technical support for addressing the adaptability of digital educational resources. Specifically, it advocates multi-disciplinary collaboration among humans, educational contexts, computers and educational resources, and uses cross-modal understanding and reconstruction technology to carry out intelligent mining and coupling calculation of multi-modal teaching behaviors and multi-modal digital educational resources in complex educational situations, so as to realize the recommendation of educational resources suitable for man-machine collaborative environment, explore the supply-demand adaptation of digital educational resources services, and realize the self-scheduling of digital educational resources generation chain, so that we can build an adaptive digital educational resources model. At a practical level, a practical framework of adaptive digital educational resources should be constructed, which includes data collection layer, intelligent analysis layer, rule constraint layer and application service layer, to effectively promote the intelligent management and personalized service of digital educational resources on the basis of cross-modal understanding of multi-modal educational resources as well as behaviors of teachers and students.
Keywords: Cross-Modal Reconstruction; Cross-Modal Understanding; Adaptive Digital Educational Resources; Human-Machine Collaboration; Artificial Intelligence-Generated Content