鐘卓 唐燁偉 鐘紹春 趙一婷
[摘? ?要] 領(lǐng)域模型作為構(gòu)建自適應(yīng)學(xué)習(xí)系統(tǒng)的核心組件,引起了研究者的廣泛關(guān)注。文章針對現(xiàn)有教育領(lǐng)域模型知識內(nèi)容分散、能力刻畫不足的問題,提出了能夠建立知識、問題、能力三者間映射關(guān)系的教育知識圖譜KQA模型。該模型由知識圖式、問題圖式、能力圖式三層圖式和知識內(nèi)容、關(guān)聯(lián)關(guān)系、映射關(guān)系、學(xué)習(xí)路徑四個(gè)要素組成。利用基于機(jī)器學(xué)習(xí)的實(shí)體抽取、關(guān)系抽取、實(shí)體對齊等方法,從數(shù)據(jù)獲取、知識抽取、知識融合、知識推理四個(gè)方面,提出了教育知識圖譜KQA模型的構(gòu)建方法。研究為知識圖譜在教育領(lǐng)域的應(yīng)用提供依據(jù),對個(gè)性化學(xué)習(xí)的開展具有重要意義。
[關(guān)鍵詞] 人工智能; 知識圖譜; 模型構(gòu)建; 機(jī)器學(xué)習(xí); 學(xué)習(xí)路徑; 自適應(yīng)學(xué)習(xí)
[中圖分類號] G434? ? ? ? ? ? [文獻(xiàn)標(biāo)志碼] A
[作者簡介] 鐘卓(1987—),男,湖北仙桃人。博士研究生,主要從事智慧教育、數(shù)字化學(xué)習(xí)環(huán)境的研究。E-mail:382452265@qq.com。
一、引? ?言
近年來,深度學(xué)習(xí)、知識圖譜、人工神經(jīng)網(wǎng)絡(luò)等人工智能技術(shù)的迅猛發(fā)展,驅(qū)動(dòng)著社會(huì)從“互聯(lián)網(wǎng)+”進(jìn)入“人工智能+”新時(shí)代?!督逃畔⒒?.0行動(dòng)計(jì)劃》中強(qiáng)調(diào):“建立健全教育信息化可持續(xù)發(fā)展機(jī)制,構(gòu)建網(wǎng)絡(luò)化、數(shù)字化、智能化、個(gè)性化、終身化的教育體系?!盵1]構(gòu)建新型教育體系的關(guān)鍵在于個(gè)性化學(xué)習(xí)的開展,個(gè)性化學(xué)習(xí)的實(shí)現(xiàn)離不開自適應(yīng)學(xué)習(xí)系統(tǒng)的大力支持。自適應(yīng)學(xué)習(xí)系統(tǒng)的核心組件包括領(lǐng)域模型、用戶模型、自適應(yīng)模型、自適應(yīng)引擎和呈現(xiàn)模型五部分[2]。領(lǐng)域模型是構(gòu)建自適應(yīng)學(xué)習(xí)系統(tǒng)的重要基礎(chǔ)和核心要素,而構(gòu)建語義清晰、結(jié)構(gòu)完整、可擴(kuò)充性好的領(lǐng)域模型是自適應(yīng)學(xué)習(xí)系統(tǒng)面臨的一個(gè)重要挑戰(zhàn)。以知識圖譜為代表的人工智能技術(shù)為教育領(lǐng)域模型構(gòu)建提供了技術(shù)保障。《新一代人工智能發(fā)展規(guī)劃》特別指出,“重點(diǎn)突破知識加工、深度搜索和可視交互核心技術(shù),形成涵蓋數(shù)十億實(shí)體規(guī)模的多源、多學(xué)科和多數(shù)據(jù)類型的跨媒體知識圖譜”[3]。因此,利用知識構(gòu)建、知識挖掘、知識推理等技術(shù),實(shí)現(xiàn)對教育領(lǐng)域模型的知識抽取、表達(dá)、融合、推理和利用,這是當(dāng)前教育領(lǐng)域研究的重要課題。
二、教育領(lǐng)域模型構(gòu)建現(xiàn)狀分析
領(lǐng)域模型構(gòu)建是指利用建模技術(shù)對領(lǐng)域知識進(jìn)行標(biāo)簽化與序列化的過程,教育領(lǐng)域模型構(gòu)建是指利用知識抽取、知識融合等技術(shù)對學(xué)科知識及知識之間關(guān)聯(lián)關(guān)系建立聯(lián)系的過程,其目的是為了讓知識序列化,以便更好地促進(jìn)教與學(xué)。教育領(lǐng)域模型構(gòu)建常用到的方法有概念圖(Concept Map)、知識地圖(Knowledge Map)和知識圖譜(Knowledge Graph),這三種方法都可以進(jìn)行知識的表征與圖式,但這三個(gè)概念容易混淆,現(xiàn)在進(jìn)行一下辨析。
概念圖最早是由Novak教授提出的組織和表征知識的工具,包括節(jié)點(diǎn)和連線兩部分,用節(jié)點(diǎn)表示概念,用連線表示概念之間的關(guān)聯(lián)關(guān)系[4]。概念圖包括命題、概念、交叉連接和層級結(jié)構(gòu)四個(gè)要素。概念圖既能描述知識,還能對知識進(jìn)行評價(jià)。Trowbridge等人利用概念圖對大學(xué)課程進(jìn)行了評價(jià),分析學(xué)生對同一節(jié)課的知識理解差異[5];Ruiz-Primo等人將概率圖作為評估工具,發(fā)現(xiàn)學(xué)生的概念圖被解釋為代表他(她)的記憶(認(rèn)知結(jié)構(gòu))中概念組織的重要方面[6]。
知識地圖的概念最早是由Dansereau和Holley提出的一種知識的關(guān)系網(wǎng)絡(luò)[7],知識地圖能夠?qū)⒘闵⒌闹R組織起來形成序列化的知識,促進(jìn)學(xué)習(xí)者知識建構(gòu)。知識地圖表示知識獲取路徑及知識間的關(guān)系,不僅可以表征知識體系結(jié)構(gòu),還能夠幫助學(xué)習(xí)者精準(zhǔn)定位所需知識。知識地圖在教育領(lǐng)域主要應(yīng)用在學(xué)科知識結(jié)構(gòu)的體系化構(gòu)建中。Kim認(rèn)為知識地圖能夠建立知識的關(guān)聯(lián)關(guān)系,幫助知識結(jié)構(gòu)化,便于知識理解[8];李艷紅等人認(rèn)為,知識地圖能夠幫助教師重塑學(xué)習(xí)內(nèi)容和學(xué)習(xí)資源,有效體現(xiàn)學(xué)科體系、學(xué)習(xí)目標(biāo)、學(xué)習(xí)活動(dòng)的關(guān)聯(lián)關(guān)系和層次關(guān)系[9];劉紅晶等人認(rèn)為,知識地圖可以反映某個(gè)學(xué)科的知識結(jié)構(gòu),促進(jìn)學(xué)習(xí)者生成關(guān)聯(lián)化和網(wǎng)絡(luò)化的學(xué)習(xí)思維[10]。
知識圖譜最初是以科學(xué)知識計(jì)量為對象,通過圖示化展現(xiàn)知識的結(jié)構(gòu)關(guān)系,屬于科學(xué)計(jì)量學(xué)的研究范疇[11]。知識圖譜是結(jié)構(gòu)化的知識語義網(wǎng)絡(luò),圖譜中的節(jié)點(diǎn)表示實(shí)體,圖譜中的邊表示節(jié)點(diǎn)間的語義關(guān)系。三元組是知識圖譜的通用表達(dá)方法,即 G={E,R,K},其中,E是實(shí)體集合,R是關(guān)系集合,K是知識集合。Leo 等人認(rèn)為,學(xué)科知識圖譜作為知識點(diǎn)與知識點(diǎn)以及知識點(diǎn)與教學(xué)資源之間建立連接的語義網(wǎng)絡(luò),能夠在學(xué)習(xí)資料語義關(guān)聯(lián)、學(xué)習(xí)者模型構(gòu)建、學(xué)習(xí)資源個(gè)性化推薦等方面發(fā)揮重要作用[12];李振等人認(rèn)為,教育知識圖譜是一種以知識元為節(jié)點(diǎn),根據(jù)其多維語義關(guān)系進(jìn)行關(guān)聯(lián),在知識層面和認(rèn)知層面上表示學(xué)科領(lǐng)域知識和學(xué)習(xí)者認(rèn)知狀態(tài),可用于知識導(dǎo)航、認(rèn)知診斷、資源聚合、路徑推薦的知識組織與認(rèn)知表征工具[13];余勝泉等人認(rèn)為,學(xué)科知識圖譜是基于知識之間的語義關(guān)系所形成的知識之間的邏輯關(guān)聯(lián)網(wǎng),在此基礎(chǔ)上,疊加教學(xué)目標(biāo)、教學(xué)問題、認(rèn)知狀態(tài),進(jìn)而生成認(rèn)知地圖[14]。
在通用領(lǐng)域,知識圖譜主要應(yīng)用在大規(guī)模知識庫和智能搜索引擎上。大規(guī)模知識庫,知名的有Metaweb公司的Freebase知識庫、維基媒體基金會(huì)主持的Wikidata知識庫以及德國馬普所科研人員研發(fā)的YAGO綜合知識庫;搜索引擎,知名的有谷歌Google Search、微軟Bing Search和百度知心。在教育領(lǐng)域,美國的Knewton 公司利用知識圖譜構(gòu)建了包含概念及其先決關(guān)系的跨學(xué)科知識體系,清華大學(xué)聯(lián)合微軟研究院開發(fā)了開放學(xué)術(shù)圖譜Open Academic Graph,北京師范大學(xué)余勝泉教授團(tuán)隊(duì)研發(fā)了基于知識圖譜的“智慧學(xué)伴”[15]。
根據(jù)上述分析,本研究對概念圖、知識地圖和知識圖譜三個(gè)相似概念從概念內(nèi)涵、組成要素、知識范圍、知識關(guān)系、應(yīng)用領(lǐng)域五個(gè)維度進(jìn)行了對比分析,系統(tǒng)梳理出三者的相似性和差異性,對比分析見表1。
綜上所述,知識圖譜相比概念圖、知識地圖,能夠表達(dá)更加廣泛的知識內(nèi)容以及語義關(guān)聯(lián)關(guān)系,而且構(gòu)建的自動(dòng)化程度較高。但經(jīng)過文獻(xiàn)分析發(fā)現(xiàn),當(dāng)前知識圖譜在知識內(nèi)容表示、學(xué)習(xí)者能力刻畫、構(gòu)建方法等方面仍存在以下問題:(1)在知識內(nèi)容表示方面,現(xiàn)有知識圖譜還是集中在基本知識點(diǎn)的描述,知識內(nèi)容分散,缺乏以學(xué)科關(guān)鍵詞為中心、其他關(guān)聯(lián)詞根據(jù)學(xué)科語義相關(guān)性結(jié)合在一起的知識單位——知識簇;(2)在能力刻畫方面,現(xiàn)有知識圖譜大多數(shù)是描述知識點(diǎn)內(nèi)容與知識點(diǎn)之間的關(guān)聯(lián)關(guān)系,對學(xué)習(xí)者能力的刻畫還缺乏進(jìn)一步研究;(3)在構(gòu)建方法方面,現(xiàn)有知識圖譜大多數(shù)還是采用領(lǐng)域?qū)<胰斯?gòu)建的方法來完成,缺乏借助機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語言處理等人工智能技術(shù)的自動(dòng)構(gòu)建。
三、教育知識圖譜模型構(gòu)建
(一)教育知識圖譜概念界定
教育知識圖譜主要是利用知識圖譜的方法來描述教育領(lǐng)域知識及知識間關(guān)聯(lián)關(guān)系的集合。關(guān)于教育知識圖譜的概念,學(xué)界還沒有統(tǒng)一的定論,可以從教師教學(xué)、學(xué)生學(xué)習(xí)、學(xué)習(xí)服務(wù)的不同視角來剖析教育領(lǐng)域知識圖譜的內(nèi)涵。
1. 教師教學(xué)的視角
教育領(lǐng)域知識圖譜是知識與知識間關(guān)系形成的網(wǎng)絡(luò)圖[16],是教師進(jìn)行教學(xué)設(shè)計(jì)、組織教學(xué)活動(dòng)的“課程標(biāo)準(zhǔn)”。教師根據(jù)群體學(xué)生共性特征,參考教育知識圖譜,設(shè)計(jì)符合大多數(shù)群體學(xué)生的教學(xué)安排,篩選適合絕大多數(shù)學(xué)習(xí)者的學(xué)習(xí)路徑,真正做到大規(guī)模教育背景下的個(gè)性化教學(xué)。
2. 學(xué)生學(xué)習(xí)的視角
教育領(lǐng)域知識圖譜是學(xué)生認(rèn)知狀態(tài)的圖式體現(xiàn),是支撐學(xué)生開展高品質(zhì)個(gè)性化學(xué)習(xí)的“行動(dòng)指南”。依據(jù)教育領(lǐng)域知識圖譜,學(xué)生根據(jù)已有的知識水平、興趣愛好、學(xué)習(xí)方法,選擇個(gè)性化的學(xué)習(xí)路徑,完成學(xué)習(xí)活動(dòng)。
3. 學(xué)習(xí)服務(wù)的視角
教育領(lǐng)域知識圖譜是個(gè)性化學(xué)習(xí)資源和學(xué)習(xí)路徑推薦的服務(wù)平臺(tái)[17],是構(gòu)建個(gè)性化學(xué)習(xí)環(huán)境、開展個(gè)性化學(xué)習(xí)的“核心要素”。教育領(lǐng)域知識圖譜在表征領(lǐng)域知識與知識關(guān)系的基礎(chǔ)上,推理出知識之間前驅(qū)后繼的關(guān)系,依據(jù)學(xué)習(xí)者個(gè)性特征(學(xué)習(xí)方式、認(rèn)知水平、知識水平),以圖式化的形式精準(zhǔn)推薦學(xué)習(xí)資源與學(xué)習(xí)路徑。
綜上所述,本研究認(rèn)為,教育知識圖譜是一種以知識簇為節(jié)點(diǎn),以問題為線索,以能力培養(yǎng)為目標(biāo),將問題解決或任務(wù)完成可能的方法有序組織,將所涉及的知識與方法相關(guān)聯(lián),通過問題解決和任務(wù)完成評測學(xué)科能力。這些知識、問題、能力集合以及知識之間、問題之間、能力之間的關(guān)聯(lián)關(guān)系稱為教育知識圖譜。
(二)教育知識圖譜KQA模型構(gòu)建
基于教育知識圖譜存在知識內(nèi)容分散、能力刻畫不足、構(gòu)建技術(shù)自動(dòng)化程度低等問題,本研究設(shè)計(jì)了教育知識圖譜模型。學(xué)科教學(xué)的目的是通過學(xué)科知識的學(xué)習(xí)培養(yǎng)學(xué)生的核心素養(yǎng),即學(xué)科的思維品質(zhì)和關(guān)鍵能力[18]。學(xué)科能力發(fā)展通過分解問題任務(wù)來實(shí)施,并通過問題任務(wù)的完成來評估[19]。在學(xué)科教學(xué)中,需要將知識映射為學(xué)科的問題或任務(wù),并通過問題解決與任務(wù)達(dá)成來刻畫學(xué)科能力。知識、問題、能力及三者間的映射關(guān)系是教育知識圖譜模型構(gòu)建的前提依據(jù),因此,本研究主要抽取“知識(Knowledge)”、“問題(Question)”、“能力(Ability)”三個(gè)關(guān)鍵詞縮寫,將該模型命名為教育知識圖譜KQA模型(簡稱“KQA模型”),如圖1所示。在所設(shè)計(jì)的模型中,教學(xué)組織者和學(xué)習(xí)者分別位于模型中的兩個(gè)頂端,由知識圖式、問題圖式、能力圖式三個(gè)層面以及知識內(nèi)容、關(guān)聯(lián)關(guān)系、映射關(guān)系、學(xué)習(xí)路徑四個(gè)要素支撐并連接起整個(gè)教育知識圖譜KQA模型。
1. 模型解釋
模型的上頂點(diǎn)代表的是教學(xué)組織者,在教學(xué)中主要指教師,教師依據(jù)教育知識圖譜開展教學(xué)設(shè)計(jì),組織教學(xué)活動(dòng)。下頂點(diǎn)代表的是學(xué)習(xí)者,在教學(xué)中主要指學(xué)生,學(xué)生依據(jù)教育知識圖譜開展個(gè)性化學(xué)習(xí)。第一層級知識圖式的三個(gè)頂點(diǎn)分別是概念、公式、原理,在知識圖式上建立起概念、公式、原理之間的關(guān)聯(lián)關(guān)系,并完成知識與問題的映射。第二層級問題圖式的三個(gè)頂點(diǎn)分別是問題、任務(wù)、創(chuàng)客,教育領(lǐng)域的學(xué)科知識將轉(zhuǎn)化為學(xué)科需要解決的問題、任務(wù)和創(chuàng)客,在問題圖式上建立起三者之間的關(guān)聯(lián)關(guān)系,并完成問題與能力的映射。第三層級能力圖式的三個(gè)頂點(diǎn)分別是問題解決、批判性思維、創(chuàng)造性思維,通過問題完成或任務(wù)達(dá)成進(jìn)行能力的刻畫,并在能力圖式上建立起三者之間的關(guān)聯(lián)關(guān)系。
2. 模型運(yùn)作機(jī)制
教育知識圖譜KQA模型運(yùn)作過程是一個(gè)動(dòng)態(tài)平衡、循環(huán)迭代的過程,在三層圖式中,需要一定的運(yùn)作機(jī)制作用于該模型,且機(jī)制之間相互影響,從而保證整個(gè)模型的正常運(yùn)轉(zhuǎn)。本研究所提出的KQA模型主要包括三種運(yùn)作機(jī)制:關(guān)聯(lián)機(jī)制、篩選機(jī)制和優(yōu)化機(jī)制,如圖2所示。關(guān)聯(lián)機(jī)制為知識與知識、問題與問題、能力與能力之間提供關(guān)聯(lián),并貫徹于教學(xué)活動(dòng)的組織、開展、評價(jià)等各個(gè)環(huán)節(jié);篩選機(jī)制通過知識、問題、能力之間的關(guān)聯(lián)關(guān)系記錄學(xué)習(xí)路徑,篩選出群體學(xué)習(xí)路徑;優(yōu)化機(jī)制收集教學(xué)組織者和學(xué)習(xí)者利用模型開展教學(xué)活動(dòng)的相關(guān)數(shù)據(jù),利用人工智能技術(shù)進(jìn)行優(yōu)化,并重新組織關(guān)聯(lián)關(guān)系,確保KQA模型的迭代進(jìn)化。
3. 模型三層圖式
教育領(lǐng)域?qū)W科的認(rèn)識活動(dòng)和問題解決活動(dòng)可以概括為:學(xué)習(xí)理解活動(dòng)、應(yīng)用實(shí)踐活動(dòng)和遷移創(chuàng)新活動(dòng)[20]。學(xué)習(xí)理解活動(dòng)的關(guān)鍵要素有記憶、說明、觀察、概括等,這些對應(yīng)于知識理解層面;應(yīng)用實(shí)踐活動(dòng)的關(guān)鍵要素有推理、證明、設(shè)計(jì)、分析等,這些對應(yīng)于問題解決層面;遷移創(chuàng)新活動(dòng)的關(guān)鍵要素有問題解決、模型建立、批判思考、想象創(chuàng)造等,這些對應(yīng)于能力應(yīng)用層面。為此,本研究從知識層、問題層、能力層三層圖式構(gòu)建了教育知識圖譜KQA模型。
(1)知識圖式
圖式是學(xué)習(xí)者以往習(xí)得知識的結(jié)構(gòu)。教育知識圖譜的知識圖示是描述學(xué)科知識與知識關(guān)聯(lián)關(guān)系的語義網(wǎng)絡(luò)圖,將學(xué)科基本概念、公式、原理以知識簇的形式進(jìn)行聚合,知識簇與知識簇關(guān)聯(lián)關(guān)系通過形式化語義網(wǎng)進(jìn)行描述。知識圖示可以用通用三元組進(jìn)行描述,其表示為:KG=(E,R,S),KG為知識圖式,E為實(shí)體集合,R為關(guān)系集合,S為三元組集合。
(2)問題圖式
用圖式知識來描述與問題和問題類型有關(guān)的知識,是對問題圖式較早的詮釋。問題圖式包括:特定類型的問題、解決問題的領(lǐng)域知識和解決問題的策略[21]。教育知識圖譜的問題圖式是學(xué)科問題及問題之間關(guān)聯(lián)關(guān)系的集合。問題圖式是連接知識圖式與能力圖式的紐帶,問題圖式梳理出學(xué)科核心問題集,并依據(jù)問題或任務(wù)的完成情況來評價(jià)學(xué)習(xí)者能力情況。問題圖示表示為:QG=(Qi,R,Qj),QG代表問題圖式,Qi是問題集中的第i個(gè)問題,Qj是問題集中的第j個(gè)問題,R是問題集中的關(guān)系集合。
(3)能力圖式
教育知識圖譜中的學(xué)科能力是指學(xué)習(xí)者開展學(xué)科知識學(xué)習(xí)和問題解決所需要的心理調(diào)節(jié)機(jī)制,其本質(zhì)是結(jié)構(gòu)化、系統(tǒng)化的學(xué)科技能及學(xué)科經(jīng)驗(yàn)圖式。能力圖示是學(xué)習(xí)者能力的可視化刻畫,能力圖式以問題圖示為基礎(chǔ),通過對問題與任務(wù)的完成情況的診斷與評測,進(jìn)而對學(xué)科能力進(jìn)行量化與評估。能力圖式是教育領(lǐng)域某個(gè)學(xué)科能力(學(xué)科核心素養(yǎng))及其關(guān)聯(lián)關(guān)系的集合。能力圖式表示為:AG=(Am,R,An),AG代表能力圖式,Am是能力庫中的第m類能力,An是能力庫中的第n類能力,R是能力庫中的關(guān)系集合。
4. 模型構(gòu)成要素
KQA模型主要由知識內(nèi)容、關(guān)聯(lián)關(guān)系、映射關(guān)系、學(xué)習(xí)路徑四大基本要素構(gòu)成。
(1)知識內(nèi)容
根據(jù)聯(lián)通主義理論,學(xué)習(xí)是知識結(jié)構(gòu)中節(jié)點(diǎn)和關(guān)系重構(gòu)的過程[22],知識內(nèi)容是構(gòu)成教育知識圖譜最基本的單位,包括知識簇、問題集和能力庫三部分。
知識簇是以教育領(lǐng)域基本概念、公式、原理為中心的知識詞聚合,展示和描述與知識詞相關(guān)的知識觀念網(wǎng)絡(luò),關(guān)聯(lián)以該知識詞為中心的各個(gè)知識點(diǎn)的相關(guān)知識片段,形成基于詞的知識點(diǎn)的簇狀集聚[23]。
問題集包括教育領(lǐng)域的核心問題與典型任務(wù),具體包括基本問題、組合問題和疑難問題三大類,基本問題通過篩選組合得到組合問題,組合問題通過凝練萃取得到疑難問題。問題集的構(gòu)建是將知識體系的具體知識還原為需要其解決的問題或任務(wù)。問題集不僅要覆蓋全面,還要精準(zhǔn)簡練。需要根據(jù)學(xué)科基本知識體系梳理學(xué)科內(nèi)核問題集[24]。
能力庫主要包括教育領(lǐng)域?qū)W科核心素養(yǎng)指向的學(xué)科高階思維能力。布魯姆認(rèn)為,高階認(rèn)知指向分析、綜合、評價(jià);安德森認(rèn)為,分析、評價(jià)與創(chuàng)造是高階思維能力的核心要素[25];黃國禎認(rèn)為,高階思維能力包括問題解決、批判性思維、團(tuán)隊(duì)協(xié)作、溝通和創(chuàng)造性思維[26]。通過對國內(nèi)外文獻(xiàn)的梳理,本研究認(rèn)為學(xué)科能力主要包括問題解決、批判性思維和創(chuàng)造性思維三項(xiàng)核心能力。學(xué)科問題解決能力形成的關(guān)鍵是,要有應(yīng)用知識解決問題的探究環(huán)境,讓學(xué)生有機(jī)會(huì)運(yùn)用知識解決問題、完成任務(wù)。批判性思維能力形成的關(guān)鍵是讓學(xué)習(xí)者能夠運(yùn)用批判性思維指導(dǎo)與規(guī)劃疑難問題的完成。系統(tǒng)思維能力形成的關(guān)鍵是,系統(tǒng)設(shè)計(jì)不同層次學(xué)科內(nèi)核問題及任務(wù),分層次提供應(yīng)用體驗(yàn)機(jī)會(huì),全面系統(tǒng)監(jiān)測學(xué)習(xí)過程和水平,及時(shí)反饋評價(jià)結(jié)果,幫助學(xué)生有針對性地調(diào)整學(xué)習(xí)方式和過程[27]。
(2)關(guān)聯(lián)關(guān)系
知識構(gòu)建的關(guān)鍵在于有意義學(xué)習(xí),而有意義學(xué)習(xí)的關(guān)鍵是能夠?qū)⑿轮獙W(xué)習(xí)與已有知識之間建立聯(lián)系。教育知識圖譜中關(guān)聯(lián)關(guān)系主要包括知識與知識之間、問題與問題之間、能力與能力之間的關(guān)聯(lián)關(guān)系。
知識與知識之間的關(guān)聯(lián)關(guān)系主要存在于學(xué)科基本概念、公式和原理中。學(xué)科知識之間的關(guān)系常見有父子、兄弟、前后等關(guān)聯(lián)關(guān)系。問題與問題之間的關(guān)聯(lián)關(guān)系主要存在于基本問題、組合問題、疑難問題的組合和凝聚上,常見關(guān)聯(lián)關(guān)系包括一對多、多對一和多對多。能力與能力之間的關(guān)聯(lián)關(guān)系主要指問題解決能力與批判性思維能力之間的關(guān)聯(lián)關(guān)系和問題解決能力與創(chuàng)造性思維能力之間的關(guān)聯(lián)關(guān)系。問題解決能力是學(xué)科能力中的關(guān)鍵能力,學(xué)習(xí)者需要結(jié)合其他學(xué)習(xí)者的觀點(diǎn),反思自己的問題解決方案,提出創(chuàng)新性的問題解決方案[28]。
(3)映射關(guān)系
本文構(gòu)建的KQA模型,不僅能夠表示知識之間的關(guān)聯(lián)關(guān)系,還能刻畫教育領(lǐng)域的學(xué)科能力。但是,學(xué)科能力是一個(gè)較為抽象的概念,難以進(jìn)行直接描述。如何對能力進(jìn)行量化和評估,是一個(gè)較大的挑戰(zhàn)。要想刻畫能力,需要在學(xué)科能力與問題或者任務(wù)之間建立映射關(guān)系,即能力發(fā)展通過分解任務(wù)來實(shí)施,并通過任務(wù)的完成來評估。
KQA模型的映射關(guān)系包括知識映射問題和問題映射能力兩個(gè)方面。知識映射問題是指把教育學(xué)科中常見的基本概念、公示、原理映射為問題集中的基本問題、組合問題和疑難問題。問題映射能力是指把問題集中的問題與任務(wù)映射為學(xué)科應(yīng)具備的能力,通過問題與任務(wù)的完成情況來測量能力的形成程度。映射關(guān)系如圖4所示。
圖4? ?KQA模型的映射關(guān)系
(4)學(xué)習(xí)路徑
關(guān)于學(xué)習(xí)路徑的概念界定,可以從知識學(xué)習(xí)和問題解決兩個(gè)視角對其進(jìn)行內(nèi)涵解析。從知識學(xué)習(xí)的視角來看,學(xué)習(xí)路徑是學(xué)習(xí)者在學(xué)習(xí)過程中選擇或被選擇的一系列概念和活動(dòng)的序列集合[29]。從問題解決的視角來看,學(xué)習(xí)路徑是在智慧學(xué)習(xí)理念的指導(dǎo)下,以問題為線索,經(jīng)歷分析、構(gòu)想、抉擇、評價(jià)、歸納等智慧學(xué)習(xí)過程所包含的學(xué)習(xí)活動(dòng)的設(shè)計(jì)和對活動(dòng)序列的組織[30]。綜合上述觀點(diǎn),本研究認(rèn)為,教育知識圖譜的學(xué)習(xí)路徑是學(xué)習(xí)者為達(dá)成能力目標(biāo),基于學(xué)科知識簇,以內(nèi)核問題為線索,支持學(xué)習(xí)者經(jīng)歷問題發(fā)現(xiàn)、方案構(gòu)想、方法抉擇、能力轉(zhuǎn)化等過程的問題解決或任務(wù)完成的序列集合。學(xué)科能力的量化是根據(jù)學(xué)科問題解決和任務(wù)完成情況進(jìn)行評估。學(xué)習(xí)者為達(dá)成能力目標(biāo),需要從一個(gè)問題解決狀態(tài)到另一個(gè)問題解決狀態(tài),問題解決狀態(tài)之間存在若干個(gè)學(xué)科核心問題或任務(wù)。學(xué)科能力形成的關(guān)鍵是要有運(yùn)用知識解決問題或完成任務(wù)的體驗(yàn)環(huán)境,知識學(xué)習(xí)分為三種方式:聽講式、讀懂式、探究式,問題解決或任務(wù)完成可以通過提供聽講、讀懂、探究的體驗(yàn)環(huán)境實(shí)現(xiàn)突破[31]。對每一個(gè)問題都會(huì)有三種可能的突破方式。總的來說,從一個(gè)問題解決狀態(tài)到另一個(gè)問題解決狀態(tài),就會(huì)存在多條學(xué)習(xí)路徑,學(xué)習(xí)路徑如圖5所示。
四、教育知識圖譜構(gòu)建方法
知識圖譜構(gòu)建主要研究如何從海量數(shù)據(jù)中抽取指定的實(shí)體,并根據(jù)實(shí)體信息構(gòu)建結(jié)構(gòu)化的實(shí)體與實(shí)體之間的關(guān)聯(lián)關(guān)系[32]。徐增林等人從知識抽取、知識表示、知識融合、知識推理四個(gè)方面提出了知識圖譜的構(gòu)建方法[33];黃恒琪等人提出了一種自底向上的知識圖譜構(gòu)建方法,包括數(shù)據(jù)獲取、知識抽取、知識融合、知識加工[34]。教育知識圖譜構(gòu)建的關(guān)鍵在于,利用知識抽取、知識融合等技術(shù)抽取出教育領(lǐng)域中的實(shí)體,并建立實(shí)體間的關(guān)聯(lián)關(guān)系。教育領(lǐng)域知識來源廣泛,多數(shù)知識以非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)進(jìn)行存儲(chǔ),如何將這些數(shù)據(jù)利用自然語言技術(shù)識別出實(shí)體(數(shù)據(jù)獲?。┦墙逃R圖譜構(gòu)建的首要任務(wù);如何從龐雜的教育領(lǐng)域知識中自動(dòng)抽取出教育領(lǐng)域的概念、公式、原理(實(shí)體抽取),并解決實(shí)體語義鏈接的問題(關(guān)系抽?。墙逃R圖譜構(gòu)建的第二任務(wù);由于教育領(lǐng)域知識存在知識質(zhì)量良莠不齊、來自不同數(shù)據(jù)源的知識重復(fù)、層次結(jié)構(gòu)缺失等問題,如何將來自不同知識庫的同一實(shí)體融合在一起(知識融合),是教育知識圖譜構(gòu)建的第三任務(wù);如何在已有知識庫基礎(chǔ)上進(jìn)一步挖掘隱含的知識,從而豐富、擴(kuò)展知識庫(知識推理),是教育知識圖譜構(gòu)建的第四任務(wù)。通過對國內(nèi)外文獻(xiàn)的分析,在KQA模型基礎(chǔ)上,本文利用人工智能技術(shù)中基于機(jī)器學(xué)習(xí)的實(shí)體抽取、關(guān)系抽取、實(shí)體對齊等方法,從數(shù)據(jù)獲取、知識抽?。▽?shí)體抽取、關(guān)系抽取)、知識融合、知識推理四個(gè)方面提出KQA模型的構(gòu)建方法,教育知識圖譜KQA模型構(gòu)建方法如圖6所示。
(一)數(shù)據(jù)獲取
教育領(lǐng)域知識的數(shù)據(jù)獲取來源主要有三類,第一類是非結(jié)構(gòu)化的數(shù)據(jù),這類數(shù)據(jù)大多以文本形式進(jìn)行存儲(chǔ),如教學(xué)設(shè)計(jì)、導(dǎo)學(xué)案、試題庫等;第二類是半結(jié)構(gòu)化的數(shù)據(jù),如專題網(wǎng)站、在線學(xué)習(xí)課程等;第三類是結(jié)構(gòu)化的數(shù)據(jù),如專業(yè)教育機(jī)構(gòu)開發(fā)的教學(xué)系統(tǒng)。結(jié)構(gòu)化數(shù)據(jù)可以直接使用;非結(jié)構(gòu)化數(shù)據(jù)需要進(jìn)行實(shí)體識別處理;半結(jié)構(gòu)化數(shù)據(jù)需要通過包裝器學(xué)習(xí)半結(jié)構(gòu)化數(shù)據(jù)的抽取進(jìn)行處理[35]。
(二)知識抽取
知識抽取是構(gòu)建教育知識圖譜KQA模型的基礎(chǔ),知識抽取包括實(shí)體抽取和關(guān)系抽取。
1. 實(shí)體抽取
實(shí)體抽取是指從教育領(lǐng)域知識庫中提煉基本概念、公式、原理和學(xué)科問題或任務(wù)的過程。實(shí)體抽取的常見方法有三種:基于規(guī)則的抽取、面向開放域的抽取和基于機(jī)器學(xué)習(xí)的抽取[36]?;谝?guī)則的抽取需要組織數(shù)量眾多的領(lǐng)域?qū)<揖帉憣?shí)體抽取規(guī)則,覆蓋面不足;面向開放域的抽取需要數(shù)量巨大的原始語料,難以操作;基于機(jī)器學(xué)習(xí)的抽取是利用機(jī)器學(xué)習(xí)算法對原始語料進(jìn)行訓(xùn)練,將機(jī)器學(xué)習(xí)算法和規(guī)則模型相結(jié)合,不僅自動(dòng)化程度高,而且還能提高準(zhǔn)確性。
在本研究中,能力庫由于受教育領(lǐng)域知識影響較大,主觀性比較強(qiáng),不適合利用機(jī)器學(xué)習(xí)技術(shù)進(jìn)行自動(dòng)抽取,需要組織教育領(lǐng)域?qū)W科專家、教研員、一線教師進(jìn)行人工抽取。將利用基于機(jī)器學(xué)習(xí)的方法對知識簇和問題集進(jìn)行實(shí)體抽取。知識簇的實(shí)體抽取采用條件隨機(jī)場模型(Conditional Random Fields,簡稱CRF)實(shí)現(xiàn)。假設(shè)需要標(biāo)注的實(shí)體序列為X,狀態(tài)序列為Y,實(shí)體抽取的問題可以轉(zhuǎn)化為,求解P(Y/X)取最大值的狀態(tài)序列,在隨機(jī)變量X取值為x的條件下,隨機(jī)變量Y取值為y的條件概率計(jì)算公式如式(1)所示:
映射關(guān)系抽取采用開放信息抽取原型系統(tǒng)(TextRunner)進(jìn)行抽取,人工標(biāo)記訓(xùn)練集,利用實(shí)體關(guān)系分類模型對開放數(shù)據(jù)進(jìn)行分類,依據(jù)分類結(jié)果訓(xùn)練貝葉斯模型來抽取映射關(guān)系,映射關(guān)系三元組包括{K,M,Q}和{Q,M,A},K代表知識集,M代表映射關(guān)系,Q代表問題集,A代表能力集。
(三)知識融合
知識融合是知識組織的高層次表現(xiàn)形式[37],知識融合最常用的是實(shí)體對齊技術(shù)。本研究采用基于機(jī)器學(xué)習(xí)的實(shí)體對齊方法,其基本流程為:(1)數(shù)據(jù)預(yù)處理:利用語法正規(guī)化和數(shù)據(jù)正規(guī)化對原始數(shù)據(jù)進(jìn)行預(yù)處理;(2)分塊:從給定的實(shí)體對中,選出潛在匹配的候選項(xiàng);(3)記錄鏈接:從屬性相似度和實(shí)體相似度記錄鏈接;(4)相似度計(jì)算:利用聚類算法計(jì)算相似度;(5)結(jié)果輸出:輸出知識融合結(jié)果。實(shí)體對齊流程如圖7所示。
(四)知識推理
本研究采用基于圖的推理中Path Ranking算法來實(shí)現(xiàn)教育知識圖譜的知識推理,挖掘知識圖譜中的學(xué)習(xí)路徑。其基本思想是,將教育知識圖譜的問題圖式視為圖,其中問題或任務(wù)為節(jié)點(diǎn),關(guān)聯(lián)關(guān)系為邊,從初始問題解決狀態(tài)開始,在圖上隨機(jī)游走,如果能夠通過某個(gè)路徑到達(dá)目標(biāo)問題解決狀態(tài),則挖掘出初始問題解決狀態(tài)和目標(biāo)問題解決狀態(tài)的學(xué)習(xí)路徑。假設(shè)有任意關(guān)系路徑P=R1…Rl,指定一個(gè)種子節(jié)點(diǎn)S∈domain(P),一個(gè)路徑約束隨機(jī)行走定為hs,p。如果P是一個(gè)空路徑,則定義如式(7)所示:
五、結(jié)? ?語
教育領(lǐng)域模型是教育領(lǐng)域構(gòu)建自適應(yīng)系統(tǒng)的關(guān)鍵和基礎(chǔ),也是該領(lǐng)域研究中長期存在的瓶頸問題。本研究針對知識內(nèi)容粒度模糊、學(xué)習(xí)能力刻畫不足、構(gòu)建方法效率低下等問題,從知識圖式、問題圖式、能力圖式三個(gè)層面,圍繞知識內(nèi)容、關(guān)聯(lián)關(guān)系、映射關(guān)系、學(xué)習(xí)路徑四大關(guān)鍵要素,構(gòu)建了教育知識圖譜KQA模型,為知識圖譜在教育領(lǐng)域的應(yīng)用和智慧學(xué)習(xí)環(huán)境構(gòu)建提供了基礎(chǔ)。一方面,該模型可以助力智慧教學(xué)的有效實(shí)施,智慧教學(xué)實(shí)施的關(guān)鍵在于精準(zhǔn)確定教學(xué)目標(biāo)和篩選、優(yōu)化適合課堂教學(xué)的群體學(xué)習(xí)路徑。教師依據(jù)教育知識圖譜KQA模型,可以清晰地了解學(xué)科知識、問題、能力的關(guān)聯(lián)關(guān)系,在此基礎(chǔ)上,依據(jù)學(xué)情分析,精準(zhǔn)確定教學(xué)目標(biāo)。教育知識圖譜匯聚了不同學(xué)科的共性學(xué)習(xí)路徑,教師可以根據(jù)學(xué)情分析,篩選、優(yōu)化群體學(xué)生學(xué)習(xí)路徑,支撐智慧教學(xué)的順利實(shí)施。另一方面,該模型可以助力智慧學(xué)習(xí)高效構(gòu)建,智慧學(xué)習(xí)開展的關(guān)鍵在于能夠?yàn)閷W(xué)習(xí)者提供個(gè)性化的學(xué)習(xí)路徑,即向?qū)W習(xí)者推送最適合的學(xué)習(xí)資源、學(xué)習(xí)活動(dòng)序列和學(xué)習(xí)任務(wù)等,促進(jìn)學(xué)習(xí)者個(gè)性化學(xué)習(xí)。學(xué)習(xí)者依據(jù)KQA模型,借助知識簇聚合學(xué)科核心知識,以知識簇的形式推送學(xué)習(xí)內(nèi)容,解決學(xué)習(xí)內(nèi)容粒度較粗的問題;借助問題集中的基本問題、組合問題、疑難問題,以問題或任務(wù)形式倒掛學(xué)習(xí)資源,讓學(xué)習(xí)資源精準(zhǔn)解決學(xué)習(xí)問題,促進(jìn)智慧學(xué)習(xí)的高效構(gòu)建。此外,該模型還可以為教育資源體系構(gòu)建提供重要參考,資源體系是資源組織與存儲(chǔ)的結(jié)構(gòu)方式,高品質(zhì)的個(gè)性化學(xué)習(xí)離不開優(yōu)質(zhì)教育資源的大力支持,離開了優(yōu)質(zhì)資源的教師會(huì)出現(xiàn)“巧婦難為無米之炊”的困境。如何借助教育知識圖譜KQA模型,對資源學(xué)科分類、資源應(yīng)用情境、資源適用對象、資源媒體格式、資源呈現(xiàn)形態(tài)進(jìn)行分析,構(gòu)建新型的教育資源體系,還需要深入探索。
[參考文獻(xiàn)]
[1] 中華人民共和國教育部.教育部關(guān)于印發(fā)《教育信息化2.0行動(dòng)計(jì)劃》的通知[EB/OL].[2018-04-18].http://www.moe.gov.cn/srcsite/A16/s3342/201804/t20180425_334188.html.
[2] 姜強(qiáng).自適應(yīng)學(xué)習(xí)系統(tǒng)支持模型與實(shí)現(xiàn)機(jī)制研究[D].長春:東北師范大學(xué),2012.
[3] 中華人民共和國國務(wù)院.新一代人工智能發(fā)展規(guī)劃[EB/OL].[2017-07-20].http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm.
[4] NOVAK J D, GOWIN D B. Learning how to learn[M]. Cambridge: Cambridge University Press,1984.
[5] TROWBRIDGE J E, WANDERSEE J H. How do graphics presented during college biology lessons affect students' learning?[J]. Journal of college science teaching, 1996, 26(1):54-57.
[6] RUIZ-PRIMO M A, SHAVELSON R J. Problems and issues in the use of concept maps in science assessment[J]. Journal of research in science teaching, 1998, 33(6):569-600.
[7] HWA L J, AVIV S. Knowledge maps for e-learning [J]. Computers & education, 2012, 59(2):353-364.
[8] KIM S, SUH E, HWANG H. Building the knowledge map: an industrial case study[J]. Journal of knowledge management, 2003, 7(2):34-45.
[9] 李艷紅,趙波,甘健侯.基于知識地圖的MOOC課程開發(fā)[J].現(xiàn)代教育技術(shù),2015,25(5):85-90.
[10] 劉紅晶,譚良.基于知識地圖的MOOC學(xué)習(xí)共同體的學(xué)習(xí)研究[J].中國遠(yuǎn)程教育,2017(3):22-29,79-80.
[11] 陳悅,劉則淵.悄然興起的科學(xué)知識圖譜[J].科學(xué)學(xué)研究,2005(2):149-154.
[12] LEO Y, UREN V, MOTTA E. SemSearch: a search engine for the semantic web[J]. Lecture notes in computer science, 2006, (10):238-245.
[13] 李振,周東岱.教育知識圖譜的概念模型與構(gòu)建方法研究[J].電化教育研究,2019,40(8):78-86,113.
[14] 余勝泉,李曉慶.區(qū)域性教育大數(shù)據(jù)總體架構(gòu)與應(yīng)用模型[J].中國電化教育,2019(1):18-27.
[15] 余勝泉,彭燕,盧宇.基于人工智能的育人助理系統(tǒng)——“AI好老師”的體系結(jié)構(gòu)與功能[J].開放教育研究,2019,25(1):25-36.
[16] 楊開城.論課程的易理解性與知識建模技術(shù)[J].電化教育研究,2011(6):10-14.
[17] 李振,周東岱,王勇.“人工智能+”視域下的教育知識圖譜:內(nèi)涵、技術(shù)框架與應(yīng)用研究[J].遠(yuǎn)程教育雜志,2019,37(4):42-53.
[18] 史寧中.推進(jìn)基于學(xué)科核心素養(yǎng)的教學(xué)改革[J].中小學(xué)管理,2016(2):19-21.
[19] 姜強(qiáng),趙蔚,劉紅霞,等.能力導(dǎo)向的個(gè)性化學(xué)習(xí)路徑生成及評測[J].現(xiàn)代遠(yuǎn)程教育研究,2015(6):104-111.
[20] 王磊.學(xué)科能力構(gòu)成及其表現(xiàn)研究——基于學(xué)習(xí)理解、應(yīng)用實(shí)踐與遷移創(chuàng)新導(dǎo)向的多維整合模型[J].教育研究,2016,37(9):83-92,125.
[21] 陳剛,舒信隆.問題圖式在物理問題解決教學(xué)中的應(yīng)用[J].課程·教材·教法,2009,29(7):57-61.
[22] 王佑鎂,祝智庭.從聯(lián)結(jié)主義到聯(lián)通主義:學(xué)習(xí)理論的新取向[J].中國電化教育,2006(3):5-9.
[23] 王華偉,周和玉,韋靚,郟林,張然,王海泉,于雷.基于領(lǐng)域知識詞網(wǎng)的學(xué)科知識簇實(shí)現(xiàn)初探——以武漢理工大學(xué)自動(dòng)化學(xué)科知識簇建設(shè)為例[J].情報(bào)理論與實(shí)踐,2012,35(9):5-8.
[24] 鐘紹春,唐燁偉.人工智能時(shí)代教育創(chuàng)新發(fā)展的方向與路徑研究[J].電化教育研究,2018,39(10):15-20,40.
[25] 安德森.學(xué)習(xí)、教學(xué)和評估的分類學(xué)——布盧姆教育目標(biāo)分類學(xué)(修訂版)[M].皮連生,譯.上海:華東師范大學(xué)出版社,2008:1-20.
[26] LAI C L, HWANG G J. Effects of mobile learning time on students' conception of collaboration, communication, complex problem-solving, meta-cognitive awareness and creativity[M]. Geneva:Inderscience Publishers, 2014.
[27] 鐘紹春,唐燁偉,王春暉.智慧教育的關(guān)鍵問題思考及建議[J].中國電化教育,2018(1):106-111,117.
[28] 王靖,崔鑫.深度學(xué)習(xí)動(dòng)機(jī)、策略與高階思維能力關(guān)系模型構(gòu)建研究[J].遠(yuǎn)程教育雜志,2018,36(6):41-52.
[29] KARDAN A A, EBRAHIM M A, IMANI M B. A new personalized learning path generation method: ACO-Map[J]. Indian journal of scientific research, 2014, 5(1): 17-24.
[30] 趙琳,解月光,楊鑫,賈云,張琢.智慧課堂的“動(dòng)態(tài)”學(xué)習(xí)路徑設(shè)計(jì)研究[J].中國電化教育,2017(11):1-6.
[31] 鐘紹春.構(gòu)建信息時(shí)代教育新模式[J].電化教育研究,2019,40(4):23-29.
[32] 魏玉良.互聯(lián)網(wǎng)人物摘要知識圖譜構(gòu)建方法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2019.
[33] 徐增林,盛泳潘,賀麗榮,王雅芳.知識圖譜技術(shù)綜述[J].電子科技大學(xué)學(xué)報(bào),2016,45(4):589-606.
[34] 黃恒琪,于娟,廖曉,席運(yùn)江.知識圖譜研究綜述[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2019,28(6):1-12.
[35] 漆桂林,高桓,吳天星.知識圖譜研究進(jìn)展[J].情報(bào)工程,2017,3(1):4-25.
[36] 孫鎮(zhèn),王惠臨.命名實(shí)體識別研究進(jìn)展綜述[J].現(xiàn)代圖書情報(bào)技術(shù),2010(6):42-47.
[37] 徐緒堪,房道偉,蔣勛,蘇新寧.知識組織中知識粒度化表示和規(guī)范化研究[J].圖書情報(bào)知識,2014(6):101-106,90.
[Abstract] As a core component of constructing adaptive learning system, domain model has attracted wide attention of researchers. In order to solve the problem of scattered knowledge content and insufficient ability description in existing educational domain models, this paper proposes a KQA model of educational knowledge map which can establish the mapping relationship among knowledge, problem and ability. This model consists of three schema of knowledge schema, problem schema and ability schema and four elements of knowledge content, association relationship, mapping relationship and learning path. Using the methods of entity extraction, relation extraction and entity alignment based on machine learning, this paper proposes the construction method of KQA model of educational knowledge map from four aspects: data acquisition, knowledge extraction, knowledge fusion and knowledge reasoning. This study provides a basis for the application of knowledge map in the field of education and is of great significance for the development of personalized learning.
[Keywords] Artificial Intelligence; Knowledge Map; Model Construction; Machine Learning; Learning Path; Adaptive Learning