劉歡 張廣娜
摘? 要? 互聯(lián)網(wǎng)技術(shù)與各領(lǐng)域的深度融合推動(dòng)著教育事業(yè)的發(fā)展,解構(gòu)知識(shí)圖譜的理論內(nèi)涵,構(gòu)建計(jì)算機(jī)應(yīng)用基礎(chǔ)課程的本體模型和知識(shí)圖譜,并利用Neo4j對(duì)圖譜進(jìn)行可視化,結(jié)合校本資源和學(xué)生數(shù)據(jù)進(jìn)行教學(xué)實(shí)踐,以期運(yùn)用知識(shí)圖譜創(chuàng)新教育教學(xué)方法,為提高教學(xué)質(zhì)量提供參考。
關(guān)鍵詞? 計(jì)算機(jī)應(yīng)用基礎(chǔ);知識(shí)圖譜;可視化
中圖分類(lèi)號(hào):G712? ? 文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):1671-489X(2022)22-0078-04
0? 引言
如今,利用網(wǎng)絡(luò)進(jìn)行教學(xué)和學(xué)習(xí)的教育方式越來(lái)越被廣泛使用。網(wǎng)上學(xué)習(xí)時(shí),學(xué)生對(duì)知識(shí)點(diǎn)的理解是孤立零散的,難以系統(tǒng)地掌握所學(xué)知識(shí)點(diǎn),在檢索及學(xué)習(xí)知識(shí)的過(guò)程中效率低下。只有對(duì)知識(shí)進(jìn)行分析、整理,找準(zhǔn)內(nèi)在聯(lián)系、弄清知識(shí)脈絡(luò),形成知識(shí)結(jié)構(gòu)體系,根據(jù)學(xué)生對(duì)知識(shí)的掌握情況,針對(duì)學(xué)生特征提供學(xué)習(xí)資源,才能幫助他們提高學(xué)習(xí)效率。因此,將學(xué)科知識(shí)點(diǎn)構(gòu)建成知識(shí)圖譜應(yīng)用于教學(xué),為提高教育教學(xué)質(zhì)量帶來(lái)希望。
在教育知識(shí)圖譜方面,F(xiàn)abian K等[1]在2013年首次將概念圖引入教育教學(xué);Yang Y等[2]應(yīng)用誘導(dǎo)圖挖掘課程之間的內(nèi)在關(guān)系。在國(guó)內(nèi),最早開(kāi)始的是2013年關(guān)于旅游管理學(xué)科課程教學(xué)的研究,隨后,CSDN應(yīng)用知識(shí)圖譜推出計(jì)算機(jī)知識(shí)系統(tǒng)[3];張春霞等[4]基于數(shù)學(xué)課程本體,研究數(shù)學(xué)課程知識(shí)圖譜的構(gòu)建方法,并提供一種形式化的、顯式的課程知識(shí)表示,改善知識(shí)服務(wù)效果;何政等[5]針對(duì)C#程序設(shè)計(jì)課程構(gòu)建知識(shí)圖譜并設(shè)計(jì)學(xué)習(xí)導(dǎo)航系統(tǒng),在實(shí)際教學(xué)中進(jìn)行實(shí)踐運(yùn)用;楊娟等[6]對(duì)教育知識(shí)圖譜模型構(gòu)建進(jìn)行研究,構(gòu)造教育知識(shí)圖譜KSCG理論模型,為自適應(yīng)學(xué)習(xí)提供一定的理論支撐;朱鵬[7]通過(guò)從優(yōu)質(zhì)的教育資源站點(diǎn)采集課程知識(shí),完成課程知識(shí)圖譜的構(gòu)建。
本文采用自頂向下與自底向上結(jié)合的半自動(dòng)方式構(gòu)建計(jì)算機(jī)應(yīng)用基礎(chǔ)課程知識(shí)圖譜。
首先,自頂向下使用Protégé本體建構(gòu)工具對(duì)計(jì)算機(jī)應(yīng)用課程可視化。
其次,根據(jù)課程本體,從百度網(wǎng)站、校本數(shù)字化學(xué)習(xí)平臺(tái)網(wǎng)站中爬取數(shù)據(jù);應(yīng)用數(shù)據(jù)進(jìn)行實(shí)體與關(guān)系的抽取。
最后,采用Neo4j進(jìn)行存儲(chǔ)與可視化。
課題組把課程知識(shí)圖譜應(yīng)用于實(shí)際教學(xué)中,并通過(guò)調(diào)查問(wèn)卷和測(cè)試,發(fā)現(xiàn)該技術(shù)能有效增強(qiáng)學(xué)習(xí)效果。
1? 相關(guān)知識(shí)
一般來(lái)說(shuō),課程知識(shí)圖譜可以分為模式層和數(shù)據(jù)層兩個(gè)層次:模式層存儲(chǔ)提煉加工后的知識(shí),而數(shù)據(jù)層儲(chǔ)存真實(shí)具體的數(shù)據(jù)信息;模式層可通過(guò)構(gòu)建本體對(duì)其進(jìn)行設(shè)計(jì),而數(shù)據(jù)層一般使用數(shù)據(jù)庫(kù)進(jìn)行管理。
1.1? 本體
在課程領(lǐng)域的知識(shí)圖譜中,課程本體是指構(gòu)成課程的核心概念、課程概念之間的相互關(guān)系以及概念的一些描述信息,如定義、內(nèi)容等。本體建模的方法主要有七步法、Methontology方法、IDEF-5法、TOVE法、骨架法等。一些常見(jiàn)的本體開(kāi)發(fā)工具有Ontolingua、WebOnto、Protégé等。
1.2? 知識(shí)圖譜
狹義的知識(shí)圖譜本質(zhì)上是大規(guī)模的語(yǔ)義網(wǎng)絡(luò),由節(jié)點(diǎn)以及連接節(jié)點(diǎn)的邊構(gòu)成,其中節(jié)點(diǎn)表示實(shí)體、屬性值、概念等,邊表示節(jié)點(diǎn)間的相互依存關(guān)系或?qū)傩?,可以使用三元組表示:<實(shí)體1,關(guān)系,實(shí)體2>和<實(shí)體,屬性,屬性值>[8]。
構(gòu)建知識(shí)圖譜的主要流程是從結(jié)構(gòu)、半結(jié)構(gòu)或非結(jié)構(gòu)化的數(shù)據(jù)出發(fā),將其歸一為結(jié)構(gòu)化數(shù)據(jù),使用融合算法進(jìn)行實(shí)體消歧,得到實(shí)體數(shù)據(jù),抽取關(guān)系建邊,存入知識(shí)庫(kù)。
2? 知識(shí)圖譜的構(gòu)建
計(jì)算機(jī)應(yīng)用基礎(chǔ)課程知識(shí)圖譜,主要構(gòu)建過(guò)程包含本體構(gòu)建、基于Scrapy的數(shù)據(jù)獲取、基于TF-IDF的實(shí)體抽取、實(shí)體間的關(guān)系抽取以及課程的知識(shí)存儲(chǔ)與可視化。
2.1? 本體構(gòu)建
大學(xué)計(jì)算機(jī)基礎(chǔ)課程為大學(xué)計(jì)算機(jī)專(zhuān)業(yè)課程體系中的第一門(mén)基礎(chǔ)課程,也是非計(jì)算機(jī)專(zhuān)業(yè)必修的公共基礎(chǔ)課,課程內(nèi)容主要涉及計(jì)算機(jī)各領(lǐng)域概念,內(nèi)容主要包含計(jì)算機(jī)基礎(chǔ)知識(shí)、Windows操作系統(tǒng)、Word文檔、Excel表格、PowerPoint演示文稿制作軟件、多媒體技術(shù)基礎(chǔ)和網(wǎng)絡(luò)信息安全等。組織形式上可歸納為課程知識(shí)點(diǎn)、課程知識(shí)塊與課程知識(shí)體系等。課程知識(shí)點(diǎn)與知識(shí)塊之間相互關(guān)聯(lián),知識(shí)模塊之間也存在關(guān)系,在本體的構(gòu)建構(gòu)成中主要包含分類(lèi)、屬性、包含、平行、前驅(qū)—后繼關(guān)系等,關(guān)系的定義影響著課程結(jié)構(gòu)體系的構(gòu)建。參考大學(xué)計(jì)算機(jī)基礎(chǔ)教材,使用Protégé軟件構(gòu)建本體關(guān)系模型,如圖1所示。
2.2? 數(shù)據(jù)的獲取
本文使用Scrapy爬蟲(chóng)技術(shù)對(duì)數(shù)據(jù)進(jìn)行爬取,過(guò)程主要包括Scrapy引擎、資源調(diào)度、數(shù)據(jù)下載、解析以及數(shù)據(jù)內(nèi)容處理五個(gè)部分。首先確定課程語(yǔ)料采集目標(biāo)站點(diǎn):百度文庫(kù)中包含很多計(jì)算機(jī)技術(shù)方面的資料,采用Scrapy技術(shù)對(duì)網(wǎng)頁(yè)數(shù)據(jù)進(jìn)行爬取。其整個(gè)爬蟲(chóng)的處理流程為:
1)初始化URL;
2)調(diào)用parse()方法,進(jìn)入爬蟲(chóng)核心程序;
3)定義數(shù)據(jù)抽取算法;
4)解析URL,設(shè)置數(shù)據(jù)保存目錄;
5)抽取網(wǎng)頁(yè)數(shù)據(jù)并保存。
2.3? 課程領(lǐng)域概念抽取
對(duì)網(wǎng)站有關(guān)數(shù)據(jù)爬取后,需要對(duì)課程領(lǐng)域關(guān)鍵詞進(jìn)行抽取,抽取關(guān)鍵字的技術(shù)又分為有監(jiān)督的算法和無(wú)監(jiān)督的算法兩類(lèi)。本研究主要使用基于無(wú)監(jiān)督的TF-IDF算法對(duì)概念詞進(jìn)行抽取。
TF-IDF就是計(jì)算TF與IDF的乘積,TF表示詞頻,IDF表示逆文檔頻率。其主要思想是,如果某個(gè)詞語(yǔ)在相關(guān)文章中出現(xiàn)的頻率高,并且在其他不緊密相關(guān)的文章中出現(xiàn)的次數(shù)少,則認(rèn)為詞語(yǔ)具有良好的分類(lèi)能力。
對(duì)于抽取的課程知識(shí)的詞匯來(lái)說(shuō),TF是指在一篇文檔中某個(gè)詞語(yǔ)出現(xiàn)的次數(shù)m與文檔總詞數(shù)n的比值:
IDF指的是總文檔數(shù)N與包含該詞語(yǔ)的文檔數(shù)M的比值,再取對(duì)數(shù):
分母加1是為了避免分母為0。
然后,求TF-IDF的值:
TF-IDF(w)=TF(w)*IDF(w)
IDF—般可以篩選出常見(jiàn)詞,該算法已在jieba
中實(shí)現(xiàn),直接調(diào)用即可實(shí)現(xiàn),主要代碼為:
import jieba
import jieba.analyse
jieba.analyse.extract_tags(open(“*.txt”,rb).
read(),topK=30,withWeight= False, allowPOS=())
2.4? 實(shí)體消歧
在完成信息抽取后可能出現(xiàn)實(shí)體歧義,此時(shí)要進(jìn)行關(guān)鍵字對(duì)齊,即對(duì)課程概念之間相似度進(jìn)行計(jì)算。此部分利用Python工具包gensim調(diào)用word2vec,其主要代碼為:
from gensim.models
import word2vec
model=KeyedVectors.load_word2vec_format(ck_word2vec_model_file,binary=True)
model.most_similar(query_list[0],topn=5)
在得到的與課程概念相似度靠前的幾個(gè)詞中進(jìn)行篩選。經(jīng)過(guò)算法篩選出來(lái)的關(guān)鍵詞中尚存在一些無(wú)用的關(guān)鍵詞,因此有必要進(jìn)行二次過(guò)濾,去掉無(wú)用詞、相似詞,經(jīng)過(guò)質(zhì)量評(píng)估,獲取最終的課程關(guān)鍵詞,其部分結(jié)果如表1所示。
2.5? 概念關(guān)系抽取
課程關(guān)鍵詞抽取后,要確定關(guān)鍵詞關(guān)系。在課程本體的構(gòu)建過(guò)程中應(yīng)用到的知識(shí)關(guān)系主要包括分類(lèi)關(guān)系、包含關(guān)系和上下位關(guān)系等。
對(duì)于分類(lèi)關(guān)系數(shù)據(jù),基于迭代K-means算法生成,其算法思想是:
1)初始化,任意選擇k個(gè)點(diǎn)作為中心點(diǎn);
2)分別計(jì)算其他點(diǎn)到每個(gè)中心點(diǎn)的距離,將其分配到離它最近的中心點(diǎn);
3)重新計(jì)算已經(jīng)得到的各個(gè)類(lèi)的中心點(diǎn);
4)迭代第2)和第3)步,直到中心不再發(fā)生變化或達(dá)到迭代次數(shù),則停止迭代。
對(duì)于上下位關(guān)系,主要基于教材等圖書(shū)目錄信息來(lái)確定,算法步驟為:按照目錄的組織,進(jìn)行深度遍歷,按照關(guān)鍵詞出現(xiàn)的先后順序進(jìn)行排序。但由于源數(shù)據(jù)的不同,部分關(guān)鍵詞會(huì)有不同關(guān)系,這時(shí)就輔助以人工的方式進(jìn)行判斷。
執(zhí)行上述操作后,得到本文課程知識(shí)圖譜構(gòu)建中的節(jié)點(diǎn)和關(guān)系。
2.6? 知識(shí)圖譜可視化
通過(guò)前面的數(shù)據(jù)處理,已將課程內(nèi)容中的關(guān)鍵詞和關(guān)鍵詞的關(guān)系抽取出來(lái),下一步則是把課程知識(shí)存儲(chǔ)起來(lái)。本文選擇Neo4j引擎,在Windows下,使用Java語(yǔ)言對(duì)計(jì)算機(jī)應(yīng)用基礎(chǔ)課程知識(shí)圖譜進(jìn)行可視化,如圖2所示。
3? 知識(shí)圖譜在教學(xué)上的應(yīng)用
課題組將計(jì)算機(jī)應(yīng)用基礎(chǔ)知識(shí)圖譜應(yīng)用于教學(xué),應(yīng)用于線上線下相結(jié)合的授課實(shí)踐之中。教師授課過(guò)程中將圖譜作為輔助教學(xué)的工具,引導(dǎo)學(xué)生使用知識(shí)圖譜進(jìn)行自主學(xué)習(xí)。具體實(shí)施方式體現(xiàn)在,根據(jù)學(xué)院現(xiàn)有學(xué)習(xí)平臺(tái)數(shù)據(jù),把智慧課堂、在線網(wǎng)絡(luò)學(xué)習(xí)空間、移動(dòng)學(xué)習(xí)平臺(tái)、大數(shù)據(jù)分析與質(zhì)量監(jiān)控平臺(tái)有效地聯(lián)動(dòng)利用起來(lái),對(duì)學(xué)生個(gè)人進(jìn)行跟蹤,根據(jù)學(xué)生當(dāng)前狀態(tài)和學(xué)習(xí)接收能力,為其篩選推薦合適的學(xué)習(xí)資源及學(xué)習(xí)計(jì)劃。
學(xué)生在課堂之外使用知識(shí)圖譜進(jìn)行自主學(xué)習(xí),根據(jù)圖譜查看當(dāng)前學(xué)習(xí)模塊包含的知識(shí)點(diǎn)集合,以及和其他知識(shí)點(diǎn)的關(guān)聯(lián),判斷知識(shí)點(diǎn)的前驅(qū)后繼關(guān)系,生成各知識(shí)點(diǎn)模塊的學(xué)習(xí)順序。同時(shí),鼓勵(lì)學(xué)生利用網(wǎng)絡(luò)資源自學(xué),結(jié)合知識(shí)圖譜能夠構(gòu)建課程學(xué)習(xí)的整體感,幫助形成課程知識(shí)體系。最后,專(zhuān)業(yè)課教師借助知識(shí)圖譜集體備課,教授同一門(mén)課程的教師可以共享彼此資源,構(gòu)建側(cè)重點(diǎn)不同的課程知識(shí)圖譜,減少重復(fù)性工作。
課題組教師在教授班級(jí)中,在2021年下半學(xué)期進(jìn)行教學(xué)實(shí)踐實(shí)驗(yàn),以期中測(cè)試時(shí)間為分界點(diǎn),前半部分時(shí)間未使用知識(shí)圖譜教學(xué)并對(duì)學(xué)生進(jìn)行期中測(cè)試,后半部分時(shí)間把知識(shí)圖譜引入教學(xué),分別在期中、期末對(duì)學(xué)生學(xué)習(xí)效率、課程知識(shí)體系構(gòu)建、對(duì)教師滿(mǎn)意度以及考試成績(jī)等方面進(jìn)行調(diào)查打分,以100分為滿(mǎn)分,圖3為調(diào)查打分結(jié)果。
數(shù)據(jù)顯示,本研究使學(xué)生在以上方面均有提高,說(shuō)明知識(shí)圖譜在一定程度上能夠增強(qiáng)學(xué)生的課程學(xué)習(xí)效果。
4? 結(jié)束語(yǔ)
本文研究知識(shí)圖譜技術(shù)內(nèi)涵,構(gòu)建出計(jì)算機(jī)應(yīng)用基礎(chǔ)課程知識(shí)圖譜,以可視化的形式將課程知識(shí)內(nèi)容展現(xiàn)給學(xué)生,學(xué)生可以直觀看出知識(shí)點(diǎn)間的內(nèi)在聯(lián)系,清晰課程知識(shí)體系,提高學(xué)習(xí)效率,幫助教師發(fā)揮資源優(yōu)勢(shì)、共同提高,促進(jìn)實(shí)現(xiàn)線上與線下相結(jié)合的教與學(xué)方式。但是,作為新的研究熱點(diǎn),知識(shí)圖譜應(yīng)用于教育教學(xué)在技術(shù)上還不是很成熟,相信隨著相關(guān)研究的不斷深入,知識(shí)圖譜將會(huì)為教學(xué)提質(zhì)增效。
參考文獻(xiàn)
[1] Kneissl F, Bry F. Fostering Concept Maps Aware-ness as a Means to Learning[M]//2013 IEEE ThirdInternational Conference on Cloud and Green?Computing,2013:354-357.
[2] Yang Y M, Liu H X, Carbonell J, et al. ConceptGraph Learning from Educational Data[J].8th ACMConference on Web Search and Data Mining,2015.
[3] Network Chinese Software Developer.知識(shí)庫(kù)[EB/??OL].(2018-01-02)[2018-01-02].http://lib.csdn.??net/home.
[4] 張春霞,彭成,羅妹秋,等.數(shù)學(xué)課程知識(shí)圖譜構(gòu)建及其推理[J].計(jì)算機(jī)科學(xué),2020,47(S2):573-578.
[5] 何政,葉剛.基于知識(shí)圖譜的C#課程學(xué)習(xí)導(dǎo)航系統(tǒng)研究[J].太原城市職業(yè)技術(shù)學(xué)院學(xué)報(bào),2021(9):97-99.
[6] 楊娟,杜旭,李浩.自適應(yīng)學(xué)習(xí)系統(tǒng)中教育知識(shí)圖譜? ?模型構(gòu)建研究[J].中國(guó)教育信息化,2021(24):24-29.
[7] 朱鵬.基于Web文檔資源的課程知識(shí)圖譜構(gòu)建及應(yīng)用研究[D].昆明:云南師范大學(xué),2019.
[8] 張吉祥,張祥森,武長(zhǎng)旭,等.知識(shí)圖譜構(gòu)建技術(shù)綜述[J].計(jì)算機(jī)工程,2021,48(3):23-37.
[9] 家明強(qiáng).基于知識(shí)圖譜的課程學(xué)習(xí)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].昆明:云南師范大學(xué),2021.
*項(xiàng)目來(lái)源:2021年度河南交通職業(yè)技術(shù)學(xué)院教學(xué)改革研究與實(shí)踐項(xiàng)目“基于知識(shí)圖譜的信息化教學(xué)研究與實(shí)踐”(課題編號(hào):2021JG038)。
作者:劉歡,河南交通職業(yè)技術(shù)學(xué)院現(xiàn)代教育技術(shù)中心,講師,研究方向?yàn)橛?jì)算機(jī)應(yīng)用技術(shù);張廣娜,河南交通職業(yè)技術(shù)學(xué)院交通信息工程系,高級(jí)工程師,研究方向?yàn)橹悄芙煌夹g(shù)(450018)。