戈其平,鐘艷如
(桂林電子科技大學(xué) 計(jì)算機(jī)與信息安全學(xué)院,廣西 桂林 541000)
在新課程背景下,提高學(xué)生對數(shù)學(xué)的自主學(xué)習(xí)能力,不僅有利于掌握本階段的一些知識,而且更能促進(jìn)數(shù)學(xué)綜合素質(zhì)的提升[1]。但是對于不同學(xué)生,在對同樣的數(shù)學(xué)知識進(jìn)行學(xué)習(xí)的時(shí)候會產(chǎn)生不同的學(xué)習(xí)效果。產(chǎn)生這一現(xiàn)象主要是因?yàn)橹R是對事物結(jié)構(gòu)的認(rèn)識,不同的學(xué)習(xí)者對知識結(jié)構(gòu)的組織也會不同。一般來講,效果好的學(xué)習(xí)者對知識結(jié)構(gòu)會進(jìn)行系統(tǒng)化處理,讓知識進(jìn)行分層排布,使得知識能以網(wǎng)絡(luò)的結(jié)構(gòu)來在腦海中進(jìn)行存儲。因此在數(shù)學(xué)教學(xué)過程中,如何讓學(xué)生構(gòu)建數(shù)學(xué)知識網(wǎng)絡(luò)結(jié)構(gòu)是很重要的[2]。
知識圖譜是利用知識間的語義關(guān)系,將分散的知識收集起來的網(wǎng)絡(luò)結(jié)構(gòu)。它首先利用自然語言技術(shù)自動(dòng)抽取實(shí)體,然后通過本體策略構(gòu)建出結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù)[3],以找出它們之間的聯(lián)系,最后通過可視化引擎工具進(jìn)行展示。將知識圖譜運(yùn)用在數(shù)學(xué)教學(xué)上,不僅加強(qiáng)了數(shù)學(xué)內(nèi)容章節(jié)與章節(jié)之間的聯(lián)系,幫助學(xué)生對數(shù)學(xué)知識進(jìn)行有效存儲,還可以實(shí)現(xiàn)知識的共享。與此同時(shí),知識圖譜還可以將教學(xué)資源進(jìn)行系統(tǒng)化,以激發(fā)學(xué)生的自主學(xué)習(xí)能力,所以構(gòu)建關(guān)于數(shù)學(xué)內(nèi)容的知識圖譜是解決教學(xué)問題的好方法。
通過分析本體與知識圖譜的相關(guān)概念,通過對數(shù)學(xué)知識的部分挖掘,并結(jié)合知識圖譜表示技術(shù),實(shí)現(xiàn)基于數(shù)學(xué)教學(xué)的數(shù)學(xué)內(nèi)容知識圖譜的構(gòu)建以及可視化。
本體是一種形式化表示方法,表達(dá)的是概念的結(jié)構(gòu)、概念與概念之間的關(guān)系。對于不同領(lǐng)域,構(gòu)建本體的方法也是不同的。構(gòu)建本體的方法一般包括IDEF5、AFM、骨架法、七步循環(huán)法、半自動(dòng)構(gòu)建法、自動(dòng)構(gòu)建法等等。構(gòu)建本體的開發(fā)工具有OntoEdit,WebOnto,WebODE,KAON和protege。本體的構(gòu)建流程如圖1所示[4]。
圖1 本體構(gòu)建流程
知識圖譜是一個(gè)結(jié)構(gòu)化的語義知識庫,用符號的形式來描述物理世界中的概念及其他的一些相互關(guān)系。它的基本組成單位是:“個(gè)體-關(guān)系-個(gè)體”的三元組,個(gè)體之間通過關(guān)系鏈進(jìn)行相互連接[5]。從圖的角度而言,知識圖譜屬于一種概念網(wǎng)絡(luò),其中節(jié)點(diǎn)表示物理世界中的實(shí)體,而實(shí)體與實(shí)體之間的語義關(guān)系則由網(wǎng)絡(luò)的邊表示[6-9]。
對于知識圖譜的構(gòu)建,首先從原始數(shù)據(jù)出發(fā),采用一系列自動(dòng)或者半自動(dòng)的技術(shù)手段,抽取其中的知識要素,并將其存入到知識庫的數(shù)據(jù)層和模式層中。然后依次迭代,每一輪的迭代都包含如下階段:知識建模,信息抽取,知識融合,知識加工。知識圖譜常用的構(gòu)建技術(shù)有Semantic Wiki,XTM,自動(dòng)標(biāo)引和本體技術(shù)等,而構(gòu)建模式分為四步,六步,七步和核心三要素模式這四種[10]。知識圖譜構(gòu)建步驟如圖2所示。
圖2 知識圖譜構(gòu)建步驟
數(shù)學(xué)內(nèi)容的信息抽取就是需要從不同年級與不同章節(jié)的數(shù)據(jù)源中抽取出實(shí)體、屬性以及實(shí)體之間的相互關(guān)系,在此基礎(chǔ)上形成基于數(shù)學(xué)內(nèi)容本體化的知識表達(dá)。信息抽取如表1所示。
表1 信息抽取
在完成信息抽取后,通過自然語言處理技術(shù)根據(jù)實(shí)體之間的語義相似度對其進(jìn)行對齊,來消除實(shí)體的矛盾和歧義以及冗余率,降低存儲空間和構(gòu)圖復(fù)雜性。文中采用共性語義相似度計(jì)算方法[11]:
(1)
其中,Sim(A,B)表示A,B之間的相似度;Com(A,B)表示共性;description(A,B)表示個(gè)性。
通過語義計(jì)算后進(jìn)行融合,如表2所示。
表2 知識融合
對于經(jīng)過融合后的新知識,需要經(jīng)過質(zhì)量評估,語義相似度檢測,才能將合格的部分加入到知識庫中,來確保知識庫的質(zhì)量。并且根據(jù)相似度及實(shí)體之間關(guān)聯(lián)程度設(shè)立不同的等級,使得整個(gè)知識庫更加層次化。當(dāng)新增數(shù)據(jù)后,通過推理從而達(dá)到獲得新的知識的功能。質(zhì)量評估函數(shù)如下[12-15]:
(2)
其中,J表示質(zhì)量等級;yi表示得到的知識;Y表示監(jiān)督語料。J的值越小,表示新添加內(nèi)容越符合該知識庫。同時(shí)根據(jù)J值大小來衡定包含等級,J值越大,包含等級數(shù)越高。
知識加工如表3所示。
表3 知識加工
當(dāng)知識加工進(jìn)行完后,在知識圖譜中的每一個(gè)知識點(diǎn)的定義以及層級結(jié)構(gòu)的劃分和知識鏈也會得到相應(yīng)的實(shí)現(xiàn)。基于Neo4j引擎,文中通過Java語言在Windows下對知識圖譜進(jìn)行了可視化,如圖3所示。
圖3 知識圖譜可視化
將知識圖譜可視化后,點(diǎn)擊每一個(gè)實(shí)體節(jié)點(diǎn)后,除了會展示已經(jīng)設(shè)定好的內(nèi)容,還會爬取互聯(lián)網(wǎng)上一些類似的教學(xué)資源,從而達(dá)到將知識系統(tǒng)化的目的。不僅如此,當(dāng)加入新的知識后,根據(jù)自動(dòng)推理能力就可以將其自動(dòng)歸入到圖譜的某一個(gè)分支上,從而完成對新知識的自動(dòng)更新。
提出了一種基于數(shù)學(xué)教學(xué)的知識圖譜構(gòu)建方法,并以數(shù)學(xué)內(nèi)容為例對其進(jìn)行了知識圖譜構(gòu)建與可視化。知識圖譜技術(shù)在一定程度上能將知識更好地展示,使得教師在教學(xué)的過程中更加系統(tǒng)地規(guī)劃教學(xué)路線,學(xué)生在學(xué)習(xí)過程中能夠?qū)㈦x散與碎片化的數(shù)學(xué)知識進(jìn)行結(jié)構(gòu)化與完整化,從而提高了教學(xué)質(zhì)量與學(xué)生學(xué)習(xí)效率,在一定程度上幫助了智慧課堂的建立。與此同時(shí),雖然在構(gòu)建過程中采用自然語言技術(shù)對碎片化的知識進(jìn)行了自動(dòng)抽取與分類,但是由于技術(shù)的不成熟,有些步驟還是需要手動(dòng)添加與排錯(cuò),不能達(dá)到真正意義上全自動(dòng)的狀態(tài)。因此,對于知識圖譜構(gòu)建技術(shù)的研究還有很多工作需要去做。