迪麗努爾·克依木
新疆師范大學(xué),新疆烏魯木齊,830054
在傳統(tǒng)的教學(xué)模式中,由于學(xué)生在知識(shí)基礎(chǔ)、認(rèn)知能力、興趣等方面的差異,造成其對(duì)知識(shí)結(jié)構(gòu)的組織方式也不盡相同。一般學(xué)生在學(xué)習(xí)過(guò)程中,都能發(fā)現(xiàn)知識(shí)的關(guān)系,并把新舊知識(shí)連接在一起。但部分大學(xué)生知識(shí)結(jié)構(gòu)不完整、知識(shí)聯(lián)系不清,不能形成系統(tǒng)的理解。長(zhǎng)期下去,學(xué)生的學(xué)習(xí)和思考能力就會(huì)出現(xiàn)停滯,從而影響了學(xué)生的學(xué)習(xí)和思考能力的提升,更別說(shuō)實(shí)施個(gè)性化教學(xué)了。從以上兩方面來(lái)看,無(wú)論是對(duì)傳統(tǒng)的教學(xué),還是對(duì)網(wǎng)上的教學(xué),都需要對(duì)課程知識(shí)點(diǎn)的相互關(guān)系進(jìn)行分析。知識(shí)圖譜可視化技術(shù)展示了各知識(shí)點(diǎn)的分布狀態(tài)及其相互關(guān)系。這樣就可以幫助學(xué)生對(duì)相關(guān)知識(shí)點(diǎn)進(jìn)行系統(tǒng)的理解,幫助他們建立起知識(shí)的聯(lián)系。另外,在互聯(lián)網(wǎng)教學(xué)中,將會(huì)為個(gè)性化的推薦學(xué)習(xí)提供極大的幫助,因此,建立一個(gè)教育領(lǐng)域的知識(shí)圖譜是非常有必要的。
維基百科清晰地指出了知識(shí)圖譜的內(nèi)涵,也就是Google用于強(qiáng)化其搜索引擎的知識(shí)庫(kù)[1]。谷歌公司使用它是因?yàn)樗梢宰尮雀杷阉饕娴南嚓P(guān)功能得到拓展和提升,讓用戶(hù)擁有更好的體驗(yàn)感。谷歌的知識(shí)圖譜最早是在2012推出的,它以freebase網(wǎng)站的服務(wù)為基礎(chǔ),捕獲與應(yīng)用維基百科以及類(lèi)似的更多數(shù)據(jù)發(fā)源地的數(shù)據(jù),最后創(chuàng)造出了知識(shí)圖譜。兩年過(guò)后,谷歌公司對(duì)知識(shí)圖譜下了定義,之后將知識(shí)圖譜的功能融合到了搜索引擎中,提高了谷歌搜索引擎的搜索能力,有助于用戶(hù)更精準(zhǔn)、更迅速地獲取自己需求的知識(shí)和資訊。其他搜索引擎公司也邁進(jìn)了知識(shí)圖譜的探索領(lǐng)域[2],就像facebook研發(fā)出了facebook社會(huì)圖表知識(shí)圖譜,而我們國(guó)家的Baidu公司也研發(fā)出自己的知心知識(shí)圖譜,還有Sogou公司的知立方知識(shí)圖譜等。經(jīng)過(guò)不斷的探索和開(kāi)發(fā),它慢慢地被擴(kuò)展到了其他行業(yè),就像在AI問(wèn)答、個(gè)性化傳播等智能信息的運(yùn)用,知識(shí)圖譜形成的學(xué)術(shù)價(jià)值以及商業(yè)價(jià)值巨大[3]。
近年來(lái),學(xué)術(shù)界和工業(yè)界都建立了自己的知識(shí)圖譜,根據(jù)應(yīng)用可以將其分為兩個(gè)主要類(lèi)別[4]:一種是通用知識(shí)圖譜,也稱(chēng)為開(kāi)放領(lǐng)域知識(shí)圖譜。通俗地講就是大眾版,其沒(méi)有特別深的行業(yè)知識(shí)及專(zhuān)業(yè)內(nèi)容,通常解決科普知識(shí)和常識(shí)性問(wèn)題,適合互聯(lián)網(wǎng)的大規(guī)模搜索、問(wèn)答以及推薦。還有一種就是行業(yè)知識(shí)圖譜,也被稱(chēng)作特定領(lǐng)域知識(shí)圖譜以及垂直領(lǐng)域知識(shí)圖譜。簡(jiǎn)單來(lái)說(shuō),其指的是專(zhuān)業(yè)版,經(jīng)過(guò)深層次調(diào)研某個(gè)領(lǐng)域或子領(lǐng)域并編制相應(yīng)的版本,應(yīng)對(duì)專(zhuān)業(yè)問(wèn)題,是目前知識(shí)圖譜更具價(jià)值的研究方向[5]。
就目前的研究現(xiàn)狀來(lái)看,國(guó)內(nèi)外在構(gòu)建通用知識(shí)圖譜方面獲取了一定的成效,比如,從國(guó)外的通用知識(shí)圖譜角度出發(fā),由Cyc公司1984年開(kāi)始創(chuàng)建推出的常識(shí)知識(shí)庫(kù),其規(guī)模最大,經(jīng)典的常識(shí)知識(shí)有“Every tree is a plant”“Plants die eventually”等;另外還有:Princeton 大學(xué)知識(shí)科學(xué)實(shí)驗(yàn)室自20世紀(jì)80年代研發(fā)的應(yīng)用在語(yǔ)句消除分歧方面的WordNet詞典知識(shí)庫(kù)(主要用于詞義消歧)、2010年被谷歌公司收購(gòu)的MateWeb公司開(kāi)發(fā)的Freebase知識(shí)圖庫(kù)(完全免費(fèi)并允許商業(yè)化的開(kāi)放許可協(xié)議)、被維基媒體基金會(huì)倡導(dǎo)能夠自己制作編寫(xiě)的包含很多國(guó)家語(yǔ)種的百科知識(shí)庫(kù)Wikidata知識(shí)圖譜(目標(biāo)是構(gòu)件全世界最大的免費(fèi)知識(shí)庫(kù),但是仍然面臨知識(shí)缺失嚴(yán)重的問(wèn)題)以及如今國(guó)際上包含領(lǐng)域最多的各種語(yǔ)種百科同義詞典BabelNet知識(shí)圖譜等[6]。而在中國(guó),就知識(shí)圖譜的開(kāi)發(fā)而言,也取得了一定的成效:Baidu公司研發(fā)出了大規(guī)模知識(shí)圖譜;Sogou公司制造出了知立方圖譜;清華大學(xué)得到了XLore知識(shí)圖譜;復(fù)旦大學(xué)研發(fā)了CN-DBpedia知識(shí)圖譜(中文通用百科知識(shí)圖譜),信息的搜集主要源于中文百科類(lèi)網(wǎng)站的文本資訊,經(jīng)過(guò)過(guò)濾、融合和推斷后,形成高質(zhì)量的結(jié)構(gòu)化數(shù)據(jù),供人和機(jī)器使用;上海交通大學(xué)推出的利用百度百科、互動(dòng)百科和維基百科等三個(gè)知識(shí)庫(kù)做成類(lèi)似于DBpedia的中文百科Zhishi.me,是國(guó)內(nèi)構(gòu)建的最早的知識(shí)庫(kù)[7]。
相對(duì)于國(guó)內(nèi)外在通用知識(shí)圖譜上取得的成效,我國(guó)在知識(shí)圖譜領(lǐng)域缺少專(zhuān)業(yè)數(shù)據(jù),獲取的成效存在一定的缺陷[8]?,F(xiàn)如今研發(fā)的知識(shí)圖譜中,相對(duì)成熟的領(lǐng)域十分稀少,僅有歐洲聯(lián)盟的重要合作研究項(xiàng)目藥物領(lǐng)域的知識(shí)圖譜Open PHACTS、醫(yī)療領(lǐng)域的知識(shí)圖譜體重指數(shù)的Watson機(jī)器人。根據(jù)《2018知識(shí)圖譜發(fā)展報(bào)告》,我國(guó)在電商、企業(yè)商業(yè)、圖情、創(chuàng)投四個(gè)領(lǐng)域均在開(kāi)展知識(shí)建模[9]。
總的來(lái)說(shuō),盡管目前知識(shí)圖譜研究方面可謂是碩果累累,而且許多科研發(fā)現(xiàn)都轉(zhuǎn)化成了商業(yè)利潤(rùn),例如語(yǔ)義檢索、智能問(wèn)答、語(yǔ)境分析、還有智能知識(shí)體系等。然而,研究知識(shí)圖譜及其使用價(jià)值依然很有意義。①中文句子的識(shí)別、中文關(guān)系抽取較英文語(yǔ)法復(fù)雜很多,在中文知識(shí)圖譜的研究和應(yīng)用方面仍有很大的發(fā)展空間。并且目前互聯(lián)網(wǎng)高速發(fā)展,人工智能不斷向深研究,也從側(cè)面驗(yàn)證了中文知識(shí)圖譜的商業(yè)應(yīng)用價(jià)值以及學(xué)術(shù)研究?jī)r(jià)值相對(duì)較高[10]。②對(duì)比通用知識(shí)圖譜,成熟的領(lǐng)域知識(shí)圖譜需要更為專(zhuān)業(yè)的、深入行業(yè)的人員來(lái)建立,而且領(lǐng)域知識(shí)圖譜覆蓋的行業(yè)相對(duì)寬泛,其調(diào)研價(jià)值相對(duì)較高。簡(jiǎn)單來(lái)說(shuō),從中文角度出發(fā),選取某一領(lǐng)域,比如在這篇文章中的課程構(gòu)建知識(shí)圖譜,建立領(lǐng)域知識(shí)圖譜具有很大的研究?jī)r(jià)值和發(fā)展前景[11]。
知識(shí)圖譜具有強(qiáng)大的語(yǔ)義處理能力,能夠在互聯(lián)網(wǎng)的網(wǎng)頁(yè)上建立概念之間的連接關(guān)系,以最小的代價(jià)可以將互聯(lián)網(wǎng)上有價(jià)值的信息組織起來(lái);知識(shí)圖譜還具有強(qiáng)大的開(kāi)放互聯(lián)能力,能夠不斷地加入互聯(lián)網(wǎng)中新增的信息。憑借這些功能,知識(shí)圖譜在檢索和教育等領(lǐng)域?qū)?huì)有出色的表現(xiàn)。教育知識(shí)圖譜能夠?qū)W(xué)科知識(shí)和教學(xué)資源借助標(biāo)準(zhǔn)化的、形式化的手段密切關(guān)聯(lián)在一起,進(jìn)而完成在線教育資源的合理組織。
在大學(xué)教育時(shí)期,國(guó)內(nèi)著名的課程在線學(xué)習(xí)平臺(tái),如學(xué)堂在線、中國(guó)大學(xué)MOOC(幕課)、精品課程等,絕大多數(shù)是對(duì)優(yōu)質(zhì)課程視頻學(xué)習(xí)資源的描述,展示了不同課程的聯(lián)系、和知識(shí)相關(guān)的課程體系,而課程知識(shí)圖譜的稀缺導(dǎo)致學(xué)生在課程視頻學(xué)習(xí)結(jié)束以后,并未構(gòu)建起完備的知識(shí)體系,學(xué)習(xí)成效并未達(dá)到預(yù)期目標(biāo)?,F(xiàn)如今,盡管大學(xué)課程和有關(guān)教材的版本豐富多彩,但課程知識(shí)圖譜的構(gòu)建離不開(kāi)各行業(yè)專(zhuān)業(yè)的交流與制造,其操作十分嚴(yán)苛、復(fù)雜,并且知識(shí)更新十分迅速,因此現(xiàn)如今大學(xué)課程缺少知識(shí)圖譜的構(gòu)建。
當(dāng)今,網(wǎng)絡(luò)信息資源數(shù)量在不斷遞增,傳統(tǒng)的知識(shí)組織結(jié)構(gòu)十分分散,但用戶(hù)在知識(shí)服務(wù)方面的需要也在不斷遞增,因此兩者之間存在一定的矛盾。在知識(shí)圖譜技術(shù)出現(xiàn)以后,其與用戶(hù)的認(rèn)知需求相互適應(yīng),對(duì)比傳統(tǒng)人工組織某學(xué)科領(lǐng)域發(fā)展的宏觀狀況,知識(shí)圖譜技術(shù)的效率相對(duì)較高,并且十分合理,所以知識(shí)圖譜的出現(xiàn)是社會(huì)發(fā)展的必然。
從教育領(lǐng)域角度出發(fā),知識(shí)圖譜不僅能夠幫助學(xué)生從互聯(lián)網(wǎng)上獲取教學(xué)資源,作為自主學(xué)習(xí)的知識(shí)來(lái)源,還可以幫助學(xué)生快速分清知識(shí)點(diǎn)的主次關(guān)系以及它們之間的內(nèi)在邏輯關(guān)系。因此,學(xué)生有效利用知識(shí)圖譜能夠提高學(xué)習(xí)效率,加深知識(shí)點(diǎn)的理解和記憶能力,從而讓學(xué)校打破傳統(tǒng)的教育模式,實(shí)現(xiàn)個(gè)性化教育。
隨著互聯(lián)網(wǎng)技術(shù)和人工智能技術(shù)的飛速發(fā)展,智能教學(xué)在教師的教學(xué)和學(xué)生的自主學(xué)習(xí)方面也有了很大的突破。課程的知識(shí)圖譜是智能教學(xué)方式的一種體現(xiàn),構(gòu)建知識(shí)圖譜和應(yīng)用涉及自然語(yǔ)言處理相關(guān)的基礎(chǔ)技術(shù),因此構(gòu)建教育領(lǐng)域的知識(shí)圖譜不單單是教育行業(yè)鉆研的焦點(diǎn),也是人工智能層面的研究熱點(diǎn),具有實(shí)際應(yīng)用價(jià)值和科研價(jià)值。
知識(shí)圖譜是結(jié)構(gòu)化的語(yǔ)義網(wǎng)絡(luò),能夠描述生活中的概念和概念之間的關(guān)系。知識(shí)圖譜的構(gòu)建步驟涉及四點(diǎn),分別是知識(shí)獲取、知識(shí)表述、知識(shí)存儲(chǔ)以及知識(shí)可視化。知識(shí)獲取是從一些公開(kāi)的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)中利用知識(shí)抽取技術(shù)獲得實(shí)體、屬性和關(guān)系等知識(shí)要素,再次結(jié)合知識(shí)交融以及知識(shí)推斷等技術(shù)構(gòu)建語(yǔ)義知識(shí)庫(kù),確保其結(jié)構(gòu)化。知識(shí)抽取主要有兩部分,一部分是實(shí)體抽取,也就是從選取的數(shù)據(jù)源中選取實(shí)體組織類(lèi)別劃分,同時(shí)把文章中的實(shí)體和知識(shí)庫(kù)中的實(shí)體構(gòu)建密切聯(lián)系;另一部分是關(guān)系抽取,也就是數(shù)據(jù)源中的非結(jié)構(gòu)化信息,開(kāi)展的是不同實(shí)體關(guān)系的抽取,最終獲取各個(gè)實(shí)體的語(yǔ)義關(guān)系。從數(shù)據(jù)結(jié)構(gòu)課程的知識(shí)圖譜角度出發(fā),知識(shí)圖譜需求的理論主要源于專(zhuān)業(yè)書(shū)籍,相關(guān)技術(shù)網(wǎng)站以及部分專(zhuān)業(yè)知識(shí)庫(kù)。
教育信息化導(dǎo)致共享信息資源的迅猛遞增,但是學(xué)習(xí)資源的形式豐富多彩,導(dǎo)致學(xué)習(xí)過(guò)程中出現(xiàn)了知識(shí)不連貫以及知識(shí)碎片化等情形。在各種資源中,學(xué)生需要耗用龐大的精力去查詢(xún)無(wú)效內(nèi)容,導(dǎo)致學(xué)生不能迅速、準(zhǔn)確、高效地搜集自己需求的理論,造成學(xué)生陷入了知識(shí)誤區(qū)。
數(shù)據(jù)結(jié)構(gòu)在計(jì)算機(jī)學(xué)科中屬于專(zhuān)業(yè)學(xué)科,帶有綜合性的特點(diǎn),也是編寫(xiě)計(jì)算機(jī)程序過(guò)程中的關(guān)鍵理論基石和技術(shù)手段。課程的原理十分復(fù)雜,涉及的知識(shí)點(diǎn)較多,學(xué)生很難梳理不同知識(shí)點(diǎn)的聯(lián)系。在學(xué)習(xí)知識(shí)過(guò)程中,需要了解知識(shí)的排列順序。只有了解了學(xué)習(xí)過(guò)程中的所有知識(shí)點(diǎn),才可以有效地把控某一領(lǐng)域的有關(guān)理論。課程知識(shí)圖譜實(shí)際上是精準(zhǔn)地提取課程中的教材內(nèi)容,借助圖片等形式促使學(xué)科知識(shí)可視化,對(duì)學(xué)生構(gòu)建清楚的課程知識(shí)體系有積極意義,同時(shí)還有助于提升知識(shí)學(xué)習(xí)的趣味性。
將數(shù)據(jù)結(jié)構(gòu)教材、大綱、網(wǎng)絡(luò)資源等作為參考依據(jù),通過(guò)使用Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)搜集并整合和課程有關(guān)的知識(shí)數(shù)據(jù),運(yùn)用知識(shí)圖譜構(gòu)建技術(shù)把獲取到的數(shù)據(jù)轉(zhuǎn)變?yōu)椤皩?shí)體-關(guān)系-實(shí)體”三元組,利用圖數(shù)據(jù)庫(kù)加以保存,設(shè)計(jì)有關(guān)算法和流程來(lái)處理數(shù)據(jù)語(yǔ)料庫(kù),獲取并調(diào)整和數(shù)據(jù)結(jié)構(gòu)學(xué)科領(lǐng)域有關(guān)的內(nèi)涵和關(guān)聯(lián)。
知識(shí)圖譜對(duì)學(xué)生學(xué)習(xí)效率的提升有積極意義,運(yùn)用網(wǎng)頁(yè)信息創(chuàng)建學(xué)科知識(shí)圖譜,公開(kāi)學(xué)科知識(shí)體系,探究學(xué)科領(lǐng)域知識(shí)圖譜的切入點(diǎn)十分關(guān)鍵。而構(gòu)建數(shù)據(jù)結(jié)構(gòu)課程知識(shí)圖譜的創(chuàng)新點(diǎn)是運(yùn)用人工智能技術(shù)來(lái)展示知識(shí)點(diǎn)的內(nèi)容以及知識(shí)結(jié)構(gòu),指引學(xué)習(xí)者更好地認(rèn)識(shí)并探究課程內(nèi)容,促使學(xué)生在線學(xué)習(xí)的品質(zhì)以及效率不斷提升;借助層次遞進(jìn)形式展示知識(shí)圖譜,調(diào)整可視化頁(yè)面,促使學(xué)習(xí)者可以清楚地、方便快捷地了解知識(shí)圖譜。
隨著“互聯(lián)網(wǎng)+”教育的到來(lái),各種學(xué)習(xí)平臺(tái)、教學(xué)課程資源日益豐富,為學(xué)生的學(xué)習(xí)帶來(lái)了極大的方便,使他們能夠從課堂上獲得更多知識(shí)。在廣度上,知識(shí)的學(xué)習(xí)得到了持續(xù)擴(kuò)展。然而,海量的學(xué)習(xí)資源也使學(xué)習(xí)者不堪重負(fù),而大量的知識(shí)碎片又使學(xué)習(xí)者很難掌握所學(xué)的內(nèi)容。如果沒(méi)有正確的組織方式,就不能系統(tǒng)地了解所學(xué)的知識(shí),而且還會(huì)浪費(fèi)很多寶貴的時(shí)間。這會(huì)對(duì)學(xué)生的學(xué)習(xí)效果產(chǎn)生一定的影響。在數(shù)據(jù)結(jié)構(gòu)基礎(chǔ)上構(gòu)建知識(shí)圖譜則有助于應(yīng)對(duì)上述難題,也就是說(shuō):知識(shí)圖譜能將多個(gè)知識(shí)點(diǎn)結(jié)合起來(lái),并能反映出知識(shí)點(diǎn)的結(jié)構(gòu)和分布。