梁 爽 盧章平
(江蘇大學(xué)科技信息研究所 鎮(zhèn)江 212013)
20世紀(jì)70年代末,美國(guó)情報(bào)學(xué)家弗拉基米爾·斯拉麥卡提出知識(shí)的控制單位將從文獻(xiàn)深化到文獻(xiàn)中的數(shù)據(jù)、公式、事實(shí)、結(jié)論等最小的獨(dú)立的“知識(shí)元”[1]。自此,情報(bào)學(xué)專家著力通過(guò)知識(shí)元鏈接的方法提高知識(shí)獲取的效率和精確度,解決制約知識(shí)資源有效利用問(wèn)題。我國(guó)學(xué)者對(duì)知識(shí)元的研究已有20多年,本文利用CiteSpace知識(shí)圖譜工具對(duì)中國(guó)知網(wǎng)(CNKI)數(shù)據(jù)庫(kù)中有關(guān)“知識(shí)元”的期刊論文進(jìn)行可視化分析,總結(jié)我國(guó)知識(shí)元研究進(jìn)展,以期推動(dòng)今后我國(guó)知識(shí)元更加深入的研究。
本文數(shù)據(jù)來(lái)自于CNKI期刊論文數(shù)據(jù)庫(kù),檢索式為主題=“知識(shí)元”或“知識(shí)單元”,文獻(xiàn)發(fā)表時(shí)間限定為2007年1月1日~2016年12月31日,檢索時(shí)間為2017年6月26日,共獲得檢索結(jié)果1 094條,對(duì)檢出記錄進(jìn)行清洗篩選共有1 088條有效記錄,其中有296條記錄屬于圖書情報(bào)學(xué)科。本研究主要采用能夠展示一個(gè)學(xué)科或知識(shí)領(lǐng)域在一定時(shí)期發(fā)展的趨勢(shì)和動(dòng)態(tài)的代表性知識(shí)圖譜可視化分析工具CiteSpace(Version4.0R5SE)軟件。CiteSpace的主要分析字段有國(guó)家共現(xiàn)、機(jī)構(gòu)共現(xiàn)、作者共現(xiàn)、關(guān)鍵詞共現(xiàn)等。
對(duì)檢索到的文獻(xiàn)進(jìn)行年度發(fā)文量統(tǒng)計(jì),如圖1所示。由圖1可以看出,我國(guó)知識(shí)元研究大致可分為三個(gè)階段。
探索階段(2007~2010年),該階段發(fā)文量數(shù)量除2007年數(shù)量較少以外,其余幾年的數(shù)量波動(dòng)不大,每年發(fā)文量均為將近120篇。這一時(shí)期的知識(shí)元研究的重點(diǎn)聚焦在數(shù)字圖書館以及知識(shí)管理,以圖書情報(bào)領(lǐng)域的相關(guān)研究為主,例如利用知識(shí)元進(jìn)行知識(shí)組織及其系統(tǒng)服務(wù)功能研究等。
減速階段(2011~2014年),這四年間的論文呈現(xiàn)逐年減少的狀態(tài),但降幅并不大,自高峰到低谷減少了21篇,一直持續(xù)到2014年。這一時(shí)期的知識(shí)元研究開始拓寬至圖書情報(bào)領(lǐng)域以外的其他領(lǐng)域,包括利用知識(shí)元探討性效關(guān)聯(lián)規(guī)律、應(yīng)急管理的知識(shí)元模型構(gòu)建等。
回暖階段(2015~2016年),2005年與2014年相比,增加了約20篇論文,2016年有所下降,研究多在知識(shí)元庫(kù)構(gòu)建、知識(shí)元模型構(gòu)建研究等,沒有開拓新的領(lǐng)域和方向,說(shuō)明近幾年的知識(shí)元研究突破性不大。
圖1 我國(guó)知識(shí)元研究文獻(xiàn)發(fā)文量年度分布
(1)學(xué)科分布
以CNKI期刊論文數(shù)據(jù)庫(kù)的學(xué)科分類為分類標(biāo)準(zhǔn),1 088篇論文的學(xué)科分布在40個(gè)學(xué)科領(lǐng)域中,圖2所表示的為知識(shí)元研究論文的主要學(xué)科,即發(fā)文數(shù)量較多的學(xué)科。由圖2可以看出,“圖書情報(bào)與檔案管理”以296篇排在首位,約占整個(gè)研究的27%。計(jì)算機(jī)軟件及計(jì)算機(jī)應(yīng)用以194篇排在第二位,由于知網(wǎng)中一篇文獻(xiàn)可能歸類到某一學(xué)科,也可能同時(shí)歸類到兩個(gè)或兩個(gè)以上的學(xué)科,因此文獻(xiàn)數(shù)量最多的“圖書情報(bào)與檔案管理”這個(gè)學(xué)科分類的論文,也可能會(huì)同時(shí)屬于“計(jì)算機(jī)軟件及計(jì)算機(jī)應(yīng)用”領(lǐng)域。計(jì)算機(jī)硬件技術(shù)、高等教育、外國(guó)語(yǔ)言學(xué)是知識(shí)元研究的次要領(lǐng)域,隨后是教育理論與教育管理、科學(xué)研究管理、自動(dòng)化技術(shù),在職業(yè)教育、企業(yè)經(jīng)濟(jì)等領(lǐng)域也有知識(shí)元相關(guān)的研究成果。由此可見,知識(shí)元研究的學(xué)科范圍非常廣泛,凸顯出較強(qiáng)的學(xué)科交叉性。
傳統(tǒng)的以文本為載體的知識(shí)交流方式已經(jīng)難以適應(yīng)科學(xué)家們大規(guī)模、跨學(xué)科、系統(tǒng)科學(xué)研究的要求,更難以適應(yīng)在科學(xué)研究活動(dòng)的全過(guò)程中及時(shí)提供特定知識(shí)的要求,于是在科研的合作過(guò)程中,新知識(shí)的發(fā)現(xiàn)成為最嚴(yán)峻的挑戰(zhàn)。知識(shí)元是構(gòu)成知識(shí)的最小單位,是知識(shí)系統(tǒng)的最小元素[3],當(dāng)代圖書情報(bào)學(xué)研究的深入和現(xiàn)代信息加工技術(shù)的進(jìn)步推動(dòng)從知識(shí)元角度研究文本挖掘技術(shù)、知識(shí)管理和知識(shí)服務(wù),也是知識(shí)元研究發(fā)展的直接動(dòng)力,使其成為計(jì)算機(jī)與圖書情報(bào)科學(xué)的交叉研究領(lǐng)域。
圖2 知識(shí)元研究論文主要學(xué)科分布圖
(2)知識(shí)元研究與圖書館學(xué)的關(guān)系
知識(shí)服務(wù)是國(guó)內(nèi)圖書館學(xué)研究的一個(gè)重要方向,而知識(shí)元研究也來(lái)源于知識(shí)檢索和知識(shí)服務(wù),因此兩者的共同點(diǎn)都是為了更好的進(jìn)行知識(shí)檢索,更好的提供知識(shí)服務(wù)。知識(shí)元的研究離不開與圖書館密切相關(guān)的知識(shí)構(gòu)建、知識(shí)鏈接、知識(shí)標(biāo)引,甚至一些圖書館知識(shí)服務(wù)的開展就被視為知識(shí)元項(xiàng)目。圖書館和知識(shí)元都關(guān)注文獻(xiàn)、信息、知識(shí)的記載和應(yīng)用。知識(shí)元研究致力于在人文社科領(lǐng)域融入XML、語(yǔ)義挖掘等計(jì)算機(jī)技術(shù),使得傳統(tǒng)的知識(shí)元分離、知識(shí)元隱含關(guān)系的揭示變得更加高效簡(jiǎn)便,使得研究成果更加多元化。知識(shí)元研究成果的應(yīng)用,可以完善圖書館文本知識(shí)單元檢索系統(tǒng),參與知識(shí)元模型的構(gòu)建及實(shí)驗(yàn),從而更好的提供服務(wù),促進(jìn)圖書館和讀者的交流,促進(jìn)兩者的共同發(fā)展。圖書館領(lǐng)域的數(shù)字圖書館建設(shè)與知識(shí)構(gòu)建推動(dòng)了知識(shí)元研究的發(fā)展,知識(shí)元在其發(fā)展過(guò)程中不斷借鑒圖書館學(xué)的理論與方法。
知識(shí)元研究機(jī)構(gòu)的分布如圖3和圖4,圖3是知識(shí)元研究論文高產(chǎn)機(jī)構(gòu)時(shí)序圖,圖4顯示了發(fā)文量在10篇及以上的機(jī)構(gòu)。
經(jīng)過(guò)統(tǒng)計(jì),國(guó)內(nèi)知識(shí)元研究的1 088篇論文共有401個(gè)發(fā)文機(jī)構(gòu),大部分機(jī)構(gòu)都是研究所以及高等院校的相關(guān)學(xué)院,這些機(jī)構(gòu)開展了116次合作,只有2個(gè)機(jī)構(gòu)的論文數(shù)量達(dá)到了15篇以上;有75個(gè)機(jī)構(gòu)論文數(shù)量在5~15篇之間;小部分的機(jī)構(gòu)論文數(shù)量在2~4篇,絕大多是機(jī)構(gòu)都是1篇。從圖3、圖4中可以較為明顯的看出目前我國(guó)進(jìn)行知識(shí)元研究的主要機(jī)構(gòu)為高等院校,占文獻(xiàn)數(shù)量在10篇以上的研究機(jī)構(gòu)的88.65%,其中大連理工大學(xué)的發(fā)文總數(shù)量遠(yuǎn)高于其他高校,說(shuō)明其是國(guó)內(nèi)知識(shí)元研究領(lǐng)域的核心機(jī)構(gòu)。
圖3 知識(shí)元研究論文高產(chǎn)機(jī)構(gòu)時(shí)序圖
從圖3可以看出,中國(guó)科學(xué)技術(shù)信息研究所在2007對(duì)知識(shí)元進(jìn)行了較為深入的研究,隨后中國(guó)人民大學(xué)、武漢大學(xué)都對(duì)知識(shí)元開展了研究,并產(chǎn)生了一定數(shù)量的學(xué)術(shù)成果。2010~2011年和2015~2016年兩個(gè)時(shí)間研究知識(shí)元的個(gè)體機(jī)構(gòu)文獻(xiàn)產(chǎn)出量不大,但是文獻(xiàn)總量呈現(xiàn)上升趨勢(shì),說(shuō)明該時(shí)間段的知識(shí)元研究處于一個(gè)探索的階段。在2012年,大連理工大學(xué)開辟了一個(gè)較為新的知識(shí)元研究領(lǐng)域——非常規(guī)突發(fā)事件應(yīng)急處理,這也成為了大連理工大學(xué)知識(shí)元研究的重點(diǎn)和優(yōu)勢(shì),也是2012年該校發(fā)文數(shù)量增加的原因。
圖4 發(fā)文量在10篇及以上的機(jī)構(gòu)
利用CiteSpace繪制的知識(shí)元研究論文作者共現(xiàn)圖如圖5所示,1 088篇文獻(xiàn)共有440位作者,圖5中顯示的是論文數(shù)量在5篇以上的作者,由圖中可以較為清晰的看到三個(gè)較為明顯的核心作者群,一個(gè)是由王寧、王延章、仲雁秋三人構(gòu)成的作者群,第二個(gè)是由文庭孝、劉曉英構(gòu)成的作者群,第三個(gè)是由化柏林構(gòu)成的作者群。
圖5 CiteSpace作者共現(xiàn)圖
對(duì)知識(shí)元研究領(lǐng)域發(fā)文的第一作者進(jìn)行分析研究發(fā)現(xiàn),發(fā)文最多的學(xué)者為湘潭大學(xué)的文庭孝,有7篇論文為第一作者論文。該作者發(fā)文年度分布比較平均,在2008~2011年四年間都有文章產(chǎn)出,研究?jī)?nèi)容為基于知識(shí)元的知識(shí)管理、知識(shí)網(wǎng)絡(luò)理論及測(cè)度研究,研究從理論到測(cè)度,從淺層次到深層次,一步步深入知識(shí)元的研究。最高的一篇文章下載量達(dá)到1461次,是所有檢出論文下載量排名第一的文章。其與羅賢春等合著的文章《知識(shí)單元研究述評(píng)》被引量達(dá)到了40次,在所有檢出文獻(xiàn)中排名第三。
排名第二的是哈爾濱商業(yè)大學(xué)的姜永常,其發(fā)文數(shù)量年度分布也比較平均,在2007~2013年7年間除2008年外每年都有發(fā)文,主要研究基于知識(shí)元的知識(shí)網(wǎng)絡(luò)和知識(shí)構(gòu)建。
第三、四、五位高產(chǎn)作者王寧、陳雪龍、高繼平都來(lái)自大連理工大學(xué),這也是圖4大連理工大學(xué)在發(fā)文機(jī)構(gòu)中占首要位置的原因,大連理工大學(xué)的研究人員創(chuàng)新性的將知識(shí)元引入非常規(guī)突發(fā)事件的研究中,發(fā)文多圍繞這個(gè)主題展開。另外有兩名作者來(lái)自中國(guó)科學(xué)技術(shù)信息研究所。其他的作者來(lái)自不同的機(jī)構(gòu),發(fā)文多局限在某個(gè)時(shí)間段內(nèi),研究的持續(xù)性不足,深入程度不夠。
表1 知識(shí)元領(lǐng)域高產(chǎn)作者
關(guān)鍵詞是表述論文中心內(nèi)容的實(shí)質(zhì)詞匯。通過(guò)對(duì)關(guān)鍵詞詞頻與中心性的統(tǒng)計(jì),能夠掌握某研究領(lǐng)域的主題分布,發(fā)現(xiàn)隱藏在真實(shí)關(guān)系背后的關(guān)系網(wǎng)絡(luò),探究研究主題的成熟度、知識(shí)結(jié)構(gòu)等狀況[2]。通過(guò)對(duì)知識(shí)元研究論文的關(guān)鍵詞數(shù)量與詞頻進(jìn)行統(tǒng)計(jì),共獲取關(guān)鍵詞293個(gè),其中詞頻高于10的關(guān)鍵詞如圖6,圖6中去除了檢索詞“知識(shí)元”和“知識(shí)單元”這兩個(gè)關(guān)鍵詞。知識(shí)元研究論文中涉及的關(guān)鍵詞數(shù)量較多,但是詞頻高于10的關(guān)鍵詞僅有22個(gè),說(shuō)明該領(lǐng)域涉及的研究主題非常廣泛,并不集中,也是知識(shí)元跨學(xué)科特性的顯著體現(xiàn)。
圖6 知識(shí)元研究高頻關(guān)鍵詞(詞頻>10)
在知識(shí)元研究高頻關(guān)鍵詞中,圖書館、計(jì)算機(jī)基礎(chǔ)、教學(xué)改革揭示了近10年研究知識(shí)元的主要學(xué)科,而知識(shí)鏈接、知識(shí)網(wǎng)絡(luò)為知識(shí)元研究提供理論與方法。知識(shí)庫(kù)、關(guān)聯(lián)數(shù)據(jù)反映出知識(shí)元的研究基礎(chǔ)與分析對(duì)象。為了進(jìn)一步探究圖書館學(xué)領(lǐng)域知識(shí)元研究的主題,對(duì)圖書館學(xué)中知識(shí)元研究論文的關(guān)鍵詞進(jìn)行詞頻統(tǒng)計(jì),其中詞頻大于5的關(guān)鍵詞如圖7所示。
圖書館學(xué)領(lǐng)域出現(xiàn)了具有鮮明專業(yè)性的關(guān)鍵詞“高校圖書館”、“數(shù)字圖書館”,縮小并深化了知識(shí)元研究的學(xué)科零余額。知識(shí)集合、情報(bào)分析等關(guān)鍵詞說(shuō)明圖書館學(xué)領(lǐng)域知識(shí)元研究使用的技術(shù)與方法更加注重資源的組織與集合。
將圖書館學(xué)領(lǐng)域高頻關(guān)鍵詞與總體的關(guān)鍵詞進(jìn)行比較分析,有10個(gè)關(guān)鍵詞是重復(fù)的,包括知識(shí)組織、知識(shí)鏈接、知識(shí)構(gòu)建的知識(shí)元方法,也包括知識(shí)管理、知識(shí)服務(wù)的知識(shí)元應(yīng)用方式,還有圖書館、數(shù)字圖書館的知識(shí)元應(yīng)用領(lǐng)域。
圖7 圖書館學(xué)領(lǐng)域知識(shí)元研究高頻關(guān)鍵詞(詞頻>5)
圖8為利用CiteSpace軟件制作的關(guān)鍵詞共現(xiàn)時(shí)區(qū)圖譜,從共現(xiàn)頻次看,除去檢索詞“知識(shí)元”和“知識(shí)單元”,知識(shí)組織以53次排在首位,有20個(gè)關(guān)鍵詞的共現(xiàn)頻次在10~50之間,主要包括兩方面的內(nèi)容,一是與知識(shí)組織、知識(shí)認(rèn)知相關(guān),如元認(rèn)知(84次)、知識(shí)管理(36次)等,二是與教學(xué)管理有關(guān),如教學(xué)改革(36次)、教學(xué)方法(25次)。共現(xiàn)頻次在9次以下的關(guān)鍵詞多達(dá)345個(gè)。從凸顯程度上來(lái)看,凸顯度最高的是知識(shí)管理(2.49),可見現(xiàn)階段知識(shí)元研究的重點(diǎn)和熱點(diǎn)聚焦在知識(shí)管理方面。
圖8 知識(shí)元研究論文高頻關(guān)鍵詞共現(xiàn)時(shí)區(qū)圖
通過(guò)高頻關(guān)鍵詞共現(xiàn)時(shí)區(qū)圖(圖8、圖9),可以了解知識(shí)元研究的主題變遷與演化過(guò)程。總體來(lái)看,隨著計(jì)算機(jī)與網(wǎng)絡(luò)技術(shù)的發(fā)展與應(yīng)用,知識(shí)元研究不斷拓展其研究廣度與深度,從討論數(shù)字圖書館、知識(shí)組織、知識(shí)管理、知識(shí)庫(kù)構(gòu)建、指導(dǎo)圖書館知識(shí)服務(wù)的輔助功能,到不斷嘗試使用網(wǎng)絡(luò)與知識(shí)計(jì)量手段融入到知識(shí)管理系統(tǒng),出現(xiàn)了圍繞知識(shí)關(guān)聯(lián)、知識(shí)發(fā)現(xiàn)研究的知識(shí)鏈接、知識(shí)網(wǎng)絡(luò)、領(lǐng)域本體等關(guān)鍵詞,以及借助本體的手段,進(jìn)行知識(shí)地圖的構(gòu)建。2014年起將知識(shí)元應(yīng)用于應(yīng)急管理以及非常規(guī)突發(fā)事件的處理已成為主流應(yīng)用。到2015 ~2016年,又出現(xiàn)了信息單元、解題策略、情景表示等新的關(guān)鍵詞,知識(shí)元在不同領(lǐng)域的發(fā)展不斷拓展。在圖書館領(lǐng)域,知識(shí)元研究是圖書館學(xué)和計(jì)算機(jī)科學(xué)交叉融合的產(chǎn)物,從最基本、最基層的教學(xué)模式、教學(xué)方法開始研究,到利用計(jì)算機(jī)技術(shù)、運(yùn)用知識(shí)構(gòu)建理論進(jìn)行知識(shí)集合、知識(shí)鏈接、知識(shí)關(guān)聯(lián),將關(guān)聯(lián)數(shù)據(jù)引入到知識(shí)元研究,構(gòu)建知識(shí)元庫(kù),進(jìn)行語(yǔ)義分析,并將成果運(yùn)用到知識(shí)標(biāo)引上。突發(fā)事件應(yīng)急管理同樣也是知識(shí)元在圖書館學(xué)領(lǐng)域的一個(gè)重要研究方向。在2016年,出現(xiàn)了將知識(shí)元同信息素養(yǎng)相結(jié)合的探索性研究,這也是知識(shí)元研究與時(shí)俱進(jìn)的一個(gè)體現(xiàn)。
圖9 圖書館學(xué)領(lǐng)域知識(shí)元研究論文高頻關(guān)鍵詞共現(xiàn)時(shí)區(qū)圖
結(jié)合圖1和圖8的時(shí)間分布曲線,可以繪制出知識(shí)元研究的10年演化路徑(如圖10所示),選擇每一年最為突出的一個(gè)關(guān)鍵詞作為重點(diǎn)詞。
圖10 知識(shí)元10年研究演化路徑
關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)可以展現(xiàn)一段時(shí)間內(nèi)研究文獻(xiàn)集中反映出的熱點(diǎn)詞匯,能夠體現(xiàn)某一研究領(lǐng)域的熱點(diǎn)問(wèn)題[4]。利用CiteSpace繪制知識(shí)元關(guān)鍵詞共現(xiàn)圖譜,并選擇聚類功能,產(chǎn)生了廣義領(lǐng)域的71個(gè)關(guān)鍵詞共現(xiàn)聚類(見圖11),和圖書情報(bào)領(lǐng)域的60個(gè)關(guān)鍵詞聚類(見圖12)。采用關(guān)鍵詞作為聚類標(biāo)識(shí),以具體化的名詞短語(yǔ)標(biāo)識(shí)各聚類,以便客觀歸納知識(shí)元的研究熱點(diǎn),結(jié)合每個(gè)聚類內(nèi)的具體文獻(xiàn)內(nèi)容分析,確定研究熱點(diǎn)問(wèn)題[5]。由于篇幅所限,本文僅選取前四大聚類的研究熱點(diǎn)進(jìn)行具體分析,各聚類情況如表2所示。
圖11 知識(shí)元研究論文關(guān)鍵詞共現(xiàn)聚類圖譜
圖12 圖書館學(xué)領(lǐng)域知識(shí)元研究論文關(guān)鍵詞共現(xiàn)聚類圖譜
表2 知識(shí)元研究四大熱點(diǎn)領(lǐng)域
到目前為止學(xué)術(shù)界對(duì)知識(shí)元的概念還沒有公認(rèn)的統(tǒng)一界定。不同概念之間的差別主要是在對(duì)知識(shí)元的粒度的認(rèn)知上,多數(shù)專家認(rèn)為是構(gòu)成知識(shí)的最小單位,是知識(shí)系統(tǒng)的最小元素[3],是在知識(shí)管理中可以對(duì)知識(shí)進(jìn)行獨(dú)立、自由、有效地識(shí)別、處理與組合的基本知識(shí)單位[6];少數(shù)學(xué)者則認(rèn)為知識(shí)元是基本知識(shí)單位,能夠再劃分。對(duì)于知識(shí)元特征的研究,國(guó)內(nèi)學(xué)者基本達(dá)成了一致,都強(qiáng)調(diào)了知識(shí)元的獨(dú)立性、可存儲(chǔ)性以及其可鏈接性?,F(xiàn)有對(duì)知識(shí)元的分類雖然不盡相同,但每種觀點(diǎn)都有重疊的部分,基本都是都從概念、事實(shí)、方法策略等幾個(gè)維度來(lái)對(duì)知識(shí)元進(jìn)行分類,溫有奎[3]把知識(shí)元類型分成描述型知識(shí)元和過(guò)程型知識(shí)元兩大類。
基于知識(shí)元的知識(shí)管理研究包括知識(shí)元表示、知識(shí)元標(biāo)引以及知識(shí)元抽取三個(gè)大方面,這三個(gè)方面不是獨(dú)立的,而是相輔相成、環(huán)環(huán)緊扣的,只有在較為完全的表示知識(shí)元的基礎(chǔ)上,才可以對(duì)知識(shí)元進(jìn)行標(biāo)引,只有在對(duì)知識(shí)元標(biāo)引分析后,才可以對(duì)其進(jìn)行抽取。目前還沒有一種被普遍接受的知識(shí)元表示方法,現(xiàn)有的組織與表示方法幾乎來(lái)源于知識(shí)的經(jīng)典表示方法[3]。
知識(shí)元研究在根本上是由知識(shí)組織和知識(shí)管理驅(qū)動(dòng)的,而知識(shí)元標(biāo)引是實(shí)現(xiàn)知識(shí)組織與檢索的核心與具體化。有的學(xué)者選取了知識(shí)元描述模型中具有代表性的幾個(gè)元素作為具體的研究對(duì)象,在標(biāo)引分析的基礎(chǔ)上,發(fā)現(xiàn)知識(shí)元描述的句法特征,建立了知識(shí)元的提取規(guī)則,提出了一種基于規(guī)則的知識(shí)元標(biāo)引方法,并以實(shí)驗(yàn)證明其有效性[7]。從數(shù)字資源中抽取知識(shí)元是知識(shí)元應(yīng)用的基礎(chǔ)。通過(guò)對(duì)現(xiàn)有相關(guān)文獻(xiàn)的分析發(fā)現(xiàn),國(guó)內(nèi)學(xué)者所提出的方法大致可分為基于文本結(jié)構(gòu)的抽取方法與基于規(guī)則的抽取方法兩種類型,其中基于創(chuàng)新點(diǎn)的知識(shí)元挖掘被認(rèn)為是文本知識(shí)挖掘的一種有效方法[8]。針對(duì)給定的文本,其他學(xué)者也提出了利用一種基于XML平臺(tái)的知識(shí)元表示與抽取模型,解析出相應(yīng)的基本知識(shí)元的抽取方法[9]。冷伏海等綜合運(yùn)用語(yǔ)義標(biāo)注、規(guī)則抽取以及正則表達(dá)技術(shù),提出了一種混合語(yǔ)義信息抽取方法,既不破壞科技文獻(xiàn)原有語(yǔ)義內(nèi)容,又能以較為簡(jiǎn)單的展示創(chuàng)新內(nèi)容的知識(shí)元抽取方法[10]。
現(xiàn)階段的知識(shí)元技術(shù)研究基本都是大粒度資源的信息組織方法,已開展知識(shí)標(biāo)引的方法是在傳統(tǒng)信息資源組織模型指導(dǎo)下的元數(shù)據(jù)標(biāo)引,缺乏深層次的語(yǔ)義內(nèi)容信息和主題關(guān)系標(biāo)識(shí)。大多學(xué)者的研究側(cè)重在主題詞、關(guān)鍵詞或摘要的自動(dòng)提取研究,缺乏知識(shí)元標(biāo)引具體過(guò)程和方法的研究成果。在知識(shí)元抽取上,如何抽取以及抽取的知識(shí)元如何存儲(chǔ)和如何組織并沒有進(jìn)行具體說(shuō)明。
在知識(shí)的視角下,知識(shí)元與特定領(lǐng)域知識(shí)無(wú)關(guān),使得利用知識(shí)元描述不同類型突發(fā)事件系統(tǒng)要素的共性屬性特征,進(jìn)而構(gòu)建突發(fā)事件系統(tǒng)共性結(jié)構(gòu)模型成為可能。突發(fā)事件應(yīng)急處理過(guò)程很復(fù)雜,在處理中需要決策者充分利用多學(xué)科、跨領(lǐng)域的綜合知識(shí)來(lái)進(jìn)行即時(shí)決策。雖然本體的方法在一定程度上可以解決多學(xué)科、跨領(lǐng)域的知識(shí)綜合問(wèn)題,但描述概念的工作量巨大,容易產(chǎn)生知識(shí)推理不完備的問(wèn)題。將知識(shí)元模型應(yīng)用于應(yīng)急管理領(lǐng)域中,使得多學(xué)科、跨領(lǐng)域之間的知識(shí)融合成為可能,而且通過(guò)知識(shí)元屬性間關(guān)系的隱性描述方法,可以解決知識(shí)推理不完備的問(wèn)題,能夠?yàn)橥话l(fā)事件應(yīng)急管理提供綜合知識(shí)支持。仲秋雁等對(duì)非常規(guī)突發(fā)事件情景中的要素及其關(guān)系進(jìn)行抽取,提出了基于知識(shí)元的領(lǐng)域情景概念模型,并以此為基礎(chǔ),結(jié)合承災(zāi)體知識(shí)元結(jié)構(gòu),建立了非常規(guī)突發(fā)事件情景生成中承災(zāi)體實(shí)體化約束模型[11]。陳雪龍[12]等從非常規(guī)突發(fā)事件應(yīng)急管理客觀系統(tǒng)本原角度出發(fā)構(gòu)建知識(shí)元模型,給出了知識(shí)元屬性間關(guān)系的隱性描述方法,為非常規(guī)突發(fā)事件的應(yīng)急管理提供綜合的知識(shí)支持。知識(shí)元應(yīng)用到突發(fā)事件的研究中,能夠弱化事件的概念,強(qiáng)化知識(shí)元實(shí)體對(duì)象屬性狀態(tài)集中元素變化對(duì)其它知識(shí)元實(shí)體對(duì)象的影響,為形式化描述各類不同突發(fā)事件提供了依據(jù)[13]。
知識(shí)服務(wù)是在知識(shí)構(gòu)建的基礎(chǔ)上開展的,知識(shí)構(gòu)建是基于信息構(gòu)建的更高層次的資源構(gòu)建形式,其核心內(nèi)容是由知識(shí)組織、知識(shí)標(biāo)識(shí)、知識(shí)檢索和知識(shí)導(dǎo)航四個(gè)系統(tǒng)組成的,它能使知識(shí)更易于理解和吸收,為用戶提供比信息空間更高層次的知識(shí)空間[14]。在對(duì)某個(gè)既定主題開展研究進(jìn)行知識(shí)服務(wù)時(shí),需要對(duì)各種技術(shù)進(jìn)行集成構(gòu)建相關(guān)主題庫(kù),通常采用構(gòu)建主題本體源數(shù)據(jù)庫(kù)、構(gòu)建主題知識(shí)元庫(kù)和知識(shí)倉(cāng)庫(kù)最后規(guī)劃統(tǒng)一界面的流程,最后進(jìn)行知識(shí)服務(wù)。知識(shí)元庫(kù)是通過(guò)對(duì)文獻(xiàn)信息資源的知識(shí)元素加工,提取出具有獨(dú)立性的知識(shí)元而構(gòu)成的數(shù)據(jù)庫(kù)。也有學(xué)者按照特定的規(guī)則和需求將知識(shí)元聯(lián)系起來(lái),排列組合形成有序的結(jié)構(gòu)化知識(shí)集合,并且進(jìn)一步構(gòu)成知識(shí)網(wǎng)絡(luò)[15],進(jìn)行知識(shí)構(gòu)建以實(shí)現(xiàn)知識(shí)服務(wù)。
本文從整體學(xué)科領(lǐng)域和圖書館學(xué)領(lǐng)域兩個(gè)角度對(duì)知識(shí)元研究現(xiàn)狀進(jìn)行了分析,在對(duì)知識(shí)元進(jìn)行計(jì)量分析與可視化分析的基礎(chǔ)上,總結(jié)了現(xiàn)階段知識(shí)元研究熱點(diǎn)。知識(shí)元并不是一個(gè)新產(chǎn)物,而是計(jì)算機(jī)學(xué)科和圖書館學(xué)學(xué)科交融的產(chǎn)物,知識(shí)元研究涉及的主題較為廣泛,呈現(xiàn)學(xué)科交融的特點(diǎn),圖書館學(xué)領(lǐng)域的研究與知識(shí)元總體研究的演進(jìn)過(guò)程相對(duì)應(yīng),研究熱點(diǎn)也相對(duì)應(yīng)變化,呈現(xiàn)出從理論到實(shí)踐,從概念到技術(shù)的過(guò)程,同時(shí)知識(shí)元研究也做到了與時(shí)俱進(jìn),與現(xiàn)階段的研究熱點(diǎn)相結(jié)合進(jìn)行更加深入的融合研究?,F(xiàn)階段知識(shí)元研究已經(jīng)取得了一些成就,但是仍有一些不足的地方。
(1)從研究?jī)?nèi)容看,現(xiàn)有論文基本是從理論開展的基礎(chǔ)性和普及性介紹,很少有貼近生活的知識(shí)元示例,讀者在理解上有不同程度的難度。在知識(shí)元定義上,專家學(xué)者并未達(dá)成一致共識(shí)。在知識(shí)元表示上,大多只考慮了知識(shí)元本體,忽略了與各種領(lǐng)域知識(shí)相關(guān)的領(lǐng)域本體?,F(xiàn)階段圖書館學(xué)領(lǐng)域知識(shí)元研究基本都是在技術(shù)驅(qū)動(dòng)下進(jìn)行,并未真正與圖書館的知識(shí)服務(wù)相結(jié)合,以實(shí)現(xiàn)服務(wù)不同類型、不同層次的讀者的需求目的。
(2)從研究深度看,現(xiàn)有對(duì)知識(shí)元的研究與圖書館的本質(zhì)聯(lián)系不夠緊密,重點(diǎn)在技術(shù)而不是在服務(wù),研究停留在理論層面上,沒有與圖書館實(shí)踐相聯(lián)系,圖書館自身的紙質(zhì)館藏、電子資源并沒有得到重視,而圖書館的讀者也沒有參與其中。
(3)從研究領(lǐng)域看,現(xiàn)階段知識(shí)元研究多在圖書情報(bào)、教育學(xué)、科學(xué)計(jì)量學(xué)、計(jì)算機(jī)學(xué)、管理學(xué)領(lǐng)域展開,其他學(xué)科的相關(guān)研究較少,與其他領(lǐng)域的融合研究很少,研究基本都是圍繞文本信息的挖掘與處理進(jìn)行。在圖書情報(bào)領(lǐng)域缺少知識(shí)元同圖書館學(xué)目前熱點(diǎn)問(wèn)題相結(jié)合的研究。
當(dāng)前我們能預(yù)見的知識(shí)元未來(lái)的發(fā)展方向,是知識(shí)元的研究粒度將越來(lái)越小,內(nèi)涵將不斷深化,結(jié)合時(shí)代發(fā)展和各學(xué)科熱點(diǎn)問(wèn)題的研究將變成主流。圖書情報(bào)領(lǐng)域應(yīng)從以下幾個(gè)方面加強(qiáng)對(duì)知識(shí)元的研究。
第一,從融合視角探討圖書館與知識(shí)元研究。信息技術(shù)驅(qū)動(dòng)的知識(shí)元研究?jī)H僅是研究的初級(jí)階段,圖書館與知識(shí)元研究應(yīng)當(dāng)對(duì)領(lǐng)域知識(shí)的細(xì)粒度進(jìn)行組織并且基于此提供知識(shí)檢索與知識(shí)服務(wù),不應(yīng)該局限于簡(jiǎn)單的服務(wù)與支持層面,嘗試融合數(shù)學(xué)、物理學(xué)中的理論來(lái)指導(dǎo)知識(shí)元研究,構(gòu)建知識(shí)元模型的理論框架。
第二,營(yíng)造良好的知識(shí)元研究環(huán)境。圖書館的服務(wù)本質(zhì)、強(qiáng)大的紙本資源和購(gòu)買的跨學(xué)科、多領(lǐng)域的數(shù)據(jù)庫(kù)系統(tǒng),以及讀者的先天優(yōu)勢(shì),能夠在知識(shí)服務(wù)、知識(shí)標(biāo)引、知識(shí)鏈接、知識(shí)構(gòu)建等方面提供強(qiáng)有力的支持。同時(shí),通過(guò)知識(shí)元研究成果的應(yīng)用,圖書館可以完善文本知識(shí)單元檢索系統(tǒng),參與知識(shí)元模型的構(gòu)建及實(shí)驗(yàn),從而更好的提供服務(wù),促進(jìn)圖書館和讀者的交流,促進(jìn)兩者的共同發(fā)展。
第三,拓寬知識(shí)元研究領(lǐng)域。在進(jìn)行知識(shí)元研究時(shí),可以融合信號(hào)處理的反變關(guān)系來(lái)研究知識(shí)元變換問(wèn)題;也可以大膽引入范疇論,把知識(shí)元看成是特定的結(jié)構(gòu)和態(tài)射??梢試L試進(jìn)行與閱讀推廣服務(wù)、圖書館資源深度整合與揭示、基于文本挖掘的科技文獻(xiàn)知識(shí)發(fā)現(xiàn)相結(jié)合,更好的進(jìn)行研究。