梁 爽 盧章平
(江蘇大學(xué)科技信息研究所 鎮(zhèn)江 212013)
20世紀(jì)70年代末,美國情報學(xué)家弗拉基米爾·斯拉麥卡提出知識的控制單位將從文獻(xiàn)深化到文獻(xiàn)中的數(shù)據(jù)、公式、事實、結(jié)論等最小的獨(dú)立的“知識元”[1]。自此,情報學(xué)專家著力通過知識元鏈接的方法提高知識獲取的效率和精確度,解決制約知識資源有效利用問題。我國學(xué)者對知識元的研究已有20多年,本文利用CiteSpace知識圖譜工具對中國知網(wǎng)(CNKI)數(shù)據(jù)庫中有關(guān)“知識元”的期刊論文進(jìn)行可視化分析,總結(jié)我國知識元研究進(jìn)展,以期推動今后我國知識元更加深入的研究。
本文數(shù)據(jù)來自于CNKI期刊論文數(shù)據(jù)庫,檢索式為主題=“知識元”或“知識單元”,文獻(xiàn)發(fā)表時間限定為2007年1月1日~2016年12月31日,檢索時間為2017年6月26日,共獲得檢索結(jié)果1 094條,對檢出記錄進(jìn)行清洗篩選共有1 088條有效記錄,其中有296條記錄屬于圖書情報學(xué)科。本研究主要采用能夠展示一個學(xué)科或知識領(lǐng)域在一定時期發(fā)展的趨勢和動態(tài)的代表性知識圖譜可視化分析工具CiteSpace(Version4.0R5SE)軟件。CiteSpace的主要分析字段有國家共現(xiàn)、機(jī)構(gòu)共現(xiàn)、作者共現(xiàn)、關(guān)鍵詞共現(xiàn)等。
對檢索到的文獻(xiàn)進(jìn)行年度發(fā)文量統(tǒng)計,如圖1所示。由圖1可以看出,我國知識元研究大致可分為三個階段。
探索階段(2007~2010年),該階段發(fā)文量數(shù)量除2007年數(shù)量較少以外,其余幾年的數(shù)量波動不大,每年發(fā)文量均為將近120篇。這一時期的知識元研究的重點聚焦在數(shù)字圖書館以及知識管理,以圖書情報領(lǐng)域的相關(guān)研究為主,例如利用知識元進(jìn)行知識組織及其系統(tǒng)服務(wù)功能研究等。
減速階段(2011~2014年),這四年間的論文呈現(xiàn)逐年減少的狀態(tài),但降幅并不大,自高峰到低谷減少了21篇,一直持續(xù)到2014年。這一時期的知識元研究開始拓寬至圖書情報領(lǐng)域以外的其他領(lǐng)域,包括利用知識元探討性效關(guān)聯(lián)規(guī)律、應(yīng)急管理的知識元模型構(gòu)建等。
回暖階段(2015~2016年),2005年與2014年相比,增加了約20篇論文,2016年有所下降,研究多在知識元庫構(gòu)建、知識元模型構(gòu)建研究等,沒有開拓新的領(lǐng)域和方向,說明近幾年的知識元研究突破性不大。
圖1 我國知識元研究文獻(xiàn)發(fā)文量年度分布
(1)學(xué)科分布
以CNKI期刊論文數(shù)據(jù)庫的學(xué)科分類為分類標(biāo)準(zhǔn),1 088篇論文的學(xué)科分布在40個學(xué)科領(lǐng)域中,圖2所表示的為知識元研究論文的主要學(xué)科,即發(fā)文數(shù)量較多的學(xué)科。由圖2可以看出,“圖書情報與檔案管理”以296篇排在首位,約占整個研究的27%。計算機(jī)軟件及計算機(jī)應(yīng)用以194篇排在第二位,由于知網(wǎng)中一篇文獻(xiàn)可能歸類到某一學(xué)科,也可能同時歸類到兩個或兩個以上的學(xué)科,因此文獻(xiàn)數(shù)量最多的“圖書情報與檔案管理”這個學(xué)科分類的論文,也可能會同時屬于“計算機(jī)軟件及計算機(jī)應(yīng)用”領(lǐng)域。計算機(jī)硬件技術(shù)、高等教育、外國語言學(xué)是知識元研究的次要領(lǐng)域,隨后是教育理論與教育管理、科學(xué)研究管理、自動化技術(shù),在職業(yè)教育、企業(yè)經(jīng)濟(jì)等領(lǐng)域也有知識元相關(guān)的研究成果。由此可見,知識元研究的學(xué)科范圍非常廣泛,凸顯出較強(qiáng)的學(xué)科交叉性。
傳統(tǒng)的以文本為載體的知識交流方式已經(jīng)難以適應(yīng)科學(xué)家們大規(guī)模、跨學(xué)科、系統(tǒng)科學(xué)研究的要求,更難以適應(yīng)在科學(xué)研究活動的全過程中及時提供特定知識的要求,于是在科研的合作過程中,新知識的發(fā)現(xiàn)成為最嚴(yán)峻的挑戰(zhàn)。知識元是構(gòu)成知識的最小單位,是知識系統(tǒng)的最小元素[3],當(dāng)代圖書情報學(xué)研究的深入和現(xiàn)代信息加工技術(shù)的進(jìn)步推動從知識元角度研究文本挖掘技術(shù)、知識管理和知識服務(wù),也是知識元研究發(fā)展的直接動力,使其成為計算機(jī)與圖書情報科學(xué)的交叉研究領(lǐng)域。
圖2 知識元研究論文主要學(xué)科分布圖
(2)知識元研究與圖書館學(xué)的關(guān)系
知識服務(wù)是國內(nèi)圖書館學(xué)研究的一個重要方向,而知識元研究也來源于知識檢索和知識服務(wù),因此兩者的共同點都是為了更好的進(jìn)行知識檢索,更好的提供知識服務(wù)。知識元的研究離不開與圖書館密切相關(guān)的知識構(gòu)建、知識鏈接、知識標(biāo)引,甚至一些圖書館知識服務(wù)的開展就被視為知識元項目。圖書館和知識元都關(guān)注文獻(xiàn)、信息、知識的記載和應(yīng)用。知識元研究致力于在人文社科領(lǐng)域融入XML、語義挖掘等計算機(jī)技術(shù),使得傳統(tǒng)的知識元分離、知識元隱含關(guān)系的揭示變得更加高效簡便,使得研究成果更加多元化。知識元研究成果的應(yīng)用,可以完善圖書館文本知識單元檢索系統(tǒng),參與知識元模型的構(gòu)建及實驗,從而更好的提供服務(wù),促進(jìn)圖書館和讀者的交流,促進(jìn)兩者的共同發(fā)展。圖書館領(lǐng)域的數(shù)字圖書館建設(shè)與知識構(gòu)建推動了知識元研究的發(fā)展,知識元在其發(fā)展過程中不斷借鑒圖書館學(xué)的理論與方法。
知識元研究機(jī)構(gòu)的分布如圖3和圖4,圖3是知識元研究論文高產(chǎn)機(jī)構(gòu)時序圖,圖4顯示了發(fā)文量在10篇及以上的機(jī)構(gòu)。
經(jīng)過統(tǒng)計,國內(nèi)知識元研究的1 088篇論文共有401個發(fā)文機(jī)構(gòu),大部分機(jī)構(gòu)都是研究所以及高等院校的相關(guān)學(xué)院,這些機(jī)構(gòu)開展了116次合作,只有2個機(jī)構(gòu)的論文數(shù)量達(dá)到了15篇以上;有75個機(jī)構(gòu)論文數(shù)量在5~15篇之間;小部分的機(jī)構(gòu)論文數(shù)量在2~4篇,絕大多是機(jī)構(gòu)都是1篇。從圖3、圖4中可以較為明顯的看出目前我國進(jìn)行知識元研究的主要機(jī)構(gòu)為高等院校,占文獻(xiàn)數(shù)量在10篇以上的研究機(jī)構(gòu)的88.65%,其中大連理工大學(xué)的發(fā)文總數(shù)量遠(yuǎn)高于其他高校,說明其是國內(nèi)知識元研究領(lǐng)域的核心機(jī)構(gòu)。
圖3 知識元研究論文高產(chǎn)機(jī)構(gòu)時序圖
從圖3可以看出,中國科學(xué)技術(shù)信息研究所在2007對知識元進(jìn)行了較為深入的研究,隨后中國人民大學(xué)、武漢大學(xué)都對知識元開展了研究,并產(chǎn)生了一定數(shù)量的學(xué)術(shù)成果。2010~2011年和2015~2016年兩個時間研究知識元的個體機(jī)構(gòu)文獻(xiàn)產(chǎn)出量不大,但是文獻(xiàn)總量呈現(xiàn)上升趨勢,說明該時間段的知識元研究處于一個探索的階段。在2012年,大連理工大學(xué)開辟了一個較為新的知識元研究領(lǐng)域——非常規(guī)突發(fā)事件應(yīng)急處理,這也成為了大連理工大學(xué)知識元研究的重點和優(yōu)勢,也是2012年該校發(fā)文數(shù)量增加的原因。
圖4 發(fā)文量在10篇及以上的機(jī)構(gòu)
利用CiteSpace繪制的知識元研究論文作者共現(xiàn)圖如圖5所示,1 088篇文獻(xiàn)共有440位作者,圖5中顯示的是論文數(shù)量在5篇以上的作者,由圖中可以較為清晰的看到三個較為明顯的核心作者群,一個是由王寧、王延章、仲雁秋三人構(gòu)成的作者群,第二個是由文庭孝、劉曉英構(gòu)成的作者群,第三個是由化柏林構(gòu)成的作者群。
圖5 CiteSpace作者共現(xiàn)圖
對知識元研究領(lǐng)域發(fā)文的第一作者進(jìn)行分析研究發(fā)現(xiàn),發(fā)文最多的學(xué)者為湘潭大學(xué)的文庭孝,有7篇論文為第一作者論文。該作者發(fā)文年度分布比較平均,在2008~2011年四年間都有文章產(chǎn)出,研究內(nèi)容為基于知識元的知識管理、知識網(wǎng)絡(luò)理論及測度研究,研究從理論到測度,從淺層次到深層次,一步步深入知識元的研究。最高的一篇文章下載量達(dá)到1461次,是所有檢出論文下載量排名第一的文章。其與羅賢春等合著的文章《知識單元研究述評》被引量達(dá)到了40次,在所有檢出文獻(xiàn)中排名第三。
排名第二的是哈爾濱商業(yè)大學(xué)的姜永常,其發(fā)文數(shù)量年度分布也比較平均,在2007~2013年7年間除2008年外每年都有發(fā)文,主要研究基于知識元的知識網(wǎng)絡(luò)和知識構(gòu)建。
第三、四、五位高產(chǎn)作者王寧、陳雪龍、高繼平都來自大連理工大學(xué),這也是圖4大連理工大學(xué)在發(fā)文機(jī)構(gòu)中占首要位置的原因,大連理工大學(xué)的研究人員創(chuàng)新性的將知識元引入非常規(guī)突發(fā)事件的研究中,發(fā)文多圍繞這個主題展開。另外有兩名作者來自中國科學(xué)技術(shù)信息研究所。其他的作者來自不同的機(jī)構(gòu),發(fā)文多局限在某個時間段內(nèi),研究的持續(xù)性不足,深入程度不夠。
表1 知識元領(lǐng)域高產(chǎn)作者
關(guān)鍵詞是表述論文中心內(nèi)容的實質(zhì)詞匯。通過對關(guān)鍵詞詞頻與中心性的統(tǒng)計,能夠掌握某研究領(lǐng)域的主題分布,發(fā)現(xiàn)隱藏在真實關(guān)系背后的關(guān)系網(wǎng)絡(luò),探究研究主題的成熟度、知識結(jié)構(gòu)等狀況[2]。通過對知識元研究論文的關(guān)鍵詞數(shù)量與詞頻進(jìn)行統(tǒng)計,共獲取關(guān)鍵詞293個,其中詞頻高于10的關(guān)鍵詞如圖6,圖6中去除了檢索詞“知識元”和“知識單元”這兩個關(guān)鍵詞。知識元研究論文中涉及的關(guān)鍵詞數(shù)量較多,但是詞頻高于10的關(guān)鍵詞僅有22個,說明該領(lǐng)域涉及的研究主題非常廣泛,并不集中,也是知識元跨學(xué)科特性的顯著體現(xiàn)。
圖6 知識元研究高頻關(guān)鍵詞(詞頻>10)
在知識元研究高頻關(guān)鍵詞中,圖書館、計算機(jī)基礎(chǔ)、教學(xué)改革揭示了近10年研究知識元的主要學(xué)科,而知識鏈接、知識網(wǎng)絡(luò)為知識元研究提供理論與方法。知識庫、關(guān)聯(lián)數(shù)據(jù)反映出知識元的研究基礎(chǔ)與分析對象。為了進(jìn)一步探究圖書館學(xué)領(lǐng)域知識元研究的主題,對圖書館學(xué)中知識元研究論文的關(guān)鍵詞進(jìn)行詞頻統(tǒng)計,其中詞頻大于5的關(guān)鍵詞如圖7所示。
圖書館學(xué)領(lǐng)域出現(xiàn)了具有鮮明專業(yè)性的關(guān)鍵詞“高校圖書館”、“數(shù)字圖書館”,縮小并深化了知識元研究的學(xué)科零余額。知識集合、情報分析等關(guān)鍵詞說明圖書館學(xué)領(lǐng)域知識元研究使用的技術(shù)與方法更加注重資源的組織與集合。
將圖書館學(xué)領(lǐng)域高頻關(guān)鍵詞與總體的關(guān)鍵詞進(jìn)行比較分析,有10個關(guān)鍵詞是重復(fù)的,包括知識組織、知識鏈接、知識構(gòu)建的知識元方法,也包括知識管理、知識服務(wù)的知識元應(yīng)用方式,還有圖書館、數(shù)字圖書館的知識元應(yīng)用領(lǐng)域。
圖7 圖書館學(xué)領(lǐng)域知識元研究高頻關(guān)鍵詞(詞頻>5)
圖8為利用CiteSpace軟件制作的關(guān)鍵詞共現(xiàn)時區(qū)圖譜,從共現(xiàn)頻次看,除去檢索詞“知識元”和“知識單元”,知識組織以53次排在首位,有20個關(guān)鍵詞的共現(xiàn)頻次在10~50之間,主要包括兩方面的內(nèi)容,一是與知識組織、知識認(rèn)知相關(guān),如元認(rèn)知(84次)、知識管理(36次)等,二是與教學(xué)管理有關(guān),如教學(xué)改革(36次)、教學(xué)方法(25次)。共現(xiàn)頻次在9次以下的關(guān)鍵詞多達(dá)345個。從凸顯程度上來看,凸顯度最高的是知識管理(2.49),可見現(xiàn)階段知識元研究的重點和熱點聚焦在知識管理方面。
圖8 知識元研究論文高頻關(guān)鍵詞共現(xiàn)時區(qū)圖
通過高頻關(guān)鍵詞共現(xiàn)時區(qū)圖(圖8、圖9),可以了解知識元研究的主題變遷與演化過程。總體來看,隨著計算機(jī)與網(wǎng)絡(luò)技術(shù)的發(fā)展與應(yīng)用,知識元研究不斷拓展其研究廣度與深度,從討論數(shù)字圖書館、知識組織、知識管理、知識庫構(gòu)建、指導(dǎo)圖書館知識服務(wù)的輔助功能,到不斷嘗試使用網(wǎng)絡(luò)與知識計量手段融入到知識管理系統(tǒng),出現(xiàn)了圍繞知識關(guān)聯(lián)、知識發(fā)現(xiàn)研究的知識鏈接、知識網(wǎng)絡(luò)、領(lǐng)域本體等關(guān)鍵詞,以及借助本體的手段,進(jìn)行知識地圖的構(gòu)建。2014年起將知識元應(yīng)用于應(yīng)急管理以及非常規(guī)突發(fā)事件的處理已成為主流應(yīng)用。到2015 ~2016年,又出現(xiàn)了信息單元、解題策略、情景表示等新的關(guān)鍵詞,知識元在不同領(lǐng)域的發(fā)展不斷拓展。在圖書館領(lǐng)域,知識元研究是圖書館學(xué)和計算機(jī)科學(xué)交叉融合的產(chǎn)物,從最基本、最基層的教學(xué)模式、教學(xué)方法開始研究,到利用計算機(jī)技術(shù)、運(yùn)用知識構(gòu)建理論進(jìn)行知識集合、知識鏈接、知識關(guān)聯(lián),將關(guān)聯(lián)數(shù)據(jù)引入到知識元研究,構(gòu)建知識元庫,進(jìn)行語義分析,并將成果運(yùn)用到知識標(biāo)引上。突發(fā)事件應(yīng)急管理同樣也是知識元在圖書館學(xué)領(lǐng)域的一個重要研究方向。在2016年,出現(xiàn)了將知識元同信息素養(yǎng)相結(jié)合的探索性研究,這也是知識元研究與時俱進(jìn)的一個體現(xiàn)。
圖9 圖書館學(xué)領(lǐng)域知識元研究論文高頻關(guān)鍵詞共現(xiàn)時區(qū)圖
結(jié)合圖1和圖8的時間分布曲線,可以繪制出知識元研究的10年演化路徑(如圖10所示),選擇每一年最為突出的一個關(guān)鍵詞作為重點詞。
圖10 知識元10年研究演化路徑
關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)可以展現(xiàn)一段時間內(nèi)研究文獻(xiàn)集中反映出的熱點詞匯,能夠體現(xiàn)某一研究領(lǐng)域的熱點問題[4]。利用CiteSpace繪制知識元關(guān)鍵詞共現(xiàn)圖譜,并選擇聚類功能,產(chǎn)生了廣義領(lǐng)域的71個關(guān)鍵詞共現(xiàn)聚類(見圖11),和圖書情報領(lǐng)域的60個關(guān)鍵詞聚類(見圖12)。采用關(guān)鍵詞作為聚類標(biāo)識,以具體化的名詞短語標(biāo)識各聚類,以便客觀歸納知識元的研究熱點,結(jié)合每個聚類內(nèi)的具體文獻(xiàn)內(nèi)容分析,確定研究熱點問題[5]。由于篇幅所限,本文僅選取前四大聚類的研究熱點進(jìn)行具體分析,各聚類情況如表2所示。
圖11 知識元研究論文關(guān)鍵詞共現(xiàn)聚類圖譜
圖12 圖書館學(xué)領(lǐng)域知識元研究論文關(guān)鍵詞共現(xiàn)聚類圖譜
表2 知識元研究四大熱點領(lǐng)域
到目前為止學(xué)術(shù)界對知識元的概念還沒有公認(rèn)的統(tǒng)一界定。不同概念之間的差別主要是在對知識元的粒度的認(rèn)知上,多數(shù)專家認(rèn)為是構(gòu)成知識的最小單位,是知識系統(tǒng)的最小元素[3],是在知識管理中可以對知識進(jìn)行獨(dú)立、自由、有效地識別、處理與組合的基本知識單位[6];少數(shù)學(xué)者則認(rèn)為知識元是基本知識單位,能夠再劃分。對于知識元特征的研究,國內(nèi)學(xué)者基本達(dá)成了一致,都強(qiáng)調(diào)了知識元的獨(dú)立性、可存儲性以及其可鏈接性?,F(xiàn)有對知識元的分類雖然不盡相同,但每種觀點都有重疊的部分,基本都是都從概念、事實、方法策略等幾個維度來對知識元進(jìn)行分類,溫有奎[3]把知識元類型分成描述型知識元和過程型知識元兩大類。
基于知識元的知識管理研究包括知識元表示、知識元標(biāo)引以及知識元抽取三個大方面,這三個方面不是獨(dú)立的,而是相輔相成、環(huán)環(huán)緊扣的,只有在較為完全的表示知識元的基礎(chǔ)上,才可以對知識元進(jìn)行標(biāo)引,只有在對知識元標(biāo)引分析后,才可以對其進(jìn)行抽取。目前還沒有一種被普遍接受的知識元表示方法,現(xiàn)有的組織與表示方法幾乎來源于知識的經(jīng)典表示方法[3]。
知識元研究在根本上是由知識組織和知識管理驅(qū)動的,而知識元標(biāo)引是實現(xiàn)知識組織與檢索的核心與具體化。有的學(xué)者選取了知識元描述模型中具有代表性的幾個元素作為具體的研究對象,在標(biāo)引分析的基礎(chǔ)上,發(fā)現(xiàn)知識元描述的句法特征,建立了知識元的提取規(guī)則,提出了一種基于規(guī)則的知識元標(biāo)引方法,并以實驗證明其有效性[7]。從數(shù)字資源中抽取知識元是知識元應(yīng)用的基礎(chǔ)。通過對現(xiàn)有相關(guān)文獻(xiàn)的分析發(fā)現(xiàn),國內(nèi)學(xué)者所提出的方法大致可分為基于文本結(jié)構(gòu)的抽取方法與基于規(guī)則的抽取方法兩種類型,其中基于創(chuàng)新點的知識元挖掘被認(rèn)為是文本知識挖掘的一種有效方法[8]。針對給定的文本,其他學(xué)者也提出了利用一種基于XML平臺的知識元表示與抽取模型,解析出相應(yīng)的基本知識元的抽取方法[9]。冷伏海等綜合運(yùn)用語義標(biāo)注、規(guī)則抽取以及正則表達(dá)技術(shù),提出了一種混合語義信息抽取方法,既不破壞科技文獻(xiàn)原有語義內(nèi)容,又能以較為簡單的展示創(chuàng)新內(nèi)容的知識元抽取方法[10]。
現(xiàn)階段的知識元技術(shù)研究基本都是大粒度資源的信息組織方法,已開展知識標(biāo)引的方法是在傳統(tǒng)信息資源組織模型指導(dǎo)下的元數(shù)據(jù)標(biāo)引,缺乏深層次的語義內(nèi)容信息和主題關(guān)系標(biāo)識。大多學(xué)者的研究側(cè)重在主題詞、關(guān)鍵詞或摘要的自動提取研究,缺乏知識元標(biāo)引具體過程和方法的研究成果。在知識元抽取上,如何抽取以及抽取的知識元如何存儲和如何組織并沒有進(jìn)行具體說明。
在知識的視角下,知識元與特定領(lǐng)域知識無關(guān),使得利用知識元描述不同類型突發(fā)事件系統(tǒng)要素的共性屬性特征,進(jìn)而構(gòu)建突發(fā)事件系統(tǒng)共性結(jié)構(gòu)模型成為可能。突發(fā)事件應(yīng)急處理過程很復(fù)雜,在處理中需要決策者充分利用多學(xué)科、跨領(lǐng)域的綜合知識來進(jìn)行即時決策。雖然本體的方法在一定程度上可以解決多學(xué)科、跨領(lǐng)域的知識綜合問題,但描述概念的工作量巨大,容易產(chǎn)生知識推理不完備的問題。將知識元模型應(yīng)用于應(yīng)急管理領(lǐng)域中,使得多學(xué)科、跨領(lǐng)域之間的知識融合成為可能,而且通過知識元屬性間關(guān)系的隱性描述方法,可以解決知識推理不完備的問題,能夠為突發(fā)事件應(yīng)急管理提供綜合知識支持。仲秋雁等對非常規(guī)突發(fā)事件情景中的要素及其關(guān)系進(jìn)行抽取,提出了基于知識元的領(lǐng)域情景概念模型,并以此為基礎(chǔ),結(jié)合承災(zāi)體知識元結(jié)構(gòu),建立了非常規(guī)突發(fā)事件情景生成中承災(zāi)體實體化約束模型[11]。陳雪龍[12]等從非常規(guī)突發(fā)事件應(yīng)急管理客觀系統(tǒng)本原角度出發(fā)構(gòu)建知識元模型,給出了知識元屬性間關(guān)系的隱性描述方法,為非常規(guī)突發(fā)事件的應(yīng)急管理提供綜合的知識支持。知識元應(yīng)用到突發(fā)事件的研究中,能夠弱化事件的概念,強(qiáng)化知識元實體對象屬性狀態(tài)集中元素變化對其它知識元實體對象的影響,為形式化描述各類不同突發(fā)事件提供了依據(jù)[13]。
知識服務(wù)是在知識構(gòu)建的基礎(chǔ)上開展的,知識構(gòu)建是基于信息構(gòu)建的更高層次的資源構(gòu)建形式,其核心內(nèi)容是由知識組織、知識標(biāo)識、知識檢索和知識導(dǎo)航四個系統(tǒng)組成的,它能使知識更易于理解和吸收,為用戶提供比信息空間更高層次的知識空間[14]。在對某個既定主題開展研究進(jìn)行知識服務(wù)時,需要對各種技術(shù)進(jìn)行集成構(gòu)建相關(guān)主題庫,通常采用構(gòu)建主題本體源數(shù)據(jù)庫、構(gòu)建主題知識元庫和知識倉庫最后規(guī)劃統(tǒng)一界面的流程,最后進(jìn)行知識服務(wù)。知識元庫是通過對文獻(xiàn)信息資源的知識元素加工,提取出具有獨(dú)立性的知識元而構(gòu)成的數(shù)據(jù)庫。也有學(xué)者按照特定的規(guī)則和需求將知識元聯(lián)系起來,排列組合形成有序的結(jié)構(gòu)化知識集合,并且進(jìn)一步構(gòu)成知識網(wǎng)絡(luò)[15],進(jìn)行知識構(gòu)建以實現(xiàn)知識服務(wù)。
本文從整體學(xué)科領(lǐng)域和圖書館學(xué)領(lǐng)域兩個角度對知識元研究現(xiàn)狀進(jìn)行了分析,在對知識元進(jìn)行計量分析與可視化分析的基礎(chǔ)上,總結(jié)了現(xiàn)階段知識元研究熱點。知識元并不是一個新產(chǎn)物,而是計算機(jī)學(xué)科和圖書館學(xué)學(xué)科交融的產(chǎn)物,知識元研究涉及的主題較為廣泛,呈現(xiàn)學(xué)科交融的特點,圖書館學(xué)領(lǐng)域的研究與知識元總體研究的演進(jìn)過程相對應(yīng),研究熱點也相對應(yīng)變化,呈現(xiàn)出從理論到實踐,從概念到技術(shù)的過程,同時知識元研究也做到了與時俱進(jìn),與現(xiàn)階段的研究熱點相結(jié)合進(jìn)行更加深入的融合研究?,F(xiàn)階段知識元研究已經(jīng)取得了一些成就,但是仍有一些不足的地方。
(1)從研究內(nèi)容看,現(xiàn)有論文基本是從理論開展的基礎(chǔ)性和普及性介紹,很少有貼近生活的知識元示例,讀者在理解上有不同程度的難度。在知識元定義上,專家學(xué)者并未達(dá)成一致共識。在知識元表示上,大多只考慮了知識元本體,忽略了與各種領(lǐng)域知識相關(guān)的領(lǐng)域本體。現(xiàn)階段圖書館學(xué)領(lǐng)域知識元研究基本都是在技術(shù)驅(qū)動下進(jìn)行,并未真正與圖書館的知識服務(wù)相結(jié)合,以實現(xiàn)服務(wù)不同類型、不同層次的讀者的需求目的。
(2)從研究深度看,現(xiàn)有對知識元的研究與圖書館的本質(zhì)聯(lián)系不夠緊密,重點在技術(shù)而不是在服務(wù),研究停留在理論層面上,沒有與圖書館實踐相聯(lián)系,圖書館自身的紙質(zhì)館藏、電子資源并沒有得到重視,而圖書館的讀者也沒有參與其中。
(3)從研究領(lǐng)域看,現(xiàn)階段知識元研究多在圖書情報、教育學(xué)、科學(xué)計量學(xué)、計算機(jī)學(xué)、管理學(xué)領(lǐng)域展開,其他學(xué)科的相關(guān)研究較少,與其他領(lǐng)域的融合研究很少,研究基本都是圍繞文本信息的挖掘與處理進(jìn)行。在圖書情報領(lǐng)域缺少知識元同圖書館學(xué)目前熱點問題相結(jié)合的研究。
當(dāng)前我們能預(yù)見的知識元未來的發(fā)展方向,是知識元的研究粒度將越來越小,內(nèi)涵將不斷深化,結(jié)合時代發(fā)展和各學(xué)科熱點問題的研究將變成主流。圖書情報領(lǐng)域應(yīng)從以下幾個方面加強(qiáng)對知識元的研究。
第一,從融合視角探討圖書館與知識元研究。信息技術(shù)驅(qū)動的知識元研究僅僅是研究的初級階段,圖書館與知識元研究應(yīng)當(dāng)對領(lǐng)域知識的細(xì)粒度進(jìn)行組織并且基于此提供知識檢索與知識服務(wù),不應(yīng)該局限于簡單的服務(wù)與支持層面,嘗試融合數(shù)學(xué)、物理學(xué)中的理論來指導(dǎo)知識元研究,構(gòu)建知識元模型的理論框架。
第二,營造良好的知識元研究環(huán)境。圖書館的服務(wù)本質(zhì)、強(qiáng)大的紙本資源和購買的跨學(xué)科、多領(lǐng)域的數(shù)據(jù)庫系統(tǒng),以及讀者的先天優(yōu)勢,能夠在知識服務(wù)、知識標(biāo)引、知識鏈接、知識構(gòu)建等方面提供強(qiáng)有力的支持。同時,通過知識元研究成果的應(yīng)用,圖書館可以完善文本知識單元檢索系統(tǒng),參與知識元模型的構(gòu)建及實驗,從而更好的提供服務(wù),促進(jìn)圖書館和讀者的交流,促進(jìn)兩者的共同發(fā)展。
第三,拓寬知識元研究領(lǐng)域。在進(jìn)行知識元研究時,可以融合信號處理的反變關(guān)系來研究知識元變換問題;也可以大膽引入范疇論,把知識元看成是特定的結(jié)構(gòu)和態(tài)射??梢試L試進(jìn)行與閱讀推廣服務(wù)、圖書館資源深度整合與揭示、基于文本挖掘的科技文獻(xiàn)知識發(fā)現(xiàn)相結(jié)合,更好的進(jìn)行研究。