摘要:當(dāng)今社會信息技術(shù)發(fā)展日新月異,互聯(lián)網(wǎng)技術(shù)、數(shù)據(jù)庫技術(shù)、人工智能技術(shù)等在各個(gè)領(lǐng)域的應(yīng)用日臻成熟;信息化數(shù)字化時(shí)代的到來,信息的獲取和利用日益方便和快捷,為科學(xué)研究提供了不可或缺的分析基礎(chǔ),這些都為科學(xué)計(jì)量學(xué)的研究奠定了發(fā)展基礎(chǔ)。
關(guān)鍵詞:圖書情報(bào)學(xué)知識圖譜聚類分析
1. 緒論
知識圖譜(Mapping Knowledge Domains)是顯示科學(xué)知識的發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一種圖形,它以科學(xué)知識為計(jì)量研究對象,屬于科學(xué)計(jì)量學(xué)范疇[1]。它是基于內(nèi)容分析、引文網(wǎng)絡(luò)分析和信息可視化的一種可視化顯示知識以及相互關(guān)系的一種圖形,已經(jīng)成為當(dāng)前科學(xué)計(jì)量學(xué)中比較熱門的研究方法。知識圖譜在圖書情報(bào)學(xué)領(lǐng)域也稱為知識域可視化或知識領(lǐng)域映射地圖,是現(xiàn)實(shí)知識發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形,用可視化技術(shù)描述知識資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識及它們之間的相互聯(lián)系[2]。
2. 圖書情報(bào)學(xué)知識圖譜的構(gòu)建
2.1 數(shù)據(jù)獲取和處理
對于高頻主題詞的提取,目前國內(nèi)外還未形成統(tǒng)一權(quán)威的標(biāo)準(zhǔn)。大多數(shù)學(xué)者在選擇小樣本主題詞時(shí)都是按照詞頻大于某個(gè)特定值的方法,認(rèn)為大于這個(gè)特定值即可認(rèn)定該主題詞是高頻主題詞。此外還需要考慮提取的高頻主題詞占所有主題詞詞頻的比重,根據(jù)主題詞累積詞頻的變化截取高頻主題詞。
2.2 共詞分析
共詞分析是一種內(nèi)容分析技術(shù),它通過分析在同一個(gè)文本主題中的款目對共同出現(xiàn)的形式,確認(rèn)文本所代表的學(xué)科領(lǐng)域中相關(guān)主題的關(guān)系,進(jìn)而探索學(xué)科的發(fā)展。共詞分析的主要作用是通過對高頻主題詞的聚類,發(fā)現(xiàn)研究對象的分析熱點(diǎn)和主要內(nèi)容,深入揭示相對應(yīng)的研究結(jié)構(gòu),進(jìn)而系統(tǒng)探討其研究維度、學(xué)科背景和理論基礎(chǔ),以期進(jìn)一步把握其研究現(xiàn)狀、學(xué)術(shù)熱點(diǎn)及發(fā)展趨勢。
2.3 相關(guān)分析
相關(guān)分析是研究現(xiàn)象之間是否存在某種依存關(guān)系,是以分析變量間的線性關(guān)系為主,是研究它們之間線性相關(guān)密切程度的一種統(tǒng)計(jì)分析方法[3]。通過相關(guān)分析,界定任意兩個(gè)主題詞之間的距離,以及這種距離所代表的關(guān)系,從而進(jìn)一步確定主題與主題直接或正或負(fù)的聯(lián)系。
相關(guān)分析是整個(gè)數(shù)據(jù)處理過程中比較簡單的一步,卻至關(guān)重要。SPSS的統(tǒng)計(jì)分析是建立在相關(guān)系數(shù)的基礎(chǔ)上,需要基于相關(guān)矩陣表進(jìn)行。因此,須將以上共詞矩陣經(jīng)過特定的相關(guān)性轉(zhuǎn)化為相關(guān)矩陣,以便SPSS統(tǒng)計(jì)分析。共詞矩陣轉(zhuǎn)化為相關(guān)矩陣通過Excel來完成,具體步驟是:在Excel中加載宏,導(dǎo)入分析工具庫-VBA函數(shù),使用Excel中自帶的數(shù)據(jù)分析模塊進(jìn)行相關(guān)系數(shù)的計(jì)算,通過“工具”-“數(shù)據(jù)分析”-“相關(guān)系數(shù)”,對共詞表中的每一列進(jìn)行相關(guān)系數(shù)的運(yùn)算,由此可以得到完整的100*100的相關(guān)矩陣表。得到100*100主題詞相關(guān)矩陣后,就可以通過SPSS統(tǒng)計(jì)分析工具進(jìn)行因子分析,聚類分析以及多維尺度分析,并構(gòu)建圖書情報(bào)學(xué)知識圖譜。然后通過SPSS對主題詞進(jìn)行了一系列的因子分析、聚類分析和多維尺度分析,在此基礎(chǔ)上得到圖書情報(bào)學(xué)研究的各個(gè)大類,
3. 圖書情報(bào)學(xué)知識圖譜的解讀
3.1 基于主題詞的總體分析
對主題詞的總體分析主要是對研究范圍內(nèi)選取的樣本進(jìn)行SPSS分析后獲取的前100位的主題詞上,在圖譜構(gòu)建中主題詞對應(yīng)的百分比就表示在這一年該主題詞出現(xiàn)的次數(shù)占該年所有提取的主題詞總詞頻數(shù)的比重。“平均比重”則表示該主題詞在研究年限范圍內(nèi)的平均值;“變化狀態(tài)”表示研究年限范圍內(nèi)的變化情況,會有“持續(xù)上升”和“持續(xù)下降”兩種情況;“無顯著規(guī)律”則表示該主題詞在研究年限內(nèi)變化比較反復(fù);研究年限中的“末年比初年增長幅度”表示末年比初年的增長比例,用以衡量該主題詞在末年的關(guān)注度和熱度相較初年的情況,比例越高,增速越大,發(fā)展越快。
3.2 學(xué)科發(fā)展的現(xiàn)狀與熱點(diǎn)
通過前文的統(tǒng)計(jì)分析和當(dāng)前科學(xué)研究趨勢可以將圖書情報(bào)學(xué)研究的結(jié)果進(jìn)行具體分類,當(dāng)前對于圖書情報(bào)學(xué)研究的文獻(xiàn)顯示,通過對2005-2011年的主要樣本進(jìn)行分析后能夠?qū)D書情報(bào)學(xué)圖譜分為11個(gè)大類,從而得出當(dāng)前圖書情報(bào)學(xué)的科學(xué)發(fā)展現(xiàn)狀與熱點(diǎn)分別是:醫(yī)學(xué)信息學(xué)、信息計(jì)量學(xué)與出版、圖書館系統(tǒng)、計(jì)算機(jī)技術(shù)與管理、網(wǎng)絡(luò)信息資源、信息管理與信息系統(tǒng)理論、電子資源、網(wǎng)絡(luò)資源與醫(yī)學(xué)圖書館、數(shù)字圖書館、教育與信息素養(yǎng)、信息行為與信息共享。
3.3 科學(xué)發(fā)展態(tài)勢
綜合以上對圖書情報(bào)學(xué)11大類研究主題的內(nèi)容剖析和現(xiàn)狀分析,可以看出,現(xiàn)階段的學(xué)科發(fā)展主要集中在圖書館實(shí)體研究、資源對象以及學(xué)科基本信息理論三個(gè)方面[4]。而在每個(gè)方面下,又有不同的發(fā)展側(cè)重點(diǎn),如在實(shí)體研究中,主要是根據(jù)系統(tǒng)的觀點(diǎn),將圖書館劃分為結(jié)構(gòu)、職能、作用、類型、表現(xiàn)形式各不同的子元素,研究多集中在學(xué)術(shù)圖書館、圖書館人員和圖書館的地域研究上;在資源對象方面,主要是將圖書情報(bào)學(xué)的研究對象——信息資源作為研究主導(dǎo),尤其是針對目前網(wǎng)絡(luò)信息資源迅猛發(fā)展的情況,因此研究多集中在網(wǎng)絡(luò)資源的檢索與評價(jià)方面;在學(xué)科基本信息理論方面,研究則多集中在管理和技術(shù)兩大方面,其中管理側(cè)重于對信息資源管理和知識管理的研究,而技術(shù)更多的是面向檢索技術(shù)和存儲技術(shù)的研究[5]。
4. 結(jié)論
在知識經(jīng)濟(jì)發(fā)展的大環(huán)境下,知識圖譜的應(yīng)用受到了越來越多的關(guān)注,而關(guān)注的增多必將會帶來更深入的研究。如今對知識圖譜的研究多數(shù)還只是局限在對某個(gè)特定主題的分析之上,對學(xué)科和領(lǐng)域的研究不是很多。因此,各個(gè)學(xué)科在審視自身發(fā)展的同時(shí),可以借助知識圖譜的分析,可視化地顯示學(xué)科發(fā)展的態(tài)勢和走向,為研究方向提供參考。
參考文獻(xiàn)
[1] 肖明李國俊楊楠. 基于詞頻分析的國內(nèi)情報(bào)學(xué)研究熱點(diǎn)(1998~2007)[J]. 情報(bào)雜志,2009(28): 21-25.
[2] 陳蘭杰. 國內(nèi)情報(bào)學(xué)理論2008年研究熱點(diǎn)及發(fā)展趨勢[J]. 情報(bào)雜志, 2009(28(8)): 55-58.
[3] 嚴(yán)怡民. 現(xiàn)代情報(bào)學(xué)理論[M]. 武漢: 武漢大學(xué)出版社,1996.
[4] 梁戰(zhàn)平. 開創(chuàng)情報(bào)學(xué)的未來——爭論的焦點(diǎn)問題研究[J]. 情報(bào)學(xué)報(bào), 2007(26(1)): 14-19.
[5] 周承聰. 信息生態(tài)鏈中的信息流轉(zhuǎn)[J]. 情報(bào)理論與實(shí)踐,2007(30(6)): 725-727.
作者簡介:
金葉(1982-),女,山西長治人,學(xué)歷:中南大學(xué)醫(yī)藥信息系2009 級碩士研究生在讀,職務(wù):長治醫(yī)學(xué)院信息管理系教師。