劉妮萍 宋艷輝
摘要:共詞分析方法是文獻計量學的研究方法,而知識域可視化的一種交叉學科研究。本文嘗試將共詞分析應用于知識域可視化的研究。該文對知識域以及知識域可視化進行定義,并詳細分析了如何以共詞分析進行知識域可視化的研究。
關鍵詞:共詞分析;知識域可視化;知識域
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2015)13-0238-02
Abstract: The Co-words Analysis method is the research method of literature metrology, and domain knowledge visualization of a cross-disciplinary study. This article attempts to apply Co-words Analysis to the domain knowledge visualization research. In this paper, the knowledge domain and the domain of knowledge visualization are defined. We analyze in detail how to apply Co-words Analysis to domain knowledge visualization research.
Key words: Co-words Analysis; Domain Knowledge Visualization; Domain Knowledge
隨著知識經濟在全球范圍內的廣泛興起,知識這種可以產生巨大經濟效益的無形資產受到前所未有的重視,知識也因此被提升到與物質、能量同等重要的位置。在學術界,與知識密切相關的一系列研究也在悄然興起,如知識管理、知識經濟等。如何從可視化的角度顯示知識就是眾多研究中的一支重要的研究力量,這是計算機技術與知識表示相結合的一個研究領域,即知識域可視化。我們認為,共詞分析方法能夠較好的進行知識域可視化。本文嘗試以共詞分析與知識域可視化結合起來進行研究。
1 知識域可視化概念
知識域通常被理解為知識領域,知識領域可以是一個一級學科、二級學科、三級學科,甚至可以僅僅是一個技術領域。但是,其它學科的學者對知識域有不同的理解。藝術學有人將知識域理解為“教學中傳授的全部知識內容,包含兩個部分:教學的常設知識部分、信息部分[1]”。經濟學領域有人認為知識域是在知識的經濟價值轉化過程中,不同形態(tài)的同質知識與異質知識,由于表現(xiàn)出的不同的價值差異性而重新整合從而形成的一種知識的群聚[2]。我們認為,與可視化結合在一起的所謂的知識域是一般意義上的知識域,即學科知識領域。The International Symposium on Knowledge Domain Visualization(知識域可視化國際學術研討會)對知識域可視化做出的定義是:使用可視化技術用直覺的方式表示領域知識結構關系及其發(fā)展進程的方法;其目的是通過多種可視化思維、可視化發(fā)現(xiàn)、可視化探索和可視化分析技術來揭示一個知識域的動態(tài)發(fā)展,并從中發(fā)現(xiàn)模式。
2 基于共詞分析的知識域可視化
“共詞分析”被認為是由20世紀70年代末法國計量學家Callon提出的[3]。其原理是,統(tǒng)計文獻中共同出現(xiàn)的主題詞,計算這些主題詞在同一篇文獻中出現(xiàn)的次數,從而建立主題詞之間的共詞網絡,通過主題詞的聚類以及關聯(lián)效應研究文獻之間的依存關系。這實際上已經是從內容層面探析文獻之間的內容關系,因此,共詞分析被認為是內容分析法的一種。共詞分析中的主題詞一般都是敘詞表中的敘詞,但最具有分析意義的應該是論文的關鍵詞,它是論文作者對論文內容進行高度的概括與精確的凝練而形成的。共詞分析是發(fā)現(xiàn)科學研究各領域之間關系的有效方法,也是追蹤人類社會認知網絡的結構和變化的一種有力工具。共詞分析方法在知識域可視化中的基本步驟可以表述如下:
1)從數據庫中提取可以代表該學科研究主題或研究方向敘詞(高頻關鍵詞或主題詞);
2)計算這些敘詞在文獻中共同出現(xiàn)的次數,即它們的共現(xiàn)次數,形成共詞矩陣;
3)矩陣的處理,如對角線值,標準化等問題;
4)選取多元統(tǒng)計、詞頻法、突變詞檢測、關聯(lián)法等方法分析對共詞矩陣中敘詞關系(如果是知識域的分析,使用較多的可能是聚類方法),揭示敘詞所代表的學科的知識結構與發(fā)展狀況。
5)對研究結果進行可視化展示,并進行詳細闡述。
周寧等認為,共詞分析分析法有兩個主要的應用:①探索知識領域之間的互相關系;②探測次要的但是存在著潛在增長性的知識域[4]。我們認為,戰(zhàn)略坐標圖就是共詞分析方法在知識域可視化上對這2個應用方面的很好體現(xiàn)。戰(zhàn)略坐標圖是由Law等人提出的[5]。戰(zhàn)略坐標圖以向心度和密度為參數繪制成的二維坐標圖,一般情況下,X軸為向心度(Centrality),Y軸為密度(Density),原點為二者的均值。
向心度(Centrality):測度類團之間的相互作用力。對于某一類團,其對其它類團的聯(lián)系越緊密,聯(lián)系越多,該類團在結構圖中就會越處于中心位置,其重要性也就不言而喻[6]。我們可以計算各個類團之間的主題詞或者關鍵詞的相互鏈接強度來推算向心度。具體的計算公式是外部鏈接的總和、平方和的開平方。
密度(Density):不同于向心度計算類團之間的相互作用力,它是計算類團內部的相互作用,即類團內部鏈接的緊密型。它可以通過計算類團內部主題詞或者關鍵詞對在同一篇文獻中出現(xiàn)的的次數的定量化數值(如平均值、平方和或者中位數)來獲取。
如圖1所示的分為四個象限的戰(zhàn)略坐標圖就是一種較好的表達研究領域的研究發(fā)展狀況的。
Ⅰ象限:它們的密度高,向心度也較高。密度高說明研究主題內部聯(lián)系緊密,研究趨向成熟;向心度高,說明這個象限中的研究主題又與其余各研究主題有廣泛的聯(lián)系,即處于研究網絡的中心。
Ⅱ象限:此象限的研究主題內部聯(lián)系緊密,說明結構已相對固定,但與其他研究主題聯(lián)系不密切,在整個研究網絡中處于邊緣位置。
Ⅲ象限:此象限的研究主題密度較低、向心度也較低。較低的密度和較低的向心度都說明其研究主題處在整個研究網絡的邊緣位置,需要向中心區(qū)域推進。
Ⅳ象限:此象限的研究主題向心度較高,密度較低。向心度高說明,它跟別的主題還是有一定聯(lián)系的,研究者們對其有興趣。但較低的密度又說明該主題內部松散、呈渙散狀,尚處于發(fā)展初、中期,還需要有進一步提升的空間。
圖2為2000-2010年間我國圖書館學知識域的戰(zhàn)略坐標圖(SPSS繪制)[7]。
3 結語
本文認為共詞分析方法是一種比較有效的知識域可視化的表示方法,實際上,知識域可視化還有很多研究方法,如共被引方法、耦合方法、合作方法、共詞方法。在今后的研究中,我們會系統(tǒng)地進行這些方法的研究。
參考文獻:
[1]焦應奇. 知識域概念和專業(yè)知識板塊的劃分與設計[J]. 美術觀察,2001(9):16-20.
[2]高政利, 梁工謙. 價值性差異、知識域結構與知識計量研究[J]. 科學學研究,2009,27(6):881-890.
[3]Callon, M., Courtial, J.P.,Turner W.A.. From translations to problematic networks: An introduction to co-word analysis [J]. Social Science Information Surles Les Sciences Sociales, 1983, 22(2):191-235.
[4]周寧,張李義,等. 信息資源可視化模型與方法[M]. 北京:科學出版社,2008.
[5]Law J., Bauin S., Courtial J.P., etal. Policy and the Mapping of Scientific Changer: A co-word analysis of Research into Environmental Acidification[J]. Scientometrics,1988,14(3-4):251-264.
[6]Callon M.,Laville F.Co-word Analysis as a tool for Describing the Netword for Interactions Between Basic and Technological Research:The Case of Polymer Chemistry[J].Scientometrics,1991,22(1):155-205.
[7]丁敬達. 學術社區(qū)知識交流模式研究[D]. 武漢:武漢大學博士學位論文,2011.