郭 文 斌
(陜西師范大學(xué)教育學(xué)院,西安 710062)
知識(shí)圖譜:教育文獻(xiàn)內(nèi)容可視化研究新技術(shù)*
郭 文 斌
(陜西師范大學(xué)教育學(xué)院,西安 710062)
如何對(duì)數(shù)字時(shí)代產(chǎn)生的海量信息進(jìn)行客觀、高效和科學(xué)的整理,產(chǎn)生出新的知識(shí)為教育研究者所用,已經(jīng)成為當(dāng)前教育研究者必備的素養(yǎng)。本文旨在促進(jìn)教育研究者通過使用計(jì)算機(jī),將抽象數(shù)據(jù)信息轉(zhuǎn)化為可視化信息,增強(qiáng)他們快速識(shí)別抽象信息的認(rèn)知過程。論文對(duì)知識(shí)圖譜進(jìn)行教育文獻(xiàn)內(nèi)容可視化的原理、繪制流程及注意事項(xiàng)進(jìn)行了較為詳細(xì)的介紹和實(shí)例說明。結(jié)果發(fā)現(xiàn),作為教育文獻(xiàn)內(nèi)容可視化的知識(shí)圖譜屬于較新的科學(xué)計(jì)量分析方法,它能夠通過圖像直觀展現(xiàn)出教育研究最前沿領(lǐng)域和學(xué)科知識(shí)的信息會(huì)聚點(diǎn),從宏觀、中觀、微觀等不同層面來揭示教育研究發(fā)展的概貌,便于研究者全面審視教育研究領(lǐng)域的結(jié)構(gòu)和研究熱點(diǎn)、重點(diǎn)等信息。結(jié)果表明,知識(shí)圖譜通過信息可視化對(duì)教育文獻(xiàn)內(nèi)容進(jìn)行定量研究和定性研究的結(jié)合,極大提升了教育文獻(xiàn)內(nèi)容研究的質(zhì)量,為海量教育文獻(xiàn)內(nèi)容的深度解讀提供了可行性的技術(shù)支持。
知識(shí)圖譜;教育文獻(xiàn);信息可視化;內(nèi)容可視化
過去,在互聯(lián)網(wǎng)和數(shù)字化時(shí)代沒有到來之前,研究者為了解教育領(lǐng)域發(fā)展的整體狀況,首先,通過人工方法查閱教育領(lǐng)域的幾乎所有文獻(xiàn);其次,從大量文獻(xiàn)中篩選出相對(duì)重要的文獻(xiàn)(郭文斌,2015);最后,研究者依據(jù)自己的專業(yè)特長(zhǎng)對(duì)文獻(xiàn)資料進(jìn)行綜合加工,撰寫文獻(xiàn)綜述。這樣的文獻(xiàn)研究方法,不僅因?yàn)檠芯空哒玖⒔嵌群椭饔^判斷的差異,造成選取的文獻(xiàn)材料有較大的出入,文獻(xiàn)研究結(jié)論難以得到重復(fù)驗(yàn)證,而且,還可能會(huì)因?yàn)槲墨I(xiàn)資料搜集的人為遺漏,產(chǎn)生錯(cuò)誤或者不當(dāng)?shù)臍w類和總結(jié)(郭文斌,陳秋珠,2012)。如今,隨著知識(shí)大爆炸和全球數(shù)字化時(shí)代的到來,教育文獻(xiàn)不僅以海量方式呈現(xiàn),而且其呈現(xiàn)的內(nèi)容和主題也在快速發(fā)生變化。要對(duì)如此海量、多變的教育文獻(xiàn)進(jìn)行研究,客觀地捕捉出它們發(fā)展變化的特點(diǎn),傳統(tǒng)的文獻(xiàn)處理方法難以勝任。在數(shù)字化時(shí)代背景下,憑借數(shù)據(jù)挖掘和信息可視化技術(shù),對(duì)已有海量信息進(jìn)行客觀、高效和科學(xué)的整理,產(chǎn)生新的知識(shí)的科學(xué)計(jì)量學(xué)逐漸發(fā)展并且成熟起來(郭文斌,方俊明,陳秋珠,2012)。1989年,羅伯遜等人提出了信息可視化概念。信息可視化主要指通過使用計(jì)算機(jī),將抽象數(shù)據(jù)信息轉(zhuǎn)化為可視化信息,增強(qiáng)人們快速識(shí)別抽象信息的認(rèn)知過程(Bederson & Shneiderman,2003)。信息可視化技術(shù)可以自動(dòng)生成可視化內(nèi)容地圖,這些地圖不僅可以抽取和定義信息模型、種類和作者、概念以及其它信息實(shí)體之間的關(guān)系,而且,它還支持多種多樣的交互功能,用于用戶探索概念關(guān)系和隱含的信息(林夏,2004)。也就是說,內(nèi)容信息可視化可以顯示出專業(yè)領(lǐng)域中出現(xiàn)的交叉學(xué)科的復(fù)雜現(xiàn)象,從而獲得詳盡的前沿科學(xué)信息分析結(jié)果,它不僅有助于科學(xué)家在最短時(shí)間里了解和預(yù)測(cè)前沿科技研究動(dòng)態(tài),而且還有助于在復(fù)雜的科研信息中開辟新的未知領(lǐng)域,提供快速獨(dú)立科學(xué)判斷的客觀依據(jù)(郭文斌,2015)。知識(shí)圖譜作為文獻(xiàn)內(nèi)容可視化的科學(xué)計(jì)量方法之一,近年越來越受到研究者的重視和青睞。2003年美國(guó)科學(xué)院組織的“mapping knowledge domains”討論會(huì),預(yù)示著世界科學(xué)計(jì)量學(xué)中知識(shí)圖譜和可視化研究的春天已經(jīng)到來。知識(shí)圖譜已成為科學(xué)共同體結(jié)構(gòu)與發(fā)展實(shí)證研究的主流方法,廣泛用于很多學(xué)科領(lǐng)域的可視化研究。但是,國(guó)內(nèi)教育研究方法方面還比較落后(郭文斌,方俊明,2015),許多現(xiàn)代科學(xué)研究方法較少在教育科研中應(yīng)用,現(xiàn)代數(shù)學(xué)遲遲未被引進(jìn)到教育科學(xué)中來(鄭日昌,崔麗霞,2001)。為促進(jìn)教育研究者認(rèn)識(shí)和準(zhǔn)確把握信息可視化,將知識(shí)圖譜方法運(yùn)用于教育研究中,本文對(duì)知識(shí)圖譜的概念、應(yīng)用原理、繪制流程以及注意事項(xiàng)進(jìn)行較為全面的介紹和說明。
知識(shí)圖譜也被稱為科學(xué)知識(shí)圖譜、知識(shí)域可視化或知識(shí)域映射地圖,是可視化地描述人類隨時(shí)間擁有的知識(shí)資源及其載體,繪制、挖掘、分析和顯示科學(xué)技術(shù)知識(shí)以及它們之間的相互聯(lián)系,在組織內(nèi)創(chuàng)造知識(shí)共享的環(huán)境以促進(jìn)科學(xué)技術(shù)知識(shí)的合作和深入(劉則淵, 陳悅, 侯海燕,2010)。知識(shí)圖譜以科學(xué)學(xué)為基礎(chǔ),涉及應(yīng)用數(shù)學(xué)、信息科學(xué)及計(jì)算機(jī)科學(xué)諸學(xué)科交叉的領(lǐng)域,是科學(xué)計(jì)量學(xué)和信息計(jì)量學(xué)的新發(fā)展。知識(shí)圖譜能夠用直觀圖像展現(xiàn)出最前沿領(lǐng)域和學(xué)科知識(shí)的信息會(huì)聚點(diǎn),從宏觀、中觀、微觀等不同層面來揭示一個(gè)領(lǐng)域或?qū)W科的發(fā)展的概貌,使人們便于全面審視一個(gè)學(xué)科的結(jié)構(gòu)和研究熱點(diǎn)、重點(diǎn)等信息(郭文斌,陳秋珠,2012),生成新的知識(shí)。在教育學(xué)領(lǐng)域使用知識(shí)圖譜的目的在于:將教育領(lǐng)域的知識(shí)和引人矚目的信息以可視化的圖像直觀地展現(xiàn)出來,挖掘、分析和顯示教育領(lǐng)域知識(shí)及其聯(lián)系,判定教育領(lǐng)域的研究前沿及歷史演進(jìn)路徑,為后續(xù)科研選題和研究走向提供合理性的意見和建議。
(一)知識(shí)圖譜的基本原理
知識(shí)圖譜的基本原理是科學(xué)文獻(xiàn)、科學(xué)家、關(guān)鍵詞等分析單位的相似性分析及測(cè)度。根據(jù)不同的方法和技術(shù)可以繪制不同類型的科學(xué)知識(shí)圖譜。首先,通過計(jì)算機(jī)和互聯(lián)網(wǎng)搜索引擎強(qiáng)大的自動(dòng)查詢功能,在極短的時(shí)間里面完成對(duì)海量信息的準(zhǔn)確查詢;其次,通過計(jì)算機(jī)對(duì)已查詢到海量零散信息進(jìn)行文獻(xiàn)計(jì)量統(tǒng)計(jì)分析,不僅可以通過量化模型將其以科學(xué)的、可視化的形式直觀的呈現(xiàn)出來,而且還可以發(fā)現(xiàn)它們之間的深層次關(guān)系和趨勢(shì),為今后在該領(lǐng)域的研究提供更有力的客觀數(shù)據(jù)和科學(xué)支持(任紅娟,張志強(qiáng),2009)。
(二)知識(shí)圖譜的繪制流程
知識(shí)圖譜的繪制流程主要有五個(gè)步驟(胡澤文,孫建軍,武夷山,2013):首先,確定并選取合適的數(shù)據(jù)源;其次,數(shù)據(jù)源數(shù)據(jù)采集;第三,選取合適的知識(shí)圖譜繪制工具;第四,繪制知識(shí)圖譜;第五,知識(shí)圖譜解讀和分析。
1.確定并選取合適的數(shù)據(jù)源
為了確保繪制知識(shí)圖譜文獻(xiàn)的準(zhǔn)確性和全面性,繪制知識(shí)圖譜初期查詢文獻(xiàn)時(shí),一定要選取較為權(quán)威的文獻(xiàn)數(shù)據(jù)庫作為數(shù)據(jù)源。現(xiàn)在較為公認(rèn)的權(quán)威文獻(xiàn)數(shù)據(jù)庫有:中文社會(huì)科學(xué)引文索引數(shù)據(jù)庫(Chinese Social Sciences Citation Index,CSSCI,網(wǎng)址為http://cssci.nju.edu.cn)、中國(guó)知識(shí)基礎(chǔ)設(shè)施工程數(shù)據(jù)庫(China National Knowledge Infrastructure,CNKI,網(wǎng)址為http://www.cnki.net)、萬方數(shù)據(jù)庫(wan fang data,WFD,網(wǎng)址為http://www.wanfangdata.com.cn)、大型綜合性以及多學(xué)科的Web of Science(WOS)核心期刊引文索引數(shù)據(jù)庫(包括SCI、SSCI、A&HCI,網(wǎng)址為http://www.isiknowledge.com)、全球最大的文摘和索引數(shù)據(jù)庫Scopus(網(wǎng)址為http://www.elsevier.com/solutions/scopus)等。
2.數(shù)據(jù)源數(shù)據(jù)采集
在找到合適的數(shù)據(jù)庫后,研究者可以根據(jù)自己需要,選擇主題、作者、出版物名稱、關(guān)鍵詞或者時(shí)間等多個(gè)標(biāo)準(zhǔn)作為檢索條件。查找到符合檢索要求的文獻(xiàn)后,一般將其按照包含作者、題目、摘要和文獻(xiàn)的引文等字段的固定格式加以采集和保存。對(duì)數(shù)字信息進(jìn)行保存時(shí),研究者可以直接選用數(shù)據(jù)源數(shù)據(jù)格式保存,也可以根據(jù)繪制知識(shí)圖譜軟件需要,選用特定軟件或者自己編程來對(duì)查詢到的信息資料格式進(jìn)行加工。對(duì)于無法通過數(shù)字化查詢的重要數(shù)據(jù),研究者可以通過手工錄入的方式來實(shí)現(xiàn)信息保存。
3.選取合適的知識(shí)圖譜繪制工具
知識(shí)圖譜繪制的工具有:Citespace、Bibexcel、Wordsmith Tools、Pajek、Ucinet、BICOMB、Histcite 、Sci2等軟件。
(1)Citespace由美國(guó)德雷賽爾大學(xué)(費(fèi)城)信息科學(xué)與技術(shù)學(xué)院的陳超美開發(fā),可獲取地址為http://cluster.ischool.drexel.edu/~cchen/citespace/download.html。
(2)Bibexcel由瑞典科學(xué)家Olle Persson開發(fā),可獲取地址為http://homepage.univie.ac.at/juan.gorraiz/bibexcel/index.html。
(3)Wordsmith Tools由英國(guó)詞法分析軟件公司和牛津大學(xué)出版社(Lexical Analysis Software and Oxford University Press)聯(lián)合研發(fā),可獲取地址為http://www.lexically.net/publications/copyright_permission_for_screenshots.htm。
(4)Pajek 由斯洛文尼亞盧布爾雅那大學(xué)社會(huì)科學(xué)學(xué)院(University of Ljubljana,F(xiàn)aculty of Social Sciences)的Vladimir Batagelj和Andrej Mrvar共同開發(fā),可獲取網(wǎng)址為http://vlado.fmf.uni-lj.si/pub/networks/pajek/。使用Pajek時(shí),數(shù)據(jù)格式為.net格式。
(5)Ucinet(University of California at Irvine NETwork)最初由加州大學(xué)爾灣分校社會(huì)網(wǎng)研究的權(quán)威學(xué)者Linton Freeman 編寫。后來Stephen Borgatti、Martin Everett和Linton Freeman擴(kuò)展了該軟件功能??色@取地址為http://www.analytictech.com/ucinet/download.htm。
(6)BICOMB是書目共現(xiàn)分析系統(tǒng)(Bibliographic Item Co-Occurrence Matrix Builder)的英文縮寫,它受到我國(guó)衛(wèi)生政策支持項(xiàng)目(HPSP)資助,由中國(guó)醫(yī)科大學(xué)醫(yī)學(xué)信息學(xué)系崔雷教授和沈陽市弘盛計(jì)算機(jī)技術(shù)有限公司協(xié)作研發(fā)??色@取地址為http://www.cmu.edu.cn/bc/menu1.html。
(7)Histcite(history of cite,引文歷史)由美國(guó)Eugene Garfield和其科研團(tuán)隊(duì)研發(fā)。可獲取地址為http://interest.science.thomsonreuters.com/forms/HistCite/。
(8) Sci2(Science of Science)由美國(guó)印第安納大學(xué)的Katy B?rner及其團(tuán)隊(duì)研發(fā)。可獲取地址為http://sci2.wiki.cns.iu.edu/display/SCI2TUTORIAL/Science+of+Science+%28Sci2%29+Tool+Manual;jsessionid=FCEAD9B9DE117DCD8F3FE4F68848B3B7。
值得注意的是,上述的(2)和(6)雖然可以對(duì)數(shù)據(jù)源下載數(shù)據(jù)進(jìn)行處理獲得相關(guān)的共現(xiàn)分析數(shù)據(jù),但是,要想獲得可視化的知識(shí)圖譜,還需要進(jìn)一步與SPSS、Pajek 或者Ucinet相互配合使用。
4.繪制可視化知識(shí)圖譜
一般繪制可視化的知識(shí)圖譜常用方法有:引文分析法、共被引分析法、詞頻分析法、社會(huì)網(wǎng)絡(luò)分析法。
(1)引文分析法
就是利用各種數(shù)學(xué)、統(tǒng)計(jì)學(xué)的方法,以及比較、歸納、抽象、概括等邏輯方法,對(duì)科學(xué)期刊、論文、著者等各種分析對(duì)象的引用和被引用現(xiàn)象進(jìn)行分析,以便揭示其數(shù)量特征和內(nèi)在規(guī)律,達(dá)到評(píng)價(jià)、預(yù)測(cè)科學(xué)發(fā)展趨勢(shì)的一種信息計(jì)量研究方法(邱均平,2007)。采用引文分析形成的網(wǎng)絡(luò)結(jié)構(gòu),可以發(fā)現(xiàn),最近幾年教育研究領(lǐng)域引用較為集中的文獻(xiàn)。這些文獻(xiàn)的研究領(lǐng)域便構(gòu)成了教育研究領(lǐng)域的熱點(diǎn)和前沿。
(2)共被引分析法
采用聚類分析、多維尺度分析等多元統(tǒng)計(jì)分析方法,以教育領(lǐng)域有代表性的文章、詞匯、作者或者刊物作為分析對(duì)象,將它們間錯(cuò)綜復(fù)雜的共引網(wǎng)狀關(guān)系簡(jiǎn)化為數(shù)目相對(duì)較少的若干類群之間的關(guān)系,并直觀地表示出來,使分析對(duì)象之間相互關(guān)系的格局清晰可辨(陳定權(quán),2005)。采用共被引分析法可以發(fā)現(xiàn)教育研究的領(lǐng)域分布、權(quán)威期刊、權(quán)威作者以及熱點(diǎn)詞匯構(gòu)成。
(3)詞頻分析法
詞頻分析法主要通過分析某一研究領(lǐng)域中,文獻(xiàn)中的詞出現(xiàn)的頻次高低,可以確定該領(lǐng)域發(fā)展動(dòng)向和研究熱點(diǎn)發(fā)展動(dòng)向(馬費(fèi)成,張勤,2006)。詞頻分析法屬于定性分析方法,但它與傳統(tǒng)文獻(xiàn)定性分析的最大不同之處在于,較好地摒棄了研究者的個(gè)人喜好,通過對(duì)文獻(xiàn)中關(guān)鍵詞、主題詞以及篇名的詞頻準(zhǔn)確、客觀的分析,有助于得出深入并且共識(shí)性的結(jié)論。采用詞頻分析法,可以較好的直觀展示出教育研究領(lǐng)域的新的發(fā)展及變化。
(4)社會(huì)網(wǎng)絡(luò)分析法
社會(huì)網(wǎng)絡(luò)分析法是測(cè)量與調(diào)查社會(huì)系統(tǒng)中各部分(點(diǎn))的特征與相互間的關(guān)系(連接),將其用網(wǎng)絡(luò)的形式加以表示,進(jìn)而分析其關(guān)系的模式與特征的理論、方法和技術(shù)(湯匯道,2009)。社會(huì)網(wǎng)絡(luò)分析法以圖形或者矩陣方式,直觀呈現(xiàn)出教育研究領(lǐng)域文獻(xiàn)間鏈接的強(qiáng)弱關(guān)系,較好地揭示某一研究領(lǐng)域在整個(gè)教育研究中所處的位置。
5.知識(shí)圖譜解讀和分析
為了避免繪制知識(shí)圖譜結(jié)果出現(xiàn)偏差,在繪制出教育研究領(lǐng)域知識(shí)圖譜后,最好能夠請(qǐng)本領(lǐng)域的專家對(duì)結(jié)果進(jìn)行把關(guān)驗(yàn)證。對(duì)知識(shí)圖譜解讀和分析時(shí),首先,要匯報(bào)統(tǒng)計(jì)效度;其次,要與專家進(jìn)行商討;第三,要對(duì)知識(shí)圖譜結(jié)果進(jìn)行解讀,藉此預(yù)測(cè)教育研究領(lǐng)域的進(jìn)展和趨勢(shì),探尋教育研究熱點(diǎn)與前沿。
為了解國(guó)內(nèi)學(xué)者在遠(yuǎn)程教育領(lǐng)域的具體研究,我們選取了中國(guó)博士及優(yōu)秀碩士全文數(shù)據(jù)庫收錄的3170篇學(xué)位論文的關(guān)鍵詞作為分析材料,嘗試通過內(nèi)容可視化呈現(xiàn)我國(guó)遠(yuǎn)程教育研究的熱點(diǎn)和現(xiàn)狀。首先,以中國(guó)知識(shí)基礎(chǔ)設(shè)施工程數(shù)據(jù)庫中的碩博士論文庫為研究主要數(shù)據(jù)源。其次,設(shè)定檢索條件,將主題詞設(shè)定為“遠(yuǎn)程教育”,將時(shí)間設(shè)定為截至2013年6月9日。共檢索到3179篇文獻(xiàn),剔除不符合要求的學(xué)位論文9篇,共得到有效文獻(xiàn)3170篇。對(duì)獲取的不同單位來源的學(xué)位論文的關(guān)鍵詞進(jìn)行格式和內(nèi)容標(biāo)準(zhǔn)化。第三,選取Bicomb2.0和SPSS20作為知識(shí)圖譜繪制工具。第四,對(duì)查詢到文獻(xiàn)的關(guān)鍵詞進(jìn)行詞頻分析:從關(guān)鍵詞總頻次14307次中確定19.51% 的前50位關(guān)鍵詞為高頻關(guān)鍵詞、建立高頻關(guān)鍵詞共詞頻矩陣、高頻關(guān)鍵詞聚類分析、高頻關(guān)鍵詞多維尺度分析,繪制出高頻關(guān)鍵詞知識(shí)圖譜(見圖1)。第五,對(duì)知識(shí)圖譜(圖1)進(jìn)行相應(yīng)的內(nèi)容解釋和分析,可以發(fā)現(xiàn),遠(yuǎn)程教育研究熱點(diǎn)主要圍繞八個(gè)領(lǐng)域展開,分別為:遠(yuǎn)程教育支持系統(tǒng)及其應(yīng)用技術(shù)研究、遠(yuǎn)程教育中的個(gè)性化設(shè)計(jì)研究、遠(yuǎn)程考試系統(tǒng)設(shè)計(jì)研究、網(wǎng)絡(luò)教學(xué)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)研究、遠(yuǎn)程教育的學(xué)習(xí)支持服務(wù)系統(tǒng)研究、遠(yuǎn)程教育中的網(wǎng)絡(luò)課程的教學(xué)設(shè)計(jì)研究、遠(yuǎn)程教育中的流媒體教育平臺(tái)研究與開發(fā)、遠(yuǎn)程教育中的虛擬現(xiàn)實(shí)技術(shù)研究與開發(fā)。對(duì)可視化戰(zhàn)略坐標(biāo)進(jìn)行內(nèi)容分析,不僅可以發(fā)現(xiàn),遠(yuǎn)程考試系統(tǒng)設(shè)計(jì)研究和網(wǎng)絡(luò)教學(xué)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)研究2類主題自身的內(nèi)部聯(lián)系緊密,且其研究成果處于有關(guān)遠(yuǎn)程教育學(xué)位論文中心地位;遠(yuǎn)程教育中的網(wǎng)絡(luò)課程的教學(xué)設(shè)計(jì)研究,流媒體教育平臺(tái)研究與開發(fā)2類主題自身內(nèi)部聯(lián)系較為松散,它們未來在遠(yuǎn)程教育研究中具有較重要價(jià)值,可以加大對(duì)它們的研究力度;遠(yuǎn)程教育中的虛擬現(xiàn)實(shí)技術(shù)研究中,落在第三象限的網(wǎng)絡(luò)教育、網(wǎng)絡(luò)交互、VRML等內(nèi)容之間的聯(lián)系較為緊密,而落在第四象限的虛擬實(shí)驗(yàn)、虛擬實(shí)驗(yàn)室、虛擬現(xiàn)實(shí)等內(nèi)容的相關(guān)研究成果與其他領(lǐng)域的相關(guān)成果比較而言還較少;遠(yuǎn)程教育支持系統(tǒng)及其應(yīng)用技術(shù)橫跨第一和第四象限,其處于第一象限的支持系統(tǒng)研究間聯(lián)系較為緊密,相應(yīng)的研究也較多,而處于第四象限的遠(yuǎn)程教育的應(yīng)用技術(shù)則研究人員少,相應(yīng)的成果也較少。而且,還可以發(fā)現(xiàn),遠(yuǎn)程教育中的個(gè)性化設(shè)計(jì)研究和遠(yuǎn)程教育的學(xué)習(xí)支持服務(wù)系統(tǒng)研究分別處于戰(zhàn)略坐標(biāo)的縱軸和橫軸,將最后為遠(yuǎn)程教育研究關(guān)注的兩大中心點(diǎn)(郭文斌,俞樹文,2014)。
圖1 遠(yuǎn)程教育研究熱點(diǎn)知識(shí)圖譜(郭文斌,俞樹文,2014)
采用知識(shí)圖譜對(duì)教育文獻(xiàn)內(nèi)容可視化呈現(xiàn)時(shí),應(yīng)該注意以下三方面的內(nèi)容:
(一)關(guān)鍵詞的選取和標(biāo)準(zhǔn)化
知識(shí)圖譜分析的單詞多是以文本形式保存的詞匯清單,繪制工具可以找到該詞匯或詞組在文本所處的全部位置,對(duì)其進(jìn)行自動(dòng)統(tǒng)計(jì)。繪制知識(shí)圖譜時(shí),為了使研究更加深入,大多數(shù)研究者會(huì)選取關(guān)鍵詞作為單詞詞頻分析對(duì)象。此時(shí),需要注意:第一,關(guān)鍵詞的標(biāo)準(zhǔn)化。因?yàn)閿?shù)據(jù)源文獻(xiàn)采集到的關(guān)鍵詞來源多樣,關(guān)鍵詞的標(biāo)識(shí)可能存在差異,所以進(jìn)行高頻關(guān)鍵詞提取前,要對(duì)詞義接近或者相同的關(guān)鍵詞進(jìn)行合并,比如:將“自閉癥”、“孤獨(dú)癥”、“自閉癥譜系障礙”等含義相同的關(guān)鍵詞合并為“自閉癥譜系障礙”。隨后再進(jìn)行關(guān)鍵詞詞頻統(tǒng)計(jì)。如若不然,會(huì)影響到關(guān)鍵詞的排序,致使結(jié)果發(fā)生偏差。第二,無意義關(guān)鍵詞的刪除。有的詞匯雖然以關(guān)鍵詞呈現(xiàn),但是,它們并非實(shí)質(zhì)的關(guān)鍵詞,比如展望、政策等詞匯,需要研究者對(duì)此類詞匯進(jìn)行甄別并予以手工刪除。
(二)判斷高頻關(guān)鍵詞閾限的適當(dāng)性
(三)知識(shí)圖譜結(jié)構(gòu)分析
結(jié)構(gòu)分析也稱單詞語義網(wǎng)絡(luò)分析,主要應(yīng)用因子分析和空間圖將詞語間的關(guān)系直觀的展示出來(諾曼,伊馮娜,風(fēng)笑天,2007),揭示事物關(guān)系中顯現(xiàn)出來的性質(zhì)。知識(shí)圖譜結(jié)構(gòu)分析時(shí),需要呈現(xiàn)四方面的內(nèi)容:高頻關(guān)鍵詞系數(shù)矩陣、高頻關(guān)鍵詞聚類分析、多維尺度分析以及社會(huì)網(wǎng)絡(luò)分析。高頻關(guān)鍵詞系數(shù)矩陣中,研究者要交代清楚系數(shù)產(chǎn)生的統(tǒng)計(jì)原則,生成的矩陣為相同系數(shù)矩陣還是相異系數(shù)矩陣(知識(shí)圖譜論文中常采用相異系數(shù)矩陣),并對(duì)系數(shù)矩陣之間的關(guān)系進(jìn)行簡(jiǎn)單的解讀。高頻關(guān)鍵詞聚類分析時(shí),為更客觀的對(duì)單詞進(jìn)行歸類,研究者可以先采用因子分析法,依據(jù)因子分析得分值,將研究對(duì)象因子分析所構(gòu)成的空間的變量點(diǎn)畫出來,以此對(duì)聚類分析結(jié)果進(jìn)行完善(馬費(fèi)成,望俊成,陳金霞,胡超,2007)。呈現(xiàn)高頻關(guān)鍵詞聚類分析圖后,研究者對(duì)聚類分析結(jié)果進(jìn)行解讀時(shí),要對(duì)呈現(xiàn)有關(guān)單詞的原始文獻(xiàn)進(jìn)行綜合分析,挑選出最重要的文獻(xiàn),并組織好它們之間的銜接關(guān)系,以類似綜述的形式將其呈現(xiàn)出來。此處涉及到大量原始文獻(xiàn)的精讀和取舍,是知識(shí)圖譜論文寫作時(shí)研究者花費(fèi)時(shí)間較多的地方。在進(jìn)行多維尺度分析時(shí),一般要匯報(bào)生成的Stress和RSQ系數(shù),交代清楚生成戰(zhàn)略坐標(biāo)的知識(shí)領(lǐng)域的分布情況。此外,還需要求教育研究領(lǐng)域的相關(guān)專家對(duì)生成結(jié)果把關(guān),進(jìn)一步驗(yàn)證劃分領(lǐng)域和命名的合理性。值得一提的是,根據(jù)多維尺度結(jié)果對(duì)各單詞對(duì)應(yīng)的領(lǐng)域進(jìn)行劃分時(shí),應(yīng)該允許少數(shù)單詞對(duì)應(yīng)的領(lǐng)域和聚類分析結(jié)果有所出入。對(duì)知識(shí)圖譜內(nèi)容進(jìn)行詳細(xì)的解讀,首先,需要將聚類分析和多維尺度分析結(jié)果結(jié)合在一起,對(duì)生成的知識(shí)領(lǐng)域進(jìn)行解讀;其次,需要根據(jù)戰(zhàn)略坐標(biāo)的象限分布,解讀各個(gè)領(lǐng)域的重要性;最后,需要根據(jù)縱橫坐標(biāo)分布,從較為宏觀趨勢(shì)上對(duì)已有研究結(jié)果進(jìn)行概括總結(jié)。
綜上所述,知識(shí)圖譜通過信息可視化對(duì)教育文獻(xiàn)內(nèi)容進(jìn)行定量研究和定性研究的結(jié)合,極大提升了教育文獻(xiàn)內(nèi)容研究的質(zhì)量,為海量教育文獻(xiàn)內(nèi)容的深度解讀提供了可行性的技術(shù)支持。筆者期待更多的教育研究者投身到對(duì)教育文獻(xiàn)內(nèi)容可視化技術(shù)的討論和實(shí)際應(yīng)用中來。
陳定權(quán). (2005). 同引分析與可視化技術(shù).情報(bào)科學(xué), 23(4), 532-537.
郭文斌. (2015).知識(shí)圖譜理論在教育與心理研究中的應(yīng)用.杭州:浙江大學(xué)出版社.4-6.
郭文斌,陳秋珠.(2012).特殊教育研究熱點(diǎn)知識(shí)圖譜.華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版),30(3), 49-54.
郭文斌, 方俊明. (2015). 關(guān)鍵詞共詞分析法: 高等教育研究的新方法.高教探索,(9), 15-21.
郭文斌, 方俊明, 陳秋珠.(2012).基于關(guān)鍵詞共詞分析的我國(guó)自閉癥熱點(diǎn)研究.西北師大學(xué)報(bào)(社會(huì)科學(xué)版), 49(1), 128-132.
郭文斌, 俞樹文. (2014). 我國(guó)遠(yuǎn)程教育研究熱點(diǎn)知識(shí)圖譜——基于 3170 篇碩士及博士學(xué)位論文的關(guān)鍵詞共詞分析.電化教育研究,(2), 163-171.
胡澤文, 孫建軍, 武夷山. (2013). 國(guó)內(nèi)知識(shí)圖譜應(yīng)用研究綜述.圖書情報(bào)工作,57(3),131-137.
林夏. (2004). 信息可視化與內(nèi)容描述.現(xiàn)代圖書情報(bào)技術(shù),(10), 3-13.
劉則淵, 陳悅, 侯海燕. (2010).科學(xué)知識(shí)圖譜: 方法與應(yīng)用.. 北京:人民出版社.5.
馬費(fèi)成, 望俊成, 陳金霞, 胡超. (2007). 我國(guó)數(shù)字信息資源研究的熱點(diǎn)領(lǐng)域: 共詞分析透視.情報(bào)理論與實(shí)踐,30(4), 438-443.
馬費(fèi)成, 張勤. (2006). 國(guó)內(nèi)外知識(shí)管理研究熱點(diǎn)——基于詞頻的統(tǒng)計(jì)分析.情報(bào)學(xué)報(bào), 25(2), 163-171.
(美國(guó))諾曼·K·鄧津,伊馮娜·S·林主編,風(fēng)笑天等譯.(2007).肯定性研究:經(jīng)驗(yàn)資料收集與分析方法(第3卷). 重慶:重慶大學(xué)出版社.837.
邱均平. (2007).信息計(jì)量學(xué).武漢:武漢大學(xué)出版社.315.
任紅娟,張志強(qiáng). (2009). 基于文獻(xiàn)計(jì)量的科學(xué)知識(shí)圖譜發(fā)展研究.情報(bào)雜志,(12), 86-90.
湯匯道. (2009). 社會(huì)網(wǎng)絡(luò)分析法述評(píng).學(xué)術(shù)界,(3), 205-208.
張勤,馬費(fèi)成. (2007). 國(guó)外知識(shí)管理研究范式.管理科學(xué)學(xué)報(bào),(6),65-74.
鄭日昌,崔麗霞. (2001). 二十年來我國(guó)教育研究方法的回顧與反思.教育研究,(6), 17-21.
鐘文娟. (2012). 基于普賴斯定律與綜合指數(shù)法的核心作者測(cè)評(píng)——以《圖書館建設(shè)》為例.科技管理研究,32(2),57-60.
Bederson, B. B., & Shneiderman, B. (2003). The craft of information visualization: readings and reflections. San Francisco:Morgan Kaufmann./.
(責(zé)任編輯 陳振華)
陜西省田家炳項(xiàng)目“學(xué)校發(fā)展及改進(jìn)計(jì)劃”。
10.16382/j.cnki.1000-5560.2016.01.007