姜 濤,趙俊玲
(1.河北大學,河北 保定 071000 2.河北大學管理學院,河北 保定 071000)
文獻計量學是以文獻本身及其所表現(xiàn)出來的題名、著者、參考文獻及文獻內(nèi)容等一切與文獻有關的文獻計量特征為研究對象,通過數(shù)學、統(tǒng)計學等的計量方法,研究文獻信息的分布結(jié)構(gòu)、數(shù)量關系、變化規(guī)律和定量管理,并進而探討科學技術的某些結(jié)構(gòu)、特征和規(guī)律的一門科學[1]。我國文獻計量學的研究隨著情報學學科的建立和發(fā)展,在理論研究與實際應用方面均取得了長足的發(fā)展,目前已經(jīng)在許多學科中廣泛的應用,是情報學中最活躍、發(fā)展最迅速的專業(yè)領域之一。知識爆炸的時代,醫(yī)學相關信息海量激增,醫(yī)務工作者由于時間缺乏,檢索能力差等原因,很難從大量醫(yī)學信息中查找相關知識,文獻計量分析為醫(yī)務工作者提供了一種方便快捷可靠度高的醫(yī)學情報情報信息獲取途徑。隨著現(xiàn)代信息技術的飛速發(fā)展,文獻計量分析在醫(yī)學中的應用也越來越廣泛,本文探討醫(yī)學文獻計量分析的研究現(xiàn)狀,現(xiàn)報道如下。
1.1 一般資料:本文的文獻數(shù)據(jù)來源范圍限定在《中國學術期刊全文數(shù)據(jù)庫(CJFD)》“醫(yī)藥衛(wèi)生科技”專輯,以“文獻計量”為主題進行精確檢索,檢索出977條符合條件的論文,導入Excel中以方便統(tǒng)計。借助Excel剔除會議通知等非論文文獻,并通過查檢剔除非相關文獻,最終得到的有效記錄為740條。
1.2 方法:詞頻分析法是常用的文獻計量學方法之一,是利用某一研究領域文獻中的關鍵詞頻次高低來確定該研究領域的研究熱點和研究現(xiàn)狀。關鍵詞是論文的文獻檢索標識,是表達文獻主題概念的自然語言詞匯,能夠簡單、直接、較為全面地概括論文的核心研究內(nèi)容[2]。
共詞分析法是利用某一研究領域文獻中關鍵詞共同出現(xiàn)的情況,來確定該研究領域中各關鍵詞之間的關系[3]。一對關鍵詞在文獻中出現(xiàn)的頻次越高,它們之間的關系越緊密。因此,構(gòu)建出醫(yī)學文獻計量分析期刊論文的高頻關鍵詞共現(xiàn)網(wǎng)絡,其節(jié)點之間的關系就可以反映出該領域主題內(nèi)容的親疏關系,通過分析該共現(xiàn)網(wǎng)絡就能夠得到醫(yī)學文獻計量分析的研究現(xiàn)狀。
本文將在對醫(yī)學文獻計量分析相關的期刊論文進行頻次分析和共詞分析的基礎之上,結(jié)合相關文獻的具體內(nèi)容,總結(jié)該領域的研究現(xiàn)狀。
1.3 應用軟件:應用Bibexcel和Netdraw軟件對數(shù)據(jù)進行處理。
2.1 高頻關鍵詞:利用Bibexcel對醫(yī)學文獻計量分析相關論文的關鍵詞進行統(tǒng)計,得到1673個關鍵詞,將其頻次降序排列,其中頻次不小于十次的高頻關鍵詞見表1。
表1 高頻關鍵詞及詞頻
2.2 高頻關鍵詞共詞網(wǎng)絡:使用Netdraw軟件繪制醫(yī)學文獻分析的共詞網(wǎng)絡,選取共現(xiàn)3次以上的關鍵詞予以顯示,如圖1所示。節(jié)點大小反映與其它節(jié)點的連接次數(shù)的多少,節(jié)點之間連線的粗細反映節(jié)點之間共同出現(xiàn)的頻次,頻次越高表示節(jié)點之間關系越密切。
通過詞頻分析和共詞分析的結(jié)果,結(jié)合醫(yī)學文獻計量分析論文進行內(nèi)容分析,對醫(yī)學文獻計量分析的目的,對象,數(shù)據(jù)來源和分析方法進行討論。
3.1 醫(yī)學文獻計量分析的目的:①期刊評價:利用醫(yī)學文獻計量分析對某一種或一類期刊進行評價,確定該刊的發(fā)展現(xiàn)狀以及在同類期刊中的地位和作用。②個人或機構(gòu)評價:利用文獻計量學方法確定某一領域的核心期刊,高產(chǎn)作者,高產(chǎn)機構(gòu)等。③研究熱點預測:利用醫(yī)學文獻計量分析得到某一研究領域的研究熱點和研究現(xiàn)狀。
3.2 醫(yī)學文獻計量分析的對象:①以某一種或某一類醫(yī)學期刊為對象進行文獻計量分析。②以某一研究領域的文獻為對象進行醫(yī)學文獻計量分析,例如藥物不良反應、艾滋病、中醫(yī)藥、醫(yī)院管理或生物材料等。
3.3 醫(yī)學文獻計量分析的數(shù)據(jù)來源:①SCI(科學引文索引)數(shù)據(jù)庫:SCI(Science Citation Index)是1961年由美國科學信息研究所(ISI)創(chuàng)建的引文數(shù)據(jù)庫,是世界三大科技文獻檢索系統(tǒng)之一,是世界公認的科學統(tǒng)計與評價的重要數(shù)據(jù)來源。②PubMed數(shù)據(jù)庫:PubMed是由美國國立醫(yī)學圖書館開發(fā)的Entrez檢索系統(tǒng)的一部分,是世界公認的最權威的免費的大型醫(yī)學文獻數(shù)據(jù)庫,現(xiàn)有1950年以來的2200多萬篇文獻的記錄,涉及40多個語種,每年增加60余萬條文獻記錄。其中最重要的MEDLINE數(shù)據(jù)庫收錄1966以來的70余個國家5000余種生物醫(yī)學期刊的題錄與文摘。③CBMdisc(中國生物醫(yī)學文獻)數(shù)據(jù)庫:CBMdisc是中國醫(yī)學科學院醫(yī)學信息研究所創(chuàng)建的綜合性醫(yī)學文獻數(shù)據(jù)庫,收錄了1978以來的近1800余種中國期刊,以及匯編、會議論文的文獻題錄700余萬篇,全部題錄均進行主題標引和分類標引等規(guī)范化加工處理,年增文獻40余萬篇[4]。
3.4 醫(yī)學文獻計量分析方法:①載文分析:載文分析一般應用在期刊評價中,是對某一種或一類期刊的載文情況進行分析,主要分析內(nèi)容包括載文量,載文質(zhì)量,參考文獻量,篇均引文率,基金支持情況等等。②著者分析:著者分析的主要分析內(nèi)容包括高產(chǎn)作者,合著情況。高產(chǎn)作者,是指某一研究領域中論文發(fā)表數(shù)量相對很多的少數(shù)幾個著者,這些著者在該領域中非?;钴S,可以認定為該領域的核心領軍人物。隨著科技的飛速發(fā)展,醫(yī)學研究的廣度、深度不斷增加,專業(yè)化程度越來越高,分工越來越精細,一些大型的復雜的科研實驗往往需要不同學科學者的合作,科研合作日趨頻繁。合著情況在一定程度上能夠反映科研合作趨勢,某一研究領域著者合作度越高,表明該領域信息共享和科研合作交往較多,有利于該領域發(fā)展。③引文分析:引文分析是利用各種數(shù)學及統(tǒng)計學的方法和比較、歸納、抽象、概括等邏輯方法,對科學期刊、論文、著者等各種分析對象的引證與被引證現(xiàn)象進行分析,以揭示其數(shù)量特征和內(nèi)在規(guī)律的一種文獻計量分析方法[5]。引文分析是文獻計量學中的應用最為廣泛的方法之一,主要分析內(nèi)容包括引文時間分布,引文量,引文類型,引文語種,被引期刊等等。④統(tǒng)計分析、聚類分析:統(tǒng)計學方法是文獻計量學的最基本的方法之一,聚類分析是統(tǒng)計分析中最常用的降低維數(shù)技術的多元統(tǒng)計方法之一。統(tǒng)計分析法是利用統(tǒng)計、概率的原理對關系中各屬性進行統(tǒng)計分析,從而找出它們之間關系和規(guī)律的一種方法。常用的統(tǒng)計分析法有聚類分析、因子分析、相關分析、多元回歸分析、多維標度分析等。
綜上所述,大型的醫(yī)學權威數(shù)據(jù)庫如PubMed、CBMdisc等的建設,深度全面的文獻歸類,規(guī)范化的主題詞表的標引,使得醫(yī)學文獻計量分析的結(jié)果更加具有權威性、可靠性。隨著大數(shù)據(jù)時代的到來,文獻計量分析方法越來越多樣化,作為一門交叉科學越來越受到各領域?qū)<覍W者的重視。近年來可視化分析法和社會網(wǎng)絡分析方法在情報學中應用廣泛,但在醫(yī)學文獻計量分析中應用還相對比較少,可以預見這些新的方法將為醫(yī)學文獻計量分析開辟更廣闊的發(fā)展空間。
[1]邱均平,文獻計量學,科學技術文獻出版社,1988.12-13.
[2]尹相旭,張更平,李曉菲.基于關鍵詞統(tǒng)計的情報學研究現(xiàn)狀分析[J].情報雜志,2009,28(11):38-41.
[3]李長玲,支嶺,紀雪梅,王效岳.我國情報學研究進展——基于期刊論文關鍵詞的統(tǒng)計分析[J].圖書情報工作,2010(24):35-40.
[4]中國生物醫(yī)學服務文獻系統(tǒng).http://sinomed.imicams.ac.cn/,2013-11-24.
[5]邱均平,信息計量學[M],武漢大學出版社,2007.23.