趙蓉英 吳勝男
(武漢大學(xué)信息管理學(xué)院 湖北武漢 430072)
館藏資源一直是我國圖書情報實(shí)踐領(lǐng)域和教學(xué)科研領(lǐng)域的核心主題之一。對館藏資源研究主題進(jìn)行分析,有助于圖書情報機(jī)構(gòu)更好地了解新信息環(huán)境下館藏資源研究的特點(diǎn)及發(fā)展趨勢,提高圖書館的知識服務(wù)能力和水平以及館藏利用率,從而針對用戶需求提供準(zhǔn)確、有效的知識服務(wù)。為了了解我國圖書情報領(lǐng)域館藏資源研究的主題分布情況和我國館藏資源研究的主要研究主題,本文應(yīng)用共詞分析、層次聚類以及戰(zhàn)略坐標(biāo)的方法,繪制出我國館藏資源研究的主題戰(zhàn)略坐標(biāo)圖,直觀地展示出館藏資源研究各主題的發(fā)展情況以及核心研究內(nèi)容。最后通過對我國館藏資源研究的主題分析,就我國在該領(lǐng)域的研究提供建議,為館藏資源研究的發(fā)展與成熟提供強(qiáng)有力的支撐,這也是本文的研究意義和目的之所在。
本文依托CNKI數(shù)據(jù)庫的中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫、中國學(xué)術(shù)期刊全文數(shù)據(jù)庫以及中國博碩士學(xué)位論文全文數(shù)據(jù)庫,“館藏資源”進(jìn)行主題檢索,共獲得論文4455篇。經(jīng)過數(shù)據(jù)去重之后,共得到相關(guān)論文4365篇。
本文主要采用共詞分析、層次聚類以及戰(zhàn)略坐標(biāo)分析的方法,以檢索到的4365篇論文為數(shù)據(jù)源,利用自編的VBA程序以及SPSS19軟件生成我國館藏資源研究的高頻關(guān)鍵詞矩陣以及主要的關(guān)鍵詞類團(tuán)。通過計算每一類團(tuán)中各關(guān)鍵詞的粘合度值,表達(dá)類團(tuán)中各關(guān)鍵詞對聚類成團(tuán)的貢獻(xiàn)程度,確定每一類團(tuán)的核心概念;同時通過計算不同關(guān)鍵詞類團(tuán)的向心度和密度值,繪制出我國館藏資源研究中不同研究主題的戰(zhàn)略坐標(biāo)圖,描述各研究主題內(nèi)部聯(lián)系情況和主題間相互影響的情況。
本文以檢索到的與館藏資源相關(guān)的論文為數(shù)據(jù)源,套錄每一篇文獻(xiàn)的關(guān)鍵詞,統(tǒng)計各關(guān)鍵詞的詞頻,考慮到多數(shù)關(guān)鍵詞出現(xiàn)的頻次較低,從而導(dǎo)致共現(xiàn)的頻次也低,而且過于零散的詞頻分析結(jié)果無法深入的展示出各研究主題的產(chǎn)生演變情況以及主題間的交叉融合情況,從而阻礙了對于某一研究總體研究趨勢的把握。因此本文截取了前98個、頻次大于20的高頻關(guān)鍵詞作為本文的研究對象(見表 1)。
表1 我國館藏資源研究高頻詞列表(頻次大于20)
在得到我國館藏資源研究的高頻關(guān)鍵詞列表后,本文利用自編的VBA程序,統(tǒng)計其共現(xiàn)關(guān)系,生成了高頻關(guān)鍵詞的共現(xiàn)矩陣。但是這種共現(xiàn)矩陣所反映出來的關(guān)鍵詞之間的關(guān)聯(lián)只是一種表象,因?yàn)閮蓚€關(guān)鍵詞共現(xiàn)頻次的多少直接受到各自詞頻大小的影響。為了真正揭示關(guān)鍵詞之間的共現(xiàn)關(guān)系,本文引入了表現(xiàn)關(guān)鍵詞共現(xiàn)相對強(qiáng)度的指標(biāo)——Salton指數(shù)。
Salton指數(shù)的計算公式為:
其中n和n分別表示關(guān)鍵詞i、j出現(xiàn)的頻次,n表示關(guān)鍵詞 i與 j共現(xiàn)的頻次。
利用Salton指數(shù),本文得到了我國館藏資源研究高頻關(guān)鍵詞之間的相對共現(xiàn)強(qiáng)度矩陣(見表2)。
將上述矩陣輸入到SPSS 19軟件中,對其進(jìn)行聚類分析,發(fā)掘關(guān)鍵詞矩陣中關(guān)聯(lián)強(qiáng)度大的主要詞群,從而揭示出我國館藏資源研究的主流領(lǐng)域。在聚類的過程中,聚類方法主要選用層次聚類法,其原理是先將所有n個變量看成不同的n類,然后將性質(zhì)最接近的兩類合并為一類;再從n-1類中找到最接近的兩類加以合并,依此類推,直到所有的變量被合并為一個大類。類內(nèi)部個體特征之間具有相似性,不同類間個體特征的差異性較大。聚類標(biāo)準(zhǔn)采用歐式距離平方,并選用Z分?jǐn)?shù)對矩陣中的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化的處理。最后得到我國館藏資源研究高頻關(guān)鍵詞共現(xiàn)聚類樹圖。根據(jù)聚類結(jié)果,同時參考相關(guān)的文獻(xiàn),本文最終將我國館藏資源研究的高頻關(guān)鍵詞聚為17類。
上述得到的高頻關(guān)鍵詞聚類結(jié)果,是通過詞間距離的遠(yuǎn)近而形成的類團(tuán)。這些類團(tuán)只能顯示出哪些關(guān)鍵詞之間的關(guān)聯(lián)較強(qiáng),而對于這些類團(tuán)的中心概念卻無從得知。為了對各類團(tuán)的主題進(jìn)行正確的分析,本文引入了鐘偉金等學(xué)者提出的粘合力思想,用以衡量類團(tuán)內(nèi)各主題詞對聚類成團(tuán)的貢獻(xiàn)程度,表達(dá)每個主題在類團(tuán)的聚集過程中所起作用的程度。在類團(tuán)中,粘合力最大的詞稱為中心詞,中心詞在確定類團(tuán)的名稱與性質(zhì)中起至關(guān)重要的影響,能夠表征某一類團(tuán)的核心概念。計算公式為:
其中 N(A)表示關(guān)鍵詞 Ai的粘合度,F(xiàn)(A→B)表示關(guān)鍵詞A與同一類團(tuán)其余關(guān)鍵詞的共現(xiàn)頻次。根據(jù)上述公式,本文計算出了17個類團(tuán)中每一個關(guān)鍵詞的粘合度值,并以此為基礎(chǔ),對17個類團(tuán)進(jìn)行主題分析。因?yàn)槠南拗疲疚闹涣信e出子類團(tuán)1的關(guān)鍵詞粘合度計算結(jié)果(見表3),其余的類團(tuán)只列出其主題分析結(jié)果。
表3 我國館藏資源研究子類團(tuán)中關(guān)鍵詞粘合度值列表
從列舉的各關(guān)鍵詞的粘合度值可以判斷出,這個類團(tuán)所研究的主要內(nèi)容是館藏的電子期刊資源利用、整合以及利用率的評價。按照以上方法,其余類團(tuán)的主題分析結(jié)果如下所示:
類團(tuán)2:各類型圖書館網(wǎng)絡(luò)數(shù)字資源共享建設(shè)以及開發(fā)利用;類團(tuán)3:基于用戶需求的館藏資源建設(shè)以及開放存?。活悎F(tuán)4:公共圖書館館藏文獻(xiàn)資源建設(shè)發(fā)展;類團(tuán)5:圖書館信息服務(wù)、讀者服務(wù)以及管理創(chuàng)新;類團(tuán)6:高職院校圖書館基于教育職能的圖書館建設(shè);類團(tuán)7:檔案館館藏資源建設(shè);類團(tuán)8:基于讀者需求的醫(yī)院圖書館工作以及讀者服務(wù)模式與質(zhì)量研究;類團(tuán)9:開架借閱對大學(xué)生素質(zhì)教育的影響;類團(tuán)10:知識經(jīng)濟(jì)時代下的圖書館資源與服務(wù);類團(tuán)11:各類型圖書館虛擬館藏文獻(xiàn)資源的共建共享;類團(tuán)12:學(xué)校圖書館學(xué)科館員的參考咨詢;類團(tuán)13:各類型圖書館的藏書建設(shè);類團(tuán)14:館藏資源的數(shù)字化、網(wǎng)絡(luò)化以及信息自動化建設(shè);類團(tuán)15:信息時代館藏資源的知識管理研究;類團(tuán)16:基于讀者需求調(diào)查的個性化服務(wù)研究;類團(tuán)17:館藏資源的知識產(chǎn)權(quán)研究。
本文將館藏資源研究的高頻關(guān)鍵詞進(jìn)行共現(xiàn)、聚類以及粘合力指標(biāo)的計算后,得到了我國館藏資源研究的主題,粘合力的計算進(jìn)一步確定了館藏資源研究的具體主題內(nèi)容。但問題也隨之出現(xiàn),即共詞聚類分析以及粘合力指標(biāo)的運(yùn)用只有助于了解某研究領(lǐng)域內(nèi)具體的研究主題,然而各研究主題的發(fā)展?fàn)顩r以及成熟度卻無法揭示,同時對于不同主題之間的關(guān)系以及該研究領(lǐng)域內(nèi)核心研究主題的確定也無從了解。因此,為了考察我國館藏資源研究領(lǐng)域不同研究主題的研究地位以及發(fā)展?jié)摿?,本文引入了?zhàn)略坐標(biāo)這一概念。
戰(zhàn)略坐標(biāo)是LAW在1988年提出的,用來描述某一研究領(lǐng)域內(nèi)部聯(lián)系情況以及領(lǐng)域間的相互影響情況。在戰(zhàn)略坐標(biāo)地圖中,有兩個非常重要的指標(biāo)——密度與向心度來衡量某一研究領(lǐng)域各主題類團(tuán)的內(nèi)部發(fā)展?fàn)顩r以及主題類團(tuán)間的相互影響狀況。
密度是一種用來衡量主題類團(tuán)內(nèi)部關(guān)聯(lián)強(qiáng)度的指標(biāo),它表示該主題類團(tuán)維持和發(fā)展自己的能力。類團(tuán)密度有很多種計算公式,可以用本主題類團(tuán)內(nèi)所有關(guān)鍵詞間兩兩共現(xiàn)頻次總和的均值、中位數(shù)或者平方和來表示。由前文介紹的粘合力指標(biāo)得知,粘合力是用來表示主題聚類類團(tuán)中各個關(guān)鍵詞的重要程度,而密度是對類團(tuán)內(nèi)部聯(lián)系的緊密程度的表示,因此從概念上來看,二者有著十分密切的聯(lián)系。有學(xué)者也在研究中表明,類團(tuán)密度的計算公式可以用粘合力來表示,具體的表示方法如下:
向心度用來衡量一個類團(tuán)與同一研究領(lǐng)域的其它類團(tuán)聯(lián)系的緊密程度。向心度越大,說明某一研究領(lǐng)域的一個主題類團(tuán)與其它主題類團(tuán)有著緊密的聯(lián)系,因此該主題在這一研究領(lǐng)域中就占據(jù)核心地位。向心度的計算可以用某一類團(tuán)中關(guān)鍵詞與其余類團(tuán)中的關(guān)鍵詞兩兩出現(xiàn)頻次的總和,平方和或者平方根來表示。類團(tuán)內(nèi)關(guān)鍵詞數(shù)量的多少對于類團(tuán)的向心度的影響很大,因此本文對于向心度的計算方法進(jìn)行了改良,即將用某一類團(tuán)中關(guān)鍵詞與其余類團(tuán)中的關(guān)鍵詞兩兩出現(xiàn)頻次的總和除以該類團(tuán)內(nèi)的關(guān)鍵詞總數(shù),從而解決了這一影響。
表2 我國館藏資源研究高頻關(guān)鍵詞共現(xiàn)的Salton指數(shù)矩陣(部分)
綜上對于密度以及向心度的表述,本文計算出了我國館藏資源研究領(lǐng)域各主題類團(tuán)的向心度以及密度 (見表 4)。
表4 我國館藏資源研究領(lǐng)域各個主題類團(tuán)密度以及向心度值列表
戰(zhàn)略坐標(biāo)圖以向心度和密度為參數(shù)繪制成的二維坐標(biāo)圖,其典型結(jié)構(gòu)是橫軸表示向心度,縱軸表示密度,坐標(biāo)的原點(diǎn)在兩個軸的中位數(shù)或者平均數(shù)。這個地圖將每一個二維空間的題目領(lǐng)域劃分為4個象限,可以用來描述各主題的研究發(fā)展?fàn)顩r。按照上述繪制主題戰(zhàn)略坐標(biāo)圖的方法,本文繪制出了我國館藏資源研究的主題戰(zhàn)略坐標(biāo)圖(見圖 1)。
圖1 我國館藏資源研究主題戰(zhàn)略坐標(biāo)圖
從圖中可以清晰地發(fā)現(xiàn),沿著X軸方向,向心度值越大,在戰(zhàn)略坐標(biāo)圖中,主題類團(tuán)所在的位置越偏右,向心度越大,這說明了該主題類團(tuán)與其它主題類團(tuán)關(guān)聯(lián)十分緊密,具體則表現(xiàn)為這種主題類團(tuán)中的關(guān)鍵詞與其它主題類團(tuán)中的關(guān)鍵詞能形成搭配在同一篇文獻(xiàn)中出現(xiàn),即兩個主題類團(tuán)中的關(guān)鍵詞共現(xiàn)頻度較高。這些都充分說明了該主題類團(tuán)在所屬領(lǐng)域占有重要地位,是其領(lǐng)域內(nèi)的核心主題或者關(guān)注熱點(diǎn),具有強(qiáng)大的生命力,不易消失。沿著Y軸方向,密度值越大,在戰(zhàn)略坐標(biāo)圖中,主題類團(tuán)所在的位置越偏上,密度越大,這說明該主題類團(tuán)內(nèi)部的關(guān)鍵詞聯(lián)系非常緊密,在所屬領(lǐng)域中該主題研究已經(jīng)趨向成熟。同時本文以向心度以及密度平均值的相交點(diǎn)(0.86,0.32)作為坐標(biāo)原點(diǎn),將整個戰(zhàn)略坐標(biāo)圖分為四個象限。下面對處于四個象限中的主題類團(tuán)分別作具體分析。
類團(tuán)17所代表的研究主題 “館藏資源知識產(chǎn)權(quán)研究”位于戰(zhàn)略坐標(biāo)圖的第一象限,擁有的密度與向心度值都很高,這表明此研究主題不僅內(nèi)部關(guān)聯(lián)緊密,而且與其它研究主題也存在著較強(qiáng)的聯(lián)系。這種情況說明了兩個問題,一是該象限的主題類團(tuán)是所屬學(xué)科的重要研究內(nèi)容以及研究熱點(diǎn);二是主題類團(tuán)中的關(guān)鍵詞是所屬學(xué)科研究的活躍主題,受到關(guān)注也很多,且與其余主題研究關(guān)聯(lián)密切。
戰(zhàn)略坐標(biāo)圖第二象限中的類團(tuán)2所代表的各類型圖書館網(wǎng)絡(luò)數(shù)字資源共享建設(shè)以及開發(fā)利用研究主題以及類團(tuán)7所代表的檔案館館藏資源建設(shè)研究主題密度值很高,向心度值卻較低。這表明這些研究主題內(nèi)部關(guān)聯(lián)緊密,已經(jīng)自成一體被很好地研究過,形成了相對獨(dú)立的研究領(lǐng)域,但是這些研究主題與其他研究主題聯(lián)系不是十分密切,在學(xué)科表現(xiàn)不活躍,生命力不太頑強(qiáng),因此這些主題發(fā)展到一定規(guī)模后,可能會由于沒有有效的提升動力而慢慢消失。
處于密度以及向心度都較低的第三象限的主題類團(tuán)有類團(tuán) 1、類團(tuán)5、類團(tuán)6、類團(tuán)9、類團(tuán) 10以及類團(tuán) 12,它們分別代表的館藏的電子期刊資源利用、整合以及利用率的評價、圖書館信息服務(wù)、讀者服務(wù)以及管理創(chuàng)新、高職院校圖書館基于教育職能的圖書館建設(shè)、開架借閱對大學(xué)生素質(zhì)教育的影響、知識經(jīng)濟(jì)時代下的圖書館資源與服務(wù)、以及學(xué)校圖書館學(xué)科館員的參考咨詢;這些研究主題內(nèi)部結(jié)構(gòu)松散,與其他的研究主題聯(lián)系不密切,屬于所在研究領(lǐng)域關(guān)注較少的邊緣研究領(lǐng)域,研究尚不成熟,有待于進(jìn)一步發(fā)展。
戰(zhàn)略坐標(biāo)圖第四象限中的主題類團(tuán) 3、4、8、11、13、14、15、16的向心度很高,說明這些主題類團(tuán)與其它主題類團(tuán)的聯(lián)系緊密,在所屬研究領(lǐng)域表現(xiàn)活躍,是其它主題類團(tuán)重視的研究主題,但是自身內(nèi)部結(jié)構(gòu)松散,發(fā)展不夠成熟。在后續(xù)研究的發(fā)展中,由于研究主題分散容易演化成相關(guān)主題。因此總體來說,這類研究主題具有一定的發(fā)展?jié)摿?,但是由于自身?lián)系不緊密,結(jié)構(gòu)不穩(wěn)定,易分解。
通過上述對于我國館藏資源研究的主題分析,可以發(fā)現(xiàn)我國館藏資源研究雖然取得了一定的成果,但是仍然有很大的發(fā)展空間。位于戰(zhàn)略坐標(biāo)圖四個象限中的研究主題為了取得后續(xù)的發(fā)展,都需要進(jìn)行一定程度的努力,而努力的最終目標(biāo)就是向著第一象限前進(jìn),成為所屬領(lǐng)域的研究熱點(diǎn)和活躍主題。為此,本文提出了以下建議:
⑴館藏資源的知識產(chǎn)權(quán)研究想獲得發(fā)展要做到研究上的“深”與“廣”。眾所周知,事物的發(fā)展是一個循環(huán)往復(fù),不斷上升的過程,有著特定的生命周期規(guī)律。由于受到社會需求、技術(shù)發(fā)展等多種因素的影響,某些反映某一領(lǐng)域研究熱點(diǎn)以及核心內(nèi)容的研究主題可能會被其它新的研究熱點(diǎn)以及主題所代替。所以,位于戰(zhàn)略坐標(biāo)圖第一象限的研究主題——館藏資源知識產(chǎn)權(quán)研究是目前館藏資源研究領(lǐng)域發(fā)展成熟度與活躍度都很高的研究主題,為了保持住其研究地位,要在研究上做到“深”與“廣”這兩方面。從研究深度上來說,該研究主題要做更深層次的研究,使其發(fā)展的更加成熟,內(nèi)部結(jié)構(gòu)更加穩(wěn)定;從研究廣度上來說,該研究主題要注重與其它研究主題的聯(lián)合,從而形成更廣泛的研究,推動該研究主題更上一個層次,從而拓寬其所屬領(lǐng)域的研究視野。
⑵對于圖書館、檔案館館藏資源的共建共享研究要注重研究范圍的拓展。圖書館、檔案館館藏資源的共建共享等主題位于戰(zhàn)略坐標(biāo)第二象限,對于此類主題的研究目前已經(jīng)相對成熟且獨(dú)立,因此這些研究主題為了獲得新的發(fā)展,就需要有效的提升動力。此類研究主題需要拓寬研究范圍,尋找與其它主題合適的契合點(diǎn),從而形成新的知識研究點(diǎn),為此類主題的研究注入新鮮的血液,從而促進(jìn)該主題領(lǐng)域的發(fā)展。
⑶位于第三象限的研究主題可以作為館藏資源研究新的研究思路和研究方向。存在于戰(zhàn)略坐標(biāo)第三象限的研究主題包括館藏電子資源的研究,高職院校圖書館基于教育職能的館藏建設(shè),以及在當(dāng)今時代背景下的圖書館服務(wù)研究等等,從發(fā)展?fàn)顩r上來看,這些主題內(nèi)部結(jié)構(gòu)松散,研究尚不成熟;但是從研究內(nèi)容上來看,這些主題均是館藏資源研究結(jié)合當(dāng)今的時代背景、研究主題以及社會需求發(fā)展起來的新興研究主題,它們可以作為館藏資源研究新的發(fā)展方向,為館藏資源的研究發(fā)展提供借鑒和思考。因此該類研究主題為了取得進(jìn)一步的發(fā)展,一方面要加強(qiáng)自身的理論研究,夯實(shí)研究基礎(chǔ),為后續(xù)研究發(fā)展做鋪墊;另一方面要抓住時機(jī),尋找與發(fā)展成熟的研究主題完美的結(jié)合點(diǎn),成為館藏資源研究新的發(fā)展思路與研究方向。
⑷館藏資源的開放存取、知識管理、虛擬館藏以及信息化建設(shè)等研究要提高主題的一致性。第四象限的研究主題多而分散,包括了館藏資源的開放存取、知識管理、虛擬館藏以及信息化等主題。經(jīng)過分析發(fā)現(xiàn),這些主題大多都是館藏資源研究與其他領(lǐng)域通過結(jié)合而形成的研究主題,研究的新穎性強(qiáng)。但是這些主題也存在著致命的弱點(diǎn),即內(nèi)部聯(lián)系不緊密,易分裂分化相關(guān)主題。為了克服這一缺點(diǎn),這些研究主題在研究的過程中要注意主題一致性,尋找研究主題的共性,將所有研究圍繞這一共性去展開,使主題內(nèi)部形成穩(wěn)定的結(jié)構(gòu),從而促進(jìn)該類研究主題的發(fā)展成熟。
本文系統(tǒng)的分析了我國館藏資源研究的主題分布情況以及發(fā)展?fàn)顩r,但是由于本文分析的數(shù)據(jù)源僅限于學(xué)術(shù)論文,沒有統(tǒng)計專著、研究報告等其它類型的數(shù)據(jù),此外由于檢索策略以及共詞分析固有的缺陷,本文中的分析難免有片面或者疏漏的地方。在后續(xù)研究中,筆者將致力于改善這一狀況,以便更全面客觀地反映館藏資源研究的發(fā)展?fàn)顩r。
[1]梁立明等.科學(xué)計量學(xué):理論探索與案例研究[M].北京:科學(xué)出版社,2006.
[2]楊穎,崔雷.基于共詞分析的學(xué)科結(jié)構(gòu)可視化表達(dá)方法的探討[J].現(xiàn)代情報,2011,(1):92-96
[3]鐘偉金,李佳.共詞分析方法研究(二)[J].情報雜志,2008,(6):141-143.
[4]馮路,冷伏海.共詞分析方法理論進(jìn)展[J].中國圖書館學(xué)報,2006,(2):88-92.