〔摘 要〕文章介紹了一種新的適用于計(jì)算機(jī)的引文檢索和引文分析的方法——關(guān)系矩陣法,這種方法能更快速更方便地進(jìn)行引文分析和引文檢索,并具有更強(qiáng)大的功能,例如計(jì)算文獻(xiàn)的耦合單位。
〔關(guān)鍵詞〕關(guān)系矩陣;引文索引;引文分析
DOI:10.3969/j.issn.1008-0821.2010.10.041
〔中圖分類號(hào)〕G254.36 〔文獻(xiàn)標(biāo)識(shí)碼〕B 〔文章編號(hào)〕1008-0821(2010)10-0153-02
To compile Citation Index and Analyse Citation With Relationship MatrixWang Xiaofen1 Deng Dongning2 Zou Xiaoshun3 Xiao Xia1
(1.Library,Wuhan Sports University,Wuhan 430000,China;
2.Library,Zhongnan University of Economics and Law,Changsha 410000,China;
3.Library,Wuhan University of Science and Technology,Wuhan 430000,China)
〔Abstract〕The paper introduced the new algorithm of compiling citation index,it could be used in citation retrielval and citation analysis quicklier and conveniantlier.The algorithm also have more fuctions,such as counting the coupling number between papers.
〔Keywords〕relationship matrix;citation index;citation analysis
引文索引是從被引用文獻(xiàn)檢索引用文獻(xiàn)的索引(當(dāng)然,我們也可以引用文獻(xiàn)檢索被引用文獻(xiàn))。兩篇文獻(xiàn)具有引用與被引用的關(guān)系,那么它們的內(nèi)容之間一般都具有某種聯(lián)系;在科技文獻(xiàn)中,這種聯(lián)系更加密切。另外,如果兩篇文獻(xiàn)引用了同一篇文獻(xiàn),那么這兩篇文獻(xiàn)的內(nèi)容或多或少也有聯(lián)系,不過(guò)這種聯(lián)系一般不像直接的引用和被引用關(guān)系那樣強(qiáng)烈。情報(bào)人員用這種聯(lián)系定量地描述文獻(xiàn)之間的相關(guān)關(guān)系:如果兩篇文獻(xiàn)共同引用了一篇文獻(xiàn),稱這兩篇文獻(xiàn)具有一個(gè)“耦合單位”,耦合單位越多,說(shuō)明兩篇文獻(xiàn)的相關(guān)性越強(qiáng)。美國(guó)的《科學(xué)引文索引》(SCI)和《社會(huì)科學(xué)引文索引》(SSCI)這兩種著名的引文索引正廣泛地應(yīng)用于我國(guó)的學(xué)術(shù)界。
人們常常利用引文索引進(jìn)行“滾雪球”式的檢索:從一篇文獻(xiàn)出發(fā),找出引用它的所有文獻(xiàn);再?gòu)臋z索出的文獻(xiàn)出發(fā),找出引用它們的所有文獻(xiàn),……以此類推。這樣做雖然檢全率低,,但對(duì)于追溯一個(gè)科學(xué)家、一個(gè)課題產(chǎn)生的歷史淵源和學(xué)術(shù)思想的形成有著特殊的功用,因此引文索引正廣泛的應(yīng)用于科學(xué)評(píng)價(jià)的領(lǐng)域。
顯然,所謂“滾雪球”式的檢索正是把引用與被引用關(guān)系當(dāng)作一種傳遞關(guān)系來(lái)對(duì)待的,因此我們很自然地聯(lián)想到用關(guān)系矩陣來(lái)進(jìn)行這種“滾雪球”式的檢索,因?yàn)橛镁仃囘\(yùn)算求間接的引用關(guān)系畢竟要方便得多。
首先介紹一下關(guān)系矩陣。
在一個(gè)有n個(gè)元素A1,A2,…,AN的集合Q中,如果任意兩個(gè)元素Ai,Aj之間具有R關(guān)系,那么我們可以用下面矩陣S表示它們之間的關(guān)系:
S=a11a12…a1n
a21a22…a2n
…………
an1an2…ann
令S中各元{aij=1,當(dāng)Ai和Aj具有直接的R關(guān)系,
否則aij=0
則稱S為集合Q的R關(guān)系矩陣。
通過(guò)下面例子,我們可以發(fā)現(xiàn)用關(guān)系矩陣進(jìn)行引文檢索可以非常方便快速地進(jìn)行引文檢索,同時(shí)還可以得到一個(gè)副產(chǎn)品,就是兩篇文獻(xiàn)的耦合度很容易在關(guān)系矩陣中看出來(lái)。
例:已知文獻(xiàn)A被文獻(xiàn)B、C、I引用,文獻(xiàn)B被D、F引用,C被E、F、G、H、I引用,E被G、H、I引用,求:(1)與A相關(guān)的所有文獻(xiàn);(2)A、B、C、D、E、F、G、H、I 9篇文獻(xiàn)中,哪兩篇文獻(xiàn)的耦合度最大(最小),因而它們的相關(guān)程度最大(最小)。
由A、B、C、D、E、F、G、H、I之間的被引用關(guān)系可列出它們的“被引用”關(guān)系矩陣S(當(dāng)然也可列出“引用”關(guān)系矩陣),其中各元按各文獻(xiàn)發(fā)表時(shí)間的先后順序排列。
用關(guān)系矩陣編引文索引和進(jìn)行引文分析Oct.,2010Vol.30 No.10
ABCDEFGHI
S=A
B
C
D
E
F
G
H
I011000001
000101000
000011111
000000000
000000111
000000000
000000000
000000000
000000000
由S,可以看出引用關(guān)系矩陣是上三角矩陣,因?yàn)橐梦墨I(xiàn)發(fā)表的時(shí)間一定遲于被引用文獻(xiàn)發(fā)表的時(shí)間。
由S+S2(S2=S×S,邏輯乘)可以看出,文獻(xiàn)A的引用相關(guān)文獻(xiàn)是B、C、D、E、F、G、H、I,因此我們要了解由A文獻(xiàn)產(chǎn)生的學(xué)術(shù)思想的發(fā)展?fàn)顩r,可以從B、C、D、E、F、G、H、I等文獻(xiàn)中尋找線索。同樣,由S+S2可知C的引用相關(guān)文獻(xiàn)是E、F、G、H、I,E的引用相關(guān)文獻(xiàn)是G、H、I。
由S矩陣求任意兩篇文獻(xiàn)的耦合度顯然是很容易的。從左到右,S的行顯示的是“被引用”關(guān)系;因此從上到下,S的列顯示的就是“引用”關(guān)系。我們?nèi)我獗容^兩行(如i和k行)的第j個(gè)元(j=1,2,…,n),若有一對(duì)同時(shí)為1,就表示第i篇文獻(xiàn)和第i篇文獻(xiàn)有一個(gè)耦合單位,兩篇文獻(xiàn)的總的耦合單位A可由下面公式求得:
A=∑nj=1Si,j#8226;Sk,j,n是S的維數(shù),即文獻(xiàn)的篇數(shù)。
在S矩陣中很容易求出A、B、C、D、E、F、G、H、I兩兩之間的耦合度。顯然G、H、I兩兩之間的耦合度最大,都是2,其次是F、G、D等,耦合度為1,最低的為0,即兩篇文獻(xiàn)沒(méi)有共同的引文。
如果把文獻(xiàn)-屬性相關(guān)矩陣C(見(jiàn)鄧珞華教授于《情報(bào)學(xué)報(bào)》2003年2期上發(fā)表的“概念空間——定義、意義與局限”一文)引進(jìn)來(lái),引文關(guān)系矩陣的功用就更多了:我們用引文關(guān)系矩陣S與文獻(xiàn)-屬性相關(guān)矩陣C相乘得到一個(gè)新矩陣R=SC,那么R(ij)=a就表示第i篇文獻(xiàn)的引文中有a篇是用第j個(gè)主題詞標(biāo)引的。此外S與它的轉(zhuǎn)置矩陣S的乘積Z=S#8226;S的元Z(ij)表示第i篇文獻(xiàn)和第j篇文獻(xiàn)都引用了的文獻(xiàn)的數(shù)目,而S×S=Y的元Y(ij)?jiǎng)t表示既引用了第i篇文獻(xiàn)又引用了第j篇文獻(xiàn)的文獻(xiàn)數(shù)目。
參考文獻(xiàn)
[1]鄧珞華.信息檢索系統(tǒng)數(shù)學(xué)模型的理論及其評(píng)價(jià)[J].大學(xué)圖書(shū)館學(xué)報(bào),2002,(1):6-13.
[2]夏淑萍,鄧珞華.計(jì)算機(jī)信息檢索[M].武漢大學(xué)出版社,2005.
[3]鄧珞華.用矩陣編機(jī)內(nèi)主題詞典[J].計(jì)算機(jī)與圖書(shū)館,1982,(2-3).
[4]G.Salton.Mathematics and information retrieval,Journal of Documentation,1979,35(1):1-29.
[5]鄧珞華.用關(guān)系矩陣顯示概念之間的關(guān)系[J].情報(bào)學(xué)報(bào),1983,(1).
[6]鄧珞華,孫清蘭,范并思.圖書(shū)情報(bào)數(shù)學(xué)[M].長(zhǎng)春:東北師范大學(xué)出版社,1983,(8).