早期引文擴散深廣度對論文后期擴散強度的影響

2025-05-01 00:00:00馮小東羅簡凡

現(xiàn)代情報 2025年5期

摘要：［目的／意義］梳理并界定引文擴散深度與廣度概念，探究論文發(fā)表早期引文擴散深度與廣度特征對后期擴散強度的影響，以豐富對論文早期被引特征與后期被引關(guān)聯(lián)機制的解釋。［方法／過程］采集５０個學(xué)科類別各３本期刊于２０１３年發(fā)表的論文題錄數(shù)據(jù)及其早期施引文獻題錄數(shù)據(jù)，構(gòu)建目標(biāo)論文的早期個體引文網(wǎng)絡(luò)；定義引文擴散深度為引文平均級聯(lián)深度，基于布里淵指數(shù)從學(xué)科廣度、地域廣度和作者廣度３個維度定義引文擴散廣度；使用負二項回歸模型和雙重機器學(xué)習(xí)（ＤＤＭＬ）方法對早期引文擴散深度和廣度對論文后期擴散強度的影響關(guān)系進行分析。［結(jié)果／結(jié)論］早期引文擴散深度在２年和３年引文窗口下均表現(xiàn)出了對后期擴散強度的顯著負向影響，而早期引文擴散學(xué)科廣度在兩個引文窗口下均表現(xiàn)出對后期擴散強度的正向影響；地域廣度在２年引文窗口下表現(xiàn)出對論文后期擴散強度的正向影響，在３年引文窗口下則未表現(xiàn)出顯著性；早期引文擴散作者廣度對于低被引論文組表現(xiàn)出與論文后期擴散強度的顯著正向關(guān)系，但對于高被引論文組則為負向影響關(guān)系。

關(guān)鍵詞：引文擴散；擴散深度；擴散廣度；擴散強度；個體引文網(wǎng)絡(luò)

ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１００８－０８２１．２０２５．０５．０１２

〔中圖分類號〕Ｇ２５０. ２５２〔文獻標(biāo)識碼〕Ａ〔文章編號〕１００８－０８２１（２０２５）０５－０１２６－１３

知識擴散可被定義為科學(xué)出版物和專利中所記錄知識的改變與應(yīng)用［１］，這一過程不僅包括原有知識向外傳播，還包括接收方吸收知識并與自身知識結(jié)合產(chǎn)生新知識的過程［２］。因此，文獻之間的引證關(guān)系被認為是科學(xué)知識擴散的重要形式之一，基于科學(xué)論文引證關(guān)系的引文擴散研究是知識擴散領(lǐng)域的重要研究子域，而引文擴散效果及其影響因素研究是其下一重要主題。關(guān)于引文擴散效果的測度，研究中提出了強度、速度和廣度３個主要測量維度，其中，擴散強度從擴散次數(shù)的角度對知識擴散進行描述，能夠通過被引頻次直觀地反映擴散效果，其背后的影響因素得到了大量研究的探討［３］。關(guān)于單篇論文擴散強度影響因素，目前學(xué)界主要關(guān)注論文內(nèi)容因素（如創(chuàng)新性［４］、跨學(xué)科性［５］）、論文形式因素（如標(biāo)題特征［６－７］、圖表使用情況［８］、論文篇幅［９］）、期刊因素（如期刊影響力［１０］）、作者因素（如科研合作情況［１１］、作者資歷與聲譽［１２］）等一系列基于論文內(nèi)、外部特征的因素。此外，亦有學(xué)者聚焦論文早期知識擴散特征，研究指出，早期擴散強度［１３］及速度［１４］與論文后續(xù)擴散強度存在顯著正相關(guān)關(guān)系，表明早期形成的被引優(yōu)勢能夠促進論文后期知識擴散；早期引文與目標(biāo)文獻的知識關(guān)聯(lián)也是能夠影響后期擴散的重要因素［１５］。

探究論文早期知識擴散特征與后續(xù)擴散情況的關(guān)聯(lián)關(guān)系，一方面可在理論層面豐富完善論文知識擴散的動態(tài)機制；另一方面可以輔助論文影響力的早期預(yù)測以及早期學(xué)術(shù)影響評估體系的構(gòu)建與完善，具有十分重要的學(xué)術(shù)與實踐意義。然而，就目前的相關(guān)研究而言，僅基于引文的早期擴散強度和速度兩個指標(biāo)難以反映知識擴散背后的不同過程及范圍等更深入的效果，關(guān)于早期引文擴散效果對后期擴散強度的作用機制的揭示尚不夠充分。例如，早期引文在相近引文數(shù)量（擴散強度）的擴散強度或速度作用下，可能呈現(xiàn)截然不同的引文網(wǎng)絡(luò)結(jié)構(gòu)及引文文獻的學(xué)科分布特征等擴散過程及范圍差異，能在一定程度上反映出目標(biāo)文獻未來不同的擴散潛力。因此，引入能夠反映更深層次早期知識擴散效果的維度指標(biāo)，進一步探究論文早期知識擴散效果對后續(xù)擴散強度的影響，對于進一步完善知識擴散機制具有重要意義，同時也能夠為早期預(yù)測與識別較高影響力的文獻、完善早期學(xué)術(shù)評估體系提供新的客觀依據(jù)。

早期引文擴散的深度和廣度特征能夠在引文擴散強度的基礎(chǔ)上進一步測量已有引文擴散過程的差異特征，在一定程度上能夠增強對未來擴散范圍的解釋和預(yù)測。引文擴散深度指論文發(fā)表后經(jīng)逐層引用形成的級聯(lián)次數(shù)［１６］，能夠反映論文知識擴散的路徑結(jié)構(gòu)特征，并一定程度上彰顯論文的傳播“感染”能力；引文擴散廣度則反映論文的知識擴散輻射范圍，體現(xiàn)論文在學(xué)術(shù)界的“能見度”，從這兩個維度解析論文早期知識擴散的特征，能夠深層而多維地揭示早期知識擴散特征對后續(xù)擴散能力的作用機制。

因此，本研究基于論文個體引文網(wǎng)絡(luò)（個體引文網(wǎng)絡(luò)的具體內(nèi)涵見２. ２. １），聚焦早期引文擴散深度與廣度特征，探究其對論文后續(xù)擴散強度的作用：首先，對已有研究進行梳理，對擴散深度和廣度進行界定與測度的操作化；其次，構(gòu)建目標(biāo)論文的個體引文網(wǎng)絡(luò)，并計算變量測度指標(biāo)；最后，基于多學(xué)科的論文采樣數(shù)據(jù)，采用負二項回歸模型探究早期引文擴散深度和廣度與目標(biāo)論文后續(xù)擴散強度的關(guān)聯(lián)情況，并利用雙重機器學(xué)習(xí)（Ｄｏｕｂｌｅ／ＤｅｂｉａｓｅｄＭａｃｈｉｎｅＬｅａｒｎｉｎｇ，ＤＤＭＬ）方法盡可能消除早期引文擴散強度等其他特征帶來的混淆變量干擾，檢驗早期引文擴散深廣度對后續(xù)引文擴散強度的穩(wěn)健因果影響關(guān)系。

１文獻綜述

１. １論文早期知識擴散與后續(xù)擴散的關(guān)聯(lián)

論文在發(fā)表初期獲得的引用是學(xué)界對新知識的快速反饋，能夠反映知識的早期擴散情況。許多研究表明，論文的早期引文擴散特征對后續(xù)擴散強度存在顯著的影響［１５，１７］。相關(guān)研究大致可分為兩類：一是關(guān)注早期引文擴散強度（早期被引頻次）的影響，如ＡｄａｍｓＪ等［１３］對６個學(xué)科領(lǐng)域文獻的被引情況分析發(fā)現(xiàn)，前兩年被引量與后續(xù)７年被引量呈高度相關(guān)；ＡｂｒａｍｏＧ等［１８］使用早期被引量和期刊影響因子兩個指標(biāo)預(yù)測論文發(fā)表９年后的被引量，發(fā)現(xiàn)隨著引文窗口的增加，回歸模型的擬合優(yōu)度以及早期被引量的回歸系數(shù)均出現(xiàn)明顯增長，且發(fā)表３年后的被引量已能夠較為準(zhǔn)確地對長期被引進行預(yù)測。二是關(guān)注早期引文擴散速度（初次被引時間）的影響，如ＹｕＴ等［１４］研究發(fā)現(xiàn)，論文的初次被引年齡是影響其長期被引的重要因素之一；ＨｉｌｍｅｒＣＥ等［１９］則對農(nóng)業(yè)與應(yīng)用經(jīng)濟學(xué)領(lǐng)域論文被引情況進行研究后，發(fā)現(xiàn)論文在發(fā)表后的第一年獲得引用會顯著促進后續(xù)被引，比第一年未獲引用的文獻平均多出２６次。此外，早期施引文獻和目標(biāo)文獻的知識關(guān)聯(lián)程度也能夠強化對論文擴散效果的預(yù)測［１５］。

１. ２引文擴散深度與廣度

部分學(xué)者在分析引文擴散情況時曾使用擴散“深度” 一詞，但對其定義則與得到更廣泛認可的“強度” 的定義具有較高相似度。ＹａｎｇＳＬ等［２０］將“深度” 定義為“若干個知識單元對特定知識單元的最大引用次數(shù)”；俞立平等［２１］參考ｈ指數(shù)計算原理提出了測度期刊知識擴散深度的指標(biāo)ＣＪＨ指數(shù)，并定義為“至少ＣＪＨ種期刊引用了該期刊論文ＣＪＨ次”；魏緒秋等［２２］將圖書知識擴散深度定義為“某本圖書引證作者的最高引用數(shù)”，均落腳于知識單元的被引頻次。上述對擴散“深度” 的理解和定義易造成與擴散“強度” 之間的概念混淆，且從術(shù)語的表達效果來看， “強度” 一詞更為直觀達意。另一派觀點認為， “深度” 是基于網(wǎng)絡(luò)的節(jié)點之間的距離［２３］，如深度優(yōu)先算法，具體反映在論文發(fā)表后經(jīng)過逐層引用而形成的引文級聯(lián)次數(shù)［１６］，它能夠反映出區(qū)別于強度、廣度與速度的基于引文網(wǎng)絡(luò)結(jié)構(gòu)的知識擴散特征，因此，按照這一理解定義“深度” 更為合理。

相比“深度”，學(xué)界對于擴散“廣度” 的理解則相對一致，即從覆蓋范圍的角度對知識擴散效果進行描述［３］，但具體而言這種覆蓋主要涉及學(xué)科、期刊和作者三類對象：ＬｉｕＹＸ等［２４］提出了“學(xué)科擴散廣度”，即一組論文的施引文獻所屬的學(xué)科數(shù)量。梁國強等［２３］則用香農(nóng)熵表示學(xué)科多樣性，進而衡量擴散廣度。ＲｏｗｌａｎｄｓＩ［２５］提出了“期刊擴散指數(shù)”，其定義為某期刊每１００次被引所涉及的期刊數(shù)量，實際上反映了知識擴散的廣度。逄順欣［２６］則直接將作者的知識擴散廣度定義為“作者文獻的引證文獻所屬期刊數(shù)量”。魏緒秋等［２２］將圖書知識擴散廣度定義為“某一本圖書的施引作者數(shù)”。

綜合上述相關(guān)研究可知，在論文知識擴散強度影響因素的研究方面，考慮了早期被引的知識擴散強度和速度兩個維度，而對于早期引文本身的深度及廣度的關(guān)注較為缺乏，表明對論文早期個體引文網(wǎng)絡(luò)所反映的更深層的知識擴散特征的研究相對不足。同時，已有研究對于擴散深度與廣度內(nèi)涵的理解具有一定差異性、復(fù)雜性，因而，本研究著眼于論文早期個體引文網(wǎng)絡(luò)所體現(xiàn)出的知識擴散深度與廣度特征，基于相關(guān)研究重新梳理和界定其內(nèi)涵，進而探究其對論文后期擴散強度即被引頻次的影響。

２研究設(shè)計

本研究整體思路：第一，界定研究變量，提出研究假設(shè)，并對變量進行操作化。第二，設(shè)計抽樣方案，并根據(jù)變量特點獲取相應(yīng)的論文數(shù)據(jù)集，對數(shù)據(jù)進行清洗。第三，基于論文數(shù)據(jù)集，計算生成最終的研究數(shù)據(jù)，并展開統(tǒng)計分析。第四，對統(tǒng)計分析結(jié)果進行解讀，得出研究結(jié)論，并展開相應(yīng)討論。基于此，具體的研究設(shè)計如圖１所示。

２. １數(shù)據(jù)獲取與處理

目前，對于論文知識擴散強度影響因素的研究多是基于單一學(xué)科的論文數(shù)據(jù)，且有不少研究依托的是本學(xué)科（即圖書情報學(xué)科）的期刊論文數(shù)據(jù)，但鑒于不同學(xué)科在研究內(nèi)容、研究方法、學(xué)術(shù)交流模式等方面存在差異，僅依據(jù)單一學(xué)科展開研究所得的結(jié)論不一定具有普適性，故本研究將依托多學(xué)科論文數(shù)據(jù)展開分析論述，據(jù)此設(shè)計了如下抽樣方案： ①學(xué)科抽?。?采用簡單隨機抽樣法抽取學(xué)科類別，為方便抽樣的實施，首先生成ＪｏｕｒｎａｌＣｉｔａｔｉｏｎＲｅｐｏｒｔｓ中２５４個學(xué)科類別的亂序列表，然后以５為間隔進行抽取，最終抽得５０個學(xué)科類別，此舉意在使學(xué)科覆蓋更全面，而非局限于單一或少數(shù)學(xué)科的論文樣本，以增強研究結(jié)論的普適性。②期刊抽?。?對抽取所得的５０個學(xué)科類別，在ＪｏｕｒｎａｌＣｉ?ｔａｔｉｏｎＲｅｐｏｒｔｓ中將其下屬期刊按照近５年影響因子降序排列，并將其均勻劃分成前、中、后３組，在各組中分別選取排在最中間（或接近最中間）的期刊，此舉意在均衡考慮不同影響力水平的期刊，進一步增強研究結(jié)論的普適性。③論文抽?。?相關(guān)研究表明，論文發(fā)表５年之后的被引量可以較好地反映論文的影響力［１４］，在此將引文時間窗口進一步拉長至１０年，獲取步驟②所得學(xué)術(shù)期刊于２０１３年所發(fā)表的全部Ａｒｔｉｃｌｅ類型文獻。

大型開放科學(xué)知識圖譜ＯｐｅｎＡｌｅｘ作為微軟學(xué)術(shù)圖譜的替代產(chǎn)品，旨在建立一個全球性的研究文獻關(guān)聯(lián)數(shù)據(jù)平臺，具有索引文獻量大、覆蓋范圍全、完全免費開源等突出優(yōu)勢［２７］，能夠讓研究者便捷地獲取與使用文獻元數(shù)據(jù)，同時可提供相比付費數(shù)據(jù)庫更為豐富完整的文獻被引記錄，而不受單一數(shù)據(jù)庫平臺的制約，并且當(dāng)前很多學(xué)者在研究中充分意識到ＯｐｅｎＡｌｅｘ的優(yōu)越性，并將其作為研究數(shù)據(jù)源［２８－３０］，因此，本研究亦選擇ＯｐｅｎＡｌｅｘ作為數(shù)據(jù)源。在數(shù)據(jù)獲取方面，直接通過Ｐｙｔｈｏｎ腳本調(diào)用ＡＰＩ將學(xué)術(shù)論文題錄數(shù)據(jù)保存至本地。根據(jù)前述抽樣方案獲取原始文獻共８３６２篇，對其中關(guān)鍵字段信息缺失的論文予以剔除，同時參考前人對早期施引文獻的定義［１３］，將論文發(fā)表前２年和前３年（包括發(fā)表當(dāng)年）的引文作為早期引文（以便后續(xù)針對兩個不同的引文窗口展開對比分析），并據(jù)此將發(fā)表前２年被引量為０的論文予以剔除，最終獲得原始文獻共８１９２篇。接著，獲取原始文獻早期施引文獻集共３３０９９篇（前２年）和６４９１２篇（前３年）。具體所獲取的論文題錄數(shù)據(jù)內(nèi)容如表１所示。

２. ２研究變量與假設(shè)

２. ２. １因變量

本研究旨在探究論文早期個體引文網(wǎng)絡(luò)中所表現(xiàn)出的引文擴散深度和廣度特征與其后期擴散強度的關(guān)聯(lián)機制，根據(jù)擴散強度的基本內(nèi)涵，采用論文后期被引頻次作為因變量的具體指標(biāo)。其中，本研究所指“個體引文網(wǎng)絡(luò)”，也可稱為“自中心引文網(wǎng)絡(luò)”，即社會網(wǎng)絡(luò)中的自中心網(wǎng)絡(luò)（ＥｇｏＮｅｔｗｏｒｋ）［３１］在引文網(wǎng)絡(luò)上的體現(xiàn)，其定義為以目標(biāo)文獻（被引用的原始文獻）為中心節(jié)點，以其所有施引文獻作為節(jié)點的引文網(wǎng)絡(luò)，所有鄰居節(jié)點與中心節(jié)點均存在直接連接，而鄰居節(jié)點相互之間也可能存在連接，具體形式如圖２所示，紅色代表目標(biāo)文獻（中心節(jié)點），藍色代表施引文獻（鄰居節(jié)點）。

２."２. ２研究假設(shè)及自變量構(gòu)建

１）引文擴散深度。根據(jù)文獻綜述部分的討論，本研究對擴散深度的定義為論文經(jīng)逐層引用從而形成的引文級聯(lián)次數(shù)。前人的研究將這種引文級聯(lián)現(xiàn)象類比于病毒的代際傳播與滲透過程，擴散的距離越遠則代表“感染力” 越強，而其中一項測量指標(biāo)即各節(jié)點（各代施引文獻）到初始節(jié)點（原始文獻）深度的平均值［３２－３３］。

而對基于單篇論文被引情況形成的個體引文網(wǎng)絡(luò)而言，由于所有其他節(jié)點（施引文獻）均與中心節(jié)點（原始文獻）相連接，因而其引文級聯(lián)必然會呈現(xiàn)三角引用結(jié)構(gòu)。所謂三角引用是文獻直接引用、共被引與耦合關(guān)系融合到一起所形成的特殊引用關(guān)系，其定義如下：若文獻Ａ與文獻Ｂ被文獻Ｃ引用，同時文獻Ａ與Ｂ之間也存在引用關(guān)系，那么Ａ、Ｂ、Ｃ三者之間就建立了三角引用關(guān)系，文獻Ａ、Ｂ、Ｃ分別稱為“原始文獻” “中介文獻” 和“追隨文獻”［３４］。相關(guān)研究發(fā)現(xiàn)，三角引用關(guān)系在引文網(wǎng)絡(luò)中普遍存在，且原始文獻的被引量與三角引用發(fā)生頻次呈正相關(guān)［３５］，而原始文獻往往是相關(guān)研究主題、領(lǐng)域或?qū)W科比較重要的、高影響力的文獻［３６］，并且三角引用關(guān)系中存在的間接引用機制（轉(zhuǎn)引行為、虛假引用）易導(dǎo)致原始文獻Ａ被引頻次虛高［３７］。相比三角引用關(guān)系，引文擴散深度側(cè)重于網(wǎng)絡(luò)整體結(jié)構(gòu)特征，能夠反映施引文獻到原始文獻的“距離”，更能體現(xiàn)知識擴散的宏觀特點?；谏鲜龇治?，提出第一個研究假設(shè)：

Ｈ１：早期引文擴散深度正向影響論文后期擴散強度

擴散深度的具體測度指標(biāo)參考前述的節(jié)點深度平均值，使用個體引文網(wǎng)絡(luò)中其他節(jié)點到中心節(jié)點的最大路徑深度平均值，計算公式如式（１）所示：

其中，Ｎｅｃ表示早期施引文獻總量，ｄｍａｘ（ｐ，ｑｉ）則表示每篇施引文獻ｑｉ到中心節(jié)點文獻ｐ的路徑深度最大值。

２）引文擴散廣度。擴散廣度是從覆蓋范圍的角度衡量引文擴散的影響效果［３］，相關(guān)研究主要從學(xué)科、機構(gòu)、期刊、國家（地區(qū)）等維度細化廣度的概念，并通過實證分析指出在早期具有較高擴散廣度的文獻易成長為高被引文獻［３８］。借鑒前人研究對擴散廣度的多元界定，并結(jié)合單篇論文的特性，本研究將擴散廣度細分為學(xué)科廣度、地域廣度和作者廣度３個子維度：學(xué)科廣度能夠反映論文所影響的學(xué)科范圍，體現(xiàn)了跨學(xué)科的擴散能力；地域廣度則反映論文輻射的地域范圍，代表一種跨越空間邊界的影響能力，相關(guān)研究表明，地理邊界和距離仍是制約論文知識擴散傳播的一大因素［３９－４１］；作者廣度反映論文在學(xué)術(shù)界所影響學(xué)者的范圍，引文擴散歸根結(jié)底是學(xué)者所提出的新知識經(jīng)由文獻引證關(guān)系擴散給其他學(xué)者?；诖?，提出如下研究假設(shè)：

Ｈ２ａ：早期引文擴散學(xué)科廣度正向影響論文后期擴散強度

Ｈ２ｂ：早期引文擴散地域廣度正向影響論文后期擴散強度

Ｈ２ｃ：早期引文擴散作者廣度正向影響論文后期擴散強度

布里淵指數(shù)（ＢｒｉｌｌｏｕｉｎｓＩｎｄｅｘ，ＢＩ）是布里淵于１９５６年基于信息論的信息熵原理提出的用于測度信息中包含信息量的統(tǒng)計指標(biāo)［４２］，綜合考慮多樣性與均勻性的優(yōu)點［４３］，在早期曾被生態(tài)學(xué)領(lǐng)域用于生物多樣性研究，后來則被科學(xué)計量學(xué)領(lǐng)域視為衡量學(xué)科多樣性或跨學(xué)科程度的重要指標(biāo)之一，目前已有較多研究利用該指標(biāo)開展跨學(xué)科性測度相關(guān)研究［４４－４６］。而本研究參考上述研究，使用布里淵指數(shù)來直接計算引文擴散學(xué)科廣度與地域廣度，計算公式如式（２）所示［４７］：

其中，Ｃ代表早期施引文獻中所涉各學(xué)科（地域）對應(yīng)的文獻數(shù)量總和（由于論文可能存在學(xué)者跨國合著的現(xiàn)象，因此部分論文會在不同地域之下重復(fù)計數(shù)），Ｃｉ指某學(xué)科（地域）ｉ的施引文獻數(shù)量，Ｃ越大，且各學(xué)科（地域）所對應(yīng)的文獻數(shù)量越均勻，ＢＩ值就越大［４８］。參考相關(guān)研究中的處理方法［３０］，本研究依據(jù)ＯｐｅｎＡｌｅｘ數(shù)據(jù)集的每篇文獻的Ｃｏｎｃｅｐｔｓ字段來確定其學(xué)科類別。Ｃｏｎｃｅｐｔｓ是一個分為６級的樹狀層次分類體系，其從１９個學(xué)科入手逐步細分至子學(xué)科、研究領(lǐng)域乃至研究主題，共包含６５０００余個概念。ＯｐｅｎＡｌｅｘ是通過基于微軟學(xué)術(shù)圖譜語料庫訓(xùn)練所得的自動分類器實現(xiàn)對文獻“Ｃｏｎｃｅｐｔｓ” 的標(biāo)注，每篇文獻會在各個層級上被標(biāo)注若干概念，同時這些概念會被賦予反映其與文獻內(nèi)容契合程度的權(quán)重值。因此，Ｃｏｎｃｅｐｔｓ字段既能從不同粒度的層面反映文獻的學(xué)科歸屬情況，也能較細粒度地揭示文獻的具體研究主題。據(jù)此，綜合考慮Ｃｏｎｃｅｐｔｓ體系的特點，筆者認為其第２層級的概念能夠較為有效地揭示與區(qū)分文獻的學(xué)科歸屬（２級概念共２８４個），是對第１層級１９個較為宏觀的學(xué)科概念的細分。因此，本研究選用文獻所標(biāo)注的Ｃｏｎｃｅｐｔｓ體系中權(quán)重最高的第２級概念作為論文的學(xué)科類別。施引文獻的地域信息為ＯｐｅｎＡｌｅｘ中所給出的作者所在國家（地區(qū)）的英文縮寫。若少部分施引文獻的Ｃｏｎｃｅｐｔｓ值缺失，則在計算跨學(xué)科程度時忽略該部分文獻，作者地域信息缺失的文獻處理亦進行相同處理。

區(qū)別學(xué)科廣度和地域廣度的計算，作者廣度的計算須考慮自引的情況，因為知識在同一學(xué)科內(nèi)或同一國家（地區(qū)）內(nèi)部的擴散亦具有重要意義，而學(xué)者的自引則不然。自引是科學(xué)交流過程中普遍存在的自然現(xiàn)象，但由于其動機的復(fù)雜性，致使自引行為長期以來在科學(xué)評價中飽受質(zhì)疑與爭議［４９］。合理的自引被視為是科學(xué)研究的延續(xù)與繼承［５０］，可以視為學(xué)者對舊知識的運用，而不當(dāng)自引往往是故意抬升被引率的手段［５１］。從客觀的角度來看，無論自引的動機合理與否，就結(jié)果而言，學(xué)者自引并沒有真正實現(xiàn)擴散，而只是舊知識的延續(xù)，他引才能真正反映出知識的有效擴散。ＣｏｓｔａｓＲ等［５２］的研究亦曾指出，外部引用（他引）才是衡量科學(xué)影響力最為可靠的標(biāo)準(zhǔn)。因此，本研究基于布里淵指數(shù)測度引文擴散作者廣度，計算公式如式（３）所示：

其中，Ｃａ表示早期施引文獻中所涉各作者（考慮文獻的所有作者，同時除去與原始文獻相同的作者）所對應(yīng)的文獻數(shù)量總和（由于論文普遍存在合著現(xiàn)象，因此部分論文會在不同作者之下重復(fù)計數(shù)）。當(dāng)Ｃａ＝０，即僅存在原始文獻作者自引的情況時，規(guī)定作者廣度為０；而當(dāng)Ｃａ＞０，即存在其他作者對原始文獻進行了引用，按照調(diào)整后的布里淵指數(shù)計算公式進行計算作者廣度（為避免他引作者只有１人而導(dǎo)致布里淵指數(shù)為０，對分子加上Ｃａ）。

２. ２. ３控制變量

為了因果分析的有效性，本研究從學(xué)界已識別的若干影響因素中選取部分因素作為控制變量，具體的選取思路如下： ①考慮到數(shù)據(jù)獲取的便利性，控制變量所對應(yīng)的數(shù)據(jù)可直接從ＯｐｅｎＡｌｅｘ中獲取，無需進行手動預(yù)處理或從其他渠道獲??； ②現(xiàn)有文獻已對其與論文擴散強度的相關(guān)關(guān)系進行了研究與證明。基于上述思路，共選取了６個控制變量，所有變量的基本信息如表２所示。

２. ３研究方法與工具

本研究需構(gòu)建原始文獻的早期個體引文網(wǎng)絡(luò)以計算引文擴散深度，采用Ｐｙｔｈｏｎ社會網(wǎng)絡(luò)分析工具包Ｎｅｔｗｏｒｋｘ進行網(wǎng)絡(luò)構(gòu)建與變量計算，具體包括以下幾個步驟： ①針對表１中ＤａｔａｓｅｔＳ數(shù)據(jù)集中每一篇原始文獻ｐ，使用ＤｉＧｒａｐｈ（）語句初始化有向網(wǎng)絡(luò)Ｇｐ； ②在ＤａｔａｓｅｔＣ中（Ｃ２或Ｃ３），獲得原始文獻ｐ的所有施引文獻構(gòu)成的集合Ｃｐ； ③針對集合Ｃｐ中每一篇施引文獻ｑ，得到其參考文獻列表Ｒｑ，并在Ｒｑ中篩選出同時出現(xiàn)在原始文獻施引文獻集合Ｃｐ中的文獻ｑ′，即找出施引文獻中存在的多層級引用關(guān)系； ④基于這些文獻的引用關(guān)系，利用ａｄｄ＿ｅｄｇｅ（）方法構(gòu)建早期施引文獻ｑ與原始文獻ｐ，以及施引文獻ｑ和ｑ′之間的引用關(guān)系，得到原始文獻ｐ為中心的個體引文網(wǎng)絡(luò)Ｇｐ； ⑤基于個體引文網(wǎng)絡(luò)Ｇｐ，通過ｄａｇ＿ｌｏｎｇｅｓｔ＿ｐａｔｈ（）方法獲取中心節(jié)點ｐ到所有施引文獻ｑ的最大路徑長度，并根據(jù)式（１）計算求得文獻ｐ的早期引文擴散深度。其他３個引文擴散廣度相關(guān)自變量則可直接使用Ｐｙｔｈｏｎ的數(shù)值計算功能實現(xiàn)。

在統(tǒng)計模型構(gòu)建方面，相關(guān)研究表明，由于學(xué)術(shù)論文被引頻次為典型的離散型變量，一般不服從正態(tài)分布而是偏態(tài)分布，且存在過離散現(xiàn)象，通常使用負二項回歸模型進行數(shù)據(jù)擬合［５３－５４］，本研究使用Ｓｔａｔａ的Ｎｂｒｅｇ方法命令進行模型檢驗。為了提高回歸分析的穩(wěn)健性，識別出自變量對與因變量影響的凈效應(yīng)，使用ＤＤＭＬ方法（雙重／去偏機器學(xué)習(xí)）［５５］消除控制變量對自變量和因變量的混淆影響，具體地，采用Ｓｔａｔａ工具相應(yīng)的外部命令ＤＤＭＬ。

３研究結(jié)果

鑒于將２年設(shè)為早期引文窗口時間較短，且部分發(fā)表于年末的論文在當(dāng)年難以獲得被引，早期引文的特征可能難以得到相對準(zhǔn)確地反映，因此本研究另將３年設(shè)為早期引文窗口，并分別獲取原始文獻的兩個早期施引文獻數(shù)據(jù)集ＤａｔａｓｅｔＣ２和ＤａｔａｓｅｔＣ３，再分別進行變量的計算，以實現(xiàn)基于兩個引文窗口對比分析。

３. １描述性統(tǒng)計與相關(guān)分析

早期引文窗口為２年的變量描述性統(tǒng)計與相關(guān)性分析結(jié)果如表３所示。其中，論文后期引文擴散強度均值為３２. ９３５，說明每篇論文在得到發(fā)表的后８年內(nèi)會被約３３篇論文引用，但其標(biāo)準(zhǔn)差達到５４. ９９９，表明擴散強度的離散程度很高；早期擴散強度均值為４. ０２０，說明每篇論文在發(fā)表前２年內(nèi)平均會被約４篇論文引用，而其標(biāo)準(zhǔn)差為５. ０８３，表明離散程度也較高。由于本研究的自變量均為無計量單位的連續(xù)型變量，且均值和標(biāo)準(zhǔn)差數(shù)值均較小，無法直觀判斷其數(shù)據(jù)離散程度，因而通過計算變異系數(shù)判斷離散程度較為妥當(dāng)。根據(jù)變異系數(shù)的定義（標(biāo)準(zhǔn)差／均值?１００％），計算得到４個自變量的變異系數(shù)分別為１５. ８２４％、１０２. ６３９％、７９. ７７０％、４１. ３９２％，表明就論文發(fā)表前２年的個體引文網(wǎng)絡(luò)而言，不同論文的知識擴散深度分布相對集中、差異較小，而知識擴散學(xué)科廣度、地域廣度和作者廣度則離散程度很高且差異明顯，三者離散程度依次遞減，即論文所影響的學(xué)科多樣性差異大于地域多樣性差異，地域多樣性差異又大于作者多樣性差異。

早期引文窗口為３年的變量描述性統(tǒng)計與相關(guān)性分析結(jié)果如表４所示。論文后期引文擴散強度均值為２９. ０７４，說明每篇論文在得到發(fā)表的后７年內(nèi)會被約２９篇論文引用，其標(biāo)準(zhǔn)差為５１. ２２２，亦反映了很高的離散程度。相比于２年引文窗口，３年引文窗口的早期擴散強度增至７. ８８２，說明每篇論文平均會被約８篇論文引用。從標(biāo)準(zhǔn)差（９. ７７２）來看，離散程度同樣處于較高水平，計算兩組數(shù)據(jù)的早期擴散強度變異系數(shù)（１２６. ４４３％和１２３. ９７９％）進行比較后發(fā)現(xiàn)，３年引文窗口的早期擴散強度離散程度略微低于２年引文窗口的情況。４個自變量的均值相比２年引文窗口的情況均有所增長，而計算所得變異系數(shù)分別為２３.０７０％、６９.９８４％、５９.５５４％、３５. ４４６％，表明知識擴散深度的離散程度略有提高，而知識擴散學(xué)科廣度、地域廣度和作者廣度的離散程度則有所降低。由此可見，將引文窗口延長至３年后，論文獲得了更多早期引文積累，并且早期引文擴散深廣度的數(shù)據(jù)分布情況與２年引文窗口的情況表現(xiàn)出了一定差異。

就Ｓｐｅａｒｍａｎ相關(guān)性分析結(jié)果而言，兩組數(shù)據(jù)并沒有明顯差異，但值得注意的是，早期引文擴散學(xué)科廣度、地域廣度和作者廣度兩兩之間的相關(guān)系數(shù)在兩個引文窗口之下均高于０. ７，而由于這３個自變量的測量對象與實際意義并不相同，不應(yīng)視作存在多重共線性。另外，早期引文擴散強度與４個自變量的相關(guān)系數(shù)在兩個引文窗口下均較高，這表明早期引文擴散的深度及廣度均在較大程度上受到早期施引文獻數(shù)量的影響，因此在后續(xù)進行負二項回歸分析時，有必要采取相應(yīng)的穩(wěn)健因果推斷方法，以排除早期引文擴散強度引起的自變量與因變量的虛假相關(guān)。

３. ２模型假設(shè)驗證

由于因變量為計數(shù)型變量，且描述性統(tǒng)計結(jié)果顯示其方差大于均值，存在過離散的現(xiàn)象，因此本研究選擇負二項回歸模型對數(shù)據(jù)進行擬合。表５展示了８１９２篇論文數(shù)據(jù)的負二項回歸結(jié)果，模型Ａ和模型Ｂ分別代表早期引文窗口為２年和３年的結(jié)果，其下的子模型（１）僅包含控制變量，子模型（２）則加入了自變量。將模型Ａ（２）與Ａ（１）、Ｂ（２）與Ｂ（１）相比，偽Ｒ２值均出現(xiàn)上升，表明自變量的加入提升了模型擬合度，能夠更充分地對因變量進行解釋。就表５所呈現(xiàn)的模型Ａ（２）與Ｂ（２）的結(jié)果而言，在２年引文窗口下，早期引文擴散深度負向影響后期擴散強度，而在３年引文窗口下兩者并不存在顯著關(guān)系（ｐ＞０. １），說明在論文發(fā)表的前２年，早期引文擴散深度會對后期被引產(chǎn)生一定阻礙作用，當(dāng)引文窗口得到延長，這種阻礙作用則不再表現(xiàn)出來。早期引文擴散學(xué)科、地域和作者廣度對論文在兩個引文窗口下均正向影響后期擴散強度，三者的影響力度依次遞減，其中，學(xué)科廣度對后期擴散強度的影響在３年引文窗口下表現(xiàn)更弱，而地域廣度和作者廣度的影響則表現(xiàn)更強。在控制變量方面，早期引文擴散強度、參考文獻數(shù)量和作者影響力正向影響論文后期擴散強度，這在一定程度上印證了前人研究的結(jié)論，而作者來源國家（地區(qū)）數(shù)量與論文后期擴散強度不存在顯著關(guān)系，作者數(shù)量則在兩個模型中的顯著性表現(xiàn)出相反情況，這表明當(dāng)以前２年引文數(shù)據(jù)進行分析時，作者數(shù)量無法表現(xiàn)出與論文后期擴散強度的顯著關(guān)系（ｐ＞０. １），而基于前３年引文數(shù)據(jù)則能夠反映作者數(shù)量的負向影響，一定程度上反映了２年與３年引文窗口之間所表現(xiàn)出來的早期引文擴散特征差異對模型整體的擬合產(chǎn)生了影響。進一步從模型Ａ（２）與Ｂ（２）偽Ｒ２值的大小關(guān)系來看，以３年作為早期引文窗口能夠獲得更好的模型擬合優(yōu)度，對因變量的解釋更為充分。

根據(jù)前文相關(guān)分析，本研究的自變量很大程度上受到早期引文擴散強度的影響，極可能存在虛假相關(guān)的情況，因此本研究采用雙重機器學(xué)習(xí)（Ｄｏｕｂ?ｌｅ／Ｄｅ－ｂｉａｓｅｄＭａｃｈｉｎｅＬｅａｒｎｉｎｇ，ＤＤＭＬ）方法重新對４個自變量進行回歸，以加強因果推斷的穩(wěn)健性。具體而言，本研究不涉及工具變量，因而采用ＤＤＭＬ中的ＰａｒｔｉａｌｌｙＬｉｎｅａｒＭｏｄｅｌ，其數(shù)學(xué)表達式及具體擬合過程如下［５６］：

Ｙ＝Ｄθ０＋ｇ０（Ｘ）＋ζ，Ｅ（ζ ｜Ｄ，Ｘ）＝０（４）

Ｄ＝ｍ０（Ｘ）＋Ｖ，Ｅ（Ｖ｜Ｘ）＝０（５）

其中，Ｄ表示處理變量（即本研究中的４個自變量），Ｘ表示混淆變量（即本研究中的控制變量早期引文擴散強度），Ｙ則為因變量（本研究中的后期擴散強度），首先需要選擇回歸模型分別擬合Ｙ和Ｘ及Ｄ和Ｘ，并得到殘差＾ξ ＝Ｙ－＾ｇ０（Ｘ）和＾Ｖ＝Ｙ－＾ｍ０（Ｘ），再以＾ξ ＝＾Ｖθ０對殘差進行回歸擬合，估計出θ０。另外，對數(shù)據(jù)進行ｋ折交叉擬合并重復(fù)這一步驟能夠提升參數(shù)估計的有效性。本研究選用ＤＤＭＬ中常見的機器學(xué)習(xí)模型———隨機森林回歸器對模型進行擬合，并采用１０折交叉擬合，擬合過程重復(fù)１０次取平均結(jié)果，并設(shè)置隨機種子確保處理各個自變量時數(shù)據(jù)采樣過程一致。最終得到的ＤＤＭＬ結(jié)果如表６所示，結(jié)果顯示，部分變量回歸系數(shù)的顯著性與正負方向相比于負二項回歸結(jié)果存在明顯差異，表明早期引文擴散強度的確對原有回歸分析造成了偏誤，而ＤＤＭＬ起到了去偏的作用。具體而言，在消除了早期引文擴散強度帶來的偏誤后，早期引文擴散學(xué)科廣度在２年和３年的引文窗口下均對論文后期擴散強度具有顯著的正向影響，地域廣度在２年引文窗口下表現(xiàn)出顯著正向影響，在３年引文窗口下則不存在顯著關(guān)系，而作者廣度在２年引文窗口下未表現(xiàn)出顯著性，在３年引文窗口下則表現(xiàn)出顯著的負向影響。由此可見，早期引文擴散學(xué)科廣度是影響總體擴散強度的重要因素，而早期引文擴散地域廣度只在前２年表現(xiàn)其促進后期引文積累的作用。同時，隨著引文的不斷積累，早期引文擴散作者廣度則可能從無顯著影響逐漸轉(zhuǎn)變?yōu)楫a(chǎn)生較弱的負向影響。

３. ３異質(zhì)性分析

為了探究前面所得到的前期引文擴散特征對后期擴散強度的影響在不同特征論文中的差異，以總被引頻次的中位數(shù)（２２次）為界，將數(shù)據(jù)集ＤａｔａｓｅｔＳ中的論文劃分為高被引組（４０５０篇）和低被引組（４１４２篇），再分別進行ＤＤＭＬ回歸，結(jié)果如表７和表８所示，展開異質(zhì)性分析。

結(jié)果表明，對于高被引組論文而言，引文擴散深度廣度對后期引文擴散強度的影響和整體基本一致，除在２年引文窗口下早期引文擴散地域廣度的影響不再顯著，其他變量在兩個引文窗口下表現(xiàn)出來的影響顯著性和方向均與整體樣本沒有本質(zhì)區(qū)別，且回歸系數(shù)的絕對值變大，表明其影響力更強。而對于低被引組論文而言，其結(jié)果與樣本整體存在較大區(qū)別，在兩個引文窗口下的回歸系數(shù)顯著性以及系數(shù)的大小發(fā)生了明顯的變化：早期引文擴散深度在２年引文窗口下未表現(xiàn)出顯著影響，在３年引文窗口下表現(xiàn)出顯著負向影響；早期引文擴散學(xué)科廣度在２年引文窗口下呈顯著正向影響，在３年引文窗口下表現(xiàn)出顯著性；地域廣度和作者廣度則在兩個引文窗口下都表現(xiàn)出顯著正向影響，且根據(jù)回歸系數(shù)來看，２年引文窗口所表現(xiàn)出的影響更大，并且作者廣度的正向影響區(qū)別于整體組和高被引組，說明對于低被引組，由于論文整體引用較低，不同作者的引用更能促進后期擴散，或者說對于通過其他學(xué)者的早期引用起到中介傳播作用的依賴性更高，但這種影響其實較為微弱。這表明對于被引量較低的論文而言，早期引文擴散的深度及廣度對后期擴散強度的影響小于整體及高被引組，并且由于論文整體引用量較低，較短時期（２年）的引文擴散特征對后期引文擴散的影響均大于較長時期（３年）的影響；而高被引組論文在較短時期（２年）的兩個顯著的引文擴散廣度變量對后期引文擴散的影響均小于較長時期（３年）的影響，這從一個角度說明了高被引組文獻在時間上的持久影響。

４結(jié)論與討論

４. １主要結(jié)論

本研究以ＷＯＳ中５０個學(xué)科類別的８１９２篇論文數(shù)據(jù)為樣本，構(gòu)建每篇論文的早期個體引文網(wǎng)絡(luò)，并分析了早期引文擴散深廣度與論文后期引文擴散強度的關(guān)聯(lián)性。其中，對引文擴散深度與廣度的具體內(nèi)涵進行了新的界定。同時，將早期引文窗口分別設(shè)置為２年和３年及根據(jù)論文整體被引次數(shù)的不同進行了對比分析。具體的研究結(jié)論如下：

１）在個體引文網(wǎng)絡(luò)中，早期引文擴散深度在２年和３年引文窗口下均表現(xiàn)出了對后期擴散強度的顯著負向影響，這和假設(shè)１的方向相反。這表明當(dāng)著眼于目標(biāo)文獻的個體引文網(wǎng)絡(luò)時，其擴散深度越高，反而可能代表其知識擴散路徑已相對固化、封閉化，難以影響到更多的研究，或是存在一種，因而在后續(xù)獲得更少引用。

２）在兩個引文窗口下，早期引文擴散學(xué)科廣度均正向影響論文后期擴散強度，這說明論文在發(fā)表的早期所影響的學(xué)科更廣，后續(xù)在各學(xué)科領(lǐng)域的學(xué)術(shù)共同體之中能得到更多的關(guān)注，從而更易獲得更多被引，假設(shè)Ｈ２ａ得到證實。

３）早期引文擴散地域廣度在２年引文窗口下表現(xiàn)出對論文后期擴散強度的正向影響，在３年引文窗口下則未表現(xiàn)出顯著性，即假設(shè)Ｈ２ｂ在２年引文窗口之下成立。由此可知，在論文發(fā)表前２年、引文積累時間極短的情況下，論文所承載的知識擴散至更廣的地域范圍，在后續(xù)易獲得更多被引，這可能是由于論文早期的知識擴散受到空間邊界的顯著影響，國內(nèi)引文比國外引文積累更快、峰值出現(xiàn)更早［３９］，即論文在發(fā)表早期相對不易引起國外學(xué)者關(guān)注，由此推知，論文在早期就能夠突破這種空間邊界的限制，影響到了更廣的地域范圍，能夠在一定程度上反映出其本身的研究質(zhì)量與學(xué)術(shù)影響力。但當(dāng)引文窗口延長至３年、引文積累更為充分時，這一作用機制則不再表現(xiàn)出來，這說明此時空間邊界對知識擴散的阻礙作用已經(jīng)基本失效，因此引文擴散的地域廣度不再能持續(xù)影響論文的擴散過程。

４）早期引文擴散作者廣度在２年引文窗口下未表現(xiàn)出與論文后期擴散強度的顯著關(guān)系，但在３年引文窗口下則表現(xiàn)出對后期擴散強度的弱負向影響，和假設(shè)Ｈ２ｃ的方向相反。這一現(xiàn)象表明，當(dāng)引文窗口延長至３年、引文積累更為充分時，論文所影響的學(xué)者范圍更廣，反而對后續(xù)擴散與被引起到較為微弱的阻礙作用，這可能意味著在早期能夠引起更多學(xué)者關(guān)注的文獻使用壽命相對較短，時效性略強，因而在后續(xù)的擴散和被引上略顯乏力。

５）異質(zhì)性分析結(jié)果表明，在高被引組論文中，引文擴散深度廣度對后期引文擴散強度的影響和整體基本一致，且早期引文擴散特征的作用力度相較整體更強；而在低被引組論文中，自變量和因變量的相互關(guān)系則與樣本整體存在明顯區(qū)別，且較短時期（２年）的引文擴散特征對后期引文擴散的影響均大于較長時期（３年）的影響，而早期引文擴散作者的廣度則正向促進后期擴散強度，區(qū)別于整體上的負向影響。由此可見，對于影響力較高的論文而言，早期引文擴散深廣度對后期擴散強度的影響機制與總體情況較為接近，而影響力較低的論文則表現(xiàn)出明顯區(qū)別于總體的作用機制。

４. ２研究貢獻

本研究的主要貢獻有３個方面：第一，在理論探索層面，基于單篇論文的引證關(guān)系界定了引文擴散深度和廣度的內(nèi)涵，并從擴散深度和廣度兩大維度出發(fā)，探究了早期個體引文網(wǎng)絡(luò)中知識傳播結(jié)構(gòu)特征以及早期施引文獻覆蓋范圍的影響，而非著眼于早期擴散強度（被引頻次）和速度（初次被引時間）等基于計數(shù)指標(biāo)的淺層維度，也區(qū)別于早期施引文獻和目標(biāo)文獻的知識關(guān)聯(lián)視角［１５］，更為充分且深入地解釋了論文早期知識擴散效果與后續(xù)擴散效果關(guān)聯(lián)與作用機制。第二，在研究方法方面，本研究在負二項回歸分析基礎(chǔ)上，采用雙重機器學(xué)習(xí)方法（ＤＤＭＬ）消除混淆變量同時影響自變量和因變量所造成的偏誤［５７］，相比常規(guī)回歸分析能夠更準(zhǔn)確地識別自變量對因變量的凈效應(yīng)，抑制虛假相關(guān)關(guān)系，使得研究結(jié)果更為可靠。第三，在現(xiàn)實意義層面，本研究從引文關(guān)系的層級深度、學(xué)科輻射范圍、地域輻射范圍和作者輻射范圍４個角度為科學(xué)論文未來影響力的早期判斷與預(yù)測提供了新思路，能夠在一定程度上支撐后續(xù)的論文被引預(yù)測模型研究，并為進一步完善學(xué)術(shù)成果的早期評估體系提供新的依據(jù)。另外，也能夠為研究者提升自身研究成果的擴散潛力提供一定啟示，如可以加強跨學(xué)科、多學(xué)科的學(xué)術(shù)交流，并多參與國際性的學(xué)術(shù)活動，以增強自身研究成果在不同學(xué)科領(lǐng)域以及不同國家和地區(qū)中的可見度，為后續(xù)的被引及知識擴散創(chuàng)造更為良好的條件。

４. ３不足及展望

本研究也存在一定局限性：本研究對論文早期知識擴散特征的測度都是基于其早期個體引文網(wǎng)絡(luò)，即只考慮了論文早期施引文獻之間所表現(xiàn)出的特征，并未從純粹的時間角度出發(fā)，構(gòu)建以原始文獻為起始節(jié)點的完整早期引文網(wǎng)絡(luò)（其中應(yīng)包含僅引用了原始文獻的早期施引文獻，而未直接引用原始文獻的后續(xù)文獻），因此有待后續(xù)研究的進一步探索。本研究依舊著眼于早期施引文獻的外在特征表現(xiàn)，而未將論文的文本內(nèi)容納入考慮，從而更細致地探究早期施引文獻的學(xué)科主題范圍及其與原始文獻的親疏程度所產(chǎn)生的影響，后續(xù)可借鑒相關(guān)研究［１５］的做法展開進一步探索。另外，由于本研究旨在從理論和實踐層面獲取相對普適性的結(jié)論，因而在數(shù)據(jù)獲取過程中選取了較多的學(xué)科及期刊，故不便基于學(xué)科或期刊展開異質(zhì)性分析，鑒于此，未來的研究亦可在文獻引用規(guī)律方面具有較大差異性的學(xué)科（如理工科和社會科學(xué)）及期刊（如開源期刊和非開源期刊）上展開異質(zhì)性分析，以期得到更有價值的研究發(fā)現(xiàn)。

參考文獻

［１］ＣｈｅｎＣＭ，ＨｉｃｋｓＤ．ＴｒａｃｉｎｇＫｎｏｗｌｅｄｇｅＤｉｆｆｕｓｉｏｎ［Ｊ］．Ｓｃｉｅｎｔｏ?ｍｅｔｒｉｃｓ，２００４，５９（２）：１９９－２１１．

［２］侯劍華，鄭碧麗，張洋．科學(xué)知識擴散研究：概念界定、理論基礎(chǔ)與體系重構(gòu)［Ｊ］．現(xiàn)代情報，２０２０，４０（９）：１１７－１２６．

［３］李江．基于引文的知識擴散研究評述［Ｊ］．情報資料工作，２０１３，３４（４）：３６－４０．

［４］董克，陳曉萍，吳佳純．科研論文創(chuàng)新性與引文影響力相關(guān)性研究———基于語義視角的測度［Ｊ］．情報理論與實踐，２０２３，４６（１０）：２４－３１．

［５］張琳，孫蓓蓓，王賢文，等．交叉科學(xué)成果影響力研究：使用數(shù)據(jù)與引用數(shù)據(jù)視角［Ｊ］．情報學(xué)報，２０２０，３９（５）：４６９－４７７．

［６］ＳｕｂｏｔｉｃＳ，ＭｕｋｈｅｒｊｅｅＢ．ＳｈｏｒｔａｎｄＡｍｕｓｉｎｇ：ＴｈｅＲｅｌａｔｉｏｎｓｈｉｐｂｅ?ｔｗｅｅｎＴｉｔｌｅＣｈａｒａｃｔｅｒｉｓｔｉｃｓ，Ｄｏｗｎｌｏａｄｓ，ａｎｄＣｉｔａｔｉｏｎｓｉｎＰｓｙｃｈｏｌｏｇｙＡｒｔｉｃｌｅｓ［Ｊ］．ＪｏｕｒｎａｌｏｆＩｎｆｏｒｍａｔｉｏｎＳｃｉｅｎｃｅ，２０１３，４０（１）：１１５－１２４．

［７］ＪａｍａｌｉＨＲ，ＮｉｋｚａｄＭ．ＡｒｔｉｃｌｅＴｉｔｌｅＴｙｐｅａｎｄｉｔｓＲｅｌａｔｉｏｎｗｉｔｈｔｈｅＮｕｍｂｅｒｏｆＤｏｗｎｌｏａｄｓａｎｄＣｉｔａｔｉｏｎｓ［Ｊ］．Ｓｃｉｅｎｔｏｍｅｔｒｉｃｓ，２０１１，８８（２）：６５３－６６１．

［８］ＮｉｅｒｉＭ，ＣｌａｕｓｅｒＣ，ＦｒａｎｃｅｓｃｈｉＤ，ｅｔａｌ．ＲａｎｄｏｍｉｚｅｄＣｌｉｎｉｃａｌＴｒｉａｌｓｉｎＩｍｐｌａｎｔＴｈｅｒａｐｙ：ＲｅｌａｔｉｏｎｓｈｉｐｓＡｍｏｎｇＭｅｔｈｏｄｏｌｏｇｉｃａｌ，Ｓｔａｔｉｓｔｉｃａｌ，Ｃｌｉｎｉｃａｌ，ＰａｒａｔｅｘｔｕａｌＦｅａｔｕｒｅｓａｎｄＮｕｍｂｅｒｏｆＣｉｔａｔｉｏｎｓ［Ｊ］．ＣｌｉｎｉｃａｌＯｒａｌＩｍｐｌａｎｔｓＲｅｓｅａｒｃｈ，２００７，１８（４）：４１９－４３１．

［９］盛麗娜，顧歡．基于學(xué)科角度的論文長度與被引頻次關(guān)系研究［Ｊ］．情報雜志，２０１９，３８（４）：１１１－１１８，１１０．

［１０］ＬｅｅｕｗｅｎＴＮ，ＭｏｅｄＨＦ．ＣｈａｒａｃｔｅｒｉｓｔｉｃｓｏｆＪｏｕｒｎａｌＩｍｐａｃｔＦａｃ?ｔｏｒｓ：ＴｈｅＥｆｆｅｃｔｓｏｆＵｎｃｉｔｅｄｎｅｓｓａｎｄＣｉｔａｔｉｏｎＤｉｓｔｒｉｂｕｔｉｏｎｏｎｔｈｅＵｎ?ｄｅｒｓｔａｎｄｉｎｇｏｆＪｏｕｒｎａｌＩｍｐａｃｔＦａｃｔｏｒｓ［Ｊ］．Ｓｃｉｅｎｔｏｍｅｔｒｉｃｓ，２００５，６３（２）：３５７－３７１．

［１１］楊瑞仙，李賢．科學(xué)合作與論文影響力之間的相關(guān)性研究［Ｊ］．現(xiàn)代情報，２０１９，３９（４）：１２５－１３３．

［１２］謝娟，成穎，李江，等．文化資本與論文影響力的關(guān)系［Ｊ］．情報學(xué)報，２０１９，３８（９）：９４３－９５３．

［１３］ＡｄａｍｓＪ．ＥａｒｌｙＣｉｔａｔｉｏｎＣｏｕｎｔｓＣｏｒｒｅｌａｔｅｗｉｔｈＡｃｃｕｍｕｌａｔｅｄＩｍ?ｐａｃｔ［Ｊ］．Ｓｃｉｅｎｔｏｍｅｔｒｉｃｓ，２００５，６３（３）：５６７－５８１．

［１４］ＹｕＴ，ＹｕＧ，ＬｉＰＹ，ｅｔａｌ．ＣｉｔａｔｉｏｎＩｍｐａｃｔＰｒｅｄｉｃｔｉｏｎｆｏｒＳｃｉｅｎ?ｔｉｆｉｃＰａｐｅｒｓＵｓｉｎｇＳｔｅｐｗｉｓｅＲｅｇｒｅｓｓｉｏｎＡｎａｌｙｓｉｓ［Ｊ］．Ｓｃｉｅｎｔｏｍｅｔｒｉｃｓ，２０１４，１０１：１２３３－１２５２．

［１５］李悅，馬亞雪，張宇，等．基于知識關(guān)聯(lián)度的科學(xué)論文擴散效果預(yù)測研究———早期施引文獻的作用［Ｊ］．現(xiàn)代情報，２０２３，４３（１１）：７３－８４．

［１６］李奇，李秀霞，臧志棟．作者文獻被引廣度與被引深度分析［Ｊ］．科學(xué)與管理，２０２４，４４（４）：５２－５８．

［１７］阮選敏．學(xué)術(shù)圖書被引外部影響因素及被引預(yù)測研究［Ｄ］．南京：南京大學(xué)，２０２０．

［１８］ＡｂｒａｍｏＧ，Ｄ‘ＡｎｇｅｌｏＣＡ，ＦｅｌｉｃｉＧ．ＰｒｅｄｉｃｔｉｎｇＰｕｂｌｉｃａｔｉｏｎＬｏｎｇ－ＴｅｒｍＩｍｐａｃｔＴｈｒｏｕｇｈａＣｏｍｂｉｎａｔｉｏｎｏｆＥａｒｌｙＣｉｔａｔｉｏｎｓａｎｄＪｏｕｒｎａｌＩｍ?ｐａｃｔＦａｃｔｏｒ［Ｊ］．ＪｏｕｒｎａｌｏｆＩｎｆｏｒｍｅｔｒｉｃｓ，２０１９，１３（１）：３２－４９．

［１９］ＨｉｌｍｅｒＣＥ，ＬｕｓｋＪＬ．ＤｅｔｅｒｍｉｎａｎｔｓｏｆＣｉｔａｔｉｏｎｓｔｏｔｈｅＡｇｒｉｃｕｌ?ｔｕｒａｌａｎｄＡｐｐｌｉｅｄＥｃｏｎｏｍｉｃｓＡｓｓｏｃｉａｔｉｏｎＪｏｕｒｎａｌｓ［Ｊ］．ＲｅｖｉｅｗｏｆＡｇｒｉｃｕｌｔｕｒａｌＥｃｏｎｏｍｉｃｓ，２００９，３１（４）：６７７－６９４．

［２０］ＹａｎｇＳＬ，ＨａｎＲＺ．ＢｒｅａｄｔｈａｎｄＤｅｐｔｈｏｆＣｉｔａｔｉｏｎＤｉｓｔｒｉｂｕｔｉｏｎ［Ｊ］．ＩｎｆｏｒｍａｔｉｏｎＰｒｏｃｅｓｓｉｎｇａｎｄＭａｎａｇｅｍｅｎｔ，２０１５，５１（２）：１３０－１４０．

［２１］俞立平，萬曉云，項益鳴，等．一個評價學(xué)術(shù)期刊知識擴散深度的新指標(biāo)———ＣＪＨ指數(shù)［Ｊ］．情報雜志，２０１９，３８（８）：１４５－１５０．

［２２］魏緒秋，郭鳳嬌，于淼．微觀視域下的圖書知識擴散特征探析［Ｊ］．情報科學(xué)，２０２１，３９（３）：３７－４３．

［２３］梁國強，侯海燕，高桐，等．基于創(chuàng)新擴散理論的學(xué)術(shù)論文影響力廣度研究［Ｊ］．圖書情報工作，２０１９，６３（２）：９１－９８．

［２４］ＬｉｕＹＸ，ＲｏｕｓｓｅａｕＲ．ＫｎｏｗｌｅｄｇｅＤｉｆｆｕｓｉｏｎＴｈｒｏｕｇｈＰｕｂｌｉｃａｔｉｏｎｓａｎｄＣｉｔａｔｉｏｎｓ：ＡＣａｓｅＳｔｕｄｙＵｓｉｎｇＥＳＩ－ＦｉｅｌｄｓａｓＵｎｉｔｏｆＤｉｆｆｕｓｉｏｎ［Ｊ］．ＪｏｕｒｎａｌｏｆｔｈｅＡｍｅｒｉｃａｎＳｏｃｉｅｔｙｆｏｒＩｎｆｏｒｍａｔｉｏｎＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，２００９，６１：３４０－３５１．

［２５］ＲｏｗｌａｎｄｓＩ．ＪｏｕｒｎａｌＤｉｆｆｕｓｉｏｎＦａｃｔｏｒｓ：ＡＮｅｗＡｐｐｒｏａｃｈｔｏＭｅａｓ?ｕｒｉｎｇＲｅｓｅａｒｃｈＩｎｆｌｕｅｎｃｅ［Ｊ］．ＡｓｌｉｂＰｒｏｃｅｅｄｉｎｇｓ，２００２，５４（２）：７７－８４．

［２６］逄順欣．基于知識擴散的作者學(xué)術(shù)影響力評價研究［Ｄ］．曲阜：曲阜師范大學(xué)，２０２１．

［２７］ＰｒｉｅｍＪ，ＰｉｗｏｗａｒＨ，ＯｒｒＲ．ＯｐｅｎＡｌｅｘ：Ａｒｕｌｌｙ－ＯｐｅｎＩｎｄｅｘｏｆＳｃｈｏｌａｒｌｙＷｏｒｋｓ，Ａｕｔｈｏｒｓ，Ｖｅｎｕｅｓ，Ｉｎｓｔｉｔｕｔｉｏｎｓ，ａｎｄＣｏｎｃｅｐｔｓ［ＥＢ／ＯＬ］．［２０２４－０４－０９］．ｈｔｔｐｓ：／／ａｒｘｉｖ．ｏｒｇ／ａｂｓ／２２０５．０１８３３ｖ２．

［２８］鄭智涵，李昕雨，孟凡，等．融合多種特征的多學(xué)科引文分類研究［Ｊ］．情報學(xué)報，２０２４，４３（６）：６５８－６７１．

［２９］ＮａｒｉｎＦ，欒春娟，胡志剛．施引側(cè)文獻計量指標(biāo)的設(shè)置、優(yōu)勢與應(yīng)用研究［Ｊ］．科學(xué)與管理，２０２３，４３（６）：５６－６１．

［３０］ＸｕＨＭ，ＬｉｕＭＪ，ＢｕＹ，ｅｔａｌ．ＴｈｅＩｍｐａｃｔｏｆＨｅｔｅｒｏｇｅｎｅｏｕｓＳｈａｒｅｄＬｅａｄｅｒｓｈｉｐｉｎＳｃｉｅｎｔｉｆｉｃＴｅａｍｓ［Ｊ］．ＩｎｆｏｒｍａｔｉｏｎＰｒｏｃｅｓｓｉｎｇａｎｄＭａｎａｇｅｍｅｎｔ，２０２４，６１（１）：１０３５４２．

［３１］ＡｒｎａｂｏｌｄｉＶ，ＣｏｎｔｉＭ，ＰａｓｓａｒｅｌｌａＡ，ｅｔａｌ．ＯｎｌｉｎｅＳｏｃｉａｌＮｅｔ?ｗｏｒｋｓａｎｄＩｎｆｏｒｍａｔｉｏｎＤｉｆｆｕｓｉｏｎ：ｔｈｅＲｏｌｅｏｆＥｇｏＮｅｔｗｏｒｋｓ［Ｊ］．ＯｎｌｉｎｅＳｏｃｉａｌＮｅｔｗｏｒｋｓａｎｄＭｅｄｉａ，２０１７，１：４４－５５．

［３２］ＧｏｅｌＳ，ＡｎｄｅｒｓｏｎＡ，ＨｏｆｍａｎＪ，ｅｔａｌ．ＴｈｅＳｔｒｕｃｔｕｒａｌＶｉｒａｌｉｔｙｏｆＯｎｌｉｎｅＤｉｆｆｕｓｉｏｎ［Ｊ］．ＭａｎａｇｅｍｅｎｔＳｃｉｅｎｃｅ，２０１５，６２（１）：１８０－１９６．

［３３］閔超，ＤｉｎｇＹ，李江，等．單篇論著的引文擴散［Ｊ］．情報學(xué)報，２０１８，３７（４）：３４１－３５０．

［３４］劉運梅，馬費成．面向全文本內(nèi)容分析的文獻三角引用現(xiàn)象研究［Ｊ］．中國圖書館學(xué)報，２０２１，４７（３）：８４－９９．

［３５］ＬｉｕＹＭ，ＹａｎｇＬ，ＣｈｅｎＭ．ＡＮｅｗＣｉｔａｔｉｏｎＣｏｎｃｅｐｔ：Ｔｒｉａｎｇｕ?ｌａｒＣｉｔａｔｉｏｎｉｎｔｈｅＬｉｔｅｒａｔｕｒｅ［Ｊ］．ＪｏｕｒｎａｌｏｆＩｎｆｏｒｍｅｔｒｉｃｓ，２０２１，１５（２）：１０１１４１．

［３６］劉運梅，張帥，司湘云，等．基于內(nèi)容標(biāo)注的三角引用動機研究方法探析［Ｊ］．圖書情報工作，２０２１，６５（１０）：４８－５５．

［３７］劉運梅，李冉，盛小平．隱形三角引用：科學(xué)論文中的不規(guī)范引用行為［Ｊ］．現(xiàn)代情報，２０２４，４４（４）：１２７－１４１．

［３８］徐建中，王名揚．文獻被引特征空間上的引文模式分析［Ｊ］．情報雜志，２０１３，３２（１１）：５５－５８．［３９］ＷａｎｇＪ，ＺｈａｎｇＬＷ．ＰｒｏｘｉｍａｌＡｄｖａｎｔａｇｅｉｎＫｎｏｗｌｅｄｇｅＤｉｆｆｕｓｉｏｎ：ＴｈｅＴｉｍｅＤｉｍｅｎｓｉｏｎ［Ｊ］．ＪｏｕｒｎａｌｏｆＩｎｆｏｒｍｅｔｒｉｃｓ，２０１８，１２（３）：８５８－８６７．

［４０］ＡｂｒａｍｏＧ，ＤＡｎｇｅｌｏＣＡ，ＣｏｓｔａＦＤ．ＴｈｅＲｏｌｅｏｆＧｅｏｇｒａｐｈｉｃａｌＰｒｏｘｉｍｉｔｙｉｎＫｎｏｗｌｅｄｇｅＤｉｆｆｕｓｉｏｎ，ＭｅａｓｕｒｅｄｂｙＣｉｔａｔｉｏｎｓｔｏＳｃｉｅｎｔｉｆｉｃＬｉｔｅｒａｔｕｒｅ［Ｊ］．ＪｏｕｒｎａｌｏｆＩｎｆｏｒｍｅｔｒｉｃｓ，２０２０，１４（１）：１０１０１０．

［４１］ＷｕＪ．ＧｅｏｇｒａｐｈｉｃａｌＫｎｏｗｌｅｄｇｅＤｉｆｆｕｓｉｏｎａｎｄＳｐａｔｉａｌＤｉｖｅｒｓｉｔｙＣｉ?ｔａｔｉｏｎＲａｎｋ［Ｊ］．Ｓｃｉｅｎｔｏｍｅｔｒｉｃｓ，２０１３，９４（１）：１８１－２０１．

［４２］ＢｒｉｌｌｏｕｉｎＬ．ＳｃｉｅｎｃｅａｎｄＩｎｆｏｒｍａｔｉｏｎＴｈｅｏｒｙ［Ｍ］．ＮｅｗＹｏｒｋ：ＡｃａｄｅｍｉｃＰｒｅｓｓ，１９５６．

［４３］宋宜嘉，樓雯，趙星．基于布里淵指數(shù)的期刊多維度影響力多樣性測度［Ｊ］．圖書館建設(shè)，２０２３（１）：１１８－１２７．

［４４］ＳｔｅｅｌｅＴＷ，ＳｔｉｅｒＪＣ．ＴｈｅＩｍｐａｃｔｏｆＩｎｔｅｒｄｉｓｃｉｐｌｉｎａｒｙＲｅｓｅａｒｃｈｉｎｔｈｅＥｎｖｉｒｏｎｍｅｎｔａｌＳｃｉｅｎｃｅｓ：ＡＦｏｒｅｓｔｒｙＣａｓｅＳｔｕｄｙ［Ｊ］．ＪｏｕｒｎａｌｏｆｔｈｅＡｍｅｒｉｃａｎＳｏｃｉｅｔｙｆｏｒＩｎｆｏｒｍａｔｉｏｎＳｃｉｅｎｃｅ，２０００，５１（５）：４７６－４８４．

［４５］李江． “跨學(xué)科性” 的概念框架與測度［Ｊ］．圖書情報知識，２０１４（３）：８７－９３．

［４６］ＨｕａｎｇＭＨ，ＣｈａｎｇＹＷ．ＡＣｏｍｐａｒａｔｉｖｅＳｔｕｄｙｏｆＩｎｔｅｒｄｉｓｃｉｐｌｉｎａｒｙＣｈａｎｇｅｓＢｅｔｗｅｅｎＩｎｆｏｒｍａｔｉｏｎＳｃｉｅｎｃｅａｎｄＬｉｂｒａｒｙＳｃｉｅｎｃｅ［Ｊ］．Ｓｃｉ?ｅｎｔｏｍｅｔｒｉｃｓ，２０１２，９１（３）：７８９－８０３．

［４７］陳必坤，劉鈺馨，白寬，等．基于科學(xué)建模的學(xué)科交叉測度研究綜述［Ｊ］．圖書情報工作，２０２２，６６（１８）：１２６－１３９．

［４８］邵瑞華，李亮，劉勐．學(xué)科交叉程度與文獻學(xué)術(shù)影響力的關(guān)系研究———以圖書情報學(xué)為例［Ｊ］．情報雜志，２０１８，３７（３）：１４６－１５１．

［４９］溫芳芳．自引研究綜述：科學(xué)評價與科學(xué)交流中的質(zhì)疑、求證與創(chuàng)新［Ｊ］．圖書情報工作，２０１９，６３（２１）：１１７－１２７．

［５０］ＭｕｂｉｎＯ，ＡｒｓａｌａｎＭ，ＭａｈｍｕｄＡ．ＴｒａｃｋｉｎｇｔｈｅＦｏｌｌｏｗ－ｕｐｏｆＷｏｒｋｉｎＰｒｏｇｒｅｓｓＰａｐｅｒｓ［Ｊ］．Ｓｃｉｅｎｔｏｍｅｔｒｉｃｓ，２０１８，１１４（３）：１１５９－１１７４．

［５１］ＳｃｈｒｅｉｂｅｒＭ．Ｓｅｌｆ－ＣｉｔａｔｉｏｎＣｏｒｒｅｃｔｉｏｎｓｆｏｒｔｈｅＨｉｒｓｃｈＩｎｄｅｘ［Ｊ］．ＥｕｒｏｐｈｙｓｉｃｓＬｅｔｔｅｒｓ，２００７，７８（３）：３０００２．

［５２］ＣｏｓｔａｓＲ，ＬｅｅｕｗｅｎＴＮ，ＢｏｒｄｏｎｓＭ．Ｓｅｌｆ－ＣｉｔａｔｉｏｎｓａｔｔｈｅＭｅｓｏａｎｄＩｎｄｉｖｉｄｕａｌＬｅｖｅｌｓ：ＥｆｆｅｃｔｓｏｆＤｉｆｆｅｒｅｎｔＣａｌｃｕｌａｔｉｏｎＭｅｔｈｏｄｓ［Ｊ］．Ｓｃｉｅｎｔｏｍｅｔｒｉｃｓ，２０１０，８２（３）：５１７－５３７．

［５３］梁興堃．圖情檔研究中的回歸分析：基本原理［Ｊ］．圖書情報知識，２０２１，３８（３）：１５４－１６４．

［５４］陳悅，宋超，周京生，等．文獻計量學(xué)視角下的論文被引頻次影響因素研究———兼評使用與被引之間關(guān)系［Ｊ］．情報雜志，２０１９，３８（４）：９６－１０４．

［５５］ＡｈｒｅｎｓＡ，ＨａｎｓｅｎＣＢ，ＳｃｈａｆｆｅｒＭＥ，ｅｔａｌ．ＤＤＭＬ：Ｄｏｕｂｌｅ／ＤｅｂｉａｓｅｄＭａｃｈｉｎｅＬｅａｒｎｉｎｇｉｎＳｔａｔａ［Ｊ］．ＴｈｅＳｔａｔａＪｏｕｒｎａｌ，２０２４，２４（１）：３－４５．

［５６］ＢａｃｈＰ，ＣｈｅｒｎｏｚｈｕｋｏｖＶ，ＫｕｒｚＭＳ，ｅｔａｌ．ＤｏｕｂｌｅＭＬ－ＡｎＯｂ?ｊｅｃｔ－ＯｒｉｅｎｔｅｄＩｍｐｌｅｍｅｎｔａｔｉｏｎｏｆＤｏｕｂｌｅＭａｃｈｉｎｅＬｅａｒｎｉｎｇｉｎＰｙｔｈｏｎ［Ｊ］．ＪｏｕｒｎａｌｏｆＭａｃｈｉｎｅＬｅａｒｎｉｎｇＲｅｓｅａｒｃｈ，２０２２（２３）：１－６．

［５７］蔣墨冰，李瑩，徐曉慧．反壟斷法與科技企業(yè)進入———基于雙重機器學(xué)習(xí)的因果推斷［Ｊ］．科學(xué)學(xué)研究，２０２５，４３（４）：８６４－８７５．

（責(zé)任編輯：郭沫含）

基金項目：廣州市基礎(chǔ)與應(yīng)用基礎(chǔ)研究項目“基于全文本挖掘的科技論文作者合作模式研究” （項目編號：２０２４Ａ０４Ｊ４３９３）。

現(xiàn)代情報2025年5期

現(xiàn)代情報的其它文章: 主動知識貢獻對在線健康社區(qū)擇醫(yī)行為的影響研究; 面向健康管理的個體健康畫像概念模型構(gòu)建; 基于軌跡聚類分析的中國人文領(lǐng)域核心學(xué)者成長模式研究; 多維度涉企網(wǎng)絡(luò)輿情對企業(yè)價值的影響研究; 基于多案例數(shù)據(jù)的突發(fā)事件網(wǎng)絡(luò)輿情傳播組態(tài)路徑及其影響研究; 生成式人工智能訓(xùn)練數(shù)據(jù)風(fēng)險治理：歐盟經(jīng)驗及其啟示

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

早期引文擴散深廣度對論文后期擴散強度的影響