朱世琴 范丹丹 茍文靜
(華東理工大學(xué)科技信息研究所,上海 200237)
科學(xué)技術(shù)的每一個(gè)學(xué)科都會(huì)或多或少、或遠(yuǎn)或近地與其他任何一個(gè)學(xué)科相關(guān)聯(lián)[1]。學(xué)科間通過(guò)引文知識(shí)擴(kuò)散,并不斷借鑒其他學(xué)科有益的理論和方法,逐漸交叉滲透與融合,從而達(dá)到知識(shí)創(chuàng)新、科學(xué)發(fā)展的目的。知識(shí)擴(kuò)散反映了知識(shí)的傳遞、繼承、應(yīng)用與創(chuàng)新[2]。探討論文的知識(shí)擴(kuò)散對(duì)科研評(píng)估、科學(xué)預(yù)測(cè)以及準(zhǔn)確衡量學(xué)科交叉產(chǎn)生的科研成果影響力具有潛在價(jià)值。十四五規(guī)劃明確提出:為推動(dòng)科技自立自強(qiáng),需要加強(qiáng)基礎(chǔ)研究、注重原始創(chuàng)新,優(yōu)化學(xué)科布局和研發(fā)布局,推進(jìn)學(xué)科交叉融合??梢?jiàn),學(xué)科交叉研究受到政府和學(xué)術(shù)界的高度關(guān)注。目前,國(guó)內(nèi)外對(duì)學(xué)科交叉與知識(shí)產(chǎn)出的關(guān)系已開(kāi)展了廣泛的研究,主要關(guān)注學(xué)科交叉與論文學(xué)術(shù)影響力的關(guān)系,但對(duì)于論文中知識(shí)擴(kuò)散的廣度、速度及強(qiáng)度鮮有探究,沒(méi)有關(guān)注學(xué)科交叉程度與知識(shí)擴(kuò)散的關(guān)系。本研究旨在計(jì)算論文的學(xué)科交叉度,探索學(xué)科交叉的實(shí)際效果和影響,從而判斷學(xué)科交叉程度與知識(shí)擴(kuò)散的關(guān)系。
學(xué)科交叉反映了不同學(xué)科之間的知識(shí)流動(dòng)和滲透,在科學(xué)研究中發(fā)揮著關(guān)鍵作用,并產(chǎn)生了許多開(kāi)創(chuàng)性的科學(xué)發(fā)現(xiàn)。但學(xué)科交叉程度對(duì)論文價(jià)值的影響還有待思考。許多學(xué)者對(duì)學(xué)科交叉的意義進(jìn)行了深入研究,嘗試從不同角度探索學(xué)科交叉成果的實(shí)際效果和影響力。
1)學(xué)科交叉與被引頻次的關(guān)系研究
Stopar K等[3]從主題和參考文獻(xiàn)兩個(gè)角度研究林業(yè)學(xué)科論文,研究發(fā)現(xiàn)論文學(xué)科交叉程度越高,被引頻次越高,學(xué)科交叉研究對(duì)林業(yè)論文的學(xué)術(shù)影響力具有促進(jìn)作用。Alfredo Y Y等[4]從參考文獻(xiàn)多樣性、均衡性、差異性角度出發(fā),使用Tobit回歸模型分析學(xué)科交叉程度與論文影響力的關(guān)系,研究發(fā)現(xiàn)學(xué)科多樣性與影響力呈正相關(guān)關(guān)系,多樣性處于中等程度的論文影響力最強(qiáng)。Levitt J M等[5]對(duì)圖書(shū)情報(bào)領(lǐng)域前0.1%的高被引論文進(jìn)行分析,發(fā)現(xiàn)多數(shù)高被引論文至少涉及兩個(gè)學(xué)科,即學(xué)科交叉研究相比單一的學(xué)科研究能產(chǎn)生更高的學(xué)術(shù)影響,推廣學(xué)科交叉研究有利于提高圖書(shū)情報(bào)領(lǐng)域的論文質(zhì)量。張琳等[6]引入PLOS官方平臺(tái)的使用數(shù)據(jù),結(jié)合引用數(shù)據(jù)對(duì)學(xué)科交叉研究成果進(jìn)行綜合評(píng)價(jià),發(fā)現(xiàn)學(xué)科交叉水平與論文影響力有一定正相關(guān)關(guān)系,學(xué)科交叉程度對(duì)使用數(shù)據(jù)和引用數(shù)據(jù)之間的相關(guān)關(guān)系有顯著影響。Chen S等[7]從不同維度探討學(xué)科交叉程度與高被引論文影響力的關(guān)系,發(fā)現(xiàn)無(wú)論是否考慮控制變量,多樣性和差異性明顯促進(jìn)論文的影響力,而平衡性不利于論文的影響力。
雖然學(xué)科交叉研究一直被各界廣泛關(guān)注,產(chǎn)生了許多高影響力的學(xué)術(shù)成果,但學(xué)科交叉是否產(chǎn)生更高的實(shí)際效果和影響力仍存在分歧。Levitt J M等[8]將自然科學(xué)和醫(yī)學(xué)類(lèi)期刊作為研究對(duì)象,研究發(fā)現(xiàn)多學(xué)科期刊的引文數(shù)量遠(yuǎn)少于單一學(xué)科期刊。Zhang L等[9]對(duì)7種不同學(xué)科的TOP期刊研究發(fā)現(xiàn),學(xué)科交叉程度和引文數(shù)量的關(guān)系因?qū)W科而異,數(shù)學(xué)學(xué)科交叉程度越高,引文數(shù)量越多,與之相反,生物信息學(xué)的引文數(shù)量隨交叉程度提高而降低。
2)學(xué)科交叉與其他指標(biāo)的關(guān)系研究
除了對(duì)學(xué)科交叉程度與影響力的關(guān)系進(jìn)行探討外,學(xué)者們還從不同層面對(duì)學(xué)科交叉成果的價(jià)值進(jìn)行測(cè)度。Bromham L等[10]對(duì)學(xué)科交叉程度與基金資助的關(guān)系進(jìn)行探究,發(fā)現(xiàn)學(xué)科交叉程度越高,基金申請(qǐng)成功率越低。王菲菲等[11]使用Tobit回歸模型對(duì)學(xué)科交叉程度與論文價(jià)值成長(zhǎng)老化指標(biāo)進(jìn)行分析,發(fā)現(xiàn)學(xué)科交叉度與論文成長(zhǎng)老化指標(biāo)呈倒U型關(guān)系。開(kāi)濱等[12]采集了6個(gè)SCI學(xué)科中的睡美人文獻(xiàn),對(duì)其學(xué)科交叉特征的相關(guān)性、獨(dú)特性和差異性進(jìn)行分析,發(fā)現(xiàn)論文的睡美人特征越強(qiáng),學(xué)科交叉程度越高。徐璐等[13]以圖書(shū)情報(bào)領(lǐng)域18種核心期刊為研究樣本,探討了期刊的跨學(xué)科引用對(duì)知識(shí)輸出的影響,發(fā)現(xiàn)期刊跨學(xué)科引用有助于擴(kuò)大知識(shí)輸出的學(xué)科范圍,增強(qiáng)了該學(xué)科對(duì)其他學(xué)科的影響力,但降低了跨學(xué)科知識(shí)輸出的速度。
知識(shí)擴(kuò)散作為知識(shí)生產(chǎn)和傳播的重要組成部分,在知識(shí)創(chuàng)新過(guò)程中發(fā)揮著重要作用[14]。關(guān)于知識(shí)擴(kuò)散的相關(guān)研究,國(guó)內(nèi)學(xué)者已經(jīng)取得了一些研究成果。
現(xiàn)有學(xué)者多是將知識(shí)擴(kuò)散作為評(píng)價(jià)指標(biāo),如趙蓉英等[15]通過(guò)作者知識(shí)擴(kuò)散廣度、深度等指標(biāo),評(píng)價(jià)作者知識(shí)擴(kuò)散的貢獻(xiàn)程度。Ding J等[14]使用知識(shí)擴(kuò)散廣度、強(qiáng)度、速度和主題探討圖書(shū)情報(bào)學(xué)的知識(shí)擴(kuò)散發(fā)展趨勢(shì)及其對(duì)其他學(xué)科的影響。魏緒秋等[2]以圖書(shū)情報(bào)學(xué)領(lǐng)域的圖書(shū)為研究對(duì)象,發(fā)現(xiàn)圖書(shū)知識(shí)擴(kuò)散深度、擴(kuò)散速度、擴(kuò)散指數(shù)和擴(kuò)散強(qiáng)度4個(gè)指標(biāo)與圖書(shū)被引頻次相關(guān)性極強(qiáng)。但缺乏對(duì)影響知識(shí)擴(kuò)散的因素的研究,僅張雪等[16]以中國(guó)醫(yī)藥領(lǐng)域?yàn)檠芯繉?duì)象,分析專(zhuān)利的知識(shí)吸收對(duì)知識(shí)擴(kuò)散廣度、強(qiáng)度、速度的影響,發(fā)現(xiàn)不同的知識(shí)吸收指標(biāo)對(duì)知識(shí)擴(kuò)散廣度、強(qiáng)度、速度產(chǎn)生不同影響。
縱觀上述研究可知:現(xiàn)有研究主要聚焦在學(xué)科、期刊及作者的知識(shí)擴(kuò)散特征上,忽視了將學(xué)術(shù)論文這一學(xué)科交叉成果作為研究對(duì)象,論文知識(shí)擴(kuò)散能力代表了知識(shí)傳播與知識(shí)流動(dòng)能力,知識(shí)在不同學(xué)科之間流動(dòng),有助于產(chǎn)生新的知識(shí)點(diǎn),了解論文在不同學(xué)科的知識(shí)擴(kuò)散可以更好地提高知識(shí)價(jià)值。目前對(duì)學(xué)科交叉成果的科學(xué)認(rèn)定及價(jià)值評(píng)估的角度較為單一,可以嘗試從論文知識(shí)擴(kuò)散視角進(jìn)行佐證,了解學(xué)科交叉與知識(shí)擴(kuò)散的相關(guān)性可以為評(píng)估學(xué)科交叉成果提供參考。但是現(xiàn)有研究尚未提及學(xué)科交叉與知識(shí)擴(kuò)散的關(guān)系研究。
據(jù)此,本文提出以下研究問(wèn)題:學(xué)術(shù)論文的學(xué)科交叉程度與知識(shí)擴(kuò)散是否有相關(guān)關(guān)系?學(xué)術(shù)論文的學(xué)科交叉對(duì)知識(shí)擴(kuò)散會(huì)產(chǎn)生怎樣的影響?本研究將嘗試以基因工程領(lǐng)域論文為研究對(duì)象,通過(guò)參考文獻(xiàn)從學(xué)科交叉綜合指標(biāo)和3個(gè)單一維度指標(biāo)測(cè)度論文的學(xué)科交叉程度;通過(guò)引證文獻(xiàn)從論文知識(shí)擴(kuò)散廣度、知識(shí)擴(kuò)散強(qiáng)度、知識(shí)擴(kuò)散速度視角衡量論文的知識(shí)擴(kuò)散程度;并采用Tobit回歸模型對(duì)論文學(xué)科交叉和知識(shí)擴(kuò)散之間的關(guān)系進(jìn)行探析。
為探析論文知識(shí)擴(kuò)散特征,本研究結(jié)合Liu Y等[17]在2010年提出的學(xué)科知識(shí)擴(kuò)散廣度、強(qiáng)度以及速度,引入論文知識(shí)擴(kuò)散廣度、強(qiáng)度以及速度3個(gè)測(cè)度指標(biāo)。
1)論文知識(shí)擴(kuò)散廣度(KDB)。引證學(xué)科數(shù)量從學(xué)科層面量化了學(xué)術(shù)論文影響力廣度,對(duì)于一篇論文,引證該篇論文所屬的JCR學(xué)科(去重)數(shù)量就是該篇論文知識(shí)擴(kuò)散廣度。學(xué)術(shù)論文的引證文獻(xiàn)所屬學(xué)科越多,學(xué)術(shù)論文影響廣度越大。
2)知識(shí)擴(kuò)散強(qiáng)度(KDD)。對(duì)于一篇論文,知識(shí)擴(kuò)散強(qiáng)度等于該論文某一學(xué)科引證該論文最高的次數(shù)。引證某一學(xué)科論文數(shù)量越多,說(shuō)明該論文的方法技術(shù)、理論知識(shí)對(duì)該學(xué)科影響力越強(qiáng)。
3)知識(shí)擴(kuò)散速度(KDS)。一篇論文發(fā)表后,引用該論文的(去重)學(xué)科數(shù)量與統(tǒng)計(jì)起點(diǎn)到終點(diǎn)年數(shù)的比值,可以用來(lái)量化論文知識(shí)的整體擴(kuò)散速度。
陳仕吉[18]指出,導(dǎo)致學(xué)科交叉研究與影響力關(guān)系不同的一個(gè)原因在于學(xué)者們?cè)跍y(cè)度學(xué)科交叉程度時(shí),并未使用統(tǒng)一的測(cè)度指標(biāo),只是涉及學(xué)科多樣性的一到兩個(gè)維度。為排除學(xué)科交叉測(cè)度指標(biāo)不同所帶來(lái)的影響,本文根據(jù)Stirling A[19]提出的學(xué)科多樣性3個(gè)測(cè)度屬性,即多樣性、均衡性、差異性,選擇V、B、D作為學(xué)科交叉單一測(cè)度指標(biāo),Rao-Stirling指標(biāo)作為學(xué)科交叉綜合測(cè)度指標(biāo),在文中簡(jiǎn)稱(chēng)為R。
1)V指標(biāo)。指一篇論文參考文獻(xiàn)所屬JCR學(xué)科的類(lèi)別,被用作測(cè)度學(xué)科交叉多樣性。若參考文獻(xiàn)所屬學(xué)科類(lèi)別越多,則學(xué)科交叉多樣性越強(qiáng)。
V=n
(1)
2)B指標(biāo)。使用香農(nóng)熵表示一篇論文引文學(xué)科均衡性,如果論文每個(gè)學(xué)科參考文獻(xiàn)的數(shù)量相同,說(shuō)明該論文引文學(xué)科分布均衡,若引文學(xué)科分布越均衡,則學(xué)科交叉程度越高。
(2)
3)D指標(biāo)。通過(guò)計(jì)算學(xué)科之間不同距離分析學(xué)科交叉程度,若一篇論文引文所屬學(xué)科差異性較大,則該論文學(xué)科交叉程度更高。
(3)
4)R指標(biāo)。從多樣性、均衡性及差異性綜合測(cè)度論文學(xué)科交叉程度。若一篇論文參考文獻(xiàn)所屬學(xué)科類(lèi)別非常相似,則該論文學(xué)科交叉程度較低,反之,則越高。
R=∑i,j(1-Si,j)pipj
(4)
其中n為參考文獻(xiàn)所屬學(xué)科類(lèi)別,pi表示學(xué)科i的被引頻次占所有學(xué)科總被引頻次的比例,i不等于j,Si,j表示學(xué)科i和學(xué)科j的相似性程度矩陣中學(xué)科i和學(xué)科j之間的相似性。
由于本研究選取的因變量在正值上連續(xù)分布,存在大量0值,且呈現(xiàn)離散分布,而傳統(tǒng)的最小二乘法回歸模型忽略了0值的重要意義,故不適用于本研究。離散分布數(shù)據(jù)通常采用Tobit、泊松分布、負(fù)二項(xiàng)分布以及零膨脹分布等模型進(jìn)行擬合。在選擇具體模型時(shí),本研究結(jié)合樣本數(shù)據(jù),對(duì)模型一一進(jìn)行檢驗(yàn),最終得到適合本研究所有樣本數(shù)據(jù)集的最佳模型為T(mén)obit模型。Tobit模型適用于受限因變量的情況,采用最大似然法對(duì)參數(shù)進(jìn)行估計(jì),能夠較好地規(guī)避參數(shù)估計(jì)有偏的問(wèn)題[20]。因此,本研究選擇Tobit模型對(duì)論文學(xué)科交叉和知識(shí)擴(kuò)散指標(biāo)進(jìn)行回歸分析。其公式具體如下:
(5)
Y*=β0+βiXi+ε
(6)
式中,Y為因變量,Y*為潛在變量,Xi為自變量,βi為對(duì)應(yīng)的相關(guān)系數(shù),i為第i個(gè)變量,ε為隨機(jī)誤差項(xiàng)。
本研究選取Web of Science核心合集的SCIE數(shù)據(jù)庫(kù)作為數(shù)據(jù)源,以基因工程領(lǐng)域文獻(xiàn)為研究樣本,限定在標(biāo)題或者作者關(guān)鍵詞字段檢索,數(shù)據(jù)檢索時(shí)間為2021年1月。檢索式為T(mén)I=(“gene*engineering”or“DNA engineering”or“gene* manipulat*”or“DNA manipulat*”or“gene*recombinat*”or“transgen*”or“gene*clon*”or“molecular clon*”)or AK=(“gene*engineering”or“DNA engineering”or“gene*manipulat*”or“DNA manipulat*”or“gene*recombinat*”or“transgen*”or“gene*clon*”or“molecular clon*”)。文獻(xiàn)類(lèi)型限定為Article,由于論文存在“延遲引用”現(xiàn)象,絕大部分論文在發(fā)表3年后才被引用[21],為保證一定的引用時(shí)間窗口,所以時(shí)間跨度限定為2000—2018年,最終命中50 142條文獻(xiàn)。選擇“全記錄與引用的參考文獻(xiàn)”格式,導(dǎo)出論文的題錄信息,同時(shí)利用Python爬取每篇論文的引證文獻(xiàn)。
1)構(gòu)建期刊全稱(chēng)—縮寫(xiě)1—縮寫(xiě)2—學(xué)科類(lèi)別對(duì)照表。WoS學(xué)科分類(lèi)體系以期刊為分類(lèi)對(duì)象,更容易獲取參考文獻(xiàn)的學(xué)科數(shù)據(jù),并且WoS學(xué)科包含254個(gè)學(xué)科類(lèi)別,劃分粒度細(xì)致,涵蓋學(xué)科最全,故研究選擇WoS學(xué)科分類(lèi)方法[22]。為計(jì)算單篇論文的學(xué)科交叉指標(biāo)和知識(shí)擴(kuò)散指標(biāo),研究需要根據(jù)論文所屬期刊的學(xué)科類(lèi)別將每篇參考文獻(xiàn)和引證文獻(xiàn)映射到特定的學(xué)科類(lèi)目。首先從JCR下載期刊學(xué)科對(duì)應(yīng)信息,對(duì)照ESI期刊列表構(gòu)建期刊全稱(chēng)—縮寫(xiě)1—縮寫(xiě)2—學(xué)科對(duì)照表;其次發(fā)現(xiàn)部分期刊未被收錄在JCR期刊中,故對(duì)丟失學(xué)科信息的期刊進(jìn)行手動(dòng)補(bǔ)足;最后成功將12 268本期刊匹配到學(xué)科。
2)數(shù)據(jù)清洗。由于題錄信息中包含參考文獻(xiàn)在內(nèi)的多個(gè)字段,故需要對(duì)其進(jìn)行清理。首先刪除參考文獻(xiàn)為0以及題錄信息不全的論文,最終共得到49 997篇論文;其次對(duì)導(dǎo)出的論文提取學(xué)科類(lèi)別、作者、機(jī)構(gòu)、參考文獻(xiàn)等字段,為了避免其他因素對(duì)研究結(jié)果產(chǎn)生影響,本研究設(shè)置4個(gè)控制變量,即合著人數(shù)(AU)、合著機(jī)構(gòu)數(shù)量(N_inst)、國(guó)際合作(I_collab)和國(guó)內(nèi)合作(N_collab)。如果合著機(jī)構(gòu)來(lái)自不同的國(guó)家,則I_collab取1;如果至少有兩個(gè)不同的機(jī)構(gòu)來(lái)自同一個(gè)國(guó)家,則N_collab取1;否則I_collab和N_collab均取0。這些數(shù)據(jù)通過(guò)Excel進(jìn)行手動(dòng)提取得到。
3)學(xué)科映射。通過(guò)論文的參考文獻(xiàn)可以有效獲取各個(gè)學(xué)科的知識(shí)和信息的輸入情況,了解論文知識(shí)的學(xué)科來(lái)源,測(cè)度論文的學(xué)科交叉程度[23]。利用Python提取每篇論文的參考文獻(xiàn)的期刊刊名,通過(guò)構(gòu)建的期刊—學(xué)科對(duì)照表,對(duì)每個(gè)刊名進(jìn)行一一匹配。如果參考文獻(xiàn)和引證文獻(xiàn)涉及的期刊所屬學(xué)科有兩個(gè)以上,為保證數(shù)據(jù)準(zhǔn)確性將其全部計(jì)入統(tǒng)計(jì)結(jié)果。根據(jù)上述步驟,獲得參考文獻(xiàn)共2 045 283篇,期刊未匹配到學(xué)科的參考文獻(xiàn)共212 247篇,匹配率達(dá)89.6%。通過(guò)Python共爬取1 510 875條引證文獻(xiàn),期刊未匹配到學(xué)科的引證文獻(xiàn)共62 735篇,匹配率達(dá)95.8%。
4)指標(biāo)計(jì)算。利用Python計(jì)算每篇論文的學(xué)科交叉程度和知識(shí)擴(kuò)散程度。由于自變量中學(xué)科交叉多樣性指標(biāo)(V)的取值范圍在[1,50],為了讓學(xué)科交叉指標(biāo)更加統(tǒng)一,同時(shí)為消除奇異樣本帶來(lái)的不良影響,因此采用最大—最小值標(biāo)準(zhǔn)化方法,將其區(qū)間映射在[0,1]。而每篇論文的知識(shí)擴(kuò)散廣度、知識(shí)擴(kuò)散強(qiáng)度、知識(shí)擴(kuò)散速度服從偏斜分布,為了減弱這些變量的偏斜分布,使得數(shù)據(jù)更加平穩(wěn),本研究對(duì)這些因變量進(jìn)行加1取對(duì)數(shù)處理[4]。為保證計(jì)算結(jié)果的科學(xué)性與準(zhǔn)確性,本研究將引證文獻(xiàn)和參考文獻(xiàn)的期刊學(xué)科匹配率不足50%的論文刪除,使用Vlookup函數(shù)對(duì)保留的論文進(jìn)行匹配,最終共得到47 873篇論文。采用Stata 15.1統(tǒng)計(jì)軟件對(duì)數(shù)據(jù)進(jìn)行分析。
對(duì)觀測(cè)樣本變量進(jìn)行描述性統(tǒng)計(jì),結(jié)果如表1所示。可以看出,多數(shù)變量標(biāo)準(zhǔn)差較大,呈離散分布,且部分變量存在0值,適用于Tobit模型。
表1 各變量描述性統(tǒng)計(jì)分析
1)學(xué)科交叉論文分布。圖1展示了4個(gè)學(xué)科交叉指標(biāo)的論文頻數(shù)分布,可以看出,基因工程領(lǐng)域?qū)W科交叉綜合程度較低,交叉水平呈現(xiàn)較大差異,分布均衡;引文學(xué)科多樣性集中在較低水平、而差異性呈中等水平,引文學(xué)科分布偏向均衡。說(shuō)明基因工程領(lǐng)域的論文引文學(xué)科多樣性不高,但偏向于引用學(xué)科差異性中等的論文,且引文學(xué)科分布均衡,故基因工程領(lǐng)域?qū)W科交叉整體水平偏低。但是與已有研究[11,25]相比,可以發(fā)現(xiàn)基因工程領(lǐng)域論文的學(xué)科交叉的綜合程度、多樣性、均衡性、差異性均高于醫(yī)學(xué)信息學(xué)和納米科技與納米技術(shù)等領(lǐng)域,適合作為研究對(duì)象。
圖1 學(xué)科交叉指標(biāo)論文頻數(shù)分布直方圖
2)知識(shí)擴(kuò)散論文分布。3個(gè)知識(shí)擴(kuò)散指標(biāo)的論文頻數(shù)分布如圖2所示,可以看出,論文知識(shí)擴(kuò)散兩極差異明顯、分布不均衡,論文分布主要集中在中等擴(kuò)散廣度、低擴(kuò)散強(qiáng)度以及低擴(kuò)散速度區(qū)域。說(shuō)明該領(lǐng)域論文雖然知識(shí)流向?qū)W科范圍廣,但影響力不強(qiáng),傳播速度慢。
圖2 知識(shí)擴(kuò)散指標(biāo)論文頻數(shù)分布直方圖
本研究采用Spearman秩相關(guān)分析,構(gòu)建了學(xué)科交叉綜合指標(biāo)、學(xué)科交叉多樣性指標(biāo)、學(xué)科交叉均衡性指標(biāo)、學(xué)科交叉差異性指標(biāo)、知識(shí)擴(kuò)散廣度指標(biāo)、知識(shí)擴(kuò)散強(qiáng)度指標(biāo)、知識(shí)擴(kuò)散速度指標(biāo)、合著作者數(shù)、合作機(jī)構(gòu)數(shù)、國(guó)際合作和國(guó)內(nèi)合作的相關(guān)關(guān)系矩陣,如表2所示。
從表2可以看出,學(xué)科交叉綜合指標(biāo)、多樣性、均衡性、差異性指標(biāo)與知識(shí)擴(kuò)散廣度、強(qiáng)度、速度的相關(guān)性不同,說(shuō)明從不同維度研究學(xué)科交叉對(duì)知識(shí)擴(kuò)散的影響具有必要性。變量全部通過(guò)了相關(guān)性系數(shù)顯著性檢驗(yàn),所選取的變量具有一定的影響力,且相關(guān)性系數(shù)很低,進(jìn)一步檢驗(yàn)變量的方差膨脹因子,結(jié)果顯示模型并不存在嚴(yán)格意義上的多重共線(xiàn)性,可以將全部變量納入回歸模型進(jìn)行回歸分析驗(yàn)證。
表2 學(xué)科交叉和知識(shí)擴(kuò)散各指標(biāo)變量的相關(guān)矩陣
表2(續(xù))
4.3.1 模型估計(jì)結(jié)果
為更加深入地研究變量之間的依賴(lài)關(guān)系,本文采用Tobit模型研究。將自變量(學(xué)科交叉多樣性、差異性、均衡性、綜合指標(biāo))、因變量(知識(shí)擴(kuò)散廣度)、控制變量(合作機(jī)構(gòu)數(shù)、合著作者數(shù)、跨國(guó)合著機(jī)構(gòu)、國(guó)內(nèi)合著機(jī)構(gòu))代入回歸方程,使用Tobit模型估計(jì)學(xué)科交叉研究對(duì)知識(shí)擴(kuò)散廣度的影響,其中Prob>chi2=0.0000,說(shuō)明模型可信度較高。從表3可以看出,除機(jī)構(gòu)數(shù)外各變量均在至少0.1的水平下通過(guò)了顯著性檢驗(yàn)。從模型1和3可以看出,學(xué)科交叉綜合指數(shù)對(duì)知識(shí)擴(kuò)散廣度的影響在0.05水平上呈正向促進(jìn)作用;學(xué)科交叉多樣性和差異性對(duì)知識(shí)擴(kuò)散廣度的影響也在0.05水平上呈正向作用;而學(xué)科交叉均衡性對(duì)知識(shí)擴(kuò)散廣度的影響則在0.05水平上呈負(fù)向作用。為了驗(yàn)證學(xué)科交叉與知識(shí)擴(kuò)散廣度是否存在U型或倒U型關(guān)系,對(duì)知識(shí)擴(kuò)散廣度的所有一次回歸函數(shù)均加入二次項(xiàng),獲得模型2、4、5和6,具體結(jié)果如表3所示。
表3 Tobit模型估計(jì)學(xué)科交叉研究對(duì)知識(shí)擴(kuò)散廣度的影響
采用Tobit模型估計(jì)學(xué)科交叉研究對(duì)知識(shí)擴(kuò)散強(qiáng)度、知識(shí)擴(kuò)散速度的影響,其研究過(guò)程與上述研究相同,研究結(jié)果和表3類(lèi)似,不再列出。
4.3.2 學(xué)科交叉綜合指標(biāo)與知識(shí)擴(kuò)散指標(biāo)的回歸分析
根據(jù)Tobit模型估計(jì)學(xué)科交叉研究對(duì)知識(shí)擴(kuò)散指標(biāo)的回歸結(jié)果發(fā)現(xiàn),學(xué)科交叉綜合指標(biāo)與知識(shí)擴(kuò)散廣度、強(qiáng)度、速度之間存在統(tǒng)計(jì)學(xué)上的顯著關(guān)系,其關(guān)系式為:
ln(KDB)=-1.566*R2+1.512*R+1.829
(7)
ln(KDD)=0.941*R2-1.397*R+2.128
(8)
ln(KDS)=0.951*R2-0.322*R+0.482
(9)
一篇論文的學(xué)科交叉融合與多樣性越高,吸收的學(xué)科知識(shí)差異越大,R值越大。在一定程度上,該論文的知識(shí)基礎(chǔ)越全面與均衡,越有助于提高學(xué)科影響范圍和擴(kuò)散速度。學(xué)科交叉綜合指標(biāo)與知識(shí)擴(kuò)散廣度兩者呈倒U型關(guān)系,表明論文學(xué)科交叉綜合指標(biāo)在達(dá)到某個(gè)最優(yōu)值前,有利于提升知識(shí)擴(kuò)散的廣度;而達(dá)到最優(yōu)值后,則會(huì)降低知識(shí)擴(kuò)散的廣度。對(duì)于知識(shí)擴(kuò)散強(qiáng)度而言,學(xué)科交叉綜合指標(biāo)對(duì)其影響呈現(xiàn)U型左半邊,最低值為0.74。說(shuō)明當(dāng)R小于0.74時(shí),論文多樣性越高,分布越均衡,學(xué)科差異越大,知識(shí)擴(kuò)散強(qiáng)度越低,反之則越高。對(duì)于知識(shí)擴(kuò)散速度而言,學(xué)科交叉程度對(duì)其影響則呈現(xiàn)U型右半邊,當(dāng)R大于0.17時(shí),學(xué)科交叉綜合指標(biāo)越高,知識(shí)擴(kuò)散速度越快,反之則越低。說(shuō)明論文學(xué)科知識(shí)融合更全面、均衡,在一定程度上會(huì)被更加迅速地傳播到更多學(xué)科,但同時(shí)由于論文知識(shí)專(zhuān)業(yè)度不強(qiáng),會(huì)降低知識(shí)擴(kuò)散強(qiáng)度。
從表1可知,學(xué)科交叉綜合指標(biāo)的平均值為0.38,如果想要提高論文知識(shí)擴(kuò)散廣度、速度使其達(dá)到最優(yōu)值,則需融合種類(lèi)更多、差異性更強(qiáng)的學(xué)科知識(shí)。學(xué)科交叉綜合指標(biāo)與知識(shí)擴(kuò)散廣度、強(qiáng)度、速度關(guān)系如圖3所示。
提取處于極值點(diǎn)的論文進(jìn)行分析。研究發(fā)現(xiàn)共1 404篇論文處于知識(shí)擴(kuò)散廣度極大值點(diǎn),篇均被引頻次為36.2,發(fā)文量最多的學(xué)科為Neurosciences;2篇論文處于知識(shí)擴(kuò)散強(qiáng)度極小值點(diǎn),篇均被引頻次為20,所屬學(xué)科為Biology;共531篇論文處于知識(shí)擴(kuò)散速度極小值點(diǎn),篇均被引頻次為31.1,發(fā)文量最多的學(xué)科為Plant Sciences。
學(xué)科交叉綜合指標(biāo)從學(xué)科多樣性、均衡性及差異性3個(gè)維度綜合測(cè)度論文的學(xué)科交叉程度。為了更加深入分析學(xué)科交叉各維度的影響,本研究分別探討了學(xué)科交叉多樣性、均衡性、差異性3個(gè)指標(biāo)對(duì)知識(shí)擴(kuò)散指標(biāo)的影響。
4.3.3 學(xué)科交叉多樣性指標(biāo)與知識(shí)擴(kuò)散指標(biāo)的回歸分析
根據(jù)Tobit模型回歸結(jié)果發(fā)現(xiàn),學(xué)科交叉多樣性指標(biāo)與知識(shí)擴(kuò)散廣度、強(qiáng)度、速度之間存在統(tǒng)計(jì)學(xué)上的顯著關(guān)系,其關(guān)系式為:
ln(KDB)=-3.045*V2+2.758*V+2.198
(10)
ln(KDD)=-4.658*V2+3.511*V+3.199
(11)
ln(KDS)=-0.534*V2+1.521*V+0.510
(12)
當(dāng)論文引用學(xué)科類(lèi)別越豐富時(shí),知識(shí)傾向于多元發(fā)展,其V值越高,說(shuō)明該論文掌握了多個(gè)學(xué)科的理論和方法,而這些學(xué)科知識(shí)的交叉和融合使得論文的知識(shí)擴(kuò)散學(xué)科范圍更加寬泛,影響力更大,被學(xué)科吸收速度更快。學(xué)科交叉多樣性與知識(shí)擴(kuò)散廣度和強(qiáng)度呈倒U型關(guān)系,說(shuō)明若要提高論文的學(xué)科擴(kuò)散的范圍及影響力,需要融合更多學(xué)科的知識(shí),但存在一個(gè)閾值,當(dāng)學(xué)科種類(lèi)超過(guò)一定數(shù)量時(shí),可能會(huì)造成論文知識(shí)冗雜,主題定位不清晰,科學(xué)性受到質(zhì)疑,從而降低論文的知識(shí)傳播范圍和影響力。結(jié)合表1可知,基因工程論文學(xué)科交叉多樣性的平均值為0.25,低于對(duì)知識(shí)擴(kuò)散廣度和強(qiáng)度影響的最優(yōu)值,表明論文可以適度地增加不同學(xué)科參考文獻(xiàn)引用,提高知識(shí)綜合能力。對(duì)學(xué)科交叉多樣性與知識(shí)擴(kuò)散速度關(guān)系進(jìn)行倒U型檢驗(yàn),發(fā)現(xiàn)兩者不存在倒U型關(guān)系,即學(xué)科交叉多樣性達(dá)到知識(shí)擴(kuò)散速度最優(yōu)值的點(diǎn)大于V的最大值,論文引用學(xué)科類(lèi)別越多,知識(shí)傳播速度越快。學(xué)科交叉多樣性與知識(shí)擴(kuò)散強(qiáng)度、廣度、速度的關(guān)系如圖4所示。
研究發(fā)現(xiàn),共568篇論文處于知識(shí)擴(kuò)散廣度極大值點(diǎn),篇均被引頻次為24.9,發(fā)文量最多的學(xué)科是Biochemistry & Molecular Biology;共1 539篇論文處于知識(shí)擴(kuò)散強(qiáng)度極大值點(diǎn),篇均被引頻次為30.2,發(fā)文量最多的學(xué)科也是Biochemistry & Molecular Biology。
4.3.4 學(xué)科交叉均衡性指標(biāo)與知識(shí)擴(kuò)散指標(biāo)的回歸分析
Tobit模型回歸結(jié)果顯示,學(xué)科交叉均衡性指標(biāo)與知識(shí)擴(kuò)散廣度、強(qiáng)度、速度之間存在統(tǒng)計(jì)學(xué)上的顯著關(guān)系,其關(guān)系式為:
ln(KDB)=-2.245*B2+2.849*B+1.050
(13)
ln(KDD)=-5.098*B2+6.220*B+0.464
(14)
ln(KDS)=-0.550*B2+0.491*B+0.217
(15)
論文所引用各學(xué)科的參考文獻(xiàn)數(shù)量越均衡,理論基礎(chǔ)和系統(tǒng)知識(shí)越堅(jiān)實(shí),B值越大,其科學(xué)性越高[11],吸引更多學(xué)科引用,領(lǐng)域知識(shí)在學(xué)科中傳播速度越快,影響力越大。學(xué)科交叉均衡性與知識(shí)擴(kuò)散廣度、強(qiáng)度、速度均呈倒U型關(guān)系,如圖5所示。表明論文引用學(xué)科分布越均衡,知識(shí)融合越全面,影響力更加廣泛和強(qiáng)大,傳播更加迅速。但當(dāng)論文學(xué)科交叉均衡性超過(guò)閾值時(shí),可能會(huì)表現(xiàn)出太過(guò)中庸,主題不清晰,論文缺乏新穎性和創(chuàng)造性,很難被擴(kuò)散到更廣的學(xué)科范圍,產(chǎn)生更深的影響力;只有適當(dāng)降低論文學(xué)科分布的均衡性,明確研究重點(diǎn),論文的學(xué)術(shù)價(jià)值才會(huì)提升,知識(shí)擴(kuò)散廣度、強(qiáng)度和速度才會(huì)提升。
結(jié)合表1可知,基因工程領(lǐng)域論文均衡性的平均值為0.82,高于達(dá)到知識(shí)擴(kuò)散廣度、強(qiáng)度和速度的最優(yōu)值,表明論文引用學(xué)科均衡性過(guò)高,知識(shí)擴(kuò)散偏弱,該領(lǐng)域?qū)W者應(yīng)當(dāng)提高論文專(zhuān)業(yè)水平,明確重點(diǎn),突出研究主題,才能更好地提高知識(shí)擴(kuò)散廣度、強(qiáng)度和速度。
研究發(fā)現(xiàn),共190篇論文處于知識(shí)擴(kuò)散廣度極大值點(diǎn),篇均被引頻次為29.3,發(fā)文量最多的學(xué)科是Plant Sciences;共105篇論文處于知識(shí)擴(kuò)散強(qiáng)度極大值點(diǎn),篇均被引頻次為36.8,發(fā)文量最多的學(xué)科也是Plant Sciences;僅1篇論文處于知識(shí)擴(kuò)散速度極大值點(diǎn),該論文被引頻次為65,所屬學(xué)科為Entomology。
4.3.5 學(xué)科交叉差異性指標(biāo)與知識(shí)擴(kuò)散指標(biāo)的回歸分析
Tobit模型回歸結(jié)果顯示,學(xué)科交叉差異性指標(biāo)與知識(shí)擴(kuò)散廣度、強(qiáng)度、速度之間存在統(tǒng)計(jì)學(xué)上的顯著關(guān)系,其關(guān)系式為:
ln(KDB)=-2.344*D2+2.478*D+1.813
(16)
ln(KDD)=-2.366*D2+1.536*D+2.903
(17)
ln(KDS)=-0.186*D2+0.170*D+0.496
(18)
論文所引用的參考文獻(xiàn)歸屬學(xué)科的差異度越高,知識(shí)越不容易整合[24],學(xué)科間知識(shí)流動(dòng)更稀少,從某種程度上來(lái)說(shuō)這篇論文的創(chuàng)新性越強(qiáng)[11],因而在一定程度上使知識(shí)擴(kuò)散廣度、強(qiáng)度和速度越高。學(xué)科交叉差異性與知識(shí)擴(kuò)散廣度、強(qiáng)度、速度均呈倒U型關(guān)系,如圖6所示,即知識(shí)屬性上學(xué)科差異度高的論文會(huì)產(chǎn)生更強(qiáng)、更廣泛、更迅速的影響力。但論文學(xué)科交叉差異性并非越高越好,當(dāng)學(xué)科交叉差異性達(dá)到閾值后,論文融合的學(xué)科知識(shí)差異度過(guò)大,導(dǎo)致凝聚力不強(qiáng),論文科學(xué)性受到質(zhì)疑,知識(shí)擴(kuò)散廣度、強(qiáng)度和速度下降?;蚬こ填I(lǐng)域差異性均值為0.56,低于論文達(dá)到知識(shí)擴(kuò)散廣度最優(yōu)值,若要提高論文影響范圍,需加強(qiáng)對(duì)差異性較大學(xué)科的引用,即論文探索、融合更多相差較大的學(xué)科知識(shí),將此類(lèi)學(xué)科中有價(jià)值的理論方法應(yīng)用到該學(xué)科的研究進(jìn)程,并與該學(xué)科的知識(shí)理論相結(jié)合。
結(jié)合表1可知,論文達(dá)到知識(shí)擴(kuò)散強(qiáng)度、速度最優(yōu)值的差異性指標(biāo)略低于均值,說(shuō)明基因工程領(lǐng)域不能一味地追求打破學(xué)科壁壘、擴(kuò)大基礎(chǔ)知識(shí)的差距,而應(yīng)當(dāng)在保持論文專(zhuān)業(yè)性的同時(shí),適當(dāng)整合差異性較強(qiáng)的學(xué)科知識(shí),才能最大限度地促進(jìn)論文知識(shí)傳播與擴(kuò)散。
研究發(fā)現(xiàn),共1 508篇論文處于知識(shí)擴(kuò)散廣度極大值點(diǎn),篇均被引頻次為36.4,發(fā)文量最多的學(xué)科是Biochemistry & Molecular Biology;共203篇論文處于知識(shí)擴(kuò)散強(qiáng)度極大值點(diǎn),篇均被引頻次為54.9,發(fā)文量最多的學(xué)科是Plant Sciences;共872篇論文處于知識(shí)擴(kuò)散速度極大值點(diǎn),篇均被引頻次為34.7,發(fā)文量最多的學(xué)科也是Plant Sciences。
本研究以基因工程領(lǐng)域2000—2018年發(fā)表論文為研究對(duì)象,以合著作者數(shù)、合著機(jī)構(gòu)數(shù)、國(guó)內(nèi)及國(guó)外合著情況為控制變量,采用Tobit模型分析基因工程領(lǐng)域論文的學(xué)科交叉綜合指標(biāo)、多樣性、均衡性、差異性對(duì)知識(shí)擴(kuò)散廣度、強(qiáng)度、速度的影響。研究得出以下結(jié)論:
1)學(xué)科交叉和知識(shí)擴(kuò)散基本呈現(xiàn)U型和倒U型關(guān)系。從多樣性、均衡性、差異性3個(gè)維度更能細(xì)致地分析學(xué)科交叉對(duì)知識(shí)擴(kuò)散的影響。學(xué)科交叉綜合指標(biāo)與3個(gè)單一維度指標(biāo)和知識(shí)擴(kuò)散廣度全部呈倒U型關(guān)系;學(xué)科交叉綜合指標(biāo)與知識(shí)擴(kuò)散強(qiáng)度呈U型關(guān)系,而3個(gè)單一維度指標(biāo)則呈倒U型關(guān)系;學(xué)科交叉綜合指標(biāo)與知識(shí)擴(kuò)散速度呈U型關(guān)系,而均衡性、差異性呈倒U型關(guān)系,多樣性則不存在U型或倒U型關(guān)系。
2)學(xué)科交叉對(duì)知識(shí)擴(kuò)散的影響存在最優(yōu)值。在基因工程領(lǐng)域中主要學(xué)科發(fā)展到一定程度后都會(huì)出現(xiàn)難以逾越的知識(shí)屏障,研究成熟的學(xué)科在產(chǎn)生這些屏障時(shí)會(huì)向發(fā)展程度低一級(jí)的學(xué)科滲透。起初,發(fā)展較低的學(xué)科由于成熟學(xué)科的跨界會(huì)得到迅速的發(fā)展,論文的知識(shí)多樣性增加,研究質(zhì)量與知識(shí)擴(kuò)散基本提高,但是過(guò)度的學(xué)科合作使得知識(shí)體系融合產(chǎn)生一定難度,并不能解決問(wèn)題,論文研究容易停留在低層次的形式上,缺乏實(shí)質(zhì)性的融合,反而對(duì)知識(shí)擴(kuò)散產(chǎn)生不利影響。基因工程領(lǐng)域的研究主要以Plant Sciences、Neurosciences等學(xué)科提供的理論方法為基礎(chǔ),脫離這些學(xué)科,論文專(zhuān)業(yè)性難以被認(rèn)同,可能流于膚淺。
3)基因工程領(lǐng)域論文應(yīng)該適當(dāng)增加引文的學(xué)科類(lèi)別,降低引文均衡性,明確研究重點(diǎn),突出研究主題,適當(dāng)調(diào)整對(duì)差距較大學(xué)科的引用。目前基因工程領(lǐng)域大部分論文的引文學(xué)科多樣性不高,且偏向于引用學(xué)科類(lèi)別跨度相對(duì)均勻、距離中等的論文,學(xué)科交叉整體水平偏低。推動(dòng)論文學(xué)科交叉指標(biāo)達(dá)到實(shí)現(xiàn)知識(shí)擴(kuò)散的最優(yōu)值,有助于論文獲得更加廣泛、深遠(yuǎn)、迅速的影響力。
本文以基因工程領(lǐng)域的論文為研究對(duì)象,研究對(duì)象較為單一,雖然具有參考價(jià)值,但研究結(jié)論可能不適合其他領(lǐng)域;本文以JCR分類(lèi)為基準(zhǔn)進(jìn)行學(xué)科期刊匹配時(shí)較為準(zhǔn)確和高效,但存在少量論文所在期刊未被JCR期刊收錄,可能會(huì)在一定程度上影響學(xué)科交叉度指標(biāo)和知識(shí)擴(kuò)散指標(biāo)計(jì)算的精確度。今后研究可拓展到其他領(lǐng)域,并在提高精確度方面做進(jìn)一步探討。