亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        隱形三角引用:科學(xué)論文中的不規(guī)范引用行為

        2024-04-14 13:33:15劉運(yùn)梅李冉盛小平
        現(xiàn)代情報(bào) 2024年4期
        關(guān)鍵詞:影響因素

        劉運(yùn)梅 李冉 盛小平

        關(guān)鍵詞:三角引用結(jié)構(gòu);不規(guī)范引用行為;引文內(nèi)容相似度;文獻(xiàn)耦合;影響因素

        參考文獻(xiàn)是學(xué)術(shù)論文的有機(jī)組成部分,注明了被引理論、觀點(diǎn)、方法、數(shù)據(jù)的來源,將其正確、合理、充分地引用在學(xué)術(shù)傳播與科學(xué)發(fā)展過程中發(fā)揮著重要作用和廣泛影響。然而,相比于研究方法剽竊、實(shí)驗(yàn)數(shù)據(jù)造假等學(xué)術(shù)不端行為,參考文獻(xiàn)的引用不規(guī)范問題并未涉及科學(xué)論文的正文,從表面看并不會(huì)產(chǎn)生嚴(yán)重的學(xué)術(shù)風(fēng)險(xiǎn)。因此,在科學(xué)知識(shí)快速更迭的背景下,參考文獻(xiàn)引用不規(guī)范、不合理問題在近年來層出不窮,越來越具有隱蔽性與欺騙性,形式也逐漸呈現(xiàn)出多樣化特征。《Na-ture》雜志曾通過對(duì)科學(xué)論文中的引文錯(cuò)誤開展調(diào)查,發(fā)現(xiàn)許多作者并沒有閱讀他們所引用的參考文獻(xiàn),引文著錄中的異常錯(cuò)誤非常普遍,進(jìn)而披露了科學(xué)界普遍存在的引用不規(guī)范這一事實(shí)。在國內(nèi),因科研人員參考文獻(xiàn)引用不規(guī)范而通報(bào)的各類學(xué)術(shù)不端事件也頻頻發(fā)生,其中不乏學(xué)術(shù)界的知名學(xué)者。參考文獻(xiàn)的引用不規(guī)范現(xiàn)象逐漸成為科學(xué)界一項(xiàng)長期、復(fù)雜且相對(duì)隱蔽的問題。

        為此,我國政府及相關(guān)部門十分重視對(duì)引用不規(guī)范行為的防范與治理,并出臺(tái)了一系列針對(duì)性的政策文件。2018年8月,中共中央辦公廳、國務(wù)院辦公廳印發(fā)了《關(guān)于進(jìn)一步加強(qiáng)科研誠信建設(shè)的若干意見》,提出“嚴(yán)厲打擊嚴(yán)重違反科研誠信要求的行為,建立終身追究制度”。2021年11月,針對(duì)引用不規(guī)范行為,中國科學(xué)院科研道德委員會(huì)辦公室發(fā)布了《關(guān)于規(guī)范論著引用的通知》,明確提出“反對(duì)不合理不規(guī)范的論著引用情形”,并將其認(rèn)定為科研失信行為。此外,2022年8月,科技部對(duì)《科研誠信案件調(diào)查處理規(guī)則》進(jìn)行了修訂,規(guī)則中將“引用與論文內(nèi)容無關(guān)的文獻(xiàn)、要求作者非必要地引用特定文獻(xiàn)”等引用不規(guī)范行為認(rèn)定為科研失信,并進(jìn)一步規(guī)范了其調(diào)查程序,使得引用不規(guī)范行為的調(diào)查處理工作有了更具操作性的懲處規(guī)則。引用不規(guī)范問題的解決除了通過相關(guān)政策規(guī)則予以打擊之外,隨著科學(xué)文獻(xiàn)全文數(shù)據(jù)庫的成熟、大數(shù)據(jù)文本分析技術(shù)的發(fā)展,運(yùn)用科學(xué)的文本語義分析手段與文獻(xiàn)計(jì)量學(xué)的數(shù)據(jù)挖掘方法予以識(shí)別與治理是關(guān)鍵所在。

        目前,在科學(xué)文獻(xiàn)引用規(guī)范問題上學(xué)者們已進(jìn)行了大量相關(guān)研究,但鮮有人關(guān)注不規(guī)范引用行為的形成機(jī)制與偏好及其對(duì)學(xué)術(shù)論文價(jià)值造成的負(fù)面影響。在早期的引文研究與期刊編輯工作中,轉(zhuǎn)引問題便被發(fā)現(xiàn)并指出,“轉(zhuǎn)引行為”指施引文獻(xiàn)作者受某些客觀或主觀因素影響,在沒有閱讀引文原文內(nèi)容的前提下,從其他引用了該篇引文的文獻(xiàn)中轉(zhuǎn)引該引文內(nèi)容與題錄信息的現(xiàn)象。轉(zhuǎn)引行為具有高度的隱蔽性、復(fù)雜性與危害性,一方面,其不僅違背了科學(xué)論文中參考文獻(xiàn)引用的基本要求,還因轉(zhuǎn)引作者缺乏對(duì)原始文獻(xiàn)全面、系統(tǒng)的理解,而降低論文本身的表達(dá)流暢度與科學(xué)性;另一方面,通過轉(zhuǎn)引行為產(chǎn)生的虛假引用,導(dǎo)致被轉(zhuǎn)引文獻(xiàn)的被引頻次表面虛高,而實(shí)際上這些被引則多來自中間文獻(xiàn)的間接影響力,掩蓋了被引文獻(xiàn)的真實(shí)價(jià)值,造成引文分析的開展建立在虛假的數(shù)據(jù)資料基礎(chǔ)之上,從而影響引文分析、引文評(píng)價(jià)工作的準(zhǔn)確度、嚴(yán)謹(jǐn)性與科學(xué)性。因此,有必要對(duì)這一引用行為與影響因素予以識(shí)別,并分析其中具體的引用情境與危害,為優(yōu)化不合理的引文評(píng)價(jià)體系、治理不規(guī)范的引用行為提供解決途徑。

        基于以上研究問題,本文對(duì)轉(zhuǎn)引這一不規(guī)范引用行為進(jìn)行有效識(shí)別與分析。通過大規(guī)模的文獻(xiàn)數(shù)據(jù)對(duì)不規(guī)范引用行為進(jìn)行有效識(shí)別,并嘗試結(jié)合相關(guān)文獻(xiàn)特征,挖掘這些不合理引用背后的引用情境與動(dòng)機(jī),首先,可以為編輯部、期刊管理部門檢測(cè)、治理科學(xué)引用不規(guī)范問題提供技術(shù)指導(dǎo);其次,通過揭示廣泛、隱性、長期存在的不當(dāng)引用行為及其危害,為學(xué)者在科學(xué)論文寫作與引用中提供警示;最后,提出針對(duì)不規(guī)范引用行為的治理措施與規(guī)范建議,為科學(xué)界、科研管理機(jī)構(gòu)后續(xù)科技政策的制定與完善提供重點(diǎn)方向和指導(dǎo)。

        1引用不規(guī)范行為相關(guān)研究

        1.1引用不規(guī)范行為的概念界定與分類

        在引用不規(guī)范行為的界定與分類領(lǐng)域,學(xué)者們已結(jié)合期刊編輯中的具體實(shí)例進(jìn)行大量討論。引文包括參考文獻(xiàn)的引用內(nèi)容信息與文后的著錄條目信息,據(jù)此,引用不規(guī)范行為也包括引文內(nèi)容不規(guī)范、引文格式不規(guī)范兩種形式。引文內(nèi)容不規(guī)范是指具有學(xué)術(shù)不端動(dòng)機(jī)的引用行為,或引文與被引文獻(xiàn)之間沒有內(nèi)在邏輯關(guān)聯(lián)的引用現(xiàn)象,主要包括誘引、匿引、轉(zhuǎn)引、濫引、崇引、曲引等;引文格式不規(guī)范則是指引文著錄格式錯(cuò)誤的現(xiàn)象。其中,大部分引文格式不規(guī)范往往在期刊審稿、編校過程中加以修正,而由學(xué)術(shù)不端動(dòng)機(jī)導(dǎo)致的引文內(nèi)容不規(guī)范行為則相對(duì)隱蔽且復(fù)雜,很難通過直接觀察與主觀判斷對(duì)其識(shí)別。

        1.2引用不規(guī)范行為的識(shí)別方法與技術(shù)

        對(duì)于引用著錄格式錯(cuò)誤的自動(dòng)識(shí)別,學(xué)者們從理論分析與自動(dòng)化識(shí)別方法兩個(gè)層面進(jìn)行了探索。例如,蘇新寧分析了CSSCI數(shù)據(jù)庫中容易出現(xiàn)的幾類引文格式錯(cuò)誤形式,并提出計(jì)算機(jī)輔助糾錯(cuò)的思路:Brennan D探討了各種格式類型的引文字段自動(dòng)識(shí)別與規(guī)范化表達(dá),可用于檢驗(yàn)參考文獻(xiàn)格式的準(zhǔn)確性:李軍蓮等根據(jù)參考文獻(xiàn)著錄標(biāo)準(zhǔn)來分析期刊引文數(shù)據(jù)的核心特征,并基于決策樹方法和準(zhǔn)確率指標(biāo)生成多特征融合的引文不規(guī)范數(shù)據(jù)自動(dòng)處理模型,實(shí)驗(yàn)表明該模型的準(zhǔn)確率高達(dá)99.72%。

        此外,部分研究還基于引文中錯(cuò)誤的著錄數(shù)據(jù)及其分布,推斷引文復(fù)制等引用不規(guī)范行為。例如,Simkin M V等將一篇高被引論文的錯(cuò)引記錄按其被引頻次從高到低排列,構(gòu)建錯(cuò)誤引文的隨機(jī)分布模型,發(fā)現(xiàn)大部分“名著文獻(xiàn)”的被引用都是通過中間文獻(xiàn)復(fù)制的;梁立明等以《Nature》雜志中一篇高被引論文的錯(cuò)引記錄為例,通過錯(cuò)引記錄的引文傳播網(wǎng)絡(luò),推斷出科學(xué)家群體中存在的引文復(fù)制與引而不注兩種引用不規(guī)范行為。綜上所述,目前在引文不規(guī)范問題的自動(dòng)化識(shí)別領(lǐng)域主要聚焦于引用格式及其信息的識(shí)別與校正,而未深入到引文內(nèi)容不規(guī)范問題的識(shí)別。

        1.3引用不規(guī)范行為的政策治理

        在引用不規(guī)范行為的政策治理領(lǐng)域,學(xué)者們大多從原因分析視角提出相應(yīng)的建議,其中包括相關(guān)政策規(guī)范的完善、作者的自身意識(shí)提高、期刊編輯的審核編校、審稿專家的學(xué)術(shù)把關(guān)等。例如,鄧履翔等簡述了一種欺詐引用的定義、表現(xiàn)形式、產(chǎn)生原因,并從外部客觀環(huán)境、編輯、作者和讀者等方面給出了防治欺詐引用的建議:王志標(biāo)認(rèn)為造成期刊論文引用不規(guī)范的原因在于作者研究態(tài)度不端正、未建立良好引用習(xí)慣、不了解學(xué)術(shù)規(guī)范等,并從作者、學(xué)術(shù)期刊、作者單位、行業(yè)管理部門等主體角度提出相應(yīng)的治理措施。綜上所述,目前在引用不規(guī)范問題的政策治理方面,研究者多是從編輯報(bào)道與建議視角出發(fā),未深入該行為背后的邏輯及機(jī)理,制約了研究的理論深度。

        目前學(xué)界對(duì)于引用不規(guī)范行為的研究主要存在以下兩個(gè)問題:一是僅從編輯報(bào)道視角指出一些現(xiàn)象問題與具體實(shí)例,未深入引用不規(guī)范行為背后的邏輯及機(jī)理,制約了研究的理論深度:二是聚焦于錯(cuò)誤引用格式及其信息的識(shí)別與校正,未深入到情節(jié)嚴(yán)重且相對(duì)隱蔽的引文內(nèi)容不規(guī)范問題檢測(cè)。因此,本文將從引用結(jié)構(gòu)角度,探索不規(guī)范引用行為的識(shí)別方法及其內(nèi)在生成因素。

        2隱形三角引用行為概念與識(shí)別方法

        2.1概念

        在早期的編輯工作中,轉(zhuǎn)引問題便被發(fā)現(xiàn)并指出,轉(zhuǎn)引指來源文獻(xiàn)的作者由于某種原因沒有閱讀引文的原文內(nèi)容,而從其他引用了該篇引文的文獻(xiàn)中轉(zhuǎn)錄該引文內(nèi)容的現(xiàn)象。實(shí)際上,轉(zhuǎn)引現(xiàn)象在文獻(xiàn)引用關(guān)系中的體現(xiàn)即為三角引用結(jié)構(gòu)中的間接引用現(xiàn)象。間接三角引用行為的定義為:文獻(xiàn)C在未閱讀文獻(xiàn)A原文的情況下,通過中間文獻(xiàn)B中關(guān)于A的引文,對(duì)文獻(xiàn)A施加了間接引用行為,從而在文獻(xiàn)A、B、C三者之間產(chǎn)生三角引用關(guān)系,間接三角引用行為的示例圖如圖1所示。

        在上述間接三角引用行為發(fā)生過程中,會(huì)出現(xiàn)兩種引用情況:一種是作者在標(biāo)注引文時(shí),既標(biāo)注原始文獻(xiàn)A,也標(biāo)注中間文獻(xiàn)B;但也有可能只標(biāo)注原始文獻(xiàn)A,而忽略了最先參考的中間文獻(xiàn)B。鑒于后一種引用情境,本文將提出一種間接三角引用延伸出的匿引問題,即隱形三角引用結(jié)構(gòu),如圖2所示??茖W(xué)文獻(xiàn)C的作者在閱讀中間文獻(xiàn)B時(shí),根據(jù)文獻(xiàn)B中關(guān)于A的引文內(nèi)容對(duì)文獻(xiàn)A施加引用:然而,文獻(xiàn)C作者受到某些社會(huì)性因素影響,如為避免抄襲之嫌等主觀因素、文獻(xiàn)A、B權(quán)威度、影響力差距等客觀因素,雖采納、吸收或利用了文獻(xiàn)B中的論述、數(shù)據(jù)或觀點(diǎn),在實(shí)際引用中卻沒有引用最先參考的中間文獻(xiàn)B,只引用了文獻(xiàn)A。其定義為:科學(xué)文獻(xiàn)C的作者在未閱讀文獻(xiàn)A原文的情況下,根據(jù)文獻(xiàn)B中關(guān)于A的引文內(nèi)容對(duì)文獻(xiàn)A施加引用;然而,文獻(xiàn)C作者受到某些社會(huì)性因素或主觀心理影響,雖采納、吸收或利用了文獻(xiàn)B,但在實(shí)際引用中沒有引用中間文獻(xiàn)B,只引用了文獻(xiàn)A。

        上述隱形三角引用行為具有兩個(gè)比較明確的特征:第一,未閱讀原文而轉(zhuǎn)引文獻(xiàn)A。第二,參考但未引用文獻(xiàn)B。隱形三角引用現(xiàn)象使得引文成分與引用行為更加復(fù)雜化,但同時(shí)也包含著豐富的科學(xué)引用偏好與規(guī)律。

        其中,間接引用原始文獻(xiàn)A,而非親自閱讀的行為動(dòng)機(jī)如下:

        ●文獻(xiàn)C作者力求省力原則,認(rèn)為他人所引用資料中包含的信息足夠完整、足以滿足需要,不愿再去核查原始文獻(xiàn)的原文。

        ●文獻(xiàn)C作者受數(shù)據(jù)庫權(quán)限、資料搜集能力、語言閱讀障礙、跨學(xué)科知識(shí)壁壘等影響,難以尋找到原始文獻(xiàn)的全文或無法順利閱讀全文,只能采取間接引用的方式。

        參考但未引用中間文獻(xiàn)B的行為動(dòng)機(jī)如下:

        ●文獻(xiàn)C作者缺乏嚴(yán)肅認(rèn)真、實(shí)事求是的科學(xué)態(tài)度,雖采納或利用了中間文獻(xiàn)B,但為了在文中掩人耳目、避免抄襲之嫌,又或?yàn)榱梭w現(xiàn)自己論文的創(chuàng)新性、先進(jìn)性或原創(chuàng)性,故意不引用文獻(xiàn)B。

        ●文獻(xiàn)C作者受馬太效應(yīng)影響,寫作時(shí)傾向于選擇引用被認(rèn)為“重要的”“權(quán)威的”文獻(xiàn)或期刊來證明自身研究的科學(xué)價(jià)值與知識(shí)聯(lián)系,并避免引用那些相對(duì)“不重要”的文獻(xiàn)。在三角引用結(jié)構(gòu)中,原始文獻(xiàn)A由于發(fā)表時(shí)間、科學(xué)發(fā)現(xiàn)優(yōu)先權(quán)、被引頻次累積等方面的優(yōu)勢(shì),往往比中間文獻(xiàn)B更具有所謂的“權(quán)威度”和“社會(huì)認(rèn)可度”。因此,在二者擇其一的情況下,文獻(xiàn)C作者傾向于放棄引用中間文獻(xiàn)B,只引用文獻(xiàn)A。

        2.2識(shí)別旨標(biāo)

        隱形三角引用行為識(shí)別方法與影響因素構(gòu)建如圖3所示。

        首先,在文獻(xiàn)引文網(wǎng)絡(luò)中提取可能發(fā)生的隱形三角引用關(guān)系,步驟如下:

        ●提取文獻(xiàn)B與文獻(xiàn)C具有耦合關(guān)系的數(shù)據(jù),即文獻(xiàn)B、C同時(shí)引用文獻(xiàn)A。

        ●去掉文獻(xiàn)B與文獻(xiàn)C之間發(fā)生直接引用的數(shù)據(jù)。

        ●保證文獻(xiàn)B的發(fā)表時(shí)間早于文獻(xiàn)C。

        其次,構(gòu)建以下三項(xiàng)指標(biāo)測(cè)度耦合關(guān)系中的隱形三角引用行為。

        1)文獻(xiàn)使用一引用轉(zhuǎn)化率。WoS數(shù)據(jù)庫平臺(tái)中論文的使用數(shù)量(Usage)是Web of Science平臺(tái)所有用戶訪問論文全文鏈接或保存記錄的次數(shù),捕獲了用戶試圖獲取全文的各種操作。文獻(xiàn)使用一引用的轉(zhuǎn)化率用一篇科學(xué)文獻(xiàn)的被引頻次與使用次數(shù)之比計(jì)算,表示為CR。若文獻(xiàn)所獲被引頻次用R表示,使用次數(shù)用U表示,CR計(jì)算公式如式(1):

        按照隱形三角引用行為發(fā)生的兩個(gè)情境:引用但未閱讀文獻(xiàn)A、參考但未引用文獻(xiàn)B,本文識(shí)別的一組隱形三角引用關(guān)系應(yīng)具有以下特征:文獻(xiàn)A的被引頻次R應(yīng)當(dāng)較大,而使用次數(shù)U則偏小,甚至低于被引數(shù)量,因此文獻(xiàn)A的使用一引用轉(zhuǎn)化率CR(A)較高;而文獻(xiàn)B受參考但未引用的影響,表現(xiàn)為使用次數(shù)U較大、被引頻次R較小,因此文獻(xiàn)B的使用一引用轉(zhuǎn)化率CR(B)應(yīng)相對(duì)較低。

        2)B-A與C-A引用內(nèi)容的文本相似度。隱形三角引用結(jié)構(gòu)中,文獻(xiàn)C是通過B的引文內(nèi)容間接引用文獻(xiàn)A,那么,最直接、有效的判斷方法是通過文本相似度計(jì)算,比較文獻(xiàn)B引用A的引文內(nèi)容與文獻(xiàn)C引用A的引文內(nèi)容之間是否相似。

        由于傳統(tǒng)IF-IDF表示特征向量計(jì)算的引用文本相似度區(qū)分度較低,本節(jié)將調(diào)用Nils and Iryna構(gòu)建的Sentence Transformers預(yù)訓(xùn)練模型,計(jì)算B-yA與C-A引用內(nèi)容之間的文本相似度。Sentence Trans-formers模型是一個(gè)用于最先進(jìn)的句子、文本和圖像嵌入的Python框架,使用連體和三元網(wǎng)絡(luò)結(jié)構(gòu)來推導(dǎo)語義上有意義的句子嵌入,并使用余弦相似度進(jìn)行語義文本相似計(jì)算,其在語義文本相似性應(yīng)用中表現(xiàn)出很好的性能和區(qū)分度。此處,將引用內(nèi)容設(shè)定為引用標(biāo)簽所在的完整句子,計(jì)算得到耦合關(guān)系組中,兩兩引用文本的內(nèi)容相似度Sim(B-A,C-A)。Sim(B-A,C-A)值越接近于1,比較的兩個(gè)引用文本越相似,則認(rèn)定對(duì)應(yīng)的耦合關(guān)系更傾向于發(fā)生了隱形三角引用行為。

        3)耦合強(qiáng)度。耦合強(qiáng)度是指文獻(xiàn)B與文獻(xiàn)C中參考文獻(xiàn)重合的數(shù)量。隱形三角引用情境中,文獻(xiàn)C通過文獻(xiàn)B的參考文獻(xiàn)列表,間接引用文獻(xiàn)A。因此,文獻(xiàn)C中的參考文獻(xiàn)與文獻(xiàn)B的參考文獻(xiàn)重復(fù)數(shù)量越多,那么意味著文獻(xiàn)C更大概率地將文獻(xiàn)B作為中介傳輸文獻(xiàn),間接引用越多的文獻(xiàn)A,此時(shí)對(duì)應(yīng)的耦合關(guān)系更傾向于發(fā)生了隱形三角引用行為。文獻(xiàn)B、C的耦合強(qiáng)度用BS(B,C)表不,N(B n C)表示文獻(xiàn)B與文獻(xiàn)C中參考文獻(xiàn)重合的數(shù)量,耦合強(qiáng)度計(jì)算公式如式(2):

        2.3影響因素

        從文獻(xiàn)數(shù)據(jù)庫平臺(tái)WOS的全字段記錄中提取出6項(xiàng)有效的文獻(xiàn)屬性特征,用以推斷影響隱形三角引用行為發(fā)生的情境與偏好,即隱形三角引用行為的影響因素。

        最省力法則指出,一個(gè)人在面對(duì)多種問題的情況下將會(huì)爭取運(yùn)用最省事、省力的方法去處理面臨的問題,這里的問題不只是當(dāng)前面臨的問題,也包含未來有可能出現(xiàn)的問題,他會(huì)盡可能運(yùn)用最小功力消耗率去解決。間接引用文獻(xiàn)A的分析要素包括3項(xiàng),即文獻(xiàn)A、B、C組合在語言、文獻(xiàn)類型、學(xué)科方面存在怎樣的特征,導(dǎo)致文獻(xiàn)C間接通過文獻(xiàn)B引用文獻(xiàn)A:

        1)語言差異:在每組文獻(xiàn)耦合關(guān)系中,文獻(xiàn)A、B、C在語言方面的分布特征。

        2)文獻(xiàn)類型差異:在每組文獻(xiàn)耦合關(guān)系中,文獻(xiàn)A、B、C在文獻(xiàn)類型上的分布特征。

        3)學(xué)科差異:在每組文獻(xiàn)耦合關(guān)系中,文獻(xiàn)A、B、C在學(xué)科上的分布特征。

        馬太效應(yīng)理論表明,論文自身被引、作者知名度、期刊權(quán)威性、發(fā)表時(shí)長等方面的累積是馬太效應(yīng)在科學(xué)研究中的表現(xiàn),都對(duì)論文的關(guān)注度和被引量有正向的影響作用。由于作者在其所屬研究領(lǐng)域知名度的測(cè)量具有一定復(fù)雜性和主觀性,且無法通過文獻(xiàn)來源信息直接獲取,本文暫不考慮作者知名度這一變量對(duì)隱形三角引用行為的影響。本文選取其他3項(xiàng)變量作為參考但未引用文獻(xiàn)B的分析要素,即文獻(xiàn)A、B在發(fā)表期刊影響力、出版時(shí)間、被引影響力方面存在怎樣的差異,導(dǎo)致文獻(xiàn)C只選擇引用文獻(xiàn)A、不引用文獻(xiàn)B。

        4)期刊影響力:本文用期刊的五年影響因子代表文獻(xiàn)所發(fā)表期刊水平的高低,在每組文獻(xiàn)耦合關(guān)系中,測(cè)度文獻(xiàn)A、B所發(fā)表期刊五年影響因子之間存在的差異。

        5)發(fā)表時(shí)間:在每組文獻(xiàn)耦合關(guān)系中,測(cè)度文獻(xiàn)A、B發(fā)表年份之間的時(shí)間跨度特征,以代表文獻(xiàn)A、B在科學(xué)發(fā)現(xiàn)優(yōu)先權(quán)方面的差異。

        6)被引影響力:在每組文獻(xiàn)耦合關(guān)系中.測(cè)度文獻(xiàn)A、B所獲得被引頻次之間存在的差異,以代表文獻(xiàn)A、B在相關(guān)研究領(lǐng)域的相對(duì)地位和權(quán)威度。

        3隱形三角引用行為的識(shí)別指標(biāo)計(jì)算

        本文以Web of Science數(shù)據(jù)庫作為數(shù)據(jù)來源:根據(jù)WoS學(xué)科分類體系,選取醫(yī)學(xué)與生物學(xué)、心理學(xué)、管理學(xué)、化學(xué)、物理學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)、圖書情報(bào)科學(xué)8個(gè)學(xué)科,并根據(jù)文獻(xiàn)的被引頻次分層抽樣;其次,為保證數(shù)據(jù)樣本多樣性,文獻(xiàn)類型同時(shí)包含Article、Review、Proceedings Paper;最后,以40篇樣本文獻(xiàn)作為原始文獻(xiàn)A,獲取相關(guān)的三角引用關(guān)系與隱形三角引用關(guān)系文獻(xiàn)數(shù)據(jù),具體的數(shù)據(jù)獲取與處理過程如圖4所示。

        其中,三角引用關(guān)系的獲取是以原始文獻(xiàn)A人手,尋找中介文獻(xiàn)B和追隨文獻(xiàn)C,來確定以文獻(xiàn)A為原始文獻(xiàn)的三角引用數(shù)據(jù)。具體步驟如下:首先,采集引用文獻(xiàn)A的所有施引文獻(xiàn),得到中介文獻(xiàn)集合{ B0、B1、B2、…Bi…},即多個(gè)“B-A”的引用關(guān)系對(duì);其次,分別采集中介文獻(xiàn)集合中每個(gè)文獻(xiàn)B的施引文獻(xiàn);最后,獲取A的施引文獻(xiàn)與Bi的施引文獻(xiàn)中相同的文獻(xiàn),所得到的相同文獻(xiàn)就是追隨文獻(xiàn)集合Ci,即“Ci-A”,同時(shí)“C-Bi”。那么,文獻(xiàn)A、Bi與集合Ci中的每個(gè)文獻(xiàn)就組成了三角引用關(guān)系。本文通過40篇原始文獻(xiàn)A的樣本,在引文網(wǎng)絡(luò)中共獲取了6918篇中介文獻(xiàn)B、54649篇追隨文獻(xiàn)C,以及54649條三角引用關(guān)系。

        隱形三角引用關(guān)系的獲取同樣也是以原始文獻(xiàn)A入手,來確定以A為原始文獻(xiàn)的隱形三角引用數(shù)據(jù)。具體步驟如下:首先,將文獻(xiàn)A施引文獻(xiàn)集合中的文獻(xiàn)兩兩配對(duì),即文獻(xiàn)B、C具有耦合關(guān)系的數(shù)據(jù)。通過40篇文獻(xiàn)A所獲得的15045篇施引文獻(xiàn),本文共得到2990905條耦合關(guān)系;其次,隱形三角引用結(jié)構(gòu)中的文獻(xiàn)B與文獻(xiàn)C不存在直接引用關(guān)系,在已獲得的2990905條耦合數(shù)據(jù)集中,刪除發(fā)生三角引用關(guān)系的54649條數(shù)據(jù),共剩余2936256條數(shù)據(jù):最后,在保證每組隱形三角引用數(shù)據(jù)中,文獻(xiàn)B的發(fā)表時(shí)間要早于文獻(xiàn)C??紤]到文獻(xiàn)B、C同一年發(fā)表的作者自引或團(tuán)隊(duì)自引等問題,去掉文獻(xiàn)B與文獻(xiàn)C同年發(fā)表的耦合關(guān)系數(shù)據(jù),以及數(shù)據(jù)記錄中沒有明確發(fā)表時(shí)間的文獻(xiàn)數(shù)據(jù)13743條,最終共剩余可供分析的隱形三角引用文獻(xiàn)數(shù)據(jù)共2922513條。

        通過2922513組耦合數(shù)據(jù)中文獻(xiàn)A與文獻(xiàn)B在WoS平臺(tái)獲得的使用量、引用量(WoS Core),計(jì)算得到文獻(xiàn)A、B的使用一引用轉(zhuǎn)化率CR(A)、CR(B),統(tǒng)計(jì)值的對(duì)比結(jié)果如表1所示。

        根據(jù)CR(A)、CR(B)的對(duì)比結(jié)果,在近300萬組耦合數(shù)據(jù)中,超過七成的文獻(xiàn)A使用一引用轉(zhuǎn)化率高于文獻(xiàn)B。因此,在一組文獻(xiàn)B、C的耦合關(guān)系中存在較為普遍的規(guī)律,即被引文獻(xiàn)A的被引量往往較高,而使用量偏??;相比之下,施引方文獻(xiàn)B的被引則較少,被使用較頻繁。

        根據(jù)2922513組耦合數(shù)據(jù)中文獻(xiàn)A與文獻(xiàn)B的使用一引用轉(zhuǎn)化率分布,構(gòu)建散點(diǎn)圖,如圖5所示。其中,為了更清晰地表示轉(zhuǎn)化率數(shù)據(jù)的主體分布區(qū)域,將CR(A)超過10的極端數(shù)值設(shè)置為10??梢钥吹紺R(B)在[0,1]區(qū)間內(nèi)的分布最為密集,隨著使用一引用轉(zhuǎn)化率增加,其在圖5頂部的分布越來越稀疏;而CR(A)在[0,10]區(qū)間內(nèi)的分布則相對(duì)比較均勻。

        在規(guī)范、合理的引用情境下,文獻(xiàn)的使用與引用存在一個(gè)遞進(jìn)的鏈?zhǔn)疥P(guān)系,引用文獻(xiàn)之前用戶必然需要獲取和瀏覽原文內(nèi)容。因此,被引頻次的增加一定伴隨瀏覽、下載等使用次數(shù)的增加。那么,在隱形三角引用的不規(guī)范引用情境中,文獻(xiàn)A受引用但未閱讀的影響,此時(shí),理論上文獻(xiàn)A的部分引用數(shù)據(jù)并未伴隨相應(yīng)的瀏覽、下載等使用行為,而是在未閱讀原文情況下進(jìn)行的間接引用行為,因此文獻(xiàn)A的被引頻次R大,而使用次數(shù)U則偏小,甚至低于被引次數(shù),即CR(A)大于1。同樣地,文獻(xiàn)B受參考但未被引用的影響,使用次數(shù)大于被引次數(shù),即CR(B)小于1。因此,當(dāng)CR(A)≥1,且同時(shí)CR(B) <1時(shí),對(duì)應(yīng)的耦合關(guān)系發(fā)生隱形三角引用行為的可能性較大。

        在2922513條數(shù)據(jù)中,位于圖5右下角區(qū)域(同時(shí)滿足CR(A)≥1且CR(B)<1)的耦合數(shù)據(jù)共687112條,將用于進(jìn)一步的隱形三角引用行為識(shí)別。其中,文獻(xiàn)B或文獻(xiàn)CDOI號(hào)缺失、無全文記錄的耦合數(shù)據(jù)共108622條,因此,對(duì)能夠獲取全文數(shù)據(jù)的578490條文獻(xiàn)耦合數(shù)據(jù)進(jìn)行引文內(nèi)容相似度與耦合強(qiáng)度分析。

        在耦合強(qiáng)度計(jì)算中,由于文獻(xiàn)B、C本身具有耦合關(guān)系,因此耦合強(qiáng)度BS(BC)的最小值為1。在引文內(nèi)容相似度計(jì)算中,由于文獻(xiàn)B、C涉及多種語言,文獻(xiàn)B、C的跨語言文本相似度計(jì)算使用了Google機(jī)器翻譯工具,將非英文的源語言翻譯為目標(biāo)語言英語,再使用單語言的文本相似度算法進(jìn)行計(jì)算。最后,根據(jù)耦合強(qiáng)度BS(BC)、引用內(nèi)容相似度Sim(B-A,C-A)的計(jì)算結(jié)果構(gòu)建三維氣泡圖,如圖6所示。其中,橫坐標(biāo)表示耦合強(qiáng)度值,縱坐標(biāo)表示兩兩引用內(nèi)容的文本相似度值,氣泡大小表示對(duì)應(yīng)位置的耦合關(guān)系數(shù)量。

        在耦合強(qiáng)度與引文內(nèi)容相似度分布圖中,當(dāng)耦合強(qiáng)度高于3時(shí),引文內(nèi)容相似度的變化最為明顯:隨著相似度增加,氣泡的分布越大,且越密集。此時(shí),耦合關(guān)系大部分分布在Sim(B-A,C-A)≥0.5區(qū)域內(nèi)。而當(dāng)耦合強(qiáng)度在1~2之間時(shí),引文內(nèi)容相似度主要分布在0.5~0.6區(qū)間內(nèi),明顯低于耦合強(qiáng)度超過3時(shí)的引文內(nèi)容相似度。因此,在耦合關(guān)系中,文獻(xiàn)B與C的耦合強(qiáng)度越大,兩者同時(shí)引用文獻(xiàn)A的引文內(nèi)容相似度就越高。

        耦合強(qiáng)度越高,意味著文獻(xiàn)B與C之間雖然沒有實(shí)際的引用關(guān)系,但兩者具有密切的隱性關(guān)系,文獻(xiàn)C在一定概率上參考了文獻(xiàn)B中較多的參考文獻(xiàn)。而B-A與C-A之間引文內(nèi)容相似度較高,意味著在很大程度上文獻(xiàn)C參考了文獻(xiàn)B中關(guān)于A的引文內(nèi)容,進(jìn)行了轉(zhuǎn)引行為。因此,在圖6右上角的氣泡高密集區(qū),即耦合強(qiáng)度BS在3以上,同時(shí)B-A與C-A的引文內(nèi)容相似度超過0.5,該耦合關(guān)系在很大概率上發(fā)生隱形三角引用行為。文獻(xiàn)A的被引用量大于使用量、文獻(xiàn)B的被使用量大于被引量、文獻(xiàn)B與文獻(xiàn)C高耦合強(qiáng)度與高引文內(nèi)容相似度一致等特征,也進(jìn)一步佐證了隱形三角引用現(xiàn)象在科學(xué)界的廣泛、真實(shí)存在。

        4隱形三角引用行為的影響因素分析

        4.1間接引用行為的影響因素分析

        結(jié)合三角引用行為的特征識(shí)別結(jié)果,從耦合關(guān)系中文獻(xiàn)A、B、C的語言差異、文獻(xiàn)類型差異、學(xué)科差異層面,對(duì)隱形三角引用結(jié)構(gòu)的間接引用行為進(jìn)行引用語境與影響因素分析。間接引用行為在文獻(xiàn)特征上的表現(xiàn):文獻(xiàn)A收獲的被引量較大,而使用量偏?。何墨I(xiàn)B與文獻(xiàn)C的參考文獻(xiàn)重復(fù)(耦合強(qiáng)度)較多;文獻(xiàn)B與C引用文獻(xiàn)A的引文內(nèi)容相似度較高。

        因此,根據(jù)CR(A)、CR(B)的識(shí)別結(jié)果,首先,將2922513組耦合關(guān)系分為4個(gè)數(shù)據(jù)集合:CR(A)<1且CR(B)<1、CR(A)<1且CR(B)≥1、CR(A)≥1且CR(B)<1、CR(A)≥1且CR(B)≥1;根據(jù)文獻(xiàn)B與C耦合強(qiáng)度的計(jì)算結(jié)果,將578490條文獻(xiàn)耦合關(guān)系分為兩個(gè)數(shù)據(jù)集合:BS≤2、BS≥3:根據(jù)文獻(xiàn)B與C同時(shí)引用文獻(xiàn)A的文本相似度計(jì)算結(jié)果,將578490條文獻(xiàn)耦合關(guān)系分為兩個(gè)數(shù)據(jù)集合:Sim<0.5、Sim≥0.5。其次,根據(jù)耦合關(guān)系中文獻(xiàn)A、B、C的語言類型、文獻(xiàn)類型、學(xué)科領(lǐng)域,劃分為ABC相同、AB相同、BC相同、AC相同、ABC不同五種特征分布類型。最后,分別計(jì)算A-B-C不同特征分布類型在以上8個(gè)數(shù)據(jù)集合中的數(shù)量及比例。其中,語言差異情境下的特征分布情況如圖7所示,文獻(xiàn)類型差異下的特征分布如圖8所示,學(xué)科差異下的特征分布如圖9所示。

        1)語言差異:在圖7中,95%以上的耦合關(guān)系A(chǔ)-B-C語言相同,而A、B、C均屬于不同語言的耦合數(shù)據(jù)則最少,這來源于WoS平臺(tái)的收錄文獻(xiàn)主要以英語為主,且在非英語母語國家,英語仍作為科學(xué)交流、科學(xué)文獻(xiàn)撰寫的主流語言。

        對(duì)比具有語言差異的文獻(xiàn)耦合數(shù)據(jù),在以引文內(nèi)容相似度分類的兩個(gè)數(shù)據(jù)集合中,BC語言相同情境下的分布比例對(duì)比較為明顯:Sim≥0.5的比例超過了Sim<0.5的5倍之多。同樣,在以耦合強(qiáng)度分類的兩個(gè)集合中,BC語言相同的情境下對(duì)比同樣最為明顯,BS≥3的比例(0.151%)遠(yuǎn)遠(yuǎn)高于BS≤2(0.008%);此外,ABC語言均不同的比例也具有較大差異,BS≥3時(shí)的比例(0.175%)遠(yuǎn)遠(yuǎn)高于BS≤2(0.013%)。而以使用一引用轉(zhuǎn)化率分類的4個(gè)數(shù)據(jù)集中.BC語言相同這一情境在CR(A)<1且CR(B)≥1的耦合數(shù)據(jù)中沒有出現(xiàn),而在其余3種數(shù)據(jù)集的分布比例變化不大。因此,根據(jù)以上引文內(nèi)容相似度與耦合強(qiáng)度兩個(gè)對(duì)比結(jié)果,文獻(xiàn)B、C語言相同、但與文獻(xiàn)A不同的語言特征傾向于發(fā)生在耦合強(qiáng)度與引文內(nèi)容相似度均較高的隱形三角引用結(jié)構(gòu)中,與文獻(xiàn)A的語言差異是追隨文獻(xiàn)C施加間接引用行為的一個(gè)重要影響因素。

        2)文獻(xiàn)類型差異:在圖8文獻(xiàn)類型差異情境下的三角引用特征分布中,除了CR(A)<1的兩個(gè)數(shù)據(jù)集之外,A、B、C文獻(xiàn)類型相同的耦合關(guān)系在其他6個(gè)數(shù)據(jù)集中仍占據(jù)60%以上的主要比例。統(tǒng)計(jì)2922513條文獻(xiàn)耦合關(guān)系中文獻(xiàn)A、B、C的文獻(xiàn)類型,如表2所示。

        在表2中,大部分文獻(xiàn)類型為Article、Review,因此在A-B-C的文獻(xiàn)類型組合中,三者文獻(xiàn)類型相同的情況占據(jù)主要比重。在文獻(xiàn)類型不一致的耦合數(shù)據(jù)中,與語言情境下的對(duì)比結(jié)果相似,BC文獻(xiàn)類型相同在耦合強(qiáng)度與引文內(nèi)容相似度分類集合中的差異最為顯著:在Sim≥0.5與BS≥3數(shù)據(jù)集合中的比例均明顯超出了Sim<0.5與BS≤2。其中,Sim≥0.5中的分布比例(4.438%)高于Sim<0.5(10.613%)的兩倍;在BS≥3中的分布比例(12.534%)也明顯超出了BS≤2(7.639%)。而其他4種文獻(xiàn)類型結(jié)構(gòu)(ABC相同、AB相同、AC相同、ABC均不同)在上述幾個(gè)數(shù)據(jù)集中的分布則比較穩(wěn)定,并沒有表現(xiàn)出明顯差異。因此,在隱形三角引用結(jié)構(gòu)中,根據(jù)以上引文內(nèi)容相似度與耦合強(qiáng)度兩個(gè)數(shù)據(jù)集的對(duì)比結(jié)果,A、B、C的文獻(xiàn)類型差異是追隨文獻(xiàn)C施加間接引用行為的影響因素。

        3)學(xué)科領(lǐng)域差異:在學(xué)科情境下的8組耦合數(shù)據(jù)集對(duì)比中,BC學(xué)科相同在BS≥3與Sim≥0.5兩個(gè)數(shù)據(jù)集中所占比例最高,分別為16. 512%、7.704%。此外,在CR(A)≥1的兩個(gè)數(shù)據(jù)集合中,BC學(xué)科相同所占比例也明顯高于CR(A) <1時(shí)。因此,在CR(A)、BS(BC)、Sim(B-A,C-A)較高的隱形三角引用結(jié)構(gòu)中,更容易發(fā)生文獻(xiàn)B、C學(xué)科相同,但與文獻(xiàn)A不同的跨學(xué)科引用現(xiàn)象。同時(shí),與文獻(xiàn)A的學(xué)科差異是追隨文獻(xiàn)C施加間接引用行為的一個(gè)顯著影響因素。

        美國語言學(xué)家Zipf最早提出省力法則:人們總希望以最小的付出得到最大的收獲,一切有目的的行為總是追求“省力”“偷懶”。綜合語言、文獻(xiàn)類型、學(xué)科特征的分析結(jié)果,在隱形三角引用結(jié)構(gòu)中,文獻(xiàn)C會(huì)受到跨語言、跨文獻(xiàn)類型、跨學(xué)科等因素的影響,不負(fù)責(zé)任地間接從文獻(xiàn)B的引文內(nèi)容中轉(zhuǎn)引文獻(xiàn)A,從而體現(xiàn)出B-A與C-A引文內(nèi)容相似度較高、文獻(xiàn)B與文獻(xiàn)C參考文獻(xiàn)重復(fù)較多等特征。具體引用情境為:追隨文獻(xiàn)C作者受到文獻(xiàn)A跨語言、跨文獻(xiàn)類型、跨學(xué)科等壁壘,無法獲取原始文獻(xiàn),或?yàn)榱耸×Σ辉覆檎液烷喿x原文,但為了增加參考文獻(xiàn)豐富度、“裝飾門面”等,在閱讀與其相同語言、相同文獻(xiàn)類型或相同學(xué)科的文獻(xiàn)B時(shí),產(chǎn)生惰性引用心理,傾向于從文獻(xiàn)B的引文中直接轉(zhuǎn)引文獻(xiàn)A,從而對(duì)文獻(xiàn)A施加間接引用。

        4.2匿引行為的影響因素分析

        從耦合關(guān)系中文獻(xiàn)A、B所在期刊影響力、發(fā)表時(shí)間間隔、被引影響力3個(gè)方面,對(duì)隱形三角引用行為中參考但未引用文獻(xiàn)B的匿引行為進(jìn)行引用語境分析,僅引用A、未引用B的匿引行為在文獻(xiàn)特征上的表現(xiàn)是:文獻(xiàn)B收獲的被引量較少,而使用量較大;相反,文獻(xiàn)A的被引量則較大,使用量偏小。因此,根據(jù)CR(A)、CR(B)的計(jì)算結(jié)果,比較在CR(A)<1且CR(B)<1、CR(A) <1且CR(B)≥1、CR(A)≥1且CR(B)<1、CR(A)≥1且CR(B)≥1的4個(gè)數(shù)據(jù)集合中,文獻(xiàn)A、B在期刊影響因子、發(fā)表時(shí)間、被引頻次3個(gè)角度的差異。

        1)期刊影響力差異。首先,計(jì)算文獻(xiàn)A、B發(fā)表期刊的影響因子差距對(duì)匿引行為的影響。去掉非期刊類型的文獻(xiàn),以及未被收錄、無影響因子的文獻(xiàn)數(shù)據(jù)后,共剩余2598600條文獻(xiàn)耦合數(shù)據(jù)。分別統(tǒng)計(jì)文獻(xiàn)A、B所在期刊的5年影響因子,并計(jì)算IF(A) -IF(B)。圖10顯示了不同的影響因子之差在4個(gè)耦合數(shù)據(jù)集中所占比例。

        在圖10的特征分布中,對(duì)比以使用一引用轉(zhuǎn)化率分類的4個(gè)數(shù)據(jù)集合,CR(A)≥1且CR(B)<1數(shù)據(jù)集中的影響因子之差分布最為集中,主要分布在-4~50范圍內(nèi)。相比之下,在-8~-90的較大負(fù)值范圍內(nèi),CR(A)≥1且CR(B) <1的數(shù)量微乎其微,而其他3個(gè)數(shù)據(jù)集合在該區(qū)域均占有一定比例。因此,對(duì)于CR(A)≥1且CR(B)<1的耦合數(shù)據(jù),文獻(xiàn)A與文獻(xiàn)B的影響因子之差明顯主要分布在正值區(qū)域內(nèi),即文獻(xiàn)A所在期刊的影響因子一般高于文獻(xiàn)B。

        通常情況下,期刊聲望越高,文章質(zhì)量就越好,學(xué)界認(rèn)可度也越強(qiáng)。對(duì)于研究主題與研究內(nèi)容相似的論文,作者會(huì)更傾向于引用發(fā)表在權(quán)威度較高期刊上的論文?;贑R(A)≥1且CR(B)<1的期刊影響因子分布,可以看到隱形三角引用結(jié)構(gòu)中的文獻(xiàn)C作者,在文獻(xiàn)A、B二者擇其一的情況下,更傾向于選擇引用期刊影響力與權(quán)威度更高的文獻(xiàn)A,在實(shí)際引用中往往忽略所在期刊影響力相對(duì)較低的文獻(xiàn)B,從而出現(xiàn)文獻(xiàn)A的被引量甚至高于其使用量(CR(A)≥1),文獻(xiàn)B收獲的被引頻次遠(yuǎn)遠(yuǎn)低于其應(yīng)有的被引量(CR(B)<1)這一現(xiàn)象。在隱形三角引用結(jié)構(gòu)中,文獻(xiàn)A、B所發(fā)表期刊的影響力差異是施引作者C選擇匿引文獻(xiàn)B的重要影響因素。

        2)發(fā)表時(shí)間差異。其次,計(jì)算文獻(xiàn)A、B發(fā)表時(shí)間間隔,以分析文獻(xiàn)發(fā)表優(yōu)先權(quán)對(duì)匿引行為的影響。分別統(tǒng)計(jì)2 922 5 13條耦合數(shù)據(jù)中文獻(xiàn)A、B的發(fā)表年份,并計(jì)算year(B)-year(A)。圖11顯示了不同發(fā)表時(shí)間差在4個(gè)耦合數(shù)據(jù)集中所占的比例。

        從文獻(xiàn)A、B發(fā)表時(shí)間角度可以發(fā)現(xiàn),在以使用一引用轉(zhuǎn)化率分類的4個(gè)耦合數(shù)據(jù)集合中,CR(A)≥1且CR(B)<1明顯與其他3組數(shù)據(jù)集的分布范圍不同。對(duì)于CR(A) <1且CR(B) <1、CR(A)<1且CR(B)≥1、CR(A)≥1且CR(B)≥1這3個(gè)數(shù)據(jù)集合,隨著時(shí)間差year(B)-year(A)增大,對(duì)應(yīng)的耦合數(shù)據(jù)所占比例明顯隨之減少:相反,CR(A)≥1且CR(B) <1的時(shí)間差隨時(shí)間變化明顯比較穩(wěn)定,在2~12年里的分布比例幾乎一致。其次,從極端值看,在文獻(xiàn)A早于文獻(xiàn)B發(fā)表20年以上的數(shù)據(jù)中,基本是CR(A)≥1且CR(B)<1的耦合關(guān)系,甚至還有部分文獻(xiàn)A發(fā)表在文獻(xiàn)B之前47年之久。因此,當(dāng)文獻(xiàn)耦合結(jié)構(gòu)中CR(A)≥1且CR(B)<1時(shí),文獻(xiàn)A的發(fā)表時(shí)間一般要遠(yuǎn)遠(yuǎn)早于文獻(xiàn)B,而在其他使用一引用轉(zhuǎn)化率情況中,文獻(xiàn)A與文獻(xiàn)B的發(fā)表時(shí)間間隔相對(duì)較小。

        因此,在隱形三角引用結(jié)構(gòu)中,文獻(xiàn)A、B的出版時(shí)間差距是施引作者C選擇匿引文獻(xiàn)B的重要影響因素??紤]到文獻(xiàn)A在相關(guān)研究領(lǐng)域的相對(duì)領(lǐng)先地位、發(fā)表優(yōu)先權(quán)等,追隨文獻(xiàn)C更傾向于引用發(fā)表時(shí)間較早、較年長的文獻(xiàn)A,而不引用發(fā)表時(shí)間相對(duì)較近、較年輕的文獻(xiàn)B,從而導(dǎo)致文獻(xiàn)A的被引量甚至高于其使用量(CR(A)≥1),而文獻(xiàn)B收獲的被引頻次遠(yuǎn)遠(yuǎn)低于其應(yīng)有的被引量(CR(B)<1)。

        3)自身被引影響力。論文所獲被引頻次在一定程度上反映了論文在該研究領(lǐng)域的影響力或地位,計(jì)算文獻(xiàn)A、B所獲被引頻次的差距,以分析文獻(xiàn)A、B自身影響力對(duì)匿引行為的影響。分別統(tǒng)計(jì)2922513條耦合數(shù)據(jù)中文獻(xiàn)A、B的被引頻次,并計(jì)算C(A)-C(B),圖12顯示了不同的被引差在4個(gè)耦合數(shù)據(jù)集中所占比例。

        在被引頻次差異情境下,耦合數(shù)據(jù)集CR(A)≥1且CR(B)<1仍表現(xiàn)出與期刊影響力、發(fā)表時(shí)間等類似的特征。在以使用一引用轉(zhuǎn)化率分類的4組數(shù)據(jù)集中,CR(A)≥1且CR(B) <1的被引頻次之差主要分布在200~700區(qū)間內(nèi);相反,在文獻(xiàn)B被引頻次大于文獻(xiàn)A的左側(cè)負(fù)值區(qū)域內(nèi),幾乎沒有CR(A)≥1且CR(B) <1的耦合數(shù)據(jù),而其他3種數(shù)據(jù)集(CR(A)<1且CR(B) <1、CR(A) <1且CR(B)≥1、CR(A)≥1且CR(B)≥1)在負(fù)值區(qū)域內(nèi)均有明顯的一定比例分布。因此,當(dāng)文獻(xiàn)耦合結(jié)構(gòu)中CR(A)≥1且CR(B)<1時(shí),文獻(xiàn)A的被引影響力一般遠(yuǎn)遠(yuǎn)高于文獻(xiàn)B。

        在隱形三角引用結(jié)構(gòu)中,文獻(xiàn)A、B的被引頻次大小及其差距是追隨文獻(xiàn)C選擇匿引文獻(xiàn)B的重要影響因素。Price D J S曾指出:一篇經(jīng)常被引用的論文比一篇很少被引用的論文更容易再次被引用。考慮到文獻(xiàn)A在相關(guān)研究領(lǐng)域的影響力、權(quán)威度等,追隨文獻(xiàn)C作者更傾向于引用被引頻次較高的文獻(xiàn)A,而忽略被引較少的中間文獻(xiàn)B,從而導(dǎo)致文獻(xiàn)A的被引量甚至高于其使用量(CR(A)≥1),而文獻(xiàn)B收獲的被引頻次遠(yuǎn)遠(yuǎn)低于其應(yīng)有的被引量(CR(B)<1)。

        綜上所述,在隱形三角引用行為中,由期刊影響力差異、發(fā)表時(shí)間差異、自身被引影響力差異導(dǎo)致的匿引文獻(xiàn)B現(xiàn)象在科學(xué)文獻(xiàn)引用中真實(shí)且廣泛存在??茖W(xué)文獻(xiàn)引用中的馬太效應(yīng)指出,作者通常具有崇拜學(xué)術(shù)權(quán)威和學(xué)術(shù)名望的社會(huì)心理,引用動(dòng)機(jī)會(huì)受到社會(huì)因素和主觀意識(shí)的影響。為了達(dá)到說服和被認(rèn)可的目的,學(xué)者們?cè)谡撐淖珜戇^程中,更傾向于引用被認(rèn)為具有“權(quán)威性”的文獻(xiàn),如著名期刊、著名學(xué)者、著名文獻(xiàn)等,而不管被引文獻(xiàn)在研究內(nèi)容上與自己的論文是否實(shí)質(zhì)性相關(guān)。追隨文獻(xiàn)C在閱讀文獻(xiàn)B時(shí),通過文獻(xiàn)B中關(guān)于A的引文內(nèi)容對(duì)文獻(xiàn)A施加引用,即表現(xiàn)為三角引用結(jié)構(gòu):但文獻(xiàn)C會(huì)受到文獻(xiàn)A與文獻(xiàn)B期刊影響力差異、發(fā)表時(shí)間間隔差異、自身被引影響力差異等影響,在引用過程中往往忽略期刊影響力較差、發(fā)表時(shí)間較晚或被引頻次較低的文獻(xiàn)B,只引用相對(duì)更“權(quán)威”的文獻(xiàn)A,從而在引文網(wǎng)絡(luò)中表現(xiàn)為文獻(xiàn)B、C同時(shí)引用文獻(xiàn)A的耦合關(guān)系,即隱形三角引用結(jié)構(gòu)。

        5結(jié)語

        文獻(xiàn)的不當(dāng)引用是一個(gè)長期、復(fù)雜且相對(duì)隱蔽的現(xiàn)象,既屬于學(xué)術(shù)道德問題,又屬于學(xué)術(shù)規(guī)范問題。學(xué)界針對(duì)科學(xué)文獻(xiàn)引用相關(guān)問題已進(jìn)行了大量的研究,但很少有人關(guān)注不合理的參考文獻(xiàn)引用對(duì)學(xué)術(shù)論文價(jià)值造成的不良影響。本文通過大規(guī)模的文獻(xiàn)數(shù)據(jù)對(duì)隱形三角引用行為進(jìn)行有效識(shí)別,并嘗試結(jié)合相關(guān)文獻(xiàn)特征,挖掘這種不合理引用背后的引用動(dòng)機(jī)與情境。

        首先,在隱形三角引用行為識(shí)別中,雖然文獻(xiàn)B與C之間未有直接的引用關(guān)系與關(guān)聯(lián),但本文結(jié)合使用一引用轉(zhuǎn)化率、耦合強(qiáng)度、引文內(nèi)容相似度等多維度判定指標(biāo),從近300萬組文獻(xiàn)耦合數(shù)據(jù)中層層篩選,發(fā)現(xiàn)了39276條隱形三角引用行為。其中,引用動(dòng)機(jī)、引用行為的識(shí)別均建立在理想化的前提和推斷之上,部分?jǐn)?shù)據(jù)可能帶有判斷誤差,但通過大規(guī)模的數(shù)據(jù)表現(xiàn)出的特征規(guī)律及多個(gè)判定指標(biāo)綜合的識(shí)別結(jié)果,足以表征隱形三角引用行為在科學(xué)文獻(xiàn)引用中的真實(shí)且普遍存在。

        其次,在隱形三角引用行為的引用情境分析中,由文獻(xiàn)語言、文獻(xiàn)類型、所屬學(xué)科領(lǐng)域影響的轉(zhuǎn)引行為是真實(shí)存在的,由文獻(xiàn)A、B所在期刊影響力、自身影響力、發(fā)表時(shí)間差異影響的匿引行為也真實(shí)存在。雖然,轉(zhuǎn)引行為與匿引行為中作者刻意的主觀性動(dòng)機(jī)無法通過文獻(xiàn)來源信息間接判斷,但由文獻(xiàn)特征等客觀因素導(dǎo)致的引用動(dòng)機(jī)則可以通過大規(guī)模數(shù)據(jù)表征出來,并足以表征隱形三角引用這種不規(guī)范引用現(xiàn)象存在的必然性。

        因此,在進(jìn)行引文分析與評(píng)價(jià)時(shí),可以通過技術(shù)手段提前識(shí)別、并排除這些引文相似度較高的不規(guī)范引用,以增強(qiáng)引文分析的可靠性。廣大科學(xué)界學(xué)者、期刊應(yīng)共同重視引文不當(dāng)問題的緊迫性和重要性,逐步推出針對(duì)不當(dāng)引用行為的監(jiān)督、獎(jiǎng)勵(lì)機(jī)制,鼓勵(lì)廣大學(xué)者發(fā)現(xiàn)、修正間接引用、引而不標(biāo)注、匿引等不合理引用問題。在國家、相關(guān)機(jī)構(gòu)組織等層面,要高度重視文獻(xiàn)情報(bào)的管理工作,加強(qiáng)智力投資,建立健全各種類型科研文獻(xiàn)、科研成果的全文存儲(chǔ)與開放獲取平臺(tái),盡可能為學(xué)者提供多語言、多種文獻(xiàn)類型的文獻(xiàn)資源全文,以避免作者因獲取、借閱不到原始文獻(xiàn)而進(jìn)行間接三角引用、隱形三角引用等行為。對(duì)于期刊編審人員,應(yīng)重視參考文獻(xiàn)的規(guī)范化著錄,對(duì)參考文獻(xiàn)引用是否得當(dāng)及準(zhǔn)確性提出意見,提高文獻(xiàn)引用的科學(xué)性與真實(shí)性。對(duì)存在嚴(yán)重虛假引用、錯(cuò)誤引用或不規(guī)范引用的稿件嚴(yán)肅處理或不予錄用。在作者層面,作者自身也要提高對(duì)參考文獻(xiàn)重要性的認(rèn)識(shí),重視參考文獻(xiàn)的選擇和著錄。論文所引用的參考文獻(xiàn)應(yīng)限于作者親自閱讀過的、與論文有密切聯(lián)系的文獻(xiàn):在無法查到原始文獻(xiàn)、只能間接引用的情況下,應(yīng)采用腳注的方式注明引文出處,消除轉(zhuǎn)引對(duì)引文分析結(jié)果的影響。同時(shí),作者不應(yīng)將參考文獻(xiàn)的數(shù)量、語種、來源期刊、來源機(jī)構(gòu)等作為權(quán)衡論文質(zhì)量唯一或過于重要的標(biāo)準(zhǔn),無論參考文獻(xiàn)是出自“名家之手”還是出自“無名小卒”,均應(yīng)出于對(duì)前人研究成果的尊重而如實(shí)地在論文中予以標(biāo)識(shí),并在文后參考文獻(xiàn)中著錄。

        猜你喜歡
        影響因素
        房地產(chǎn)經(jīng)濟(jì)波動(dòng)的影響因素及對(duì)策
        零售銀行如何贏得客戶忠誠度
        醫(yī)保政策對(duì)醫(yī)療服務(wù)價(jià)格影響因素的探討
        東林煤礦保護(hù)層開采瓦斯抽采影響因素分析
        影響農(nóng)村婦女政治參與的因素分析
        高新技術(shù)企業(yè)創(chuàng)新績效影響因素的探索與研究
        水驅(qū)油效率影響因素研究進(jìn)展
        突發(fā)事件下應(yīng)急物資保障能力影響因素研究
        環(huán)衛(wèi)工人生存狀況的調(diào)查分析
        農(nóng)業(yè)生產(chǎn)性服務(wù)業(yè)需求影響因素分析
        商(2016年27期)2016-10-17 07:09:07
        久草视频在线手机免费看| 亚洲av成人一区二区三区网址| 中文字幕人妻少妇美臀| 中文av字幕一区二区三区| 99热在线观看| 国模无码人体一区二区| 国产女人体一区二区三区| 免费看片的网站国产亚洲| 最新国产毛2卡3卡4卡| 97精品依人久久久大香线蕉97| 亚洲性69影视| 午夜精品男人天堂av| 乱人伦精品视频在线观看| 99久久免费精品高清特色大片 | 中文亚洲成a人片在线观看 | 亚洲av无一区二区三区| 人妻熟女一区二区三区app下载| 这里只有久久精品| 狼人av在线免费观看| 东北女人一级内射黄片| 国产又爽又粗又猛的视频| 国产xxxxx在线观看免费| 日本一区二区三区激视频| 欧美伦费免费全部午夜最新| 欧美丰满熟妇aaaaa片| 亚洲成aⅴ人片在线观看天堂无码| 乳乱中文字幕熟女熟妇| 丁香美女社区| 99久久久国产精品免费蜜臀| 男女搞黄在线观看视频| www国产亚洲精品| 亲子乱aⅴ一区二区三区下载| 欧洲人体一区二区三区| 丝袜美腿人妻第一版主| 国产又色又爽又刺激在线播放| 人妻无码Aⅴ中文系列| 网红尤物泛滥白浆正在播放 | 亚洲最大一区二区在线观看| 欧美性受xxxx狂喷水| 国产成人精品午夜福利免费APP| 日本一区二区在线播放|