亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于“反事實(shí)”思想測度學(xué)術(shù)期刊對知識(shí)系統(tǒng)信息熵變化的貢獻(xiàn)

        2022-07-30 01:20:04
        情報(bào)學(xué)報(bào) 2022年7期
        關(guān)鍵詞:信息熵學(xué)術(shù)期刊論文

        馬 崢

        (1. 中國科學(xué)技術(shù)信息研究所,北京 100038;2. 南京大學(xué)信息管理學(xué)院,南京 210023)

        1 引 言

        學(xué)術(shù)期刊是記錄科學(xué)研究人員創(chuàng)新性科研成果的主要載體,針對學(xué)術(shù)期刊設(shè)計(jì)合理、科學(xué)和準(zhǔn)確的評價(jià)方法具有非常重要的研究意義和實(shí)踐意義[1]。在早期,對學(xué)術(shù)期刊的評價(jià)主要還是依靠同行評議的方式。目前,學(xué)術(shù)期刊的評價(jià)方法越來越偏重于定量方法,主要分為基于傳統(tǒng)計(jì)量學(xué)和替代計(jì)量學(xué)兩種方式。

        在早期學(xué)術(shù)期刊品種總體數(shù)量比較少,在各個(gè)學(xué)科中分布的數(shù)量也不多,因此對學(xué)術(shù)期刊評價(jià)的需求和必要性相對較弱。各個(gè)領(lǐng)域科學(xué)家對相關(guān)期刊的情況比較了解,且期刊出版活動(dòng)和發(fā)展變化的節(jié)奏相對較慢,期刊所發(fā)表的文獻(xiàn)數(shù)量也相對較少,所以當(dāng)科學(xué)家評價(jià)和擇優(yōu)選擇適合發(fā)表論文的期刊時(shí),有可能實(shí)現(xiàn)對同學(xué)科或同類型期刊的遍歷,因而采取同行評議的方式,就是可以實(shí)現(xiàn)最高效率、最準(zhǔn)確結(jié)果的最優(yōu)選擇。目前,同行評議仍是很多期刊評價(jià)活動(dòng)中不可缺失的組成部分[2-3]。隨著全球社會(huì)經(jīng)濟(jì)的發(fā)展,工業(yè)革命引領(lǐng)下出版行業(yè)和傳播行業(yè)的繁榮,以及以信息科學(xué)技術(shù)為代表的科技研究活動(dòng)日新月異的進(jìn)步,學(xué)術(shù)期刊種類以及所承載的文獻(xiàn)量急劇增長,同行評議制度的適用性受到了不斷的沖擊,任何科學(xué)家都難以對學(xué)科領(lǐng)域的所有期刊情況和所有發(fā)表論文有全面和深入的了解,也難以完全客觀地對眾多學(xué)術(shù)期刊的學(xué)術(shù)質(zhì)量和影響力水平都有準(zhǔn)確認(rèn)知[4],以及從中篩選出學(xué)術(shù)影響力大、知識(shí)傳播效率高的高質(zhì)量期刊。同行評議評價(jià)方式所暴露的方方面面的問題在學(xué)科評價(jià)領(lǐng)域也都逐漸有所體現(xiàn)[5]。例如,同行評議專家的主觀性問題、隨意性問題、意見過于分散的問題、出于個(gè)人及小團(tuán)體利益的考慮而產(chǎn)生的學(xué)術(shù)道德與誠信問題,等等[6]。

        隨著文獻(xiàn)數(shù)量的累計(jì)和文獻(xiàn)學(xué)研究的發(fā)展,對學(xué)術(shù)期刊評價(jià)方法的研究主要繼承了文獻(xiàn)學(xué)[7]研究思路。錢榮貴[8]、邱均平等[9]和賴茂生等[10]對期刊評價(jià)活動(dòng)源起的時(shí)間分別進(jìn)行了研究,普遍認(rèn)為20世紀(jì)30 年代開始,隨著工業(yè)技術(shù)發(fā)展和學(xué)術(shù)傳播活動(dòng)的快速興起,學(xué)術(shù)文獻(xiàn)的體量和總品種數(shù)量快速提升,需要通過評價(jià)從中篩選出應(yīng)當(dāng)優(yōu)先使用的重要期刊,于是歐洲開始出現(xiàn)了對期刊的評價(jià)活動(dòng)和方法探索。1934 年,布拉德福歸納了“文獻(xiàn)離散定律”,發(fā)現(xiàn)各學(xué)科都存在“核心區(qū)”期刊刊載本學(xué)科絕大部分主要文獻(xiàn)的現(xiàn)象。學(xué)術(shù)期刊評價(jià)理論起源于布拉德福定律對學(xué)術(shù)期刊分層的定義。20 世紀(jì)60 年代,美國著名的情報(bào)學(xué)家尤金·加菲爾德探究建立引文分析體系,逐步構(gòu)建了系列引文數(shù)據(jù)庫,并在實(shí)踐中不斷擴(kuò)展應(yīng)用范圍,衍生新的分析體系和方法,形成了廣泛的影響。經(jīng)過長期以來的研究和實(shí)踐,國內(nèi)外圍繞科技學(xué)術(shù)期刊評價(jià)逐漸形成了應(yīng)用廣泛的、基于科學(xué)計(jì)量學(xué)指標(biāo)的評價(jià)方法和指標(biāo)體系[11]。典型的研究成果包括1955 年加菲爾德發(fā)明的“影響因子”[12],2005 年美國物理學(xué)家喬治·赫施發(fā)明的“h 指數(shù)”[13]等。應(yīng)用基于引文分析的傳統(tǒng)計(jì)量學(xué)指標(biāo)也存在顯著問題[14]。例如,基于引文分析理論的傳統(tǒng)科學(xué)計(jì)量指標(biāo)評價(jià)所需后置時(shí)間較長,通常需要數(shù)年才能相對完整地評價(jià)期刊學(xué)術(shù)影響力,不能及時(shí)體現(xiàn)期刊學(xué)術(shù)影響力的變化;傳統(tǒng)科學(xué)計(jì)量指標(biāo)的評價(jià)數(shù)據(jù)來源主要偏重期刊論文等文獻(xiàn)形式,沒有統(tǒng)籌考慮被評價(jià)期刊在學(xué)術(shù)交流、產(chǎn)業(yè)發(fā)展、學(xué)科建設(shè)、人才培養(yǎng)等方面所發(fā)揮的作用和取得的影響;引文分析的基礎(chǔ)假設(shè)是:引用反映出學(xué)術(shù)成果產(chǎn)生了積極效果,但是現(xiàn)實(shí)中引文動(dòng)機(jī)比較多樣化[15],引用某篇論文未必就說明引用者認(rèn)可那篇論文[16]。

        2010 年10 月,J. Priem 和D.Taraborelli 等學(xué)者共同發(fā)表了Altmetrics:A manifesto宣言,提出替代計(jì)量學(xué)(Altmetrics)的概念[17]。其主要進(jìn)步在于跳出了以文獻(xiàn)統(tǒng)計(jì)為中心的傳統(tǒng)科學(xué)計(jì)量學(xué)1.0 時(shí)代,跨入以社交媒體內(nèi)容分析所產(chǎn)生的數(shù)據(jù)和網(wǎng)絡(luò)資源標(biāo)簽化結(jié)構(gòu)等Web 2.0 技術(shù)為中心的2.0 時(shí)代[18],能夠更快、更全面、更有效地反映被評價(jià)對象的影響力?;谏缃幻襟w數(shù)據(jù)統(tǒng)計(jì)出評價(jià)對象的網(wǎng)絡(luò)活動(dòng)數(shù)據(jù)(下載量[19],自媒體發(fā)表學(xué)術(shù)內(nèi)容的引用行為、瀏覽行為、點(diǎn)擊次數(shù)、評論內(nèi)容、推薦數(shù)、點(diǎn)贊數(shù)、轉(zhuǎn)發(fā)次數(shù)等[20]),可以研制形成新型的計(jì)量指標(biāo)[21-22]。普遍認(rèn)為,科學(xué)有效地應(yīng)用替代計(jì)量學(xué)能夠?qū)崿F(xiàn)更加全面的影響力評價(jià)[23-25]。在評價(jià)導(dǎo)向上,替代計(jì)量學(xué)指標(biāo)方法在評價(jià)方面的應(yīng)用將會(huì)促進(jìn)在互聯(lián)網(wǎng)上開展更豐富多彩、更高效快捷的科學(xué)交流[26],并能推動(dòng)衍生出一系列完善和優(yōu)化現(xiàn)有信息組織與信息發(fā)現(xiàn)的新方法、新工具、新機(jī)制[27-28]。替代計(jì)量學(xué)目前很難完全取代傳統(tǒng)科學(xué)計(jì)量學(xué)評價(jià)方法[29],但是科學(xué)界和出版?zhèn)鞑ソ缙毡榭春梦磥硖娲?jì)量學(xué)指標(biāo)在學(xué)術(shù)成果評價(jià)和期刊影響力評價(jià)方面的潛在重要作用[30]。但是,替代計(jì)量指標(biāo)應(yīng)用于科技期刊評價(jià)存在一個(gè)顯著的挑戰(zhàn),就是如何避免人為干擾指標(biāo)[31]。與之相關(guān)的問題還包括替代計(jì)量指標(biāo)的數(shù)據(jù)嚴(yán)謹(jǐn)性和數(shù)據(jù)一致性問題[32]。另一個(gè)受到關(guān)注的問題是如何認(rèn)定廣域分散的動(dòng)態(tài)數(shù)據(jù)源是科學(xué)可靠的,統(tǒng)計(jì)分析結(jié)果是科學(xué)可重復(fù)的[33]。

        學(xué)術(shù)期刊的核心功能是分享科學(xué)家的研究認(rèn)知和創(chuàng)新技術(shù)突破[34],是學(xué)術(shù)信息的有序和有效傳播途徑[35]。從情報(bào)學(xué)角度看,學(xué)術(shù)期刊的識(shí)別、監(jiān)測、評價(jià)和管理等問題可以歸結(jié)為學(xué)術(shù)信息集合的靜態(tài)和動(dòng)態(tài)的定量測度問題[36]。信息熵方法正是解決信息度量問題的經(jīng)典理論方法。深入信息熵理論層面對期刊學(xué)術(shù)傳播規(guī)律展開研究,是從本質(zhì)上認(rèn)識(shí)學(xué)術(shù)期刊,探索學(xué)術(shù)期刊在科學(xué)發(fā)展和知識(shí)傳播中發(fā)揮的作用和實(shí)現(xiàn)機(jī)理,對于情報(bào)學(xué)、信息傳播研究、學(xué)術(shù)出版研究和科技成果研究具有重要理論意義。

        本研究假設(shè),科技學(xué)術(shù)期刊的作用之一是減少科學(xué)認(rèn)識(shí)中的不確定因素??茖W(xué)認(rèn)識(shí)中的不確定因素減少的過程是知識(shí)系統(tǒng)的熵減的過程。學(xué)術(shù)期刊出版過程的根本目的是通過對科學(xué)發(fā)現(xiàn)和技術(shù)創(chuàng)新成果的傳播推廣,使人們更加準(zhǔn)確地認(rèn)知科學(xué)問題和規(guī)律。通過定量方法,測度學(xué)術(shù)出版前后知識(shí)系統(tǒng)的信息熵變化量,研制測度科技學(xué)術(shù)期刊貢獻(xiàn)的評價(jià)方法。

        在經(jīng)典信息論中,對信息量的測度不考慮消息的內(nèi)容重要性或內(nèi)在意義。信息量的多少和信息的重要性沒有必然的聯(lián)系,經(jīng)典信息熵只是在數(shù)量層面計(jì)算出一個(gè)數(shù)值,并非直接表示該信息的重要性。某期刊為知識(shí)系統(tǒng)的信息熵引入了多少負(fù)熵,反映了該期刊為學(xué)科發(fā)展做出多少貢獻(xiàn)。在本研究中,擬基于“反事實(shí)”思想,通過對計(jì)算信息熵的“事實(shí)量”和“反事實(shí)量”之間的差距,解決對信息效用的測度問題。

        “反事實(shí)”研究思想是提出反事實(shí)的假定,設(shè)定與事實(shí)相反的條件,根據(jù)反事實(shí)推理形成的結(jié)果,判斷反事實(shí)條件變化與結(jié)果之間的因果關(guān)系。在面對繁雜評價(jià)相關(guān)因素的情況下,傳統(tǒng)因果分析是往往假定研究者已經(jīng)控制了解釋因變量的重要因素,并且沒有遺漏重要自變項(xiàng);但是研究所處的情況和變量經(jīng)常無法滿足這一假定,或者所觀察的對象并非隨機(jī)發(fā)生的,因而經(jīng)常會(huì)產(chǎn)生內(nèi)生性或樣本選擇偏誤的問題,造成因果分析的不準(zhǔn)確和偏差,甚至是錯(cuò)誤。反事實(shí)分析的優(yōu)點(diǎn)是能明確地找出傳統(tǒng)回歸分析無法充分掌握的不同樣本群在基準(zhǔn)線上的差異或因果效果的異質(zhì)性,進(jìn)而進(jìn)行準(zhǔn)確的因果分析[37]。

        2 數(shù) 據(jù)

        2.1 樣 本

        本研究采用萬方數(shù)據(jù)資源系統(tǒng)期刊數(shù)據(jù)庫2016—2019 年所收錄的全部期刊論文和引文數(shù)據(jù)作為主要統(tǒng)計(jì)數(shù)據(jù)來源??紤]到我國開展學(xué)術(shù)期刊評價(jià)的需求,被評價(jià)期刊大都是中文期刊,因此,采用國內(nèi)中文文獻(xiàn)為主的數(shù)據(jù)庫更能保證評價(jià)結(jié)果的可靠性。該數(shù)據(jù)庫系統(tǒng)覆蓋了我國出版的絕大多數(shù)學(xué)術(shù)期刊,其中包括原國家新聞出版廣電總局2014 年認(rèn)定的3713 種科技類學(xué)術(shù)期刊。

        原國家新聞出版廣電總局采用各主管單位初審上報(bào)、總局審定的方式,認(rèn)定了第一批學(xué)術(shù)期刊名單。本研究用于實(shí)證的樣本采用其中歸屬于科技類的3713 種學(xué)術(shù)期刊。

        2.2 學(xué)科分類體系

        參照《中國科技期刊引證報(bào)告(核心版)》《中華人民共和國國家標(biāo)準(zhǔn)學(xué)科分類與代碼(GB/T 13745—2009)》《中國圖書資料分類法(第四版)》,設(shè)定112 個(gè)學(xué)科類別。學(xué)科類別的劃分考慮到各個(gè)學(xué)科的隸屬關(guān)系和出版物的規(guī)模,分為自然科學(xué)綜合、理學(xué)、農(nóng)學(xué)、醫(yī)學(xué)、工程技術(shù)、管理等6 大部分。其中第1 部分“自然科學(xué)綜合”類是指報(bào)道綜合性內(nèi)容(發(fā)表多學(xué)科的研究論文)的期刊。由于這部分期刊品種很多,其中大學(xué)學(xué)報(bào)數(shù)量尤其多,為此再細(xì)分為3 個(gè)類別。其余5 大部分按照學(xué)科屬性進(jìn)行劃分。

        2.3 各學(xué)科高頻詞統(tǒng)計(jì)

        布拉德福定律指出,大部分學(xué)術(shù)成果文獻(xiàn)向少量重要期刊聚集。在各個(gè)學(xué)科中,少量核心區(qū)期刊就能集中刊載本學(xué)科主要科研成就。為了提高工作效率,同時(shí)也為了減少一般性期刊中大量低水平論文的干擾,本研究采用中國科學(xué)技術(shù)信息研究所研制的中國科技論文與引文數(shù)據(jù)庫(China Scientific and Technical Papers and Citations Database, CST‐PCD)2016 年收錄的論文統(tǒng)計(jì)高頻詞。

        CSTPCD 2016 收錄中國科技核心期刊2008 種,大約占我國科技期刊總數(shù)的1/3。核心期刊所報(bào)道的研究活動(dòng)是各個(gè)學(xué)科的主流研究領(lǐng)域,覆蓋的作者群體和研究選題能比較集中地反映各個(gè)學(xué)科的核心科研活動(dòng),因而避免了被統(tǒng)計(jì)中的噪音數(shù)據(jù)過度干擾。

        CSTPCD 2016 收錄56.49 萬篇論文,使用關(guān)鍵詞149.40 萬個(gè)、414.83 萬次,平均每篇論文使用7.3個(gè)關(guān)鍵詞,中文詞和英文詞計(jì)為2 個(gè)不同關(guān)鍵詞,以此為基礎(chǔ)計(jì)算各個(gè)學(xué)科使用頻次列在前1%的高頻關(guān)鍵詞。

        3 由期刊論文構(gòu)成的知識(shí)系統(tǒng)的概念

        3.1 學(xué)術(shù)傳播的系統(tǒng)屬性

        對學(xué)術(shù)期刊傳播的特點(diǎn)和屬性進(jìn)行系統(tǒng)思考和重新梳理,可以認(rèn)為科技學(xué)術(shù)期刊具備如下特征,且符合一個(gè)系統(tǒng)的特性。

        (1)總體大于部分之和[38]。我國科技期刊作為一個(gè)整體,不是幾千種科技期刊的簡單加和。這些科技期刊和對科技期刊的管理機(jī)制、評價(jià)、投入等諸多相關(guān)內(nèi)容以及它們之間的聯(lián)系,共同構(gòu)成了科技期刊這一總體系統(tǒng)。對科技期刊的研究和管理,有必要從總體上進(jìn)行考慮[39]。

        (2)多重目標(biāo),多重發(fā)展路徑??萍计诳陌l(fā)展目標(biāo)不僅是記載、傳播和積累科技信息、科技理念、科技知識(shí),成為展示科技進(jìn)步的窗口,同時(shí)也應(yīng)成為科技人員進(jìn)行科技成果傳播和學(xué)術(shù)交流的平臺(tái)??萍计诳从沉艘粐萍及l(fā)展的現(xiàn)狀和水平,承擔(dān)著促進(jìn)科學(xué)創(chuàng)新的公共社會(huì)責(zé)任[40]。科技期刊是科學(xué)活動(dòng)中的紐帶和橋梁,因此,科技活動(dòng)中的科學(xué)研究、科技管理政策、科技出版管理體制等多方面的相關(guān)因素都會(huì)對科技期刊發(fā)展和變化產(chǎn)生影響;而這些因素在不同時(shí)期的不同組合,也意味著多種發(fā)展道路和結(jié)果。選擇最優(yōu)方案正是系統(tǒng)思考支持決策的最終目的。

        (3)因果互動(dòng)和內(nèi)部反饋。從內(nèi)部而言,科技期刊的政策法規(guī)、體制、人員、產(chǎn)業(yè)、評價(jià)等子系統(tǒng)和更多相關(guān)因素之間,還有單個(gè)期刊之間,并不是簡單的單向因果關(guān)系,而是相互影響,互為因果。貝塔朗菲是現(xiàn)代系統(tǒng)研究的開創(chuàng)者,他對系統(tǒng)的定義就是相互作用的多元素的復(fù)合體[41]??萍计诳沁@樣的一個(gè)復(fù)雜系統(tǒng)。

        (4)封閉和開放的統(tǒng)一??萍计诳诳茖W(xué)事業(yè)發(fā)展的大環(huán)境中,是一個(gè)相對獨(dú)立的系統(tǒng)。但是這個(gè)獨(dú)立系統(tǒng)并非一個(gè)完全孤立的封閉體。科技期刊系統(tǒng)與外界環(huán)境之間的物質(zhì)、能量和信息的交換是其自身發(fā)展和發(fā)揮功能的機(jī)理,而且這種交換在一定的條件下會(huì)形成相對穩(wěn)定的狀態(tài),即科技期刊系統(tǒng)兼?zhèn)浞忾]性和開放性。

        3.2 知識(shí)系統(tǒng)不確定性的構(gòu)成

        本研究定義的知識(shí)系統(tǒng)是,在確定的邊界內(nèi),基于一定的知識(shí)載體,匯集人類對客觀世界的顯性認(rèn)知,同時(shí)存在相同和不同的研究觀點(diǎn),并且隨著時(shí)間轉(zhuǎn)移會(huì)出現(xiàn)觀點(diǎn)的變化、增加和消失。這種觀點(diǎn)的構(gòu)成和變化看作知識(shí)系統(tǒng)的不確定性。知識(shí)系統(tǒng)的不確定性可以分解為靜態(tài)層面的不確定性和動(dòng)態(tài)層面的不確定性(圖1)。

        圖1 期刊論文構(gòu)建的知識(shí)系統(tǒng)的不確定性分解

        1)分布狀態(tài)不確定性(靜態(tài)層面)

        分布狀態(tài)不確定性主要從靜態(tài)層面反映一個(gè)知識(shí)系統(tǒng)對學(xué)術(shù)知識(shí)內(nèi)容的結(jié)論、研究關(guān)注點(diǎn)的趨向性等絕對指標(biāo)量分布是否顯著呈現(xiàn)出集中或分散的態(tài)勢。在一個(gè)系統(tǒng)內(nèi),經(jīng)過一段時(shí)間后,對知識(shí)觀點(diǎn)、研究熱點(diǎn)、主流發(fā)展方向的判斷越一致、越集中,則這個(gè)知識(shí)系統(tǒng)對學(xué)術(shù)問題的認(rèn)識(shí)越清晰一致,即人類對客觀世界的認(rèn)識(shí)越趨于完整正確。反之,一個(gè)系統(tǒng)內(nèi)對知識(shí)的探索和理解更加多樣,且不同方向和結(jié)論的正確可能性(正確概率)彼此差別不大,則說明人類對相關(guān)問題的認(rèn)識(shí)還處于不確定、不清晰、不一致的狀態(tài)。

        針對學(xué)術(shù)期刊論文所構(gòu)建的知識(shí)系統(tǒng)之靜態(tài)不確定性的表述可以繼續(xù)分解成3 個(gè)子系統(tǒng)。

        A1. 規(guī)模度:指學(xué)術(shù)期刊傳播文獻(xiàn)的容量。學(xué)術(shù)期刊作為發(fā)布和交流平臺(tái),在保證質(zhì)量和效率的前提下,應(yīng)該盡量多地發(fā)表體現(xiàn)科學(xué)發(fā)現(xiàn)和技術(shù)創(chuàng)新成果的論文。

        A2. 廣泛性:指期刊學(xué)術(shù)影響的擴(kuò)張能力。學(xué)術(shù)期刊所發(fā)表傳播的內(nèi)容是科研論文,需要有足夠的讀者群空間,才能實(shí)現(xiàn)高效率的成果傳播功能和活躍的學(xué)術(shù)交流功能。

        A3. 可持續(xù)性:主要指基金支持論文的數(shù)量和比例,以此來體現(xiàn)期刊論文與科技投入的匹配程度。

        2)關(guān)系狀態(tài)不確定性(動(dòng)態(tài)層面)

        關(guān)系狀態(tài)不確定性主要從動(dòng)態(tài)層面反映一個(gè)知識(shí)系統(tǒng)關(guān)于學(xué)術(shù)知識(shí)節(jié)點(diǎn)結(jié)構(gòu)、節(jié)點(diǎn)之間的相互作用、不同節(jié)點(diǎn)之間的關(guān)系類指標(biāo)是否顯著呈現(xiàn)集中還是分散的狀態(tài)[42-43]。在一個(gè)系統(tǒng)內(nèi),不同的節(jié)點(diǎn)層次上(如作者、期刊、關(guān)鍵詞、單篇論文),知識(shí)之間的聯(lián)系形成了節(jié)點(diǎn)網(wǎng)絡(luò)。基于節(jié)點(diǎn)網(wǎng)絡(luò)所表達(dá)的知識(shí)節(jié)點(diǎn)與相關(guān)節(jié)點(diǎn)之間的聯(lián)系,可以反映整個(gè)知識(shí)系統(tǒng)的相對集中性。與絕對集中性的含義相同的是,人們對知識(shí)觀點(diǎn)、研究熱點(diǎn)、主流發(fā)展方向的判斷越一致、越集中,說明這個(gè)知識(shí)系統(tǒng)中對學(xué)術(shù)問題的認(rèn)識(shí)越清晰一致,即人類對客觀世界的認(rèn)識(shí)越趨于完整正確。反之,一個(gè)系統(tǒng)對知識(shí)的探索和理解更加多樣,且不同方向和結(jié)論的正確可能性(正確概率)彼此差別不大,則說明人類對該問題的認(rèn)識(shí)還處于不確定、不清晰、不一致的狀態(tài)。

        針對學(xué)術(shù)期刊論文所構(gòu)建的知識(shí)系統(tǒng)之相對集中性層面對系統(tǒng)不確定性的表述可以繼續(xù)分解成4個(gè)子系統(tǒng)。

        B1. 開放度:指期刊論文稿源組織的合理性和開放程度。稿源渠道建設(shè)是學(xué)術(shù)期刊建設(shè)的重要組成部分。廣泛充分的高水平稿源是期刊發(fā)揮自身功能的基本保障。如果稿源范圍過于有限,或者過于集中,會(huì)降低學(xué)術(shù)期刊的交流活力。

        B2. 合作性:指期刊發(fā)表合著論文(包括國家層面、機(jī)構(gòu)層面合作研究所形成論文)的能力[44]。合作研究往往能實(shí)現(xiàn)優(yōu)勢互補(bǔ),產(chǎn)出高水平研究成果。特別是近年來逐漸增多的大規(guī)模多邊合作產(chǎn)出的“大科學(xué)”論文成果,往往是全世界均可受益的關(guān)鍵成果[45]。

        B3. 競爭力:指給定期刊與同學(xué)科或同類型的其他期刊競爭取得比較優(yōu)勢的能力。學(xué)術(shù)期刊大都具有顯著的公益性色彩,但學(xué)術(shù)出版活動(dòng)同時(shí)也是一種商業(yè)行為。在競爭中發(fā)展壯大是每個(gè)學(xué)術(shù)期刊不能逃避的任務(wù)。

        B4. 影響力:指期刊發(fā)表的論文成果對其他相關(guān)學(xué)術(shù)研究活動(dòng)的借鑒價(jià)值或爭鳴價(jià)值,主要通過引文來測度。期刊論文被引用可以看作論文產(chǎn)生學(xué)術(shù)影響的典型表現(xiàn)。

        3.3 知識(shí)系統(tǒng)信息熵的定義

        正是因?yàn)閷W(xué)科發(fā)展和傳播具有顯著的系統(tǒng)屬性,所以可以把一個(gè)學(xué)科領(lǐng)域發(fā)表在學(xué)術(shù)期刊上的論文集合作為一個(gè)相對獨(dú)立的系統(tǒng)進(jìn)行研究。在本研究中,知識(shí)系統(tǒng)信息熵定義如下:在期刊研究論文所構(gòu)成的封閉和孤立的知識(shí)系統(tǒng)中,將對特定科學(xué)問題的認(rèn)識(shí)和判斷的不確定性狀態(tài)的測度量,定義為該知識(shí)系統(tǒng)的信息熵。

        對于信息熵的測度,可操作性較強(qiáng)的方法是通過構(gòu)建數(shù)學(xué)模型來組織和描述反映知識(shí)熵的各項(xiàng)指標(biāo)[46]。

        4 用關(guān)鍵詞集合測度知識(shí)系統(tǒng)的信息熵

        4.1 以高頻關(guān)鍵詞集合作為各個(gè)期刊所在學(xué)科領(lǐng)域的學(xué)科發(fā)展選項(xiàng)集合

        本研究使用各個(gè)學(xué)科的高頻關(guān)鍵詞集合來定義各個(gè)學(xué)科發(fā)展的可能選項(xiàng)。本研究構(gòu)建的模型在應(yīng)用于各個(gè)學(xué)科領(lǐng)域的期刊評價(jià)實(shí)踐時(shí),每一個(gè)學(xué)科領(lǐng)域可能包含的研究方向的數(shù)量是不同的,即根據(jù)每個(gè)學(xué)科的規(guī)模和特點(diǎn)不同,存在不同的學(xué)科發(fā)展可能選項(xiàng)(變量)數(shù)量。

        關(guān)鍵詞是表述論文所涉及的選題、解題、技術(shù)方法、研究對象、創(chuàng)新觀點(diǎn)、應(yīng)用價(jià)值等內(nèi)容的若干詞語。按照期刊出版相關(guān)標(biāo)準(zhǔn),學(xué)術(shù)論文都會(huì)著錄關(guān)鍵詞。關(guān)鍵詞具備規(guī)范性和通用性的特征[47]。通常關(guān)鍵詞會(huì)優(yōu)先選用敘詞,也就是從自然語言詞匯中優(yōu)先選出來語義相關(guān)、族性相關(guān)的科學(xué)術(shù)語。自由詞也可當(dāng)作關(guān)鍵詞,但需要優(yōu)先使用出自詞表或廣泛應(yīng)用的參考書、工具書的詞匯[48]。

        論文的關(guān)鍵詞可以體現(xiàn)選題方向、研究方法或主要發(fā)現(xiàn)。在大數(shù)據(jù)技術(shù)基礎(chǔ)上,對關(guān)鍵詞的研究能夠?qū)崿F(xiàn)對知識(shí)結(jié)構(gòu)和領(lǐng)域發(fā)展的直觀理解。通過分析關(guān)鍵詞的數(shù)量關(guān)系之演化情況,還能發(fā)現(xiàn)和監(jiān)測學(xué)科熱點(diǎn)[49]。

        在同一時(shí)間窗口內(nèi),將某學(xué)科全部期刊論文的關(guān)鍵詞按詞頻從大到小排序,處于前1%的關(guān)鍵詞組成高頻關(guān)鍵詞集合。該集合所反映的研究主題代表了特定時(shí)段內(nèi)該學(xué)科的研究熱點(diǎn)。實(shí)踐中,不宜用過長的時(shí)間范圍統(tǒng)計(jì)高頻詞,以免研究熱點(diǎn)轉(zhuǎn)移造成統(tǒng)計(jì)誤差。研究熱點(diǎn)的轉(zhuǎn)移速度與各個(gè)學(xué)科演進(jìn)發(fā)展的節(jié)奏相對應(yīng),但是考慮到可操作性,時(shí)間窗口也不宜過窄(比如,按季度或月份獲取數(shù)據(jù))[50]。本研究采用高頻關(guān)鍵詞作為變量,而沒有使用全部關(guān)鍵詞作為變量,主要原因是高頻詞具備代表性,其范圍和結(jié)構(gòu)的變化情況可以比較充分地反映學(xué)科發(fā)展變化的整體情況,使用全部關(guān)鍵詞反而有可能造成過多噪音數(shù)據(jù)的混入。因此,從可行性角度,經(jīng)過測試比較,1%高頻詞的標(biāo)準(zhǔn)兼?zhèn)淇茖W(xué)性和可操作性。

        本研究采用CSTPCD 2016 收錄的論文統(tǒng)計(jì)高頻詞。

        4.2 構(gòu)造指標(biāo)矩陣

        對于一個(gè)學(xué)科領(lǐng)域的發(fā)展來說,隨著時(shí)間的推移,通過學(xué)術(shù)傳播發(fā)揮知識(shí)積累和交流功能,人類對科學(xué)規(guī)律和發(fā)展方向的認(rèn)知會(huì)逐步清晰。如果假設(shè)一個(gè)學(xué)科領(lǐng)域中某一個(gè)未知知識(shí)點(diǎn)存在n個(gè)預(yù)設(shè)可能選項(xiàng),那么在早期,n個(gè)預(yù)設(shè)選項(xiàng)的不確定性會(huì)相對較顯著,即人們的知識(shí)認(rèn)知較混亂;在后期,n個(gè)預(yù)設(shè)選項(xiàng)的不確定性會(huì)相對減弱,即人們的知識(shí)認(rèn)知逐漸清晰。這一過程,就是有效信息加入學(xué)科知識(shí)系統(tǒng)(引入負(fù)熵)的過程。

        在信息熵理論框架下,我們可以把n個(gè)預(yù)設(shè)可能選項(xiàng)看作隨機(jī)選項(xiàng),用m個(gè)指標(biāo)來描述每一個(gè)預(yù)設(shè)選項(xiàng)的明確性,即表達(dá)每一個(gè)選項(xiàng)的概率Pi。

        根據(jù)本研究提出的假設(shè)來推斷,在這個(gè)學(xué)科系統(tǒng)中,隨著知識(shí)信息的注入,不同預(yù)設(shè)選項(xiàng)成為主流研究方向的可能性的概率在變化。由于這個(gè)領(lǐng)域的未來方向會(huì)逐漸清晰,不確定性會(huì)降低,所以這個(gè)學(xué)科知識(shí)系統(tǒng)的信息熵狀態(tài)數(shù)值應(yīng)該有所下降。

        由此,可以構(gòu)建指標(biāo)矩陣:

        其中,n表示n個(gè)學(xué)科方向;m表示m個(gè)測度指標(biāo)。設(shè)i=1,2,…,n,j=1,2,…,m,則fij為第i個(gè)學(xué)科方向上的第j個(gè)指標(biāo)的數(shù)值。

        4.3 計(jì)算知識(shí)系統(tǒng)信息熵指標(biāo)選擇

        根據(jù)俞立平等[51]研究歸納,一般常用的指標(biāo)篩選方法包括基于粗糙集理論的遴選、領(lǐng)域內(nèi)專家調(diào)研評議法、應(yīng)用相關(guān)系數(shù)法和變異系數(shù)法等;盡管在指標(biāo)篩選方面尚未形成統(tǒng)一通用的方法,但是專家評議在指標(biāo)篩選中所起到的作用仍然是不可替代的。劉麗莉[52]研究提出選取指標(biāo)的原則是目的明確、覆蓋全面、切實(shí)可行。因此在本研究中,采用專家評議方法選擇指標(biāo)。

        指標(biāo)選擇過程中,主要考慮本研究需要表現(xiàn)不同發(fā)展方向的研究體量、廣泛性、活躍度、增長能力等方面的因素,結(jié)合指標(biāo)的科學(xué)性、可獲取性,經(jīng)過多次調(diào)整和實(shí)驗(yàn),結(jié)合同行專家的調(diào)研咨詢意見,最終確定選取了7 項(xiàng)指標(biāo)作為期刊評價(jià)準(zhǔn)則與計(jì)算知識(shí)系統(tǒng)信息熵的指標(biāo),如表1 所示。

        表1 期刊評價(jià)準(zhǔn)則與計(jì)算知識(shí)系統(tǒng)信息熵指標(biāo)對應(yīng)表

        (1)發(fā)表論文數(shù)量:5 年時(shí)間窗口發(fā)表論文數(shù)量。選用5 年是為了減少數(shù)據(jù)跳躍所造成的誤差。

        (2)文獻(xiàn)分布廣泛性:文獻(xiàn)計(jì)量學(xué)發(fā)現(xiàn),出版物的秩頻分布存在負(fù)冪函數(shù)關(guān)系[53-54]。在本研究中,我們交換頻率與份額,二者關(guān)系表達(dá)公式為

        其中,在某領(lǐng)域中,y表示各個(gè)國家發(fā)表論文的數(shù)量;x表示各個(gè)國家論文數(shù)量的排名。對于一個(gè)領(lǐng)域,a通常是恒定的。如果a的數(shù)值在一個(gè)學(xué)科方向中較低,則意味著這個(gè)學(xué)科方向中,很少的國家集中發(fā)表了較高比例的論文,文獻(xiàn)分布廣泛性較弱;反之,則可認(rèn)為這個(gè)學(xué)科文獻(xiàn)分布廣泛性較強(qiáng)。

        (3)基金論文數(shù)量:1 年時(shí)間窗口有基金項(xiàng)目資助的論文數(shù)。一些文獻(xiàn)計(jì)量學(xué)家發(fā)現(xiàn),科技投入與科技產(chǎn)出之間是存在一定關(guān)聯(lián)性的[55];然而由于科技成果的滯后性,二者又不是簡單的線性相關(guān)關(guān)系。通常來說,如果某一地區(qū)發(fā)表論文數(shù)量比另一地區(qū)多,那就意味著該地區(qū)投入的資源和設(shè)施比其他地區(qū)更多[56]。

        (4)篇均機(jī)構(gòu)數(shù):1 年時(shí)間窗口內(nèi)論文作者所屬機(jī)構(gòu)數(shù)的平均值。

        (5)國際合著論文比:1 年時(shí)間窗口內(nèi)國際合著論文所占的百分比。

        (6)論文份額增長率:論文數(shù)量份額相對前一年度增長的百分比。

        (7)篇均論文被引用次數(shù):5 年時(shí)間窗口內(nèi)論文篇均被引用次數(shù)。篇均被引用指標(biāo)是分年度統(tǒng)計(jì)和計(jì)算的,即各年度發(fā)表論文篇均被引用次數(shù)雖然存在累計(jì)性差異,但是經(jīng)過分年度標(biāo)準(zhǔn)化后,得到的數(shù)值是具有可比性的。

        4.4 標(biāo)準(zhǔn)化處理

        由于不同指標(biāo)的量綱、極值等存在顯著差異,必須要對指標(biāo)矩陣進(jìn)行標(biāo)準(zhǔn)化轉(zhuǎn)化,形成標(biāo)準(zhǔn)化矩陣A:

        其中,設(shè)i=1,2,…,n,j=1,2,…,m,則aij∈[0,1]。標(biāo)準(zhǔn)化公式為

        其中,min{f1j,…,fij,…,fnj}表示j指標(biāo)項(xiàng)上,n個(gè)選項(xiàng)的fij的最小值;max{f1j,…,fij,…,fnj}表示j指標(biāo)項(xiàng)上,n個(gè)選項(xiàng)的fij的最大值。

        4.5 知識(shí)系統(tǒng)信息熵?cái)?shù)值的計(jì)算

        本研究對于孤立系統(tǒng)各個(gè)單項(xiàng)指標(biāo)的信息熵計(jì)算公式為

        其中,i= 1,2,…,n;j= 1,2,…,m。

        通過計(jì)算,可以得出m個(gè)預(yù)設(shè)可能選項(xiàng)各自的信息熵狀態(tài)值,則整個(gè)知識(shí)系統(tǒng)的信息熵就是m個(gè)子系統(tǒng)的信息熵之和:

        由于Hi的數(shù)值分布范圍是[0,1],所以H的數(shù)值分布范圍是[0,n]。H= 0,表示系統(tǒng)絕對有序,即所有子系統(tǒng)都是只有一個(gè)選項(xiàng),且同一個(gè)選項(xiàng)的實(shí)現(xiàn)概率是100%,其他為0;H=n,表示系統(tǒng)絕對無序,即所有子系統(tǒng)的所有選項(xiàng)概率都完全相同。

        H的數(shù)值大小可以看作一個(gè)孤立系統(tǒng)的信息量和不確定性的體現(xiàn)。例如,在某個(gè)研究領(lǐng)域中,當(dāng)人類對客觀世界的認(rèn)識(shí)存在兩種或更多種不同觀點(diǎn),或者尚不知道某學(xué)科未來發(fā)展走向,只是可以預(yù)判幾種可能選項(xiàng)時(shí),可以認(rèn)為,初期各個(gè)選項(xiàng)實(shí)現(xiàn)的可能性比較接近,不確定性較強(qiáng)。隨著科學(xué)研究活動(dòng)的積累,發(fā)展趨向必然是可能選項(xiàng)越來越少,不確定性越來越小;還可以認(rèn)為,其中某一部分可能選項(xiàng)的實(shí)現(xiàn)概率持續(xù)增加,另一部分可能選項(xiàng)的實(shí)現(xiàn)概率持續(xù)減少,即不確定性也在減少。不確定性減少意味著知識(shí)系統(tǒng)所表達(dá)的信息在減少,也可以看作不確定性大的事物逐漸得到了確定,即通過科學(xué)研究成果的傳播,人類實(shí)現(xiàn)了對客觀世界的更多認(rèn)知。

        5 基于反事實(shí)思路測度被評價(jià)期刊貢獻(xiàn)的負(fù)熵

        5.1 計(jì)算每個(gè)學(xué)科領(lǐng)域所對應(yīng)知識(shí)信息的信息熵的事實(shí)量H(X)

        本研究以各學(xué)科高頻關(guān)鍵詞(出現(xiàn)頻次排名在前1%)作為相應(yīng)學(xué)科的發(fā)展方向。

        按照本研究設(shè)計(jì)的計(jì)算模型,各個(gè)學(xué)科的潛在發(fā)展方向就是學(xué)科高頻詞集合所反映的方向。統(tǒng)計(jì)得到學(xué)科內(nèi)n個(gè)高頻關(guān)鍵詞就是n個(gè)潛在學(xué)科方向。

        每個(gè)學(xué)科方向的數(shù)據(jù)子集的產(chǎn)生方式是,用關(guān)鍵詞作為檢索詞在萬方數(shù)據(jù)中檢索,檢索策略為單詞檢索(各關(guān)鍵詞之間是“或”的關(guān)系)。

        信息熵的計(jì)算指標(biāo)仍為發(fā)表論文數(shù)量、文獻(xiàn)分布廣泛性、基金論文數(shù)量、篇均機(jī)構(gòu)數(shù)、國際合著論文比、論文份額增長率、篇均論文被引用次數(shù)等7 個(gè)指標(biāo)。利用從萬方數(shù)據(jù)中檢索得到的子數(shù)據(jù)集合,對上述指標(biāo)進(jìn)行統(tǒng)計(jì)計(jì)算。

        這樣,每個(gè)學(xué)科可以構(gòu)建形成n×m的指標(biāo)矩陣。其中n是潛在學(xué)科方向數(shù)量,即高頻關(guān)鍵詞數(shù)量;m= 7,即計(jì)算指標(biāo)數(shù)量。參照矩陣A構(gòu)建指標(biāo)矩陣F。

        根據(jù)本研究提出的假設(shè)推斷,在這個(gè)學(xué)科系統(tǒng)中,隨著知識(shí)信息的注入,不同預(yù)設(shè)選項(xiàng)成為主流研究方向的概率在變化。由于未來研究方向會(huì)逐漸清晰,不確定性會(huì)降低,所以在這個(gè)學(xué)科知識(shí)系統(tǒng)中,知識(shí)系統(tǒng)的信息熵?cái)?shù)值應(yīng)該有所下降。

        5.2 計(jì)算每個(gè)學(xué)科領(lǐng)域所對應(yīng)知識(shí)信息的信息熵的反事實(shí)量H(X)′

        對于特定的被評價(jià)期刊,計(jì)算在其對應(yīng)的學(xué)科體系中,被評價(jià)期刊缺位情況下知識(shí)系統(tǒng)信息熵的反事實(shí)量H(X)′。

        在期刊評價(jià)活動(dòng)中,假設(shè)該期刊不在對應(yīng)的學(xué)科中,即將被評價(jià)期刊從相應(yīng)的期刊論文構(gòu)成的真實(shí)知識(shí)系統(tǒng)中移除,其論文量、參考文獻(xiàn)(即引文)都不列入統(tǒng)計(jì)范圍。在這個(gè)新的虛擬的知識(shí)系統(tǒng)中,重新計(jì)算7 個(gè)指標(biāo):發(fā)表論文數(shù)量、文獻(xiàn)分布廣泛性、基金論文數(shù)量、篇均機(jī)構(gòu)數(shù)、國際合著論文比、論文份額增長率、篇均論文被引用次數(shù);并根據(jù)計(jì)算結(jié)果,計(jì)算被評價(jià)期刊缺位情況下知識(shí)系統(tǒng)的信息熵反事實(shí)量H(X)′。

        5.3 計(jì)算事實(shí)量與反事實(shí)量的差距

        對于特定的被評價(jià)期刊,通過對比該刊所屬學(xué)科的知識(shí)系統(tǒng)信息熵的事實(shí)量H(X)與被評價(jià)期刊缺位情況下的知識(shí)系統(tǒng)的信息熵反事實(shí)量H(X)′之間的數(shù)值變化,反映被評價(jià)期刊對知識(shí)系統(tǒng)信息熵降低的貢獻(xiàn),也就是被評價(jià)學(xué)術(shù)期刊對知識(shí)系統(tǒng)所貢獻(xiàn)的負(fù)熵,如圖2 所示。

        圖2 基于信息熵的學(xué)術(shù)期刊評價(jià)思路

        采用知識(shí)系統(tǒng)信息熵的事實(shí)量H(X)與被評價(jià)期刊缺位情況下知識(shí)系統(tǒng)信息熵的反事實(shí)量H(X)′之間的差值ΔH,即學(xué)術(shù)期刊為系統(tǒng)所提供的負(fù)熵,測度該期刊的學(xué)術(shù)貢獻(xiàn):

        其中,p代表第p個(gè)學(xué)科,數(shù)值范圍是[1, 112];q代表p學(xué)科全部期刊中的第q種。

        6 實(shí)證結(jié)果

        6.1 2016年各學(xué)科高頻詞統(tǒng)計(jì)

        CSTPCD 2016 收錄56.49 萬篇論文,使用了關(guān)鍵詞149.40 萬個(gè)、414.83 萬次,平均每篇論文使用7.3 個(gè)關(guān)鍵詞??紤]到兼容中文期刊和英文期刊,將關(guān)鍵詞的中文寫法和英文寫法計(jì)為2個(gè)不同關(guān)鍵詞。

        計(jì)算各個(gè)學(xué)科使用頻次列在前1%的高頻關(guān)鍵詞。以感染性疾病學(xué)、傳染病學(xué)為例,2016 年CSTPCD 收錄了8 種期刊,發(fā)表了1093 篇論文,共使用4349 個(gè)關(guān)鍵詞,使用7876 次。將這4349 個(gè)關(guān)鍵詞按出現(xiàn)頻次排序,排在前1%的關(guān)鍵詞有44 個(gè)(4349 個(gè)的1%),組成了該學(xué)科的高頻關(guān)鍵詞集合。各個(gè)學(xué)科高頻詞數(shù)量如表2 所示。

        6.2 2016年各知識(shí)系統(tǒng)信息熵的測度

        計(jì)算各學(xué)科領(lǐng)域由期刊論文所構(gòu)成的知識(shí)系統(tǒng)的信息熵事實(shí)量。經(jīng)過構(gòu)造指標(biāo)矩陣、標(biāo)準(zhǔn)化處理,112 個(gè)學(xué)科中的每一個(gè)都可以看作孤立知識(shí)系統(tǒng)。完成各個(gè)學(xué)科知識(shí)系統(tǒng)信息熵的計(jì)算,結(jié)果如表2 所示。

        表2 2016年期刊學(xué)科分類及相關(guān)指標(biāo)

        續(xù)表

        續(xù)表

        從圖3 所示的112 個(gè)學(xué)科的核心期刊數(shù)量和知識(shí)系統(tǒng)信息熵的分布情況可以看出,學(xué)科內(nèi)期刊數(shù)量的多少與該知識(shí)系統(tǒng)信息熵?cái)?shù)值的相關(guān)性不是非常明顯。計(jì)算二者之間的線性相關(guān)系數(shù)可以得到R2= 0.7312,也可以看出其不具備顯著相關(guān)性。

        圖3 112個(gè)學(xué)科的核心期刊數(shù)量和知識(shí)系統(tǒng)信息熵的分布情況

        6.3 2016年被評價(jià)期刊對知識(shí)系統(tǒng)的貢獻(xiàn)

        以天文學(xué)為例,該學(xué)科6 種被評價(jià)期刊對知識(shí)系統(tǒng)的貢獻(xiàn)的計(jì)算結(jié)果如表3 所示。

        表3 2016年天文學(xué)學(xué)科(k)期刊對知識(shí)系統(tǒng)的信息熵的影響

        6.4 2016—2019年各知識(shí)系統(tǒng)信息熵的變化

        采用與6.3 節(jié)相同的方法,并且采用2016 年遴選得到的高頻關(guān)鍵詞列表,在其后的2017—2018 年數(shù)據(jù)庫中進(jìn)行知識(shí)系統(tǒng)信息熵?cái)?shù)值的運(yùn)算,可以得到各個(gè)知識(shí)系統(tǒng)信息熵?cái)?shù)值變化的量,如表4 所示。

        從表4 所示的2016—2019 年各個(gè)學(xué)科知識(shí)系統(tǒng)信息熵的變化情況來看,大部分學(xué)科的信息熵?cái)?shù)值呈現(xiàn)明顯的減少趨勢。比較2016 年和2019 年數(shù)值的變化幅度,如圖4 所示,可以發(fā)現(xiàn)在全部112 個(gè)學(xué)科類別中,4 年之間信息熵變化方向?yàn)樵黾拥闹挥?1 個(gè),占比約為9.8%;其余超過90%的學(xué)科都是向信息熵減少的方向變化。由于各個(gè)學(xué)科之間知識(shí)系統(tǒng)信息熵的數(shù)值比較無明顯意義,因此,盡管圖4 所示分布狀態(tài)有類似于正態(tài)分布的形式,但本研究數(shù)據(jù)并不支持知識(shí)系統(tǒng)信息熵符合隨機(jī)分布。

        圖4 112個(gè)學(xué)科的知識(shí)系統(tǒng)信息熵2016—2019年變化幅度的分布情況

        表4 2016—2019年各學(xué)科(知識(shí)系統(tǒng))信息熵變化

        續(xù)表

        續(xù)表

        7 結(jié) 論

        (1)通過計(jì)算知識(shí)系統(tǒng)信息熵的事實(shí)量和被評價(jià)期刊缺位時(shí)知識(shí)系統(tǒng)信息熵的反事實(shí)量的差值ΔH,能夠體現(xiàn)被評價(jià)期刊對知識(shí)系統(tǒng)信息熵變化的貢獻(xiàn)。但是由于本研究中,以每個(gè)學(xué)科高頻詞為檢索詞得到的論文集合構(gòu)成的知識(shí)系統(tǒng)是相互獨(dú)立的系統(tǒng),所以不同系統(tǒng)的H狀態(tài)值之間不具備直接可比性,狀態(tài)值變化量ΔH之間也不具備直接可比性,不過每個(gè)系統(tǒng)ΔH的方向是可以比較的,它反映期刊對系統(tǒng)做出的是正貢獻(xiàn)還是負(fù)貢獻(xiàn)。從統(tǒng)計(jì)數(shù)據(jù)看,在3713 種期刊中有3578 種期刊(96.4%)的ΔH為正值,這表明絕大部分學(xué)術(shù)期刊對降低其所屬知識(shí)系統(tǒng)的混亂程度是有所貢獻(xiàn)的,也就是說,期刊學(xué)術(shù)出版活動(dòng)發(fā)揮了其必要功能。按照信息熵理論,一個(gè)孤立系統(tǒng)中引入的信息量應(yīng)是非負(fù)的,即最極端現(xiàn)象是期刊為系統(tǒng)貢獻(xiàn)的信息量為零,期刊為系統(tǒng)的貢獻(xiàn)不應(yīng)出現(xiàn)負(fù)值。但是在本研究中,部分期刊對所屬知識(shí)系統(tǒng)的貢獻(xiàn)ΔH為負(fù)值,這也許說明,這部分期刊發(fā)表了一些對學(xué)科發(fā)展和凝聚共識(shí)有負(fù)面作用的文章,增加了系統(tǒng)的混亂程度。

        (2)幾乎所有的學(xué)科中,都可以發(fā)現(xiàn)少數(shù)幾個(gè)期刊對系統(tǒng)的貢獻(xiàn)程度ΔH相比于其他期刊來說要顯著高出許多,而絕大多數(shù)期刊的ΔH數(shù)值處于非常接近0 的水平。也就是說,在學(xué)科內(nèi),眾多期刊對知識(shí)系統(tǒng)的信息熵的貢獻(xiàn)數(shù)值分布呈現(xiàn)出貢獻(xiàn)較大的期刊數(shù)量較少、分布曲線長尾明顯的分布規(guī)律。這表明在學(xué)科當(dāng)中,只有很少一部分期刊能夠充分發(fā)揮學(xué)術(shù)期刊的核心功能,為減少科學(xué)認(rèn)識(shí)中的不確定因素做出相對顯著的貢獻(xiàn);同時(shí),較多期刊對減少本學(xué)科認(rèn)識(shí)不確定性的作用十分有限。這一規(guī)律與布拉德福定律非常吻合,即各個(gè)學(xué)科都存在少數(shù)重要的核心區(qū)期刊。本研究發(fā)現(xiàn),能為本學(xué)科知識(shí)系統(tǒng)做出較大貢獻(xiàn)的期刊也是數(shù)量較少的,它們是另一種含義上的“核心期刊”,但是尚未定量描述高貢獻(xiàn)期刊與低貢獻(xiàn)期刊之間的數(shù)量關(guān)系。

        (3)就學(xué)科間的差異來看,期刊數(shù)量規(guī)模和所對應(yīng)知識(shí)系統(tǒng)的信息熵變化沒有明顯的相關(guān)性。也就是說,一個(gè)學(xué)科的期刊品種的數(shù)量與該學(xué)科的個(gè)體期刊對知識(shí)系統(tǒng)信息熵變化貢獻(xiàn)的大小沒有直接關(guān)系。一個(gè)期刊對學(xué)科發(fā)展的貢獻(xiàn),主要取決于自身建設(shè)水平、發(fā)掘組織優(yōu)質(zhì)稿源的能力和精準(zhǔn)高效的傳播能力,與其他競爭對手期刊的數(shù)量多寡關(guān)系不大。與此同時(shí),可以觀察到綜合性期刊的類別,包括自然科學(xué)綜合類、自然科學(xué)綜合大學(xué)學(xué)報(bào)類、自然科學(xué)師范大學(xué)學(xué)報(bào)類等,相對于其他專業(yè)類別,其2016—2019 年知識(shí)系統(tǒng)信息熵的變化幅度整體比較小,分別是-2.86、-1.41、1.58;其原因可能是綜合性期刊中發(fā)表的論文幾乎覆蓋全部學(xué)科領(lǐng)域,因此其體現(xiàn)學(xué)科發(fā)展變化的功能性較弱。

        (4)大部分樣本期刊ΔH為正值,但還有41 種(1.1%)期刊ΔH為負(fù)數(shù),94 種(2.5%)期刊ΔH為0。當(dāng)ΔH為0 或接近于0 的時(shí)候,可以看作這一部分期刊對學(xué)科發(fā)展的貢獻(xiàn)極小。由于本研究計(jì)算方法是基于關(guān)鍵詞統(tǒng)計(jì),一些關(guān)注內(nèi)容與學(xué)科主題關(guān)系較遠(yuǎn)的期刊,關(guān)鍵詞與學(xué)科高頻詞無疊加,因此出現(xiàn)了貢獻(xiàn)值為0 的情況。當(dāng)ΔH為負(fù)數(shù)的時(shí)候,還有可能是期刊的學(xué)科分類屬性不夠明確,如果將該刊分到A 類,也許ΔH為正,若分到B 類,ΔH就是負(fù)數(shù)。另一種可能是,期刊刊載內(nèi)容過于廣泛,分布在多個(gè)學(xué)科當(dāng)中。這樣,它對任何一個(gè)學(xué)科的貢獻(xiàn)都不會(huì)大。從統(tǒng)計(jì)數(shù)據(jù)來看,綜合性較顯著的學(xué)科分類中,期刊的ΔH都比較低。

        (5)從2016—2019 年各個(gè)學(xué)科知識(shí)系統(tǒng)信息熵的變化情況來看,在采用與2016 年同一組高頻關(guān)鍵詞的情況下,在時(shí)序系列的概念上是前后可比的。也就是說,都采用2016 年出現(xiàn)的高頻關(guān)鍵詞集合作為變量,測算同一知識(shí)領(lǐng)域的系統(tǒng)信息熵變化。從圖4 的數(shù)值關(guān)系可以看到,大部分學(xué)科的信息熵?cái)?shù)值呈現(xiàn)明顯的減少趨勢。特別是對比2016 年和2019 年的各個(gè)知識(shí)領(lǐng)域的信息熵,可以發(fā)現(xiàn)在全部112 個(gè)學(xué)科類別中,4 年之間信息熵變化方向?yàn)樵黾拥闹挥?1 個(gè),占比為9.8%;其余90%以上的學(xué)科都是向信息熵減少的方向變化。這意味著絕大多數(shù)學(xué)科的知識(shí)不確定性在逐步減小,也就是固定范圍學(xué)科發(fā)展主題方向逐漸聚焦和清晰,這符合對一般學(xué)科發(fā)展規(guī)律的認(rèn)知。這一變化過程中,各個(gè)期刊所發(fā)揮的作用有所差別,也就是各個(gè)期刊貢獻(xiàn)大小有所差別。

        8 討 論

        科學(xué)領(lǐng)域的學(xué)術(shù)活動(dòng)發(fā)展過程中,學(xué)術(shù)成果的傳播可以增加人類的知識(shí)積累,科研人員在擴(kuò)充知識(shí)儲(chǔ)備的同時(shí),進(jìn)一步明晰知識(shí)點(diǎn)之間的邏輯、結(jié)構(gòu),從而實(shí)現(xiàn)對客觀世界更明確的認(rèn)知。這一過程是信息熵減少的過程,是認(rèn)知中的不確定性、復(fù)雜性減少的過程,也是人類知識(shí)系統(tǒng)性、全面性、邏輯性發(fā)展的過程。在這個(gè)過程中,學(xué)術(shù)期刊發(fā)揮著重要的作用。對大部分學(xué)科領(lǐng)域,特別是基礎(chǔ)研究領(lǐng)域,絕大多數(shù)的研究成果和認(rèn)識(shí)是通過學(xué)術(shù)期刊來實(shí)現(xiàn)評價(jià)、加工、記載、傳播和交流的。學(xué)術(shù)期刊的評價(jià)應(yīng)該首先是對學(xué)術(shù)期刊應(yīng)具備的核心功能的評價(jià),也就是對學(xué)術(shù)期刊在學(xué)科發(fā)展中的價(jià)值的評價(jià)。

        在本研究中,從信息熵的視角進(jìn)行學(xué)術(shù)期刊的評價(jià),就是觀察學(xué)術(shù)期刊是否通過自身組稿、審稿、編稿、發(fā)稿、傳播等環(huán)節(jié)的高效率工作,甄選和供給有學(xué)術(shù)意義的研究成果,能否對學(xué)科的發(fā)展提供支撐,逐漸凝聚科學(xué)問題。換句話說,就是評價(jià)一個(gè)期刊能否通過學(xué)術(shù)傳播工作,減少一點(diǎn)學(xué)科體系的信息熵。

        本研究假設(shè)被評價(jià)期刊不在系統(tǒng)內(nèi)進(jìn)而觀察系統(tǒng)變化的思路可以歸為“反事實(shí)”分析方法,即提出反事實(shí)的假定,設(shè)定與事實(shí)相反的條件,再去確定因果關(guān)系。

        通過建立數(shù)學(xué)模型的方式,實(shí)現(xiàn)對學(xué)科系統(tǒng)信息熵的測定,這是一個(gè)宏觀層面的研究探索;如果將這一方法體系應(yīng)用到中觀層面,就是對學(xué)術(shù)期刊出版能力和學(xué)科貢獻(xiàn)的評價(jià);如果將這一方法體系應(yīng)用到微觀層面,就是對單篇學(xué)術(shù)論文的評價(jià)。通過測度相關(guān)指標(biāo),發(fā)現(xiàn)哪些單篇論文對科學(xué)進(jìn)步產(chǎn)生了重要影響。這些成果顯著地提高了人類認(rèn)識(shí)自然的水平,顯著地降低了學(xué)科系統(tǒng)的信息熵。

        對于期刊評價(jià)來說,識(shí)別、發(fā)現(xiàn)這樣的關(guān)鍵性成果既是對期刊優(yōu)秀稿件組稿能力的認(rèn)定,也為期刊擴(kuò)展組稿工作渠道提供了有效工具[57]。在信息熵視角下,將學(xué)術(shù)期刊的評價(jià)管理建設(shè)工作與單篇論文的評價(jià)、優(yōu)秀作者和團(tuán)隊(duì)的識(shí)別工作結(jié)合起來,有助于扭轉(zhuǎn)當(dāng)前較為嚴(yán)重的“以刊評文”的不當(dāng)評價(jià)導(dǎo)向,也可以在一定程度上對當(dāng)前廣泛存在的“濫用影響因子”的情況進(jìn)行糾偏[58]。

        猜你喜歡
        信息熵學(xué)術(shù)期刊論文
        基于信息熵可信度的測試點(diǎn)選擇方法研究
        學(xué)術(shù)期刊引證指標(biāo)
        學(xué)術(shù)期刊引證指標(biāo)
        基于信息熵的實(shí)驗(yàn)教學(xué)量化研究
        電子測試(2017年12期)2017-12-18 06:35:48
        河海大學(xué)學(xué)術(shù)期刊創(chuàng)辦百年
        一種基于信息熵的雷達(dá)動(dòng)態(tài)自適應(yīng)選擇跟蹤方法
        基于信息熵的IITFN多屬性決策方法
        下期論文摘要預(yù)登
        下期論文摘要預(yù)登
        下期論文摘要預(yù)登
        亚洲aⅴ无码国精品中文字慕| 久久精品国产自在天天线| 日本在线看片免费人成视频1000| 在线视频精品免费| 日韩精品中文字幕 一区| 国产精品又湿又黄九九九久久嫩草| 国产裸体美女永久免费无遮挡| 午夜成人无码福利免费视频| 亚洲AV综合A∨一区二区| 看大陆男女真人草逼视频| 精品一区三区视频在线观看| 亚洲 另类 日韩 制服 无码 | 91亚洲国产成人aⅴ毛片大全| 日韩一区二区,亚洲一区二区视频| 日本区一区二区三视频| 又黄又硬又湿又刺激视频免费| 日本一本久道| 色噜噜精品一区二区三区| 日韩精品一区二区在线天天狠天| 国产台湾无码av片在线观看| 久久精品国产91久久性色tv| 少妇久久高潮不断免费视频| 亚洲国产高清精品在线| 天天弄天天模| 不卡国产视频| 国产中文字幕亚洲国产| 激情综合色五月丁香六月欧美| 亚洲av无码成人精品区在线观看 | 可以免费看亚洲av的网站| 国产熟人av一二三区| 亚洲av高清在线观看三区| 成人国产高清av一区二区三区| 国产果冻豆传媒麻婆精东| av无码精品一区二区三区四区| 久草精品手机视频在线观看| 久久精品亚州中文字幕| 午夜成人鲁丝片午夜精品| 成年奭片免费观看视频天天看| 免费看草逼操爽视频网站| 亚洲人成精品久久久久| 国产精品久久国产精麻豆99网站|