亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        文獻(xiàn)計(jì)量視角下的數(shù)據(jù)論文引用特征剖析

        2022-05-14 06:37:44黃國(guó)彬
        圖書(shū)情報(bào)研究 2022年2期
        關(guān)鍵詞:論文期刊文獻(xiàn)

        吳 寧 黃國(guó)彬

        (1.中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心 北京 100190;2.中國(guó)科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院圖書(shū)情報(bào)與檔案管理系 北京 100190;3.北京師范大學(xué)政府管理學(xué)院 北京 100875)

        0 引言

        近年來(lái),計(jì)算機(jī)技術(shù)和傳感器技術(shù)不斷發(fā)展并得到廣泛應(yīng)用,使得科研數(shù)據(jù)越來(lái)越密集。共享科研數(shù)據(jù)可以減少科學(xué)研究過(guò)程的數(shù)據(jù)壓力,提高研究結(jié)果的可靠性,為后續(xù)研究提供更多的原始數(shù)據(jù)與分析手段支持。廣泛引用科學(xué)數(shù)據(jù)能有效促進(jìn)科學(xué)數(shù)據(jù)傳播,推動(dòng)后期更好地量化評(píng)價(jià)科學(xué)數(shù)據(jù)[1]。

        為了實(shí)現(xiàn)更大范圍的數(shù)據(jù)共享,同時(shí)保護(hù)研究者的數(shù)據(jù)知識(shí)產(chǎn)權(quán),期刊出版社開(kāi)始逐漸支持?jǐn)?shù)據(jù)出版。隨著數(shù)據(jù)出版的不斷嘗試與發(fā)展,“數(shù)據(jù)論文”(data paper)這一概念開(kāi)始出現(xiàn),基于數(shù)據(jù)論文的數(shù)據(jù)出版模式不斷更新,出現(xiàn)了同時(shí)發(fā)表傳統(tǒng)學(xué)術(shù)論文和數(shù)據(jù)論文的重疊期刊(overlay journal)、純數(shù)據(jù)期刊(pure data journal)等新的出版物形式[2]。數(shù)據(jù)論文逐漸在各領(lǐng)域得到普及,并受到學(xué)術(shù)界的廣泛認(rèn)可[3]。最早在20世紀(jì)70年代早期,美國(guó)物理學(xué)會(huì)雜志The Journal of Physical and Chemical Reference Data就開(kāi)始刊載理化材料一般特性的文章,一直持續(xù)到了現(xiàn)在。2000年,美國(guó)生態(tài)學(xué)會(huì)首次在Ecological Archives發(fā)表數(shù)據(jù)論文,隨后有部分?jǐn)?shù)據(jù)論文零星發(fā)表在地球系統(tǒng)科學(xué)數(shù)據(jù)Earth System Science Data,CMB數(shù)據(jù)論文CMB Data Papers,BMC Data Notes和國(guó)際機(jī)器人研究International Journal of Robotics Research雜志。

        當(dāng)前,以數(shù)據(jù)為主導(dǎo)的研究范式已逐步興起??茖W(xué)研究應(yīng)當(dāng)保證其使用的數(shù)據(jù)和研究方法的透明,以及參考文獻(xiàn)的原始出處可查、準(zhǔn)確,這決定了科學(xué)研究的科學(xué)性與可考證性。對(duì)數(shù)據(jù)論文的引用情況展開(kāi)研究,不僅可以推動(dòng)數(shù)據(jù)共享,也有利于數(shù)據(jù)引用的學(xué)術(shù)規(guī)范化,最終達(dá)到數(shù)據(jù)論文及其引用學(xué)術(shù)規(guī)范的目的。本研究通過(guò)文獻(xiàn)計(jì)量方法分析2015~2019年Scientific Data期刊發(fā)表的數(shù)據(jù)論文的引用現(xiàn)狀,對(duì)數(shù)據(jù)論文的施引文獻(xiàn)進(jìn)行關(guān)鍵詞、學(xué)科、機(jī)構(gòu)、年份、國(guó)別等方面的計(jì)量分析,以揭示數(shù)據(jù)論文在“數(shù)據(jù)驅(qū)動(dòng)”型科學(xué)研究中的發(fā)展與應(yīng)用情況,推動(dòng)數(shù)據(jù)論文與數(shù)據(jù)期刊在數(shù)據(jù)共享方面的發(fā)展。

        1 相關(guān)研究

        1.1 數(shù)據(jù)論文與數(shù)據(jù)期刊的概念

        目前對(duì)數(shù)據(jù)論文的定義,是通過(guò)對(duì)比數(shù)據(jù)論文和傳統(tǒng)論文及其他出版模式得出的。國(guó)內(nèi)學(xué)者劉鳳紅[4]等人提出數(shù)據(jù)論文是遵從標(biāo)準(zhǔn)的學(xué)術(shù)形式出版規(guī)范,接受同行評(píng)議(peer-review)的正式學(xué)術(shù)論文。數(shù)據(jù)論文是一種特殊的學(xué)術(shù)論文,它對(duì)數(shù)據(jù)采集過(guò)程中數(shù)據(jù)收集、處理、使用軟件、數(shù)據(jù)內(nèi)容、數(shù)據(jù)產(chǎn)生背景和數(shù)據(jù)質(zhì)量與結(jié)構(gòu)等元數(shù)據(jù)進(jìn)行詳細(xì)的描述,但不提供分析方法與分析過(guò)程,不會(huì)產(chǎn)出研究成果與結(jié)論。屈寶強(qiáng)[2]等認(rèn)為數(shù)據(jù)論文的內(nèi)容也包括標(biāo)題、作者、摘要、章節(jié)、參考文獻(xiàn)等內(nèi)容,與傳統(tǒng)學(xué)術(shù)論文的不同之處在于,數(shù)據(jù)論文至少具有作為數(shù)據(jù)論文對(duì)象的數(shù)據(jù)集和描述數(shù)據(jù)產(chǎn)生過(guò)程的數(shù)據(jù)處理相關(guān)信息這兩類(lèi)具體的、明確的信息對(duì)象。

        國(guó)外學(xué)者V.Chavan和L.Penev[3]通過(guò)對(duì)比傳統(tǒng)研究論文指出,在數(shù)據(jù)論文中更主要的部分是數(shù)據(jù)集描述的相關(guān)信息,包括是什么(what)、在哪里(where)、為什么(why)、如何(how)、是誰(shuí)(who)幾方面內(nèi)容,而不是傳統(tǒng)學(xué)術(shù)論文中的科學(xué)假設(shè)或是基于數(shù)據(jù)的分析論證。不同的期刊有不同的數(shù)據(jù)論文管理方法,從而更好地描述數(shù)據(jù)、共享數(shù)據(jù),而不是如學(xué)術(shù)論文一樣產(chǎn)出研究結(jié)果。美國(guó)生態(tài)學(xué)會(huì)(Ecological Society of America, ESA)提出,數(shù)據(jù)可以共享,也可以重用;讓數(shù)據(jù)發(fā)揮更大的價(jià)值,是數(shù)據(jù)論文主要的目的[5]。為了應(yīng)對(duì)科研數(shù)據(jù)共享的主流趨勢(shì),數(shù)據(jù)期刊開(kāi)始誕生,并對(duì)數(shù)據(jù)的使用(對(duì)數(shù)據(jù)的描述)、引用(對(duì)數(shù)據(jù)的引用)和重用(對(duì)數(shù)據(jù)內(nèi)容來(lái)源的準(zhǔn)確識(shí)別和溯源)進(jìn)行了規(guī)范[6]。數(shù)據(jù)論文可以通過(guò)重疊期刊(overlay journal)與學(xué)術(shù)論文混合在傳統(tǒng)學(xué)術(shù)期刊上出版,也可以通過(guò)純數(shù)據(jù)期刊(pure data journal)在專(zhuān)門(mén)的數(shù)據(jù)期刊上出版。

        1.2 數(shù)據(jù)論文的獲取和權(quán)益機(jī)制研究

        對(duì)數(shù)據(jù)論文的應(yīng)用現(xiàn)狀進(jìn)行分析,需要首先了解數(shù)據(jù)論文的獲取機(jī)制和其中的權(quán)益內(nèi)涵,才能全面了解科研人員引用數(shù)據(jù)論文、共享科研數(shù)據(jù)的方式和注意事項(xiàng)。

        目前,數(shù)據(jù)論文的獲取模式主要是“金色開(kāi)放獲取”(gold open access),即出版費(fèi)用(數(shù)據(jù)倉(cāng)儲(chǔ)收費(fèi)和期刊收費(fèi))是由作者全部承擔(dān)和支付的。因此有觀點(diǎn)認(rèn)為,數(shù)據(jù)出版的費(fèi)用應(yīng)該由所有的相關(guān)利益者共同承擔(dān),例如期刊和資助機(jī)構(gòu)可以提供出版費(fèi)用優(yōu)惠和補(bǔ)貼。另一方面,目前數(shù)據(jù)論文是否只對(duì)數(shù)據(jù)集部分進(jìn)行開(kāi)放獲取仍然存在爭(zhēng)議。英國(guó)皇家學(xué)會(huì)明確提出,要保證科學(xué)知識(shí)本身的可檢驗(yàn)、可重復(fù)和可利用,就必須從源頭起打破數(shù)據(jù)鴻溝,保證科學(xué)數(shù)據(jù)的可獲得、可理解、可評(píng)估和可利用[7]。而王丹丹[8]等指出開(kāi)放獲取的數(shù)據(jù)集被引用的可能性更大,數(shù)據(jù)論文出版的內(nèi)容不應(yīng)該僅限于開(kāi)放獲取數(shù)據(jù)集。

        對(duì)于數(shù)據(jù)論文的權(quán)益機(jī)制,劉晶晶和顧立平[6]基于Scientific Data的期刊政策,將數(shù)據(jù)期刊的權(quán)益分為讀者權(quán)益、作者權(quán)益和其他權(quán)益,其中作者權(quán)益是討論研究的熱點(diǎn)。開(kāi)放獲取的數(shù)據(jù)論文,在統(tǒng)籌保留版權(quán)的基礎(chǔ)上,被作者授權(quán)出版社進(jìn)行出版,并被授權(quán)第三方科研人員在注明作者和參考文獻(xiàn)的基礎(chǔ)上對(duì)論文進(jìn)行引用;對(duì)于非開(kāi)放獲取的數(shù)據(jù)論文,購(gòu)買(mǎi)方和授權(quán)用戶只有使用權(quán)。在數(shù)據(jù)論文權(quán)益分配中的另一個(gè)關(guān)鍵問(wèn)題是其引用機(jī)制。劉鳳紅[4]等人調(diào)查Pensoft的出版政策后,對(duì)數(shù)據(jù)和數(shù)據(jù)論文的同時(shí)引用,需要在文中和文后對(duì)數(shù)據(jù)及論文都進(jìn)行引用。L.Candela[9]等提出數(shù)據(jù)論文可以像引用一般論文一樣被引用,而不只是引用數(shù)據(jù)集本身。

        2 研究設(shè)計(jì)

        Scientific Data是英國(guó)著名出版商自然出版集團(tuán)(Nature Publishing Group)于2014年5月推出的同行評(píng)審數(shù)據(jù)期刊,該期刊主要內(nèi)容是對(duì)有價(jià)值的科學(xué)數(shù)據(jù)進(jìn)行描述,專(zhuān)注于數(shù)據(jù)采集的嚴(yán)謹(jǐn)性和完整性。該刊篩選論文的六個(gè)原則是信用、重用、質(zhì)量、發(fā)現(xiàn)、開(kāi)放和服務(wù),讓科研數(shù)據(jù)以數(shù)據(jù)論文的形式被科研人員發(fā)現(xiàn),輔助研究者解釋和重用數(shù)據(jù),促進(jìn)數(shù)據(jù)共享。

        筆者于2020年3月10日在Web of Science中以Scientific Data為出版物名稱(chēng),以2015-2019年為發(fā)表時(shí)間跨度進(jìn)行檢索,并在文獻(xiàn)類(lèi)型中選擇“data paper”,共得到853篇數(shù)據(jù)論文。以數(shù)據(jù)論文為出發(fā)點(diǎn),本研究追溯其施引文獻(xiàn),通過(guò)EXCEL軟件,統(tǒng)計(jì)數(shù)據(jù)論文和施引文獻(xiàn)的關(guān)鍵詞、機(jī)構(gòu)、學(xué)科、年份、國(guó)別、文獻(xiàn)類(lèi)型等特征,進(jìn)行對(duì)比分析。并借助CiteSpace對(duì)施引文獻(xiàn)的機(jī)構(gòu)合作情況及研究主題進(jìn)行可視化呈現(xiàn),總結(jié)數(shù)據(jù)論文總體情況以及數(shù)據(jù)論文作為參考文獻(xiàn)被引用的情況。

        3 研究結(jié)果

        檢索統(tǒng)計(jì)發(fā)現(xiàn),在2015-2019年Scientific Data發(fā)表的853篇數(shù)據(jù)論文中,221篇文獻(xiàn)被引頻次為0,632篇文獻(xiàn)已被引用,總被引頻次為7 184次,施引文獻(xiàn)共有6 657篇,其中期刊論文5 280篇(其中數(shù)據(jù)論文211篇),會(huì)議論文440篇,圖書(shū)36本,其他類(lèi)型文獻(xiàn)901篇。

        3.1 數(shù)據(jù)論文被引年代分析

        本研究以數(shù)據(jù)論文的發(fā)表時(shí)間為基準(zhǔn),統(tǒng)計(jì)了每篇施引文獻(xiàn)的相對(duì)引用時(shí)間。如圖1可知,有745次(10.37%)的被引發(fā)生在發(fā)表數(shù)據(jù)論文的當(dāng)年。隨后,有2 532次(35.24%)的被引發(fā)生在公開(kāi)發(fā)表后第一年,出版后第二年的引用次數(shù)與第一年相似,是被引情況發(fā)生最多的兩年。此后,被引用的次數(shù)有所下降,但是在發(fā)表后的第三年仍然可以達(dá)到1 533次??茖W(xué)研究數(shù)據(jù)對(duì)于所有科學(xué)研究活動(dòng)都是必不可少的,研究成果的開(kāi)放共享是現(xiàn)代學(xué)術(shù)規(guī)范之一。由圖1的被引頻次數(shù)據(jù)可知,Scientific Data發(fā)表的數(shù)據(jù)論文在引用時(shí)間上高度接近于發(fā)表時(shí)間,引用效率非常高,數(shù)據(jù)共享比較及時(shí),最新的研究數(shù)據(jù)可以得到充分的利用,科研數(shù)據(jù)的潛在價(jià)值開(kāi)發(fā)得以保證。

        圖1 被引頻次隨發(fā)表后時(shí)間的變化情況

        被引半衰期(Cited Half Life)是指達(dá)到該期刊總引用次數(shù)50%時(shí)的年限[10]。期刊被引半衰期是一種衡量期刊過(guò)去出版情況及其老化速度,以此分析期刊生命力的一項(xiàng)指標(biāo)[10]。如圖2,2015-2019年,Scientific Data數(shù)據(jù)論文的被引頻次分別為1、136、733、2 079、4 235次,經(jīng)計(jì)算,Scientific Data在2019年的被引半衰期為3.10年。作為數(shù)據(jù)期刊,Scientific Data的文獻(xiàn)生命周期較短。但由于Scientific Data2014年創(chuàng)刊,發(fā)展時(shí)間不長(zhǎng),還處于新生階段,在后續(xù)的發(fā)展過(guò)程中還存在著無(wú)限的潛力。隨著數(shù)據(jù)論文相關(guān)政策不斷發(fā)展和完善,數(shù)據(jù)共享越來(lái)越被重視和認(rèn)同,Scientific Data文獻(xiàn)的生命力會(huì)越來(lái)越強(qiáng)盛。

        圖2 Scientific Data被引頻次年度分布圖

        3.2 國(guó)家與機(jī)構(gòu)分析

        數(shù)據(jù)論文的發(fā)表與被引情況分析可以看出各國(guó)的科研水平及數(shù)據(jù)共享意識(shí)的不同。經(jīng)統(tǒng)計(jì),Scientific Data所刊載數(shù)據(jù)論文及其施引文獻(xiàn)國(guó)別前五位均為美國(guó)、英國(guó)、中國(guó)、德國(guó)、澳大利亞,具體數(shù)據(jù)見(jiàn)圖3。由此可以看出,數(shù)據(jù)論文的發(fā)表和引用的國(guó)別基本一致:美國(guó)等發(fā)達(dá)國(guó)家是數(shù)據(jù)論文產(chǎn)出和應(yīng)用主要國(guó)家,這主要由于歐美主要發(fā)達(dá)國(guó)家對(duì)科學(xué)數(shù)據(jù)的認(rèn)識(shí)更早,更加重視數(shù)據(jù)對(duì)國(guó)家科學(xué)技術(shù)的增值,尤其在互聯(lián)網(wǎng)技術(shù)日益發(fā)達(dá)的情況下,其全社會(huì)的數(shù)據(jù)共享體系逐漸成型。此外,這些國(guó)家也擁有更加完善的數(shù)據(jù)共享機(jī)制和權(quán)益保護(hù)政策,這也進(jìn)一步激勵(lì)科研人員共享數(shù)據(jù),推動(dòng)數(shù)據(jù)論文的發(fā)展。而另一方面,我國(guó)也位于數(shù)據(jù)論文產(chǎn)出和應(yīng)用的前列,說(shuō)明我國(guó)科研工作者對(duì)數(shù)據(jù)共享越來(lái)越重視,并逐漸嘗試建立健全數(shù)據(jù)共享和數(shù)據(jù)保護(hù)體系,開(kāi)始著手于全球范圍的數(shù)據(jù)共享和科研協(xié)作,推動(dòng)國(guó)際科學(xué)技術(shù)進(jìn)步和科研影響力提升。

        圖3 發(fā)表和施引文獻(xiàn)的國(guó)別分析

        本研究借助CiteSpace軟件對(duì)數(shù)據(jù)論文施引文獻(xiàn)的發(fā)文機(jī)構(gòu)進(jìn)行共現(xiàn)分析,設(shè)置“Node Types”為“Institutions”,得到合作圖譜如圖4,其網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)量與連線數(shù)量分別為204和660。6 657篇施引文獻(xiàn)由204個(gè)研究機(jī)構(gòu)完成,研究機(jī)構(gòu)由圓形結(jié)點(diǎn)表示,節(jié)點(diǎn)越大表示機(jī)構(gòu)發(fā)文數(shù)量越多,節(jié)點(diǎn)之間的連線表示機(jī)構(gòu)合作發(fā)文情況。表1中統(tǒng)計(jì)了對(duì)數(shù)據(jù)論文引用排名前十的發(fā)文機(jī)構(gòu),對(duì)數(shù)據(jù)論文利用最多的機(jī)構(gòu)依次為中國(guó)科學(xué)院(大學(xué))、斯坦福大學(xué)、牛津大學(xué)、哈佛醫(yī)學(xué)院、倫敦大學(xué)、加州大學(xué)圣地亞哥分校、劍橋大學(xué)、麻省理工大學(xué)、昆士蘭科技大學(xué),機(jī)構(gòu)所屬國(guó)家情況與施引文獻(xiàn)整體發(fā)表國(guó)家情況基本一致。此外,從整體來(lái)看,圖譜的網(wǎng)絡(luò)密度為0.031 9,可以直接反映出,在數(shù)據(jù)論文利用方面,各機(jī)構(gòu)之間合作并不密切,主要以各國(guó)內(nèi)部機(jī)構(gòu)合作為主。

        圖4 施引文獻(xiàn)的機(jī)構(gòu)合作圖譜

        表1 施引文獻(xiàn)的Top10發(fā)文機(jī)構(gòu)

        3.3 學(xué)科領(lǐng)域分析

        通過(guò)統(tǒng)計(jì)對(duì)比數(shù)據(jù)論文和施引文獻(xiàn)的學(xué)科分布,本研究發(fā)現(xiàn),如圖5所示,在Scientific Data上發(fā)表數(shù)據(jù)論文最多的學(xué)科為數(shù)學(xué)計(jì)算生物學(xué)、遺傳學(xué)、計(jì)算機(jī)科學(xué)、工程學(xué)、環(huán)境生態(tài)學(xué)等;而另一方面,如圖6所示,引用數(shù)據(jù)論文最多的學(xué)科為環(huán)境生態(tài)學(xué)、遺傳學(xué)、數(shù)學(xué)計(jì)算生物學(xué)、計(jì)算機(jī)科學(xué)、生物化學(xué)、分子生物學(xué)等。

        圖5 數(shù)據(jù)論文學(xué)科分布

        圖6 數(shù)據(jù)論文施引文獻(xiàn)的學(xué)科分布

        生命科學(xué)、環(huán)境物理學(xué)與計(jì)算機(jī)科學(xué)對(duì)于數(shù)據(jù)論文的引用要高于經(jīng)濟(jì)學(xué)等人文社會(huì)學(xué)科,這種差別可能與學(xué)科領(lǐng)域有關(guān):生命科學(xué)、環(huán)境生態(tài)學(xué)等自然科學(xué)領(lǐng)域需要大量數(shù)據(jù)支撐研究成果,用數(shù)據(jù)去驗(yàn)證、解決科學(xué)問(wèn)題;相反,人文社會(huì)科學(xué)領(lǐng)域更多的是通過(guò)思辨的方式開(kāi)展研究,部分研究對(duì)數(shù)據(jù)需求較弱,且數(shù)據(jù)共享意識(shí)并不健全。在實(shí)際研究過(guò)程中,自然科學(xué)產(chǎn)生的數(shù)據(jù)量更大,且研究對(duì)數(shù)據(jù)的依賴性更高。特別是涉及實(shí)地觀測(cè)、標(biāo)本提取等實(shí)際記錄時(shí),不同學(xué)科之間的差距更加明顯。因此,生物學(xué)、地理學(xué)、計(jì)算機(jī)科學(xué)等領(lǐng)域的科研數(shù)據(jù)和數(shù)據(jù)收集、存儲(chǔ)、處理等方法的描述十分有公開(kāi)和共享的必要。公開(kāi)數(shù)據(jù)方便同行驗(yàn)證和開(kāi)展重復(fù)實(shí)驗(yàn),通過(guò)各種行業(yè)的科研人員重用數(shù)據(jù),促進(jìn)提出新的科學(xué)問(wèn)題,進(jìn)一步推動(dòng)科研總體創(chuàng)新水平的提升。同領(lǐng)域的研究者可以重用科研數(shù)據(jù),發(fā)揮出已有數(shù)據(jù)更大的價(jià)值,也可以學(xué)習(xí)改進(jìn)數(shù)據(jù)收集處理等一系列方法,彌補(bǔ)已有研究的漏洞,找到全新的研究思路和方法,推動(dòng)學(xué)科的不斷發(fā)展。

        而另一方面,這些領(lǐng)域在較早的時(shí)候就推出了學(xué)科專(zhuān)門(mén)的數(shù)據(jù)期刊。美國(guó)生態(tài)學(xué)會(huì)2000年在Ecological Archives開(kāi)始發(fā)表數(shù)據(jù)論文;CMB數(shù)據(jù)論文(CMB Data Papers)、BMC Data Notes、地球系統(tǒng)科學(xué)數(shù)據(jù)(Earth System Science Data)和國(guó)際機(jī)器人研究International Journal of Robotics Research雜志,都有一些零星數(shù)據(jù)論文出版;2012年Wiley發(fā)行了Geoscience Data Journal,以地理科學(xué)的原始數(shù)據(jù)為內(nèi)容,發(fā)表數(shù)據(jù)論文,供同行評(píng)議以及開(kāi)放獲取。因此,這些領(lǐng)域的數(shù)據(jù)論文有較長(zhǎng)的發(fā)展歷程,數(shù)據(jù)共享機(jī)制較為完善,科研工作人員的數(shù)據(jù)共享意識(shí)也更加完備,對(duì)數(shù)據(jù)論文的應(yīng)用自然更加普遍。但是人文社科類(lèi)學(xué)科對(duì)數(shù)據(jù)論文的應(yīng)用較少,數(shù)據(jù)共享沒(méi)有形成規(guī)模。希望在數(shù)據(jù)論文后續(xù)的發(fā)展中,能帶動(dòng)人文社科類(lèi)學(xué)科數(shù)據(jù)共享與數(shù)據(jù)重用不斷普及。

        3.4 研究熱點(diǎn)分析

        高頻詞是指在文獻(xiàn)集中出現(xiàn)頻次較高的關(guān)鍵詞或主題詞,可以據(jù)此來(lái)確定該文獻(xiàn)集的研究熱點(diǎn)和發(fā)展動(dòng)向。將853篇數(shù)據(jù)論文和6 657篇施引文獻(xiàn)導(dǎo)入Citespace中進(jìn)行關(guān)鍵詞的詞頻統(tǒng)計(jì)分析。設(shè)置結(jié)點(diǎn)類(lèi)型為“關(guān)鍵詞”,并對(duì)施引文獻(xiàn)圖譜設(shè)置修剪算法為“尋徑網(wǎng)絡(luò)算法+修剪整個(gè)網(wǎng)絡(luò)”。運(yùn)行后,數(shù)據(jù)論文關(guān)鍵詞共現(xiàn)圖譜共有158個(gè)節(jié)點(diǎn)和528條連線,施引文獻(xiàn)關(guān)鍵詞共現(xiàn)圖譜共產(chǎn)生221個(gè)節(jié)點(diǎn)和415條連線。提取頻次最高的20個(gè)高頻關(guān)鍵詞,得到數(shù)據(jù)論文和施引文獻(xiàn)高頻關(guān)鍵詞統(tǒng)計(jì)表,如表2。

        表2 數(shù)據(jù)論文與施引文獻(xiàn)高頻關(guān)鍵詞統(tǒng)計(jì)表

        對(duì)比數(shù)據(jù)論文和施引文獻(xiàn)的高頻關(guān)鍵詞可以發(fā)現(xiàn),兩者的一致性較高。首先,“氣候變化”在兩個(gè)文獻(xiàn)集中都是出現(xiàn)頻次最高的關(guān)鍵詞,而“氣候”、“溫度”等環(huán)境氣象學(xué)方面的詞匯都出現(xiàn)在高頻詞列表中。說(shuō)明“氣候變化”成為科研人員的數(shù)據(jù)共享熱點(diǎn),數(shù)據(jù)論文的引用文獻(xiàn)也集中在“氣候變化”等相關(guān)領(lǐng)域,目前全球氣候變化、大氣變暖等問(wèn)題已受到研究者的高度關(guān)注。其次,生態(tài)學(xué)方面的“生物多樣性”、“多樣性”、“演化”等關(guān)鍵詞以及遺傳學(xué)方面的“基因”、“基因表達(dá)”、“表達(dá)”等關(guān)鍵詞也有較高的出現(xiàn)頻次。這說(shuō)明在環(huán)境生態(tài)學(xué)和生物遺傳學(xué)方面數(shù)據(jù)論文更多地被用于數(shù)據(jù)共享,且這些研究方向的學(xué)者也更樂(lè)于重用數(shù)據(jù)。最后,“動(dòng)力學(xué)”也出現(xiàn)在高頻詞列表中,但并沒(méi)有更多相關(guān)詞匯的擴(kuò)展,在動(dòng)力學(xué)方面關(guān)注程度和數(shù)據(jù)共享意識(shí)還需要提高。

        除了在高頻關(guān)鍵詞兩者存在較高的一致性外,施引文獻(xiàn)中還出現(xiàn)了“機(jī)器學(xué)習(xí)”這一高頻關(guān)鍵詞,推測(cè)可能機(jī)器學(xué)習(xí)方面的研究人員會(huì)引用數(shù)據(jù)論文的數(shù)據(jù)集作為機(jī)器學(xué)習(xí)的訓(xùn)練和測(cè)試數(shù)據(jù)來(lái)源。

        在對(duì)關(guān)鍵詞進(jìn)行提取與篩選的基礎(chǔ)上,繪制施引文獻(xiàn)關(guān)鍵詞共現(xiàn)圖譜,如圖7所示。圖譜中,關(guān)鍵詞由結(jié)點(diǎn)表示,節(jié)點(diǎn)越大,表示該關(guān)鍵詞出現(xiàn)的頻率越高。節(jié)點(diǎn)之間的連線及線條的粗細(xì)分別表示關(guān)鍵詞的共現(xiàn)情況和共現(xiàn)頻率的高低。該共現(xiàn)圖譜共有221個(gè)節(jié)點(diǎn),415條連線,網(wǎng)絡(luò)密度為0.017 1。結(jié)合高頻關(guān)鍵詞統(tǒng)計(jì)表與共現(xiàn)網(wǎng)絡(luò)圖譜可得出結(jié)論:氣候變化、基因表達(dá)、生物多樣性、機(jī)器學(xué)習(xí)及癌癥等是核心關(guān)鍵詞。

        聚類(lèi)分析(Cluster Analysis)是一種多元的統(tǒng)計(jì)分析方法,根據(jù)事物自身的特點(diǎn)進(jìn)行分類(lèi),并進(jìn)行定量的研究。聚類(lèi)分析法在對(duì)施引文獻(xiàn)的關(guān)鍵詞進(jìn)行挖掘分析,尋找數(shù)據(jù)論文引用特點(diǎn)時(shí)具有重要作用。本研究基于關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜,使用“Find clusters”功能給關(guān)鍵詞分類(lèi),并從中提取聚類(lèi)的自動(dòng)命名標(biāo)簽,使用“LLR”為聚類(lèi)命名抽取。經(jīng)過(guò)對(duì)聚類(lèi)結(jié)果再不斷進(jìn)行優(yōu)化,最終形成關(guān)鍵詞聚類(lèi)圖譜,如圖7所示。當(dāng)Modularity值大于0.3時(shí),網(wǎng)絡(luò)社團(tuán)結(jié)構(gòu)顯著。該聚類(lèi)圖譜的Modularity值最終為0.727 5,聚類(lèi)效果顯著。

        圖7 施引文獻(xiàn)關(guān)鍵詞共現(xiàn)圖譜

        聚類(lèi)后,關(guān)鍵詞被劃分為11類(lèi),在此基礎(chǔ)上進(jìn)行進(jìn)一步的整理和提取,把數(shù)據(jù)論文引用熱點(diǎn)劃分為以下幾個(gè)領(lǐng)域:

        生態(tài)變化:代表關(guān)鍵詞有“氣候變化”、“氣候”、“二氧化碳排放”、“溫度”、“生物多樣性”、“入侵植物”等。由二氧化碳和其他溫室氣體的增加引起的全球變暖是限制人類(lèi)社會(huì)可持續(xù)發(fā)展的主要問(wèn)題。研究全球氣候變化,尋找有效的對(duì)策,才能推進(jìn)地球的生態(tài)和人類(lèi)生存環(huán)境的保護(hù)。此外,入侵生物及環(huán)境破壞對(duì)生物多樣性造成的破壞成為日益嚴(yán)重的生態(tài)問(wèn)題,保護(hù)生物多樣性,維護(hù)生態(tài)平衡也成為人類(lèi)共同面臨的問(wèn)題。

        醫(yī)學(xué):代表關(guān)鍵詞有“阿茲海默癥”、“癌癥”、“重癥監(jiān)護(hù)室”、“死亡”、“基因表達(dá)”、“基因”等,這部分研究的主要內(nèi)容有腫瘤的生長(zhǎng)、增殖、轉(zhuǎn)移及基因表達(dá)調(diào)控。醫(yī)學(xué)科研領(lǐng)域與人類(lèi)生命健康息息相關(guān),人類(lèi)的科研熱點(diǎn)也一直離不開(kāi)疾病治療和預(yù)防,以及基因表達(dá)和遺傳方面的研究與探索。

        人工智能:代表關(guān)鍵詞有“機(jī)器學(xué)習(xí)”、“深度學(xué)習(xí)”、“數(shù)據(jù)集合”、“數(shù)據(jù)庫(kù)”、“大數(shù)據(jù)”、“分類(lèi)算法”等。隨著大數(shù)據(jù)、高性能計(jì)算和深度學(xué)習(xí)技術(shù)的快速迭代和進(jìn)步,人工智能已成為全球重點(diǎn)關(guān)注的研究和發(fā)展領(lǐng)域,具有廣泛的實(shí)踐應(yīng)用場(chǎng)景,已成為引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量。

        3.5 數(shù)據(jù)論文影響力分析

        為了分析數(shù)據(jù)共享對(duì)論文質(zhì)量的貢獻(xiàn),本研究統(tǒng)計(jì)了施引文獻(xiàn)的被引頻次與施引文獻(xiàn)的期刊分布情況,如圖8、圖9。由統(tǒng)計(jì)結(jié)果可以看出,引用“Scientific Data”數(shù)據(jù)論文的文獻(xiàn)被引用頻次集中在0次和1~10次,被引用頻次在100次以上的只有22篇。而在期刊分布方面,圖9顯示了文獻(xiàn)量最多的15種期刊。通過(guò)2018年的JCR報(bào)告統(tǒng)計(jì)出各期刊的影響因子,這部分期刊影響因子多集中于4~12,其中也有Nature這種高影響因子(43.07)的期刊。現(xiàn)代科研環(huán)境越來(lái)越復(fù)雜,單個(gè)科學(xué)家在完善科學(xué)研究的同時(shí),很難獨(dú)自完成數(shù)據(jù)的采集、儲(chǔ)存、加工等全部工作,因此,數(shù)據(jù)共享成為推動(dòng)科研進(jìn)一步發(fā)展的重要手段。數(shù)據(jù)論文一方面幫助科研人員直接獲取需要的數(shù)據(jù),另一方面也鼓勵(lì)他們共享自己的科研數(shù)據(jù),促進(jìn)科研效率的提升,免去了大量重復(fù)工作。通過(guò)這兩方面,數(shù)據(jù)論文的施引文獻(xiàn)及其數(shù)據(jù)來(lái)源更加豐富,對(duì)比分析更加明確,研究結(jié)論更加深入,大大提升了自身的研究?jī)r(jià)值和論文影響力。

        圖 8 施引文獻(xiàn)被引頻次

        圖9 施引文獻(xiàn)期刊分布及影響因子

        4 結(jié)論與展望

        4.1 研究結(jié)論

        本次研究以2015-2019年Scientific Data發(fā)表的數(shù)據(jù)論文為調(diào)查對(duì)象,主要借鑒引文分析法,采用文獻(xiàn)調(diào)查法、內(nèi)容分析法、統(tǒng)計(jì)分析法,從對(duì)數(shù)據(jù)論文的引用出發(fā),總結(jié)數(shù)據(jù)論文的應(yīng)用現(xiàn)狀,主要研究結(jié)論如下:

        (1)從數(shù)據(jù)論文引用總體情況來(lái)看,Scientific Data發(fā)表的數(shù)據(jù)論文引用效率非常高,數(shù)據(jù)共享比較及時(shí),最新的研究數(shù)據(jù)可以得到充分的利用,科研數(shù)據(jù)的潛在價(jià)值開(kāi)發(fā)得以保證。但也同時(shí)存在文獻(xiàn)老化速度比較快,文獻(xiàn)的生命周期較短的問(wèn)題。在后續(xù)的發(fā)展中,數(shù)據(jù)論文應(yīng)注意其數(shù)據(jù)質(zhì)量及數(shù)據(jù)格式統(tǒng)一,提升數(shù)據(jù)重利用的可能性,使科研數(shù)據(jù)更具生命力,為學(xué)科領(lǐng)域的長(zhǎng)期發(fā)展做出貢獻(xiàn)。

        (2)從數(shù)據(jù)論文的發(fā)表與引用的國(guó)家機(jī)構(gòu)來(lái)看,Scientific Data所刊登數(shù)據(jù)論文及其施引文獻(xiàn)較多的國(guó)家多為發(fā)達(dá)國(guó)家,這些國(guó)家擁有更加完善的數(shù)據(jù)共享機(jī)制和權(quán)益保護(hù)政策,這進(jìn)一步激勵(lì)科研人員共享數(shù)據(jù),推動(dòng)數(shù)據(jù)論文的發(fā)展;對(duì)數(shù)據(jù)論文利用最多的機(jī)構(gòu)所屬國(guó)家情況與施引文獻(xiàn)整體發(fā)表國(guó)家情況基本一致。此外,從整體來(lái)看,在數(shù)據(jù)論文利用方面,各機(jī)構(gòu)之間合作并不密切,主要以各國(guó)內(nèi)部機(jī)構(gòu)合作為主。各個(gè)國(guó)家機(jī)構(gòu)應(yīng)積極推動(dòng)數(shù)據(jù)論文發(fā)展及科研數(shù)據(jù)共享,發(fā)展中國(guó)家應(yīng)借鑒發(fā)達(dá)國(guó)家的數(shù)據(jù)發(fā)表模式和數(shù)據(jù)共享措施,健全本國(guó)科研數(shù)據(jù)共享與保護(hù)機(jī)制。各國(guó)應(yīng)加強(qiáng)國(guó)家間機(jī)構(gòu)合作,支持國(guó)家合作科研數(shù)據(jù)共享,便于研究人員進(jìn)行國(guó)家間對(duì)比研究,推動(dòng)各國(guó)學(xué)科進(jìn)步。

        (3)通過(guò)對(duì)數(shù)據(jù)論文及其施引文獻(xiàn)的學(xué)科分布和高頻關(guān)鍵詞進(jìn)行對(duì)比分析發(fā)現(xiàn),生命科學(xué)、環(huán)境生態(tài)學(xué)等領(lǐng)域?qū)?shù)據(jù)論文的發(fā)表與利用最為集中,這些學(xué)科需要大量數(shù)據(jù)支撐研究成果,用數(shù)據(jù)去驗(yàn)證、解決科學(xué)問(wèn)題。相反,社會(huì)科學(xué)領(lǐng)域更多的通過(guò)思辨方式開(kāi)展研究,雖然已經(jīng)逐漸開(kāi)始重視數(shù)據(jù)驅(qū)動(dòng)的研究范式,但目前數(shù)據(jù)論文并沒(méi)有得到充分的發(fā)展。在學(xué)科發(fā)展過(guò)程中,社會(huì)科學(xué)應(yīng)注意完善保留科研數(shù)據(jù),緊跟“數(shù)據(jù)驅(qū)動(dòng)”型科學(xué)研究的發(fā)展方向,更新研究方法,完善研究結(jié)論。

        4.2 研究展望

        本文對(duì)Scientific Data刊發(fā)的數(shù)據(jù)論文引用現(xiàn)狀進(jìn)行了調(diào)查分析,并對(duì)數(shù)據(jù)論文的引用功能及其發(fā)展進(jìn)行了總結(jié)。但是,本次研究采用的數(shù)據(jù)收集方法并不完善且對(duì)數(shù)據(jù)結(jié)果的分析還不夠全面和透徹。在本文研究工作的基礎(chǔ)上,可以從以下幾個(gè)方面進(jìn)行進(jìn)一步的完善研究:

        (1)由于本研究未采用自動(dòng)的文獻(xiàn)引用位置識(shí)別工具,本文主要通過(guò)人工來(lái)識(shí)別和判斷Scientific Data的數(shù)據(jù)論文引用位置,由于識(shí)別工具和方法的不完善性,可能使得數(shù)據(jù)結(jié)果缺乏科學(xué)客觀性。希望后續(xù)研究能夠從提高識(shí)別工具的科學(xué)有效性出發(fā),來(lái)更客觀地識(shí)別判斷數(shù)據(jù)論文引用功能。

        (2)本文對(duì)于數(shù)據(jù)論文引用現(xiàn)狀和數(shù)據(jù)論文引用功能的研究只基于Scientific Data發(fā)表的數(shù)據(jù)論文,沒(méi)有考慮到期刊學(xué)科特性的影響,對(duì)數(shù)據(jù)論文的引用現(xiàn)狀的評(píng)價(jià)尚不成熟且不完善。在后續(xù)研究中,希望能夠結(jié)合多種數(shù)據(jù)論文期刊,建立更加科學(xué)有效的數(shù)據(jù)論文評(píng)價(jià)指標(biāo)體系,并為數(shù)據(jù)論文引用的評(píng)價(jià)研究提供理論基礎(chǔ)。

        猜你喜歡
        論文期刊文獻(xiàn)
        期刊更名啟事
        期刊簡(jiǎn)介
        Hostile takeovers in China and Japan
        速讀·下旬(2021年11期)2021-10-12 01:10:43
        期刊問(wèn)答
        Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
        大東方(2019年12期)2019-10-20 13:12:49
        The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
        The Role and Significant of Professional Ethics in Accounting and Auditing
        商情(2017年1期)2017-03-22 16:56:36
        下期論文摘要預(yù)登
        下期論文摘要預(yù)登
        下期論文摘要預(yù)登
        国产欧美日韩a片免费软件| 国语淫秽一区二区三区四区| 国产精品国产亚洲精品看不卡| 欧美性巨大╳╳╳╳╳高跟鞋 | 亚洲视频不卡免费在线| 伊人色网站| 精品日产一区2区三区| 国产精品综合一区久久| 亚洲乱色伦图片区小说| 狠狠色婷婷久久一区二区| jk制服黑色丝袜喷水视频国产| 人妻在线有码中文字幕| 婷婷色香五月综合缴缴情| 丰满少妇愉情中文字幕18禁片| 亚洲va欧美va人人爽夜夜嗨| 久久成人精品国产免费网站| 国产精品免费一区二区三区四区 | 三级国产精品久久久99| 日本黄网站三级三级三级| 欧美在线观看一区二区| 亚洲素人av在线观看| 手机看片自拍偷拍福利| 亚洲人成网站18禁止久久影院| 精品国产福利久久久| 国产成人亚洲综合二区| 男女18禁啪啪无遮挡激烈网站| 亚洲综合精品成人| 亚洲欧美国产成人综合不卡| 亚洲av香蕉一区二区三区av| 一本久久a久久精品vr综合 | 一区视频免费观看播放| 少妇扒开毛茸茸的b自慰| 久久aⅴ无码一区二区三区| 日本红怡院东京热加勒比| 亚洲精品人成中文毛片| 日韩人妻无码免费视频一区二区三区| 国产精品自产拍在线观看中文| 亚洲中文字幕综合网站| 男人的天堂av网站| 最新69国产成人精品视频免费| 日本免费一区精品推荐|