亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于被引位置的數(shù)據(jù)論文價值分析*
        ——以數(shù)據(jù)期刊Scientific Data為例

        2022-05-14 06:37:44王傳清黃國彬
        圖書情報研究 2022年2期
        關鍵詞:論文期刊文獻

        吳 寧 王傳清 黃國彬

        (1.中國科學院文獻情報中心 北京 100190;2.中國科學院大學經(jīng)濟與管理學院圖書情報與檔案管理系 北京 100190;3.富媒體數(shù)字出版內容組織與知識服務重點實驗室 北京 100038;4.北京師范大學政府管理學院 北京 100875)

        0 引言

        “數(shù)據(jù)論文”是一種特殊的學術論文,它對數(shù)據(jù)采集過程中數(shù)據(jù)收集、處理、使用軟件、數(shù)據(jù)內容、數(shù)據(jù)產(chǎn)生背景和數(shù)據(jù)質量與結構等元數(shù)據(jù)進行詳細的描述,但不提供分析方法與分析過程,不會產(chǎn)出研究成果與結論。近年來,數(shù)據(jù)論文獲得了出版商、期刊和科研基金資助機構等的大力支持和推廣。例如ViBRANT(Virtual Biodiversity Research and Access Network for Taxonomy)和BioFresh(a program to support freshwater biodiversity)獲得了歐盟的資助,積極參與數(shù)據(jù)論文推廣,甚至創(chuàng)辦了專門發(fā)表數(shù)據(jù)論文的下一代生物多樣性數(shù)據(jù)雜志Biodiversity Data Journal。哥倫比亞的亞力山大洪堡特生物資源研究所(Colombia’s Alexander von Humboldt Biological Resources and Research Institute)也致力于出版數(shù)據(jù)論文。2012年Wiley發(fā)行了Geoscience Data Journal,發(fā)表了地理科學的原始數(shù)據(jù)論文,供同行評議和研究人員獲取[1]。自然出版集團于2014年5月推出開放存取的數(shù)據(jù)期刊Scientific Data,該期刊以出版有科學價值的科學數(shù)據(jù)為目的,大力推動數(shù)據(jù)出版進一步發(fā)展。

        數(shù)據(jù)論文與傳統(tǒng)論文有明顯區(qū)別,研究人員可以完全公開地閱讀數(shù)據(jù)描述文件、下載原始數(shù)據(jù)集。然而,數(shù)據(jù)論文撰寫與發(fā)表的機制以及相關工具還遠遠沒有獲得推廣,從豐富的研究元數(shù)據(jù)生成數(shù)據(jù)論文,截至目前這種做法仍然只是小眾做法。

        數(shù)據(jù)期刊層出不窮,數(shù)據(jù)論文也不斷增多,現(xiàn)代科學已經(jīng)越來越重視數(shù)據(jù)共享和重用??蒲腥藛T開始廣泛引用數(shù)據(jù)論文,對其內容和數(shù)據(jù)集進行二次分析,對已有研究結果進行檢驗和再現(xiàn),從而減少科研過程中的重復性工作,并以已有研究為基礎不斷深化,得到更進一步的研究結論[2]。數(shù)據(jù)論文的引用頻率、引用動機和數(shù)據(jù)論文對科研產(chǎn)生的影響,代表著數(shù)據(jù)論文的重要程度,也是數(shù)據(jù)論文與數(shù)據(jù)期刊的重要評價標準。本研究擬從對數(shù)據(jù)論文的引用出發(fā),調查數(shù)據(jù)論文的引用位置,總結數(shù)據(jù)論文的引文功能和應用現(xiàn)狀,從新角度出發(fā)認識數(shù)據(jù)論文的發(fā)展情況,為科研數(shù)據(jù)出版和管理提供新的視角。

        1 相關研究進展

        1.1 數(shù)據(jù)論文相關研究

        數(shù)據(jù)論文目前的出版流程依舊與學術論文的出版流程基本一致,但由于數(shù)據(jù)論文的特殊性,使得數(shù)據(jù)論文的出版模式更加復雜。劉鳳紅[3]和劉晶晶[4]分別針對性解釋了全球生物多樣信息網(wǎng)絡(GBIF)和Penspft出版社與自然出版集團推出的Scientific Data的出版流程。歐陽崢崢[5]等調研了15種數(shù)據(jù)期刊,對其發(fā)展現(xiàn)狀、出版方式、收錄內容、版權協(xié)議等進行了對比分析,認為科研數(shù)據(jù)通過數(shù)據(jù)期刊以正式出版物的形式發(fā)表,提高了數(shù)據(jù)的規(guī)范性、可理解性和可引用性。對數(shù)據(jù)論文中的科研數(shù)據(jù),歐陽崢崢[5]指出,已發(fā)表論文的科研數(shù)據(jù)和新產(chǎn)生的數(shù)據(jù)都可以作為數(shù)據(jù)論文的描述對象,而為了更好地描述數(shù)據(jù),保證數(shù)據(jù)集質量和數(shù)據(jù)可重用性,部分數(shù)據(jù)期刊制定了數(shù)據(jù)論文專門的模板和指南。

        為保證和提升數(shù)據(jù)論文的可用性和可信度,數(shù)據(jù)期刊對出版的數(shù)據(jù)論文內容和結構會有不同的要求。Gorgolewski等人指出,數(shù)據(jù)論文內容和結構方面的要求保障了科研數(shù)據(jù)的透明和可重用性,進一步推動數(shù)據(jù)共享[6]。Candela等調查了100余種數(shù)據(jù)期刊,發(fā)現(xiàn)數(shù)據(jù)論文格式和內容還沒有統(tǒng)一的規(guī)定與標準,部分數(shù)據(jù)期刊對數(shù)據(jù)論文提出非常詳細的要求,更多的期刊則對論文的內容給予充分的自由[7]。他另外指出,研究人員有可能將一項數(shù)據(jù)內容分為多個部分進行展示,因此這不利于數(shù)據(jù)論文出版過程的發(fā)展和完善,也不利于保障數(shù)據(jù)共享[7]。

        為保障期刊質量,幾乎所有的數(shù)據(jù)期刊都采取同行評議的機制,然而目前不同期刊采用的評估方法和評審標準不盡相同。Candela把數(shù)據(jù)論文的同行評審分為封閉式同行評審(closed peer review)、開放式同行評審(open peer review)、半開放式同行評審(semi-open peer review),而數(shù)據(jù)集、數(shù)據(jù)描述、數(shù)據(jù)集與數(shù)據(jù)描述的一致性和數(shù)據(jù)論文對數(shù)據(jù)集的開放獲取作用,都是評議數(shù)據(jù)論文的獨特重點[7]。另一方面,數(shù)據(jù)論文的同行評審還存在許多爭議,例如:數(shù)據(jù)質量對數(shù)據(jù)論文有著更重要的作用,但目前尚無統(tǒng)一的公認的數(shù)據(jù)質量評價標準;傳統(tǒng)的同行評議不夠透明,評審的過程需要更多的發(fā)展和完善。

        1.2 文獻引用相關研究

        規(guī)范理論(Normative Theory)來源于莫頓科學社會學,而社會建構觀(Social Constructivist View)則來自構建主義[8],這兩種理論對引用行為和引文本質有不同的定義,是引用行為研究領域中相互競爭的理論。規(guī)范理論認為引用行為是施引者對參考文獻研究價值的認可,因此可以通過被引頻次評價文獻的學術價值[9];社會建構觀則指出,知識傳承不是文獻引用的目的,引文發(fā)揮的功能是說服讀者,使文獻更有可信性,因此被引情況作為學術評價依據(jù)缺乏權威性[10]。

        調查發(fā)現(xiàn),研究者主要通過兩種方式對引用行為開展實證研究。第一種是通過內容分析方法對引文上下文語境(Citation Context)進行判定和解讀,對被引文獻的功能進行分類,從而對科研人員的引用動機進行解讀。Willett分析了10篇論文,從18個可能的引用動機中挑選出了最重要的10個,并且對作者的引用動機進行調查,將其與判讀的引用動機進行比較[11];Brooks[12]從引用動機文獻中總結篩選出七種引用動機:新穎性(currency)、操作性信息(operational information)、負面證據(jù)(negative credit)、正面評價(positive credit)、說服(persuasiveness)、提醒讀者(reader alert)、社會認同(social consensus);Peritz[13]提出可以根據(jù)引文在論文中所發(fā)揮的不同功能對引用動機進行分類。另一種是采用問卷調查法或訪談法直接地剖析施引者的引用行為。邱均平[14]等通過已有研究文獻,總結出知識主張、價值感知、信息源便利性、引用輸出、引用重要性五種引用動機,并將其分為內在引用動機和外在引用動機;通過量表式問卷對科研人員進行調查,通過結構方程建模的方法驗證引用行為以及不同引用動機之間的影響關系。Liu M[15]通過調查問卷,對1981-1987年在Chinese Physics上發(fā)表文章的415位作者進行調査,構建引用動機的理論模型,分析引用行為的各種影響因素及其各因素之間可能存在的聯(lián)系。

        科研論文通常都遵循著嚴格的章節(jié)結構,引文內容在施引文獻中出現(xiàn)的位置,可以反映出某一領域文獻的引用規(guī)律。Sombatsompop[16]等學者將引用位置劃分為“引言”、“實驗與材料”、“結果與討論”、“結論與其他”,通過引用位置來評價學術論文的引用價值。他們認為引用位置在“結果與討論”中的內容比被引用在“引言”部分的更重要。Catalini等學者持相似意見,但他們將文章分為“引言”、“材料與方法”、“結果與討論”、“其他”四個部分。他們分析了Journal of Immunology上從1998到2007年共15 731篇文獻的引用位置后發(fā)現(xiàn),有約84%的內容在“結果與討論”部分被引用[17]。張夢瑩[18]等人將引用位置分為“引言”、“文獻綜述”、“方法”、“結果”、“討論”、“結論”等六個部分,以PLoS One期刊為數(shù)據(jù)來源,從中抽取2006-2015年6個不同學科刊載的3 414篇論文,對5 320條引文內容數(shù)據(jù)進行分析,發(fā)現(xiàn)引用集中于“引言”部分。

        綜上,通過對國內外相關研究的調研,可以發(fā)現(xiàn)目前對數(shù)據(jù)論文的研究主要集中于對數(shù)據(jù)論文及數(shù)據(jù)期刊相關概念、數(shù)據(jù)論文同行審議、出版機制和權益機制等過程的總結與闡述,對數(shù)據(jù)論文發(fā)展過程的綜述性研究也比較完善。文獻引用相關研究局限在對普通學術論文的被引情況研究,對數(shù)據(jù)論文被引情況的研究較少。

        本文擬研究數(shù)據(jù)論文的引用情況,著重調研引文功能和引用位置,總結數(shù)據(jù)論文的引用現(xiàn)狀。

        2 研究設計

        Scientific Data是自然出版集團推出的專門的科學數(shù)據(jù)期刊,其收錄的論文涵蓋生物、地球與環(huán)境、健康、物理、科學界與社會等領域。該期刊的主要論文類型為Data Descriptor,將傳統(tǒng)的敘述內容與精心策劃的數(shù)據(jù)描述(元數(shù)據(jù))相結合,為數(shù)據(jù)共享和重用提供了新的框架。

        筆者于2020年3月10日在Web of Science中檢索2015-2019年Scientific Data中刊發(fā)的數(shù)據(jù)論文,并選定被引頻次最高的50篇文獻。通過追溯數(shù)據(jù)論文的施引文獻,并篩選出其中的“論文”(Article)和“會議論文”(Proceeding Paper)兩種文獻類型作為統(tǒng)計對象,共獲得3 011篇文獻。然后獲取這批文獻的全文,人工找尋數(shù)據(jù)論文在其中的引用位置,按照文章結構或上下文,判斷分類數(shù)據(jù)論文的引用位置;借助EXCEL、“百度圖說”等可視化統(tǒng)計工具,統(tǒng)計高被引數(shù)據(jù)論文的關鍵詞、學科、機構、國別等特征,并以條形圖、氣泡圖等形式進行可視化呈現(xiàn),將其功能與自身屬性聯(lián)系起來,找尋數(shù)據(jù)論文引用行為的規(guī)律與特點。

        3 研究結果

        3.1 引用位置分析

        IMRD結構模式是近代實驗科學興起時就已形成的大量現(xiàn)代學術研究論文遵循的模式。該模式建立在觀察可重現(xiàn)原則之上,由界定研究所關心的問題(Introduction)、介紹研究問題的方法(Method)、陳述研究的發(fā)現(xiàn)(Result)以及發(fā)現(xiàn)的意義(Discussion)共四個部分組成。Voos和Dagaev[19]在1976年最早提出引用內容位置的有關研究,他們發(fā)現(xiàn),在施引文獻中分布在不同位置的引用內容,其價值并不相同。因此,數(shù)據(jù)論文在施引文獻中的不同位置分布,意味著數(shù)據(jù)論文承擔著不同的引文功能。本文借鑒張夢瑩[18]等人在構建引文內容分析數(shù)據(jù)集時,將引用位置劃分的“引言”、“文獻綜述”、“方法”、“結果”、“討論”、“結論”等六個部分,并結合Sombatsompop[16]等學者對引用位置的劃分,最后確定引言、綜述、數(shù)據(jù)/方法、結果、討論、結論、附錄、致謝八種引用位置分類。

        本文通過人工逐篇追溯數(shù)據(jù)論文的施引文獻的方式,根據(jù)數(shù)據(jù)論文在其中的引用位置和施引文獻上下文,判斷數(shù)據(jù)論文發(fā)揮的引用功能,對數(shù)據(jù)論文作為參考文獻的引用情況進行總結分析。由于一篇數(shù)據(jù)論文可能會在施引文獻中被多處引用,即一篇論文可能有多種引文功能[20],在統(tǒng)計編碼過程中,將回溯數(shù)據(jù)論文每次被引的位置,因此一條文獻會存在多條重復記錄。

        通過追溯上述數(shù)據(jù)論文在施引文獻中出現(xiàn)的位置及上下文,判斷其引文功能,并按引言、綜述、數(shù)據(jù)/方法、結果、討論、結論、附錄、致謝八種進行分類。數(shù)據(jù)論文總計被引3 871次,總體引文位置分布見圖1。

        圖1 引文位置分布

        論文的引言部分是研究的總體概述,其目的是簡略描述研究主題及相關環(huán)境或背景,對論文正文起到引導的作用,同時可以激發(fā)讀者的閱讀興趣。在引言部分引用數(shù)據(jù)論文達1 048次,占所有引文位置的27.07%。數(shù)據(jù)論文在引言部分被引用,可以幫助研究者闡述研究主題,并通過新舊研究的對比說明這項研究工作的意義與創(chuàng)新點。

        文獻綜述部分通常是總結梳理該研究領域的相關研究文獻,闡明研究現(xiàn)狀和當前存在的問題,并闡明研究課題研究的必要性、意義和所要實現(xiàn)的目標。統(tǒng)計發(fā)現(xiàn),綜述部分引用數(shù)據(jù)論文268次,占所有引文位置的6.92%。由于數(shù)據(jù)論文的獨特性,施引文獻在綜述部分引用數(shù)據(jù)論文的目的主要在于對闡明某項研究的數(shù)據(jù)來源、數(shù)據(jù)獲取的規(guī)則與手段、數(shù)據(jù)描述方法進行總結概括。數(shù)據(jù)論文在引言和綜述部分被多次引用,證明了在科學研究的傳承中,數(shù)據(jù)論文具有重要意義。

        數(shù)據(jù)/方法部分指研究的數(shù)據(jù)來源和實驗過程與方法部分,從圖1中可以看出,數(shù)據(jù)論文在數(shù)據(jù)/方法部分總共被引用了1 427次,在所有引文位置中占到了36.86%,是被引最為集中的一部分。數(shù)據(jù)論文的被引集中于此部分,說明在施引文獻的數(shù)據(jù)來源、數(shù)據(jù)集選擇、數(shù)據(jù)獲取、數(shù)據(jù)描述、研究方法以及實驗設計等方面,數(shù)據(jù)論文對相關研究提供了較多的幫助。統(tǒng)計還發(fā)現(xiàn),許多文獻甚至直接選取數(shù)據(jù)論文中提供的數(shù)據(jù)集或數(shù)據(jù)描述方法進行不同角度或更深層次的分析和解釋,這充分體現(xiàn)出數(shù)據(jù)論文在不斷地推動數(shù)據(jù)共享和重用,為科研數(shù)據(jù)的進一步利用和潛在價值地挖掘奠定了基礎。

        數(shù)據(jù)論文在施引文獻的結果部分被引用了411次,在這部分中,研究人員通過描述在科學實驗中獲得的客觀結果,提出自己的看法以及對實驗結果的評價和認識。數(shù)據(jù)論文在這一部分被引用,旨在幫助研究人員交待做出了什么,根據(jù)實驗結果可以得到什么,使前期有待證明的假說或者提出的科學理論得到證實,以證明研究人員提出的假說是合理的,觀點是正確的。在這一部分,許多數(shù)據(jù)論文的數(shù)據(jù)集直接以圖表的形式在施引文獻中出現(xiàn),作者將引用信息標注在圖表的腳注部分。這也進一步說明數(shù)據(jù)論文共享的數(shù)據(jù)集可作為直接的研究結果支撐,科研數(shù)據(jù)得到了充分的重用。

        在討論部分中,數(shù)據(jù)論文被引用了546次。研究發(fā)現(xiàn)是討論部分的核心,而數(shù)據(jù)論文的引用是為了有力地支持研究發(fā)現(xiàn)。在討論部分數(shù)據(jù)論文可以直接作為證據(jù)來支持研究的結果;其次,可以將已有的數(shù)據(jù)結果作為參照,與本次研究進行比較,針對數(shù)據(jù)的一致性或差異性對研究進行擴展性的討論;此外,可以引用既往的研究數(shù)據(jù),來說明本次的研究對這一領域的貢獻。

        結論部分是對研究工作中最重要結果的總結,不是簡單地總結研究得出的要點,而是要以更高的抽象水平解釋研究的發(fā)現(xiàn),并闡述研究者是否成功解決了研究問題中所述的需求,或達到了何種程度。在此部分引用數(shù)據(jù)論文是輔助研究進行進一步的展望,或借鑒其他研究對本研究提出意見或建議,分析目前研究的不足。

        在正文之外,數(shù)據(jù)論文在附錄被引用了14次。雖然附錄的重要性和必要性不如正文,但一般選擇將較大的圖表等對研究具有重要參考價值的內容以附錄的形式出現(xiàn),作為對正文的補充,以更好地支撐論文觀點。附錄中的數(shù)據(jù)論文一般在表格或公式中出現(xiàn)。

        數(shù)據(jù)論文幫助施引文獻節(jié)約了大量成本和工作量, 45篇施引文獻的致謝部分對數(shù)據(jù)論文予以感謝,這既是研究人員之間互相的尊重,也是對數(shù)據(jù)共享行為的鼓勵。

        本文在統(tǒng)計數(shù)據(jù)論文引用位置的同時發(fā)現(xiàn),對數(shù)據(jù)論文的引用內容與對傳統(tǒng)學術論文的引用內容存在差異。學術論文通常會在實驗性、理論性或預測性上有別于現(xiàn)有研究,提出新觀點或思路,或是某種已知原理的新應用、新實踐。數(shù)據(jù)論文不同于傳統(tǒng)學術論文,它通常只發(fā)表某項研究相關的數(shù)據(jù)集,包括描述數(shù)據(jù)內容、數(shù)據(jù)產(chǎn)生背景、數(shù)據(jù)質量和結構的元數(shù)據(jù)文件,而不發(fā)表觀點。對數(shù)據(jù)論文中數(shù)據(jù)方法、數(shù)據(jù)集部分內容的引用更能體現(xiàn)數(shù)據(jù)論文在科學數(shù)據(jù)共享中發(fā)揮的作用及其獨特的數(shù)據(jù)共享價值。而這樣的引用更多地體現(xiàn)在數(shù)據(jù)/方法、結果和附錄部分:

        (1)在數(shù)據(jù)/方法中引用數(shù)據(jù)論文,更多的是引用數(shù)據(jù)論文中的數(shù)據(jù)方法,對其中的數(shù)據(jù)收集、存儲、處理方法進行借鑒,來輔助研究獲取、加工數(shù)據(jù)。還有少部分論文會引用數(shù)據(jù)論文中的數(shù)據(jù)集,直接作為自身研究的數(shù)據(jù)來源,進行二次分析,獲得與原研究不同的研究結果,進一步發(fā)掘數(shù)據(jù)資源的潛在價值。

        (2)在結果部分,多數(shù)論文會引用數(shù)據(jù)論文中的部分數(shù)據(jù)集,與研究獲取的數(shù)據(jù)進行比較,增加研究結果分析的層次和深度,也會在已有研究結果的基礎上,與數(shù)據(jù)論文數(shù)據(jù)集結合,提出進一步的假設和預測。在這部分中,部分施引文獻直接將數(shù)據(jù)論文的數(shù)據(jù)集進行圖表化分析,并在圖表腳注部分標明引用信息,通過可視化呈現(xiàn)實現(xiàn)更科學有效的比較分析。

        (3)在附錄部分,施引文獻會引用數(shù)據(jù)論文的部分或全部數(shù)據(jù),這意味著施引文獻通過引用數(shù)據(jù)論文,作為推理、證明的支撐,是支持自身論點的直接依據(jù)。

        3.2 引用頻次與數(shù)據(jù)集分析

        3.2.1 引用頻次分析

        本文統(tǒng)計施引文獻的被引頻次,并按照對數(shù)據(jù)論文的引用位置分類,借助“百度圖說”,制作出氣泡圖,見圖2,橫坐標為八種引用位置,縱坐標為施引文獻的被引頻次,氣泡大小代表相同被引頻次的文獻量。此外,去除未被引用的文獻,對不同引用位置的施引文獻,按被引頻次分段統(tǒng)計其文獻量占比,如表1。從圖2和表1可以看出,雖然數(shù)據(jù)論文發(fā)揮著不同的引用功能,但是除了無被引的文獻,施引文獻的被引頻次都集中在1~10次。進一步結合引用位置分布和被引頻次情況分析,在綜述、致謝引用數(shù)據(jù)論文的文獻被引頻次50次以上占比更大,分別為3.92%、6.26%。此外,在數(shù)據(jù)/方法、引言部分引用數(shù)據(jù)論文的文獻最多,同時其被引頻次的峰值分別為954次、706次,明顯高于其他文獻。

        圖2 被引頻次氣泡圖

        表1 被引頻次分段統(tǒng)計表

        僅從引文的被引頻次對參考文獻進行評價過于片面,一方面無法判斷施引者的引用動機,另一方面沒有考慮到引文在被引過程中的價值差異性。因此,將引用位置與被引頻次進行結合,通過數(shù)據(jù)論文在文章中被引用的不同位置體現(xiàn)出數(shù)據(jù)論文的不同價值,而被引頻次體現(xiàn)出數(shù)據(jù)論文對研究價值的貢獻。綜合調研數(shù)據(jù)發(fā)現(xiàn),數(shù)據(jù)論文往往在引言和數(shù)據(jù)/方法中發(fā)揮自身作用,同時也是在這兩部分中使施引文獻更有價值。

        3.2.2 高被引數(shù)據(jù)論文數(shù)據(jù)集分析

        本研究選取50次以上頻次,且在數(shù)據(jù)/方法部分對引用數(shù)據(jù)論文的施引文獻中的數(shù)據(jù)集進一步分析,所涉及的16篇數(shù)據(jù)論文如表2。在收集閱讀了16篇數(shù)據(jù)論文后,筆者認為,這些數(shù)據(jù)論文在學科領域、數(shù)據(jù)內容、數(shù)據(jù)獲取方式、數(shù)據(jù)形式、數(shù)據(jù)可重用性等方面有如下特點:

        表2 高被引數(shù)據(jù)論文基本信息

        (1)學科領域方面:其中4篇屬于環(huán)境生態(tài)學,3篇屬于材料學,遺傳學、生物學各2篇,另外有信息科學、生命科學/醫(yī)學、神經(jīng)科學、人口學、氣象學各1篇,學科領域分布基本與前期分析的數(shù)據(jù)論文總體學科情況相符。

        (2)論文內容方面:除了本學科領域的科研數(shù)據(jù)與元數(shù)據(jù)外,還有對各種數(shù)據(jù)庫的信息的詳細描述,這也從另一方面說明隨著研究涉及的數(shù)據(jù)量不斷增加,各種學科領域的科研人員對數(shù)據(jù)管理和存儲方面也越來越重視。

        (3)數(shù)據(jù)獲取方面:除了直接實驗測量獲得的數(shù)據(jù),還有模擬建模、從各種可用來源收集整理等不同方式,另外,自然語言處理與機器學習也被廣泛應用于從期刊文獻中提取數(shù)據(jù)。目前人工智能領域的快速發(fā)展帶來了越來越多的數(shù)據(jù)需求,同時也產(chǎn)生了龐大的處理數(shù)據(jù),成為主要的數(shù)據(jù)來源渠道之一,這使得數(shù)據(jù)共享漸漸成為科學研究的基礎,極大地減少科學人員的重復性工作。

        (4)數(shù)據(jù)形式方面:大多數(shù)據(jù)集以數(shù)據(jù)矩陣的形式呈現(xiàn),大規(guī)模數(shù)據(jù)集會在專門的數(shù)據(jù)平臺提供另外的數(shù)據(jù)文件,而且數(shù)據(jù)有多種可視化形式呈現(xiàn),如一般的條形圖、折線圖、扇形圖、散點圖、熱圖,數(shù)據(jù)處理方面的信息還會以流程圖、設計概念圖的形式出現(xiàn),部分數(shù)據(jù)分布情況也以地理分布圖的形式呈現(xiàn),能更加清晰地表現(xiàn)數(shù)據(jù)情況。

        (5)數(shù)據(jù)可重用性方面:為了提高數(shù)據(jù)可重用性,大部分數(shù)據(jù)論文會采用學科專業(yè)的數(shù)據(jù)驗證方式或者其他實驗、研究結果進行比較驗證,也有部分數(shù)據(jù)論文設計了專門的方法體系來確保數(shù)據(jù)質量,或對獲取數(shù)據(jù)的不確定度進行詳細分析。

        在數(shù)據(jù)論文的引用過程中,數(shù)據(jù)使用的層次有所不同,在文獻中發(fā)揮的功能不同,對文獻質量及文獻的被引頻次也有不同程度的影響。一篇數(shù)據(jù)論文中可能共享了不止一個數(shù)據(jù)集,而數(shù)據(jù)集可以靈活地被科研人員重用,可以多個數(shù)據(jù)集進行組合,也可以把數(shù)據(jù)集拆分為子集。對數(shù)據(jù)論文可以在引言、綜述部分引用其中對數(shù)據(jù)庫的描述和數(shù)據(jù)共享規(guī)則機制的描述,為整個研究奠定理論基礎;或在數(shù)據(jù)/方法中僅引用一個特定的數(shù)據(jù)集和數(shù)據(jù)記錄,為研究提供數(shù)據(jù)源,或完善已有的數(shù)據(jù)結構和數(shù)據(jù)描述。數(shù)據(jù)論文構成的復雜結構使得數(shù)據(jù)論文可以有效推動研究人員對數(shù)據(jù)集的收集、管理和重用過程,這也同時提升了研究的質量,完善研究成果。

        4 總結與展望

        4.1 研究結論

        本文針對Scientific Data中被引頻次最高的50篇數(shù)據(jù)論文,回溯其在施引文獻中的引用位置,分別對引言、綜述、數(shù)據(jù)/方法、結果、討論、結論、附錄、致謝八個部分對數(shù)據(jù)論文的引用目的和數(shù)據(jù)論文發(fā)揮的功能進行分析。研究發(fā)現(xiàn):

        (1)數(shù)據(jù)論文并不重點報道基于科學假設和科學問題的研究結果,而是重點描述科學數(shù)據(jù)本身這一獨特性,對數(shù)據(jù)論文的引用具有鮮明的特點。引用數(shù)據(jù)論文中數(shù)據(jù)方法、數(shù)據(jù)集部分內容更能體現(xiàn)數(shù)據(jù)論文在科學數(shù)據(jù)共享中發(fā)揮的作用。

        (2)在數(shù)據(jù)論文的引用過程中,數(shù)據(jù)使用的層次有所不同,在文獻中發(fā)揮的功能不同,對文獻質量及文獻的被引頻次也有不同程度的影響。數(shù)據(jù)論文往往在施引文獻的引言和數(shù)據(jù)/方法中發(fā)揮自身作用,同時也是在這兩部分中使施引文獻更有價值。

        (3)從高被引數(shù)據(jù)論文來看,一篇數(shù)據(jù)論文中可能共享了不止一個數(shù)據(jù)集,而數(shù)據(jù)集可以靈活的被科研人員重用,可以多個數(shù)據(jù)集進行組合,也可以把數(shù)據(jù)集拆分為子集進行使用。數(shù)據(jù)獲取方式是否明確、數(shù)據(jù)格式是否統(tǒng)一明晰、數(shù)據(jù)可重用性是否有保障,都關系到數(shù)據(jù)論文的可利用情況。

        4.2 研究展望

        本文對于數(shù)據(jù)論文引用現(xiàn)狀和數(shù)據(jù)論文引用功能的研究只基于Scientific Data上發(fā)表的數(shù)據(jù)論文,沒有考慮到期刊學科特性的影響,對數(shù)據(jù)論文的引用現(xiàn)狀的評價尚不成熟且不完善。在后續(xù)研究中,希望能夠結合多種數(shù)據(jù)論文期刊,提出更加科學有效的數(shù)據(jù)論文評價指標體系,并為數(shù)據(jù)論文引用的評價研究提供理論基礎。

        對數(shù)據(jù)論文引用位置分布和被引頻次部分的分析,本文選取的文獻規(guī)模較小,在后續(xù)的研究中,可以擴展數(shù)據(jù)論文規(guī)模,增添數(shù)據(jù)格式、數(shù)據(jù)完整性等方面,與施引文獻的引用位置和被引頻次進行綜合分析,推斷數(shù)據(jù)論文質量與其在施引文獻中發(fā)揮功能的相關性。

        本研究將數(shù)據(jù)論文的情況和被引情況進行了多個方面的呈現(xiàn),通過對數(shù)據(jù)論文引用位置的標引和數(shù)據(jù)論文與傳統(tǒng)學術論文的對比,展現(xiàn)了數(shù)據(jù)論文在數(shù)據(jù)共享和科研數(shù)據(jù)潛在價值發(fā)掘方面的獨特貢獻。希望以此讓科研人員看到數(shù)據(jù)論文對科學研究做出的貢獻,鼓勵科研人員發(fā)表數(shù)據(jù)論文,提高數(shù)據(jù)共享意識,充分發(fā)掘科研數(shù)據(jù)價值,減輕科研負擔,推動科學研究進步。

        猜你喜歡
        論文期刊文獻
        期刊更名啟事
        期刊簡介
        Hostile takeovers in China and Japan
        速讀·下旬(2021年11期)2021-10-12 01:10:43
        期刊問答
        Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
        大東方(2019年12期)2019-10-20 13:12:49
        The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
        The Role and Significant of Professional Ethics in Accounting and Auditing
        商情(2017年1期)2017-03-22 16:56:36
        下期論文摘要預登
        下期論文摘要預登
        下期論文摘要預登
        成人免费看吃奶视频网站| 亚洲综合久久中文字幕专区一区 | 亚洲av无码一区二区三区鸳鸯影院| 国产激情久久久久影院老熟女免费| 色婷婷资源网| 日本中出熟女一区二区| 手机av在线中文字幕| 久久综合九色综合97欧美| 国产一区二区波多野结衣| av毛片一区二区少妇颜射| 亚洲黄色一级在线观看| 亚洲性无码一区二区三区| chinesefreexxxx国产麻豆| 人妻丝袜中文字幕久久| 亚洲国产色婷婷久久精品| 东京热人妻无码一区二区av| 六月丁香久久| 精品国产一区二区三广区| 偷拍一区二区视频播放器| 精品一区二区三区免费播放| 成人片在线看无码不卡| 一区二区三区亚洲免费| 亚洲av永久无码一区二区三区| 中国精学生妹品射精久久| 中日韩字幕中文字幕一区| 美女扒开腿露内裤免费看| 97人妻精品一区二区三区| 在线观看视频一区| 日本一二三区在线视频观看| аⅴ天堂中文在线网| 精品人妻系列无码人妻免费视频| 欧美手机在线视频| 午夜免费观看国产视频| 48久久国产精品性色aⅴ人妻 | 日本最新视频一区二区| 亚洲精品无码久久久久av老牛 | 中文无码免费在线| 久久久中文字幕日韩精品| 无码人妻久久一区二区三区免费| 亚洲an日韩专区在线| 自拍偷拍韩国三级视频|