管茜 董克 夏義堃
摘? ?要:數(shù)據(jù)管理直接影響科研數(shù)據(jù)和科研結(jié)果的可發(fā)現(xiàn)、可獲取、互操作和可重用性,是規(guī)范學(xué)術(shù)行為的重要前提。論文撤稿是保證論文科學(xué)性,建立學(xué)術(shù)信任的重要手段,近年來生命科學(xué)領(lǐng)域頻發(fā)撤稿事件反映了包括數(shù)據(jù)管理在內(nèi)的多種學(xué)術(shù)不端行為。在分析生命科學(xué)領(lǐng)域撤稿論文基本特征基礎(chǔ)上,對(duì)撤稿原因進(jìn)行歸類,對(duì)與數(shù)據(jù)、圖像有關(guān)的撤稿論文進(jìn)一步分析,發(fā)現(xiàn)其在時(shí)間、時(shí)滯、國(guó)家、學(xué)科、期刊等方面的相對(duì)發(fā)展趨勢(shì)。數(shù)據(jù)、圖像問題是生命科學(xué)論文撤稿的主要原因之一,并呈現(xiàn)波動(dòng)上升趨勢(shì),數(shù)據(jù)、圖像問題發(fā)生頻率與學(xué)科、期刊等級(jí)有關(guān)。應(yīng)當(dāng)從能力提升、制度完善、主體責(zé)任機(jī)制、過程監(jiān)督、約束激勵(lì)手段等方面來加強(qiáng)科研數(shù)據(jù)管理。
關(guān)鍵詞:數(shù)據(jù)管理;撤稿;生命科學(xué)數(shù)據(jù)
Abstract Data management has a direct impact on the Findable, Accessible, Interoperable and Re-usable of scientific research data and results, and is an important prerequisite for standardizing academic behavior. The retraction of papers is an important means to ensure the scientificity of papers and build academic trust. In recent years, the frequent retraction of papers in the field of life science reflects a variety of academic misconduct, including data management.? Based on the analysis of the basic characteristics of retractions in the field of life science, this paper classifies the reasons for retractions, further analyzes the retractions related to data and images, and finds out their relative development trends in terms of period, time lag, country, discipline, journal and so on. Data and image problems are one of the main reasons for retractions of life science papers, and the frequency of data and image problems is related to discipline and journal level. The management of scientific research data should be strengthened from the aspects of ability promotion, system perfection, subject responsibility mechanism, process supervision, restraint and incentive means, etc.
Key words data management; retracted papers; life scientific data
撤稿是學(xué)術(shù)界自我凈化、自我完善的機(jī)制[1],也是維護(hù)學(xué)術(shù)誠(chéng)信、保障期刊質(zhì)量的基本制度保障?!案玫乩斫獬犯宓臐撛谠蛴兄诟淖儺?dāng)前的學(xué)術(shù)文化,并為阻止公眾對(duì)學(xué)術(shù)失去信任而提供信息、尋找改進(jìn)的方向”[2]。近年來,因數(shù)據(jù)誤用、圖像重復(fù)以及數(shù)據(jù)偽造等數(shù)據(jù)管理問題引發(fā)的生命科學(xué)論文撤稿成上升趨勢(shì),如2018年10月,哈佛醫(yī)學(xué)院Anversa教授的多篇論文被舉報(bào)存在數(shù)據(jù)、圖像偽造等問題,進(jìn)而導(dǎo)致其發(fā)表在《NEJM》《Nature》《Cell》《Lancet》等頂級(jí)學(xué)術(shù)期刊的31篇研究論文被全部撤稿[3]。從撤稿現(xiàn)象背后的數(shù)據(jù)管理問題進(jìn)行深度探索,有助于從根源上找出癥結(jié)與解決方法。
1? ?研究回顧與問題的提出
1.1? ? 研究回顧
(1)生命科學(xué)撤稿論文中的數(shù)據(jù)問題認(rèn)知研究。生命科學(xué)領(lǐng)域是撤稿的重災(zāi)區(qū)。Fang等[4]研究發(fā)現(xiàn),自1975年以來,PubMed數(shù)據(jù)庫中已撤稿文章的百分比增加了約10倍。美國(guó)科研誠(chéng)信辦公室(ORI)發(fā)布的《科研不當(dāng)行為的發(fā)現(xiàn)與后果》報(bào)告指出,醫(yī)療與公共衛(wèi)生領(lǐng)域24起結(jié)案調(diào)查中有21起涉及到數(shù)據(jù)偽造和/或捏造等情況[5]。韓磊[6]分析了2010-2019我國(guó)生物醫(yī)學(xué)領(lǐng)域國(guó)際論文撤稿,發(fā)現(xiàn)自2016年起,因數(shù)據(jù)問題、方法與結(jié)果問題被撤銷的論文數(shù)量連續(xù)4年位于第1和第2位,因圖片問題被撤稿的論文數(shù)量多數(shù)年度居第4或第5位。Elisabeth等[7]結(jié)合數(shù)據(jù)欺詐調(diào)查的具體案例,深入探討了撤稿事件背后的數(shù)據(jù)/圖像操縱、誤用等數(shù)據(jù)管理問題。Mike Rossner和Hill[8]進(jìn)一步指出,修改、重組和偽造數(shù)據(jù)/圖像的部分內(nèi)容以得到想要的但是不客觀的結(jié)果等行為,均屬學(xué)術(shù)不端。Fecher等[9]結(jié)合案例將數(shù)據(jù)濫用行為歸納為四種類型,即“偽造、商業(yè)濫用、競(jìng)爭(zhēng)性濫用、有缺陷的解釋和不明確的意圖”。
(2)生命科學(xué)撤稿論文中的數(shù)據(jù)問題原因分析。多位學(xué)者通過挖掘期刊數(shù)據(jù)庫和Retraction網(wǎng)站的撤稿聲明,發(fā)現(xiàn)數(shù)據(jù)問題成為引發(fā)生命科學(xué)撤稿的重要因素。如針對(duì)PubMed數(shù)據(jù)庫2013年1月1日至2016年12月31日撤稿論文的研究發(fā)現(xiàn),主要撤稿原因包括剽竊(32.7%)和數(shù)據(jù)處理(32.5%)等相關(guān)問題[10]。醫(yī)學(xué)類最常見的撤稿原因是欺詐(數(shù)據(jù)偽造或操縱),占比近一半(49.4%)[11],其中,麻醉學(xué)領(lǐng)域的主要撤稿原因包括數(shù)據(jù)操作/捏造/欺詐(49.4%)、倫理問題(28%)、其他數(shù)據(jù)/方法問題(4.2%)等[12]。
在撤稿論文數(shù)據(jù)問題的原因細(xì)分中,既有學(xué)者從生命科學(xué)研究對(duì)大規(guī)模實(shí)驗(yàn)數(shù)據(jù)以及對(duì)假設(shè)檢驗(yàn)的高度依賴等角度分析其研究過程與數(shù)據(jù)管理的復(fù)雜性,指出容易導(dǎo)致結(jié)果選擇性偏差、數(shù)據(jù)不完整、不一致以及研究結(jié)果假陽性等數(shù)據(jù)問題[13-15],Christian和Solmaz[16]從生命科學(xué)研究的團(tuán)隊(duì)性以及資助機(jī)構(gòu)、期刊出版等利益相關(guān)者角度分析數(shù)據(jù)管理與監(jiān)督的單一性和薄弱性,還有Arturo等[17]從學(xué)術(shù)發(fā)表焦慮、職業(yè)晉升等評(píng)價(jià)因素角度對(duì)撤稿論文數(shù)據(jù)問題的影響。
(3)生命科學(xué)撤稿論文中的數(shù)據(jù)問題應(yīng)對(duì)策略研究。目前,國(guó)內(nèi)外學(xué)者對(duì)于撤稿問題的對(duì)策研究主要從期刊撤稿管理與學(xué)術(shù)誠(chéng)信管理兩方面展開。針對(duì)數(shù)據(jù)問題引發(fā)的撤稿處理,一方面,站在期刊管理角度,早在1987年,國(guó)際醫(yī)學(xué)期刊編輯委員會(huì)(ICMJE)就提出,應(yīng)對(duì)不宜在文獻(xiàn)資源中繼續(xù)保存的,或有錯(cuò)誤的學(xué)術(shù)論文進(jìn)行撤稿[18]。張維[19]、葉青[20]、Arturo[17]等認(rèn)為期刊應(yīng)采取數(shù)據(jù)可訪問性審核等手段,運(yùn)用數(shù)據(jù)庫、圖片分析軟件開展原始數(shù)據(jù)審查與圖片原創(chuàng)性比對(duì),并制定圖像完整性標(biāo)準(zhǔn),提高數(shù)據(jù)/圖片鑒別力;另一方面,從加強(qiáng)學(xué)術(shù)誠(chéng)信角度,有學(xué)者主張撤稿論文不應(yīng)被移除,而應(yīng)被清晰標(biāo)記,并提供訪問,“去除痕跡只會(huì)幫助不當(dāng)行為研究人員隱藏該行為”[10]。Esmée等[21]指出團(tuán)隊(duì)合作完成的撤稿論文因人員協(xié)調(diào)問題容易出現(xiàn)數(shù)據(jù)管理漏洞,導(dǎo)致嚴(yán)重的數(shù)據(jù)完整性、真實(shí)性問題,應(yīng)對(duì)團(tuán)隊(duì)論文進(jìn)行系統(tǒng)性調(diào)查。李侗桐等[22]進(jìn)一步指出應(yīng)強(qiáng)化科研人員學(xué)術(shù)誠(chéng)信教育,提升對(duì)數(shù)據(jù)問題引發(fā)的學(xué)術(shù)不端行為的防范能力,在項(xiàng)目資助方、科研機(jī)構(gòu)、期刊等實(shí)施科學(xué)數(shù)據(jù)審核策略,識(shí)別和防范各種形式的數(shù)據(jù)造假。
1.2? ? 撤稿與生命科學(xué)數(shù)據(jù)管理關(guān)系
Karp[23]指出,“生物醫(yī)學(xué)數(shù)據(jù)管理是一項(xiàng)昂貴且費(fèi)時(shí)的工作,但也是共享、管理、集成和分析現(xiàn)有數(shù)據(jù)和新數(shù)據(jù)的最佳方法”。撤稿論文中形形色色的數(shù)據(jù)問題,既檢驗(yàn)了生命科學(xué)數(shù)據(jù)管理制度實(shí)施中的現(xiàn)實(shí)困境與不足,也折射出深層次的科學(xué)數(shù)據(jù)管理與學(xué)術(shù)誠(chéng)信之間緊密的內(nèi)在關(guān)聯(lián)。
(1)撤稿揭示了生命科學(xué)數(shù)據(jù)管理的重要性。因數(shù)據(jù)問題引發(fā)撤稿論文數(shù)量的激增,表明數(shù)據(jù)管理及數(shù)據(jù)共享已經(jīng)成為生命科學(xué)基礎(chǔ)設(shè)施的重要組成部分,數(shù)據(jù)采集方法、分析技術(shù)以及計(jì)算工具等有助于研究人員以新的方式和尺度查詢并利用數(shù)據(jù)產(chǎn)生新的數(shù)據(jù)洞察。換言之,“一旦描述了數(shù)據(jù)并進(jìn)行了數(shù)據(jù)融合與分析,就應(yīng)進(jìn)行數(shù)據(jù)管理。完成此操作后,才可以將數(shù)據(jù)公開訪問(共享)或提供再利用[24]”。任一環(huán)節(jié)、任一方面的數(shù)據(jù)管理缺失/疏漏都有可能連帶出研究結(jié)論/方法的偏差,相應(yīng)的論文撤稿在所難免。
(2)撤稿折射了生命科學(xué)數(shù)據(jù)管理規(guī)范的復(fù)雜性。實(shí)驗(yàn)數(shù)據(jù)和研究結(jié)論的再現(xiàn)性、可重復(fù)性問題是引發(fā)各方關(guān)注和論文撤稿的重要因素。現(xiàn)代生命科學(xué)屬于數(shù)據(jù)驅(qū)動(dòng)型交叉科學(xué),基因測(cè)序、遺傳育種等大量生物學(xué)研究建構(gòu)在充分準(zhǔn)確的實(shí)驗(yàn)數(shù)據(jù)基礎(chǔ)之上。同時(shí),數(shù)據(jù)類型的多樣性、術(shù)語邏輯的錯(cuò)綜復(fù)雜以及對(duì)特定實(shí)驗(yàn)環(huán)境、對(duì)象客體的高度依賴,導(dǎo)致實(shí)施標(biāo)準(zhǔn)化數(shù)據(jù)描述、數(shù)據(jù)組織等數(shù)據(jù)管理工作量的激增。BLAUSTEIN[25]對(duì)《PLOS Biology》的調(diào)查發(fā)現(xiàn),研究人員的數(shù)據(jù)共享標(biāo)準(zhǔn)不一,許多人沒有恰當(dāng)?shù)姆椒ū4鎸?shí)驗(yàn)數(shù)據(jù)和成果,這些數(shù)據(jù)問題不僅造成后續(xù)研究的不可復(fù)制,也為論文撤稿埋下了隱患。
(3)撤稿反映了生命科學(xué)數(shù)據(jù)管理制度實(shí)施的脆弱性。“從原始觀察到科學(xué)發(fā)現(xiàn),科研合作中的信息流涉及一系列的轉(zhuǎn)換和簡(jiǎn)化,流程管理中各項(xiàng)分工的無意疏忽或故意改變,都有可能導(dǎo)致撤稿[26]”。如實(shí)驗(yàn)數(shù)據(jù)記錄的不完整、實(shí)驗(yàn)室筆記數(shù)字化缺失或?qū)?shù)據(jù)記錄在過時(shí)的存儲(chǔ)介質(zhì)……,都會(huì)造成數(shù)據(jù)復(fù)用的無效,并引發(fā)數(shù)據(jù)再現(xiàn)危機(jī)。同時(shí),生命科學(xué)數(shù)據(jù)管理制度的實(shí)施還牽涉到多方主體,相關(guān)數(shù)據(jù)活動(dòng)并未完全遵循常規(guī)的數(shù)據(jù)管理線性路徑(如專注于原始數(shù)據(jù)采集和分析的項(xiàng)目可能會(huì)繞過數(shù)據(jù)發(fā)現(xiàn)和整合步驟直接進(jìn)入數(shù)據(jù)發(fā)布和存儲(chǔ)環(huán)節(jié)),需要全員參與數(shù)據(jù)管理,特別是“溝通和集體監(jiān)督可以讓合作者確保數(shù)據(jù)收集、存儲(chǔ)、處理和分析的完整性”[27]。
(4)撤稿凸顯了生命科學(xué)數(shù)據(jù)管理與學(xué)術(shù)誠(chéng)信管理的共生性。數(shù)據(jù)是生命科學(xué)學(xué)術(shù)記錄的關(guān)鍵組成部分,撤稿論文的數(shù)據(jù)組織與利用方式不僅反映出作者的數(shù)據(jù)管理態(tài)度與能力,也對(duì)學(xué)術(shù)誠(chéng)信以及數(shù)據(jù)監(jiān)管、共享和復(fù)用發(fā)揮著不可替代的影響。Tijdink[28]對(duì)315名比利時(shí)生物醫(yī)學(xué)研究人員的調(diào)查發(fā)現(xiàn),出于學(xué)術(shù)發(fā)表和職務(wù)晉升壓力,15%的受訪者承認(rèn)他們?cè)谶^去3年中有偽造、篡改、剽竊或操縱數(shù)據(jù)的嫌疑,數(shù)據(jù)利用行為成為檢驗(yàn)學(xué)術(shù)誠(chéng)信的標(biāo)尺?!霸S多已發(fā)布的科學(xué)數(shù)據(jù)生命周期管理模型反映了基本的學(xué)術(shù)誠(chéng)信原則,如質(zhì)量控制以及隱私和保密的法律/道德問題[29]”。因而,負(fù)責(zé)任的生命科學(xué)研究應(yīng)包含詳細(xì)的數(shù)據(jù)管理計(jì)劃與數(shù)據(jù)管理實(shí)施、檢查與評(píng)估方案。
2? ?基礎(chǔ)生命科學(xué)領(lǐng)域撤稿數(shù)據(jù)分析
2.1? ? 數(shù)據(jù)來源
本研究數(shù)據(jù)來源于Retraction Watch,該網(wǎng)站創(chuàng)建于2010年,旨在關(guān)注科研不端行為,收錄了多個(gè)學(xué)科領(lǐng)域的撤稿文獻(xiàn),基于該數(shù)據(jù)進(jìn)行的相關(guān)研究已經(jīng)得到了學(xué)界的一致認(rèn)可[30-31]。Retraction Watch數(shù)據(jù)庫中基礎(chǔ)生命科學(xué)領(lǐng)域(不含健康、醫(yī)學(xué)),共包含18個(gè)二級(jí)學(xué)科,本研究采集了數(shù)據(jù)庫中基礎(chǔ)生命科學(xué)領(lǐng)域截至2021年4月30日的6146篇學(xué)術(shù)論文撤稿記錄,每條數(shù)據(jù)包括被撤稿論文的標(biāo)題、學(xué)科、期刊、出版商、機(jī)構(gòu)、作者、撤稿原因、原始文獻(xiàn)發(fā)表日期、撤稿日期、國(guó)家10個(gè)字段,對(duì)于部分字段信息缺失的數(shù)據(jù),由人工補(bǔ)齊。
研究首先分析了基礎(chǔ)生命科學(xué)領(lǐng)域撤稿論文原因的總體分布情況,進(jìn)一步從時(shí)間、二級(jí)學(xué)科以及期刊的角度,分析了因數(shù)據(jù)問題撤稿論文的分布特征,最后,對(duì)這些撤稿論文的數(shù)據(jù)問題進(jìn)行細(xì)分。
2.2? ? 撤稿原因分布
一篇論文可能涉及一條或者多條原因被撤,Retraction Watch對(duì)每條撤稿原因均單獨(dú)計(jì)次。通過數(shù)據(jù)整理發(fā)現(xiàn),被撤稿的6146篇學(xué)術(shù)論文共涉及12146條撤稿原因記錄,去除通知不全、通知無法獲取、通知用語模糊等原因不明確的相關(guān)記錄,共獲得撤稿記錄11018條。Retraction Watch用戶指南將撤稿原因歸為100條[32],可以總結(jié)為12個(gè)類別,分別是數(shù)據(jù)、方法與結(jié)果、作者、文章剽竊或重復(fù)發(fā)表、第三方、作者機(jī)構(gòu)、期刊/出版商、版權(quán)、同行評(píng)審、實(shí)驗(yàn)、引用、倫理、法律糾紛等(基礎(chǔ)生命科學(xué)領(lǐng)域12類撤稿原因的統(tǒng)計(jì)分析結(jié)果見表1),從表中可以發(fā)現(xiàn),因圖像和數(shù)據(jù)的錯(cuò)誤、復(fù)制、偽造、不可信、缺失、操縱等造成的數(shù)據(jù)質(zhì)量問題已經(jīng)成為基礎(chǔ)生命科學(xué)領(lǐng)域論文撤稿的首要原因,占撤稿記錄比例達(dá)到了39.30%。
生命科學(xué)研究在復(fù)雜的實(shí)驗(yàn)過程中形成了海量多源異構(gòu)的研究數(shù)據(jù),實(shí)驗(yàn)技術(shù)缺陷、數(shù)據(jù)假陽性及數(shù)理統(tǒng)計(jì)分析過程中方法謬誤等非主觀因素,以及數(shù)據(jù)和圖像的偽造、操縱、剽竊、重復(fù)等學(xué)術(shù)不端行為都會(huì)導(dǎo)致生命科學(xué)論文撤稿。數(shù)據(jù)問題可能是由于數(shù)據(jù)收集不全面、方法操作有誤、結(jié)果分析錯(cuò)誤等造成的假陽性;也可能是實(shí)驗(yàn)描述錯(cuò)漏、不充分等,既涉及數(shù)據(jù)質(zhì)量問題,也包括了數(shù)據(jù)采集描述的標(biāo)準(zhǔn)與處理加工的方法等。
2.3? ? 數(shù)據(jù)問題撤稿論文分布
由于一篇論文可能因多個(gè)原因撤稿,因此,4307條與數(shù)據(jù)相關(guān)的撤稿記錄對(duì)應(yīng)2686篇撤稿論文(基礎(chǔ)生命科學(xué)領(lǐng)域總體撤稿論文及數(shù)據(jù)問題相關(guān)撤稿論文的時(shí)間分布見圖1)。從時(shí)間來看,從2004年起,基礎(chǔ)生命科學(xué)領(lǐng)域論文撤稿數(shù)量開始出現(xiàn)快速增加的趨勢(shì),數(shù)據(jù)問題導(dǎo)致的撤稿與總體撤稿在時(shí)間分布上表現(xiàn)出一致性。從占比角度來看,2008年以來因數(shù)據(jù)問題導(dǎo)致的撤稿占比呈現(xiàn)出波動(dòng)上升的趨勢(shì),特別是在2020年,因數(shù)據(jù)原因造成的撤稿論文達(dá)到了669篇,占基礎(chǔ)生命科學(xué)領(lǐng)域撤稿論文的58.0%。
數(shù)據(jù)問題導(dǎo)致的撤稿在二級(jí)學(xué)科的分布上存在明顯差異。從總量來看,細(xì)胞生物學(xué)、生物化學(xué)、遺傳學(xué)、分析生物學(xué)相關(guān)論文占撤稿總數(shù)的比例較高。這與上述學(xué)科的研究?jī)?nèi)容有關(guān),隨著高通量測(cè)序技術(shù)的發(fā)展和應(yīng)用,上述學(xué)科體現(xiàn)出明顯的數(shù)據(jù)驅(qū)動(dòng)特征,涉及到大量的基因測(cè)序、蛋白質(zhì)結(jié)構(gòu)等研究數(shù)據(jù),具有更高的數(shù)據(jù)管理風(fēng)險(xiǎn)。進(jìn)一步分析各二級(jí)學(xué)科因數(shù)據(jù)問題導(dǎo)致的撤稿比例,可以發(fā)現(xiàn)植物生物學(xué)/植物學(xué)(Plant Biology/Botany)、遺傳學(xué)(Genetics)、細(xì)胞生物學(xué)(Biology-Cellular)、神經(jīng)科學(xué)(Neuroscience)、解剖學(xué)/生理學(xué)(Anatomy/Physiology)、法醫(yī)科學(xué)(Forensic Sciences)、毒理學(xué)(Toxicology)、癌癥生物學(xué)(Biology-Cancer)等二級(jí)學(xué)科數(shù)據(jù)質(zhì)量撤稿論文占比均在50%以上,明顯高于平均水平;而營(yíng)養(yǎng)學(xué)(Nutrition)因數(shù)據(jù)問題導(dǎo)致的撤稿論文占比僅為3.5%,表明各二級(jí)學(xué)科內(nèi)部數(shù)據(jù)問題的表現(xiàn)程度存在差異,相比較而言,依賴大規(guī)模數(shù)據(jù)集的學(xué)科撤稿論文比例相對(duì)較高。
從期刊的角度來看,2686篇數(shù)據(jù)質(zhì)量撤稿論文來源于841個(gè)不同期刊,撤稿論文在15篇及以上的期刊有20個(gè),撤稿論文共972篇,占2686篇撤稿論文的36.19%。進(jìn)一步結(jié)合JCR的期刊分區(qū)域與撤稿時(shí)滯的分析結(jié)果(見圖2),從圖中可以發(fā)現(xiàn),數(shù)據(jù)問題相關(guān)撤稿論文的平均時(shí)滯要高于平均撤稿時(shí)滯,說明數(shù)據(jù)問題相比于其他學(xué)術(shù)不端行為的發(fā)現(xiàn)更具隱蔽性。此外,隨著期刊影響因子的提升,因數(shù)據(jù)問題的撤稿論文數(shù)量增加,撤稿平均時(shí)滯更長(zhǎng),這可能是因?yàn)楦咚狡诳瘬碛懈鼮閲?yán)格、規(guī)范的論文審查和數(shù)據(jù)核驗(yàn)程序,因此其撤稿用時(shí)隨著期刊等級(jí)而提升,撤稿論文數(shù)量也隨之增加。
2.4? ? 撤稿論文數(shù)據(jù)問題分析
與數(shù)據(jù)、圖像相關(guān)的撤稿原因較為復(fù)雜,從數(shù)據(jù)管理角度來看是一個(gè)多維度概念,是一系列數(shù)據(jù)特征的集合,諸多框架中形成了關(guān)于數(shù)據(jù)形式、數(shù)據(jù)內(nèi)容、數(shù)據(jù)效用、數(shù)據(jù)渠道的可獲得性、可理解性、完整性、準(zhǔn)確性、客觀性、可靠性、有效性、有用性、增值性等多層次的質(zhì)量指標(biāo)。從基礎(chǔ)生命科學(xué)領(lǐng)域撤稿論文的數(shù)據(jù)問題的統(tǒng)計(jì)分析結(jié)果(見表2),不難發(fā)現(xiàn),數(shù)據(jù)的準(zhǔn)確性、可靠性和有效性問題與數(shù)據(jù)質(zhì)量撤稿論文高度相關(guān);與準(zhǔn)確性要求相關(guān)的數(shù)據(jù)/圖像操縱、非主觀錯(cuò)誤、不可信等因素導(dǎo)致的撤稿記錄1584篇,占比36.78%;與可靠性要求相關(guān)的數(shù)據(jù)/圖像重復(fù)、偽造和剽竊等導(dǎo)致的撤稿記錄共1538篇,占比35.71%;有效性強(qiáng)調(diào)數(shù)據(jù)的效用,相關(guān)撤稿記錄共1179篇,占比27.37%;數(shù)據(jù)完整性問題出現(xiàn)頻率較低,相關(guān)撤稿記錄僅6篇,占比0.14%。因此總體來看,基礎(chǔ)生命科學(xué)領(lǐng)域撤稿論文的數(shù)據(jù)問題主要集中在準(zhǔn)確性、可靠性和有效性三個(gè)方面。
此外,根據(jù)數(shù)據(jù)問題的產(chǎn)生是否具有主觀故意統(tǒng)計(jì)的結(jié)果(見表3)。從表中可以發(fā)現(xiàn),與數(shù)據(jù)/圖像相關(guān)的2686篇被撤論文中,存在數(shù)據(jù)/圖像的偽造、捏造、重復(fù)利用與剽竊等主觀故意的論文1937條,占比45.97%;由于非主觀故意的謄寫、記錄、分析、計(jì)算錯(cuò)誤導(dǎo)致的撤稿記錄2370條,占比55.03%。兩者的比例大體上相當(dāng)。
3? ?撤稿背后的數(shù)據(jù)管理問題歸因
科研過程中的數(shù)據(jù)問題歷來受到關(guān)注,縱觀生命科學(xué)領(lǐng)域形形色色的撤稿事件,不難發(fā)現(xiàn)撤稿背后掩藏著形式多樣、錯(cuò)綜變幻的數(shù)據(jù)管理問題,其中數(shù)據(jù)不完整、數(shù)據(jù)誤用等非主觀因素導(dǎo)致的撤稿,反映了數(shù)據(jù)管理實(shí)施的薄弱,而數(shù)據(jù)捏造、數(shù)據(jù)篡改等數(shù)據(jù)造假行為實(shí)質(zhì)上是學(xué)術(shù)不端行為的升級(jí)變種。特別是網(wǎng)絡(luò)信息技術(shù)的發(fā)展,如圖片編輯軟件的出現(xiàn),客觀上也為數(shù)據(jù)/圖片修改合成等不當(dāng)數(shù)據(jù)行為提供了便利,有必要從問題歸因角度找出癥結(jié)根源,以便對(duì)癥下藥,制定針對(duì)性改進(jìn)舉措。
3.1? ? 數(shù)據(jù)管理意識(shí)與數(shù)據(jù)管理能力不足
在數(shù)字化時(shí)代,自由而負(fù)責(zé)任的生命科學(xué)研究需要研究人員及相關(guān)主體擁有敏銳的數(shù)據(jù)意識(shí)和較高的數(shù)據(jù)開發(fā)利用能力,以保障人們公平獲取生命科學(xué)數(shù)據(jù)、信息和其它研究資源。但在現(xiàn)實(shí)中,“對(duì)于大多數(shù)生物學(xué)家來說,公共數(shù)據(jù)的計(jì)算和統(tǒng)計(jì)分析(如跨多個(gè)研究的元分析)在技術(shù)上仍然具有挑戰(zhàn)性。如對(duì)于缺乏生物信息學(xué)培訓(xùn)的生物學(xué)家來說,獲得或匹配基因表達(dá)特征的能力在很大程度上仍遙不可及”[33]。美國(guó)的一項(xiàng)調(diào)查發(fā)現(xiàn),很多人缺乏發(fā)現(xiàn)數(shù)據(jù)、識(shí)別數(shù)據(jù)集以進(jìn)行恰當(dāng)分析以及確定數(shù)據(jù)質(zhì)量等技能[34]。許多撤稿事件當(dāng)事人在撤稿聲明中承認(rèn)了數(shù)據(jù)加工處理能力不足、管理不規(guī)范的問題,可見,要真正降低撤稿事件的發(fā)生,需要生命科學(xué)數(shù)據(jù)管理文化以及數(shù)據(jù)技能培訓(xùn)的普及和提升。
3.2? ? 數(shù)據(jù)管理制度不完善
“現(xiàn)代數(shù)據(jù)管理的目標(biāo)不僅僅是簡(jiǎn)單地用電子筆記本取代實(shí)驗(yàn)室筆記本,而是要?jiǎng)?chuàng)建一個(gè)復(fù)雜的、內(nèi)部一致的、可擴(kuò)展的數(shù)據(jù)管理制度體系,該體系將不同個(gè)人在不同設(shè)備上進(jìn)行的各種實(shí)驗(yàn)數(shù)據(jù)進(jìn)行集成并提供利用”[35]。撤稿聲明中提到的數(shù)據(jù)記錄錯(cuò)誤、實(shí)驗(yàn)描述偏差以及標(biāo)準(zhǔn)使用不一等問題,反映出深層次生命科學(xué)數(shù)據(jù)管理制度體系建設(shè)尚不能滿足和適應(yīng)生命科學(xué)研究發(fā)展的現(xiàn)實(shí)需要,還存在著一定程度的制度遺漏。集中表現(xiàn)在以下兩方面:
(1)術(shù)語、格式等數(shù)據(jù)管理標(biāo)準(zhǔn)與規(guī)范的統(tǒng)一問題。生命科學(xué)標(biāo)準(zhǔn)體系復(fù)雜,僅術(shù)語標(biāo)準(zhǔn)就有多種形式,“從可控詞表、術(shù)語表、分類詞表、敘詞表到本體,其形式化程度逐漸增強(qiáng),功能逐步豐富,復(fù)雜度也大幅度提升[36]”,加之生物醫(yī)學(xué)本體本身有較大的異質(zhì)性,本體間術(shù)語的映射關(guān)系錯(cuò)綜復(fù)雜,為用戶標(biāo)準(zhǔn)術(shù)語的使用帶來了困惑。同時(shí),并非所有的數(shù)據(jù)類型都有規(guī)范的定義標(biāo)準(zhǔn),需要重新注釋大量現(xiàn)有數(shù)據(jù)?!凹词乖谀承┳宇I(lǐng)域(如系統(tǒng)生物學(xué))具有標(biāo)準(zhǔn)化的數(shù)據(jù)表,選擇標(biāo)準(zhǔn)格式來描述數(shù)據(jù)和元數(shù)據(jù)也不是那么容易,許多現(xiàn)有標(biāo)準(zhǔn)非常復(fù)雜,難以適應(yīng)并且容易出現(xiàn)錯(cuò)誤陳述”[37]。如果沒有使用標(biāo)準(zhǔn)化的數(shù)據(jù)標(biāo)識(shí),可能會(huì)造成數(shù)據(jù)丟失或數(shù)據(jù)理解的誤用,進(jìn)而難以實(shí)現(xiàn)研究成果的再現(xiàn)與復(fù)用,直至論文撤稿。
(2)數(shù)據(jù)規(guī)范執(zhí)行的操作性規(guī)則不健全,數(shù)據(jù)評(píng)估與檢查監(jiān)督制度缺位。論文的數(shù)據(jù)質(zhì)量展現(xiàn)了生成它們的生命科學(xué)理論應(yīng)用和實(shí)驗(yàn)條件以及處理數(shù)據(jù)的程序方法。鑒于生命科學(xué)研究過程中的數(shù)據(jù)管理涉及到實(shí)驗(yàn)設(shè)計(jì)、樣本采集狀態(tài)、實(shí)驗(yàn)方法、實(shí)驗(yàn)儀器、數(shù)據(jù)采集與加工、分析方法與存儲(chǔ)公開等多個(gè)流程,每個(gè)流程又觸及更多更為細(xì)致的數(shù)據(jù)環(huán)節(jié),需要有健全完善的實(shí)施方案或數(shù)據(jù)規(guī)范來具體引導(dǎo)各類人員的數(shù)據(jù)行為。如面對(duì)數(shù)據(jù)環(huán)境的豐富性,“僅通過對(duì)數(shù)據(jù)進(jìn)行匿名化或征得用戶的同意使用數(shù)據(jù)就不能可靠地保護(hù)隱私[29]”,需要在數(shù)據(jù)采集、加工與發(fā)布共享的各個(gè)操作性層面制定相應(yīng)的隱私安全保護(hù)條款。再如因?qū)嶒?yàn)注釋不足而引發(fā)的撤稿論文,不僅要有嚴(yán)格的實(shí)驗(yàn)室數(shù)據(jù)管理規(guī)則,“而且還需要開發(fā)易于使用的實(shí)驗(yàn)注釋工具,以實(shí)現(xiàn)更好的可重復(fù)性[38]?!?/p>
3.3? ? 數(shù)據(jù)主體責(zé)任機(jī)制不健全
有效的數(shù)據(jù)管理源自各方主體的數(shù)據(jù)共識(shí)與履職約束,生命科學(xué)領(lǐng)域的數(shù)據(jù)管理制度的執(zhí)行源于研究人員、資助機(jī)構(gòu)、科研管理部門以及期刊等多主體的共同努力。盡管相關(guān)機(jī)構(gòu)已經(jīng)發(fā)布一系列數(shù)據(jù)管理制度,從項(xiàng)目申請(qǐng)的數(shù)據(jù)管理計(jì)劃制定到各研究機(jī)構(gòu)的《科學(xué)數(shù)據(jù)管理規(guī)定》乃至期刊的《數(shù)據(jù)提交規(guī)范》等,但不同主體在數(shù)據(jù)管理責(zé)任的實(shí)施中仍存在較大偏差,未形成多主體數(shù)據(jù)管理的協(xié)同合作機(jī)制。
(1)科研團(tuán)隊(duì)未能實(shí)現(xiàn)數(shù)據(jù)管理的團(tuán)隊(duì)合作。從實(shí)證比較中發(fā)現(xiàn),生命科學(xué)撤稿論文絕大多數(shù)為團(tuán)隊(duì)合作成果,少數(shù)涉及兩個(gè)作者,多數(shù)為三到六位合作者[10]。“發(fā)表文章的作者數(shù)量反映了生物醫(yī)學(xué)研究的復(fù)雜性,需要多專業(yè)知識(shí)和合作機(jī)制來增加樣本量和提高研究的普遍性[39]”,因而也增加了數(shù)據(jù)管理的協(xié)同性要求,即從實(shí)驗(yàn)設(shè)計(jì)到從實(shí)驗(yàn)材料中提取有價(jià)值數(shù)據(jù)、對(duì)數(shù)據(jù)進(jìn)行分析、圖片編輯和撰寫論文的所有環(huán)節(jié),由研究設(shè)計(jì)者、實(shí)驗(yàn)觀察記錄者、數(shù)據(jù)采集者、數(shù)據(jù)統(tǒng)計(jì)與分析人員、研究人員以及實(shí)驗(yàn)設(shè)備技術(shù)人員等不僅組成了一個(gè)緊密的合作研究網(wǎng)絡(luò),同時(shí)也承擔(dān)著相應(yīng)的數(shù)據(jù)記錄、描述、采集與加工管理職責(zé)。但從實(shí)際執(zhí)行來看,相較于團(tuán)隊(duì)科研攻關(guān)的一致性,數(shù)據(jù)管理職責(zé)分散、缺乏統(tǒng)一協(xié)調(diào)組織等現(xiàn)象尤為突出,導(dǎo)致個(gè)別人員的數(shù)據(jù)造假行為未能及時(shí)發(fā)現(xiàn)和制止。
(2)項(xiàng)目資助機(jī)構(gòu)、高校/研究機(jī)構(gòu)以及期刊等部門未能形成數(shù)據(jù)管理合力。目前,相關(guān)主體對(duì)數(shù)據(jù)行為的約束主要通過研究人員的主動(dòng)報(bào)備來體現(xiàn),如提交數(shù)據(jù)管理計(jì)劃、隱私保護(hù)知情同意書、論文相關(guān)數(shù)據(jù)資料等,既存在著部門內(nèi)部數(shù)據(jù)管理形式單一、手段粗放的問題,也存在著部門間數(shù)據(jù)管理的各自為政與職責(zé)推諉現(xiàn)象。如許多高校/研究機(jī)構(gòu)依賴學(xué)術(shù)期刊評(píng)估研究成果及價(jià)值,進(jìn)而將數(shù)據(jù)管理與學(xué)術(shù)誠(chéng)信管理責(zé)任轉(zhuǎn)讓給了學(xué)術(shù)期刊,使得“期刊編輯在學(xué)術(shù)交流中居核心地位,在確保其出版記錄誠(chéng)信方面具有最重要的作用”[40]。事實(shí)上,“盡管生物學(xué)期刊已經(jīng)開始要求作者提供數(shù)據(jù),但通常是在審閱者專門要求提供數(shù)據(jù)時(shí)才這樣做[24]”。對(duì)于期刊而言,發(fā)現(xiàn)和糾正投稿論文的圖像/數(shù)據(jù)問題既費(fèi)錢又費(fèi)時(shí),即便在出版前增加了圖像篩選、數(shù)據(jù)審核環(huán)節(jié),限于資源和人力仍無法獨(dú)自履行數(shù)據(jù)管理的核驗(yàn)、評(píng)估職責(zé)?!渡锘瘜W(xué)雜志》(Journal of Biological Chemistry)自2017年起就聘請(qǐng)專職人員負(fù)責(zé)圖像審核,而有關(guān)圖像復(fù)制、剽竊或操縱引發(fā)的撤稿現(xiàn)象仍難以杜絕[41]。
3.4? ? 數(shù)據(jù)管理過程監(jiān)督不到位
負(fù)責(zé)任的數(shù)據(jù)管理需要有持續(xù)的數(shù)據(jù)檢查與監(jiān)督評(píng)估環(huán)節(jié)。Howe[42]指出,“在建立數(shù)據(jù)管理的正式流程方面,生物學(xué)(35%)處于較低水平”。對(duì)生命科學(xué)數(shù)據(jù)采集、匯聚、存儲(chǔ)、加工等全生命周期管理與檢查監(jiān)督缺乏有效實(shí)施是導(dǎo)致撤稿論文數(shù)據(jù)問題的重要誘因。其中,項(xiàng)目首席科學(xué)家數(shù)據(jù)管理總體職責(zé)的落實(shí)問題不容忽視,如諾貝爾獎(jiǎng)獲得者Laureate David Baltimore因未跟蹤檢查其博士后實(shí)驗(yàn)數(shù)據(jù)的收集與分析而導(dǎo)致的多篇論文撤稿與學(xué)術(shù)誠(chéng)信調(diào)查[43]。由于大多數(shù)生物醫(yī)學(xué)實(shí)驗(yàn)主要由研究生、博士后或技術(shù)人員充當(dāng)主體來完成,一旦首席科學(xué)家以及其他項(xiàng)目組成員間的數(shù)據(jù)/圖像核驗(yàn)檢查不到位,即數(shù)據(jù)管理的第一道防線缺失,論文寫作中的數(shù)據(jù)/圖像造假與誤用就在所難免。因?yàn)?,?duì)于那些出現(xiàn)數(shù)據(jù)不當(dāng)行為或產(chǎn)生可疑數(shù)據(jù)結(jié)果的人員而言,嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)審計(jì)與過程監(jiān)督既是必要的撤稿防范舉措也是有益的數(shù)據(jù)素養(yǎng)與學(xué)術(shù)誠(chéng)信教育。當(dāng)然,實(shí)驗(yàn)數(shù)據(jù)生產(chǎn)加工過程與結(jié)果的公開透明也是數(shù)據(jù)管理參與和監(jiān)督的有益補(bǔ)充,但 “由于工作流程(數(shù)據(jù)提取、選擇、操作、分析和報(bào)告)通常沒有公開,通常無法檢查已發(fā)布結(jié)果的有效性[44]”,高質(zhì)量數(shù)據(jù)管理的檢查監(jiān)督仍然十分薄弱。
3.5? ? 數(shù)據(jù)管理激勵(lì)約束手段不完善
撤稿論文中的數(shù)據(jù)問題促使人們重新思考如何完善數(shù)據(jù)管理的激勵(lì)與約束。目前,期刊發(fā)表以及論文和數(shù)據(jù)發(fā)布后的引用已成為研究人員加強(qiáng)數(shù)據(jù)管理和共享數(shù)據(jù)的主要推動(dòng)力。eLife的調(diào)查顯示,人們不愿意公開數(shù)據(jù)的主要原因包括沒有任何激勵(lì)機(jī)制促使他們花費(fèi)時(shí)間和精力分享數(shù)據(jù),數(shù)據(jù)過于復(fù)雜而不知該如何分享,對(duì)數(shù)據(jù)質(zhì)量、知識(shí)產(chǎn)權(quán)的擔(dān)憂等[45]??梢?,除學(xué)術(shù)發(fā)表外,總體上依然缺乏有效數(shù)據(jù)管理與數(shù)據(jù)貢獻(xiàn)的衡量標(biāo)準(zhǔn),包括對(duì)研究過程中數(shù)據(jù)管理的可持續(xù)資助不足,未能減輕相關(guān)人員數(shù)據(jù)管護(hù)的成本負(fù)擔(dān),客觀上有可能導(dǎo)致數(shù)據(jù)管理的不作為。為此,美國(guó)國(guó)家科學(xué)基金會(huì)下屬的科學(xué)研究學(xué)會(huì)在其數(shù)據(jù)管理工作坊活動(dòng)中建議設(shè)立數(shù)據(jù)共享獎(jiǎng),以提高高質(zhì)量數(shù)據(jù)存檔和共享的知名度和認(rèn)可度[46]。同時(shí),除嚴(yán)重?cái)?shù)據(jù)造假引發(fā)大規(guī)模撤稿和學(xué)術(shù)不端的懲處外,對(duì)于數(shù)據(jù)誤用等問題并沒有相應(yīng)的數(shù)據(jù)管理責(zé)任追懲制度,包括撤稿聲明的模棱兩可,容易使人產(chǎn)生診療過失致死要追究責(zé)任,而數(shù)據(jù)造假?zèng)]有責(zé)任成本的錯(cuò)覺。
4? ?啟示與思考
“我們生成復(fù)雜、海量數(shù)據(jù)的能力已經(jīng)超過了我們存儲(chǔ)、管理和使用數(shù)據(jù)的能力[47]”。論文撤稿的數(shù)據(jù)問題不僅反映了當(dāng)前生命科學(xué)數(shù)據(jù)管理的薄弱與不足,也揭示出學(xué)術(shù)誠(chéng)信與數(shù)據(jù)管理二者之間緊密交織、互為促進(jìn)的依存關(guān)系,促使我們從科學(xué)研究的本質(zhì)與學(xué)術(shù)誠(chéng)信管理的更廣闊視角來理性看待和分析生命科學(xué)數(shù)據(jù)管理問題:即科學(xué)研究過程以及結(jié)果的數(shù)據(jù)公開與共享有助于防范各類數(shù)據(jù)問題引發(fā)的撤稿現(xiàn)象,有效的數(shù)據(jù)管理既是負(fù)責(zé)任的科學(xué)研究行為的應(yīng)有之義,也是保障學(xué)術(shù)誠(chéng)信的重要組成部分(見圖3)。
當(dāng)前,生命科學(xué)數(shù)據(jù)以前所未有的速度和數(shù)量產(chǎn)生和傳播,迫切需要有健全完善的數(shù)據(jù)管理制度和規(guī)范統(tǒng)一的數(shù)據(jù)管理標(biāo)準(zhǔn),還需將數(shù)據(jù)管理貫穿于生命科學(xué)數(shù)據(jù)生成、利用、存儲(chǔ)等所有階段,以挖掘數(shù)據(jù)背后的規(guī)律,加速推動(dòng)生命科學(xué)研究的創(chuàng)新,并從數(shù)據(jù)管理的源頭杜絕數(shù)據(jù)造假等學(xué)術(shù)不端行為和撤稿事件的發(fā)生。同時(shí),對(duì)學(xué)術(shù)不端行為的審查,包括對(duì)撤稿論文的及時(shí)處理,一定程度上也是對(duì)生命科學(xué)數(shù)據(jù)管理結(jié)果的糾正和約束行為的補(bǔ)充,從而推動(dòng)了良好數(shù)據(jù)共享生態(tài)的營(yíng)造,有利于生命科學(xué)數(shù)據(jù)管理工作的開展。
2007 年,美國(guó)國(guó)家自然科學(xué)基金會(huì)發(fā)布的《面向21世紀(jì)科學(xué)研究的信息化基礎(chǔ)設(shè)施》報(bào)告中指出“未來美國(guó)科學(xué)和工程上的國(guó)際領(lǐng)先地位將越來越取決于在數(shù)字化科學(xué)數(shù)據(jù)開發(fā)利用方面的優(yōu)勢(shì),取決于通過成熟的數(shù)據(jù)挖掘、集成、分析和可視化工具將其轉(zhuǎn)換為信息和知識(shí)的能力”[48]。包括生命科學(xué)數(shù)據(jù)在內(nèi)的科學(xué)數(shù)據(jù)管理已經(jīng)受到國(guó)內(nèi)外各界的高度重視,撤稿論文中的數(shù)據(jù)問題表明,生命科學(xué)數(shù)據(jù)管理的有效實(shí)施還需要從系統(tǒng)性角度,如相關(guān)主體數(shù)據(jù)責(zé)任的履職監(jiān)督、學(xué)術(shù)誠(chéng)信管理制度、數(shù)據(jù)共享激勵(lì)約束機(jī)制等深入尋找解決問題的答案與對(duì)策。
近幾年來,我國(guó)生命科學(xué)領(lǐng)域論文撤稿情況屢見不鮮,2018年,國(guó)家衛(wèi)健委制定了《醫(yī)學(xué)期刊編輯出版?zhèn)惱硪?guī)范》,提倡期刊建立規(guī)范的倫理政策和學(xué)術(shù)不端行為處理流程,包括規(guī)范的撤稿機(jī)制??傮w而言,加強(qiáng)研究人員的數(shù)據(jù)素養(yǎng)培訓(xùn),強(qiáng)化學(xué)術(shù)誠(chéng)信教育,完善數(shù)據(jù)管理標(biāo)準(zhǔn)和制度,“建設(shè)符合我國(guó)科研人員和數(shù)據(jù)管理人員數(shù)據(jù)管理流程和數(shù)據(jù)建設(shè)環(huán)境,是提升生物醫(yī)學(xué)領(lǐng)域數(shù)據(jù)質(zhì)量的重要前提和支撐條件[54]”,也是根除學(xué)術(shù)不端、規(guī)避撤稿事件發(fā)生的可行要素。
參考文獻(xiàn):
[1]? 魏眾,蔣穎.中國(guó)人文社會(huì)科學(xué)學(xué)術(shù)期刊撤稿問題研究[J].澳門理工學(xué)報(bào),2020(4):122-133.
[2]? Steen R G,Casadevall A,F(xiàn)ang F C.Why Has the Number of Scientific Retractions Increased?[J].PLoS ONE,2013,8(7):e68397.
[3]? 哈佛大牛被瘋狂撤稿31篇,心肌干細(xì)胞領(lǐng)域要涼?[EB/OL].[2020-05-01].http://iras.lib.whu.edu.cn:8080/rwt/401/https/P75YPLC/sohu.com/a/260243674_100293365.
[4]? Fang F C,Steen R G,Casadevall A.Misconduct accounts for the majority of retracted scientific publications[J].Proc Natl Acad Sci USA,2012,109(42):17028-17033.
[5]? Findings and Consequences of Research Misconduct[EB/OL].[2021-05-31].https://ori.hhs.gov/education/products/RIandImages/misconduct_cases/findings_of_misconduct.pdf.
[6]? 韓磊.2010-2019年中國(guó)生物醫(yī)學(xué)論文的撤稿趨勢(shì)及學(xué)術(shù)不端演變特征[J].中國(guó)科技期刊研究,2021,32(2):158-165.
[7]? Elisabeth,M,Bik,et al.The Prevalence of Inappropriate Image Duplication in Biomedical Research Publications[J/OL].[2021-05-31].https://mbio.asm.org/content/7/3/e00809-16.
[8]? Rossner M,Hill E E.Show me the data[J].The Journal of Cell Biology,2007,179(6):1091-1092.
[9]? Fecher B,F(xiàn)riesike,S,Hebing M.What drives academic data sharing?[J/OL].[2021-05-31].https://pubmed.ncbi.nlm.nih.gov/25714752/.
[10]? IsabelCampos-Varela,AlbertoRuano-Ravi?觡a.Misconduct as the main cause for retraction.A descriptive study of retracted publications and their authors[J].Gaceta Sanitaria,2019,33(4):356-360.
[11]? Tijdink J K,Smulders Y M,Vergouwen A,et al.The assessment of publication pressure in medical science;validity and reliability of a Publication Pressure Questionnaire(PPQ)[J].Quality of Life Research,2014,23(7):2055-2062.
[12]? Nair S,Yean C,Yoo J,et al.Reasons for article retraction in anesthesiology:a comprehensive analysisRaisons justifiant la rétractation d'un article en anesthésiologie: une analyse exhaustive[J].Canadian Journal of Anaesthesia,2019(67):57-63.
[13]? Ioannidis JPA.Why most published research findings are false[J].PLoS Med,2005;2(8):e124.
[14]? Borisas B,Ramona B,Benoit B,et al.Minimizing proteome redundancy in the UniProt Knowledgebase[EB/OL].[2021-05-31].https://academic.oup.com/database/article/doi/10.1093/database/baw139/2742069#.
[15]? Casadevall A,Steen R G,F(xiàn)ang F C.Sources of error in the retracted scientific literature[J].Faseb Journal Official Publication of the Federation of American Societies for Experimental Biology,2014,28(9):3847.
[16]? ChristianBerggren,Solmaz FilizKarabag.Scientific misconduct at an elite medical institute:The role of competing institutional logics and fragmented control[J].Research Policy,2019,48(2):428-443.
[17]? Arturo,Casadevall,Lee,et al.A Framework for Improving the Quality of Research in the Biological Sciences[J].mBio,2016,7(4):e01256-16.
[18]? 姜天華,陳靜,耿波,等.數(shù)據(jù)庫中關(guān)于撤銷論文處理的實(shí)證分析——PubMed數(shù)據(jù)庫與國(guó)內(nèi)數(shù)據(jù)庫的對(duì)比[J].中國(guó)科技期刊研究,2014,25(5):616-619.
[19]? 張維,吳培紅,汪勤儉,等.國(guó)內(nèi)外生物醫(yī)學(xué)期刊撤稿規(guī)范分析及應(yīng)對(duì)學(xué)術(shù)不端行為的防范策略[J].編輯學(xué)報(bào),2020,32(3):251-256.
[20]? 葉青,林漢楓,張?jiān)录t.圖片中學(xué)術(shù)不端的類型與防范措施[J].編輯學(xué)報(bào),2019,31(1):45-50.
[21]? An investigation of seven other publications by the first author of a retracted paper due to doubts about data integrity[J].European Journal of Obstetrics & Gynecology and Reproductive Biology,2021,261(6):236-241.
[22]? 李侗桐,馮秋蕾,韓鴻賓.科技論文偽造數(shù)據(jù)的識(shí)別與防范[J].中國(guó)科技期刊研究,2019(8):827-831.
[23]? Karp P D.How much does curation cost?[J].Database the Journal of Biological Databases & Curation,2016(110):1-2.
[24]? Renaut S,AE Budden,Gravel D,et al.Management,Archiving,and Sharing for Biologists and the Role of Research Institutions in the Technology-Oriented Age[J].BioScience,2018,68(6):400-411.
[25]? BLAUSTEIN,RICHARD.Reproducibility Undergoes Scrutiny[J].Bioscience,2014,64(4):368.
[26]? Latour B,Woolgar S.Laboratory Life: The Construction of Scientific Facts[J].Medical History,1986,25(3):341-342.
[27]? Resnik David B,Smith Elise M,Chen Stefanie H.What is Recklessness in Scientific Research The Frank Sauer Case[J].ACCOUNTABILITY IN RESEARCH-POLICIES AND QUALITY ASSURANCE2017(24):497-502.
[28]? Tijdink J K,Verbeke R,Smulders Y M.Publication pressure and scientific misconduct in medical scientists[J].J Empir Res Hum Res Ethics,2014,9(5):64-71.
[29]? Gundersen L C.SCIENTIFIC INTEGRITY AND ETHICAL CONSIDERATIONS FOR THE RESEARCH DATA LIFE CYCLE[M].John Wiley & Sons,Inc,2017.
[30]? R Dal-Ré,Ayuso C.Reasons for and time to retraction of genetics articles published between 1970 and 2018[J].Journal of Medical Genetics,2019,56(11):734-740.
[31]? M D Ribeiro,Vasconcelos S.Correction to:Retractions covered by Retraction Watch in the 2013-2015period:prevalence for the most productive countries[J].Scientometrics,2018(114):719-734.
[32]? Retraction Watch Database User Guide Appendix B:Reasons[EB/OL].[2021-04-23].https://retractionwatch.com/retraction-watch-database-user-guide/retraction-watch-database-user-guide-appendix-b-reasons/.
[33]? Sparks R,Lau W W,Tsang J S.Expanding the Immunology Toolbox:Embracing Public-Data Reuse and Crowdsourcing[J].Immunity,2016,45(6):1191-1204.
[34]? Curty R G,Crowston K,Specht A,et al.Attitudes and norms affecting scientists' data reuse[J].PLOS ONE,2017,12(12):e0189288.
[35]? Matthew,D,Zimmerman,et al.Data Management in the Modern Structural Biology and Biomedical Research Environment[J].Structural Genomics and Drug Discovery,2014(1140):1-25.
[36]? 朱彥,賈李蓉,高博,等.中醫(yī)臨床術(shù)語系統(tǒng)v2.0設(shè)計(jì)與構(gòu)建[J].中國(guó)中醫(yī)藥圖書情報(bào)雜志,2018,42(3):10-15.
[37]? Figueiredo S.Data Sharing: Convert Challenges into Opportunities[J].Frontiers in Public Health,2017,5(4):327.
[38]? Rung J,Brazma A.Reuse of public genome-wide gene expression data[J].Nature Reviews Genetics,2013,14(2):89-99.
[39]? Christopher King.Multiauthor Papers:Onward and Upward[J/OL].[2021-05-31].https://archive.annual-report.thomsonreuters.com/2012/_files/pdf/MultiauthorPapers_ChrisKing.pdf.
[40]? Marusic A,Katavic V,Marusic M.Role of editors and journals in detecting and preventing scientific misconduct: Strengths,weaknesses,opportunities,and threats[J].Medicine and law,2007,26(3):545-566.
[41]? McCook A.Job alert:biology society hiring editors to screen images[EB/OL].[2021-05-31].http://retractionwatch.com/2017/04/21/job-alert-biology-society-hiring-editors-screen-images/.
[42]? Howe N,Giles E,Newbury-Birch D,et al.Systematic review of participants' attitudes towards data sharing:a thematic synthesis[J].Journal of Health Services Research & Policy,2018,23(2):123-133.
[43]? D E Chubin,E J Hackett.Peerless Science[M].State University of New York Press,Albany,NY,1990:267.
[44]? Malika I,Winney I S,Anna K,et al.Striving for transparent and credible research:practical guidelines for behavioral ecologists[J].Behavioral Ecology,2017,28(2):348-354.
[45]? Understanding the demand for reproducible research articles[EB/OL].[2021-05-31].https://elifesciences.org/inside-elife/e832444e/innovation-unde rstanding-the-demand-for-reproducible-researcharticles.
[46]? Jane Maienschein,John N Parker,Manfred Laubichler and Edward J.Hackett[J].Data Management and Data Sharing in Science and Technology Studies.Science,Technology,& Human Values,2019,44(1):143-160.
[47]? Coates H.Ensuring research integrity:The role of data management in current crises[J].College & Research Libraries News,2014,75(11):598-601.
[48]? Cyberinfrastructure vision for 21st century discovery[EB/OL].[2021-05-31].https://www.nsf.gov/pubs/2007/nsf0728/nsf0728.pdf,2007.
[49]? 楊嘯林,楊晟,潘虹潔,等.FAIR準(zhǔn)則與生物醫(yī)學(xué)數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)用服務(wù)[J].中國(guó)醫(yī)學(xué)倫理學(xué),2020,33(2):153-159.
作者簡(jiǎn)介:管茜,女,武漢大學(xué)信息管理學(xué)院碩士研究生;董克,男,武漢大學(xué)信息管理學(xué)院副教授,研究方向:文獻(xiàn)計(jì)量與科學(xué)評(píng)價(jià);夏義堃,女,武漢大學(xué)信息資源研究中心教授,研究方向:政府?dāng)?shù)據(jù)治理。