汪慶 任慧玲
(中國醫(yī)學科學院醫(yī)學信息研究所,北京 100005)
傳統(tǒng)的商業(yè)出版模式完全基于訂閱,科學家需要付費才能獲取研究成果,這種模式阻礙了學術研究成果的開放共享。開放獲取運動的興起雖然極大地推動了學術研究成果的開放共享,但其論文處理費(Article Processing Charge,APC)對于缺乏資金的作者來說仍是一種負擔,因此這種模式并不完美[1]。在此情形下,預印本的出現(xiàn)開辟了科學出版的開放獲取新模式[2],開放獲取中一種新的學術交流形式開始出現(xiàn)。預印本是作者未向期刊投稿之前,未經(jīng)同行評議的文章手稿[3-4]。自1991年第一個預印本平臺arXiv發(fā)布以來,預印本已經(jīng)歷了30年的發(fā)展。據(jù)不完全統(tǒng)計,目前已經(jīng)出現(xiàn)了60多個可用的預印本平臺,幾乎覆蓋各個學科領域[5]。隨著新型冠狀病毒肺炎(COVID-19)的大流行和公共衛(wèi)生危機的出現(xiàn),快速發(fā)布、可免費獲取的預印本對于了解和評估有關新型冠狀病毒肺炎及其影響的新信息至關重要,預印本平臺無出版時滯、傳播速度快、避免同行評審偏見等優(yōu)點進一步凸顯。據(jù)《自然》雜志2020年相關研究顯示,科學家們經(jīng)常借助預印本發(fā)布與COVID-19和SARS-CoV-2相關的研究[6]。
從20世紀中期開始,期刊一直是學術交流的第一大主要類型。但隨著預印本平臺的出現(xiàn),這種傳統(tǒng)的學術交流生態(tài)系統(tǒng)將被打破。傳統(tǒng)出版模式下,文章只有經(jīng)同行評審后才能被引用;而預印本一經(jīng)發(fā)布就可以被引用、下載和評論,且目前主流的預印本平臺大都可鏈接到多個社交網(wǎng)絡和工具,傳播范圍更廣、傳播速度更快,提升了作者的影響力和話語權,加速了學科研究進程。預印本促進了一個開放融合、公平公開、互動快捷的普惠型學術交流新模式的形成[7-9]。如2015年,科學家Daniel MacArthur發(fā)布了其正在研究的預印本文章,其預印本研究成果一經(jīng)發(fā)布,10個月就被瀏覽了300萬次。斯坦??茖W家Stephen Quake表示如果一份預印本能給兩個生物學者提出新的思路,那么與沒有預印本相比,10年內(nèi)這個行業(yè)科學進展就會快5倍[2,10-12]。隨著主流出版商對預印本文獻的接受和認可,預印本勢必成為未來科學家開展學術交流的重要工具和平臺。
為準確地評估預印本的總體出版態(tài)勢,筆者通過Dimension平臺檢索并獲取相關數(shù)據(jù)。Dimensions是Digital Science推出的一個新型的科研搜索引擎,集成了包括PubMed、DOAJ、出版社等在內(nèi)的主流出版商、數(shù)據(jù)庫和第三方平臺的期刊論文、圖書和預印本、數(shù)據(jù)集、專利、基金項目、政策文檔等信息,并針對開放獲取、預印本等不同類型的文獻給以明確的標識。筆者在Dimensions平臺上調(diào)研發(fā)現(xiàn),截至2021年6月,該平臺共收錄各類文獻信息約1.2億條,其中預印本文獻約占2.3%。
統(tǒng)計分析Dimensions平臺上2011—2020年各類文獻的發(fā)展態(tài)勢發(fā)現(xiàn),預印本文獻在所有文獻(包括期刊、圖書、會議)中所占的比例較低,但是占比呈逐年增長態(tài)勢(見表1)。2011年預印本文獻僅10萬余篇,在所有文獻中占比僅為2.85%;2020年高達37萬余篇,是2011年的3倍多,在所有文獻中占比開始將近6%。從預印本文獻的年增長率來看,2011—2015年預印本的發(fā)展較為平穩(wěn),年增長率均未超過11%;從2016年開始進入快速發(fā)展階段,預印本文獻年增長率從2016年的17.48%提高至2019年的41.37%,這個增長率遠高于全部文獻的增長率(未到10%)。
表1 Dimension平臺上各類文獻出版占比
在過去10年中,預印本平臺獲得快速發(fā)展。根據(jù)Dimension平臺上不同預印本平臺收錄的文獻數(shù)量在整個預印本文獻中的占比進行排序發(fā)現(xiàn),目前數(shù)量最多的預印本平臺為arXiv(1 882 535篇,占比70%);其次為SSRN(436 725篇,占比16%)、bioRxiv(123 211篇,占比4.58%)、Research Square(45 332篇,占比1.69%)、OSF Preprint(33 705篇,占比1.25%)、Preprint.org(23 239篇,占比0.86%)、MedRxiv(20 635篇,占比0.77%)、ChemRxiv(19 743篇,占比0.73%)。統(tǒng)計與COVID-19相關的預印本文獻發(fā)現(xiàn),與此相關的文獻主要分布在MedRxiv(12 674篇,28.91%)、SSRN(8 126篇,占比18.54%)上,二者收錄的文獻量將近一半;其次為arXiv(4 260篇,占比9.72%)和bioRxiv(4 024篇,占比9.18%)。其中,第一大預印本平臺arXiv是1991年康奈爾大學(Cornell University)建立的一個開放獲取知識庫,也是最早的預印本平臺,該平臺最初起源于高能物理學,目前已擴展到多個學科領域,包括定量生物學、計量金融學、統(tǒng)計數(shù)據(jù)、電氣工程與系統(tǒng)科學、經(jīng)濟學等。為更好地推進科學傳播的創(chuàng)新,加強與計算和信息科學界的聯(lián)系,2019年arXiv轉由康奈爾大學計算機與信息科學(CIS)運營[13-14]。第二大預印本平臺SSRN,即社會科學研究網(wǎng),成立于1994年,于2016年5月被出版巨頭Elsevier收購,最初專注于人文科學、人文法律領域,后來業(yè)務逐漸擴張至應用科學、健康科學、生命科學、物理科學。兩大主流預印本平臺成立時間較早,且學科覆蓋范圍較廣。其他的綜合性預印本平臺還包括Research Square、OSF Preprint、Preprint.org。Research Square是2018年成立的一個覆蓋醫(yī)學、生物學、心理學學科的預印本平臺;OSF Preprint也是于2018年由開放科學中心成立的覆蓋建筑學、藝術與人文、商業(yè)、教育、工程、法律、生命科學、醫(yī)學與健康科學、物理科學和數(shù)學、社會和行為科學的多學科綜合性預印本平臺;Preprint.org是一個接受全學科文獻的預印本平臺。
除了這些綜合性的預印本平臺,其他學科領域也紛紛推出各自的預印本平臺,如2013年由美國冷泉港實驗室推出的生命科學領域的預印本平臺bioRxiv,2019年由冷泉港實驗室、耶魯大學和BMJ創(chuàng)立的醫(yī)學預印本平臺MedRxiv。這些預印本平臺在發(fā)起的時候就得到了業(yè)內(nèi)眾多科學家、學協(xié)會和出版商的支持,成為各自專業(yè)領域內(nèi)重要的學術交流平臺。一些預印本平臺還與出版商有合作,如Research Square為投稿到Springer Nature的稿件提供“In Review”服務。若Research Square上的預印本發(fā)表到Springer Nature期刊上以后,則該預印本平臺會提供最終發(fā)表版本的鏈接。bioRxiv和medRxiv也會自動添加預印本手稿最終發(fā)表版本的鏈接[15]。
(1)突發(fā)事件凸顯預印本出版速度快的優(yōu)勢。如在生命科學領域,從投稿到最終錄用大約需要6個月甚至更長的時間。文章在預印本發(fā)布后,到期刊最終錄用生成DOI(Digital Object Identifier,數(shù)字對象唯一標識)的中位時間是166天(約5個半月)[5]??梢姡瑐鹘y(tǒng)商業(yè)模式下,出版周期較長。相比之下,預印本文獻一般只需要幾天的時間就可以完成發(fā)布。而一些預印本平臺發(fā)布速度更快,如Preprint.org預印本平臺聲明大部分的預印本24小時內(nèi)可以發(fā)布。因此越來越多的科學家選擇在預印本平臺上發(fā)布COVID-19相關文獻。筆者在Dimensions平臺利用title/abstract包含關鍵詞“COVID-19”或“SARS-CoV-2”或“coronavirus”檢索2019—2020年COVID-19相關文獻,并分析COVID-19預印本文獻在所有COVID-19出版物中的占比發(fā)現(xiàn),2020年相關預印本3萬余篇,在全球COVID-19相關文獻中的占比高達17.10%(見表2)。
表2 Dimension平臺上各類COVID-19相關文獻分布情況
(2)社交媒體和替代計量凸顯預印本的開放融合優(yōu)勢。相對于期刊而言,預印本平臺包含的學科主題較為廣泛,且提供相關的替代計量學指標,包括文摘瀏覽次數(shù)、下載次數(shù)、評論次數(shù)等。如SSRN提供下載次數(shù)、文摘瀏覽次數(shù)以及排名,還直接鏈接到社交媒體(如Twitter、Facebook)和替代計量學軟件(如PlumX),支持一鍵分享;Preprint.org統(tǒng)計了觀看次數(shù)、下載次數(shù)、評論次數(shù);MedRxiv統(tǒng)計了PDF下載次數(shù)、HTML格式全文瀏覽次數(shù)、文摘瀏覽次數(shù)、社交網(wǎng)絡分享次數(shù);ChemRxiv統(tǒng)計了觀看次數(shù)、下載次數(shù)。有些還專門對最新預印本文獻或者關注度較高的文章列出了專欄,如Preprint.org預印本平臺會列出熱度較高的文章和最新發(fā)表的文章。
(3)靈活多樣的數(shù)據(jù)格式滿足不同傳播途徑需求。分析主流的預印本平臺文獻的格式可以發(fā)現(xiàn),這些平臺都提供PDF格式,而一些平臺(如bioRxiv)除了提供PDF格式外,還支持分享、郵件,支持使用BibTex、Bookbends、EasyBib、Endnote、Medlars、Mendeley、Papers、RefWorks等多種格式下載。任何人都可以免費下載和閱讀預印本平臺上面的文章,滿足了不同傳播途徑的需求。
(4)多維度審核指標保障預印本的出版質量。為控制預印本文獻的質量,主流的預印本平臺均會對預印本文獻作者的身份、內(nèi)容的學術性和真實性、格式的完整性等方面進行一定程度的審核[16]。如arXiv明確表示如果作者提交的預印本手稿內(nèi)容缺乏獨創(chuàng)性、新穎性或重要性將被拒絕,格式不正確或者學科與該平臺不符的手稿、重復提交的手稿都將被拒絕。如bioRxiv在審核的過程中要求預印本手稿須具有論文基本要素,必須為PDF或一般文本格式,不得出現(xiàn)帶有攻擊性或者違背科學性的內(nèi)容;SSRN則要求文章需使用學術專業(yè)術語,符合學術性相關要求。據(jù)統(tǒng)計,約2/3的預印本文章最終都發(fā)表在同行評議的期刊上[17],可見預印本文獻的質量還是較好的。
正式投稿的期刊文章一經(jīng)發(fā)表就無法進行再次修改。相較之下,預印本平臺一般允許作者對已上傳的手稿再次修改、補充和完善后再次上傳,所以一篇預印本文章也會存在多個版本。一般而言,預印本手稿首次上傳后就會生成一個DOI號,之后不管文章修改多少次,均使用同一個DOI以方便同行對該文章的引用。根據(jù)《中華人民共和國著作權法實施條例》第二十三條規(guī)定,著作權自作品完成創(chuàng)作之日起產(chǎn)生,并受著作權法的保護。因此,對于預印本文獻而言無論文章手稿修改多少次,有多少個版本,該文章的著作權自論文完成之日起就已自動產(chǎn)生,對論文的再次修改和補充對著作權均無影響[18]。除了特殊法律和相關協(xié)議約定之外,預印本的著作權理論上屬于作者。通過對主流預印本平臺的調(diào)研發(fā)現(xiàn),目前均未要求作者將著作權轉讓給平臺,但須與平臺簽署相關知識共享協(xié)議以將相關的論文著作權許可給平臺。
作者與預印本平臺簽訂的知識共享許可條款一般是針對單篇預印本文獻而言,但針對海量的預印本文獻,一般來說大部分平臺均支持對這些文章進行文本與數(shù)據(jù)挖掘,如bioRxiv、ChemRxiv均支持對預印本文章的文本和數(shù)據(jù)挖掘。
除了著作權許可協(xié)議外,一些預印本平臺還有專門的元數(shù)據(jù)許可,元數(shù)據(jù)一般包括預印本文獻的標題、作者、摘要及其他相關信息。如arXiv遵循的知識共享CC0 1.0,即在法律允許的范圍內(nèi),放棄其在全球范圍內(nèi)根據(jù)版權法對作品的所有權利,包括所有相關和鄰接權,將作品獻給公有領域。因此,第三方機構也可以對這一部分的元數(shù)據(jù)信息進行再利用。
筆者調(diào)研出版商的預印本政策發(fā)現(xiàn),總體來看目前所有的開放獲取出版商均接受預印本文章,絕大部分商業(yè)出版商和學協(xié)會均接受預印本文章,不同出版商關于預印本文章的政策可以在SHERPA/RoMEO上找到[19]。從出版商目前的預印本政策來看,可以分為如下4類。
(1)無預印本政策限制。大部分的出版商和學協(xié)會均接受所有的預印本平臺的文章,并無任何特殊的限制條件,如Emerald集團出版物、劍橋大學出版社、冷泉港實驗室出版社、Springer Nature、美國微生物學會。
(2)僅接受非商業(yè)性預印本平臺的文章。包括美國科學促進會、美國醫(yī)學物理協(xié)會、美國計算機協(xié)會、貝爾斯坦研究所、英國醫(yī)學雜志公司、馬薩諸塞州醫(yī)學會、芝加哥大學出版社、美國生物化學與分子生物學學會。
(3)接收所有預印本文章的投稿,但要求經(jīng)同行評審或編輯修改后的文章版本不得再次上傳到預印本平臺,或要求投稿的文章需在原有預印本文章的基礎上進行明顯地修改完善,新增重要的內(nèi)容,以將預印本文章與正式發(fā)表的文章區(qū)別開來。如美國癌癥研究協(xié)會、美國心臟協(xié)會、美國精神病學協(xié)會出版物、美國胸科學會、歐洲分子生物學組織出版社。
(4)明確表示不接收。調(diào)研發(fā)現(xiàn),目前僅有兩個出版機構(均在醫(yī)學領域)明確表示不接收預印本臨床研究文章,即英國骨與關節(jié)外科編輯協(xié)會(British Editorial Society of Bone & Joint Surgery)、骨與關節(jié)外科雜志公司(the Journal of Bone and Joint Surgery Inc.)。
通過上述對預印本文獻的發(fā)展態(tài)勢、著作權政策以及期刊的預印本政策分析,我們發(fā)現(xiàn)預印本目前僅占學術交流系統(tǒng)中的一小部分,但從2016年以后一直呈快速增長態(tài)勢,其年增長率遠遠高于普通出版物,勢必成為未來學術交流的一種重要平臺和工具[20]。預印本發(fā)展給我們帶來的啟示如下。
從預印本發(fā)展態(tài)勢來看,預印本平臺最先在國外興起,目前主流的預印本平臺均分布在國外。從國內(nèi)的情形來看,目前少數(shù)預印本平臺(包括中國科技論文在線、中國預印本服務系統(tǒng)、ChinaXiv),均為包含多學科的綜合性預印本服務平臺,各個學科領域未形成有影響力的專業(yè)性預印本服務平臺。據(jù)SCI數(shù)據(jù)庫統(tǒng)計,2018年世界科技論文總數(shù)為206.97萬篇,其中中國論文占20.20%,僅次于美國,連續(xù)10年排在世界第2位??梢姡袊茖W家發(fā)表的高質量論文很大一部分都分布在國外的期刊上。此種情況下,中國教育部、高校、圖書館、學協(xié)會應該聯(lián)合起來共同推動中國預印本平臺的快速發(fā)展,以確保重要的學術成果首先在國內(nèi)的預印本平臺上發(fā)布。中國醫(yī)學科學院圖書館作為國家科技圖書文獻中心的醫(yī)學中心分館也應聯(lián)合中國醫(yī)學科學院/北京協(xié)和醫(yī)學院、中華醫(yī)學會等機構共同推動中國生物醫(yī)學印本平臺的建設,確保優(yōu)質的生物醫(yī)學論文在國內(nèi)預印本平臺首發(fā),確立生物醫(yī)學領域科學家學術交流的話語權。
新的學術交流生態(tài)系統(tǒng)下,預印本平臺的重要性毋庸置疑。加之受疫情沖擊,全球經(jīng)濟形勢不容樂觀。在此情形下,按照黨中央、國務院“過緊日子”的要求,國內(nèi)圖書館的經(jīng)費也進一步縮減。如天津大學圖書館就因為經(jīng)費的大幅縮減,暫停訂購大量論文數(shù)據(jù)庫[21]。因此,在經(jīng)費緊張的情況下,圖書館更應該有效地利用預印本文獻資源,并將其納入資源建設的范疇。預印本文獻與期刊等正式出版物的主要區(qū)別在于其首發(fā)權的認定,預印本文獻對于推動某一學科領域的學術創(chuàng)新具有非常重要的意義。因此,圖書館很有必要重點凸顯預印本在研究成果首發(fā)、學術交流、學術創(chuàng)新方面的價值,一方面將國內(nèi)外重要的預印本平臺整合至本館的檢索系統(tǒng)中,并針對預印本平臺開展相關的培訓和宣傳工作,讓更多的學者了解并學會利用預印本平臺上豐富的文獻信息資源開展教學科研和學術交流工作;另一方面,鼓勵和引導更多的專家和學者將自己的最新研究成果發(fā)布到國內(nèi)預印本平臺,保證國內(nèi)優(yōu)秀研究成果在國內(nèi)的首發(fā)權。通過對國內(nèi)外主要預印本平臺調(diào)研發(fā)現(xiàn),與商業(yè)數(shù)據(jù)庫不同,預印本平臺一般均有PDF格式可供免費下載,可以避免法律侵權的風險,一些預印本平臺還提供了批量下載接口,且一些預印本平臺的元數(shù)據(jù)也進行了開放;加之目前國內(nèi)外有影響力的預印本平臺較為分散,因此圖書館可以對預印本平臺上的文獻進行采集、保存和整合,實現(xiàn)對不同平臺預印本文獻的一站式檢索和集成服務[1,22]。
圖書館可以針對主流的預印本平臺提供培訓、學術新聞快訊等增值服務,幫助教師和科研工作者拓展學術視野,提高學術素養(yǎng),為其開展科研項目立項、研究論文選題、學術合作、跟蹤學科發(fā)展動向等提供參考和借鑒。很多預印本平臺都注重統(tǒng)計文章的各種替代計量學指標,一些平臺還將關注度較高的文章專門列出來,并支持將文章在各種社交媒體上進行分享。因此,圖書館可以針對預印本平臺上關注度較高、學術影響力較大的預印本文獻開展重點報道、全文推送、社群分享等增值信息服務,也可以針對熱門話題(如新冠肺炎相關研究)和前沿學科(如人工智能)開展專題信息服務,讓國內(nèi)的專家和讀者了解該領域的最新國際動向。此外,圖書館也可以系統(tǒng)地整理國際上一些期刊的預印本政策并對其進行宣傳和公開,讓廣大學者了解主流的期刊對預印本的接納和包容態(tài)度,并更積極地融入預印本文獻的生態(tài)系統(tǒng)建設中。