劉樹春
遼寧中醫(yī)藥大學(xué)圖書館,遼寧 沈陽 110847
·專題論壇·
PMCI與醫(yī)學(xué)期刊文獻(xiàn)的開放存取及數(shù)字化存儲
劉樹春
遼寧中醫(yī)藥大學(xué)圖書館,遼寧 沈陽 110847
PMC及其與Europe PMC和PMC Canada共同構(gòu)建的PMCI被公認(rèn)為是生物醫(yī)學(xué)期刊文獻(xiàn)開放存取和數(shù)字化存儲的成功典范。本文從PMCI的構(gòu)成、各個鏡像節(jié)點(diǎn)的創(chuàng)建和功能特點(diǎn)加以討論,針對PMC與PubMed以及PMCI各節(jié)點(diǎn)之間在存儲模式和內(nèi)容上的差異等進(jìn)行了比較。并提出了在期刊文獻(xiàn)開放存取與數(shù)字化存儲實踐中的幾點(diǎn)啟示。
PMCI;開放存取;數(shù)字化存儲;期刊文獻(xiàn)
隨著生物醫(yī)學(xué)領(lǐng)域相關(guān)研究的飛速發(fā)展,信息更新日趨頻繁。而生物醫(yī)學(xué)期刊的開放存取和數(shù)字化存儲,順應(yīng)了網(wǎng)絡(luò)時代學(xué)術(shù)文獻(xiàn)信息快速與廣泛交流的需要,促進(jìn)了生物醫(yī)學(xué)科研信息的傳播與國際研究合作,同時也進(jìn)一步擴(kuò)大了學(xué)術(shù)期刊的使用范圍,提高了期刊的使用率和學(xué)術(shù)影響力。
在生物醫(yī)學(xué)領(lǐng)域,PubMed Central?(PMC)以及以PMC為基礎(chǔ)組建的PMC International(PMCI)被公認(rèn)為是醫(yī)學(xué)期刊文獻(xiàn)開放存取的成功典范,同時也是生物醫(yī)學(xué)期刊文獻(xiàn)數(shù)字化倉儲國際化合作的先驅(qū)。
PMCI是由美國國家衛(wèi)生研究院(National Institute of Health, NIH)和國立醫(yī)學(xué)圖書館(National Library of Medicine, NLM)、文獻(xiàn)來源期刊的出版社,以及其他國家共享NLM存儲文獻(xiàn)的組織機(jī)構(gòu)共同協(xié)作創(chuàng)建的[1]。NLM目前支持兩個PMCI中心,即Europe PubMed Central(Europe PMC)和PubMed Central Canada(PMC Canada)。二者與位于美國的PMC共同構(gòu)成PMCI。兩個中心也分別是PMC在英國和加拿大的鏡像站,接受和同步共享PMC的內(nèi)容。
PMCI是NLM的國家生物技術(shù)信息中心(National Center for Biotechnology Information, NCBI)與PMCI的各個節(jié)點(diǎn)(Europe PMC和PMC Canada)及在PMC存儲期刊論文的出版社之間的合作項目,其長期目標(biāo)是建立數(shù)字文獻(xiàn)存儲網(wǎng)絡(luò),并在網(wǎng)絡(luò)內(nèi)部共享各自存儲的內(nèi)容,以類似于國際核酸序列數(shù)據(jù)庫合作聯(lián)盟(GenBank/EMBL/DDBJ)的模式對數(shù)據(jù)進(jìn)行存儲和交換[2]。作為一個生物醫(yī)學(xué)文獻(xiàn)數(shù)字倉儲庫,其核心原則是:即使隨著技術(shù)的發(fā)展可能導(dǎo)致數(shù)字文獻(xiàn)的格式發(fā)生變化,但其收錄的全部期刊文獻(xiàn)必須提供永久性的免費(fèi)訪問。
1.1 PubMed Central
PMC(http://www.ncbi.nlm.nih.gov/pmc/或http://www. pubmedcentral.gov/)創(chuàng)建于2000年2月,是一個由NLM的NCBI開發(fā)與維護(hù)的開放存取式生物醫(yī)學(xué)及生命科學(xué)期刊文獻(xiàn)檔案庫[3]。在其起步階段,僅有美國的 PNAS(《美國國家科學(xué)院匯刊》)等少量期刊加入。經(jīng)過十幾年的發(fā)展,已經(jīng)有超過2000種期刊加入到PMC的開放存取和數(shù)字倉儲行列中,全文文獻(xiàn)超過330萬篇,成為全球生物醫(yī)學(xué)領(lǐng)域規(guī)模最大的開放存取機(jī)構(gòu)倉儲。2009年,美國總統(tǒng)奧巴馬簽署了年度《綜合撥款法案》,使NIH公共存取政策成為一項永久制度[4]。其條款規(guī)定:在遵守版權(quán)法的情況下,NIH要求受NIH資助的所有研究者在研究成果正式發(fā)表后的12個月之內(nèi)將其被期刊接受發(fā)表的經(jīng)同行評議的稿件終稿電子版提交至 PMC數(shù)字倉儲中,并向公眾開放訪問。
1.2 Europe PubMed Central
Europe PMC(http://europepmc.org/)原名為UK PubMed Central(UKPMC),是由維康信托基金會(Wellcome Trust)發(fā)起,并由歐洲生物信息學(xué)研究所、曼徹斯特大學(xué)及大英圖書館在PMC的基礎(chǔ)上共同開發(fā)維護(hù)的生物醫(yī)學(xué)及生命科學(xué)免費(fèi)數(shù)字文獻(xiàn)存儲庫,現(xiàn)受到包括維康信托基金會在內(nèi)來自于歐洲的24個慈善和政府組織等生命科學(xué)及生物醫(yī)學(xué)基金會的支持。2006年,Wellcome Trust宣布,凡是由其資助的研究論文必須在發(fā)表后的6個月內(nèi)通過UKPMC免費(fèi)向網(wǎng)絡(luò)開放。2007年1月,UKPMC作為PMCI的一部分和PMC在英國的鏡像站正式上線[2]。
2012年7月13日,歐洲學(xué)術(shù)研究委員會(The European Research Council, ERC)宣布加入到已經(jīng)有18個英國和歐洲的基金會支持的UKPMC中。正是由于 ERC的加入,以及為了擴(kuò)展該存儲庫的服務(wù)范圍,UKPMC在2012年11月1日改為Europe PMC。
1.3 PubMed Central Canada
PMC Canada(http://pubmedcentralcanada.ca/)作為PMC在加拿大的鏡像站點(diǎn)和PMCI數(shù)字存儲網(wǎng)絡(luò)的一部分,是在PMC的基礎(chǔ)上建立的,由加拿大國家科學(xué)圖書館(NRC-CISTI)維護(hù),并與加拿大衛(wèi)生研究所(CIHR)及美國的NLM建立合作伙伴關(guān)系,其目的是基于在加拿大的文獻(xiàn)庫向用戶永久性提供高質(zhì)量的生物醫(yī)學(xué)及生命科學(xué)研究文獻(xiàn)的全文免費(fèi)訪問。
PMC Canada全面支持CIHR的開放存取政策,并要求CIHR基金資助者在論文發(fā)表后的6個月內(nèi)通過PMC Canada向網(wǎng)絡(luò)開放。目前,PMC Canada只接受CIHR資助的作者提交的經(jīng)同行評議的期刊論文,以后還要擴(kuò)展接受加拿大其他基金資助機(jī)構(gòu)的研究文獻(xiàn),使位于加拿大的公共開放文獻(xiàn)庫的價值最大化。
PMCI的創(chuàng)立,是NLM和世界各國與PMC具有共同目標(biāo)的機(jī)構(gòu)建立合作關(guān)系,在其他可信的國際文獻(xiàn)檔案庫以相同的原則維護(hù)PMC的文獻(xiàn),最大限度地避免文獻(xiàn)資料的損壞和遺失。
創(chuàng)建PMCI主要是基于以下原因。第一,如果在世界各地的多個站點(diǎn)上存在活動的檔案副本被用戶正常使用,就可能加大文獻(xiàn)檔案的長期存活可能性。第二,研究文獻(xiàn)的生產(chǎn)者和資助者更習(xí)慣于將其文獻(xiàn)資料存儲于本地或區(qū)域性檔案庫,而不是在世界其他地方的檔案庫。第三,每個站點(diǎn)可以將檔案庫中的期刊論文與其他相關(guān)的資源進(jìn)行整合,如:對用戶具有特殊意義的特定國家或地區(qū)性的臨床指南等。同時,網(wǎng)站的多樣性也可以盡可能達(dá)到更大的創(chuàng)新,確保PMC的長期持久性。
PMCI中的所有論文都是免費(fèi)閱讀(Free Access)的,即任何人都可以對這些論文進(jìn)行檢索、瀏覽、閱讀和PDF格式下載,但這些論文仍然受到出版社的版權(quán)保護(hù)。沒有版權(quán)所有者的明確許可,不可以以任何形式重復(fù)應(yīng)用于研究(比如文本挖掘)或其他商業(yè)目的。但PMCI中有超過四分之一的論文屬于開放存?。∣pen Access)的,意味著只要注明來源,即可以以任何形式進(jìn)行利用。
雖然PMC與PubMed都由NLM創(chuàng)建,而且可以實現(xiàn)相互集成、彼此鏈接和共享檢索。但作為兩個不同產(chǎn)品和服務(wù)平臺,其內(nèi)容存在明顯區(qū)別。PubMed作為一種文獻(xiàn)庫,包含著生命科學(xué)領(lǐng)域的數(shù)百萬同行評議的期刊論文題錄和摘要,不提供任何全文,但可以提供外部鏈接到期刊出版社或PMC的免費(fèi)全文。而PMC作為一種全文資源庫,只包含期刊論文的全文信息。
PMCI三個站點(diǎn)中所包含全部論文的題錄均被PubMed收錄,即PMC中的論文可以利用PubMed進(jìn)行檢索,并可以鏈接至PMC中的全文。但PubMed包含的論文記錄遠(yuǎn)遠(yuǎn)多于PMC,即不是PubMed中所擁有的文獻(xiàn)記錄都可以在 PMC中找到全文。此外,因為PubMed中提供的全文鏈接是離開PubMed站點(diǎn)指向到外部提供者的全文,即可以指向PMCI站點(diǎn)或期刊出版社的網(wǎng)站。所以,即便是在PubMed中標(biāo)記有全文鏈接,在PMC中也不一定能找到全文。
簡而言之,如果檢索PMC,用戶可以直接進(jìn)入全文,但檢索的結(jié)果不能涵蓋PubMed的所有檢索結(jié)果。而檢索 PubMed,如果檢索結(jié)果中的記錄包含在 PMC中,那么記錄中會提供一個鏈接,引導(dǎo)用戶免費(fèi)獲取PMC中的全文。
PMC Canada和 PMC作為一種全文資源庫,只包含期刊論文的全文信息。而Europe PMC雖然也是一種全文資源庫,但它還包含著PubMed中那些不提供全文的題錄和文摘信息。
4.1 PMCI開放存取的模式和論文提交方式
PMCI中的文獻(xiàn)內(nèi)容向網(wǎng)絡(luò)開放的時間因期刊的不同而不同。大多數(shù)期刊在出版的同時就自動將其內(nèi)容進(jìn)入 PMCI,向用戶開放。有些期刊可能會延遲數(shù)月或一年再將全文開放。這些是依據(jù)PMC參加協(xié)議及PMCI各站點(diǎn)對期刊收錄的級別而定。
一種特定的期刊在進(jìn)入 PMC公開之前,必須與NLM簽署一個協(xié)議。這個協(xié)議決定了期刊在PMCI系統(tǒng)中的開放內(nèi)容和時間。而且,針對在PMCI中不同級別的期刊,依據(jù)NIH公共開放規(guī)定,向PMCI提交存儲的方式也不同。見表1。
4.1.1 全文存儲(Full Participation) 與NLM簽署全文存儲協(xié)議的期刊從某一特定卷期或日期起,將其刊載的全部論文存儲于資源庫中。針對這些期刊,PMC通常會將存儲的全文回溯至期刊的創(chuàng)刊卷期。而且這些期刊上刊載的論文由期刊出版商即時提交給PMC,無需論文作者操作。這種方式提交的論文,雖然期刊是以“Full”的形式加入,但有些(開放存取類期刊)是即時性開放全文訪問,有些是延遲一段時間(6~12個月)開放。
4.1.2 NIH檔案集(NIH Portfolio) 簽署此類協(xié)議的期刊從某一特定卷期或日期起,至少將期刊中受NIH資助的論文在出版后的 12個月內(nèi)存儲于資源庫中,也可以依據(jù)協(xié)議選擇其他非NIH資助論文存儲,但不是期刊中的全部內(nèi)容。這些期刊中所涉及的論文,是由期刊出版商直接單篇提交給PMC,無需作者操作,而且一般在正式出版后12個月內(nèi)通過PMCI向網(wǎng)絡(luò)開放。
4.1.3 選擇性存儲(Selective Deposit) 簽署此類協(xié)議的期刊將其刊載的作者選擇“Open Access”模式發(fā)表的論文,提交給PMC存儲。在此類期刊上發(fā)表的論文,需要作者與期刊出版商協(xié)商支付“開放存取費(fèi)用”,并提交 PMC開放。目前,已經(jīng)有 NPG Open Access、Springer Open Choice、Wiley-Blackwell、Lippincott Williams & Wilkins、ACS等商業(yè)期刊出版公司或?qū)W術(shù)團(tuán)體與NLM簽署了此類協(xié)議。對于在尚未與NLM簽署存儲協(xié)議的期刊上發(fā)表的論文,則需作者自行提交最終版本(final peer-reviewed manuscript)至PMC。有些期刊出版商,如:Elsevier、Karger、John Wiley、NPG等,承諾將符合NIH開放存取規(guī)定的經(jīng)同行評議的最終稿件主動提交給 NIH稿件提交系統(tǒng)(NIH Manuscript Submission,NIHMS),但需要論文作者予以確認(rèn),并完成后期提交流程。
4.1.4 停止存儲(No longer depositing) 此類期刊不再向PMC資源庫中新增存儲論文,但以前存儲的內(nèi)容還繼續(xù)提供全文服務(wù)。
4.2 PMCI不同鏡像站在內(nèi)容上的差異
直到2011年,PMCI的三個鏡像站的論文檢索和瀏覽方式都是一致的。就所收錄的文獻(xiàn)而言,PMCI的三個站點(diǎn)動態(tài)共享數(shù)據(jù)。但隨著UKPMC的更名及界面的改變,三個站點(diǎn)提供的內(nèi)容和檢索方式也發(fā)生了一些變化。
表1 PMCI各鏡像站收錄期刊及層次差異
與PMC相比,Europe PMC網(wǎng)站界面也有新的特色功能。它既包括PMC的期刊論文全文,還包括PubMed的題錄和摘要信息。此外,還包括 500多萬條額外的其他相關(guān)資源,如:生物醫(yī)學(xué)專利記錄、Agricola文摘、臨床指南、博士學(xué)位論文及研究報告等信息。同時,還整合了文本及數(shù)據(jù)挖掘工具等。
在美國的PMC中,也存在有少量期刊論文的全文只能通過期刊網(wǎng)站的公共鏈接獲得。即有些期刊尚未同意將其內(nèi)容鏡像至Europe PMC等其他站點(diǎn),比如:Annals of Surgery(《外科學(xué)紀(jì)事》)、Journal of Anatomy(《解剖學(xué)雜志》)等。因此,在這些期刊上發(fā)表的文獻(xiàn)雖然能通過Europe PMC檢索,但有時檢索結(jié)果會標(biāo)注“Only available in US PMC”(只包含在美國的PMC中)。
5.1 文獻(xiàn)提交方式和接受內(nèi)容
PMC、Europe PMC和 PMC Canada的區(qū)別主要在于每個站點(diǎn)上不同的論文提交系統(tǒng),而且不同資源庫的文稿存儲策略也不同。PMC只接受 NIH、Howard Hughes Medical Institute等機(jī)構(gòu)資助的研究成果,同時也接受有合作關(guān)系的期刊將論文通過 PMC存儲和開放。其接受條件是期刊必須符合出版物的學(xué)術(shù)質(zhì)量和數(shù)字文件的技術(shù)標(biāo)準(zhǔn),而且必須是以英文出版的生命科學(xué)期刊。Europe PMC只接受由 Wellcome Trust、Research Councils UK等幾個歐洲資助者的研究成果;而PMC Canada只接受來自CIHR資助的研究成果,并且除英文外,也接受法文文獻(xiàn)。
5.2 內(nèi)容共享方式
提交存儲在PMC Canada、Europe PMC中的文獻(xiàn)首先傳至位于美國的PMC,與PMC自身的數(shù)據(jù)匯總后,再分別鏡像至與其合作的各個站點(diǎn),共享數(shù)據(jù)。但并不是PMC的所有內(nèi)容都已經(jīng)鏡像至所有站點(diǎn)。分別從2006年7月及2009年6月開始,各出版社或雜志社與 PMC簽署的合作協(xié)議才開始包含將內(nèi)容鏡像于Europe PMC和PMC Canada的許可。
5.3 檢索途徑及特點(diǎn)
PMC作為NCBI的一個子系統(tǒng),與NCBI的其他數(shù)據(jù)庫共享一個檢索平臺,其檢索界面和檢索途徑與PubMed相同,既包括快速檢索,也提供文摘詞、機(jī)構(gòu)、作者、論文題名、主題詞(MeSH)、地址、DOI、圖表、全文自由詞、期刊名稱等字段的檢索。此外,也可以對出版日期、文獻(xiàn)類型等進(jìn)行限定。在檢索結(jié)果界面,可以對NIH基金資助論文進(jìn)行篩選過濾,也可以直接關(guān)聯(lián)檢索NCBI的Gene、Protein、PubMed等其他數(shù)據(jù)庫中的相關(guān)數(shù)據(jù)。
PMC的價值還在于利用通用格式存儲并交叉鏈接庫內(nèi)不同來源的數(shù)據(jù)。在數(shù)字時代,PMC利用其開放存取和數(shù)字存儲,努力發(fā)揮著世界級圖書館的作用。
PMC Canada的檢索途徑比較簡單,只提供對期刊名稱和論文的快速檢索,以及包括論文題名、作者、期刊名、論文號等途徑的高級檢索,但不提供MeSH、作者機(jī)構(gòu)等字段的檢索途徑。
Europe PMC可以檢索PMCI鏡像的全文存儲數(shù)據(jù),也可以檢索PubMed的題錄數(shù)據(jù),在其檢索界面上提供更多的檢索特性和功能,即在常規(guī)檢索字段的基礎(chǔ)上,還可以按資助機(jī)構(gòu)檢索。而其高級檢索界面所提供的過濾選項中,可以選擇在 PubMed/MEDLINE、Agricola、Chinese Biological Abstracts、Patents等不同來源中檢索,即通過Europe PMC界面,可以整合和過濾檢索多種數(shù)據(jù)庫和多類信息,也可以篩選檢索Europe PMC或Open Access的結(jié)果,并提供從文獻(xiàn)題錄至其他公共數(shù)據(jù)庫的鏈接,如:蛋白質(zhì)信息庫 UniProt以及歐洲核酸資源庫(European Nucleotide Archive)的相應(yīng)記錄。檢索結(jié)果中既可以顯示出命中的文摘記錄數(shù),也顯示可提供免費(fèi)全文的命中記錄數(shù)。同時,還提供文獻(xiàn)的被引證次數(shù)。用戶可以對檢索結(jié)果進(jìn)行相關(guān)性、出版時間和被引證次數(shù)排序顯示,有利于對某專題的經(jīng)典文獻(xiàn)篩選。此外,可以利用基金項目查找工具(Grant Lookup Tool)檢索46 000多個受24個基金會(funders)資助的生物醫(yī)學(xué)研究項目,獲得項目名稱、受資助人及相關(guān)研究信息。
學(xué)術(shù)文獻(xiàn)的開放存取和數(shù)字化存儲是擴(kuò)大學(xué)術(shù)交流和信息資源共享的發(fā)展方向。在PMCI等系統(tǒng)的實踐中,也給我們開展相關(guān)工作提供了很多啟示。
必須得到國家層面的科學(xué)研究機(jī)構(gòu)的支持,以及財政、科技、教育、衛(wèi)生、工信等國家部委的配合,并通過國家立法予以實施。同時,還要得到具有雄厚資金實力的基金管理部門的支撐。
需要選擇功能強(qiáng)大和具有國際影響力的服務(wù)平臺,具有先進(jìn)的技術(shù)保障。要具備統(tǒng)一的數(shù)字文獻(xiàn)存儲格式和完善的論文提交與審核系統(tǒng),方便數(shù)據(jù)的永久保存和開放利用,以及存儲庫之間的數(shù)據(jù)交換和關(guān)聯(lián)共享。
須得到國際權(quán)威期刊出版商和學(xué)術(shù)研究機(jī)構(gòu)的理解與配合。
大數(shù)據(jù)環(huán)境下的數(shù)字文獻(xiàn)存儲應(yīng)走國際合作、資源共享的道路。不同的存儲庫之間分工合作、交換并共享數(shù)據(jù),以及通過數(shù)據(jù)關(guān)聯(lián),與其他類型的開放數(shù)據(jù)相整合。
[1]PMC International[EB/OL].[2014-08-20].http://www.ncbi.nlm. nih.gov/pmc/about/pmci/.
[2]McEntyre JR, Ananiadou S, Andrews S, et al. UKPMC: a full text article resource for the life sciences[J]. Nucleic acids research,2011,39(Database issue):D58-D65.
[3]Roberts RJ. PubMed Central: The GenBank of the published literature[J]. Proceedings of the National Academy of Science of USA,2001,98(2):381-382.
[4]The Omnibus Appropriations Act of 2009 Makes the NIH Public Access Policy Permanent[EB/OL].[2014-08-20].http://grants.nih. gov/grants/guide/notice-files/NOT-OD-09-071.html.
PMCI and Open Access and Digital Storage for Medical Periodical Literature
LIU Shu-chun
(Library of Liaoning University of Traditional Chinese Medicine, Shenyang Liaoning 110847, China)
PMC International (PMCI) is constituted of PubMed Central in US, Europe PMC, and PMC Canada, and recognized as the successful model of open access and digital storage for medical periodical literature. In this article, the composition of PMCI, and the establishment and function characteristics of each mirror image node were discussed. The differences in storing pattern and content collected from each mirror image node among PMC, PubMed, and PMCI were compared. Some suggestions were put forward for open access and digital storage practice of periodical literature.
PMCI; open access; digital storage; periodical literature
10.3969/j.issn.2095-5707.2015.01.001
2014-10-30;編輯:張華敏)
劉樹春,研究館員,研究方向為中醫(yī)藥信息分析。
E-mail:scliu45@sina.com