臧國全,趙毅(鄭州大學信息管理學院)
電子期刊長期保存方案的比較研究
臧國全,趙毅(鄭州大學信息管理學院)
探討了電子期刊長期保存方案的幾個基本問題,比較分析了四個全球比較著名的保存方案特征以及對常見訪問事件的處理方法,探討了一個完善的保存方案中各利益相關方應承擔的基本職責,以期為圖書館等機構制定電子期刊長期保存方案所參考。
電子期刊;長期保存;LOCKSS;CLOCKSS;Portico;e-Depot
與其他類型的數(shù)字資源相比,無論是在國外還是國內,電子期刊的長期保存理論研究與實踐開展最早,研究成果最豐厚,保存項目最多。但是,在這繁榮的保存實踐中,至今為止,仍然存在一些問題?;趯σ恍┲娮悠诳鉀Q方案的考察,發(fā)現(xiàn)和總結這些問題,探討對應的解決方法,是完善電子期刊長期保存方案的一個有效途徑。
1.1 保存對象
電子期刊長期保存對象有兩種:一是作者提交的論文文件;二是電子期刊的出版文件。兩者各有優(yōu)點和缺點,在保存實踐中,兩種保存對象的實施方法可能存在較大差異。
前者的優(yōu)點是保存內容比較全面完整,不僅包括呈現(xiàn)在期刊中的論文內容,還可能包括不出現(xiàn)在論文中的用于支撐論文觀點的研究型數(shù)據(jù)等。但缺點也很明顯,一是由于作者采用的文件格式眾多,需要對來源文件轉換為標準的格式以滿足長期保存的要求,需要大量的前期投資;二是保存的一些內容(如一些研究型數(shù)據(jù))可能很少有用戶訪問,導致保存成本提高。
后者的優(yōu)點是保存文件完全呈現(xiàn)了期刊出版的外觀,用戶瀏覽閱讀的觀感友好度高,保存無需格式轉換,初始成本較低。缺點是出版商為了保護其商業(yè)利益,常采用非標準格式進行出版,導致保存文件在長期保存過程中可能需要較多的數(shù)字遷移。
在電子期刊的長期保存方案中,上述兩種方法都有應用。并且,由于難以分出孰優(yōu)孰劣,一些保存方案甚至同時保存上述兩種數(shù)字對象,比如,Pub Med Central[1]、Portico[2]、KB E-Depot[3]等。
1.2 永久訪問與長期保存
在設計電子期刊長期保存方案時,理解永久訪問和長期保存的區(qū)別非常重要。JISC對兩者界定如下。[4]
永久訪問常與電子期刊許可條款有關,旨在對訂閱的電子期刊在一定環(huán)境內被持續(xù)訪問提供保證,包括對取消訂閱的電子期刊的持續(xù)訪問(Post-Cancellation Access)。因此,永久訪問是在試圖復制傳統(tǒng)紙介質期刊的場景。在這個場景中,圖書館接收和保存期刊,并確保已訂購期刊處于可獲得狀態(tài),無論是否繼續(xù)訂購。
長期保存強調的是過程與程序,旨在采用這些過程與程序確保保存的電子期刊在未來仍處于可被訪問狀態(tài)。長期保存可以被看作一個問題,該問題不僅僅是訂閱電子期刊的圖書館需要處理的,而且也是整個社會需要解決的,這個問題就是如何確保已有學術成果對于未來時代的學者乃至整個人類具備持續(xù)的可訪問性。產(chǎn)生這個問題的原因是存儲技術和傳播技術的不斷發(fā)展導致電子期刊存儲格式過時或數(shù)據(jù)丟失。
基于上述區(qū)別,一個承擔電子期刊法定保存義務的機構(如國家圖書館)無需同時經(jīng)營對電子期刊在線訪問的業(yè)務,用戶可以現(xiàn)場使用國家圖書館保存的電子期刊。這樣一來,作為法定保存授權機構僅為電子期刊長期保存提供解決方案,無需為用戶永久訪問提供服務保障。
1.3 出版商許可
電子期刊的長期保存需要尋求這樣一個解決方案:出版商把注意力集中在能夠做得最出色的事情上,(如給所出版的內容添加更多的價值),而不是糾結于圖書館對電子期刊進行永久訪問的保證上。因此,業(yè)界應該設計一套電子期刊永久訪問的許可模型,以供出版商與圖書館簽訂許可訪問協(xié)議時參考。目前為止,NESLi2[5]許可模型是一個比較著名的實例。
NESLi2許可模型是英國圖書館與出版商之間涉及電子期刊長期保存與永久訪問事宜簽署的許可協(xié)議結構框架。針對永久訪問條款,在圖書館停止支付電子期刊許可訪問費用后,出版商提供三個選項為圖書館用戶繼續(xù)訪問已停購的電子期刊內容。(1)從出版商服務器上獲得永久訪問;(2)在圖書館的保存設施上提供圖書館以前訂購的電子期刊副本;(3)在第三方的保存設備上提供圖書館以前訂購的電子期刊副本。
上述第一個選項需要出版商提供完整的內容,第二個選項需要訂閱期刊的圖書館履行保存責任,第三個選項是將長期保存職責委托給專業(yè)保存系統(tǒng)。既不將保存責任完全交給出版商,也不把責任交給個別圖書館,應該被視為是較好的選擇。這樣,出版商專注于出版優(yōu)質內容,圖書館專注于為用戶提供優(yōu)質服務,保存系統(tǒng)則專注于電子期刊長期保存,各司其職,共同建立一個良性的學術交流系統(tǒng)。
1.4 法定繳存
較早對電子期刊實施法定繳存的是英國,2003年的《英國法定繳存圖書館法》[6]擴展了之前的出版物存繳法已包括電子期刊在內的所有電子出版物。自此之后,不少國家立法機構也通過了相似法案,授予國家圖書館接收實施電子期刊的繳存,作為其法定收繳傳統(tǒng)期刊在數(shù)字時代的延伸,用來保護本國的數(shù)字文化遺產(chǎn)。到目前為止,盡管并非所有國家都對電子期刊的繳存進行了立法,但無論是法律形式的還是自愿形式的電子期刊繳存都是出版主體履行的一項社會職責。法定繳存可被視為數(shù)字保存的一項重要內容。但由于下述三個因素,導致法定繳存在履行保存職責的同時存在一些局限性。
(1)基于法定繳存的授權,國家圖書館僅履行長期保存職責,沒有義務向用戶提供在線、全面、甚至增值的檢索訪問服務,因此無需設計運行檢索系統(tǒng)。用戶使用法定繳存的電子期刊,只能到現(xiàn)場,就像用戶使用繳存的傳統(tǒng)出版物一樣。但是,這種使用方式完全沒有體現(xiàn)電子期刊的數(shù)字化信息資源特征。(2)盡管一些國家圖書館已經(jīng)開始實施電子期刊的法定繳存,但作為一種數(shù)字資源長期保存的機制,其有效性的證實需要一個漫長過程。數(shù)字遷移和數(shù)字仿真是目前數(shù)字保存系統(tǒng)廣泛使用的長期保存策略,目的是解決數(shù)字資源格式的過時導致無法被用戶有效訪問使用的問題。但是用戶訪問不是法定繳存保存系統(tǒng)的職責,所以這類保存系統(tǒng)實施數(shù)字遷移和數(shù)字仿真的必要性目前在業(yè)界仍在爭論探討中。因此,認為法定繳存制度是一個不錯的電子期刊長期保存解決方案還為時過早。(3)網(wǎng)絡環(huán)境下,電子期刊法定繳存所基于的出版商國籍身份乃至出版機構所在地都變得越來越模糊,導致法定繳存的界限有時難以清晰界定。比如,STM(科學、技術與醫(yī)學出版商國際協(xié)會)中的大型電子期刊出版商的國際化趨勢已很明顯,電子期刊的跨國管理和國際化服務已成常態(tài)。所以,法定繳存的界限遇到了挑戰(zhàn)。
到目前為止,電子期刊長期保存方案已有不少,下面僅對四個國際上比較著名的方案進行分析。
2.1 LOCKSS
LOCKSS[7]電子期刊長期保存方案采用聯(lián)盟制,聯(lián)盟中的會員有電子期刊出版商和圖書館兩類。其基本特點有:一是當圖書館訂閱一種電子期刊時,該電子期刊出版商給訂閱圖書館一個授權,許可該圖書館采用LOCKSS開源軟件從出版商中收割訂閱的期刊并將其副本保存到圖書館本地,當圖書館取消訂閱時,已收割的訂閱期刊副本被永久保存在圖書館本地;二是當圖書館用戶訪問訂閱期刊時,首先鏈接出版商,當出版商平臺無法訪問時,轉到圖書館本地副本進行訪問使用;三是成員圖書館之間通過LOCKSS軟件實時比較保存的副本,以確保保存期刊的完整性。
LOCKSS的優(yōu)勢在于:一是高度分布式的保存,能夠保證災難降臨到某一個或一些LOCKSS會員時,有足夠的副本確保電子期刊的安全;二是確保圖書館用戶的無間斷即時訪問,即使與出版商服務器之間的通信出現(xiàn)短暫障礙,LOCKSS系統(tǒng)可及時轉換到訪問圖書館的保存副本;三是圖書館獲得了對訂閱電子期刊的控制權,就像圖書館對購買的傳統(tǒng)印刷型期刊的控制權一樣,克服了對數(shù)字資源授權訪問的虛擬性;四是厘清并強化了保存職責,無論出版商的規(guī)模大?。↙OCKSS聯(lián)盟中除了STM大型出版商外,也有大量的DOAJ小型出版商),也不管圖書館的用戶多少,只要加入該聯(lián)盟,就共同承擔電子期刊的長期保存職責,既有合作,又有分工,LOCKSS證實了這種保存職責共同承擔模式的可行性。
LOCKSS的缺憾有:一是LOCKSS系統(tǒng)需要持續(xù)的技術支持,盡管大部分技術支持都可遠程實施,但出版商和圖書館都需要專門人員監(jiān)視本地服務器運行;二是圖書館的LOCKSS平臺較難與其他數(shù)字資源平臺整合在一起,增加圖書館的運行成本;三是大型STM出版商對這種高度分布式保存模式中電子期刊的安全性擔憂,導致加入LOCKSS的熱情不高,這在LOCKSS會員的一些報告中也常有體現(xiàn)。
2.2 CLOCKSS
CLOCKSS[8]電子期刊長期保存方案是LOCKSS的改進版。具體改進有以下內容:一是雖然電子期刊的保存也是由基于分布式的圖書館實現(xiàn),但圖書館是經(jīng)過優(yōu)選的;二是圖書館保存的不再僅限于訂閱的電子期刊,而是出版商的所有期刊;三是圖書館保存的不僅是電子期刊論文的出版文件,還包括作者的提交文件,因此,圖書館需要運行兩個存檔庫;四是當遇到突發(fā)事件,出版商無法向用戶提供訪問時,圖書館的保存副本將向所有用戶(而不是僅限于本館用戶)提供訪問服務。
CLOCKSS的主要優(yōu)勢為:電子期刊長期保存的職責劃分更科學,經(jīng)過選擇的一小部分圖書館與出版商共同承擔所有電子期刊的長期保存任務,這樣至少可以部分解決大型出版商對電子期刊保存的安全擔憂。該項特征通過眾多STM出版商加盟CLOCKSS已得到證實。但是CLOCKSS不支持圖書館取消訂閱后對原訂閱期刊的繼續(xù)訪問服務。
2.3 Portico
Portico[2]是第三方機構進行電子期刊保存的解決方案?;咎卣饔校阂皇请娮悠诳霭嫔桃苑仟氄挤绞皆S可給Portico進行長期保存,并有權對自己出版且保存在Portico中的電子期刊進行訪問和獲取;二是圖書館將已訂購、獲得授權的電子期刊委托給Portico進行長期保存;三是Portico收取出版商和圖書館的保存費用;四是當出版商平臺無法提供訪問服務時,Portico向圖書館提供原有訂購范圍內的訪問服務。
Portico的優(yōu)勢有以下方面:一是免除了圖書館對訂購電子期刊的保存負擔;二是基于圖書館與出版商之間的協(xié)議,Portico向圖書館訂購期刊提供永久使用服務;三是Portico同時提供電子期刊的作者提交文件和出版文件的保存,當后者出現(xiàn)問題時,可基于前者生成后者;四是Portico與其他著名保存系統(tǒng)(如KB)達成協(xié)議,建立Portico保存內容的鏡像站點,提高Portico的長期保存可信任度。遺憾的是對于圖書館來說,委托給Portico進行保存的電子期刊仍是虛擬的。
2.4 e-Depot
e-Depot[3]長期保存的一個主要對象是STM出版商的電子期刊。其基本特征為:一是基于簽訂的保存協(xié)議,出版商委托e-Depot長期保存;二是針對一般用戶,e-Depot不提供在線訪問,僅提供現(xiàn)場瀏覽或荷蘭境內的原文傳遞;三是針對訂購電子期刊的圖書館用戶,在出版商平臺中斷服務時,提供訪問服務;四是針對進入公共領域電子期刊和出版商停止供應的期刊,面向所有用戶提供開放獲取。
e-Depot的優(yōu)勢有:一是涵蓋的STM出版商多,資源優(yōu)勢明顯;二是在數(shù)字保存的研究和實踐領域中享有很高的聲譽,公認技術實力領先;三是同時保存作者提交文件和出版文件,以克服出版文件損壞的風險。但存在缺陷:一是因為e-Depot包含的主要是STM出版商,而這類出版商技術力量雄厚,中斷服務幾率極小,導致e-Depot提供開放獲取的觸發(fā)事件概率也很?。欢悄壳皩-Depot所保存電子期刊的訪問只能現(xiàn)場實現(xiàn)。
有很多原因導致電子期刊訂閱者無法訪問期刊內容,有些是可以預見的,比如圖書館經(jīng)費的削減導致某種期刊被終止訂閱;有些是突發(fā)的,比如,期刊被出版商撤銷。持續(xù)時間有些是短暫的,如,暫時的網(wǎng)絡故障導致無法訪問出版商平臺的電子期刊;有些是長期的甚至是永久的,例如,災難性事件造成的無法訪問。發(fā)生的頻率有些較高,有些較低。導致的結果有些僅引起較小的麻煩,有些導致服務中斷。
為了對比上述四種保存方案,列出下面四種導致電子期刊無法訪問的常見事件。
事件1:圖書館停止訂閱,但要求繼續(xù)訪問已訂閱過的期刊。這類事件是由圖書館方面的原因觸發(fā)的。在停止訂閱前,圖書館應該進行風險評估,并制訂預案保證對原訂閱電子期刊的訪問。
事件2:電子期刊的過刊已經(jīng)不能從原出版商獲取。這類事件的出現(xiàn)具有一定的概率,比如出版商合并、出版商改變商業(yè)模式、出版商調整出版范圍、出版商之間交易期刊出版權等,都會導致期刊的原出版商不再提供過刊的訪問。
針對出版商之間期刊出版權交易所帶來的問題,英國Sage出版公司制定了一個規(guī)則:出版權接收方對接收期刊的過刊保存一般不作改變。比如,2010年,Sage出版公司不再出版期刊,當然,在其出版平臺上也不再提供該期刊的訪問,但對該期刊的過刊仍然提供兩個解決方案——Portico和CLOCKSS。
事件3:出版商停止商業(yè)運行,出版的電子期刊也無法獲取。大型出版商發(fā)生該類事件的概率較低,但小型出版商的發(fā)生概率很高,對用戶造成的影響很大,甚至難以接受。
事件4:出版商運營過程中服務器出現(xiàn)災難性失效。該類事件將導致完全中斷對出版商電子期刊的訪問。雖然發(fā)生概率很小,但導致的破壞影響很大。發(fā)生的情景如火災、洪水、閃電襲擊或是恐怖主義襲擊等致使出版商的服務器以及所有備份完全被毀掉。一般大型出版商的防御措施是異地備份,甚至在世界不同地域建立鏡像站點,但小型出版商財力難以負擔。
在該類事件發(fā)生時,出版商重建訪問平臺恢復對用戶的訪問服務可能需要花費較長時間。為了不影響訂閱用戶的使用,就需要啟動電子期刊保存方提供的訪問服務,但這種服務的啟動需要在出版商與保存方之間事先達成協(xié)議。比如,Portico的保存服務協(xié)議中指定實行開放訪問的條件為[9]:“電子期刊許可方停止出版業(yè)務,或暫停90天以內的對其出版物的訪問,原因可以是技術的難題、業(yè)務的中斷、資不抵債的破產(chǎn)等?!痹摋l款的一個前提是出版商在90天之內能夠恢復運行,僅在此期間由保存方提供訪問服務。
不同保存方案對上述事件的處理有所不同。下表列出了四個保存方案對上述四類事件發(fā)生時對用戶繼續(xù)訪問的處理情況。
表保存方案對事件的處理情況
基于上述保存方案的對比分析,一個電子期刊保存方案的基本構成是其各個利益相關方,主要包括圖書館(代表使用者)、出版商(電子期刊的提供者)、保存系統(tǒng)(電子期刊的長期保存者)、國家(作為一個國家地域內所有用戶利益的集體代表),每一個利益相關方都應該承擔自己的基本職責,只有這樣,才能建立一個比較完善的電子期刊保存方案。
4.1 圖書館方面
圖書館是電子期刊的最大用戶群體,永久訪問是其核心關注。為實現(xiàn)其用戶對電子期刊的永久訪問,圖書館應承擔的基本職責有:(1)強化對電子期刊永久訪問困難性的認知,將永久訪問納入圖書館的戰(zhàn)略發(fā)展規(guī)劃,并為實現(xiàn)永久訪問制定相應的政策和策略;(2)全面分析圖書館中影響永久訪問的因素,對其風險和可能帶來的損失做出評估,在基于成本效益分析的基礎上,做出針對不同因素出現(xiàn)時實現(xiàn)用戶訪問的預案;(3)永久訪問的前提是長期保存,后者需要持續(xù)投資,因此,圖書館必須將這項投資納入到長期預算中,并根據(jù)經(jīng)費情況,制訂永久訪問實施計劃;(4)加強與其他圖書館的合作,共同承擔長期保存任務,分擔保存費用,減輕單個圖書館的經(jīng)濟負擔,降低永久訪問不可持續(xù)的風險。
4.2 出版商方面
主要職責是:(1)出版高質量的電子期刊,同時確保電子期刊的長期有效性;(2)需向圖書館說明其保存政策以及圖書館取消訂閱后的服務政策,尤其是對本文第三部分內容的四種事件被觸發(fā)時的處置政策;(3)現(xiàn)實的實踐是大型出版商常常自行長期保存出版的電子期刊,而小型出版商更傾向于委托給保存系統(tǒng)。理想的做法應該是:至少委托給一個專業(yè)的保存系統(tǒng),不管是大型出版商還是小型出版商,也無論是否自行保存。
4.3 保存系統(tǒng)方面
(1)需擁有一個良好可持續(xù)、透明的財務收支模型,并得到盡可能多的出版商加盟,這是保存系統(tǒng)運行可持續(xù)的前提;(2)需贏得出版商的信任,以便基于產(chǎn)權許可的方式獲取電子期刊的作者提交文件和出版文件,這是保存系統(tǒng)的核心商業(yè)資產(chǎn);(3)需制定所需技術和專業(yè)知識支持的獲取渠道,以及與出版商的溝通方式,以便處理諸如數(shù)據(jù)結構、保存格式和檢索策略等事項;(4)出版商常對電子期刊進行增值處理,如嵌入引用和多媒體剪切等,但如何保存和向用戶提供這些增值處理內容是保存系統(tǒng)的一個困擾;(5)需設定面向用戶開放訪問的條件和用戶范圍。條件的例子見本文第三部分的四種事件。用戶范圍是指當開放訪問條件被觸發(fā)時,是對所有人開放訪問,還是僅對當前訂閱者,還是包括以往的訂閱者,后兩種情況需身份驗證。
4.4 國家層面上
(1)國家應該立法建立包括電子期刊在內的電子出版物呈繳制度,至少指定國家圖書館履行本土出版電子期刊的呈繳接收和長期保存使命,為防止電子期刊的消失構建最后一道防線。(2)電子期刊的呈繳本保存系統(tǒng)應采取面向用戶服務的日常方式(如現(xiàn)場瀏覽),以及極端事件發(fā)生時用戶服務的特殊方式(如在線訪問)。
自古以來,期刊都是學術交流系統(tǒng)的重要組成部分。數(shù)字時代,電子期刊扮演著同樣的角色,只不過載體和傳播方式發(fā)生了變化。但是,與傳統(tǒng)期刊相比,由于其載體的脆弱性和文件格式的易過時性以及產(chǎn)權保護的困難性,電子期刊的長期保存面臨更大挑戰(zhàn)。本文在對國際上比較著名的四種電子期刊長期保存方案比較分析的基礎上,探討了一個完善的保存方案中各利益相關方應該承擔的基本職責,以期供現(xiàn)有保存方案的完善以及新保存方案的設計參考。
[1]PMC.Pub Med Central Overview[EB/OL].[2015-03-01].http://www.ncbi.nlm.nih.gov/pmc/about/intro/.
[2]Portico.Preservation Approach[EB/OL].[2015-04-20].http://www.portico.org/digital-preservation/ about-us.
[3]Eijic V H.The Development of the Strategy for the e-Depot of the Koninklijke Bibliotheek,National Library of the Netherlands,National and International Context[J].2008(1),91-95.
[4]Jones M.JISC Briefing Paper:e-journals Archiving and Preservation[EB/OL].[2015-03-11].http://www.jisc.ac.uk/publications/publications/pub_ejournal spreservationbp.aspx.
[5]NESLi.NESLi2 Licencefor journals[EB/OL].[2015-04-28].http://www.nesli2.ac.uk/nesli2_lic_01090 3.htm.
[6]The National Archive.Legal Deposit Libraries Act 2003[EB/OL].[2015-03-16].http://www.legislation.gov.uk/ukpga/2003/28/introduction
[7]What Is LOCKSS?[EB/OL].[2015-06-01].http://www.lockss.org/about/what-is-lockss/.
[8]CLOCKSS.The CLOCKSS Archive:A Trusted Community-Governed Archive[EB/OL].[2015-06-21]. http://www.clockss.org/clockss/Home.
[9]Portico.Termsand ConditionsofUse[EB/OL].[2015-07-01].http://www.portico.org/digital-preservation/ terms-of-use.
Comparative Study on Long Term Preservation Solutions ofElectronic Journals
Zang Guo-quan,Zhao Yi
This article discusses several fundamental problems of long-term preservation solution ofe-journals,comparatively analyzes the features of four global famous preservation solutions and methods ofdealing with the common access events,and discusses basic duties of the beneficiaries in a perfectsolution.The above research is to provide
for the long-term preservation solution design ofe-journal forinstitutionssuch as libraries.
E-journals;Long-term Preservation;LOCKSS;CLOCKSS;Portico;e-Depot
G255.76
A
1005-8214(2016)05-0050-05
臧國全(1963-),男,教授,鄭州大學信息管理學院副院長,發(fā)表論文80多篇,出版學術專著3部;趙毅(1991-),男,在讀研究生。
2015-09-22[責任編輯]王崗
本文系國家自然科學基金項目“數(shù)字保存經(jīng)濟要素與經(jīng)濟評價研究”(項目編號:71173197)的研究成果之一。