趙俊玲 馬環(huán) 宛玲(河北大學(xué)管理學(xué)院 河北 保定 071002)
數(shù)字信息的保存不同于紙本信息的保存,其顯著的區(qū)別是數(shù)字信息保存活動的責(zé)任方不僅限于保存者,還包括數(shù)字信息生產(chǎn)者。隨著對數(shù)字信息保存研究的逐步深入,學(xué)者們?nèi)找骊P(guān)注從信息生產(chǎn)者的角度探討保存活動,如密歇根大學(xué)的Margaret Hedstrom[1]對數(shù)據(jù)生產(chǎn)者提交數(shù)據(jù)的激勵機制進行了研究。目前,有關(guān)數(shù)字信息出版者的保存行為的研究還比較少,因此本文在前人研究的基礎(chǔ)上,對數(shù)字信息出版者的保存行為進行系統(tǒng)研究。數(shù)字信息出版者涵蓋的范圍非常廣,包括數(shù)據(jù)庫商、學(xué)科庫、機構(gòu)庫、個人博客等。本文主要考查數(shù)據(jù)庫商的保存行為。這里的數(shù)據(jù)庫商并不排除學(xué)會、協(xié)會等非營利機構(gòu),同時也包括開放獲取資源的出版者。
本文以中國高等教育文獻保障系統(tǒng)(China Academic Library & Information System,簡稱CALIS)和中國科學(xué)院國家科學(xué)圖書館的數(shù)據(jù)庫產(chǎn)品列表為依據(jù)選取研究樣本,除去其中重復(fù)的,共有99家數(shù)據(jù)庫商。其中具有公司性質(zhì)的出版商54家、非營利機構(gòu)性質(zhì)(主要指學(xué)會、協(xié)會等)的44家,政府機構(gòu)1家;開放獲取數(shù)據(jù)庫商(者)6家,非開放獲取數(shù)據(jù)庫商93家。數(shù)據(jù)庫商經(jīng)營的產(chǎn)品種類包括電子期刊、電子圖書、會議錄、科技報告、數(shù)值數(shù)據(jù)、學(xué)位論文、專利文獻、報紙文件等。其中,電子期刊種類所占比重最高,其次是電子圖書和科技報告(見下頁表1)。本文對99家數(shù)據(jù)庫商網(wǎng)站相關(guān)信息進行了調(diào)查分析,以研究數(shù)據(jù)庫商的保存行為。
表1 數(shù)據(jù)庫商樣本類型構(gòu)成表
通過調(diào)研發(fā)現(xiàn),數(shù)據(jù)庫商的保存模式主要有3種:數(shù)據(jù)庫商自己保存、許可使用者進行保存、由數(shù)據(jù)庫商和使用者之外的第三方進行保存(見表2)。目前約有58%的數(shù)據(jù)庫商采取了保存行為,很多數(shù)據(jù)庫商在保存數(shù)據(jù)時并不局限于一種保存行為。從這幾種保存方式來看,目前只有少數(shù)出版商自己保存數(shù)據(jù),多數(shù)已將數(shù)據(jù)交由第三方保存。
表2 數(shù)據(jù)庫商保存行為表
通過對國內(nèi)外數(shù)據(jù)庫商網(wǎng)站內(nèi)容和許可協(xié)議的深入分析發(fā)現(xiàn),有5家數(shù)據(jù)庫商(ProQuest、AIP、JSTOR、AGU和Project Muse)自己保存數(shù)字信息,約占樣本數(shù)量的5%。
3.1.1 特點
通過對數(shù)據(jù)庫商自己保存數(shù)據(jù)行為的分析發(fā)現(xiàn),其保存有兩個特點:①多形態(tài)備份,如ProQuest分別采用數(shù)字形態(tài)(磁盤陣列)和縮微形態(tài)(縮微膠卷)進行備份。②多地點存儲備份,如AIP將保存本分別放置在不同地點以確保數(shù)據(jù)安全。 JSTOR也有穩(wěn)定的數(shù)據(jù)備份政策,將多個備份存儲到不同的地方。
3.1.2 保存方法
銀行作為整個供應(yīng)鏈條的金主,對于整個供應(yīng)鏈的作用是至關(guān)重大的。銀行可以以自身的地位,結(jié)合鏈上企業(yè)之間的差異,設(shè)立一些相關(guān)的激勵措施。供應(yīng)鏈中的企業(yè)信息明確,責(zé)任明確。加強企業(yè)之間的有效合作,建立信任。在激勵機制下表現(xiàn)的更加的真實。
數(shù)據(jù)庫商很少提供數(shù)字保存方法的信息,只有AIP提到了遷移和仿真策略、AGU提到了遷移和更新策略。但是英國的一項研究表明,目前數(shù)據(jù)庫商采用的保存策略比較多樣,如更新、技術(shù)保存、遷移、仿真等方法。其中,數(shù)據(jù)庫商采用最多的是更新策略,占53.8%,還有3家數(shù)據(jù)庫商采用了仿真策略[2]。
3.1.3 影響因素分析
采取自己對數(shù)據(jù)進行長期保存模式的數(shù)據(jù)庫商所占比例非常小,究其原因主要有以下兩個:
(1)數(shù)據(jù)庫商能力有限
數(shù)字信息保存是一項需要持續(xù)投入的活動,盡管目前還沒有成熟的計算數(shù)字信息保存成本的模型,但是數(shù)字保存成本較高已經(jīng)是普遍認(rèn)可的事實,特別是在數(shù)字信息保存活動的初期。同時數(shù)字保存需要有專門的技術(shù)人員,這對數(shù)據(jù)庫商來說也是一項很大的挑戰(zhàn)。因此,絕大部分?jǐn)?shù)據(jù)庫商沒有能力依靠自己的力量對所出版的數(shù)據(jù)進行長期保存。
(2)使用者的信任度低
數(shù)字信息的保存不同于紙本出版物的保存。對于紙本出版物來說,圖書館在購買的同時就享有對文獻的保存權(quán)。對于數(shù)字信息來說,目前國外數(shù)據(jù)庫商更多地采用許可使用的方式提供使用。由于使用者對已購買使用權(quán)的數(shù)據(jù)沒有保存權(quán),所以對數(shù)據(jù)的長期可存取非常關(guān)注。從使用者的角度分析,數(shù)據(jù)庫商自己保存數(shù)字信息會面臨很多問題,其中一個最重要的問題就是保存機構(gòu)的可持續(xù)性,數(shù)據(jù)庫商隨時有倒閉、被兼并的可能,所以使用者對數(shù)據(jù)庫商自己保存數(shù)字信息這種模式的信任度并不大。
3.2.1 數(shù)據(jù)庫商許可保存現(xiàn)狀
為了了解數(shù)據(jù)庫商賦予使用者哪些與保存相關(guān)的權(quán)利,筆者對數(shù)據(jù)庫商的網(wǎng)站進行了調(diào)查,查找網(wǎng)站上是否有正式協(xié)議,如果有正式協(xié)議,查看正式協(xié)議中是否有關(guān)于保存方面的規(guī)定;如果沒有正式協(xié)議,就到網(wǎng)站上的條件條款(terms and conditions)和常見問題解答(Frequently Asked Questions,簡稱 FAQ)中查找相關(guān)內(nèi)容。
通過對99家數(shù)據(jù)庫商網(wǎng)站的調(diào)查發(fā)現(xiàn),14家數(shù)據(jù)庫商允許購買者通過購買光盤進行保存。APS(American Psychological Society,美國心理學(xué)協(xié)會)在其協(xié)議模板中規(guī)定,圖書館可以選擇是否購買電子期刊的物理存儲形式,如光盤;允許購買者將數(shù)據(jù)從光盤等物理存儲形態(tài)轉(zhuǎn)換到本地系統(tǒng)中,并且允許授權(quán)用戶使用[6]。SPIE(The International Society for Optical Engineering,國際光學(xué)工程學(xué)會)digital library在正式協(xié)議中對保存權(quán)利進行了明確規(guī)定,SPIE的授權(quán)用戶可以選擇是否購買年度物理載體版本,包括CD和DVD兩種形式,費用為350美元。用戶可以將這些信息裝載到本地信息系統(tǒng)上,并允許其他授權(quán)用戶使用,但是如果訂購檢索使用權(quán)終止,SPIE就不再提供這項服務(wù)[7]。CABI(Centre Agriculture Bioscience Internaional,國際應(yīng)用生物科學(xué)中心)正式許可協(xié)議中的有關(guān)條款提到,數(shù)據(jù)庫商有責(zé)任向授權(quán)用戶提供已授權(quán)許可資料的物理拷貝[8]。
筆者研究表明,在同意使用者(采購者)進行物理拷貝的14家數(shù)據(jù)庫商的協(xié)議或者說明中,更多的是強調(diào)購買者可以獲得物理存儲載體形態(tài)的產(chǎn)品,但是在協(xié)議中并沒有明確購買者可否對數(shù)字信息進行遷移、仿真等操作。
3.2.2 使用者缺乏保存意識和能力
即使數(shù)據(jù)庫商許可使用者對數(shù)據(jù)進行保存,但如果使用者沒有責(zé)任意識和能力進行保存,那么這種許可對于數(shù)字信息保存毫無意義,因此需要對使用者的保存意識和能力進行研究。目前最早的研究是英國對圖書館保存意愿進行的一項研究。該研究對239名圖書館員進行了調(diào)查,很多圖書館員并不認(rèn)為他們應(yīng)該保存購買的數(shù)字信息,而是應(yīng)該保存反映當(dāng)?shù)貧v史文化的數(shù)據(jù),或者是本館特藏等具有特殊意義的數(shù)字文獻[2]。
2008年1月,Portico就電子期刊長期保存現(xiàn)狀向美國1 371位大學(xué)圖書館館長發(fā)放問卷,調(diào)查結(jié)果表明[9],大部分圖書館館長認(rèn)為他們應(yīng)該在數(shù)字保存中承擔(dān)某種職責(zé),但是認(rèn)為意識到數(shù)字信息保存的重要性和采取措施進行數(shù)字信息保存是不相關(guān)的,53%的研究型大學(xué)圖書館和74%的教學(xué)型大學(xué)圖書館沒有采取任何關(guān)于數(shù)字信息保存的措施。
由于數(shù)據(jù)庫商對自身商業(yè)利益的保護與使用者的保存意愿和能力兩方面因素產(chǎn)生影響,由數(shù)據(jù)庫商許可使用方進行保存的模式應(yīng)用得并不廣泛。
所謂第三方保存,是指由除生產(chǎn)者和使用者之外的第三方機構(gòu)對數(shù)據(jù)進行保存。由于生產(chǎn)者和使用者能力的限制以及二者沒有足夠的信任機制,所以產(chǎn)生了第三方保存項目。目前比較有影響力的第三方保存項目有Portico、LOCKSS(Lots of Copies Keep Stuff Safe,海量數(shù)據(jù)安全計劃)和CLOCKSS(Controlled LOCKSS,管控的LOCKSS)等。這些保存項目大多采用向數(shù)據(jù)庫商和圖書館收取會員費的形式,為數(shù)據(jù)庫商和圖書館提供數(shù)字信息保存相關(guān)服務(wù)。數(shù)據(jù)庫商將數(shù)據(jù)提供給第三方,第三方對數(shù)據(jù)進行更新遷移等以確保數(shù)據(jù)的永久讀取,這樣能夠解決數(shù)據(jù)庫商沒有能力自己保存數(shù)據(jù)的問題。只有在遇到特定的突發(fā)事件的情況下,如數(shù)據(jù)庫商破產(chǎn)或者自然災(zāi)害導(dǎo)致圖書館不能存取已購買使用權(quán)的數(shù)據(jù),第三方才能向數(shù)據(jù)庫商和圖書館開放相應(yīng)數(shù)據(jù)。這種模式既可以保障數(shù)據(jù)庫商的商業(yè)利益,同時也消除了使用者對數(shù)據(jù)不能持久存取的擔(dān)心。
3.3.1 數(shù)據(jù)庫商委托第三方保存總體情況
通過對數(shù)據(jù)庫商的網(wǎng)站和第三方保存項目的網(wǎng)站進行深入調(diào)查研究發(fā)現(xiàn),數(shù)據(jù)庫商樣本中有46家數(shù)據(jù)庫商委托第三方保存項目進行保存,約占數(shù)據(jù)庫商樣本總數(shù)的46%。同時很多數(shù)據(jù)庫商加入多個保存項目。例如,BioOne加入Portico 和LOCKSS;Taylor & Francis將其數(shù)據(jù)存儲到多個第三方保存庫中,包括Portico 、LOCKSS和 CLOCKSS試驗項目,同時和荷蘭國家圖書館簽署協(xié)議,委托荷蘭國家圖書館保護其數(shù)字文獻。
3.3.2 數(shù)據(jù)庫商的責(zé)任
在數(shù)據(jù)庫商許可第三方進行保存的模式下,數(shù)據(jù)庫商的責(zé)任會因委托的第三方保存項目的不同而有區(qū)別。本文以電子期刊出版商和Portico簽署的協(xié)議為例說明數(shù)據(jù)庫商應(yīng)該承擔(dān)的責(zé)任。數(shù)據(jù)庫商與Portico簽署非排他性協(xié)議,授予Portico在世界范圍內(nèi)的長期保存權(quán)利,數(shù)據(jù)庫商在內(nèi)容出版3個月之內(nèi)向Portico提交保存內(nèi)容,允許其抽取文本、音頻或其他內(nèi)容,并使用元數(shù)據(jù)、索引及其他補充數(shù)據(jù)來豐富這些內(nèi)容,允許Portico對數(shù)據(jù)格式進行遷移[10]。
3.3.3 委托第三方保存的影響因素和激勵措施
目前委托第三方保存在數(shù)據(jù)庫商的保存模式中占主導(dǎo)地位,但是還有一半以上的數(shù)據(jù)庫商沒有加入第三方保存項目。那么,如何激勵數(shù)據(jù)庫商加入第三方保存項目?下面結(jié)合委托第三方保存的影響因素進行分析。
(1)保障數(shù)據(jù)庫商的商業(yè)利益
數(shù)據(jù)庫商不加入第三方保存項目的一個非常重要的原因就是擔(dān)心其商業(yè)利益受損。曾經(jīng)有研究表明,很多數(shù)據(jù)庫商不愿意通過英國國家圖書館的自愿呈繳系統(tǒng)提交數(shù)據(jù),主要是因為擔(dān)心其他圖書館使用英國國家圖書館文獻提供中心的數(shù)據(jù)后就不再從數(shù)據(jù)庫商處采購數(shù)據(jù),從而影響其商業(yè)利益[2]。 所以第三方保存項目在設(shè)計保存機制的時候要充分保障數(shù)據(jù)庫商當(dāng)前的商業(yè)利益。因此第三方保存項目如果能向數(shù)據(jù)庫商證明其有能力將保存的數(shù)據(jù)使用限制在一定范圍內(nèi),并承諾數(shù)據(jù)庫商加入第三方保存項目不會影響其利益,那么就比較容易和數(shù)據(jù)庫商達成協(xié)議。
(2)使用者的壓力
第三方保存項目不會影響數(shù)據(jù)庫商的商業(yè)利益,是數(shù)據(jù)庫商加入第三方保存項目的必要條件,但不是充要條件。也就是說,保存項目要想數(shù)據(jù)庫商加入,就必須保證其商業(yè)利益,但是,不是保證了其商業(yè)利益數(shù)據(jù)庫商就一定會加入保存項目。因為加入保存機構(gòu)也需要成本,需要付給保存機構(gòu)相關(guān)費用,即使有些第三方保存項目對數(shù)據(jù)庫商免費,但數(shù)據(jù)庫商也需要向保存項目提供數(shù)據(jù),需要一定的人力成本等。所以要激勵數(shù)據(jù)庫商加入保存機構(gòu),還需要圖書館(使用者)對數(shù)據(jù)庫商施加壓力這一充分條件。ALPSP協(xié)會的出版者表示,90%以上的出版者都將圖書館界的強烈訴求作為最主要的激勵因素[3]。
本文通過系統(tǒng)考查數(shù)據(jù)庫商的保存行為發(fā)現(xiàn),目前有相當(dāng)比例的數(shù)據(jù)庫商具備數(shù)字信息保存的責(zé)任意識,約有一半的數(shù)據(jù)庫商進行各種形式的數(shù)字信息保存活動。從目前來看,委托第三方保存是比較適合的數(shù)字信息保存模式,該模式一方面可以最大限度地保障數(shù)據(jù)庫商的商業(yè)利益,同時也消除了使用者對數(shù)據(jù)不能持久存取的擔(dān)心。激勵數(shù)據(jù)庫商加入第三方保存項目的措施包括第三方保存項目努力確保并證明數(shù)據(jù)庫商的商業(yè)利益不受損害和使用者向數(shù)據(jù)庫商施壓。
[1]Hedstrom M, Niu Jinfang. Incentives for Data Producers to Create“Archive-Ready” Data: Implications for Archives and Records Management[EB/OL].[2010-10-22]. http://www.archivists.org/publications/proceedings/researchforum/2008/papers/M-HedstromJNiu-SAA-ResearchPaper-2008.pdf.
[2]Ayre C, Muir A.Right to Preserve? The Copyright and Licensing for Digital Preservation Project Final Report [EB/OL].[2010-10-22].http://www.lboro.ac.uk/departments/dis/disresearch/digpreserv.html.
[3]ALPSP and Portico Collaborate on Long-Term Digital Preservation Survey [EB/OL]. [2010-10-22]. http://www.Portico.org/digitalpreservation/news-events/news/research-surveys/alpsp-and-Portico-collaborate-on-long-term-digital-preservation-survey/.
[4]The Importance of Archiving and Availability of Geophysical Data[EB/OL].[2010-10-22]. http://www.paleostrat.org/Documents/agu%202005.pdf.
[5]Archiving and Use of AIP Electronic Information[EB/OL].[2010-10-22].http://www.aip.org/journals/archive/arch&use.html.
[6]American Physical Society Institutional Single-Site User License [EB/OL].[2010-10-22]. http://librarians.aps.org/sitelicense.pdf.
[7]Sample License [EB/OL].[2010-10-22].http://dlinfo.org/library/documents/samplelicense.pdf.
[8]CABI. Academic Institution Licence for Perpetual Access to the CAB eBooks Archive Database [EB/OL].[2010-10-22]. http://www.cabi.org/files/Licences/cabebooksarchivesalesagreement101207.pdf.
[9]Digital Preservation of E-Joumals in 2008:Urgent Action Revisited[EB/OL].[2010-10-22].http://www.Portico.org/digital-preservation/wp-content/uploads/2010/02/Porticosurveyondigitalpreservation.pdf.
[10]E-Journal Agreement [EB/OL].[2010-10-22]. http://www.PORTICO.org/digital-preservation/join-PORTICO/for-publishers/.