馬蕓馨 夏曼秋
(1.安徽大學(xué)管理學(xué)院,安徽合肥,230601; 2.安徽大學(xué)經(jīng)濟(jì)學(xué)院,安徽合肥,230601)
社會記憶是一個民族最寶貴的精神資源,社會記憶的保存,對于增強民族與社會的根源性和認(rèn)同感有著重要的意義。20 世紀(jì)90年代,聯(lián)合國教科文組織啟動了“世界記憶工程”項目,旨在遴選和保存最具代表意義的社會記憶遺產(chǎn),作為一個民族、一個社會的文化徽章。在2001年11月中國人民大學(xué)主辦的“中國首屆檔案學(xué)博士論壇國際學(xué)術(shù)研討會”上,“社會記憶”再次成為研討的焦點,眾多學(xué)者在重申社會記憶價值的同時,再次強調(diào)了檔案部門在社會記憶保存中的責(zé)任與使命[1]。
檔案部門是建構(gòu)社會記憶的主要機構(gòu),以存檔的方式保存大量信息資源,才能維持其原始性,進(jìn)而如實還原和展示社會演化的歷程。在“社會記憶”思想的指導(dǎo)下,檔案部門以一種更為負(fù)責(zé)、更為認(rèn)真地態(tài)度對待各種類型檔案的保存,將其作為傳承歷史,延續(xù)文脈的精髓。遺憾的是,身處信息化的大背景下,依托互聯(lián)網(wǎng)技術(shù)和信息技術(shù)生成的大量網(wǎng)絡(luò)資源卻并未得到檔案部門的關(guān)注,也未能以建檔的方式加以保存。本文將從檔案部門構(gòu)建社會記憶的角度,初步研究檔案部門的網(wǎng)絡(luò)信息存檔。
在信息時代,網(wǎng)絡(luò)已成為全球最大的信息資源庫。凡是以數(shù)字化方式直接發(fā)布在互聯(lián)網(wǎng)上并通過計算機網(wǎng)絡(luò)傳播利用的各種信息資源皆可納入網(wǎng)絡(luò)信息的范疇。網(wǎng)絡(luò)信息的種類可以按照來源、內(nèi)容、形式等不同標(biāo)準(zhǔn)進(jìn)行劃分,鑒于本文是以檔案部門構(gòu)建社會記憶為視角,而來源原則是檔案專業(yè)最基本的原則,所以筆者按照來源來劃分網(wǎng)絡(luò)信息的種類:政府網(wǎng)絡(luò)信息、企業(yè)網(wǎng)絡(luò)信息、科研教育機構(gòu)網(wǎng)絡(luò)信息、社會團(tuán)體網(wǎng)絡(luò)信息、個人網(wǎng)絡(luò)信息等。網(wǎng)絡(luò)信息能夠真實地反映政治生態(tài)變化、社會發(fā)展歷程、個人人生體驗等,是歷史的真憑實據(jù),具有憑證價值;又能夠記錄事實和經(jīng)驗,提供知識與信息,具有情報價值。
據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)測算,截至2013年12月,中國網(wǎng)民規(guī)模達(dá)到6.18 億,全年新增網(wǎng)民5358 萬人,互聯(lián)網(wǎng)的普及率增至45.8%,較2012年底提升3.7 個百分點[2]。很明顯,互聯(lián)網(wǎng)在經(jīng)濟(jì)社會中地位提升,反映文化、思想、事件的網(wǎng)絡(luò)信息大量產(chǎn)生,它們構(gòu)成了社會記憶的重要部分。此外,網(wǎng)絡(luò)信息具有實時更新性和易失性。檔案部門為構(gòu)建完整的社會記憶,對網(wǎng)絡(luò)信息存檔就是必要和緊迫的。
國外已經(jīng)開展了相關(guān)探索,其中較典型的是美國國會圖書館網(wǎng)頁信息存檔(LCWA) 項目和Internet Archive 項目。LCWA,主要提供數(shù)字信息的收集、保存和利用服務(wù),它保存了如總統(tǒng)選舉、伊拉克戰(zhàn)爭、911 事件等專題的網(wǎng)絡(luò)信息[3]。Internet Archive 從1996年成立之初起就開始從事原生數(shù)字信息(主要是網(wǎng)頁信息)的存檔實踐,致力于全面采集和保存全球網(wǎng)絡(luò)中公開可用的信息資源,使現(xiàn)在和以后的學(xué)者和研究人員能永久訪問[4]。
在借鑒國內(nèi)外現(xiàn)有經(jīng)驗的基礎(chǔ)上,根據(jù)傳統(tǒng)檔案建設(shè)管理的流程,筆者認(rèn)為網(wǎng)絡(luò)信息存檔應(yīng)該從收集(采集)、鑒定、整理、保管、檢索和利用這幾個流程展開。其中,采集、鑒定、保管是關(guān)鍵流程,本文將從這三大主要環(huán)節(jié)對網(wǎng)絡(luò)信息存檔的實施進(jìn)行探索。
采集是網(wǎng)絡(luò)信息存檔的第一個環(huán)節(jié),是開展后續(xù)工作的前提和基礎(chǔ),主要涉及采集范圍、采集方式和采集時間三個方面。
從采集范圍看,“全面而又有所側(cè)重”應(yīng)當(dāng)是基本要求。目前,網(wǎng)絡(luò)信息的采集主要有全面采集、選擇采集和聯(lián)合采集三種方法。全面采集是對所有的網(wǎng)絡(luò)信息進(jìn)行收集保存,如美國的Internet Archive 項目;選擇采集是基于主題或基于呈繳法律對部分網(wǎng)絡(luò)信息的收集,如澳大利亞的PANDORA 項目;聯(lián)合采集是前兩種采集方式的結(jié)合,如我國國家圖書館的“網(wǎng)絡(luò)信息資源采集與保存試驗項目(WICP)”[5]。筆者認(rèn)為,網(wǎng)絡(luò)信息數(shù)量龐大,質(zhì)量良莠不齊,若采用全面采集策略可能會面臨技術(shù)挑戰(zhàn)、經(jīng)費短缺和權(quán)利限制等問題,而選擇采集可能會遺失大量社會記憶。故我國檔案部門采取聯(lián)合采集的方式可能更好,既要包羅萬象,盡可能覆蓋人類的各個知識領(lǐng)域,又要精挑細(xì)選,注意有所側(cè)重。
從采集方式看,目前主要有自動采集和人工采集。自動采集是利用采集工具或系統(tǒng)自動對網(wǎng)絡(luò)信息進(jìn)行捕獲。澳大利亞國家圖書館開發(fā)的PANDAS 系統(tǒng)就具備這樣的功能[6]。人工采集則是由人對網(wǎng)絡(luò)信息進(jìn)行篩選從而確定哪些信息需要采集。兩種方式各有優(yōu)缺點,如自動采集更快捷方便,節(jié)省人力、物力,但是采集的信息也許并不能完全符合人們的利用需求,而人工采集雖然能夠從利用需求出發(fā)進(jìn)行采集,卻過于繁瑣。我國檔案部門可以綜合運用這兩種方式,需要全部采集的網(wǎng)絡(luò)信息采取自動采集,對無法判別利用情況的信息采用人工采集。
從采集時間看,按照網(wǎng)絡(luò)信息的更新頻率實時采集。網(wǎng)絡(luò)信息是一種不斷變化與更新的動態(tài)資源,在保持高速增長的同時也在大批消亡,如果不及時采取采集措施,在其消失之后人們將再也無法獲取。由于各類網(wǎng)絡(luò)信息的更新頻率不同,若仿照紙質(zhì)文件按固定時間定期歸檔的方式進(jìn)行信息采集,肯定是不可取的,所以筆者建議檔案部門根據(jù)不同網(wǎng)絡(luò)信息的更新規(guī)律,找出合理的采集頻率,按更新頻率進(jìn)行采集。
鑒定通常有真?zhèn)魏蛢r值鑒定兩種。此處的鑒定主要是指價值鑒定,即判斷網(wǎng)絡(luò)信息是否有保存價值。網(wǎng)絡(luò)信息區(qū)別于紙質(zhì)文件的最大不同在于它的軟硬件依賴性,需要通過計算機才能為人工所識讀。因此,單純的內(nèi)容上的有用性不足以構(gòu)成網(wǎng)絡(luò)信息保存價值,還必須從技術(shù)上保證其可被識讀,這就要求鑒定從兩方面入手,一是判斷網(wǎng)絡(luò)信息內(nèi)容的價值(內(nèi)容鑒定),二是判斷網(wǎng)絡(luò)信息是否具有可讀性(技術(shù)鑒定)。
從內(nèi)容鑒定方面看,通過不同的采集手段采集到的信息并不是全都要保存,只有那些反映了真實的社會面貌且有長遠(yuǎn)利用價值的原生網(wǎng)絡(luò)信息才有保存的必要。根據(jù)網(wǎng)絡(luò)信息的特點,內(nèi)容鑒定過程中應(yīng)遵循兩個原則:原生性和價值性。原生性要求保存的網(wǎng)絡(luò)信息必須是第一手產(chǎn)生的,后經(jīng)復(fù)制、粘貼、轉(zhuǎn)載的不納入保存范圍。價值性要求保存的網(wǎng)絡(luò)信息必須是真實可信、未經(jīng)惡意篡改的,具有可茲為憑的憑證價值;或包含一定的知識與信息,具有情報價值;或具有能滿足形成機關(guān)需求的第一價值;或具有對社會、未來有用的第二價值。
從技術(shù)鑒定方面看,是對網(wǎng)絡(luò)信息真實性、完整性、可讀性的分析。真實性是檢測網(wǎng)絡(luò)信息是否是當(dāng)時當(dāng)人當(dāng)事形成的,在形成之后是否經(jīng)過篡改。完整性是檢測網(wǎng)絡(luò)信息的各個要素是否完備,與其相連接的數(shù)據(jù)是否收集齊全??勺x性是檢測網(wǎng)絡(luò)信息是否可在計算機上正常讀出,有沒有鏈接錯誤或亂碼等異常。只有真實、完整、可讀的網(wǎng)絡(luò)信息才能提供利用,具有保存價值。
保管是網(wǎng)絡(luò)信息存檔的三大關(guān)鍵環(huán)節(jié)之一,對于網(wǎng)絡(luò)信息的長期存取利用、網(wǎng)絡(luò)信息價值的發(fā)揮、延續(xù)數(shù)字時代人類的記憶有著重要的作用。網(wǎng)絡(luò)信息的保管就是要長期維護(hù)網(wǎng)絡(luò)信息的真實性、可靠性、可讀性,最大限度地防止和減少損毀以及因為軟硬件過時造成的喪失,保證人們在可預(yù)料的將來能夠獲取該網(wǎng)絡(luò)信息。
從保管方式看,目前對網(wǎng)絡(luò)信息的保管主要有兩種方式:一是將收集到的網(wǎng)絡(luò)信息保存在項目實施機構(gòu)的內(nèi)部網(wǎng)絡(luò)中,如英國網(wǎng)絡(luò)信息保存聯(lián)盟計劃UKWAC 建立本地收藏集中保管網(wǎng)絡(luò)信息[7];二是將收集到的網(wǎng)絡(luò)信息保存到硬盤或磁帶等載體介質(zhì)上,如芬蘭國家圖書館[8]。筆者認(rèn)為,檔案部門將網(wǎng)絡(luò)信息集中傳輸至獨立的、可脫機保存的載體介質(zhì)上將更利于網(wǎng)絡(luò)信息的長久保存和利用。
從保管內(nèi)容看,第一,保管存儲的網(wǎng)絡(luò)信息內(nèi)容。對于保管在內(nèi)部網(wǎng)絡(luò)中的網(wǎng)絡(luò)信息,應(yīng)保管好本地收藏等文件夾;對于脫機保存在載體介質(zhì)上的網(wǎng)絡(luò)信息,應(yīng)保管好存儲載體。第二,保管網(wǎng)絡(luò)信息的各種支持軟硬件。網(wǎng)絡(luò)信息在網(wǎng)絡(luò)上傳播,必須依靠某種專門的計算機軟硬件環(huán)境才能保存、閱讀使用,這就使得我們在保管網(wǎng)絡(luò)信息的同時,還必須保存該網(wǎng)絡(luò)信息貯存的軟硬件利用環(huán)境,包括操作系統(tǒng)、應(yīng)用軟件、硬件設(shè)備等,以保證網(wǎng)絡(luò)信息的長期可讀性,以便日后能使用該網(wǎng)絡(luò)信息。第三,保管網(wǎng)絡(luò)信息相關(guān)的背景信息。這些背景信息包括網(wǎng)絡(luò)信息的產(chǎn)生環(huán)境、產(chǎn)生時間、產(chǎn)生地點、產(chǎn)生原因和受眾等,為網(wǎng)絡(luò)信息提供廣泛的社會文化和歷史線索,能更完整地保存網(wǎng)絡(luò)信息。
從保管技術(shù)看,針對網(wǎng)絡(luò)信息讀取所依賴的計算機軟硬件系統(tǒng)更新?lián)Q代后,網(wǎng)絡(luò)信息對新的軟硬件環(huán)境不兼容等問題,常用的技術(shù)有“遷移”和“仿真”,前者是將網(wǎng)絡(luò)信息轉(zhuǎn)存到新環(huán)境中,后者是模擬出舊環(huán)境。還有一種保存計算機過時的軟硬件設(shè)備的技術(shù)叫“技術(shù)典藏”,強調(diào)應(yīng)保存網(wǎng)絡(luò)信息的原始運作環(huán)境[9]。
目前很多國家及國際性組織都進(jìn)行了網(wǎng)絡(luò)信息存檔的實踐,他們在建設(shè)網(wǎng)絡(luò)信息存檔項目的過程中取得了一定成果,也面臨了一些問題,這給了我國借鑒與啟發(fā)。本文將從我國的實際情況出發(fā),分析我國檔案部門在存檔網(wǎng)絡(luò)信息的過程中可能面臨的問題并對突破方法進(jìn)行初步探索。
目前我國尚無相關(guān)規(guī)定由哪個機構(gòu)來收集保管網(wǎng)絡(luò)信息,是檔案館還是圖書館亦或是形成機關(guān)對網(wǎng)絡(luò)信息進(jìn)行存檔尚不明確,學(xué)術(shù)界對這個問題的看法也并不一致。責(zé)任歸屬不明致使少有人員或機構(gòu)收集、保管網(wǎng)絡(luò)信息,造成海量有價值網(wǎng)絡(luò)信息的嚴(yán)重流失。
不可否認(rèn)的是,檔案館一直擔(dān)負(fù)著保存以紙張、磁帶、光盤等為存儲載體的信息資源的任務(wù),隨著現(xiàn)代信息技術(shù)的發(fā)展及應(yīng)用,一些大中型檔案館已經(jīng)基本具備了保存網(wǎng)絡(luò)信息所需理論研究、標(biāo)準(zhǔn)制定及技術(shù)開發(fā)等方面的能力,且考慮到由檔案部門收藏的網(wǎng)絡(luò)信息更能反映社會原貌,更能保護(hù)好完整的社會記憶,因此檔案部門應(yīng)該承擔(dān)起網(wǎng)絡(luò)信息存檔的重任。我國各級檔案部門可以首先明確各級各類檔案業(yè)務(wù)部門在網(wǎng)絡(luò)信息存檔中的責(zé)任,其次借鑒紙質(zhì)文件收集、歸檔、保管等一整套業(yè)務(wù)規(guī)范來指導(dǎo)網(wǎng)絡(luò)信息存檔的運作,最終以此為基礎(chǔ)建立一整套的責(zé)任體系。
盡管網(wǎng)絡(luò)信息被認(rèn)為是公共資源,但仍有越來越多與知識產(chǎn)權(quán)相關(guān)的法律明確提出了對網(wǎng)絡(luò)信息保護(hù)的規(guī)定,一些網(wǎng)站采用了一定的技術(shù)保護(hù)手段防止復(fù)制和保存其網(wǎng)頁信息。這種觀念上的公共獲取與現(xiàn)實中的版權(quán)保護(hù)之間的沖突形成了網(wǎng)絡(luò)信息存檔領(lǐng)域的知識產(chǎn)權(quán)法律問題,即網(wǎng)絡(luò)信息存檔中有關(guān)主體是否有權(quán)將其捕獲到的網(wǎng)絡(luò)信息加以保存、轉(zhuǎn)換格式、復(fù)制拷貝和提供檢索等。
目前國際社會為解決此問題的一些探索實踐是:一、制定呈繳法。挪威、丹麥已經(jīng)制定了網(wǎng)絡(luò)信息呈繳法,并對呈繳的責(zé)任者、內(nèi)容、方式、格式作出相應(yīng)規(guī)定[10]。二、修改知識產(chǎn)權(quán)法與其它相關(guān)法律。如法國2006年通過的知識產(chǎn)權(quán)法規(guī)定,生產(chǎn)者或出版者不能用代碼或訪問控制來阻止授權(quán)機構(gòu)采集其站點的信息[11]。筆者認(rèn)為我國檔案部門可以借鑒國外的經(jīng)驗,做出自己的探索:其一,我國雖沒有一部關(guān)于網(wǎng)絡(luò)信息的呈繳法律,但是對于傳統(tǒng)印刷型出版物和實體電子出版物的呈繳都有相關(guān)的規(guī)定。我國可以在紙質(zhì)與電子出版物呈繳的基礎(chǔ)上,將呈繳范圍拓展到網(wǎng)絡(luò)信息領(lǐng)域,對網(wǎng)絡(luò)信息具體的呈繳范圍、呈繳時間、呈繳方式等作出明確規(guī)定。其二,我國也可以收縮知識產(chǎn)權(quán)對網(wǎng)絡(luò)信息存檔的限制,增加對網(wǎng)絡(luò)信息的合理使用范圍,通過修改知識產(chǎn)權(quán)法來實現(xiàn)國家公共文化事業(yè)單位對網(wǎng)絡(luò)信息的合理采集與保存。其三,我國還可以與出版者協(xié)商,征求出版者許可發(fā)布的范圍,或發(fā)送版權(quán)聲明詢問可否下載、下載深度,可否公開、何時公開等。
網(wǎng)絡(luò)信息存檔的目標(biāo)是永久保存海量的網(wǎng)絡(luò)信息,數(shù)字化存儲的信息量大、時間長,所需資金必然多。且項目實驗、技術(shù)開發(fā)都需要進(jìn)行大量的初始投資。此外,網(wǎng)絡(luò)信息的價值一般都要經(jīng)過一段相當(dāng)長的時間才會顯現(xiàn)出來,投資回報周期相當(dāng)漫長。所以,實施網(wǎng)絡(luò)信息存檔的主體,其經(jīng)費從何而來是一個嚴(yán)重的問題。
國外比較成功的網(wǎng)絡(luò)信息存檔項目,如美國的LCWA 和IA 項目都是依托國會圖書館的財政支持和商業(yè)機構(gòu)(如Alexa)的捐資贊助來實施的。美國國會圖書館在2003年通過了國家數(shù)字信息基礎(chǔ)設(shè)施和保存計劃,獲得了1 億美元的經(jīng)費支持;2007年美國國家基金會和梅隆基金會資助“藍(lán)帶特別小組”,關(guān)注數(shù)字保存和持續(xù)存取在經(jīng)濟(jì)上的可持續(xù)性發(fā)展等[12]。我國檔案部門若僅僅依靠館內(nèi)自籌是很難滿足網(wǎng)絡(luò)信息存檔的資金需求的,在開展網(wǎng)絡(luò)信息存檔的探索時必須考慮爭取國家財政支持和企業(yè)捐資贊助。
網(wǎng)絡(luò)信息隨時可能因為被忽略、遺忘,甚至只是簡單的短視行為而快速消失,而這種因歷史記憶的丟失而造成的損失將是無法挽回的,作為“構(gòu)建社會記憶主體”的檔案部門秉承著“守護(hù)過去,記錄現(xiàn)在,銘記未來”的歷史使命,在保存網(wǎng)絡(luò)信息、構(gòu)建完整的社會記憶大廈的過程中責(zé)無旁貸,理應(yīng)在網(wǎng)絡(luò)信息存檔方面有所作為。
*本文系國家社科青年基金項目“我國非物質(zhì)文化遺產(chǎn)建檔標(biāo)準(zhǔn)體系研究”(項目批準(zhǔn)號:12CTQ038)、教育部人文社科青年基金項目“基于群體智慧的非物質(zhì)文化遺產(chǎn)檔案管理模式及其實現(xiàn)機制研究”(項目批準(zhǔn)號:12YJC870005)的階段性成果之一。
[1]錢程程.從檔案記憶觀視角看檔案與檔案工作[J].云南檔案,2010,05:3-4.
[2]中國互聯(lián)網(wǎng)絡(luò)信息中心.第33次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告[EB/OL].[2014- 3- 5]. http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201403/t20140305_46240.htm.
[3]安琳.國外網(wǎng)頁信息存檔項目及相關(guān)問題研究[J].圖書館建設(shè),2009,12:107-110+113.
[4][5]劉青,孔凡蓮.中國網(wǎng)絡(luò)信息存檔及其與國外的比較——基于國家圖書館WICP項目的研究[J].圖書情報工作,2013,18:80-86+93.
[6]徐健.英國網(wǎng)絡(luò)信息保存聯(lián)盟計劃(UKWAC)及其啟示.圖書館論壇,2007(2):81-84.
[7]謝春林.英、美、澳、挪網(wǎng)絡(luò)信息保存政策的經(jīng)驗與借鑒[J].情報資料工作,2009,06:40-44.
[8]陳力,郝守真,王志庚.網(wǎng)絡(luò)信息資源的采集與保存——國家圖書館的WICP和ODBN項目介紹[J].國家圖書館學(xué)刊,2004,01:2-6.
[9]陳慰湧,秦建偉.數(shù)字信息長期保存研究現(xiàn)狀分析[J].浙江檔案,2008,01:43-45.
[10]向菁,吳振新.網(wǎng)絡(luò)信息資源保存發(fā)展現(xiàn)狀及趨勢分析[J].中國圖書館學(xué)報,2009,02:34-41.
[11]仇壯麗,許冬玲,卜淑芬.歸檔網(wǎng)絡(luò)信息價值判斷模型之研究現(xiàn)狀與展望[J].檔案學(xué)通訊,2010,06:61-64.
[12]周毅.論網(wǎng)絡(luò)信息存檔權(quán)及其生成[J].中國圖書館學(xué)報,2011,01:102-108.