范曉青 黃芹俠
在信息化時(shí)代,隨著信息技術(shù)的深入發(fā)展,知識(shí)傳播與傳承介質(zhì)形式正在發(fā)生深刻的變化,傳統(tǒng)紙介質(zhì)的使用正在不斷減少,逐步向數(shù)字化的電子介質(zhì)轉(zhuǎn)移已經(jīng)成為一個(gè)不可逆轉(zhuǎn)的趨勢(shì),在電子時(shí)代如何保存數(shù)字化信息,留下時(shí)代的烙印,傳承社會(huì)文化已經(jīng)成為一個(gè)不可回避的問(wèn)題。自2014年微信推出以來(lái),以燎原之勢(shì)發(fā)展,2018年2月,微信全球用戶月活數(shù)首次突破10億大關(guān),用戶覆蓋多個(gè)國(guó)家,微信以比任何媒體都廣泛的覆蓋面迅速擴(kuò)張。為適應(yīng)時(shí)代的發(fā)展,綜合檔案館也紛紛開(kāi)通微信公眾號(hào),公布數(shù)據(jù),提供服務(wù),開(kāi)發(fā)館藏,擴(kuò)大影響力。筆者以行政區(qū)劃名加檔案的關(guān)鍵詞搜索檔案微信公眾號(hào),34個(gè)省級(jí)行政區(qū)劃?rùn)n案館微信公眾號(hào)開(kāi)通率達(dá)80%。332個(gè)地級(jí)行政區(qū)共有176家檔案館開(kāi)通檔案微信公眾號(hào)。檔案微信公眾號(hào)正以成為比網(wǎng)頁(yè)宣傳更即時(shí)的一種方式。
微信傳播即時(shí)化方便廣大群眾的同時(shí),如何對(duì)這些轉(zhuǎn)瞬即逝的數(shù)據(jù)信息進(jìn)行保存,為歷史留下一些線索,把數(shù)據(jù)庫(kù)中冰冷的字符還原成當(dāng)時(shí)的激情與風(fēng)貌,成為我們檔案工作者應(yīng)該思考的問(wèn)題,是必須并且緊迫的事情。本文將就微信歸檔的一些基本問(wèn)題進(jìn)行一些初步探討,供大家參考。
一、目前檔案微信公眾號(hào)的現(xiàn)狀
從目前開(kāi)通的檔案微信公眾號(hào)看,按發(fā)送信息的內(nèi)容大致將其分為: 局館信息、檔案知識(shí)、本地特色、外埠檔案和其他五類,其中局館信息占26%;檔案知識(shí)占5%;本地特色51.8%,外埠檔案占6.8%;其他共10.3%。
檔案局(館)公眾號(hào)發(fā)送信息的格式多為圖片與文字相結(jié)合,占所有形式的96.7%;單純的文字格式只有3.2%;視頻信息占比0.74%。
二、檔案微信公眾號(hào)歸檔的必要性
(一)從檔案微信公眾號(hào)的功能看
檔案微信公眾號(hào),一般情況為檔案局(館)申請(qǐng)開(kāi)通,多為與局(館)業(yè)務(wù)相關(guān)內(nèi)容,或者根據(jù)館藏進(jìn)行二次開(kāi)發(fā)后的編研成果。總共可以分為兩個(gè)方面的主題,一個(gè)是文化宣傳類的,一個(gè)是服務(wù)類的。文化宣傳類的,可以反映局(館)在一定時(shí)期的工作信息和編研成果情況,工作信息能夠從一個(gè)側(cè)面反映機(jī)關(guān)工作開(kāi)展情況,編研成果對(duì)今后的編研具有一定的查考價(jià)值。服務(wù)類的則能反應(yīng)一定時(shí)期內(nèi)的檔案服務(wù)手段和狀況。根據(jù)歸檔范圍的定義:凡是反映本機(jī)關(guān)工作活動(dòng)、具有查考利用價(jià)值的文件材料均屬歸檔范圍。因此微信公眾號(hào)中有價(jià)值的內(nèi)容必須進(jìn)行歸檔。
(二) 從資源和記憶的角度看
在信息化、社會(huì)轉(zhuǎn)型的大背景下,記錄人類的生產(chǎn)生活的方式已不僅僅局限于文字,從傳統(tǒng)的文字逐漸演變,產(chǎn)生了錄音、錄像、圖片等多媒體檔案,信息傳播的載體也從傳統(tǒng)的紙張擴(kuò)大到了網(wǎng)絡(luò)、手機(jī)終端,隨之而來(lái)產(chǎn)生的網(wǎng)絡(luò)信息、微信公眾號(hào)信息也慢慢進(jìn)入公眾視野,成為我們需要關(guān)注的歸檔對(duì)像。無(wú)論從來(lái)源、內(nèi)容、載體來(lái)看,當(dāng)今社會(huì)的歸檔信息正在從“官方記錄”為主型向多元豐富的社會(huì)資源體系發(fā)展。馮惠玲教授的《檔案記憶觀——資源觀與——中國(guó)記憶——數(shù)字資源建設(shè)》一文中所說(shuō)“檔案工作者有責(zé)任通過(guò)自身的業(yè)務(wù)活動(dòng)積極主動(dòng)地參與集體記憶的建構(gòu)、 維護(hù)與傳承”。我們檔案工作者應(yīng)積極主動(dòng)地研究檔案微信公眾號(hào)的歸檔。
鑒于以上兩點(diǎn),新興的微信公眾號(hào)的歸檔也應(yīng)成為我們研究的內(nèi)容。因?yàn)樗巧鐣?huì)的記憶,更是檔案新媒體資源的一部分。微信公眾號(hào)從佐證集體記憶的角度,為集體記憶提供了佐證。
三、 如何歸檔
(一) 歸檔的卷宗問(wèn)題
關(guān)于檔案微信公眾號(hào)信息歸檔國(guó)內(nèi)尚無(wú)通用方法,可參照紙質(zhì)文檔管理方式,將一篇微信文章視為一件,多篇合為一個(gè)子類如月刊、雙月刊,一年或多年“成集”封裝成一類如合訂本。在歸檔時(shí),可將微信作為專題業(yè)務(wù)檔案進(jìn)行保存,如“微信類”檔案類,類下可分為“首頁(yè)子類”、“專題子類”;“首頁(yè)子類”從首頁(yè)開(kāi)始,向下保存N層,更深層次信息不再保存;“專題子類”如“工作信息”“紅色記憶”“檔案?jìng)髡妗钡?,針?duì)某一專題進(jìn)行更全面的歸檔。 “首頁(yè)子類”更側(cè)重于保存當(dāng)前微信公眾號(hào)的各個(gè)層級(jí)的界面歷史風(fēng)貌,而“專題子類”更多則重于信息保存。
(二)元數(shù)據(jù)采集
歸檔須要有“信息保存、信息發(fā)布憑證、時(shí)代文化承載”這個(gè)三方面的內(nèi)容,以留下歷史足跡、反映社會(huì)風(fēng)貌、傳承時(shí)代文化。檔案微信公眾號(hào)與傳統(tǒng)檔案相比,有共同的元素,也有不相同的地方。參照傳統(tǒng)文書檔案的歸檔元數(shù)據(jù)采集范圍,筆者認(rèn)為微信公眾號(hào)的元數(shù)據(jù)采集,應(yīng)該包括以下內(nèi)容,如右圖所示。
有兩個(gè)需要說(shuō)明的內(nèi)容:1.部分精選留言可以做為正文的附件,歸檔保存。如新華社短短的九個(gè)字的新聞,“剛剛,沙特王儲(chǔ)被廢了”全文僅有一句話,但是卻引起了極大的反響,網(wǎng)友反應(yīng)熱烈,留言區(qū)成為最大的亮點(diǎn)。那么,像這樣的微信文章歸檔,筆者認(rèn)為,留言必須成為一個(gè)重要的內(nèi)容進(jìn)行留存,這樣才能最大限度保存住當(dāng)時(shí)的真實(shí)情況,更生動(dòng)的展示這件檔案背后的社會(huì)記憶。2. 關(guān)于超鏈接。微信文章的超鏈接不同于其他媒體的超鏈接,可以會(huì)指關(guān)聯(lián)性的內(nèi)容,微信文章的超鏈接更多的是對(duì)本微信公眾號(hào)的其他推送文章進(jìn)行推送,因此,筆者認(rèn)為,微信公眾號(hào)的超鏈接可以在歸檔時(shí)予以清除,以最大限度的保證歸檔信息的唯一性。
元數(shù)據(jù)的捕獲與修訂在對(duì)每一卷進(jìn)行封裝,以及按子類、類打包時(shí)進(jìn)行,元數(shù)據(jù)內(nèi)容可以從微信頁(yè)面上實(shí)時(shí)捕獲,也可以按規(guī)則自動(dòng)添加或手動(dòng)添加標(biāo)注。
(三)歸檔文件格式的選擇
作為新興媒體的微信公眾號(hào),其歸檔可以參照同為新媒體的網(wǎng)頁(yè)歸檔的處理方式,采用網(wǎng)頁(yè)抓取工具,如網(wǎng)絡(luò)爬蟲等軟件,進(jìn)行微信頁(yè)面抓取。微信頁(yè)面為HTML語(yǔ)言開(kāi)發(fā),考慮到HTML的標(biāo)準(zhǔn)化問(wèn)題,防止保存的網(wǎng)頁(yè)文件失真,可采用“雙數(shù)據(jù)源”方式保存,既保存一份原始的HTML文檔,同時(shí)再將HTML文檔轉(zhuǎn)化為版式文檔進(jìn)行保存。選擇版式文檔格式首先要考慮的是其應(yīng)用的廣泛性、標(biāo)準(zhǔn)的公開(kāi)性和商品化程度,依據(jù)這一原則,2016年我國(guó)出臺(tái)了通用版式(OFD格式)標(biāo)準(zhǔn),采用國(guó)家標(biāo)準(zhǔn)無(wú)疑是最好的選擇,但鑒于國(guó)家標(biāo)準(zhǔn)尚不完善,普級(jí)面尚不如PDF大,在現(xiàn)階段,可以另存一份PDF格式作為備份,雖然這樣會(huì)造成一定的數(shù)據(jù)冗余,但可以最大程度地規(guī)避一些風(fēng)險(xiǎn)。
(四)關(guān)于微信電子文件的封裝
按時(shí)間封裝時(shí)采用時(shí)間基準(zhǔn)方法,以某一時(shí)間為基準(zhǔn)點(diǎn),如1月1日0時(shí)0分,對(duì)所有卷進(jìn)行數(shù)據(jù)打包,然后按封裝時(shí)間間隔或全時(shí)兩種模式進(jìn)行增量封裝。在按固定時(shí)間間隔封裝時(shí),可以按每周一次或每半月一次進(jìn)行增量打包。
(五)微信公眾號(hào)電子文件管理相關(guān)標(biāo)準(zhǔn)
在進(jìn)行網(wǎng)頁(yè)歸檔管理時(shí),應(yīng)參照國(guó)家有關(guān)電子文件管理相關(guān)辦法、標(biāo)準(zhǔn)與規(guī)范等,結(jié)合微信歸檔實(shí)際情況,制訂相應(yīng)的“微信類”電子文件的管理辦法及相關(guān)標(biāo)準(zhǔn)規(guī)范。這類標(biāo)準(zhǔn)規(guī)范內(nèi)容涉及對(duì)電子文件的捕獲、整理、封裝,以及對(duì)微信類電子檔案的保管、利用、統(tǒng)計(jì)、存儲(chǔ)、備份、轉(zhuǎn)換、遷移、銷毀及移交等多個(gè)環(huán)節(jié)。但是一個(gè)標(biāo)準(zhǔn)的出臺(tái),往往需要大量的實(shí)踐,目前微信類電子文件的歸檔,可以先參考其他電子文件歸檔的標(biāo)準(zhǔn),進(jìn)行相應(yīng)的探索,以期不久的將來(lái),能出臺(tái)微信電子文件歸檔的相關(guān)標(biāo)準(zhǔn)。
(六)建立相應(yīng)的微信公眾號(hào)電子文件歸檔管理系統(tǒng)
在進(jìn)行微信歸檔管理時(shí),應(yīng)參照國(guó)家有關(guān)電子文件管理相關(guān)要求,建設(shè)微信公眾號(hào)歸檔管理模塊,并嵌入到現(xiàn)有的數(shù)字檔案室系統(tǒng)中去,以實(shí)現(xiàn)電子文件的統(tǒng)一管理和利用。微信公眾號(hào)歸檔管理模塊應(yīng)包含采集、歸檔與管理三個(gè)主要的功能模塊。采集模塊主要實(shí)現(xiàn)數(shù)據(jù)采集功能,通過(guò)網(wǎng)頁(yè)爬蟲工具對(duì)指定微信公眾號(hào)進(jìn)行按規(guī)劃自動(dòng)增量采集,對(duì)采集到的微信頁(yè)面按標(biāo)準(zhǔn)規(guī)范進(jìn)行元數(shù)據(jù)整理、原始信息的封裝與保存、可視化封裝與保存。歸檔模塊對(duì)初步封裝的數(shù)據(jù)包進(jìn)行元數(shù)據(jù)摘錄、自動(dòng)分類歸檔,數(shù)據(jù)入庫(kù)等。管理模塊對(duì)數(shù)據(jù)實(shí)行管理,進(jìn)行數(shù)據(jù)簽名驗(yàn)證,提供在線服務(wù)接口,提供授權(quán)管理機(jī)制,提供服務(wù)接口,數(shù)據(jù)導(dǎo)入導(dǎo)出接口,數(shù)據(jù)離線包生成、導(dǎo)出等功能。
(作者單位:江蘇省泰州市檔案館)