金鳳
摘要:為了永久保存泰州市應(yīng)對(duì)新冠肺炎疫情這一重大突發(fā)公共衛(wèi)生事件的珍貴記憶,泰州市檔案館收集新冠肺炎疫情防控工作檔案資料并編制成冊(cè)。文章從工作實(shí)踐中深入進(jìn)行對(duì)新媒體檔案的研究,介紹新媒體檔案?jìng)鬟f實(shí)時(shí)、海量存儲(chǔ)、傳播面廣三大特點(diǎn),闡述了新媒體檔案收集的重要性,從確定收集內(nèi)容、收集對(duì)象、收集流程和收集方法四個(gè)方面詳細(xì)介紹本次收集的過程,總結(jié)了新媒體檔案收集的注意事項(xiàng)。
關(guān)鍵詞:新媒體;檔案;收集
檔案是國(guó)家、社會(huì)、個(gè)人一切活動(dòng)的真實(shí)記錄。在新型冠狀病毒肺炎疫情防控工作中,泰州市檔案館在抓疫情防控的同時(shí),立足本職,主動(dòng)作為,積極做好疫情檔案資料收集和指導(dǎo)。在編輯《泰州防控新冠肺炎疫情實(shí)錄》(以下簡(jiǎn)稱防控實(shí)錄)的過程中,明確專職團(tuán)隊(duì)、統(tǒng)籌計(jì)劃安排、建立保障制度,全方位抓好新媒體時(shí)代新冠肺炎疫情防控檔案資料收集處置工作。
新媒體檔案是迎合人們碎片化閱讀的習(xí)慣,依托信息技術(shù)和互聯(lián)網(wǎng)技術(shù),實(shí)現(xiàn)不受時(shí)空限制、互動(dòng)性強(qiáng)、及時(shí)性高的電子檔案。常見的新媒體主要有網(wǎng)站、博客、微信、微博,也包括今日頭條、抖音APP等。載體形式包括文字、圖片、音視頻等。在當(dāng)前云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)技術(shù)的互聯(lián)網(wǎng)時(shí)代下,新媒體檔案具有以下幾個(gè)特點(diǎn):
1.傳遞實(shí)時(shí)。新媒體信息從發(fā)布到用戶反饋,時(shí)間可能是分秒間,極大地縮短了信息傳播的時(shí)間,檔案可以實(shí)時(shí)收集。
2.海量存儲(chǔ)。傳統(tǒng)媒體在信息傳播中受制于時(shí)間、版面,而新媒體檔案的數(shù)量則相當(dāng)可觀,通過云計(jì)算和大數(shù)據(jù)技術(shù),可根據(jù)需要彈性擴(kuò)容,海量信息得以呈現(xiàn)和儲(chǔ)存。
3.傳播面廣。因?yàn)椴僮魅菀?,門檻較低,新媒體的發(fā)布者和受眾范圍很廣,每個(gè)人都可能成為新媒體,每個(gè)人又可以從海量的新媒體中獲取資訊。
1.有利于豐富檔案館館藏
新媒體檔案內(nèi)容翔實(shí),圖文并茂,其中音視頻呈現(xiàn)形式是傳統(tǒng)媒體無法比擬的,是珍貴的檔案資料。通過新媒體檔案的收集,可以彌補(bǔ)檔案館館藏形式單一的缺陷。
2.有利于探索檔案館收集新渠道
新媒體檔案?jìng)鬟f實(shí)時(shí),海量存儲(chǔ),傳播面廣,為檔案收集提供了廣闊的渠道。檔案館可根據(jù)新媒體檔案的特點(diǎn),制訂切實(shí)可行的收集規(guī)則,擴(kuò)大收集范圍。新媒體檔案以其獨(dú)特的形式,為檔案征集開辟了新天地。
3.有利于共同記錄社會(huì)發(fā)展歷史
新媒體檔案是對(duì)社會(huì)發(fā)展歷程的實(shí)時(shí)記錄。由于類型多樣,分布廣泛,檔案館可通過同一專題檔案的收集,實(shí)現(xiàn)檔案的相對(duì)集中管理。特別是針對(duì)某一重大活動(dòng)、重要事件的收集,可以真實(shí)記錄歷史原貌,發(fā)揮檔案資料存史資政的作用。
泰州市檔案館展現(xiàn)責(zé)任擔(dān)當(dāng),搜集泰州地區(qū)新冠肺炎疫情期間防控實(shí)錄,整理成冊(cè),不僅豐富了館藏內(nèi)容,而且為以后提供了歷史參考和經(jīng)驗(yàn)借鑒。
1.收集內(nèi)容
為更好地記錄全市廣大干群積極投身戰(zhàn)疫一線的奉獻(xiàn)精神和英雄壯舉,定格全市上下團(tuán)結(jié)一心、共克時(shí)艱的生動(dòng)場(chǎng)景,永久保存泰州市應(yīng)對(duì)這一重大突發(fā)公共衛(wèi)生事件的珍貴記憶,泰州市檔案館向公眾發(fā)布了疫情防控檔案征集公告,收集內(nèi)容包括反映泰州市范圍疫情防控感人事件、作出貢獻(xiàn)的人物事跡的相關(guān)資料、社會(huì)各界捐贈(zèng)款物記錄、紀(jì)實(shí)資料和宣傳報(bào)道材料等,載體形式有文字、照片、音視頻、實(shí)物等。同時(shí),館內(nèi)成立防控實(shí)錄編輯小組,主動(dòng)深入政府部門網(wǎng)站、微信公眾號(hào)等新媒體系統(tǒng),全方面收集檔案資料。
2.收集對(duì)象
(1)政府網(wǎng)站
政府網(wǎng)站通過政府信息公開向公眾提供信息服務(wù),以保障公眾的知情權(quán)和監(jiān)督權(quán)。政府網(wǎng)站是各級(jí)政府信息化建設(shè)的起點(diǎn),公民、企業(yè)與政府工作人員通過這類綜合的跨部門的業(yè)務(wù)應(yīng)用系統(tǒng),能快速便捷地接入所有相關(guān)政府部門的政務(wù)信息與業(yè)務(wù)應(yīng)用。
(2)政務(wù)微博
政務(wù)微博具有即時(shí)性、分享性、互動(dòng)性的獨(dú)特傳播優(yōu)勢(shì),可推送信息動(dòng)態(tài)、鮮為人知的小故事等,還可進(jìn)行交流互動(dòng),征求群眾意見、接受網(wǎng)上申辦等,是公共服務(wù)的新渠道。
(3)微信公眾號(hào)
政府通過微信公眾號(hào)可廣泛地傳播圖文、音視頻等各種形式的信息,實(shí)現(xiàn)無時(shí)限、無人工的政府信息服務(wù),人民群眾利用一部手機(jī)通過服務(wù)號(hào),輕輕一點(diǎn)或者對(duì)準(zhǔn)二維碼輕輕一掃,就可以了解政策、行業(yè)動(dòng)態(tài)等線下傳統(tǒng)服務(wù)內(nèi)容,還能根據(jù)個(gè)人喜好訂閱或接受精準(zhǔn)推薦等智能化的服務(wù)。
防控實(shí)錄檔案資料收集工作實(shí)踐過程中,工作人員關(guān)注的新媒體主要為泰州范圍內(nèi)政府部門及相關(guān)機(jī)構(gòu)單位官方媒體。(見表1)
3.收集流程
防控實(shí)錄收集流程主要如下:首先館內(nèi)成立編輯小組,制訂收集規(guī)則,確定收集對(duì)象,分別確定收集對(duì)象的網(wǎng)站、微博、公眾號(hào)等新媒體的網(wǎng)址和名稱,明確責(zé)任分工,同步向社會(huì)發(fā)布征集公告,全方位收集新媒體檔案。再根據(jù)收集的檔案,建立類目,同步到總庫(kù)。最后在總庫(kù)上進(jìn)行去重、清洗過濾、主題詞確定等細(xì)致化工作,校對(duì)無誤后歸檔到檔案庫(kù),形成防控實(shí)錄最終版。
防控實(shí)錄確定三級(jí)類目,一級(jí)類目為各部門單位名稱,二級(jí)類目為媒體類型名稱加圖片和視頻兩個(gè)文件類型,三級(jí)類目為檔案的日期。(見圖1)
類目中的日期為檔案內(nèi)容的時(shí)間,區(qū)別于檔案發(fā)布時(shí)間、檔案采集時(shí)間、檔案過濾時(shí)間和檔案收集時(shí)間,它們的關(guān)系可以用圖2來展示。
4.收集方法
(1)頁(yè)面內(nèi)容復(fù)制
工作人員一般所用的方法為頁(yè)面內(nèi)容復(fù)制。打開疫情期間需要收集的政府部門媒體頁(yè)面,復(fù)制所選內(nèi)容,粘貼保存到本地文檔中。這種方法的優(yōu)點(diǎn)是簡(jiǎn)單直接,門檻較低,會(huì)操作電腦的人都可以采用此方法;缺點(diǎn)是有些網(wǎng)站設(shè)置了不可復(fù)制,有些只能復(fù)制文字,圖片則要另外復(fù)制保存后插入,因此需要大規(guī)模批量收集新媒體信息時(shí),效率較低。
(2)利用工具轉(zhuǎn)化
在防控實(shí)錄收集微信公眾號(hào)文章過程中,主要嘗試了三種工具:
①使用騰訊公司自有產(chǎn)品。微信公眾號(hào)和QQ空間都是騰訊公司的產(chǎn)品,他們具有共享性,通過QQ空間可以將微信公眾號(hào)的文章導(dǎo)出。其步驟如下:在目標(biāo)公眾號(hào)中把文章打開,然后分享到QQ空間,再到QQ空間里打開這篇文章,點(diǎn)擊導(dǎo)出為文檔,然后導(dǎo)出為word,發(fā)送到我的電腦。
②使用微信公眾號(hào)編輯網(wǎng)站。以135網(wǎng)站為例,步驟如下:先復(fù)制每個(gè)文章的鏈接,然后打開135網(wǎng)站,導(dǎo)入文章,粘貼地址,在135網(wǎng)站編輯器中就能看到公眾號(hào)完整的文章,然后再?gòu)?fù)制到word。
③使用成品抓取工具文檔導(dǎo)出助手,該工具能批量下載指定公眾號(hào)所有文章,也可以根據(jù)文章鏈接下載單個(gè)文章,缺點(diǎn)是視頻不能下載保存。
(3)網(wǎng)絡(luò)爬取
防控實(shí)錄編輯過程中,充分使用新技術(shù),采取新手段,采用八爪魚和Python爬取等方法來抓取內(nèi)容。主要方法為模擬真實(shí)用戶或者解析HTML,步驟為:確定爬取網(wǎng)址、模擬登陸、獲取爬取頁(yè)及內(nèi)容、將內(nèi)容導(dǎo)出。此方法優(yōu)勢(shì)明顯,能快速爬取大量信息,其間有的網(wǎng)站對(duì)于同一IP短時(shí)間內(nèi)多次訪問要求輸入驗(yàn)證,驗(yàn)證的形式多樣,有的是圖片匹配,導(dǎo)致爬蟲無法長(zhǎng)時(shí)間運(yùn)行,需要采取網(wǎng)絡(luò)代理的方式,模擬多個(gè)IP,繞過網(wǎng)站驗(yàn)證。
1.內(nèi)容真實(shí)性問題
網(wǎng)絡(luò)信息魚龍混雜,良莠不齊,這就要求工作人員在新媒體檔案收集時(shí)務(wù)必對(duì)內(nèi)容真實(shí)性進(jìn)行嚴(yán)格把關(guān),盡可能地選擇官方媒體,以確保檔案信息的真實(shí)性。
2.日期確定問題
新媒體檔案中,常常會(huì)出現(xiàn)日期是“近日”或無法確定日期的情況。防控實(shí)錄是根據(jù)日期制定三級(jí)類目的,如果不能準(zhǔn)確確定檔案日期,會(huì)造成檔案歸類錯(cuò)誤。對(duì)于這種情況,應(yīng)多途徑核對(duì),盡可能找準(zhǔn)檔案形成時(shí)間。
3.檔案去重問題
征集來的檔案可能與從網(wǎng)站、微信、微博收集來的檔案存在重復(fù),同一部門網(wǎng)站、微信、微博中的信息也存在重復(fù)可能,因此需要在臨時(shí)庫(kù)上進(jìn)行去重,以確保檔案內(nèi)容的唯一性。
4.保管期限問題
新媒體檔案收集的是檔案的電子形式,不存在傳統(tǒng)檔案的實(shí)體存儲(chǔ),信息永久保存不難實(shí)現(xiàn),建議將保管期限確定為永久。