文/楊文剛 Yang Wen-gang
大數(shù)據(jù)背景下檔案館的建設(shè)研究
文/楊文剛 Yang Wen-gang
The Security of Archival Information Sharing Platform in the Big-Data Era
大數(shù)據(jù)是伴隨著云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)發(fā)展而衍生的又一熱門研究,從概念角度看,大數(shù)據(jù)是大數(shù)據(jù)理論、大數(shù)據(jù)技術(shù)、大數(shù)據(jù)應(yīng)用、大數(shù)據(jù)工程等領(lǐng)域的總稱。大數(shù)據(jù)為檔案館建設(shè)帶來(lái)了機(jī)遇與挑戰(zhàn)。檔案館的建設(shè)必須以現(xiàn)狀為立足點(diǎn),剖析不足,勇于創(chuàng)新。
檔案館建設(shè);大數(shù)據(jù);資源建設(shè);檔案服務(wù)
近些年來(lái),國(guó)內(nèi)各行各界對(duì)于大數(shù)據(jù)的關(guān)注也在不斷增長(zhǎng),研究成果也在不斷推出,2011年在《科學(xué)》雜志上的《聚焦數(shù)據(jù)管理》中就提出了數(shù)據(jù)就是科學(xué)、數(shù)據(jù)就是金礦的觀點(diǎn)。[1]如何順應(yīng)潮流,將大數(shù)據(jù)更好、更快的融入到檔案館建設(shè)中,發(fā)展檔案大數(shù)據(jù)應(yīng)用,也成為檔案界十分關(guān)注和研究探索的一個(gè)新問(wèn)題。
(一)思維觀念方面
傳統(tǒng)的檔案主要是以紙質(zhì)為載體或以實(shí)物的形式存在的,檔案館只需要提供足夠的物理空間就可以很好的完成對(duì)這些檔案的保管與利用,而對(duì)于數(shù)字檔案資源的建設(shè)仍處于探索和嘗試階段,大部分檔案館員對(duì)數(shù)字檔案持著觀望或保守的態(tài)度。大數(shù)據(jù)則是以數(shù)據(jù)和計(jì)算機(jī)技術(shù)為核心的一項(xiàng)系統(tǒng)工程,如果不能將館藏資源轉(zhuǎn)化為計(jì)算機(jī)可識(shí)別的數(shù)字資源,那么檔案館建設(shè)與大數(shù)據(jù)也將無(wú)法接軌。[2]
(二)資源建設(shè)方面
館藏資源數(shù)量有限,數(shù)據(jù)類型相對(duì)單一。受傳統(tǒng)檔案管理模式的影響,檔案館一般只接收歸檔范圍內(nèi)的文件及電子文件,收集的這些電子檔案大部分以文本形式存在,而忽視了對(duì)如數(shù)據(jù)表格、圖片、視頻、媒體流數(shù)據(jù)等非結(jié)構(gòu)化數(shù)字資源的建設(shè)。
基礎(chǔ)設(shè)施建設(shè)投入有限,難于應(yīng)對(duì)大數(shù)據(jù)的沖擊。受檔案館信息化建設(shè)經(jīng)費(fèi)的限制,很多檔案館無(wú)法購(gòu)置大量的磁盤陣列用于存儲(chǔ)大數(shù)據(jù)時(shí)代的海量數(shù)據(jù),同時(shí)受到服務(wù)器性能的限制,檔案館也無(wú)法對(duì)海量數(shù)據(jù)進(jìn)行實(shí)時(shí)處理并及時(shí)響應(yīng)用戶的請(qǐng)求,嚴(yán)重影響了檔案館與用戶之間的交互體驗(yàn)。
檔案館在處理非結(jié)構(gòu)化數(shù)據(jù)方面能力不足。傳統(tǒng)的數(shù)字檔案館資源建設(shè)大多是依托于關(guān)系型數(shù)據(jù)庫(kù)進(jìn)行管理的,關(guān)系型數(shù)據(jù)庫(kù)擅長(zhǎng)處理結(jié)構(gòu)化數(shù)據(jù),而對(duì)于半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的處理顯得力不從心。大數(shù)據(jù)時(shí)代,非結(jié)構(gòu)化數(shù)據(jù)將成為主流數(shù)據(jù),所以,檔案館在大數(shù)據(jù)背景下的數(shù)據(jù)管理模式也必將有所改變。
(三)利用服務(wù)方面
重藏輕用,缺乏數(shù)據(jù)分析能力和對(duì)用戶深度服務(wù)的意識(shí)。檔案館還處于資源保管中心的位置,只注重對(duì)資源的建設(shè)和儲(chǔ)存,卻忽視了對(duì)館藏資源的有效整合,檔案館員更是缺乏對(duì)這些資源進(jìn)行數(shù)據(jù)分析與挖掘的意識(shí),更無(wú)法通過(guò)挖掘新的信息為檔案用戶提供深度服務(wù)。
缺少與用戶的交互,無(wú)法對(duì)用戶提供個(gè)性化服務(wù)。在檔案利用過(guò)程中,檔案館員往往處于被動(dòng)狀態(tài),只有當(dāng)用戶主動(dòng)提出明確需求后,檔案館員才會(huì)根據(jù)現(xiàn)有館藏資源為用戶提供利用服務(wù),一旦用戶不能明確自身的檔案需求,檔案服務(wù)就會(huì)陷入僵局,檔案館員缺乏這種通過(guò)與用戶之間的交互來(lái)挖掘用戶需求,并為用戶提供個(gè)性化服務(wù)的能力。
制度規(guī)范方面,從國(guó)家到地方檔案館還沒(méi)有成熟的操作性較強(qiáng)的檔案數(shù)字化建設(shè)規(guī)范,使得檔案館在資源建設(shè)中標(biāo)準(zhǔn)不一,對(duì)于未來(lái)的大數(shù)據(jù)整合和共享十分不利。所以亟待國(guó)家檔案科研及管理機(jī)構(gòu)聯(lián)合提出檔案資源建設(shè)的行業(yè)標(biāo)準(zhǔn),來(lái)指導(dǎo)各地檔案館的資源建設(shè)工作。
首先,要樹(shù)立檔案大數(shù)據(jù)思維。在小數(shù)據(jù)時(shí)代,由于無(wú)法獲得全數(shù)據(jù),數(shù)據(jù)分析是通過(guò)抽樣分析來(lái)預(yù)測(cè)總體趨勢(shì),預(yù)測(cè)結(jié)果往往依賴于抽樣數(shù)據(jù)的準(zhǔn)確性,注重的是采樣數(shù)據(jù)與分析結(jié)果的因果關(guān)系。而大數(shù)據(jù)時(shí)代,由于可以獲得全數(shù)據(jù),在數(shù)據(jù)分析過(guò)程中對(duì)于單體數(shù)據(jù)的精確度要求并不高,其注重的是數(shù)據(jù)與事物之間的相關(guān)關(guān)系,大數(shù)據(jù)的出現(xiàn)開(kāi)啟了信息社會(huì)由自然思維轉(zhuǎn)向智能思維的大門。
其次,擴(kuò)展檔案收集范圍,加強(qiáng)資源建設(shè)。大數(shù)據(jù)背景下,檔案資源呈現(xiàn)多元化現(xiàn)象,除了包括對(duì)傳統(tǒng)紙質(zhì)檔案的數(shù)字化和索引數(shù)據(jù)庫(kù)的建立外,還包括社交媒體上產(chǎn)生的大量信息資源,基于物聯(lián)網(wǎng)射頻識(shí)別技術(shù)的檔案?jìng)鬟f信息、庫(kù)房監(jiān)控信息、用戶行為信息,通過(guò)移動(dòng)互聯(lián)網(wǎng)產(chǎn)生的檔案館與用戶的交互信息,通過(guò)數(shù)據(jù)挖掘工具發(fā)現(xiàn)新的知識(shí)信息等。這就要檔案管理者開(kāi)拓視野,增強(qiáng)收集意識(shí),不斷擴(kuò)展收集范圍,與時(shí)俱進(jìn)掃清檔案收集盲點(diǎn),努力實(shí)現(xiàn)檔案全數(shù)據(jù)的收集。
再次,增加與用戶的交互。傳統(tǒng)的檔案館在利用服務(wù)中一直處于被動(dòng)的狀態(tài),只有用戶來(lái)到檔案館提出對(duì)檔案的利用需求后,才可能得到相關(guān)的信息服務(wù)。而在大數(shù)據(jù)背景下,檔案館則應(yīng)改變這種傳統(tǒng)姿態(tài),本著用戶至上的服務(wù)意識(shí),積極主動(dòng)與用戶進(jìn)行信息交流,主動(dòng)開(kāi)放公共目錄。同時(shí)通過(guò)社交媒體網(wǎng)絡(luò)和移動(dòng)互聯(lián)網(wǎng)與檔案用戶進(jìn)行更多的交互,
又次,完善相關(guān)規(guī)范標(biāo)準(zhǔn),保障信息安全。網(wǎng)絡(luò)技術(shù)的發(fā)展如同一把雙刃劍,一方面它帶動(dòng)了大數(shù)據(jù)的發(fā)展,另一方面它又使數(shù)據(jù)信息面臨著安全隱患的問(wèn)題。大數(shù)據(jù)時(shí)代下的檔案館面臨著巨大的信息安全隱患。檔案是一種含有密級(jí)屬性的特殊信息,一些具有安全密級(jí)或涉及個(gè)人隱私的檔案信息是不能公開(kāi)開(kāi)放的,所以,要發(fā)展檔案館的大數(shù)據(jù)必須以確保檔案信息的安全為前提。
最后,加強(qiáng)人才培養(yǎng),推動(dòng)大數(shù)據(jù)在檔案館建設(shè)中的應(yīng)用。大數(shù)據(jù)是一門綜合的學(xué)科,它涵蓋了數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理與數(shù)據(jù)應(yīng)用等方面的知識(shí)和技巧。大數(shù)據(jù)的實(shí)施是一項(xiàng)憑借個(gè)人能力所無(wú)法完成的系統(tǒng)工程,這就要求檔案館培養(yǎng)并組建一支由綜合型人才組成的大數(shù)據(jù)團(tuán)隊(duì),來(lái)共同實(shí)施大數(shù)據(jù)在檔案館中的應(yīng)用。
大數(shù)據(jù)是信息社會(huì)高速發(fā)展的必然產(chǎn)物,為了使檔案館更好的融入大數(shù)據(jù)環(huán)境,本文從思維觀念、資源建設(shè)、服務(wù)利用、制度規(guī)范這四個(gè)維度分析了檔案館在大數(shù)據(jù)背景下存在的不足和問(wèn)題,然后提出檔案未來(lái)發(fā)展的建設(shè)途徑,以期為檔案館發(fā)展提供借鑒與參考。
(責(zé)任編輯:聞 道)
[1] 李廣建,化柏林.大數(shù)據(jù)分析與情報(bào)分析關(guān)系辨析[J].中國(guó)圖書(shū)館學(xué)報(bào),2014,(5).
[2] 周美蘭.大數(shù)據(jù)時(shí)代高校檔案資源體系建設(shè)的思考[J].山西檔案,2015,(1).
G270
A
1005-9652(2016)04-0067-02
楊文剛(1981—),男,天津人,天津師范大學(xué)檔案館館員,碩士。