羅娜
一、大數(shù)據(jù)的優(yōu)勢
大數(shù)據(jù)的概念提出后不久,該技術(shù)即和云計算一起對于網(wǎng)絡(luò)社區(qū)、氣象災(zāi)害控制、疾病預(yù)防等領(lǐng)域中被廣為運用。由于大數(shù)據(jù)不依賴于隨機抽樣,并未全樣本處理提供了可能,所以大數(shù)據(jù)幫助檔案管理實現(xiàn)了從靜態(tài)向動態(tài)的蛻變以及從因果關(guān)系分析向現(xiàn)實預(yù)測的過渡[1]。下面簡要從“4V”的角度說明大數(shù)據(jù)的優(yōu)勢:
1.1 數(shù)量(Volume)
大數(shù)據(jù)技術(shù)可以處理TB級的數(shù)據(jù)量,通過改進算法和運算方式,甚至可以獲得對于更大數(shù)據(jù)量的處理能力,符合當(dāng)今數(shù)據(jù)爆炸性增長的趨勢。
1.2 價值(Value)
大數(shù)據(jù)進行全樣本的分析,因而這一數(shù)據(jù)挖掘過程往往會得出一些極富價值的結(jié)論。
1.3 種類(Variety)
分析的數(shù)據(jù)種類極為多樣化,包括文字資料、數(shù)據(jù)資料、圖像資料乃至影音資料等。
1.4 速度(Veloctiy)
大數(shù)據(jù)處理要求在秒級的時間跨度內(nèi)給出分析結(jié)果,這與傳統(tǒng)的數(shù)據(jù)分析方式有著本質(zhì)區(qū)別。
二、大數(shù)據(jù)時代檔案管理的可靠性變革
傳統(tǒng)的檔案管理模式中,檔案由專人于專門場所保存,一旦檔案失竊或者檔案儲存場所遭受了自然災(zāi)害,那么被保存的檔案容易遭受到不可逆的破壞。而在大數(shù)據(jù)時代,數(shù)據(jù)的存儲往往依托于多臺主機完成,即便某一臺服務(wù)器發(fā)生了故障,系統(tǒng)也可以由其他服務(wù)器支撐運行而不至于陷入癱瘓狀態(tài)。并且,因為數(shù)據(jù)通過云端在不同服務(wù)器上有所備份,所以這類故障并不會造成嚴(yán)重的數(shù)據(jù)丟失問題,例如,陜西省近期在西安重點建設(shè)灃西大數(shù)據(jù)產(chǎn)業(yè)園,其將實現(xiàn)數(shù)據(jù)的規(guī)?;型掏隆⑸顚哟握戏治?、多領(lǐng)域社會應(yīng)用、高效益持續(xù)增值作為發(fā)展目標(biāo),意在成為國家政務(wù)資源后臺處理與備份中心、國家級大數(shù)據(jù)處理中心和國內(nèi)最大的信息資源聚集服務(wù)區(qū),目前,中國聯(lián)通、中國移動和中國電信三大運營商以及全國人口數(shù)據(jù)處理與備份(西安)中心、陜西廣電網(wǎng)絡(luò)等項目已入?yún)^(qū),只要三大運營商在某一片區(qū)的服務(wù)器出現(xiàn)了問題并因此丟失了數(shù)據(jù),儲存于此處的備份數(shù)據(jù)將會立刻派上用場。當(dāng)然,在不同服務(wù)器之間進行傳播的過程中可能會引發(fā)檔案泄露等問題,因此,高校檔案管理系統(tǒng)在大數(shù)據(jù)化改革的過程中使用權(quán)限控制程序、存儲隔離、傳輸層加密、數(shù)據(jù)檢驗、數(shù)據(jù)備份、分布式存儲等技術(shù)來保證被保存數(shù)據(jù)的安全可靠。
三、大數(shù)據(jù)時代檔案管理的高共享性變革
現(xiàn)有的檔案管理中,由于不同檔案歸屬于不同部門管理,并且同一檔案在制作的過程中也往往需要經(jīng)由不同部分,在這種分開管理的模式下,不同部門之間的交互作用相對較少,這就導(dǎo)致了“信息孤島”的產(chǎn)生,信息的缺乏使得信息的使用者無法有效挖掘數(shù)據(jù)的全部內(nèi)容。與之對應(yīng),大數(shù)據(jù)技術(shù)作為檔案管理中的新元素,可以保障用戶對于數(shù)據(jù)的共享性,其通過多個節(jié)點構(gòu)建了較節(jié)省存儲空間的用戶間數(shù)據(jù)交流的平臺,一方面?zhèn)鹘y(tǒng)檔案部門難以充分利用信息的困境將會得到有效緩解,不同部門之間將會發(fā)揮自身特定的信息優(yōu)勢,將同一問題的不同角度結(jié)合起來,更為科學(xué)地解決問題;另一方面,大數(shù)據(jù)技術(shù)也可以減少檔案重復(fù)建設(shè)等因素所附加的成本,每個檔案管理部門只需要重點建設(shè)與自身需求有關(guān)的部分,而對于共性的內(nèi)容,則可以直接借鑒其他部門的資料。
四、大數(shù)據(jù)時代檔案管理的高附加值化變革
較之傳統(tǒng)的檔案管理,引入了大數(shù)據(jù)技術(shù)的高校檔案管理工作可以創(chuàng)造出更高的單位附加值,一般而言,不同的檔案管理模式創(chuàng)造出來的每封檔案的附加價值是存有差異的,檔案交流程度、檔案存儲數(shù)目、檔案檢索方式和檔案覆蓋率等因素均會影響到被保存檔案的價值。大數(shù)據(jù)改革可以減少檔案管理中所需要的場地和人力,并使檔案管理擺脫存儲空間的約束,海量的數(shù)據(jù)被存儲于云端或者不同節(jié)點,數(shù)據(jù)管理者可以對于這些數(shù)據(jù)進行全樣本的分析,進而發(fā)生數(shù)據(jù)背后蘊含的深層次的信息價值。此外,既然更大數(shù)量級的數(shù)據(jù)處理技術(shù)變?yōu)榱爽F(xiàn)實,那么不同信息儲藏部門之間也就不需要再擔(dān)心信息處理能力不足所致的信息失效問題,其相互之間達成有關(guān)信息共享的協(xié)議的可能性增加,在這種背景下,高校內(nèi)各部門乃至各單位的檔案聯(lián)系更為密切,檔案管理者或者數(shù)據(jù)發(fā)掘者可以采用一種交叉學(xué)科的視角,更為全面地解釋一個社會問題,而在紙質(zhì)檔案時代或電子檔案時代初期,不同部門之間的信息獲取壁壘使得解釋者的思維往往囿于自身所掌握的有限資料,這既無益于解決對應(yīng)問題,還容易造成從業(yè)人員思維方式的“僵化”。
綜上,大數(shù)據(jù)技術(shù)自身的特點決定了其必然會為高校的檔案管理工作注入諸多新的元素,包括檔案管理系統(tǒng)在可靠性、共享性乃至信息附加值上的改變等,可以說,這種變革是一種雙面的創(chuàng)新,如果其成功過渡,將會對提高我國高校檔案管理工作的能力和效率大有裨益,但與此同時,這一過程中存在的風(fēng)險及問題也是檔案工作者所必須正視的問題。因此,如何有效抓住大數(shù)據(jù)時代的機遇實現(xiàn)有效的技術(shù)創(chuàng)新是高校檔案管理工作所必須認真思考的問題。
(作者單位:陜西榆林學(xué)院黨政辦公室機要科)