■
濰坊職業(yè)學(xué)院
現(xiàn)階段,信息化檔案的發(fā)展已經(jīng)給各行各業(yè)帶來(lái)了快捷,而大數(shù)據(jù)環(huán)境下的檔案管理也愈發(fā)精進(jìn),打破了傳統(tǒng)檔案的局限性,迎合了新時(shí)期的市場(chǎng)需求。但是不可否認(rèn)的是在發(fā)展過(guò)程中仍存在著諸多問(wèn)題亟待解決,所以筆者就此展開(kāi)探討,目的是促進(jìn)檔案在信息化環(huán)境中的有效轉(zhuǎn)變。
大數(shù)據(jù)即是利用精確的發(fā)掘、采集和分析力,在龐大的數(shù)據(jù)庫(kù)中獲取有效信息的技術(shù)手段,優(yōu)勢(shì)在于價(jià)值高、數(shù)據(jù)多、速度快、體積大。價(jià)值高即是能有效提煉出需要的信息,完成效率性的篩選和利用;數(shù)據(jù)多即是其中涵蓋的數(shù)據(jù)類型復(fù)雜,需要找到其中相互關(guān)聯(lián)的有效信息;速度快即是數(shù)據(jù)能在短時(shí)間內(nèi)生成和傳播,減少了傳統(tǒng)檔案管理的壓力;體積大即是強(qiáng)大的運(yùn)算分析功能可以將數(shù)據(jù)甄別并處理,節(jié)省了大量的人力。
大數(shù)據(jù)檔案相似于大數(shù)據(jù)的特點(diǎn),稍有不同在于數(shù)據(jù)缺少集中性且更為真實(shí)準(zhǔn)確。具體來(lái)講:其一,資源龐大。由于傳統(tǒng)檔案正在向信息化檔案過(guò)渡,所以電子檔案的數(shù)量也在日益增長(zhǎng),速度極快,在短時(shí)間內(nèi)就會(huì)達(dá)到海量的規(guī)模。其二,種類繁多。就檔案本身來(lái)講,其類型就分為很多種,充分滲透于教育領(lǐng)域、機(jī)關(guān)單位、事業(yè)企業(yè)以及金融行業(yè)等等,在形式上又可分為紙質(zhì)化和電子化,電子檔案可以打破傳統(tǒng)檔案的局限性,從圖文轉(zhuǎn)變?yōu)閳D文、視頻、音頻等多種形式,由此可見(jiàn),數(shù)據(jù)量也呈現(xiàn)出規(guī)?;l(fā)展形勢(shì)。其三,效率管理。信息技術(shù)推動(dòng)了各個(gè)領(lǐng)域的時(shí)效性發(fā)展,系統(tǒng)要在短時(shí)間內(nèi)完成數(shù)據(jù)的采集、歸納、分析、整合、生成,為檔案管理工作提供了有利條件。其四,作用明顯。檔案本質(zhì)上是為人們提供權(quán)威可靠信息的主要憑證,所以利用價(jià)值明顯,但是信息較為分散,需要集中整理歸納。
首先,服務(wù)形式單一。一般來(lái)講,部分檔案具有保密性質(zhì),所以對(duì)群眾開(kāi)放較少,服務(wù)形式較為單一。其次,基礎(chǔ)業(yè)務(wù)不足。信息化檔案還處于發(fā)展初期,基礎(chǔ)業(yè)務(wù)還有待加強(qiáng)。再者,保障技術(shù)匱乏。電子化檔案的傳遞和共享都需要互聯(lián)網(wǎng)技術(shù)的支持,可網(wǎng)絡(luò)過(guò)于虛擬,電子信息又有易刪除、易復(fù)制、易篡改的特點(diǎn),若缺少保障技術(shù)則在一定程度上增加了信息的不安全性和不準(zhǔn)確性。最后,員工能力不強(qiáng)。信息化檔案不僅要求員工掌握基本管理技術(shù)和檔案知識(shí),還要提高信息技術(shù)的應(yīng)用水平,但是仍存在很多檔案管理者身兼數(shù)職且缺少電子檔案的科學(xué)管理方法,難以滿足新時(shí)期的發(fā)展需求[1]。
數(shù)據(jù)采集和儲(chǔ)存是檔案管理工作中的最基礎(chǔ)部分,只有完善采集技術(shù),提高儲(chǔ)存水平才能為后續(xù)信息的使用和共享奠定基礎(chǔ)。采集過(guò)程需要確保信息的準(zhǔn)確性和價(jià)值性,有針對(duì)性的獲取所需信息才能為以后的處理和歸納做好鋪墊。儲(chǔ)存過(guò)程要確保質(zhì)量和速度,使數(shù)據(jù)適應(yīng)性更強(qiáng),效率更高。
檔案采集時(shí)最常使用的是虛擬現(xiàn)實(shí)手段,將虛擬的數(shù)據(jù)直觀具體的展現(xiàn)在人們面前,便于查詢、閱覽和使用。傳統(tǒng)采集需要靠人力來(lái)完成,浪費(fèi)了大量的時(shí)間和精力,采集效率不高。而且在歸納過(guò)程中紙質(zhì)版檔案所需空間大,查閱難度較高,而信息化檔案能拉近采集者與被采集者之間的距離,通過(guò)互聯(lián)網(wǎng)技術(shù)就能完成采集流程,獲取有效信息。與此同時(shí),電子化檔案能通過(guò)備份防止資源損失,而傳統(tǒng)檔案在反復(fù)使用后會(huì)有破損的風(fēng)險(xiǎn),所以大數(shù)據(jù)和信息技術(shù)給檔案領(lǐng)域帶來(lái)了極大的優(yōu)勢(shì)。
檔案儲(chǔ)存可以利用Hadoop平臺(tái)提高工作效率,利用其云計(jì)算功能對(duì)采集的數(shù)據(jù)進(jìn)行集中分析和整合,便于維護(hù)和使用。由于電子檔案的儲(chǔ)存容易受到網(wǎng)絡(luò)虛擬環(huán)境的影響,可能會(huì)被電腦病毒和黑客的威脅,所以要加強(qiáng)安全防護(hù),利用防火墻技術(shù)為檔案部門(mén)提供良好的保障,對(duì)于保密性強(qiáng)的文件要加密處理,設(shè)置權(quán)限,避免信息外泄。
優(yōu)化語(yǔ)義轉(zhuǎn)換功能是確保檔案利用有效性的重要手段,也是在檢索技術(shù)發(fā)展的前提下強(qiáng)化的數(shù)據(jù)處理手段。其功能主要體現(xiàn)在以下幾個(gè)方面:其一,拓展檢索。查詢檔案時(shí)可以利用歧義消除技術(shù)將判斷輸入詞匯的含義,發(fā)揮關(guān)聯(lián)詞的價(jià)值。其二,完善檢索。準(zhǔn)確篩選出檢索信息,防止查詢的主旨偏移,提高工作效率。其三,總結(jié)評(píng)價(jià)。技術(shù)模型能分析檢索數(shù)據(jù)與輸入詞匯的關(guān)聯(lián)度,核實(shí)查詢結(jié)果是否可靠精確,為改進(jìn)打好基礎(chǔ)。基于技術(shù)角度來(lái)講,要針對(duì)檔案建立過(guò)程中的目的、種類和原則來(lái)確保管理的規(guī)范有序,確保信息使用的智能和高效[2]。
檔案信息量龐大,而語(yǔ)義轉(zhuǎn)換功能可以確保檢索質(zhì)量和效率,使檔案使用時(shí)能通過(guò)簡(jiǎn)單的詞匯及時(shí)獲取到想要的信息,而排序過(guò)程的優(yōu)化即是為檔案的智能化轉(zhuǎn)變提供條件的基礎(chǔ)。在語(yǔ)義技術(shù)的支持下,系統(tǒng)不僅能將檢索內(nèi)容呈現(xiàn)出來(lái),還能將其中的近義詞、同義詞和關(guān)聯(lián)詞搜索出來(lái),避免了信息過(guò)載弊端,使檢索的信息更為合理全面。
大數(shù)據(jù)側(cè)重點(diǎn)在于人,而不是數(shù)據(jù),所以挖掘和分析過(guò)程是檔案信息化管理的重點(diǎn)。而確保數(shù)據(jù)信息挖掘和利用的實(shí)效性需要從兩方面入手:
一方面,用戶數(shù)據(jù)。檔案存在的意義是為了利用和共享,所以要滿足用戶的內(nèi)在需求,無(wú)論是教育檔案、金融檔案,亦或是企業(yè)檔案、機(jī)關(guān)檔案,都需要發(fā)揮檔案的使用價(jià)值。管理人員可以根據(jù)用戶的訪問(wèn)信息了解到檔案的檢索情況,掌握頁(yè)面點(diǎn)擊率,統(tǒng)計(jì)使用現(xiàn)狀,為完善檔案管理提供反饋意見(jiàn)。對(duì)于保密性強(qiáng)的檔案還要設(shè)置相關(guān)權(quán)限,以企業(yè)檔案為例,按職位高低分化檔案使用權(quán),領(lǐng)導(dǎo)者可以調(diào)取使用所有檔案,部門(mén)可以使用與本部門(mén)相關(guān)的檔案,而管理人員的職權(quán)也應(yīng)有所提升,這樣在資源采集和收錄過(guò)程中也能縮短時(shí)間,提高工作質(zhì)量。
另一方面,挖掘關(guān)系。檔案信息從表面上來(lái)看相對(duì)獨(dú)立,但是數(shù)據(jù)之間可以存在關(guān)聯(lián)性,所以要深入發(fā)掘單一數(shù)據(jù)之間的關(guān)系,將其整理成為一個(gè)龐大的數(shù)據(jù)網(wǎng)絡(luò),確保相互之間的關(guān)聯(lián)性,使大數(shù)據(jù)環(huán)境下檔案信息發(fā)揮其全面的服務(wù)價(jià)值。當(dāng)信息之間建立聯(lián)系后,無(wú)論是正在進(jìn)行計(jì)算的檔案數(shù)據(jù)還是未被使用的離線數(shù)據(jù)都能保持啟用狀態(tài),喚醒休眠信息,使檔案資源得到最大限度的利用。
宏觀來(lái)講,大數(shù)據(jù)在未來(lái)的發(fā)展中還要實(shí)現(xiàn)資源的互聯(lián)和共享,增強(qiáng)其在檔案管理中的預(yù)測(cè)性和創(chuàng)新性,提煉用戶的喜好習(xí)慣、操作行為和興趣特點(diǎn),生成個(gè)性化的數(shù)據(jù)服務(wù)體系,為用戶提供優(yōu)質(zhì)高效的服務(wù)。
人是檔案管理的重要組成部分,因此在大數(shù)據(jù)環(huán)境下推動(dòng)檔案信息化發(fā)展的前提是確保管理者的專業(yè)能力,為其提供有效的培訓(xùn)教育機(jī)會(huì),加強(qiáng)大數(shù)據(jù)、信息技術(shù)、智能管理、系統(tǒng)應(yīng)用等方面知識(shí)的滲透,保證且個(gè)人素質(zhì)滿足新時(shí)期檔案管理的要求。檔案工作人員也要不斷提升自我,提高檔案數(shù)據(jù)的采集和利用效率,通過(guò)多種渠道獲取資源信息,優(yōu)化數(shù)字化系統(tǒng)的利用水平,凸顯檔案的內(nèi)在價(jià)值[3]。
檔案信息還要從被動(dòng)服務(wù)轉(zhuǎn)換為主動(dòng)服務(wù),針對(duì)用戶需求制定個(gè)性化的服務(wù)方案,在大數(shù)據(jù)技術(shù)的支持下,引進(jìn)更多先進(jìn)技術(shù),完善檔案管理的智慧化體系。比如檔案館可以建立三維展覽廳,將原本平面化的檔案立體呈現(xiàn),人們可以更為直觀的獲取檔案信息,增強(qiáng)數(shù)據(jù)的實(shí)用性。
總而言之,檔案的信息化轉(zhuǎn)變是當(dāng)今時(shí)代發(fā)展的必然趨勢(shì),相關(guān)管理人員要不斷提升專業(yè)素質(zhì)和應(yīng)用能力,發(fā)揮大數(shù)據(jù)檔案的實(shí)效作用。與此同時(shí),檔案管理還要利用更為先進(jìn)的信息化手段,加強(qiáng)共享利用,提供虛擬現(xiàn)實(shí)水平,優(yōu)化語(yǔ)義分析與利用,在法律允許的前提下開(kāi)放檔案,為人民群眾提供更為便捷優(yōu)質(zhì)的服務(wù),這樣才能促進(jìn)大數(shù)據(jù)在檔案領(lǐng)域的可持續(xù)發(fā)展。