李改英
摘要:信息時代背景下,信息分析與處理方式多式多樣。大數(shù)據(jù)技術(shù)近幾年開始應(yīng)用于檔案數(shù)據(jù)挖掘中,使得檔案管理工作變得信息化和精細化。本文就大數(shù)據(jù)技術(shù)在檔案數(shù)據(jù)挖掘中的價值與策略進行深入分析。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);數(shù)據(jù)挖掘;檔案信息
伴隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)挖掘技術(shù)在檔案管理中的應(yīng)用將進入一個新的發(fā)展時期。盡管檔案學(xué)術(shù)界很早就提出知識管理與知識挖掘,但知識挖掘尚停留在概念和理論探討階段[1]。大數(shù)據(jù)挖掘,即從大數(shù)據(jù)中挖掘知識,大數(shù)據(jù)挖掘技術(shù)有效地解決了數(shù)據(jù)和知識之間的鴻溝,是將數(shù)據(jù)轉(zhuǎn)變成知識的有效方式。大數(shù)據(jù)時代給數(shù)據(jù)挖掘技術(shù)帶來的根本性改變是使數(shù)據(jù)的深度挖掘成為可能,對大量數(shù)據(jù)進行分析處理和智能化挖掘,從管理角度來看,要達到最優(yōu)的結(jié)果,不僅數(shù)據(jù)要全面、可靠、有價值,而且需要對數(shù)據(jù)進行深度挖掘[2]。
一、大數(shù)據(jù)技術(shù)與檔案數(shù)據(jù)挖掘內(nèi)容
(一)挖掘檔案資源
在大數(shù)據(jù)技術(shù)支持下,檔案管理工作的思路應(yīng)轉(zhuǎn)變?yōu)椤按髷?shù)據(jù)”,合理整合檔案數(shù)據(jù),建立完善的大數(shù)據(jù)檔案資源體系和共享軟件檔案數(shù)據(jù)資源庫,從而實現(xiàn)館藏檔案的共享和聯(lián)系。另外,云計算平臺和互聯(lián)網(wǎng)技術(shù)等推動了地區(qū)檔案數(shù)據(jù)資源網(wǎng)絡(luò)系統(tǒng)的建設(shè)與完善,使得檔案用戶查詢相關(guān)資料更加方便簡潔。
(二)用戶數(shù)據(jù)挖掘
大數(shù)據(jù)技術(shù)下的檔案資源挖掘,可以挖掘更多的用戶數(shù)據(jù),使得大數(shù)據(jù)檔案服務(wù)變得更加精準(zhǔn),同時也提升了用戶的體驗感與認同感。在進行檔案數(shù)據(jù)挖掘的時候,應(yīng)該重點對用戶的檔案信息、用戶統(tǒng)計資料等進行挖掘整理。在檔案數(shù)據(jù)挖掘的時候,可以利用大數(shù)據(jù)技術(shù)訪問用戶的瀏覽日志文件,還可以用數(shù)據(jù)分析技術(shù)進行檔案資料分析,對用戶的檢索關(guān)鍵詞進行數(shù)據(jù)化統(tǒng)計,從而提高檔案信息查準(zhǔn)率。
二、利用大數(shù)據(jù)技術(shù)進行檔案數(shù)據(jù)挖掘的有效措施
(一)構(gòu)建大數(shù)據(jù)技術(shù)為核心的數(shù)據(jù)資源體系
隨著社會的進步,檔案數(shù)據(jù)應(yīng)展現(xiàn)時代特色,構(gòu)建中華民族體記憶的“中國式”數(shù)字資源庫[3]。數(shù)字資源可以是文本形式、音頻形式、圖片形式等。首先,應(yīng)擴大檔案數(shù)據(jù)資源總量,加大實體檔案資源的建設(shè),完善實體檔案門類,優(yōu)化館藏檔案結(jié)構(gòu)。其次,應(yīng)重點建設(shè)數(shù)字資源,構(gòu)建完善的數(shù)字化檔案資源庫,使電子檔案分門別類的歸檔。最后,應(yīng)大力整合檔案數(shù)據(jù)資源,實現(xiàn)資源共享,增加數(shù)據(jù)應(yīng)用價值。一方面,在檔案數(shù)據(jù)管理方面,大數(shù)據(jù)技術(shù)為檔案管理與檔案挖掘提供了有效保證,另一方面,在大數(shù)據(jù)技術(shù)下檔案的深入挖掘中,還進一步優(yōu)化了檔案館的使用功能。
(二)構(gòu)建和諧的用戶關(guān)系管理,增大數(shù)據(jù)內(nèi)在關(guān)聯(lián)
在大數(shù)據(jù)時代,人們應(yīng)該轉(zhuǎn)變原有的“因果關(guān)系”認知思路與觀念,用“相互關(guān)系”取代傳統(tǒng)思想,用新的視覺看待檔案數(shù)據(jù)挖掘,用新的技術(shù)去挖掘檔案數(shù)據(jù),將以前的“知道為什么”變成“知道是什么”大數(shù)據(jù)技術(shù)有預(yù)測分析的功能,可以對檔案用戶之前的網(wǎng)上行為,現(xiàn)在的進行行為進行分析,還可以根據(jù)用戶的基本情況預(yù)測未來的行為,挖掘出數(shù)據(jù)之間的關(guān)聯(lián)性,實現(xiàn)檔案資源的集成、創(chuàng)新與優(yōu)化??梢越柚髷?shù)據(jù)技術(shù),統(tǒng)計分析用戶的行為軌跡,研究用戶的使用習(xí)慣和興趣,分析用戶的儲存行為等,在隱性層面滿足用戶的實際需求。例如,借助大數(shù)據(jù)技術(shù)針對不同的用戶,可以產(chǎn)生動態(tài)推薦超級鏈接列表。
(三)利用大數(shù)據(jù)技術(shù)保護數(shù)據(jù)安全
在大數(shù)據(jù)時代,信息隱私安全保護面臨著嚴峻考驗,技術(shù)因素和人力因素都會影響數(shù)據(jù)的安全性,如果合理利用大數(shù)據(jù)技術(shù),就可以為檔案管理工作提供可靠的預(yù)測決策的情報。首先,應(yīng)健全大數(shù)據(jù)檔案挖掘法律法規(guī),加強對個人檔案信息隱私的保護力度,另外,還應(yīng)建立個人檔案數(shù)據(jù)安全管理體系,合理管理檔案信息,避免發(fā)生數(shù)據(jù)外泄和丟失等現(xiàn)象。其次,選擇可以保護數(shù)據(jù)隱私的挖掘方法與技術(shù),明確私人信息和公共信息,先確保私人信息的安全,再進行數(shù)據(jù)深入挖掘。
(四)實施智慧因子聯(lián)合大數(shù)據(jù)技術(shù)的數(shù)據(jù)挖掘模式
自“智慧城市”概念提出后,“智慧因子”被廣泛應(yīng)用于各行各業(yè)中,例如智慧上海、智慧物流、智慧檔案館等[4]。智慧檔案館就是檔案數(shù)據(jù)挖掘中“智慧因子聯(lián)合大數(shù)據(jù)技術(shù)”的實際應(yīng)用案例,在大數(shù)據(jù)技術(shù)中植入智慧因子,將智慧服務(wù)為檔案館理論,在互聯(lián)網(wǎng)技術(shù)和物聯(lián)網(wǎng)技術(shù)的支持下,形成智能網(wǎng)絡(luò)體系,真正實現(xiàn)檔案信息資源的有機整合和廣度挖掘,推動我國檔案服務(wù)的信息化和智慧化發(fā)展。大數(shù)據(jù)技術(shù)可以將各種檔案資源進行有機整合,同時,借助智慧因子,創(chuàng)新智慧服務(wù)理念和手段,使得檔案數(shù)據(jù)資源開發(fā)更加個性化,同時讓隱性知識變得顯性化。
三、結(jié)語
綜上所述,在大數(shù)據(jù)時代背景下,大數(shù)據(jù)檔案、大數(shù)據(jù)服務(wù)、智慧檔案等都大大促進了檔案管理工作的發(fā)展。隨著科學(xué)技術(shù)的不斷發(fā)展,未來檔案管理工作中應(yīng)真正落實大數(shù)據(jù)技術(shù),使得每位檔案管理人員在工作中都可以輕車熟路。檔案數(shù)據(jù)挖掘有幾個不同的環(huán)節(jié),在應(yīng)用大數(shù)據(jù)技術(shù)的時候,應(yīng)該認清數(shù)據(jù)挖掘環(huán)節(jié)的特性,采取合理的數(shù)據(jù)挖掘措施,實現(xiàn)檔案數(shù)據(jù)資料的有效挖掘和合理運行,實現(xiàn)大數(shù)據(jù)技術(shù)下檔案數(shù)據(jù)的良性循環(huán)。
參考文獻:
[1]楊來青.大數(shù)據(jù)背景下檔案信息資源挖掘策略與方法研究[J].中國檔案,2018(08):60-61.
[2]陳水湖.試論大數(shù)據(jù)環(huán)境下的檔案“數(shù)據(jù)化”管理[J].機電兵船檔案,2018(02):69-72.
[3]梁雯.大數(shù)據(jù)視域下檔案數(shù)據(jù)管理的創(chuàng)新策略研究[J].科學(xué)大眾(科學(xué)教育),2018(01):184.
[4]吳曉文,孫杰,楊帆.大數(shù)據(jù)背景下海洋檔案數(shù)據(jù)挖掘研究[J].辦公室業(yè)務(wù),2017(19):186-187.