周琴
摘 要:隨著互聯(lián)網時代的到來,信息化檔案管理是未來發(fā)展的必然趨勢。在信息化時代中目前普及化程度最高的就是大數(shù)據(jù)信息處理方式。伴隨著我國高等學校教育改革的深入發(fā)展,傳統(tǒng)意義上的紙質檔案管理工作方式已經無法滿足于檔案管理工作的需要,信息化時代的檔案工作業(yè)務流程必須進行創(chuàng)新,償試著把業(yè)務流程的重組引入高校檔案管理工作來。
關鍵詞:數(shù)字檔案;信息化;大數(shù)據(jù);業(yè)務流程重組
伴隨著互聯(lián)網時代的到來,信息化檔案管理是未來發(fā)展的必然趨勢。在信息化時代中目前普及化程度最高的就是大數(shù)據(jù)信息處理方式。大數(shù)據(jù)的出現(xiàn)意味著要改變傳統(tǒng)的思維方式和計算方法,并不因為數(shù)據(jù)的龐大,而是在于這些龐大數(shù)據(jù)能為我們提供更快捷的運算過程和更強大的數(shù)據(jù)分析結果。舍恩·伯格評價:“大數(shù)據(jù)是一種新的價值觀和方法論”。而國務院也于2015年9月5日印發(fā)了關于《促進大數(shù)據(jù)發(fā)展的行動綱要》,這是國家首次從發(fā)展戰(zhàn)略全局的高度為出發(fā)點,提出我國目前所面臨大數(shù)據(jù)發(fā)展的重要性。綱要對大數(shù)據(jù)的內在涵義做出更權威的闡述,讓我們對大數(shù)據(jù)有了更全面、更深刻的認知。隨著我國高等教育改革的不斷深入,高校人事檔案管理越來越呈現(xiàn)出專業(yè)性和復雜性的特點,對我們檔案管理工作提出了更新、更高的要求。傳統(tǒng)紙質檔案時代的業(yè)務流程顯然已經無法滿足信息化檔案管理的需要,必須要對其進行業(yè)務流程的重組。
業(yè)務流程重組(簡稱:BPR)最早由美國的Michael Hammer 和James Champy提出來,這是一種出現(xiàn)在上個世紀90年代的全新管理思想,他們?yōu)槠涠x為:通過企業(yè)的運作戰(zhàn)略方案,運營工作流程以及對支撐系統(tǒng)、組織、結構和政策的重組,從而達到生產力的最優(yōu)化為目的。專業(yè)數(shù)據(jù)人士曾提出:經過提取、存儲、分析和深度挖掘等方式可以準確的得出大數(shù)據(jù)的分析結果。筆者認為可以嘗試著借鑒企業(yè)業(yè)務流程的基本原理,結合目前高校檔案工作數(shù)據(jù)化管理及服務的工作要求,重組目前正在運用的紙質檔案工作業(yè)務流程。讓其組織機構由原來組織結型轉化成流程型模式,這種全新的業(yè)務流程主要分成以下四個步驟:全面采集、分散存儲、后臺分析、可視化發(fā)布。
一、檔案信息數(shù)據(jù)全面采集
1.根據(jù)高校檔案管理工作規(guī)劃及需要解決的問題,制定出科學合理的全方面檔案信息數(shù)據(jù)采集工作業(yè)務流程。首先,業(yè)務流程要從大數(shù)據(jù)的角度出發(fā),明確高校目前現(xiàn)存檔案信息數(shù)據(jù)具體包括哪些?其次,要明確知道這些數(shù)據(jù)分別所處在學院的哪些職能部門中,誰是負責人誰保管?再次,要知道目前這些檔案數(shù)據(jù)的現(xiàn)存使用狀態(tài)如何?這些第一手的基礎數(shù)據(jù)信息不僅僅是制定大數(shù)據(jù)檔案信息業(yè)務流程的重要參考依據(jù),同時也是確保大數(shù)據(jù)檔案信息采集完成后使用效果的最重要基礎性支撐材料。
2.根據(jù)高校全方位管理的需要,積極采集空白、缺失檔案信息數(shù)據(jù)的方案。檔案信息數(shù)據(jù)的采集,在于需獲取學院所有職能部門全部檔案信息數(shù)據(jù);檔案信息數(shù)據(jù)的整理,在于解決各部門各類型檔案之間混雜性的問題;檔案信息數(shù)據(jù)的分析,在于深層挖掘各類檔案數(shù)據(jù)之間緊密關聯(lián)。因此,高校應當嚴格遵照“全面采集”原則,建立建全檔案信息數(shù)據(jù)采集各種規(guī)章制度和檔案工作管理辦法。
3.高校內部職能部門制定檔案信息大數(shù)據(jù)協(xié)作協(xié)議,實現(xiàn)檔案信息共享機制。目前,各高校內部職能部門都擁有自己獨立的,功能單一的辦公管理操作系統(tǒng),比如:學院辦公室的OA系、教務處的教學管理系統(tǒng)、人事處的全國教師信息管理系統(tǒng)、科技處的科研統(tǒng)計系統(tǒng)、國有資產處的資產統(tǒng)計系統(tǒng)、學生工作處資助貸款等等。這些工作管理系統(tǒng)基本上都沒有與檔案室的管理系統(tǒng)建立聯(lián)系,從而導致各類檔案信息數(shù)據(jù)沒有互通協(xié)作。因此,要針對高校內部這種檔案信息數(shù)據(jù)“各自為政”“信息孤島”的窘境,加快制定檔案大數(shù)據(jù)互操作協(xié)議的業(yè)務規(guī)則與考核標準盡快構建起檔案信息大數(shù)據(jù)管理平臺,把各部門中分散孤立、類型繁多的檔案信息數(shù)據(jù)有效整合,這樣能更好的推進高校內部職能部門之間乃至高校與高校之間檔案信息大數(shù)據(jù)資源的“三互”功能:互聯(lián)、互通與互享。避免了各部門之間的重復工作,大大提高了工作效率。
二、檔案信息數(shù)據(jù)分散存儲
檔案信息分散存儲,就是高校內部各職能部門將本單位所屬的檔案信息數(shù)據(jù)存儲在單獨的電腦設備中。目前咱們常用的網絡存儲系統(tǒng)通常采用集中存儲服務器來存放所有檔案信息數(shù)據(jù),其安全性和可靠性比較低,隨著檔案信息量的逐年增加無法滿足現(xiàn)有存儲應用的需求。而分散存儲可以利用多臺存儲服務器來分擔存儲的負荷,既提高了存儲系統(tǒng)的安全性和使用性,隨著高校職能部門調整增設時,這樣更易于檔案的擴展工作。
1.根據(jù)檔案信息數(shù)據(jù)的專有屬性特征來構建合理的存儲方式。首先,對我們已經采集到檔案信息數(shù)據(jù)和在下一工作階段即將采集到的各類檔案信息原始數(shù)據(jù)進行科學的劃分成三種類型,分別是結構化類型、半結構化類型和非結構化類型。接著,根據(jù)以上劃分的三種數(shù)據(jù)類型來創(chuàng)建檔案信息分散式文件管理系統(tǒng)、分散式數(shù)據(jù)庫管理系統(tǒng)和分散式數(shù)據(jù)流處理管理系統(tǒng)。最后制定規(guī)范的存儲管理辦法。
2.構建高校檔案信息大數(shù)據(jù)存儲平臺。目前最為典型運用的就是“HDFS”存儲管理系統(tǒng),因其具有成本低、包容量大、數(shù)據(jù)分析精準等優(yōu)點,成為各高校大力推廣使用的檔案信息數(shù)據(jù)存儲系統(tǒng)。
3.把采集的檔案信息數(shù)據(jù)進行優(yōu)化,提高數(shù)據(jù)質量,做好數(shù)據(jù)管理。第一,通過使用Google Refine這種數(shù)據(jù)轉換工具,把各部門分散式存儲的檔案信息數(shù)據(jù)進行數(shù)據(jù)分析。第二,根據(jù)這些真實數(shù)據(jù)從而提高檔案信息數(shù)據(jù)整體質量。第三,檔案信息數(shù)據(jù)都有自己的生命周期,根據(jù)生命周期來進行技術優(yōu)化,增加或者刪除,保證檔案信息數(shù)據(jù)的質量。
三、檔案信息數(shù)據(jù)分析
檔案信息數(shù)據(jù)分析,就是把各部門收集的大量檔案信息數(shù)據(jù)通過算法搜索將隱藏其中的信息,根據(jù)我們自己工作的要求進行數(shù)據(jù)分析的過程。數(shù)據(jù)分析常常與計算機科學有關,通過計算機后臺的數(shù)據(jù)統(tǒng)計、在線分析處理、檢索系統(tǒng)等各類方法來實現(xiàn)上述目標。
1.檔案數(shù)據(jù)分析的基本原理。檔案信息數(shù)據(jù)關聯(lián)性分析是運用大數(shù)據(jù)特有的計算機算法模式,對靜態(tài)和動態(tài)的檔案信息數(shù)據(jù)進行評估,分析出有價值的數(shù)據(jù)信息,為高校的決策提供科學的基礎性依據(jù)。
2.檔案數(shù)據(jù)分析流程。目前各高校沿用的檔案數(shù)據(jù)分析流程為:發(fā)現(xiàn)問題、數(shù)據(jù)分析、分析原因、提出解決方案,這是一種被動的工作流程,嚴重的影響我們的工作效率。而檔案數(shù)據(jù)分析流程主要作用體現(xiàn)在“預測”二字,檔案數(shù)據(jù)分析流程為:分析數(shù)據(jù)信息、找內在關聯(lián)、得預測結果、出解決辦法。而這一種主動的思維模式,這種操作流程更適用于目前檔案大數(shù)據(jù)信息化和個性化管理的工作需要,提升了工作效率。
3.采用合理的開發(fā)工具 。“購物籃分析”是目前最為先進的檔案信息數(shù)據(jù)分析工具,其主要依靠強大的云計算技術對高校工作人員行為等進行評估和梳理,快速得出高校各類檔案信息內在的聯(lián)系性,較短時間內把復雜多樣的高校檔案信息轉化成個性化工作需求。
四、 檔案信息可視化發(fā)布
可視化數(shù)據(jù)管理與發(fā)布系統(tǒng)VisualDB,是一套基于Web界面、實現(xiàn)關系型數(shù)據(jù)庫可視化數(shù)據(jù)錄入、更新、發(fā)布以及安全控制的軟件工具。我們可以利用該工具建立起檔案信息業(yè)務流程。
1.理解該系統(tǒng)的工作原理。數(shù)據(jù)可視化主要旨在借助于直觀的列表、圖形化手段,能更清晰更有效地傳達與溝通各類信息??梢暬瘮?shù)據(jù)管理與發(fā)布系統(tǒng)針對科學數(shù)據(jù)庫中多學科、多類型的專業(yè)數(shù)據(jù)庫建設需求,提出了切實可行的技術解決方案,同時也方便工作人員對檔案信息數(shù)據(jù)資源進行管理。
2.檔案信息可視化發(fā)布技術的方式有三種:第一種是運用直觀的圖形技術開發(fā)出豐富的可視化分析結果。第二種是運用智能處理工作平臺中人工與機器互動,更好的對檔案信息數(shù)據(jù)分析進行調整。第三種運用技術融合機制,讓檔案信息分析結果更好強化平臺黏度。
3.檔案“信息圖”工具的使用?,F(xiàn)在有一種與可視化發(fā)布技術非常接近能夠達到互相替換使用的 “信息圖 ”技術,此項技術可以使枯燥的數(shù)據(jù)顯示出趣味性,“信息圖”技術還可以廣泛運用到高校檔案管理,各高??筛鶕?jù)自己的情況選擇運用。
高校傳統(tǒng)的紙質檔案管理工作方式已經被信息化檔案管理工作方式所接替,新的檔案工作內容和特征對我們檔案工作者提出了更高的要求,眾所周知,在所有生產要素中,勞動者自身的改變是最困難的而且也是最緩慢的,改變從思維模式開始,讓我們在高校檔案工作這條路上不斷探索、創(chuàng)新。
參考文獻:
[1][英]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代:生活、工作與思維的大變革[M].盛陽燕,周濤譯.杭州:浙江人民出版社,2013.
[2]https://baike.baidu.com/item/業(yè)務流程重組/10375610
[3]HDFS(HadoopDistributed File System)又稱為分布式文件系統(tǒng),以流式數(shù)據(jù)訪問模式來存儲超大文件,可以從MB乃至PB級大小。
[4]購物籃分析,該過程通過發(fā)現(xiàn)顧客放入其購物籃中的不同商品之間的聯(lián)系,分析顧客的購買習慣。通過了解哪些商品頻繁地被顧客同時購買,這種關聯(lián)的發(fā)現(xiàn)可以幫助零售商制定營銷策略。
[5]信息圖:是指數(shù)據(jù)、信息或知識的可視化表現(xiàn)形式。