劉俊蘭
(河北農(nóng)業(yè)大學(xué)檔案館 保定 071001)
大數(shù)據(jù)環(huán)境下高校數(shù)字檔案館建設(shè)研究
劉俊蘭
(河北農(nóng)業(yè)大學(xué)檔案館 保定 071001)
大數(shù)據(jù)時代的到來,改變了高校檔案館的工作方式,豐富了數(shù)字檔案館的內(nèi)容,建設(shè)大數(shù)據(jù)環(huán)境下的數(shù)字檔案館,是高校順應(yīng)時代發(fā)展的必然要求。本文在分析大數(shù)據(jù)環(huán)境下高校數(shù)字檔案館現(xiàn)狀的基礎(chǔ)上,總結(jié)出大數(shù)據(jù)時代高校數(shù)字檔案館建設(shè)面臨的挑戰(zhàn),提出了大數(shù)據(jù)環(huán)境下高校數(shù)字檔案館的建設(shè)策略。
大數(shù)據(jù) 數(shù)字化 信息化 檔案館
由于互聯(lián)網(wǎng)和信息行業(yè)的快速發(fā)展,大數(shù)據(jù)逐漸應(yīng)用于各個行業(yè),不同行業(yè)有著不同的特征,對大數(shù)據(jù)也有不同的要求。對于高校數(shù)字檔案館的建設(shè)而言,大數(shù)據(jù)時代的到來對其既是一次機(jī)遇,又是一個挑戰(zhàn)。
由于大數(shù)據(jù)是最近新衍生出來的概念,它的內(nèi)涵和外延也在不斷地拓展和變化著,目前還沒有一個業(yè)界廣泛采納的明確定義。有人指大數(shù)據(jù)是指那些由于數(shù)據(jù)的信息量巨大,用戶很難獲取和加工的數(shù)據(jù),國際數(shù)據(jù)公司(IDC)給大數(shù)據(jù)下了一個定義:大數(shù)據(jù)技術(shù)是新一代的技術(shù)與架構(gòu),它被設(shè)計用于在成本可承受的條件下,通過快速的采集、發(fā)現(xiàn)和分析,從大體量、多類別的數(shù)據(jù)中提取價值。大數(shù)據(jù)的特點(diǎn)可以概述為4V,即海量化、多樣化、快速化價值化,而這4V也被廣泛地認(rèn)可為大數(shù)據(jù)的最基本內(nèi)涵。
與傳統(tǒng)數(shù)字檔案館建設(shè)相比,大數(shù)據(jù)環(huán)境下數(shù)字檔案館的建設(shè)具有檔案資源數(shù)據(jù)量大、媒體形式多樣、服務(wù)方式靈活等方面的特點(diǎn),涉及的領(lǐng)域包括云計算、數(shù)據(jù)挖掘、海量數(shù)據(jù)存儲等方面,這些必然對高校數(shù)字檔案館的建設(shè)帶來多樣化的發(fā)展。高校檔案工作者如何對包含視頻、音頻、圖片、文字、網(wǎng)絡(luò)信息、地理位置信息等形式多樣的大數(shù)據(jù)檔案資料進(jìn)行整理、分類、數(shù)字化建設(shè),進(jìn)而提供更優(yōu)質(zhì)、便利的網(wǎng)絡(luò)檢索和利用服務(wù),實現(xiàn)大規(guī)模的高校檔案信息共享服務(wù),是各高校檔案館亟待解決的問題。
1.多數(shù)高校尚未完成數(shù)字化,大數(shù)據(jù)技術(shù)無用武之地。目前河北省內(nèi)多數(shù)高校的檔案主要是以紙質(zhì)文件或?qū)嵨镄问酱嬖诘?,雖然多數(shù)高校已經(jīng)配備了檔案管理軟件,但是只是目錄級的信息化,對于館藏檔案數(shù)字化,多數(shù)高校持觀望的態(tài)度。紙質(zhì)檔案不僅查閱起來不方便,頻繁的翻閱和復(fù)印也會增大對檔案資料的磨損程度,只有把目前檔案館的館藏轉(zhuǎn)化為數(shù)字資源,大數(shù)據(jù)技術(shù)才能在檔案領(lǐng)域發(fā)揮其強(qiáng)大的作用。
2.接收資料形式單一,基礎(chǔ)設(shè)施建設(shè)不足。目前多數(shù)高校的檔案館接收檔案的類型相對單一,主要是接收檔案管理規(guī)章制度里面規(guī)定的紙質(zhì)文件,對視頻、圖片、數(shù)據(jù)表格、網(wǎng)絡(luò)日志等非結(jié)構(gòu)化的數(shù)據(jù)接收較少,即使接收了這些非結(jié)構(gòu)化的數(shù)據(jù),由于占用空間巨大,目前多數(shù)高校檔案的設(shè)備也不能滿足這些大數(shù)據(jù)的存儲要求。且傳統(tǒng)的數(shù)字檔案館使用的數(shù)據(jù)庫都是關(guān)系型數(shù)據(jù)庫,關(guān)系型數(shù)據(jù)庫不適合管理非結(jié)構(gòu)化數(shù)據(jù),在大數(shù)據(jù)環(huán)境下,檔案館將要面對大批非結(jié)構(gòu)化的數(shù)據(jù),因此,在大數(shù)據(jù)環(huán)境下,高校檔案館的數(shù)據(jù)庫也急需更新。
3.服務(wù)利用缺少與用戶的交互。高校在推動檔案館信息化建設(shè)時,重藏輕用,往往只注重檔案信息的館藏環(huán)節(jié),對檔案館的服務(wù)利用功能開發(fā)不足,面向公眾的檔案知識文化普及也有待提高。缺少與用戶的交互,只能針對用戶提出的需求提供有限的服務(wù),無法向用戶提供個性化服務(wù)。一旦用戶不能明確自身的檔案需求,檔案館員就無法為其提供服務(wù),缺乏通過與用戶之間的交互來挖掘用戶需求,并為用戶提供個性化服務(wù)的能力。
4.建設(shè)經(jīng)費(fèi)不足,專業(yè)人才匱乏。高校建設(shè)適應(yīng)大數(shù)據(jù)環(huán)境的數(shù)字檔案館,必須投入大量的人力、物力、財力。目前,高校的經(jīng)費(fèi)多投入到科研、基建等方面,對檔案館建設(shè)投入的資金嚴(yán)重不足,而大數(shù)據(jù)背景下的數(shù)字檔案館建設(shè)需要更新設(shè)備、數(shù)字化外包、管理軟件升級等,這些都需要大量的資金支持才能完成。
高校的數(shù)字化檔案館建設(shè)中,人才是最為關(guān)鍵的要素,要實現(xiàn)大數(shù)據(jù)環(huán)境下數(shù)字檔案的建設(shè)和管理,需要一批復(fù)合型檔案業(yè)務(wù)人才。而目前省內(nèi)的高校檔案館內(nèi)專業(yè)人員嚴(yán)重匱乏,缺乏一批懂計算機(jī)管理技術(shù)、非結(jié)構(gòu)化數(shù)據(jù)庫管理技術(shù)、后臺服務(wù)器管理技術(shù)和維護(hù)以及檔案管理技術(shù)的綜合型人才。這些都不利于現(xiàn)代化數(shù)字檔案館的建設(shè)。
與傳統(tǒng)數(shù)字檔案館建設(shè)相比,大數(shù)據(jù)環(huán)境下數(shù)字檔案館的建設(shè)具有檔案資源數(shù)據(jù)量大、媒體形式多樣、服務(wù)方式靈活等方面的特點(diǎn),涉及到的領(lǐng)域包括云計算、數(shù)據(jù)挖掘、海量數(shù)據(jù)存儲等方面,這些都給檔案工作者帶來了新的挑戰(zhàn)。
1.新型的大數(shù)據(jù)技術(shù)是對檔案員檔案意識和服務(wù)利用意識的挑戰(zhàn)。大數(shù)據(jù)時代的到來,對高校數(shù)字檔案館的建設(shè)不可避免地會產(chǎn)生一定的影響,在傳統(tǒng)的數(shù)字檔案館建設(shè)中,紙質(zhì)檔案數(shù)字化、目錄信息化已經(jīng)成為各高校數(shù)字檔案館建設(shè)的主流,而在大數(shù)據(jù)時代,檔案出現(xiàn)了多種表現(xiàn)形式,具有保存價值的數(shù)據(jù)、視頻、圖片、電子文件和實物等都可能成為檔案,這對原有的檔案觀念產(chǎn)生了極大的沖擊和影響,如何重新理解檔案的概念、豐富原有的檔案體系已成為當(dāng)代檔案人的當(dāng)務(wù)之急。檔案館是信息部門的弱勢群體,檔案的利用率一直偏低,公眾的檔案意識也比較薄弱,對信息利用的需求量也不是很大,沒有查閱和利用的欲望。在大數(shù)據(jù)時代,信息內(nèi)容繁多、形式多樣,檔案利用者往往并不明確自己所需要的信息,這不僅需要檔案工作者準(zhǔn)確把握利用者的需求,根據(jù)用戶的描述,分析出其需要的數(shù)據(jù),使檔案信息以開放、主動的形式展現(xiàn)給用戶,更需要檔案利用者轉(zhuǎn)變利用思維,主動提高檔案意識,充分利用現(xiàn)代化工具挖掘檔案的價值,當(dāng)然,要轉(zhuǎn)變檔案工作者和利用者的意識也不是一件簡單的事,對檔案工作者和利用者的素質(zhì)都提出了更高的要求[1]。
2.大數(shù)據(jù)的技術(shù)性對檔案工作人員業(yè)務(wù)素質(zhì)的挑戰(zhàn)。傳統(tǒng)的數(shù)字檔案館建設(shè)中,檔案工作人員需具備最基本的檔案管理理論知識、檔案文獻(xiàn)編纂、檔案保護(hù)方面的技術(shù)、計算機(jī)技術(shù)等,只要檔案工作人員掌握了這些檔案相關(guān)技術(shù),就能勝任檔案館的工作。但是在大數(shù)據(jù)環(huán)境下,檔案館的工作方式也發(fā)生了巨大變化,煩瑣的電話通知催交檔案、手工查閱等方式將逐漸減少,方便快捷的計算機(jī)查閱和自動聯(lián)系立檔部門將成為主要的手段,具有大數(shù)據(jù)特征的數(shù)字檔案館將逐步建立,這些都對高校檔案工作者提出了更高的要求,在具備傳統(tǒng)檔案基本理論知識的基礎(chǔ)上,還要掌握計算機(jī)技術(shù)、信息技術(shù)、數(shù)據(jù)挖掘技術(shù)等,還需要檔案工作人員具備職業(yè)敏感性,能夠主動挖掘到哪些領(lǐng)域需要檔案部門的介入才能保存完整的檔案數(shù)據(jù),從而更大地發(fā)揮檔案及檔案部門的作用[2]。此外,檔案工作者還要考慮到未來發(fā)展的趨勢,充分利用各校資源,實現(xiàn)不同高校之間資源的無縫對接與整合,建設(shè)適應(yīng)社會各界充分利用的高效率、低成本的數(shù)字檔案館,這些對檔案工作人員的業(yè)務(wù)素質(zhì)提出了更高的要求,具有極大的挑戰(zhàn)。
3.大數(shù)據(jù)的多樣性對各高校信息資源整合的挑戰(zhàn)。大數(shù)據(jù)不僅是海量數(shù)據(jù),還涉及文本、音頻、視頻、圖像、關(guān)系數(shù)據(jù)等多樣的結(jié)構(gòu)數(shù)據(jù),大數(shù)據(jù)環(huán)境下,各高校的的信息資源整合應(yīng)是充分運(yùn)用網(wǎng)絡(luò)技術(shù)、云計算技術(shù)等先進(jìn)手段,通過各高校之間的合作與協(xié)調(diào),把分布在不同地區(qū)的高校檔案資源連接成一個結(jié)構(gòu)有序化、管理一體化的整體,但是由于大數(shù)據(jù)的多樣性,在整合方面無疑面臨著諸多難點(diǎn)。
目前,各高?;径加幸惶鬃约旱臋n案管理系統(tǒng),各高校的檔案部門也都是各自為政,使用的這些管理系統(tǒng)都是出于不同的軟件公司,使用不同的源代碼開發(fā),對這些資源進(jìn)行整合無疑是又一難點(diǎn)。
1.加強(qiáng)人才結(jié)構(gòu)建設(shè)。大數(shù)據(jù)環(huán)境下數(shù)字檔案館的建設(shè)需要一批具有檔案管理與服務(wù)、信息管理技術(shù)、大數(shù)據(jù)技術(shù)等方面知識的專業(yè)人才,所以要根據(jù)大數(shù)據(jù)環(huán)境下數(shù)字檔案館建設(shè)需要,培養(yǎng)和引進(jìn)一批人才,建立一支檔案人才隊伍,才能順應(yīng)時代潮流,保障大數(shù)據(jù)背景下數(shù)字檔案館的順利運(yùn)行。
第一,加強(qiáng)檔案的宣傳,強(qiáng)化大數(shù)據(jù)觀念,扭轉(zhuǎn)傳統(tǒng)檔案觀念。一是宣傳大數(shù)據(jù)背景下檔案涵蓋的內(nèi)容、形式、作用及正反面事例,使公眾及檔案員了解新形勢下檔案工作的意義;二是宣傳大數(shù)據(jù)環(huán)境下檔案的收集范圍、好的檔案管理辦法,逐步將大檔案的意識灌輸?shù)綑n案管理員及利用者的意識中;三是宣傳有特色的館藏內(nèi)容,檔案工作人員在日常工作中把館藏的有特色的檔案挖掘出來,通過數(shù)字化手段轉(zhuǎn)化為電子文件,利用報刊、雜志、網(wǎng)站、視頻節(jié)目等形式向高校各部門甚至校外各單位進(jìn)行宣傳。
第二,注重專業(yè)素質(zhì),引進(jìn)專業(yè)人才。大數(shù)據(jù)時代的來臨,檔案領(lǐng)域?qū)Ω咚刭|(zhì)的復(fù)合型人才的需求越來越明顯,目前各高校檔案館這方面的人才嚴(yán)重匱乏,急需組建一支具有大數(shù)據(jù)素質(zhì)的檔案從業(yè)者隊伍,具體可以體現(xiàn)在以下幾個方面。一是高??梢月?lián)系其他檔案機(jī)構(gòu),合作培養(yǎng)人才,高校檔案館員進(jìn)入校外檔案管理部門學(xué)習(xí),或者請專家在校內(nèi)或校外進(jìn)行專業(yè)實踐指導(dǎo);二是制定規(guī)范化的檔案機(jī)構(gòu)招聘程序,采用公開招考的方式遴選人才,從源頭上禁止非專業(yè)人員進(jìn)入檔案館工作;三是規(guī)定檔案管理員只有具備了專業(yè)資格證書才允許上崗工作,如果能夠?qū)Ω咝8鲗<媛殭n案員定期進(jìn)行資格審核認(rèn)定,對進(jìn)一步規(guī)范檔案人才隊伍建設(shè)具有重要意義。
第三,對在職人員開展繼續(xù)教育。除了上述嚴(yán)格引進(jìn)人才的舉措,對在職人員職業(yè)素養(yǎng)的提升也同樣重要。一方面應(yīng)鼓勵在職人員繼續(xù)深造,全面系統(tǒng)地學(xué)習(xí)大數(shù)據(jù)相關(guān)知識,深入研究大數(shù)據(jù)環(huán)境下數(shù)字檔案館的建設(shè)策略;另一方面應(yīng)鼓勵在職人員參與各項培訓(xùn),積極參與檔案機(jī)構(gòu)開展的各項活動,如專業(yè)培訓(xùn)班、專家講座、參觀學(xué)習(xí)等,進(jìn)一步提升自身職業(yè)素養(yǎng)。
2.加強(qiáng)基礎(chǔ)設(shè)施建設(shè),加大統(tǒng)籌規(guī)劃力度。目前,全國各高校的數(shù)字檔案館缺乏統(tǒng)一規(guī)劃,各高校的建設(shè)水平也參差不齊,需要加大對基礎(chǔ)設(shè)施如計算機(jī)、服務(wù)器、檔案系統(tǒng)管理軟件、數(shù)字化設(shè)備等硬件設(shè)施不完善的高校的資金投入,此外,還需要建立一個滿足檔案信息化功能需求,適應(yīng)時代發(fā)展需要的綜合管理系統(tǒng)平臺和網(wǎng)絡(luò)架構(gòu)。
第一,基礎(chǔ)軟硬件設(shè)施建設(shè)。大數(shù)據(jù)環(huán)境下,數(shù)字檔案館的建設(shè)要按照一定的模式進(jìn)行,這樣才能實現(xiàn)規(guī)范和統(tǒng)一。國家應(yīng)制定一系列標(biāo)準(zhǔn),為大數(shù)據(jù)環(huán)境下的數(shù)字檔案館購置統(tǒng)一規(guī)格的掃描儀、數(shù)據(jù)存儲管理服務(wù)器、備份系統(tǒng)、刻錄機(jī)、大數(shù)據(jù)存儲設(shè)備等硬件設(shè)施,尤其應(yīng)統(tǒng)一檔案信息管理系統(tǒng),為信息資源的整合與共享做好充足的準(zhǔn)備。
第二,繼續(xù)推進(jìn)傳統(tǒng)檔案信息資源建設(shè)。傳統(tǒng)的數(shù)字檔案館信息資源建設(shè)有兩個方面,一是做好電子文件的收集整理,二是對館藏檔案的數(shù)字化處理,這是數(shù)字化檔案館建設(shè)的基礎(chǔ)。在大數(shù)據(jù)環(huán)境下,對這兩方面也有了更嚴(yán)格的要求。
第三,加強(qiáng)數(shù)據(jù)平臺建設(shè),積極開展多元化服務(wù)。一是加強(qiáng)檔案數(shù)據(jù)庫建設(shè),逐步搭建目錄數(shù)據(jù)庫、全文數(shù)據(jù)庫、多媒體數(shù)據(jù)庫,統(tǒng)一管理信息資源;二是推動檔案館網(wǎng)站建設(shè),在大數(shù)據(jù)環(huán)境下,采用類似淘寶、百度等網(wǎng)站主動記錄用戶行為,進(jìn)而分析用用需求的數(shù)據(jù)分析技術(shù),分析檔案用戶信息查詢行為,預(yù)測用戶的信息需求;三是充分利用移動技術(shù),推動新型媒體建設(shè),大數(shù)據(jù)環(huán)境下,高校檔案館可以通過開通檔案微博來更好地吸引潛在用戶,并為用戶提供更好的檔案信息利用服務(wù),通過開通微信公眾號來更好地傳播檔案文化。
3.加大大數(shù)據(jù)背景下高校信息資源整合的力度。大數(shù)據(jù)環(huán)境下高校數(shù)字檔案館的建設(shè),必須建立在整合信息資源的基礎(chǔ)上。高校的信息資源豐富,高校之間有著必然的聯(lián)系,各高校、各部門有著不同的信息系統(tǒng)和網(wǎng)站,每年都產(chǎn)生大量的數(shù)字信息,這些信息涉及行政、科研、教學(xué)、財務(wù)等多個方面,需要整合后才能統(tǒng)一管理。具體整合的內(nèi)容包括協(xié)議標(biāo)準(zhǔn)、高校檔案數(shù)據(jù)庫、各高校業(yè)務(wù)管理系統(tǒng)、各高校的檢索方式[3]。
要實現(xiàn)高校檔案資源的整合,不僅要轉(zhuǎn)變觀念,更重要的是靈活運(yùn)用云計算和大數(shù)據(jù)處理技術(shù),實現(xiàn)檔案數(shù)字資源的深度挖掘和有效融合,增強(qiáng)大數(shù)據(jù)環(huán)境下檔案部門的核心競爭力。
大數(shù)據(jù)環(huán)境下高校數(shù)字檔案館的建設(shè),適應(yīng)了信息化校園建設(shè)的潮流,是檔案部門重塑職業(yè)形象的機(jī)遇,檔案部門應(yīng)充分抓住機(jī)遇,關(guān)注云計算技術(shù)、大數(shù)據(jù)處理技術(shù)等信息技術(shù)的發(fā)展,進(jìn)一步研究大數(shù)據(jù)背景下高校數(shù)字檔案館建設(shè)的可行性措施,最大程度地實現(xiàn)檔案資源的共享,使之更好地為學(xué)校、為社會服務(wù)。
[1]楊文剛.大數(shù)據(jù)背景下檔案館的建設(shè)研究[J].山西檔案,2016(4).
[2]肖敏.大數(shù)據(jù)環(huán)境下檔案利用服務(wù)體系建設(shè)研究[D].湘潭大學(xué),2015.
[3]孟歆.基于云計算的高校檔案信息資源整合研究[J].蘭臺世界,2014(12).
Research on the Construction of Digital Archives in Colleges and Universities in the Big Data Environment
Liu Junlan
(Archives of Hebei Agricultural University,Baoding 071001,China)
The arrival of big data era has changed the working style of archives in colleges and universities,and enriched the contents of digital archives.Building the digital archives in big data environment is an inevitable requirement for colleges and universities to adapt to the development of times.This paper analyzes the status quo of digital archives in colleges and universities in the big data environment,summarizes the challenges of constructing digital archives in colleges and universities in the era of big data,and puts forward the construction strategy of digital archives in colleges and universities in the big data environment.
big data;digitalization;informatization;archives
河北農(nóng)業(yè)大學(xué)社科基金項目(SK201638)。
劉俊蘭,河北農(nóng)業(yè)大學(xué)檔案館館員,研究方向為檔案管理。
G270.7
A
2017-05-22