摘 要:數(shù)字化檔案利用服務(wù)應(yīng)用現(xiàn)代技術(shù)手段,完成檔案數(shù)據(jù)管理與利用任務(wù)。為了進(jìn)一步提高檔案利用服務(wù)的效率,研究了引入大數(shù)據(jù)的數(shù)字化檔案利用服務(wù)這一課題。闡述數(shù)字化檔案利用服務(wù)的概念,從中分析大數(shù)據(jù)環(huán)境下數(shù)字化檔案利用服務(wù)面臨的挑戰(zhàn)。并從形成期(數(shù)字化檔案資源形成、建設(shè))、發(fā)展期(建設(shè)檔案利用服務(wù)數(shù)據(jù)中心)、成熟期(建立大數(shù)據(jù)檔案利用服務(wù)機(jī)制)、衰退期(數(shù)字化檔案開放、創(chuàng)新)等階段構(gòu)建數(shù)字化檔案利用服務(wù)大數(shù)據(jù)模型。通過以上研究,旨在體現(xiàn)數(shù)字化檔案的開放、共享原則,為數(shù)字化檔案利用服務(wù)的發(fā)展提供理論支撐。
關(guān)鍵詞:大數(shù)據(jù);數(shù)字化;檔案利用服務(wù);數(shù)據(jù)中心;
引言
數(shù)字化就是信息處理的過程,利用計(jì)算機(jī),將不確定的數(shù)據(jù)轉(zhuǎn)化為可量化的數(shù)字單元。再設(shè)定相應(yīng)的數(shù)字化轉(zhuǎn)換模型,導(dǎo)入計(jì)算機(jī)重新分析,得到更加準(zhǔn)確、有效的數(shù)據(jù)聯(lián)系[1]。檔案是個(gè)人或組織在社會(huì)活動(dòng)中的原始記錄,從古代的龜甲記錄到現(xiàn)代的電子音像、云空間記錄,檔案轉(zhuǎn)變?yōu)閭€(gè)性化、多樣化的形式。同時(shí),檔案記錄的數(shù)據(jù)也從官方擴(kuò)大到家庭、學(xué)校、社會(huì)及個(gè)人。檔案中的數(shù)據(jù)信息包含國家大事、社會(huì)生活、自然現(xiàn)象、生產(chǎn)情況等方方面面,是反映國家、社會(huì)、個(gè)人發(fā)展的寶貴資源信息[2]。通過各類數(shù)據(jù)技術(shù)的加持,形成檔案管理體系,能夠確保檔案信息的全面性。
檔案開放理論是檔案利用服務(wù)的主要思想,檔案向公眾開放,開放程度直接體現(xiàn)了檔案的利用價(jià)值。目前,檔案開放的理念深入人心,公眾對(duì)檔案利用的意識(shí)越來越強(qiáng),利用頻率相對(duì)較高[3]。檔案管理部門也可以適應(yīng)時(shí)代發(fā)展,為公眾提供更具個(gè)性化的服務(wù)。數(shù)字化檔案就是利用數(shù)字化技術(shù)重新塑造檔案的價(jià)值信息,增強(qiáng)檔案內(nèi)容的管理與利用。在數(shù)字化轉(zhuǎn)型的背景下,檔案利用服務(wù)以公共服務(wù)為主,通過信息技術(shù),向互聯(lián)網(wǎng)平臺(tái)提供檔案服務(wù),從而實(shí)現(xiàn)檔案便捷、高效、全面的服務(wù)理念[4]。檔案利用服務(wù)界定了公共屬性,引入大數(shù)據(jù)技術(shù),能夠進(jìn)一步提高檔案管理與利用的效率。
眾多學(xué)者對(duì)數(shù)字化檔案進(jìn)行了研究。李海艷[5]根據(jù)檔案利用工作的經(jīng)驗(yàn),對(duì)大數(shù)據(jù)治理標(biāo)準(zhǔn)體系對(duì)檔案管理利用服務(wù)體系的影響進(jìn)行研究,分析大數(shù)據(jù)治理標(biāo)準(zhǔn)體系內(nèi)容以及帶來的影響,闡述大數(shù)據(jù)治理標(biāo)準(zhǔn)體系在對(duì)象、服務(wù)內(nèi)容、服務(wù)方式和目的等方面對(duì)檔案管理利用產(chǎn)生的影響。鄭曉紅[6]對(duì)大數(shù)據(jù)背景下檔案管理和數(shù)字化建設(shè)進(jìn)行了研究,提出檔案管理人員要?jiǎng)?chuàng)新工作模式,充分利用信息化技術(shù),開展檔案的數(shù)字化建設(shè)。
在現(xiàn)有研究的基礎(chǔ)上,本文為進(jìn)一步探索數(shù)字化檔案的利用,提出引入大數(shù)據(jù)的數(shù)字化檔案利用服務(wù)這一課題開展研究。
1 數(shù)字化檔案利用服務(wù)的含義
檔案是社會(huì)活動(dòng)的原始記錄,具有服務(wù)與文化屬性,屬于公共服務(wù)產(chǎn)品。檔案利用服務(wù)解釋為可利用檔案的服務(wù),就是在實(shí)現(xiàn)檔案價(jià)值、滿足公眾需求的基礎(chǔ)上,向相關(guān)用戶提供有價(jià)值的檔案信息,能夠增強(qiáng)檔案為人民群眾服務(wù)的能力[7]。檔案大數(shù)據(jù)是數(shù)字化背景衍生的概念,具有檔案數(shù)據(jù)體量龐大、類型繁多,數(shù)據(jù)處理時(shí)效性強(qiáng),檔案價(jià)值具有巨大、密度不高等大數(shù)據(jù)特征,通過大數(shù)據(jù)的處理技術(shù),能夠篩選有效的檔案數(shù)據(jù),清理無效的檔案數(shù)據(jù),更好地提供檔案利用服務(wù)。
數(shù)字化檔案利用服務(wù),簡(jiǎn)而言之,即是將傳統(tǒng)的檔案材料通過數(shù)字化手段轉(zhuǎn)化為電子形式,并通過特定的服務(wù)平臺(tái)提供給用戶進(jìn)行利用的一種服務(wù)模式。在信息化時(shí)代,數(shù)字化檔案利用服務(wù)不僅提升檔案信息的存儲(chǔ)與檢索效率,更實(shí)現(xiàn)檔案信息的快速傳播與共享。這種服務(wù)模式有效突破傳統(tǒng)檔案利用在時(shí)間和空間上的限制,使得檔案信息的利用更加便捷、高效。同時(shí),結(jié)合大數(shù)據(jù)技術(shù),數(shù)字化檔案利用服務(wù)能夠深入挖掘檔案信息的潛在價(jià)值,為用戶提供更為精準(zhǔn)、個(gè)性化的服務(wù),進(jìn)一步提升了檔案服務(wù)的質(zhì)量和水平。
2 大數(shù)據(jù)環(huán)境下數(shù)字化檔案利用服務(wù)面臨的挑戰(zhàn)
在大數(shù)據(jù)環(huán)境下,檔案利用服務(wù)面臨著多種挑戰(zhàn)。例如檔案服務(wù)意識(shí)的變化、檔案利用意識(shí)的變化、檔案保存的難點(diǎn)、檔案管理的難點(diǎn)、檔案信息的安全性、檔案內(nèi)容的守舊等問題,影響了檔案利用服務(wù)質(zhì)量。數(shù)字化檔案形式以數(shù)據(jù)、視頻、圖片、文件、實(shí)物等為主,檔案服務(wù)意識(shí)發(fā)生相應(yīng)的變化,所有的記錄與數(shù)據(jù)均能夠成為檔案,增加檔案管理與利用的負(fù)擔(dān)。檔案利用的限制較多,大部分人群對(duì)檔案的認(rèn)識(shí)不足,影響了檔案利用的效率。在大數(shù)據(jù)的加持下,檔案信息以開放、共享的形式呈現(xiàn),雖然達(dá)到了可利用的目的,但是檔案信息的安全性受到了挑戰(zhàn)。
3 基于大數(shù)據(jù)構(gòu)建數(shù)字化檔案利用服務(wù)模型
針對(duì)數(shù)字化檔案利用服務(wù)面臨的挑戰(zhàn),本文利用大數(shù)據(jù)技術(shù),構(gòu)建了數(shù)字化檔案利用服務(wù)模型。整個(gè)過程中,存在形成階段、發(fā)展階段、成熟階段與衰退階段。在形成階段,將紙質(zhì)檔案轉(zhuǎn)化為數(shù)字化檔案[8]。在發(fā)展階段,對(duì)數(shù)字化檔案信息進(jìn)行集成、存儲(chǔ)與管理。在成熟階段,完成數(shù)字化檔案多元化利用的任務(wù)。在衰退階段,創(chuàng)新服務(wù)模型與應(yīng)用場(chǎng)景,提高檔案利用服務(wù)的效率。數(shù)字化檔案利用服務(wù)模型如圖1所示。
圖1 數(shù)字化檔案利用服務(wù)模型圖
如圖1所示,在檔案數(shù)據(jù)集成、存儲(chǔ)、管理的過程中,以數(shù)據(jù)中心為主。在數(shù)據(jù)中心明確檔案的分類、標(biāo)簽、索引方式,提高檔案利用服務(wù)的效率。在檔案利用服務(wù)的全周期階段中,大數(shù)據(jù)技術(shù)貫穿全程,發(fā)現(xiàn)檔案之間的內(nèi)在聯(lián)系,真正意義上滿足檔案利用服務(wù)需求。
3.1 形成期:數(shù)字化檔案資源形成、建設(shè)
在數(shù)字化檔案資源利用服務(wù)的形成階段,以檔案資源建設(shè)、檔案利用服務(wù)觀念轉(zhuǎn)變?yōu)橹?。提升電子文件的地位,增?qiáng)檔案利用意識(shí)[9]。將個(gè)人零散、存儲(chǔ)分散、形成時(shí)間隨意的數(shù)字資源進(jìn)行集成管理,建設(shè)相應(yīng)的檔案數(shù)據(jù)記錄,如下表1所示。
如表1所示,檔案數(shù)字化處理記錄包括檔案編號(hào)、名稱、數(shù)字化掃描方式、掃描設(shè)備、掃描時(shí)間、掃描人員、掃描質(zhì)量等記錄。檔案數(shù)據(jù)存儲(chǔ)信息包括存儲(chǔ)位置、格式、容量、時(shí)間、訪問權(quán)限、備份等內(nèi)容。檔案利用服務(wù)包含服務(wù)類型、次數(shù)、時(shí)間、用戶數(shù)量、服務(wù)滿意度等內(nèi)容。檔案數(shù)據(jù)分析結(jié)果包含檔案主題、數(shù)據(jù)分析方法、關(guān)鍵指標(biāo)、分析結(jié)果、建議措施等內(nèi)容。用戶信息與管理包含用戶ID、用戶名、密碼、所屬機(jī)構(gòu)、角色權(quán)限、訪問記錄、聯(lián)系方式等內(nèi)容。檔案日志記錄包含日志ID、操作類型、時(shí)間、人員、對(duì)象、結(jié)果等內(nèi)容。檔案借閱記錄包含借閱編號(hào)、檔案編號(hào)、借閱者、借閱時(shí)間、歸還時(shí)間、借閱期限、借閱狀態(tài)等內(nèi)容。檔案利用服務(wù)滿意度評(píng)分結(jié)果包含檔案編號(hào)、服務(wù)類型、用戶ID、滿意度評(píng)分、建議等內(nèi)容。在大數(shù)據(jù)技術(shù)的推動(dòng)下,檔案管理部門轉(zhuǎn)變服務(wù)理念。運(yùn)用大數(shù)據(jù)思維、共享性思維,為用戶提供更加完善的利用服務(wù)。
3.2 發(fā)展期:建設(shè)檔案利用服務(wù)數(shù)據(jù)中心
檔案利用服務(wù)數(shù)據(jù)中心就是數(shù)字化檔案統(tǒng)一管理的平臺(tái),建立各類數(shù)據(jù)庫表,完成檔案資源管理與利用的任務(wù)。同時(shí),數(shù)據(jù)中心的建設(shè)能夠統(tǒng)一集成、整合、存儲(chǔ)資源,確保檔案信息的完整性。利用大數(shù)據(jù)處理的核心業(yè)務(wù),k-means、決策樹等算法,大批量地處理檔案利用服務(wù)數(shù)據(jù)。在大數(shù)據(jù)中心具體應(yīng)用的過程中,以用戶需求為導(dǎo)向、以完善的檢索工具為基礎(chǔ),為不同的用戶提供可利用的多元化服務(wù)[10]。利用大數(shù)據(jù)技術(shù),將用戶歷史查詢數(shù)據(jù)、歷史檢索數(shù)據(jù)進(jìn)行分析,得到用戶需求與行為,主動(dòng)為其提供檔案信息。此處的檔案信息不僅僅局限于原始檔案,還包括個(gè)性化推薦、分析內(nèi)容、預(yù)測(cè)結(jié)果、輔助決策等方面,滿足檔案利用服務(wù)的推薦需求。在檔案利用服務(wù)數(shù)據(jù)庫中,上傳檔案二次、三次、全文等信息,縮小用戶的檢索范圍,從而實(shí)現(xiàn)檔案的高效利用。
3.3 成熟期:建立大數(shù)據(jù)檔案利用服務(wù)機(jī)制
在成熟期階段,大數(shù)據(jù)為檔案資源帶來的安全隱患包含信息被泄露、病毒植入、數(shù)據(jù)容災(zāi)、數(shù)據(jù)保存等方面。因此,本文在成熟階段增加了制度層面、技術(shù)層面、人員層面的利用服務(wù)機(jī)制。在制度方面,依據(jù)《檔案法》,制定大數(shù)據(jù)檢索、查詢檔案信息的權(quán)限范圍。并將檔案利用與網(wǎng)絡(luò)安全條款納入制度需求,在體現(xiàn)數(shù)字化檔案服務(wù)特征的基礎(chǔ)上,確保檔案信息的安全。在技術(shù)層面,從數(shù)據(jù)保密技術(shù)、數(shù)據(jù)遷移技術(shù)、數(shù)據(jù)云存儲(chǔ)與異地備份等方面考量。數(shù)據(jù)保密技術(shù)以防火墻、數(shù)字簽名、電子文件認(rèn)證等為主,防火墻將不安全因素隔離在外,確保檔案數(shù)據(jù)的安全;數(shù)字簽名技術(shù),能夠避免信息丟失與非法截?。浑娮游募J(rèn)證技術(shù),能夠獲取驗(yàn)證碼,辨別電子文件的真?zhèn)?。三者相結(jié)合,確保數(shù)字化檔案服務(wù)的安全性。數(shù)據(jù)遷移技術(shù)則是數(shù)據(jù)保護(hù)的方式,將數(shù)字化檔案數(shù)據(jù)存儲(chǔ)在不同的區(qū)間,并利用計(jì)算機(jī)系統(tǒng)遷移各類數(shù)據(jù)。不同介質(zhì)之間的數(shù)據(jù)遷移,通過電子文件認(rèn)證實(shí)現(xiàn),避免數(shù)據(jù)丟失的問題[11]。數(shù)據(jù)云存儲(chǔ)與異地備份技術(shù)能夠利用云計(jì)算,將數(shù)字化檔案存儲(chǔ)在云存儲(chǔ)空間中,利用其成本低、容量大的優(yōu)勢(shì),將檔案數(shù)據(jù)資源的關(guān)鍵數(shù)據(jù)在本地遠(yuǎn)端永久保存,提升數(shù)據(jù)容災(zāi)的能力。在人員層面,培養(yǎng)安全服務(wù)的能力,確保數(shù)字化檔案利用的安全性。
3.4 衰退期:數(shù)字化檔案開放與創(chuàng)新
數(shù)字化檔案在衰退階段,需要開放檔案信息,并將檔案信息的開放理念與共享理念相契合,促進(jìn)檔案資源的共享利用。以“對(duì)用戶免費(fèi)”“自由使用”“充分共享”的理念,加強(qiáng)數(shù)字化檔案資源的可利用能力。所謂檔案衰退階段,就是檔案資源一個(gè)周期的結(jié)束,也可以作為檔案開關(guān)的黃金時(shí)代。開放數(shù)字化檔案資源,允許更多群眾訪問和利用,并通過大數(shù)據(jù)平臺(tái),推動(dòng)數(shù)字化檔案資源跨領(lǐng)域、部門,完成利用服務(wù)??傮w來說,衰退階段就是數(shù)字化檔案資源創(chuàng)新的階段,提倡檔案資源免費(fèi)、自由地獲取價(jià)值信息。
利用數(shù)字化檔案資源的廣泛性、時(shí)效性,實(shí)現(xiàn)檔案利用與共享。在此階段,利用大數(shù)據(jù)技術(shù),將數(shù)字化檔案資源以表格的形式顯示,深入挖掘檔案資源之間的聯(lián)系,制定相應(yīng)的資源獲取、處理、利用規(guī)劃。在創(chuàng)新方面,建設(shè)檔案平臺(tái)。并利用各種客戶端,開展檔案咨詢服務(wù)、檔案文化傳播、資源共享等活動(dòng),重新提高數(shù)字化檔案的可利用性能。當(dāng)衰退期轉(zhuǎn)化為下一個(gè)服務(wù)形成階段時(shí),重復(fù)形成——發(fā)展——成熟——衰退的服務(wù)步驟,真正意義上實(shí)現(xiàn)數(shù)字化檔案的高效利用。
結(jié)束語
近些年來,互聯(lián)網(wǎng)技術(shù)迅速發(fā)展,大數(shù)據(jù)成為時(shí)代特征,不僅改變了數(shù)據(jù)處理與分析的方式,還提高了數(shù)據(jù)處理與分析的效率,為各行各業(yè)的發(fā)展提供了技術(shù)支持。在這樣的背景下,原本的檔案管理模式已難以滿足需求,這就要求相關(guān)工作部門和人員能夠積極應(yīng)用大數(shù)據(jù)技術(shù)開展檔案管理,提高檔案利用效率,滿足社會(huì)需求。在檔案管理領(lǐng)域,數(shù)字化檔案存在存儲(chǔ)空間不足、檢索效率低下等問題,亟需引入大數(shù)據(jù)技術(shù)。因此,本文引入大數(shù)據(jù)技術(shù),構(gòu)建了數(shù)字化檔案利用服務(wù)模型。從形成階段、發(fā)展階段、成熟階段、衰退階段,快速處理與分析檔案數(shù)據(jù),發(fā)現(xiàn)檔案內(nèi)容之間的內(nèi)在聯(lián)系,更加科學(xué)、有效地利用檔案信息,真正意義上實(shí)現(xiàn)了高效的檔案利用與管理。
參考文獻(xiàn)
[1]余璐.開發(fā)利用校史檔案信息資源,服務(wù)學(xué)?!叭恕薄栽颇蠙C(jī)電職業(yè)技術(shù)學(xué)院為例[J].華東科技,2023,11(10):146-148.
[2]李儆蘭,吳志杰,潘亞男.基于數(shù)據(jù)分析的科研機(jī)構(gòu)檔案利用服務(wù)能力建設(shè)研究[J].知識(shí)管理論壇,2023,8(04):340-350.
[3]周文泓,文利君,代林序.面向?qū)W術(shù)利用的網(wǎng)絡(luò)檔案資源服務(wù)策略探析——基于丹麥NetLab的分析與啟示[J].檔案學(xué)通訊,2023,5(04):49-57.
[4]顏萍,樊艷麗.資政存檔留史——檔案工作主動(dòng)服務(wù)宜昌沙河綜合整治工程建設(shè)紀(jì)實(shí)[J].未來城市設(shè)計(jì)與運(yùn)營,2023,3(06):85-88.
[5]李海艷.大數(shù)據(jù)治理標(biāo)準(zhǔn)體系對(duì)檔案利用服務(wù)體系的影響研究[J].蘭臺(tái)內(nèi)外, 2023(6):48-50.
[6]鄭曉紅.大數(shù)據(jù)下檔案管理和數(shù)字化建設(shè)研究[J].內(nèi)江科技, 2022, 43(5):3-4.
[7]耿肖參,陳娜.深入推進(jìn)一體化改革不斷提升便民服務(wù)質(zhì)效——鶴壁市不動(dòng)產(chǎn)檔案查詢利用工作的實(shí)踐[J].資源導(dǎo)刊,2023,6(05):21-23.
[8]周春蓮.新《檔案法》背景下檔案素養(yǎng)與檔案利用服務(wù)推廣互為影響研究[J].廣東輕工職業(yè)技術(shù)學(xué)院學(xué)報(bào),2023,22(02):75-80.
[9]鄧未希,洪源清.新時(shí)代檔案信息資源開發(fā)利用的實(shí)踐與思考——以福建省科技廳開展公務(wù)紀(jì)念冊(cè)服務(wù)為例[J].蘭臺(tái)世界,2023,9(04):111-113.
[10]黃霄羽,靳文君,張一.檔案高質(zhì)量服務(wù)的先進(jìn)典型——我國香港特區(qū)政府檔案處利用服務(wù)近期特點(diǎn)評(píng)析[J].檔案管理,2023,5(02):74-77.
[11]羅帆,葉鴻飛.打破城建檔案數(shù)據(jù)孤立現(xiàn)象提供信息共享便民利用服務(wù)——金華市城建檔案館按照數(shù)字檔案館建設(shè)標(biāo)準(zhǔn)改造項(xiàng)目分析[J].未來城市設(shè)計(jì)與運(yùn)營,2022,6(10):76-78.
作者簡(jiǎn)介:鄭學(xué)鳳(1969.9—),山東省莒縣人民醫(yī)院副研究館員,主要從事檔案利用研究。