張福虔
摘要:重特大事件檔案數(shù)據(jù)整合對(duì)于推進(jìn)國(guó)家治理體系和治理能力現(xiàn)代化具有重要意義。論文采用內(nèi)容分析法,針對(duì)重特大事件檔案數(shù)據(jù)整合面臨的政策法規(guī)、數(shù)據(jù)技術(shù)和數(shù)據(jù)資源的障礙,從宏觀、中觀、微觀三個(gè)層面進(jìn)行剖析,提出重特大事件檔案數(shù)據(jù)資源整合的實(shí)現(xiàn)路徑,包括宏觀政策層面:完善政策法規(guī)框架;中觀技術(shù)層面:AI賦能展現(xiàn)數(shù)據(jù)知識(shí)脈絡(luò);微觀數(shù)據(jù)層面:護(hù)航數(shù)據(jù)安全和數(shù)據(jù)質(zhì)量。
關(guān)鍵詞:重特大事件檔案 檔案數(shù)據(jù) 資源整合
Abstract: The integration of archival data re? sources for major historical events holds signifi? cant implications for advancing the modernization of national governance system and capabilities. Employing a content analysis approach, this pa? per examines the obstacles related to policy and regulations, data technology and data resources associated with the integration of archival data re? sources of major historical events. The study pro? poses the following pathways to promote the in? tegration process including enhancing policy and regulation frameworks in the macro- level, dis? playing data knowledge networks through em? powerment of artificial intelligence in the mesolevel, and safeguarding data security and quality in the micro-level.
Keywords: Archives of major and historical events; Archival data; Resource integration
重特大事件檔案是黨和國(guó)家組織應(yīng)對(duì)自然災(zāi)害、事故災(zāi)難、公共衛(wèi)生事件、社會(huì)安全事件等突發(fā)事件所形成的具有保存價(jià)值的歷史記錄。[1]在面臨復(fù)雜多變的國(guó)際和國(guó)內(nèi)環(huán)境中,各種“黑天鵝”“灰犀?!笔录l(fā)生頻繁。近年來(lái),我國(guó)重特大事件檔案工作推進(jìn)取得了較好成效,尤其是在應(yīng)對(duì)處置新冠疫情、重大生產(chǎn)安全事故過(guò)程中,檔案發(fā)揮了不可替代的作用,但實(shí)踐中仍存在檔案記錄不完整、收集不齊全、保管不集中、利用不充分[2]等問(wèn)題,尤其是檔案數(shù)據(jù)缺乏有效整合,不利于跨部門之間的協(xié)作和未來(lái)的決策制定。妥善地收集、保存和有效利用重特大事件檔案,對(duì)于汲取歷史中的教訓(xùn)、提升面對(duì)風(fēng)險(xiǎn)和挑戰(zhàn)的能力,以及推進(jìn)國(guó)家治理體系和治理能力現(xiàn)代化均具有重要的作用。鑒于此背景,2022年12月,中辦、國(guó)辦聯(lián)合發(fā)布了《關(guān)于加強(qiáng)重特大事件檔案工作的通知》,明確提出了“建設(shè)重特大事件檔案數(shù)據(jù)庫(kù)”和“推動(dòng)檔案資源整合”的具體要求。
目前,學(xué)界已在檔案資源整合的政策法規(guī)[3]、模式構(gòu)想[4]、體系建設(shè)[5]、案例分析[6]等幾方面展開(kāi)了探索,并且已經(jīng)積累了一定的實(shí)踐與理論成果。在實(shí)踐方面,胡仁浩[7]、鄭婷婷[8]、張夢(mèng)[9]、歸吉官[10]分別以川渝地區(qū)檔案、海洋科技發(fā)展檔案、紅色文學(xué)檔案、涉外民生檔案為研究對(duì)象,探討了檔案資源整合的實(shí)踐現(xiàn)狀和價(jià)值意義。在理論研究方面,朱蘭蘭[11]、連志英[12]、陳慧[13]、陳海玉[14]分別以敘事理論、扎根理論、賦能思維理論、SOA理論為研究視角,針對(duì)檔案資源整合中的具體問(wèn)題進(jìn)行了分析討論并提出相應(yīng)對(duì)策。但是,就目前的研究成果而言,在重特大事件檔案數(shù)據(jù)資源整合理論探究方面還存在研究空白,缺乏系統(tǒng)性的研究成果。
鑒于此,本文以重特大事件檔案為研究對(duì)象,分析重特大事件檔案數(shù)據(jù)整合的意義和障礙,提出實(shí)現(xiàn)路徑,以期推進(jìn)重特大事件檔案數(shù)據(jù)資源整合的綜合發(fā)展。
根據(jù)檔案數(shù)據(jù)內(nèi)涵和資源整合相關(guān)概念,本文認(rèn)為重特大事件檔案數(shù)據(jù)資源整合是一個(gè)涉及收集、協(xié)調(diào)、處理和合并與重特大事件相關(guān)的多元化數(shù)據(jù)和檔案信息的過(guò)程。這一過(guò)程遵循數(shù)據(jù)整合理論,旨在創(chuàng)建一個(gè)統(tǒng)一、綜合的數(shù)據(jù)資源庫(kù),以便數(shù)據(jù)的存取、分析和應(yīng)用。它包括對(duì)來(lái)自不同來(lái)源(如政府機(jī)關(guān)、救援組織、科研機(jī)構(gòu)等)的數(shù)據(jù)進(jìn)行清洗、結(jié)構(gòu)化和標(biāo)準(zhǔn)化處理,以確保數(shù)據(jù)的一致性和可用性。整合的核心目標(biāo)是提高數(shù)據(jù)的質(zhì)量、完整性和可用性,為使用者提供一個(gè)易于訪問(wèn)的數(shù)據(jù)集成。這類數(shù)據(jù)的整合不僅增強(qiáng)了檔案資源的深度應(yīng)用,而且對(duì)于重特大事件及相關(guān)研究領(lǐng)域具有顯著的實(shí)踐意義。
(一)助力決策參考和策略制定
重特大事件檔案數(shù)據(jù)資源的整合對(duì)未來(lái)決策的參考和策略的制定具有深遠(yuǎn)的意義,因?yàn)樗鼮檎咧贫ㄕ吆鸵?guī)劃者提供了關(guān)鍵的歷史數(shù)據(jù),這些數(shù)據(jù)涵蓋了歷史上的各種重大事件、災(zāi)難響應(yīng)、社會(huì)經(jīng)濟(jì)影響以及恢復(fù)和重建的過(guò)程。通過(guò)分析和整合這些信息,可以更準(zhǔn)確地理解和預(yù)測(cè)未來(lái)可能發(fā)生的類似事件的模式和趨勢(shì),從而在制定長(zhǎng)期的公共政策、應(yīng)急響應(yīng)計(jì)劃、社會(huì)穩(wěn)定和經(jīng)濟(jì)發(fā)展策略時(shí),能夠考慮到歷史教訓(xùn)和成功案例。例如,在城市規(guī)劃和基礎(chǔ)設(shè)施建設(shè)方面,通過(guò)分析過(guò)去的災(zāi)害數(shù)據(jù),可以更好地理解哪些區(qū)域更容易受到自然災(zāi)害的影響,從而在規(guī)劃時(shí)加強(qiáng)這些區(qū)域的防災(zāi)措施;在經(jīng)濟(jì)政策制定方面,通過(guò)分析歷史上經(jīng)濟(jì)危機(jī)的影響和恢復(fù)路徑,可以更有效地制定應(yīng)對(duì)未來(lái)經(jīng)濟(jì)波動(dòng)的策略;在公共衛(wèi)生領(lǐng)域,對(duì)過(guò)去重大疫情的數(shù)據(jù)整合和分析,可以幫助制定更有效的公共衛(wèi)生政策和應(yīng)急準(zhǔn)備計(jì)劃,以應(yīng)對(duì)未來(lái)可能的公共衛(wèi)生危機(jī)。
此外,整合的數(shù)據(jù)資源還可以支持跨國(guó)界的合作和全球性問(wèn)題的應(yīng)對(duì)策略制定,如氣候變化、環(huán)境保護(hù)和國(guó)際安全問(wèn)題,因?yàn)檫@些問(wèn)題往往需要基于歷史數(shù)據(jù)和經(jīng)驗(yàn)來(lái)制定全球性的長(zhǎng)期應(yīng)對(duì)策略。總之,重特大事件檔案數(shù)據(jù)資源的整合不僅為政策制定者提供了一個(gè)更全面、更深入的歷史視角和數(shù)據(jù)支持,也為制定面向未來(lái)的長(zhǎng)期規(guī)劃和策略提供了重要的基礎(chǔ),有助于提高這些規(guī)劃和策略的有效性、預(yù)見(jiàn)性和適應(yīng)性。
(二)推進(jìn)國(guó)家治理能力現(xiàn)代化
重特大事件檔案數(shù)據(jù)的整合對(duì)于推進(jìn)國(guó)家治理能力的現(xiàn)代化具有深遠(yuǎn)的意義。在面對(duì)自然災(zāi)害、公共衛(wèi)生危機(jī)、大規(guī)模事故等重特大事件時(shí),一個(gè)國(guó)家的應(yīng)對(duì)能力不僅取決于其物質(zhì)資源和技術(shù)水平,更在于其信息管理和決策流程的效率。
首先,重特大事件檔案由于其自身特點(diǎn),往往分散存放在不同部門之中,這種分散性對(duì)檔案數(shù)據(jù)的快速檢索與利用構(gòu)成了一定的障礙。因此,通過(guò)對(duì)重特大事件檔案數(shù)據(jù)整合,形成分類明確、主題劃分清晰、層級(jí)結(jié)構(gòu)合理的數(shù)據(jù)庫(kù)或者平臺(tái),在未來(lái)重特大事件發(fā)生時(shí),不需要從檔案庫(kù)房中調(diào)用檔案,而是能夠直接從數(shù)據(jù)庫(kù)中查詢檔案信息,對(duì)于制定有效的應(yīng)對(duì)策略、分配資源以及評(píng)估潛在風(fēng)險(xiǎn)有直接的幫助。
其次,重特大事件檔案數(shù)據(jù)整合有助于打破信息孤島,促進(jìn)政府內(nèi)部及與公眾、企業(yè)和其他非政府組織之間的信息共享。這種信息的互通不僅增強(qiáng)了政府部門間的協(xié)同工作,還支持不同主體之間的信息共享和協(xié)作,同時(shí)適應(yīng)不同管理層級(jí)的需求,使得重特大事件檔案能夠跨層級(jí)、跨主題、跨地域利用。
最后,整合重特大事件檔案數(shù)據(jù)還能夠提高檔案管理的效率和準(zhǔn)確性。通過(guò)數(shù)字化的方式存儲(chǔ)和管理檔案,可以減少人為錯(cuò)誤,提升數(shù)據(jù)的準(zhǔn)確性和安全性。同時(shí),這種集中式的數(shù)據(jù)管理還有助于進(jìn)行長(zhǎng)期的數(shù)據(jù)分析和研究,為未來(lái)的事件預(yù)防和策略制定提供寶貴的歷史數(shù)據(jù)和分析工具。綜合來(lái)看,通過(guò)整合和挖掘重特大事件檔案數(shù)據(jù),能夠使國(guó)家更加智能、科學(xué)地制定政策,提高危機(jī)管理水平,增加決策的透明度,從而有效推動(dòng)國(guó)家治理能力的現(xiàn)代化。
重特大事件一般具備不可預(yù)測(cè)性、多變性和高風(fēng)險(xiǎn)性等特征,其檔案數(shù)據(jù)價(jià)值珍貴,檔案數(shù)據(jù)資源整合亦迫在眉睫。當(dāng)前,重特大事件檔案數(shù)據(jù)整合共享面臨著政策缺失、技術(shù)壁壘和人才短缺等諸多障礙,數(shù)據(jù)安全、數(shù)據(jù)質(zhì)量、數(shù)據(jù)孤島、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)倫理等問(wèn)題普遍存在,給檔案數(shù)據(jù)資源統(tǒng)籌、開(kāi)發(fā)利用帶來(lái)了巨大挑戰(zhàn)。借鑒管理和組織理論,[15]本文從宏觀、中觀和微觀三個(gè)層面深度剖析重特大事件檔案數(shù)據(jù)整合面臨的障礙。
(一)宏觀層面:政策法規(guī)與發(fā)展模式滯后
檔案學(xué)家謝倫伯格曾指出:“檔案本質(zhì)是一種經(jīng)驗(yàn),政府需要借鑒這些經(jīng)驗(yàn)去制定政策,處理社會(huì)、經(jīng)濟(jì)以及組織、程序等方面的問(wèn)題?!盵16]截至2023年10月,我國(guó)已經(jīng)制定了10部重特大事件檔案管理的相關(guān)法規(guī),170余件各省、區(qū)及地方性代表性政策,構(gòu)成了一個(gè)相對(duì)完整的法規(guī)政策體系。但毋庸諱言,該體系各部分存在不協(xié)同和不完善的問(wèn)題。
首先,重特大事件檔案數(shù)據(jù)整合通常需要跨部門和跨領(lǐng)域的協(xié)作,但通過(guò)考察發(fā)現(xiàn),無(wú)論是作為國(guó)家法規(guī)的《中華人民共和國(guó)檔案法》還是地方的下位法,都沒(méi)有提供足夠的框架和指導(dǎo)來(lái)促進(jìn)這種協(xié)作。在沒(méi)有明確法律框架的情況下,各部門會(huì)對(duì)法律責(zé)任和合規(guī)性問(wèn)題持謹(jǐn)慎態(tài)度。同時(shí),協(xié)作機(jī)制的不明確性可能會(huì)使不同部門和機(jī)構(gòu)在協(xié)作過(guò)程中難以建立有效的溝通和協(xié)調(diào)。
其次,《重大活動(dòng)和突發(fā)事件檔案管理辦法》等相關(guān)法規(guī)政策沒(méi)有明確規(guī)定執(zhí)行機(jī)構(gòu)的角色,這種不確定性可能導(dǎo)致職責(zé)重疊、職責(zé)界限模糊、責(zé)任推諉等問(wèn)題。
再者,現(xiàn)有的發(fā)展模式往往限制了數(shù)據(jù)資源的整合,這些限制可能來(lái)自技術(shù)、組織結(jié)構(gòu)、政策法規(guī)等多個(gè)方面。我國(guó)的重特大事件檔案管理發(fā)展模式以政府主導(dǎo)為基礎(chǔ),強(qiáng)調(diào)系統(tǒng)化、數(shù)字化和標(biāo)準(zhǔn)化的管理流程。這種發(fā)展模式可以確保檔案管理遵循統(tǒng)一的標(biāo)準(zhǔn)和政策,有助于保持信息的完整性和安全性。但不得不承認(rèn),這種模式在快速響應(yīng)技術(shù)變革和社會(huì)需求方面柔性不足,一定程度上限制了創(chuàng)新和靈活性。因此,為了提高重特大事件檔案數(shù)據(jù)的利用效率,推動(dòng)檔案數(shù)據(jù)整合進(jìn)程,需要在保持現(xiàn)有發(fā)展模式優(yōu)勢(shì)的基礎(chǔ)上,積極尋求改進(jìn)和創(chuàng)新。
(二)中觀層面:數(shù)據(jù)技術(shù)能力薄弱
在中觀層面,重特大事件檔案數(shù)據(jù)資源整合面臨的主要障礙之一是數(shù)據(jù)技術(shù)能力的薄弱。這種技術(shù)能力的不足表現(xiàn)在以下幾個(gè)方面。
一是重特大事件檔案數(shù)據(jù)處理技術(shù)不足。重特大事件檔案數(shù)據(jù)資源具有復(fù)雜性、多樣性和異構(gòu)性等特點(diǎn),包含文本、圖像和各種結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),其數(shù)據(jù)來(lái)源、格式和標(biāo)準(zhǔn)也各不相同?;A(chǔ)數(shù)據(jù)處理涵蓋了從數(shù)據(jù)收集到初步處理的各個(gè)環(huán)節(jié),處理能力的不足會(huì)直接影響到數(shù)據(jù)整合的質(zhì)量和效率,進(jìn)而影響數(shù)據(jù)分析和決策支持的有效性。
二是重特大事件檔案資源數(shù)據(jù)庫(kù)開(kāi)發(fā)能力欠缺。重特大事件檔案數(shù)據(jù)庫(kù)在未來(lái)危機(jī)應(yīng)對(duì)中扮演著關(guān)鍵角色,《關(guān)于加強(qiáng)重特大事件檔案工作的通知》中明確提出了“建設(shè)重特大事件檔案數(shù)據(jù)庫(kù)”的具體要求,然而數(shù)據(jù)庫(kù)開(kāi)發(fā)能力欠缺問(wèn)題對(duì)實(shí)現(xiàn)這一要求構(gòu)成了明顯的障礙。開(kāi)發(fā)能力欠缺包括技術(shù)型人才欠缺、檔案管理人員信息分析和信息挖掘能力較弱、經(jīng)費(fèi)投入不足等,嚴(yán)重制約了重特大事件檔案價(jià)值發(fā)揮與潛能釋放。
三是重特大事件檔案數(shù)據(jù)共享平臺(tái)欠缺。數(shù)據(jù)共享平臺(tái)是檔案機(jī)構(gòu)在信息時(shí)代服務(wù)社會(huì)、展示工作成效和增強(qiáng)公共透明度的重要媒介。當(dāng)前,我國(guó)各省市檔案機(jī)構(gòu)大部分建設(shè)了官方公眾號(hào)平臺(tái)和專題展覽平臺(tái),但針對(duì)重特大事件這一特定領(lǐng)域的集中和系統(tǒng)化數(shù)據(jù)共享平臺(tái)的建設(shè)仍屬于起步階段。構(gòu)建高效、安全和易于訪問(wèn)的重特大事件檔案數(shù)據(jù)共享平臺(tái)對(duì)提高應(yīng)急管理能力和決策的有效性至關(guān)重要,也對(duì)增強(qiáng)社會(huì)公共透明度和歷史研究具有深遠(yuǎn)意義。
(三)微觀層面:數(shù)據(jù)資源問(wèn)題突出
從數(shù)據(jù)導(dǎo)向的微觀層面看,重特大事件檔案數(shù)據(jù)資源整合面臨的挑戰(zhàn)表現(xiàn)在多個(gè)維度。
首先是數(shù)據(jù)標(biāo)準(zhǔn)化問(wèn)題。一方面,不同的機(jī)構(gòu)和部門在記錄和存儲(chǔ)檔案數(shù)據(jù)時(shí),往往采用各自的標(biāo)準(zhǔn)和格式,這種格式和標(biāo)準(zhǔn)的差異不僅限于數(shù)據(jù)的表現(xiàn)形式,也涉及元數(shù)據(jù)的不一致性,比如數(shù)據(jù)來(lái)源、創(chuàng)建時(shí)間等關(guān)鍵信息的記錄方式不同。在自然災(zāi)害或大規(guī)模公共衛(wèi)生事件中,不同部門或機(jī)構(gòu)收集的數(shù)據(jù)可能因?yàn)楦袷讲灰恢露y以有效融合,從而影響對(duì)事件的快速響應(yīng)和決策制定。另一方面,隨著新數(shù)據(jù)的不斷涌入和標(biāo)準(zhǔn)的更新,持續(xù)的數(shù)據(jù)標(biāo)準(zhǔn)化工作是必要的,于是便需要一個(gè)有效的機(jī)制來(lái)定期更新和修訂數(shù)據(jù)標(biāo)準(zhǔn),以適應(yīng)不斷變化的需求。
其次是數(shù)據(jù)安全問(wèn)題。重特大事件檔案數(shù)據(jù)安全問(wèn)題呈現(xiàn)出多維度的復(fù)雜性,這一問(wèn)題的核心在于如何平衡數(shù)據(jù)的可用性與保護(hù)敏感信息的需求。重特大事件檔案數(shù)據(jù)通常涵蓋廣泛的個(gè)人和組織信息,包括但不限于個(gè)人身份細(xì)節(jié)、地理位置信息、健康記錄以及政府和企業(yè)的敏感操作信息。這類數(shù)據(jù)由于其高度敏感性和重要性,成為網(wǎng)絡(luò)攻擊者的主要目標(biāo),增加了數(shù)據(jù)泄露的風(fēng)險(xiǎn)。
最后是檔案數(shù)據(jù)的權(quán)屬問(wèn)題。重特大事件如自然災(zāi)害、大規(guī)模事故或公共衛(wèi)生事件,往往涉及廣泛的社會(huì)層面和多個(gè)部門,如應(yīng)急管理機(jī)構(gòu)、衛(wèi)生機(jī)構(gòu)、檔案機(jī)構(gòu)等,這種情況下,每個(gè)機(jī)構(gòu)或部門都可能對(duì)某部分?jǐn)?shù)據(jù)持有所有權(quán)或至少擁有某種形式的使用權(quán),這就會(huì)導(dǎo)致檔案數(shù)據(jù)的權(quán)屬邊界不明確。
(一)宏觀政策層:完善政策法規(guī)框架
政策指引和規(guī)劃引領(lǐng)一直是推動(dòng)我國(guó)檔案事業(yè)向前發(fā)展的關(guān)鍵力量,完善重特大事件檔案數(shù)據(jù)整合法規(guī)體系,是重特大事件檔案管理的迫切需求。
一是以法治為前提,提升下位法規(guī)政策與上位法規(guī)政策檔案利用方面的協(xié)同性。以法治作為指導(dǎo)思想,意味著要建立一個(gè)全面、靈活且適應(yīng)性強(qiáng)的法規(guī)框架。地方檔案管理部門應(yīng)當(dāng)依據(jù)《中華人民共和國(guó)檔案法》《關(guān)于加強(qiáng)重特大事件檔案工作的通知》等國(guó)家法規(guī)重新審視本地關(guān)于檔案事業(yè)的法規(guī)政策,設(shè)立重特大事件檔案數(shù)據(jù)管理的專用章節(jié),安排專用條款,確保從地方到中央在重特大事件檔案數(shù)據(jù)管理和使用方面都遵循同一套標(biāo)準(zhǔn)和原則,確保檔案數(shù)據(jù)的流通性和協(xié)同性。
二是以善治為中心,進(jìn)一步明確執(zhí)行機(jī)構(gòu)的角色定義。所謂善治,是指以向上向善的價(jià)值觀念,高效、公正且可持續(xù)推動(dòng)檔案事業(yè)的協(xié)同共治,自主自治。上級(jí)立法機(jī)構(gòu)和相關(guān)主管部門應(yīng)當(dāng)依法履行監(jiān)管責(zé)任,及時(shí)響應(yīng)檔案事業(yè)發(fā)展的需求和變化,不斷調(diào)整和優(yōu)化檔案數(shù)據(jù)管理的相關(guān)法律政策,及時(shí)識(shí)別和填補(bǔ)檔案數(shù)據(jù)管理中執(zhí)行機(jī)構(gòu)明確的法律空白,確保法規(guī)政策能夠全面、及時(shí)地覆蓋重特大事件檔案數(shù)據(jù)管理的各個(gè)方面,從而保證檔案數(shù)據(jù)的高效、公正和可持續(xù)管理。
三是以共治為抓手,智治為指引,優(yōu)化重特大事件檔案數(shù)據(jù)管理發(fā)展模式。一方面,重特大事件檔案管理應(yīng)加強(qiáng)完善社會(huì)協(xié)同機(jī)制,這意味著在檔案數(shù)據(jù)管理過(guò)程中,不僅僅以政府機(jī)構(gòu)為主導(dǎo),還要更多地吸納和融合社會(huì)力量協(xié)同參與。這種模式的優(yōu)勢(shì)在于能夠集中更廣泛的資源和專業(yè)知識(shí),提高檔案數(shù)據(jù)管理的全面性和多元性。另一方面,管理模式應(yīng)從技術(shù)倒逼向主動(dòng)變革轉(zhuǎn)變。這一轉(zhuǎn)變強(qiáng)調(diào)的是檔案數(shù)據(jù)管理必須緊跟時(shí)代步伐,主動(dòng)適應(yīng)和引入新技術(shù)和新理念,而不僅僅是在外部環(huán)境變化時(shí)被動(dòng)應(yīng)對(duì)。智引的核心是順應(yīng)時(shí)代需求,利用智能化技術(shù)和信息化手段同時(shí)結(jié)合數(shù)據(jù)驅(qū)動(dòng)的方法引導(dǎo),優(yōu)化檔案數(shù)據(jù)管理和決策的過(guò)程。因此,在信息技術(shù)飛速發(fā)展的今天,各級(jí)檔案機(jī)構(gòu)應(yīng)提升檔案管理人員對(duì)新技術(shù)的理解和運(yùn)用能力,主動(dòng)探索,利用新技術(shù)提高重特大事件檔案數(shù)據(jù)的質(zhì)量和整合效率。
(二)中觀技術(shù)層:AI賦能展現(xiàn)數(shù)據(jù)知識(shí)脈絡(luò)
在人工智能(Artificial Intelligence,AI)發(fā)展引領(lǐng)新一輪產(chǎn)業(yè)技術(shù)變革的背景下,數(shù)據(jù)處理方法不斷創(chuàng)新,處理效能也水漲船高。針對(duì)重特大事件檔案數(shù)據(jù)資源分布異構(gòu)、缺乏互操作性等問(wèn)題,應(yīng)當(dāng)引進(jìn)新技術(shù)、新方法,推動(dòng)技術(shù)升級(jí)和AI賦能,讓技術(shù)成為重特大事件檔案數(shù)據(jù)資源整合的重要驅(qū)動(dòng)力。
首先,針對(duì)數(shù)據(jù)處理能力不足問(wèn)題,可以通過(guò)引入高效的數(shù)據(jù)處理框架和平臺(tái)來(lái)加強(qiáng)。例如,使用分布式計(jì)算技術(shù),如Apache Hadoop[17]和Apache Spark[18]能夠處理大規(guī)模數(shù)據(jù)集,同時(shí)提高處理速度和效率。此外,利用云計(jì)算服務(wù),如Amazon Web Services[19](AWS)或Google Cloud Platform[20](GCP),能夠提供可擴(kuò)展的數(shù)據(jù)存儲(chǔ)和計(jì)算資源,確保數(shù)據(jù)處理的彈性和可靠性。
其次,針對(duì)數(shù)據(jù)異構(gòu)性和缺乏互操作性的問(wèn)題,可以采用先進(jìn)的數(shù)據(jù)整合技術(shù)。例如,使用ETL(提取、轉(zhuǎn)換、加載)工具和數(shù)據(jù)虛擬化技術(shù),可以幫助整合來(lái)自不同來(lái)源的數(shù)據(jù),并將它們轉(zhuǎn)換為統(tǒng)一格式。同時(shí),通過(guò)實(shí)施標(biāo)準(zhǔn)化的數(shù)據(jù)模型和接口,如使用JSON或XML格式,可以提高不同系統(tǒng)間的數(shù)據(jù)兼容性和互操作性。
最后,針對(duì)重特大事件檔案數(shù)據(jù)互聯(lián)互通共享數(shù)據(jù)平臺(tái)欠缺問(wèn)題,采用關(guān)聯(lián)數(shù)據(jù)和知識(shí)圖譜等技術(shù)可有效展現(xiàn)數(shù)據(jù)的知識(shí)脈絡(luò),提升對(duì)復(fù)雜信息的理解和分析能力。知識(shí)圖譜構(gòu)建的核心在于從龐大且多樣化的數(shù)據(jù)中識(shí)別關(guān)鍵實(shí)體(如人名、地點(diǎn)、事件等)和它們之間的關(guān)系,這包括但不限于因果關(guān)系、地理關(guān)系、時(shí)間序列等。通過(guò)這樣的結(jié)構(gòu)化表示,不僅能夠?qū)⒃痉稚⑶译y以關(guān)聯(lián)的數(shù)據(jù)點(diǎn)轉(zhuǎn)化為有意義的信息網(wǎng)絡(luò),還能夠通過(guò)各種關(guān)系揭示數(shù)據(jù)背后的深層次聯(lián)系和模式。此外,知識(shí)圖譜和關(guān)聯(lián)數(shù)據(jù)技術(shù)支持復(fù)雜的數(shù)據(jù)查詢和分析,使得用戶能夠針對(duì)特定的問(wèn)題或需求,從多個(gè)角度和層面對(duì)數(shù)據(jù)進(jìn)行深入挖掘。例如,可以查詢特定重大事件的影響范圍、相關(guān)的人物和機(jī)構(gòu),或者分析特定時(shí)間段內(nèi)的事件發(fā)展趨勢(shì)。這種靈活性對(duì)于理解重特大事件的背景、影響和發(fā)展至關(guān)重要。通過(guò)AI賦能,可以有效地揭示重特大事件檔案數(shù)據(jù)背后的知識(shí)脈絡(luò),為后續(xù)決策制定、科學(xué)研究和應(yīng)急管理提供有力的支持。
(三)微觀數(shù)據(jù)層:護(hù)航數(shù)據(jù)安全和數(shù)據(jù)質(zhì)量
面對(duì)數(shù)字時(shí)代的變革與機(jī)遇,檔案機(jī)構(gòu)在大規(guī)模和多源的數(shù)據(jù)環(huán)境中,如何制定策略、進(jìn)行決策和管理好檔案數(shù)據(jù)成為解決重特大事件檔案數(shù)據(jù)問(wèn)題的關(guān)鍵。
首先,數(shù)據(jù)標(biāo)準(zhǔn)化是至關(guān)重要的,它涉及將不同來(lái)源和格式的數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的格式,以便后續(xù)的處理和分析。因此需要制定一套統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),這包括確定數(shù)據(jù)格式、編碼規(guī)則、命名約定和數(shù)據(jù)結(jié)構(gòu)等。這些標(biāo)準(zhǔn)應(yīng)當(dāng)被組織內(nèi)部所有相關(guān)部門和團(tuán)隊(duì)成員接受和遵守。
其次,針對(duì)數(shù)據(jù)質(zhì)量問(wèn)題,應(yīng)完善數(shù)據(jù)質(zhì)量控制,包括數(shù)據(jù)清洗和數(shù)據(jù)驗(yàn)證。這些步驟確保了數(shù)據(jù)的可靠性和有效性。此外,強(qiáng)化數(shù)據(jù)存儲(chǔ)和管理,使用高效的數(shù)據(jù)庫(kù)系統(tǒng)和數(shù)據(jù)管理工具,如云存儲(chǔ)和分布式數(shù)據(jù)庫(kù),不僅可以提高數(shù)據(jù)存儲(chǔ)的效率和靈活性,還可以增強(qiáng)數(shù)據(jù)的安全性。針對(duì)數(shù)據(jù)安全問(wèn)題,應(yīng)建立嚴(yán)格的權(quán)限控制機(jī)制,確保只有經(jīng)過(guò)授權(quán)的人員才能夠訪問(wèn)和處理敏感數(shù)據(jù),防范未授權(quán)的訪問(wèn)。同時(shí),采用加密和脫敏技術(shù),對(duì)重特大事件檔案中的敏感信息進(jìn)行保護(hù),確保在數(shù)據(jù)的傳輸和存儲(chǔ)過(guò)程中,即便被非法獲取,也難以解讀。此外,應(yīng)建立完善的監(jiān)測(cè)和審計(jì)機(jī)制,對(duì)數(shù)據(jù)訪問(wèn)和操作進(jìn)行定期審查,及時(shí)發(fā)現(xiàn)潛在的安全風(fēng)險(xiǎn)。
最后,針對(duì)檔案數(shù)據(jù)權(quán)屬問(wèn)題,各部門應(yīng)明確檔案數(shù)據(jù)的所有權(quán)和使用權(quán),對(duì)法律和政策全面審查,以確定檔案數(shù)據(jù)受哪些法律和政策的約束。通過(guò)這些綜合措施,可以有效地解決數(shù)據(jù)資源問(wèn)題,提高數(shù)據(jù)處理和分析的效率和質(zhì)量,支持更加精準(zhǔn)和高效的決策制定。
*本文系中國(guó)國(guó)家社會(huì)科學(xué)基金青年項(xiàng)目(項(xiàng)目編號(hào):21CTQ028)“文化大數(shù)據(jù)背景下古村落多源異構(gòu)檔案的知識(shí)融合”的研究成果。
注釋及參考文獻(xiàn):
[1]中共中央辦公廳,國(guó)務(wù)院辦公廳.中辦國(guó)辦印發(fā)《關(guān)于加強(qiáng)重特大事件檔案工作的通知》[N].人民日?qǐng)?bào),2022-12-13(001).
[2]中共中央辦公廳,國(guó)務(wù)院辦公廳.國(guó)家檔案局負(fù)責(zé)人就《中共中央辦公廳國(guó)務(wù)院辦公廳關(guān)于加強(qiáng)重特大事件檔案工作的通知》實(shí)施答記者問(wèn)[N].中國(guó)檔案報(bào),2022-12-15(001).
[3]姚明.我國(guó)重特大事件檔案法規(guī)政策協(xié)同化研究[J].檔案學(xué)研究,2023(4):40-46.
[4]左娜,張衛(wèi)東.面向數(shù)字人文的檔案資源整合模式構(gòu)想:解構(gòu)與重組[J].檔案學(xué)通訊,2020(3):29-37.
[5]華林,杜仕若,邱雨輝.基于抗戰(zhàn)記憶傳承的南僑機(jī)工檔案資源體系化建設(shè)研究[J].北京檔案,2020(7):11-14.
[6]方鳴,丁家友,裴洋.文旅融合背景下的檔案信息資源整合研究——以蘇州市為例[J].檔案學(xué)通訊,2020(6):54-60.
[7]胡仁浩.跨區(qū)域紅色檔案資源協(xié)作開(kāi)發(fā)利用實(shí)踐與研究——以川渝地區(qū)檔案館為例[J].檔案學(xué)研究,2023(2):87-94.
[8]鄭婷婷,于小寧,陳旖旎.基于海洋科技發(fā)展的觀測(cè)監(jiān)測(cè)檔案資源動(dòng)態(tài)整合與利用探究[J].北京檔案,2023(3):17-20.
[9]張夢(mèng).紅色文學(xué)檔案資源整合與開(kāi)發(fā)——以中國(guó)現(xiàn)代文學(xué)館為例[J].中國(guó)檔案,2023(3):40-41.
[10]歸吉官,農(nóng)秀北.邊境地區(qū)涉外民生檔案資源整合機(jī)制創(chuàng)新研究[J].北京檔案,2021(11):31-33.
[11]朱蘭蘭,段燕鴿.敘事理論在紅色檔案資源開(kāi)發(fā)中的應(yīng)用——以大別山區(qū)為例[J].檔案學(xué)研究,2023(2):95-102.
[12]連志英.數(shù)字檔案資源整合影響因素分析:基于建構(gòu)型扎根理論的研究[J].檔案學(xué)通訊,2015(6):52-56.
[13]陳慧,王曉曉,南夢(mèng)潔,等.數(shù)字檔案資源整合與服務(wù)過(guò)程中的隱性知識(shí)分類——以賦能思維為視角[J].圖書與情報(bào),2019(6):118-124.
[14]陳海玉,趙冉,萬(wàn)小玥,等.基于SOA的少數(shù)民族檔案資源整合及實(shí)現(xiàn)路徑研究[J].檔案管理,2020(2):53-55.
[15]POOLE M S, VAN DE VEN A H. Using para? dox to build management and organization theories[J]. Academy of management review, 1989,14(4):562-578.
[16]謝倫伯格.現(xiàn)代檔案——原則與技術(shù)[M].黃坤坊,譯.北京:檔案出版社,1983:15.
[17]董新華,李瑞軒,周灣灣,等.Hadoop系統(tǒng)性能優(yōu)化與功能增強(qiáng)綜述[J].計(jì)算機(jī)研究與發(fā)展,2013,50(S2):1-15.
[18]楊珍珍,張堅(jiān)君.基于Spark技術(shù)的高校校史編研系統(tǒng)研究與實(shí)現(xiàn)[J].浙江檔案,2022(1):51-53.
[19]馬曉亭,陳臣.基于亞馬遜AWS云服務(wù)的數(shù)字圖書館云計(jì)算基礎(chǔ)設(shè)施構(gòu)建[J].情報(bào)科學(xué),2013,31(1):46-51.
[20]徐泉,王良勇,劉長(zhǎng)鑫.工業(yè)云應(yīng)用與技術(shù)綜述[J].計(jì)算機(jī)集成制造系統(tǒng),2018,24(8):1887-1901.
作者單位:中國(guó)人民大學(xué)信息資源管理學(xué)院