亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)質(zhì)量控制:現(xiàn)狀、機(jī)制與優(yōu)化路徑

        2022-03-29 13:42:04周林興林凱
        檔案與建設(shè) 2022年2期

        周林興 林凱

        摘 要:檔案數(shù)據(jù)是大數(shù)據(jù)時(shí)代經(jīng)濟(jì)社會(huì)發(fā)展的重要信息資源,進(jìn)行檔案數(shù)據(jù)質(zhì)量控制研究有助于促進(jìn)檔案治理能力現(xiàn)代化的提升。通過調(diào)查分析可知,檔案數(shù)據(jù)存有政策法規(guī)缺失、數(shù)量巨大結(jié)構(gòu)復(fù)雜、數(shù)據(jù)實(shí)踐處于起步階段等現(xiàn)狀?;诂F(xiàn)狀特征構(gòu)建了檔案數(shù)據(jù)質(zhì)量控制機(jī)制:數(shù)據(jù)監(jiān)督管控機(jī)制、技術(shù)保障機(jī)制、質(zhì)量評(píng)估機(jī)制,并提出增強(qiáng)檔案數(shù)據(jù)質(zhì)量控制頂層設(shè)計(jì),筑造檔案數(shù)據(jù)質(zhì)量技術(shù)保護(hù)屏障,構(gòu)建檔案數(shù)據(jù)質(zhì)量評(píng)估方法體系等優(yōu)化路徑。

        關(guān)鍵詞:大數(shù)據(jù)時(shí)代;檔案數(shù)據(jù);數(shù)據(jù)質(zhì)量控制;質(zhì)量?jī)?yōu)化

        分類號(hào):G273

        Quality control of archival data in the era of big data: Current situation, Mechanism and Optimization path

        Zhou Linxing, Lin Kai

        ( School of Cultural Heritage and Information Management Shanghai University, Shanghai 200444 )

        Abstract: Archival data is an important information resource for economic and social development in the era of big data. The research on archival data quality control will help to promote the modernization of archival management ability. Through investigation and analysis, it can be seen that there are some current situations in archival data, such as lack of policies and regulations, huge quantity and complex structure, data practice in the initial stage and so on. Based on the current characteristics, this paper constructs the archives data quality control mechanism: data Supervision and control mechanism, technical guarantee mechanism and quality evaluation mechanism. Meanwhile it proposes to strengthen the supervision and control of archival data quality, building technical guarantee barriers for archival data quality, construction of archives data quality evaluation method system and other optimization paths.

        Keywords: Big data era; Archival data; Data quality control; Quality optimization

        1 引 言

        大數(shù)據(jù)時(shí)代,隨著檔案管理數(shù)字轉(zhuǎn)型不斷推進(jìn)及數(shù)據(jù)處理技術(shù)應(yīng)用推廣,檔案數(shù)據(jù)管理逐漸成為檔案工作的新常態(tài)。然而,檔案部門仍然存在嚴(yán)重的重?cái)?shù)量輕質(zhì)量的管理思想,數(shù)據(jù)污染、數(shù)據(jù)異構(gòu)、數(shù)據(jù)安全、數(shù)據(jù)孤島等問題突出。[1]究其原因,主要在于檔案數(shù)據(jù)質(zhì)量控制缺失,難以適應(yīng)海量檔案數(shù)據(jù)管理需求。現(xiàn)階段,迫切需要開展關(guān)于檔案數(shù)據(jù)質(zhì)量控制的研究,實(shí)現(xiàn)檔案數(shù)據(jù)規(guī)范化、標(biāo)準(zhǔn)化管控,推動(dòng)檔案數(shù)據(jù)朝著善治方向發(fā)展。

        檔案數(shù)據(jù)屬于檔案信息資源范疇,具備檔案的基本屬性,既包括檔案部門已經(jīng)掌握的各類數(shù)字化檔案資源、電子檔案等,還包括具有長(zhǎng)久保存價(jià)值但還沒有納入檔案部門保管范圍的數(shù)據(jù),以及檔案管理業(yè)務(wù)過程中產(chǎn)生的各類數(shù)據(jù)等。[2]檔案數(shù)據(jù)質(zhì)量控制,即在檔案部門主導(dǎo)下聯(lián)合業(yè)務(wù)部門、數(shù)據(jù)管理部門、檔案外包機(jī)構(gòu)等,在相關(guān)法律法規(guī)、標(biāo)準(zhǔn)規(guī)范指引下,采用一定手段對(duì)處在形成、運(yùn)行、傳輸、保管、利用等過程中的檔案數(shù)據(jù)進(jìn)行管控,使其保持穩(wěn)定的質(zhì)量效果,符合檔案工作需求。

        學(xué)界對(duì)檔案數(shù)據(jù)質(zhì)量控制研究已有初步探索,主要集中于三個(gè)方面。一是對(duì)檔案數(shù)據(jù)質(zhì)量控制的認(rèn)知。檔案數(shù)據(jù)質(zhì)量控制是檔案規(guī)范管理的基礎(chǔ),[3]是大數(shù)據(jù)時(shí)代維護(hù)檔案數(shù)據(jù)質(zhì)量的關(guān)鍵,要采取一定的方式和手段加以優(yōu)化。[4]二是從頂層設(shè)計(jì)上提出檔案數(shù)據(jù)質(zhì)量控制的規(guī)范。從構(gòu)建檔案部門數(shù)據(jù)治理權(quán)責(zé)體系著手,明確各部門的權(quán)責(zé),[5]重視檔案數(shù)據(jù)治理中的質(zhì)量問題,制定檔案數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)和管理制度,維護(hù)檔案數(shù)據(jù)質(zhì)量。[6]三是根據(jù)可能出現(xiàn)的數(shù)據(jù)質(zhì)量問題提出對(duì)應(yīng)的技術(shù)措施。如面對(duì)數(shù)量巨大、類型眾多的檔案數(shù)據(jù),可構(gòu)建檔案數(shù)據(jù)基因系統(tǒng),促進(jìn)大規(guī)模檔案數(shù)據(jù)的融合與共享,[7]亦可將檔案數(shù)據(jù)進(jìn)行語義化重組,使得大量參差不齊的數(shù)據(jù)能夠有效組織。[8]同時(shí),在面對(duì)眾多異構(gòu)檔案數(shù)據(jù)時(shí),應(yīng)探索使用開源類軟件工具,將異構(gòu)數(shù)據(jù)轉(zhuǎn)化為同構(gòu)數(shù)據(jù),[9]從而保障數(shù)據(jù)質(zhì)量??梢?,檔案數(shù)據(jù)質(zhì)量控制已成為大數(shù)據(jù)時(shí)代構(gòu)建檔案數(shù)據(jù)治理體系的重要組成部分,但是,現(xiàn)有研究主要從分析檔案數(shù)據(jù)質(zhì)量的內(nèi)涵和提升其質(zhì)量的路徑等方面出發(fā),未對(duì)其現(xiàn)狀和機(jī)制進(jìn)行研究。因此,本文希望構(gòu)建一套合理的檔案數(shù)據(jù)質(zhì)量控制機(jī)制,并提出優(yōu)化路徑,以期全面維護(hù)檔案數(shù)據(jù)質(zhì)量。

        2 大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)質(zhì)量控制現(xiàn)狀分析

        2.1 檔案數(shù)據(jù)政策法規(guī)制度缺失

        政策法規(guī)制度是維護(hù)檔案數(shù)據(jù)質(zhì)量的重要保障。新修訂的《中華人民共和國(guó)檔案法》第三十五條提出:“保障電子檔案、傳統(tǒng)載體檔案數(shù)字化成果等檔案數(shù)字資源的安全保存和有效利用?!笨梢姡瑱n案數(shù)據(jù)質(zhì)量控制在宏觀層面已經(jīng)受到關(guān)注,但是,在微觀層面上,目前配套的政策法規(guī)制度尚未完備,現(xiàn)有的政策標(biāo)準(zhǔn)(如表1所示)主要局限于系統(tǒng)規(guī)范、數(shù)據(jù)存儲(chǔ)等方面,而對(duì)其形成、傳輸、運(yùn)行、保管、利用等各方面的規(guī)范存在缺失。

        2.2 檔案數(shù)據(jù)數(shù)量巨大結(jié)構(gòu)復(fù)雜

        大數(shù)據(jù)時(shí)代,檔案工作數(shù)字化轉(zhuǎn)型加速升級(jí),文件“單軌制”持續(xù)推進(jìn),檔案數(shù)據(jù)呈現(xiàn)出數(shù)量巨大、結(jié)構(gòu)復(fù)雜的特點(diǎn)。一方面,檔案資源總量迅速膨脹。據(jù)統(tǒng)計(jì),2020年全國(guó)各級(jí)國(guó)家綜合檔案館館藏電子檔案存儲(chǔ)容量達(dá)1387.5TB,其中,數(shù)碼照片390.2TB,數(shù)字錄音、數(shù)字錄像523.5TB。館藏檔案數(shù)字化成果更是達(dá)到19588.5TB。[10]檔案數(shù)據(jù)的快速增長(zhǎng)給檔案管理、利用工作帶來巨大挑戰(zhàn),但當(dāng)前,檔案數(shù)據(jù)化卻主要依靠人工方式完成,[11]技術(shù)水準(zhǔn)較低,管控難度極大,容易造成檔案數(shù)據(jù)錯(cuò)誤。另一方面,與傳統(tǒng)環(huán)境下檔案數(shù)據(jù)較為單一的結(jié)構(gòu)相比,大數(shù)據(jù)時(shí)代的檔案數(shù)據(jù)產(chǎn)生環(huán)境呈現(xiàn)網(wǎng)絡(luò)化、數(shù)據(jù)化的特征,大量非結(jié)構(gòu)化、半結(jié)構(gòu)化、結(jié)構(gòu)化甚至異構(gòu)數(shù)據(jù)融合共存,[12]易造成數(shù)據(jù)管理標(biāo)準(zhǔn)不一致、格式不兼容等問題,導(dǎo)致檔案數(shù)據(jù)質(zhì)量下降。

        2.3 檔案數(shù)據(jù)實(shí)踐處于起步階段

        檔案數(shù)據(jù)化的持續(xù)推進(jìn)倒逼實(shí)踐部門改善管理理念、更新數(shù)據(jù)處理技術(shù),但是,檔案數(shù)據(jù)實(shí)踐尚處于起步階段,技術(shù)應(yīng)用尚未成熟,實(shí)踐部門之間缺乏有效聯(lián)動(dòng),檔案數(shù)據(jù)質(zhì)量控制效果甚微。一方面,檔案部門依然更多地將關(guān)注點(diǎn)放在檔案數(shù)據(jù)的數(shù)量增長(zhǎng)上,越來越多的檔案館館藏檔案數(shù)字化程度可達(dá)到較高水平,但是,檔案部門對(duì)其館藏?cái)?shù)字資源的管理大多只停留在簡(jiǎn)單的組織、檢索、利用層面,[13]未能對(duì)其進(jìn)行深度的數(shù)據(jù)挖掘、數(shù)據(jù)審查及安全維護(hù)等操作。另一方面,館藏資源呈現(xiàn)出孤立、碎片化的管理格局,易造成“數(shù)據(jù)壁壘”“數(shù)據(jù)孤島”等質(zhì)量問題。如大連市在民生檔案數(shù)據(jù)資源整合共享方面,其戶籍檔案與大連檔案部門的檔案是分散管理、各自為政的,“數(shù)據(jù)孤島”現(xiàn)象嚴(yán)重,未有做到有效的整合與共享。[14]

        3 大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)質(zhì)量控制機(jī)制

        檔案數(shù)據(jù)質(zhì)量控制應(yīng)立足數(shù)據(jù)生命周期過程,綜合應(yīng)用標(biāo)準(zhǔn)、技術(shù)、主體協(xié)同等手段保證檔案數(shù)據(jù)在整個(gè)生命周期中始終保持質(zhì)量效果穩(wěn)定,構(gòu)建檔案數(shù)據(jù)質(zhì)量監(jiān)督管控、技術(shù)保障、質(zhì)量評(píng)估等控制機(jī)制。

        3.1 檔案數(shù)據(jù)監(jiān)督管控機(jī)制

        應(yīng)對(duì)檔案數(shù)據(jù)管理各個(gè)環(huán)節(jié)制訂對(duì)應(yīng)的標(biāo)準(zhǔn)規(guī)范,形成有效的監(jiān)督管控機(jī)制,確保檔案數(shù)據(jù)始終保持真實(shí)、可靠、規(guī)范、可控的特征,方可滿足檔案工作和用戶利用的需求。

        (1)前端標(biāo)準(zhǔn)規(guī)范的嵌入機(jī)制。依據(jù)檔案數(shù)據(jù)質(zhì)量管控要求,把相關(guān)的標(biāo)準(zhǔn)規(guī)范嵌入文件的形成過程,以便從源頭出發(fā),形成完備的檔案數(shù)據(jù)來源管控機(jī)制。一是檔案部門需要明確檔案數(shù)字化、數(shù)據(jù)質(zhì)量管理要求,制訂前端控制階段檔案數(shù)據(jù)識(shí)別、數(shù)據(jù)檢測(cè)、數(shù)據(jù)清洗、數(shù)據(jù)分類、數(shù)據(jù)錄入、數(shù)據(jù)標(biāo)引、元數(shù)據(jù)封裝等標(biāo)準(zhǔn)規(guī)范,形成有效的規(guī)范機(jī)制管控來源端的檔案數(shù)據(jù)質(zhì)量。二是依據(jù)標(biāo)準(zhǔn)規(guī)范制訂實(shí)踐指南,設(shè)計(jì)數(shù)據(jù)核驗(yàn)計(jì)劃、行動(dòng)方案、監(jiān)控手段,做好檔案數(shù)據(jù)在生成階段的質(zhì)量檢測(cè)措施,保證檔案數(shù)據(jù)源頭的準(zhǔn)確性、完整性、可靠性。

        (2)流轉(zhuǎn)過程中的高效監(jiān)管機(jī)制。必須采取高效的監(jiān)管措施,形成有效的監(jiān)管運(yùn)行機(jī)制,確保檔案數(shù)據(jù)在傳輸、保管、利用等流轉(zhuǎn)過程中的質(zhì)量,且技術(shù)要求等應(yīng)根據(jù)檔案業(yè)務(wù)工作需求變化而隨時(shí)更新。一是要制訂檔案數(shù)據(jù)變更、加載、格式轉(zhuǎn)換等技術(shù)要求,防范數(shù)據(jù)錯(cuò)誤、難以讀取、利用困難等質(zhì)量問題。二是要制訂檔案數(shù)據(jù)管控標(biāo)準(zhǔn),明確數(shù)據(jù)歸檔原則、歸檔流程、數(shù)據(jù)存儲(chǔ)規(guī)范,掌握其歸檔效率、完整率等。同時(shí),制訂檔案數(shù)據(jù)定期核驗(yàn)標(biāo)準(zhǔn),以便于對(duì)保存期的檔案數(shù)據(jù)定期核驗(yàn)、復(fù)查,使其能隨時(shí)提供利用。三是形成合理的檔案數(shù)據(jù)利用規(guī)范,明確數(shù)據(jù)開放利用范圍、利用流程等,并確保其滿足可機(jī)讀、易訪問、能下載等通用技術(shù)指標(biāo)。

        3.2 檔案數(shù)據(jù)技術(shù)保障機(jī)制

        檔案數(shù)據(jù)的質(zhì)量由兩方面內(nèi)容構(gòu)成:一是檔案數(shù)據(jù)自身的質(zhì)量,即檔案數(shù)據(jù)準(zhǔn)確、可靠、可用的程度;二是檔案數(shù)據(jù)過程質(zhì)量,即檔案數(shù)據(jù)在傳輸、存儲(chǔ)、運(yùn)行、利用等過程中的質(zhì)量。[15]因此,可從元數(shù)據(jù)管控、數(shù)據(jù)運(yùn)轉(zhuǎn)過程兩個(gè)方面入手。

        (1)打造有效的元數(shù)據(jù)管控機(jī)制。有效的元數(shù)據(jù)管控機(jī)制對(duì)于保證檔案數(shù)據(jù)質(zhì)量具有重要的意義。因此,必須要打造切實(shí)可行的檔案元數(shù)據(jù)管控機(jī)制,實(shí)現(xiàn)對(duì)各元數(shù)據(jù)名稱和語義的規(guī)范化管控,并盡量以已有標(biāo)準(zhǔn)為指南,加深引用、復(fù)用的方式構(gòu)建新的元數(shù)據(jù)管控機(jī)制。如可利用Dublin Core作為基礎(chǔ)復(fù)用元數(shù)據(jù)標(biāo)準(zhǔn),在復(fù)用基礎(chǔ)上結(jié)合大數(shù)據(jù)時(shí)代社交媒體檔案數(shù)據(jù)特征進(jìn)行元素?cái)U(kuò)展,制訂完整的社交媒體文件元數(shù)據(jù)歸檔技術(shù)方案,[16]實(shí)現(xiàn)海量社交媒體數(shù)據(jù)的歸檔。

        (2)構(gòu)建科學(xué)的檔案數(shù)據(jù)運(yùn)轉(zhuǎn)機(jī)制??茖W(xué)的檔案數(shù)據(jù)運(yùn)轉(zhuǎn)機(jī)制,能克服檔案數(shù)據(jù)在運(yùn)行、傳輸、存儲(chǔ)、利用過程中易受到的技術(shù)異常、系統(tǒng)漏洞或管理人員操作不當(dāng)?shù)炔焕蛩赜绊?,[17]保證檔案數(shù)據(jù)質(zhì)量在全生命周期中始終處于良好狀態(tài)。一是注重?cái)?shù)據(jù)審查技術(shù)的應(yīng)用,加強(qiáng)對(duì)檔案數(shù)據(jù)的檢測(cè)、識(shí)別,實(shí)現(xiàn)對(duì)其質(zhì)量的全面追蹤。二是更新數(shù)據(jù)庫(kù)技術(shù)和存儲(chǔ)設(shè)備,促進(jìn)不同來源、異構(gòu)、碎片化、離散性強(qiáng)的檔案數(shù)據(jù)之間的整合集成,使其在存儲(chǔ)過程中保持關(guān)聯(lián),確??梢灾貜?fù)利用。如2020年4月浙江省檔案館啟動(dòng)省檔案數(shù)據(jù)中心建設(shè),旨在匯集全省開放檔案、民生檔案、專題檔案等資源數(shù)據(jù),以及檔案收集管理、開發(fā)利用等工作數(shù)據(jù),[18]為統(tǒng)籌整合檔案數(shù)據(jù)、提供高質(zhì)量數(shù)據(jù)服務(wù)做了充足準(zhǔn)備。

        3.3 檔案數(shù)據(jù)質(zhì)量評(píng)估機(jī)制

        通過構(gòu)建科學(xué)的檔案數(shù)據(jù)質(zhì)量評(píng)估機(jī)制,使其質(zhì)量效果能滿足多方面需求,從而促進(jìn)檔案數(shù)據(jù)服務(wù)的優(yōu)化。

        (1)形成實(shí)用的評(píng)估指標(biāo)遴選機(jī)制。檔案數(shù)據(jù)質(zhì)量評(píng)估機(jī)制科學(xué)的運(yùn)轉(zhuǎn),建立在指標(biāo)合理設(shè)計(jì)與分布的基礎(chǔ)之上,因此,評(píng)估指標(biāo)的遴選機(jī)制必須科學(xué)合理,能夠反映檔案數(shù)據(jù)質(zhì)量的要求,所遴選的指標(biāo)應(yīng)包括但不限于以下:可用性,即檔案數(shù)據(jù)是否可用,是否滿足可機(jī)讀、可運(yùn)行、重復(fù)利用等技術(shù)標(biāo)準(zhǔn);完整性,即檔案數(shù)據(jù)是否完整,數(shù)據(jù)實(shí)體、數(shù)據(jù)屬性是否缺失;準(zhǔn)確性,即檔案數(shù)據(jù)所記錄的事實(shí)是否準(zhǔn)確真實(shí);規(guī)范性,即檔案數(shù)據(jù)的格式、類型、值域等指標(biāo)是否合規(guī);一致性,即檔案數(shù)據(jù)是否出現(xiàn)變更;關(guān)聯(lián)性,即保持檔案數(shù)據(jù)之間的關(guān)聯(lián);可控性,即檔案數(shù)據(jù)從生成到流轉(zhuǎn)的各環(huán)節(jié)都可以得到有效控制。[19]并且,對(duì)相關(guān)指標(biāo)具體要求、規(guī)范等還必須要形成良好的增減制度,實(shí)現(xiàn)評(píng)估指標(biāo)遴選的動(dòng)態(tài)化操作,使遴選機(jī)制更加高效與科學(xué)合理。

        (2)構(gòu)建多元化評(píng)估主體的參與機(jī)制。只有構(gòu)建順暢的社會(huì)主體參與渠道,并形成有效的社會(huì)主體參與機(jī)制,檔案部門才能充分調(diào)動(dòng)與借助社會(huì)力量,助推檔案數(shù)據(jù)質(zhì)量評(píng)估機(jī)制順利實(shí)現(xiàn)。一是主動(dòng)強(qiáng)化與立檔單位、技術(shù)部門、大數(shù)據(jù)管理部門等組織機(jī)構(gòu)的協(xié)同聯(lián)動(dòng)機(jī)制,從實(shí)際出發(fā),評(píng)估檔案數(shù)據(jù)質(zhì)量是否滿足需要。二是檔案部門可基于自身網(wǎng)絡(luò)基礎(chǔ)設(shè)施,打通與社會(huì)公眾的交互渠道,收集其利用檔案數(shù)據(jù)的體驗(yàn)感受,形成良好的反饋機(jī)制,并根據(jù)公眾的反饋建議改善數(shù)據(jù)質(zhì)量,確保檔案數(shù)據(jù)服務(wù)的優(yōu)質(zhì)性。如美國(guó)國(guó)家檔案館(NARA)分別建立了與政府、社會(huì)資本和公眾的合作機(jī)制,[20]有效促進(jìn)了多元主體共同參與檔案數(shù)據(jù)質(zhì)量控制。

        4 大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)質(zhì)量控制優(yōu)化路徑

        4.1 加強(qiáng)檔案數(shù)據(jù)質(zhì)量控制頂層設(shè)計(jì)

        檔案數(shù)據(jù)質(zhì)量監(jiān)督管控等標(biāo)準(zhǔn)規(guī)范的制訂需要立足于國(guó)家層面的頂層設(shè)計(jì),對(duì)此,可通過推進(jìn)檔案數(shù)據(jù)質(zhì)量控制走進(jìn)法律視野,制訂檔案數(shù)據(jù)質(zhì)量控制戰(zhàn)略規(guī)劃等方式,增強(qiáng)頂層設(shè)計(jì),為檔案數(shù)據(jù)質(zhì)量控制的具體實(shí)踐提供綱領(lǐng)性指導(dǎo)。

        (1)推進(jìn)檔案數(shù)據(jù)質(zhì)量控制走進(jìn)法律視野。一是需要在法理層面進(jìn)一步明確檔案主管機(jī)構(gòu)對(duì)檔案數(shù)據(jù)的監(jiān)督管控職責(zé),精確劃定檔案數(shù)據(jù)保密、開放共享以及用戶群體在維護(hù)數(shù)據(jù)完整與安全方面必須履行的責(zé)任和義務(wù)。二是應(yīng)在法律上明確檔案數(shù)據(jù)質(zhì)量控制應(yīng)達(dá)到能夠有效保障數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全的效果,切實(shí)改變檔案部門“重?cái)?shù)量,輕質(zhì)量”的管理思想,關(guān)注檔案數(shù)據(jù)的生命周期過程,確保其生命周期各階段能凸顯自身的價(jià)值,成為社會(huì)運(yùn)轉(zhuǎn)的決策依據(jù)。

        (2)制訂檔案數(shù)據(jù)質(zhì)量控制戰(zhàn)略規(guī)劃。一是檔案部門需要完善現(xiàn)有的檔案數(shù)據(jù)質(zhì)量控制戰(zhàn)略規(guī)劃,增加檔案數(shù)據(jù)權(quán)益維護(hù)、檔案數(shù)據(jù)服務(wù)平臺(tái)建設(shè)規(guī)劃等方面的內(nèi)容,為微觀層面標(biāo)準(zhǔn)規(guī)范的制訂和完善提供方向引導(dǎo)。二是應(yīng)該充分考慮到不同數(shù)據(jù)資源的特點(diǎn),明確檔案數(shù)據(jù)管理發(fā)展方向,制訂統(tǒng)一的戰(zhàn)略,充分保證數(shù)據(jù)質(zhì)量。如美國(guó)國(guó)家檔案與文件署(NARA)對(duì)不同類型檔案數(shù)據(jù)的管理戰(zhàn)略值得我們借鑒。該館在2007年發(fā)布了《鑒定政策戰(zhàn)略方向》(Appraisal Policy of the National Archives),其附件二《對(duì)特定類型的文件的特殊考慮》[21]中對(duì)不同類型的檔案數(shù)據(jù)管理做了特別說明。

        4.2 筑造檔案數(shù)據(jù)質(zhì)量技術(shù)保護(hù)屏障

        大數(shù)據(jù)時(shí)代,檔案數(shù)據(jù)質(zhì)量需要更為先進(jìn)的技術(shù)保障。在對(duì)檔案元數(shù)據(jù)的管控中,應(yīng)遵從元數(shù)據(jù)管理規(guī)范,采用對(duì)應(yīng)技術(shù)進(jìn)行元數(shù)據(jù)管控;面對(duì)檔案數(shù)據(jù)生命周期各階段的質(zhì)量問題,可開發(fā)多類型的數(shù)據(jù)審查類、保管類管理工具全面維護(hù)其質(zhì)量效果,從而構(gòu)成堅(jiān)實(shí)的檔案數(shù)據(jù)質(zhì)量技術(shù)保護(hù)屏障。

        (1)拓展技術(shù)應(yīng)用深度,強(qiáng)化元數(shù)據(jù)技術(shù)運(yùn)用。大數(shù)據(jù)環(huán)境下,檔案元數(shù)據(jù)管控需要具備完善的拓展功能以滿足海量數(shù)據(jù)描述需求,并能對(duì)其進(jìn)行實(shí)時(shí)捕獲。一是可應(yīng)用元數(shù)據(jù)自動(dòng)生成技術(shù),通過爬蟲工具對(duì)網(wǎng)頁資源的時(shí)間戳、文件類型、URL、MIME等信息進(jìn)行捕獲,并解析HTML網(wǎng)頁源代碼獲取標(biāo)簽信息,從而實(shí)現(xiàn)海量元數(shù)據(jù)的管理。[22]如希臘網(wǎng)頁歸檔項(xiàng)目中對(duì)網(wǎng)頁和錨文本的關(guān)鍵詞進(jìn)行自動(dòng)抽取,形成分類集群,實(shí)現(xiàn)了大量網(wǎng)頁數(shù)據(jù)的歸檔,有效維護(hù)了數(shù)據(jù)質(zhì)量。[23]二是可探索應(yīng)用開源技術(shù)開發(fā)元數(shù)據(jù)管理工具。美國(guó)地質(zhì)勘探局在其官網(wǎng)上推薦了數(shù)據(jù)管理、元數(shù)據(jù)創(chuàng)建等工具,并公布了可供下載的鏈接等,[24]我國(guó)檔案部門可借此鏈接積極訪問,利用其公開的源代碼和技術(shù)架構(gòu),開發(fā)自己的開源類元數(shù)據(jù)管理工具。

        (2)擴(kuò)展技術(shù)應(yīng)用廣度,豐富檔案數(shù)據(jù)管理工具類型。檔案數(shù)據(jù)在整個(gè)生命周期過程中易受到多種復(fù)雜因素的影響,單一的技術(shù)難以全面保障數(shù)據(jù)質(zhì)量效果,應(yīng)針對(duì)各階段檔案數(shù)據(jù)質(zhì)量維護(hù)的實(shí)際需求,開發(fā)相應(yīng)的管理工具。歐美國(guó)家在檔案數(shù)據(jù)管理工具的開發(fā)上具備較為成熟的經(jīng)驗(yàn),可借鑒參考。如在Planets計(jì)劃支持下,歐盟各國(guó)開發(fā)了格式識(shí)別、數(shù)據(jù)庫(kù)存檔、硬件仿真器[25]等具備數(shù)據(jù)審查和保存管理功能的數(shù)據(jù)管理工具,對(duì)檔案數(shù)據(jù)在傳輸、運(yùn)行和存儲(chǔ)階段的質(zhì)量效果起到了較好的維護(hù)作用。再如加拿大溫哥華數(shù)字檔案館集成了檔案網(wǎng)絡(luò)存儲(chǔ)Archivematica、檔案利用AtoM、檔案數(shù)字鑒證BitCurator三類數(shù)據(jù)管理工具,且都是運(yùn)用開源技術(shù)開發(fā),可直接通過網(wǎng)絡(luò)下載,[26]我國(guó)檔案部門亦可體驗(yàn)。

        4.3 構(gòu)建檔案數(shù)據(jù)質(zhì)量評(píng)估模型與平臺(tái)

        檔案數(shù)據(jù)質(zhì)量評(píng)估的順利開展可借助評(píng)估模型和平臺(tái)優(yōu)勢(shì),設(shè)計(jì)可行的評(píng)估方法。一方面,可利用國(guó)際數(shù)據(jù)管理協(xié)會(huì)(DAMA International)提供的數(shù)據(jù)管理成熟度模型,根據(jù)模型評(píng)估優(yōu)勢(shì),結(jié)合檔案數(shù)據(jù)質(zhì)量評(píng)估指標(biāo),設(shè)計(jì)評(píng)估方案;另一方面,構(gòu)建交互平臺(tái),確保多元主體有效參與檔案數(shù)據(jù)質(zhì)量評(píng)估工作。

        (1)應(yīng)用數(shù)據(jù)管理成熟度模型。一是利用模型評(píng)價(jià)優(yōu)勢(shì),促進(jìn)檔案數(shù)據(jù)質(zhì)量評(píng)估模式化。檔案部門可根據(jù)評(píng)估工作的實(shí)際需求,單獨(dú)或混合使用該類模型,并結(jié)合其框架體系開發(fā)檔案數(shù)據(jù)質(zhì)量評(píng)估模型,形成評(píng)估工作開展的固定模式。二是利用模型優(yōu)化功能,推動(dòng)檔案數(shù)據(jù)質(zhì)量的持續(xù)提升。檔案部門可利用成熟度模型評(píng)估檔案數(shù)據(jù)管理現(xiàn)狀,分析檔案數(shù)據(jù)在不同階段應(yīng)達(dá)到何種質(zhì)量水平,從而促進(jìn)其質(zhì)量提升。如可將檔案數(shù)據(jù)評(píng)估維度包括的完整性、準(zhǔn)確性、規(guī)范性、一致性、關(guān)聯(lián)性、可控性等指標(biāo)與CMM的五個(gè)成熟度等級(jí)(初始級(jí)、重復(fù)級(jí)、已定義級(jí)、可預(yù)測(cè)級(jí)和優(yōu)化級(jí))相結(jié)合,分別描述不同等級(jí)應(yīng)達(dá)到的數(shù)據(jù)質(zhì)量水平,[27]以此作為衡量檔案數(shù)據(jù)質(zhì)量評(píng)估的標(biāo)準(zhǔn)方法。目前,國(guó)內(nèi)外已有多組數(shù)據(jù)管理成熟度模型,該類模型不僅能對(duì)數(shù)據(jù)管理現(xiàn)狀進(jìn)行評(píng)價(jià)分析,而且還可以提供改善策略,[28]檔案部門可參考利用。

        (2)開發(fā)功能完善的交互平臺(tái)。多元主體參與到檔案數(shù)據(jù)質(zhì)量評(píng)估中需要以交互平臺(tái)為渠道,讓其可以跨越時(shí)間、空間的限制,將檔案數(shù)據(jù)利用體驗(yàn)和改善意見反饋給檔案部門。構(gòu)建交互平臺(tái),一是要注重提升平臺(tái)服務(wù)的響應(yīng)性。要在平臺(tái)中設(shè)置數(shù)據(jù)請(qǐng)求功能,同時(shí)還應(yīng)實(shí)現(xiàn)及時(shí)答復(fù)各主體所給予的反饋意見的功能,并告知用戶數(shù)據(jù)質(zhì)量提升的改進(jìn)意見、優(yōu)化進(jìn)度等。二是開通平臺(tái)的眾包功能,發(fā)動(dòng)社會(huì)力量積極參與,利用群體智慧完善數(shù)據(jù)質(zhì)量提升方案。如“盛宣懷檔案抄錄項(xiàng)目”構(gòu)建了完善的數(shù)據(jù)眾包平臺(tái),平臺(tái)中設(shè)置了反饋、幫助[29]等數(shù)據(jù)請(qǐng)求功能,具備及時(shí)響應(yīng)性,為抄錄項(xiàng)目的順利開展起到了極大的幫助。

        5 結(jié) 語

        大數(shù)據(jù)時(shí)代,檔案數(shù)據(jù)在數(shù)量、來源、類型、結(jié)構(gòu)的變化發(fā)展,使之面臨的數(shù)據(jù)質(zhì)量問題日益嚴(yán)峻。檔案部門應(yīng)放眼檔案數(shù)據(jù)的整個(gè)生命周期過程,全面考慮其質(zhì)量問題,完善檔案數(shù)據(jù)管理的各類法規(guī)政策,制訂具體的管理制度,借助先進(jìn)的數(shù)據(jù)管理技術(shù),開展檔案數(shù)據(jù)質(zhì)量控制研究,有效維護(hù)檔案數(shù)據(jù)質(zhì)量水平,從而不斷滿足檔案工作需要。

        *本文系國(guó)家社科基金項(xiàng)目“國(guó)家大數(shù)據(jù)戰(zhàn)略背景下檔案數(shù)據(jù)質(zhì)量?jī)?yōu)化控制研究”(項(xiàng)目編號(hào):21BTQ016)的階段性研究成果。

        注釋與參考文獻(xiàn)

        [1]倪代川,金波.數(shù)字記憶視域下檔案數(shù)據(jù)治理探析[J].檔案管理,2021(01):41-44.

        [2][12]金波,添志鵬.檔案數(shù)據(jù)內(nèi)涵與特征探析[J].檔案學(xué)通訊,2020(03):4-11.

        [3]陳慧,羅慧玉,陳暉.檔案數(shù)據(jù)質(zhì)量要素識(shí)別及智能化保障探究——以昆柳龍直流工程項(xiàng)目檔案為例[J].檔案學(xué)通訊,2021(05):49-57.

        [4]于英香,張雅頡.“檔案參與”科學(xué)數(shù)據(jù)監(jiān)管:緣起、現(xiàn)狀與動(dòng)因[J].檔案學(xué)研究,2021(02):104-110.

        [5][28]劉越男.數(shù)據(jù)治理:大數(shù)據(jù)時(shí)代檔案管理的新視角和新職能[J].檔案學(xué)研究,2020(05):50-57.

        [6]常大偉,潘娜.檔案數(shù)據(jù)治理能力的結(jié)構(gòu)體系與建設(shè)路徑[J].浙江檔案,2020(02):27-29.

        [7]趙生輝,胡瑩.檔案數(shù)據(jù)基因系統(tǒng):概念、機(jī)理與實(shí)踐[J].檔案學(xué)研究,2021(01):40-48.

        [8]夏天,錢毅.面向知識(shí)服務(wù)的檔案數(shù)據(jù)語義化重組[J].檔案學(xué)研究,2021(02):36-44.

        [9]何思源,劉越男.科學(xué)數(shù)據(jù)和科研檔案的管理協(xié)同:框架和路徑[J].檔案學(xué)通訊,2021(01):49-57.

        [10]國(guó)家檔案局政策法規(guī)司.2020年度全國(guó)檔案主管部門和檔案館基本情況摘要(二)[EB/OL].[2021-08-06]. https://www.saac.gov.cn/daj/zhdt/202108/6262a796fdc3487d93bf a7005acfe2ae.shtml.

        [11]趙生輝,胡瑩.“檔案數(shù)據(jù)化”底層邏輯的解析與啟示[J].檔案學(xué)通訊,2021(04):20-27.

        [13]趙躍.大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)化的前景展望:意義與困境[J].檔案學(xué)研究,2019(05):52-60.

        [14]吳黎明.大連市民生檔案數(shù)據(jù)整合利用問題研究[D].大連理工大學(xué),2020.

        [15][17][19]金波,楊鵬.大數(shù)據(jù)時(shí)代檔案數(shù)據(jù)治理研究[J].檔案學(xué)研究,2020(04):29-37.

        [16]曾薩,黃新榮.我國(guó)社交媒體文件存檔元數(shù)據(jù)方案構(gòu)建[J].圖書館學(xué)研究,2020(20):58-66.

        [18]浙江省檔案館.浙江省檔案館啟動(dòng)省檔案數(shù)據(jù)中心 建設(shè)[EB/OL].[2020-04-14].http://www.zjda.gov.cn/art/ 2020/4/14/art_1229005493_42564205.html.

        [20]白文琳,安小米.政府電子文件協(xié)同管理:美國(guó)經(jīng)驗(yàn)及其啟示[J].檔案學(xué)通訊,2020(04):103-112.

        [21]NARA.Appraisal Policy of the National Archives[EB/ OL].[2021-05-08].https://www.archives.gov/records-mgmt/ scheduling/appraisal _ga=2.69520656.122467392.1620376251-856513955.1620376251.

        [22]王蘭成,劉曉亮,黃永勤.檔案社會(huì)化媒體信息整合中元數(shù)據(jù)構(gòu)建與集成技術(shù)研究[J].檔案學(xué)研究,2019(05):102-107.

        [23]Grotke A,Jones G.Digiboarda:tool to streamline complex web archiving activities at the Library of Congress[C].10th International Web Archiving Workshop(IWAW10),2010.

        [24]United States Geological Survey.Data Management[EB/ OL].[2021-05-09].https://www.usgs.gov/products/dataand-tools/data-management.

        [25]姚飛,姜愛蓉.歐盟長(zhǎng)期保存項(xiàng)目Planets的體系與特點(diǎn)[J].現(xiàn)代圖書情報(bào)技術(shù),2010(02):12-16.

        [26]范冠艷.基于實(shí)體檔案館信息化的數(shù)字檔案館建設(shè)實(shí)踐探究——對(duì)溫哥華市檔案館數(shù)字保存項(xiàng)目的實(shí)地調(diào)研[J].檔案學(xué)研究,2018(05):129-134.

        [27]吳錦池,余維杰.圖書館數(shù)據(jù)治理成熟度評(píng)價(jià)體系構(gòu)建[J].情報(bào)科學(xué),2021(01):65-71.

        [29]張軒慧,趙宇翔,宋小康.數(shù)字人文類公眾科學(xué)項(xiàng)目持續(xù)發(fā)展階段的公眾參與動(dòng)因探索——基于盛宣懷檔案抄錄案例的扎根分析[J].圖書情報(bào)知識(shí),2018(03):4+16-25+77.

        国产乡下三级全黄三级| 亚洲一区二区三区在线更新| 国产一区二区资源在线观看| 少妇被又大又粗又爽毛片久久黑人| 欧美肥胖老妇做爰videos| 91精品国产丝袜在线拍| 国产黄色一区二区福利| 亚洲综合中文字幕综合| 无码尹人久久相蕉无码| 欧美国产亚洲日韩在线二区| 亚洲愉拍自拍视频一区| 伊人久久大香线蕉av色婷婷色| 精品亚洲成a人无码成a在线观看 | 国产98色在线 | 国产| 欧美成a人片在线观看久| 国产三级精品美女三级| 男女打扑克视频在线看| 日本天堂免费观看| 人妻aⅴ无码一区二区三区| 精品无码人妻久久久一区二区三区 | 亚洲人成人影院在线观看| 天天摸天天做天天爽天天舒服| 久久久熟女一区二区三区| 免费无码av一区二区| 久久精品国产99国产精2020丨| 亚洲一区二区女优av| 蜜桃尤物在线视频免费看| 黑人巨大无码中文字幕无码| 国产va免费精品高清在线观看| 国产风骚主播视频一区二区 | 精品三级av无码一区| 国产欧美日韩午夜在线观看| 日本大片在线一区二区三区| 狠狠躁日日躁夜夜躁2022麻豆| 99精品国产高清一区二区麻豆| 久久精品国产72国产精福利| 日本不卡视频一区二区三区| 国产一区二区三区在线电影| 中文字幕在线亚洲一区二区三区| 一区二区日本影院在线观看| 日本真人添下面视频免费 |