亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        科學(xué)數(shù)據(jù)歸檔格式管理現(xiàn)狀分析與啟示

        2024-12-31 00:00:00羅瑞云單嵩巖
        北京檔案 2024年12期
        關(guān)鍵詞:科研檔案檔案管理

        摘要:檔案機(jī)構(gòu)對(duì)科學(xué)數(shù)據(jù)進(jìn)行歸檔格式管理是實(shí)現(xiàn)科學(xué)數(shù)據(jù)長(zhǎng)期保存的關(guān)鍵。本研究在廣泛應(yīng)用的《數(shù)字信息保存手冊(cè)》和《數(shù)據(jù)管護(hù)手冊(cè)》基礎(chǔ)上,總結(jié)出戰(zhàn)略規(guī)劃、長(zhǎng)期保存格式指南、技術(shù)工具、保存策略的格式管理分析框架。以此為基礎(chǔ),調(diào)研國(guó)內(nèi)外七個(gè)主要檔案管理機(jī)構(gòu)/平臺(tái)和科學(xué)數(shù)據(jù)管理機(jī)構(gòu)/平臺(tái)并進(jìn)行案例分析,對(duì)比提出我國(guó)科研檔案管理規(guī)劃未包含科學(xué)數(shù)據(jù)歸檔格式管理內(nèi)容、科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存格式標(biāo)準(zhǔn)規(guī)范有待完善、檔案領(lǐng)域科學(xué)數(shù)據(jù)格式管理工具與方法應(yīng)用不足的問(wèn)題。從科研檔案管理的角度提出我國(guó)檔案機(jī)構(gòu)應(yīng)將科學(xué)數(shù)據(jù)歸檔格式管理納入科研檔案管理規(guī)劃、制定科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存格式指南以及加強(qiáng)格式管理技術(shù)工具應(yīng)用的啟示。

        關(guān)鍵詞:科學(xué)數(shù)據(jù) 格式管理 科研檔案 歸檔長(zhǎng)期保存 檔案管理

        Abstract:Format management of scientific data by archival institutions is the key to achiev? ing long- term preservation of scientific data. Based on the widely used Digital Preservation Handbook and Digital Curation Manual, this study summarizes the format analysis frame? work of strategic planning, long-term preserva? tion format guidelines, technical tools, and pres? ervation strategies; based on the framework, sev? en major archive management organizations/plat? forms and scientific data management organiza? tions/platforms at home and abroad were re? searched and case studies were conducted to compare and propose the problems that China’s scientific research archive management planning does not include scientific data format manage? ment content, the standard specification of scien? tific data archiving and long- term preservation format needs to be improved, and the application of scientific data format management tools and methods in the field of archives is insufficient. From the perspective of scientific research ar? chives management, it is proposed that archival institutions in China should incorporate scientific data format management into scientific research archives management planning, formulate for? mat guidelines for archiving and long-term pres? ervation of scientific data, and strengthen the ap? plication of format management technology tools.

        Keywords: Scientific data; Format manage? ment; Scientific research archives; Archiving; Long-term preservation; Archives management

        科學(xué)數(shù)據(jù)是國(guó)家科技創(chuàng)新和經(jīng)濟(jì)社會(huì)發(fā)展的重要基礎(chǔ)性戰(zhàn)略資源,格式管理是確??茖W(xué)數(shù)據(jù)長(zhǎng)期保存和可訪問(wèn)的關(guān)鍵。隨著科研范式朝數(shù)據(jù)密集型轉(zhuǎn)變、信息技術(shù)的快速發(fā)展,科學(xué)數(shù)據(jù)格式正面臨過(guò)時(shí)和激增等方面的挑戰(zhàn),缺乏科學(xué)合理的數(shù)據(jù)格式管理方法將很有可能導(dǎo)致數(shù)據(jù)無(wú)法讀取。作為信息管理和長(zhǎng)期保存的專業(yè)領(lǐng)域,檔案學(xué)應(yīng)積極探索科學(xué)數(shù)據(jù)歸檔格式管理方法,保障科學(xué)數(shù)據(jù)的長(zhǎng)期可用。

        當(dāng)前,國(guó)內(nèi)外學(xué)術(shù)界對(duì)于科學(xué)數(shù)據(jù)格式管理方法的研究主要集中在以下三個(gè)方面:一是科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存推薦格式研究。高婷[1]總結(jié)了主流電子文件類型及其對(duì)應(yīng)歸檔格式,耿志杰[2]等通過(guò)調(diào)研荷蘭數(shù)據(jù)歸檔和網(wǎng)絡(luò)服務(wù)中心(Data Archiving and Networked Services,DANS)長(zhǎng)期保存實(shí)踐,介紹了18種數(shù)據(jù)類型的首選格式和可接受格式,J. Georgieva[3]指出基于XML的格式更適合支持元數(shù)據(jù),有助于實(shí)現(xiàn)各種數(shù)據(jù)格式管理目標(biāo);同時(shí),還有針對(duì)單獨(dú)數(shù)據(jù)類型的推薦格式研究,如版式文檔OFD格式[4]、圖像文件JPEG格式[5]、三維數(shù)據(jù)STED格式[6]及數(shù)據(jù)庫(kù)SIAED格式[7]等。二是科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存格式選擇標(biāo)準(zhǔn)研究。黃玉明[8]提出了符合歸檔和長(zhǎng)期保存要求的格式選擇原則,包括格式開(kāi)放、不綁定軟硬件、自描述等;肖秋會(huì)等[9]從電子文件類型、長(zhǎng)期保存格式及國(guó)際采標(biāo)等方面提出我國(guó)電子文件長(zhǎng)期保存格式標(biāo)準(zhǔn)的建設(shè)思路;徐擁軍等[10]從構(gòu)建專門的格式標(biāo)準(zhǔn)、強(qiáng)化標(biāo)準(zhǔn)間系統(tǒng)銜接、分析格式標(biāo)準(zhǔn)適用環(huán)境等方面提出我國(guó)電子文件長(zhǎng)期保存標(biāo)準(zhǔn)優(yōu)化策略。三是科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存格式管理工具應(yīng)用研究。錢毅[11]提出建立格式登記系統(tǒng),應(yīng)包括自動(dòng)識(shí)別格式、格式驗(yàn)證、格式元數(shù)據(jù)抽取、提供技術(shù)監(jiān)測(cè)、提供遷移路徑、風(fēng)險(xiǎn)評(píng)估及信息推送功能;周祺等[12]探討了我國(guó)檔案文件格式登記與管控系統(tǒng)的實(shí)施主體、適用范圍、運(yùn)行前置條件等;J. Xie等[13]指出格式遷移包括格式驗(yàn)證和對(duì)象轉(zhuǎn)換,介紹了元數(shù)據(jù)保存的系統(tǒng)架構(gòu),并分析了對(duì)象變換的映射規(guī)律。

        本研究以數(shù)字信息保存聯(lián)盟發(fā)布的《數(shù)字信息保存手冊(cè)》(Digital Preservation Handbook)[14]和英國(guó)數(shù)字管護(hù)中心發(fā)布的《數(shù)字管護(hù)手冊(cè)》(Digital Curation Manual)[15]為基礎(chǔ),總結(jié)科學(xué)數(shù)據(jù)格式管理分析框架,選取國(guó)內(nèi)外科學(xué)數(shù)據(jù)格式管理實(shí)踐典型案例開(kāi)展調(diào)研,梳理國(guó)內(nèi)外科學(xué)數(shù)據(jù)格式管理工作現(xiàn)狀與特點(diǎn),歸納科研檔案中科學(xué)數(shù)據(jù)歸檔格式管理的主要方法,并結(jié)合我國(guó)實(shí)際情況,提出對(duì)我國(guó)科學(xué)數(shù)據(jù)歸檔格式管理的啟示,以期為我國(guó)檔案界進(jìn)行科學(xué)數(shù)據(jù)歸檔格式管理提供經(jīng)驗(yàn)與參考。

        一、科學(xué)數(shù)據(jù)格式管理分析框架與案例調(diào)研對(duì)象

        如表1所示,本研究結(jié)合《數(shù)字信息保存手冊(cè)》和《數(shù)字管護(hù)手冊(cè)》中關(guān)于文件格式管理部分內(nèi)容,總結(jié)歸納出戰(zhàn)略規(guī)劃、長(zhǎng)期保存格式指南、技術(shù)工具和保存策略四方面的科學(xué)數(shù)據(jù)格式管理分析框架,并以此為基礎(chǔ)選取美國(guó)、英國(guó)、澳大利亞、新西蘭、荷蘭、瑞典、中國(guó)的檔案機(jī)構(gòu)/平臺(tái)、科學(xué)數(shù)據(jù)管理機(jī)構(gòu)/平臺(tái),進(jìn)行格式管理方法相關(guān)政策、工具與實(shí)踐進(jìn)展調(diào)研,如表2所示。

        二、科學(xué)數(shù)據(jù)格式管理方法現(xiàn)狀分析

        科學(xué)數(shù)據(jù)來(lái)源于科學(xué)研究活動(dòng),是科研檔案的重要組成部分,其歸檔和長(zhǎng)期保存工作涉及檔案管理機(jī)構(gòu)和科學(xué)數(shù)據(jù)管理機(jī)構(gòu)的協(xié)同,因而本研究主要對(duì)檔案管理機(jī)構(gòu)、科學(xué)數(shù)據(jù)管理機(jī)構(gòu)的格式管理方法進(jìn)行調(diào)研與分析。

        (一)頂層規(guī)劃

        頂層規(guī)劃有效指導(dǎo)了格式管理工作的開(kāi)展。圍繞數(shù)字資源長(zhǎng)期保存,各國(guó)檔案管理機(jī)構(gòu)、科學(xué)數(shù)據(jù)管理機(jī)構(gòu)出臺(tái)了數(shù)字保存戰(zhàn)略、規(guī)劃、政策等,并將“格式管理”作為其重要維度之一。一是指出格式管理面臨的主要問(wèn)題。例如,澳大利亞國(guó)家檔案館(National Archives of Australia,NAA)發(fā)布的《數(shù)字保存規(guī)劃》認(rèn)為數(shù)字記錄有三種過(guò)時(shí)形式,即文件格式過(guò)時(shí)、軟件過(guò)時(shí)和硬件過(guò)時(shí),[16]識(shí)別過(guò)時(shí)形式是有效管理的前提,針對(duì)不同形式的過(guò)時(shí)問(wèn)題應(yīng)采用不同的管理方法;瑞典國(guó)家數(shù)據(jù)服務(wù)中心(Swedish National Data Ser? vice,SNDA)的《數(shù)據(jù)管理計(jì)劃清單》指出專有文件格式是限制數(shù)字記錄長(zhǎng)期訪問(wèn)的主要威脅。[17]二是設(shè)計(jì)格式管理的具體行動(dòng)路徑。例如,美國(guó)國(guó)家檔案與文件署(National Archives and Records Administra? tion,NARA)2022年發(fā)布的《數(shù)字保存戰(zhàn)略2022—2026》設(shè)計(jì)了格式管理的關(guān)鍵措施,包括制定并持續(xù)更新保護(hù)計(jì)劃以精確識(shí)別館藏文件中各種格式、對(duì)存在風(fēng)險(xiǎn)的文件進(jìn)行必要的格式轉(zhuǎn)換,以及持續(xù)監(jiān)測(cè)和評(píng)估接收的文件和媒體格式,以便及時(shí)發(fā)現(xiàn)并應(yīng)對(duì)潛在的過(guò)時(shí)風(fēng)險(xiǎn);[18]新西蘭檔案館(Archives New Zea? land,ANZ)發(fā)布的《數(shù)字保存》[19]和《數(shù)字保存聲明》[20]認(rèn)為必須對(duì)信息、記錄及文件格式相關(guān)風(fēng)險(xiǎn)進(jìn)行詳盡的評(píng)估,并采取相應(yīng)的保存措施,如格式遷移。

        (二)格式指南

        格式指南規(guī)范著格式選擇標(biāo)準(zhǔn)與要求??茖W(xué)數(shù)據(jù)格式種類多樣,版本迭代迅速,并不是所有格式都符合歸檔和長(zhǎng)期保存需求,因而需要明確科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存格式的選擇原則,當(dāng)前已有一些檔案管理機(jī)構(gòu)、科學(xué)數(shù)據(jù)管理機(jī)構(gòu)發(fā)布了格式指南規(guī)范科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存格式。

        格式指南基本采用定量評(píng)估、定性評(píng)估或定量與定性相結(jié)合的科學(xué)方法推薦科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存格式。定性評(píng)估是指從格式特征、實(shí)踐現(xiàn)狀及國(guó)際標(biāo)準(zhǔn)中提取可持續(xù)性因素指標(biāo),來(lái)綜合評(píng)估對(duì)象格式的可持續(xù)性。例如,美國(guó)國(guó)會(huì)圖書館(Li? brary of Congress,LC)發(fā)布的《數(shù)字格式:可持續(xù)性、性能和質(zhì)量因素》,[21]詳細(xì)分析了影響數(shù)字格式可持續(xù)性的基本因素和特殊因素。定性與定量相結(jié)合評(píng)估是指既提出指標(biāo),還對(duì)指標(biāo)分配不同的權(quán)重,以可量化的矩陣框架評(píng)估可持續(xù)性因素和長(zhǎng)期保存問(wèn)題。以美國(guó)國(guó)家檔案與文件署2018年8月更新的《永久保存電子文件移交的格式指南》為例,首先調(diào)查館藏文件格式現(xiàn)狀,以全面了解文件格式風(fēng)險(xiǎn);然后創(chuàng)建風(fēng)險(xiǎn)和優(yōu)先級(jí)矩陣,設(shè)置評(píng)估項(xiàng)和權(quán)重,分為公開(kāi)程度、流行性、透明度、自描述、外部依賴性、許可和專利、使用加密/權(quán)限管理七大類別,具體包括37個(gè)評(píng)估項(xiàng),且各類和各項(xiàng)的權(quán)重不同;最后基于以上評(píng)估在格式指南中將格式分為“推薦格式”“可接受格式”等。[22]

        各機(jī)構(gòu)的格式指南詳細(xì)分析如表3所示,這些格式指南在格式選擇原則的制定上基本達(dá)成共識(shí)。一是普遍性強(qiáng),即該格式被大量用戶和多種軟件系統(tǒng)所支持,更有可能得到持續(xù)的開(kāi)發(fā)和不斷的優(yōu)化,并促進(jìn)最佳實(shí)踐的分享。二是獨(dú)立性強(qiáng),強(qiáng)調(diào)格式不應(yīng)被任何特定的軟硬件、開(kāi)發(fā)人員或供應(yīng)商所綁定,降低了因軟硬件過(guò)時(shí)、停止維護(hù)而導(dǎo)致的格式風(fēng)險(xiǎn)。三是有開(kāi)放的規(guī)范或標(biāo)準(zhǔn),這意味著格式的技術(shù)細(xì)節(jié)和實(shí)現(xiàn)方式應(yīng)公開(kāi)透明,不受版權(quán)或?qū)S屑夹g(shù)限制,有效促進(jìn)了格式的互操作性,有助于不同軟件之間的數(shù)據(jù)寫入和讀取,還有利于數(shù)據(jù)的共享和遷移。

        此外,格式指南還從格式版本、參考標(biāo)準(zhǔn)、格式說(shuō)明等方面對(duì)各類型格式進(jìn)行了深入分析。同時(shí),格式指南還保持定期更新,確保歸檔和長(zhǎng)期保存的數(shù)據(jù)格式始終符合當(dāng)前的最佳實(shí)踐和技術(shù)標(biāo)準(zhǔn),反映了格式管理的動(dòng)態(tài)性和持續(xù)性。

        (三)格式管理工具

        多功能格式管理工具與集成性管理系統(tǒng)共同構(gòu)成了格式管理的重要手段。格式管理工具根據(jù)功能可被分為四大類別:格式識(shí)別(Format Identifica? tion)、格式驗(yàn)證(Format Validation)、格式表征(For? mat Characterization)及格式評(píng)估(Format Assess? ment)。[23]

        第一,格式識(shí)別作為整個(gè)管理流程的起點(diǎn),依賴文件擴(kuò)展名、內(nèi)部代碼等特征來(lái)實(shí)現(xiàn)識(shí)別。常見(jiàn)的格式識(shí)別工具如DROID,作為英國(guó)國(guó)家檔案館在PRONOM技術(shù)注冊(cè)服務(wù)框架下開(kāi)發(fā)的首款工具,利用PRONOM存儲(chǔ)的簽名信息實(shí)現(xiàn)格式的自動(dòng)批量識(shí)別。[24]第二,格式驗(yàn)證通過(guò)解析比特流的完整內(nèi)容,驗(yàn)證文件是否符合既定的格式規(guī)范。已有通用格式驗(yàn)證工具如Checksum Checker、Apache POI等。第三,格式表征是了解格式顯著特征,包括提取和記錄與格式相關(guān)的元數(shù)據(jù)。常見(jiàn)的格式表征工具有如JHOVE2,支持多種數(shù)字格式的驗(yàn)證和特征提取,如圖像、音頻、視頻和文本文件等,詳細(xì)記錄元數(shù)據(jù)、結(jié)構(gòu)和格式特征等信息。[25]第四,格式評(píng)估是對(duì)文件格式長(zhǎng)期可用性或過(guò)時(shí)、信息丟失風(fēng)險(xiǎn)的綜合評(píng)估。已有相關(guān)研究基于格式風(fēng)險(xiǎn)的定量評(píng)估模型設(shè)計(jì)了格式過(guò)時(shí)風(fēng)險(xiǎn)評(píng)估系統(tǒng),將專家不可量化的知識(shí)或經(jīng)驗(yàn)轉(zhuǎn)換為機(jī)器可識(shí)別和可處理的形式,即“風(fēng)險(xiǎn)評(píng)分”,其結(jié)果可以被計(jì)算機(jī)自動(dòng)識(shí)別,有助于數(shù)字保存的自動(dòng)、半自動(dòng)風(fēng)險(xiǎn)管理。[26]

        國(guó)外檔案機(jī)構(gòu)使用集成性的格式管理系統(tǒng)進(jìn)行實(shí)踐,英國(guó)國(guó)家檔案館的PRONOM提供了一系列支持?jǐn)?shù)字保存的工具和服務(wù),如對(duì)象識(shí)別與驗(yàn)證、元數(shù)據(jù)提取、風(fēng)險(xiǎn)評(píng)估和遷移路徑規(guī)劃;[27]新西蘭國(guó)家檔案館則選用了Ex Libris公司的Rosetta系統(tǒng),該系統(tǒng)遵循開(kāi)放檔案信息系統(tǒng)(Open Archival Information Sys? tem,OAIS)、保存元數(shù)據(jù)實(shí)施策略(Preservation Metadata Implementation Strategies,PREMIS)和元數(shù)據(jù)編碼和傳輸標(biāo)準(zhǔn)(Metadata Encoding and Transmission Standard,METS)等國(guó)際長(zhǎng)期保存標(biāo)準(zhǔn),格式管理流程全面覆蓋識(shí)別、驗(yàn)證、元數(shù)據(jù)提取及格式遷移等環(huán)節(jié),并允許用戶根據(jù)自身需求定制化格式管理功能,具有極大的靈活性和可配置性。[28]

        (四)長(zhǎng)期保存技術(shù)策略

        國(guó)外檔案機(jī)構(gòu)/平臺(tái)、科學(xué)數(shù)據(jù)機(jī)構(gòu)/平臺(tái)在科學(xué)數(shù)據(jù)格式管理實(shí)踐中形成了以格式遷移為主的科學(xué)數(shù)據(jù)長(zhǎng)期保存操作規(guī)范。格式遷移是指對(duì)構(gòu)成數(shù)據(jù)的比特流進(jìn)行改變,[29]是數(shù)據(jù)長(zhǎng)期保存的常用方法,用于將原始數(shù)據(jù)格式轉(zhuǎn)換為符合長(zhǎng)期保存要求的格式。然而,任何數(shù)字干預(yù)都面臨著一定的風(fēng)險(xiǎn),它可能導(dǎo)致數(shù)據(jù)內(nèi)容或結(jié)構(gòu)的更改、基本信息的丟失或新錯(cuò)誤的產(chǎn)生。鑒于這些潛在的問(wèn)題,審慎的遷移過(guò)程至關(guān)重要。新西蘭檔案館在進(jìn)行格式遷移時(shí),會(huì)仔細(xì)考慮其對(duì)數(shù)據(jù)可訪問(wèn)性、內(nèi)容完整性、格式有效性及文檔記錄的影響,以確保不會(huì)損害數(shù)據(jù)的原始價(jià)值和未來(lái)的可利用性。[30]英國(guó)國(guó)家檔案館則發(fā)布了專門的格式遷移指南,[31]并附有“格式遷移檢查表”,如表4所示,以指導(dǎo)檔案信息管理人員和IT專業(yè)人員完成格式遷移。指南詳細(xì)說(shuō)明了為什么、何時(shí)以及如何進(jìn)行格式遷移。荷蘭數(shù)據(jù)歸檔和網(wǎng)絡(luò)服務(wù)中心也以格式遷移作為主要的保存策略,在科學(xué)數(shù)據(jù)集入庫(kù)后對(duì)文件原始格式的可讀性和可持續(xù)性進(jìn)行全周期評(píng)估,將穩(wěn)定性不佳或過(guò)時(shí)的格式轉(zhuǎn)換為更具持久性的首選格式。[32]

        此外,保留原始格式和操作記錄是格式遷移后的重要步驟。荷蘭數(shù)據(jù)歸檔和網(wǎng)絡(luò)服務(wù)中心、新西蘭國(guó)家檔案館、美國(guó)國(guó)家檔案與文件署等機(jī)構(gòu)都規(guī)定,在格式遷移后繼續(xù)保留文件的原始格式,并在元數(shù)據(jù)中保留所有格式遷移的操作記錄,以確保數(shù)據(jù)的完整性和可追溯性。

        三、我國(guó)科學(xué)數(shù)據(jù)歸檔格式管理問(wèn)題分析

        在我國(guó),科學(xué)數(shù)據(jù)已被納入科研檔案歸檔范圍,科學(xué)數(shù)據(jù)歸檔成為科研檔案管理的重要組成部分。2020年出臺(tái)的《科學(xué)技術(shù)研究檔案管理規(guī)定》[33]指出科學(xué)數(shù)據(jù)是研究實(shí)施及過(guò)程管理階段形成的重要文件材料;《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》[34]也提出要“大力推動(dòng)科學(xué)數(shù)據(jù)與科研檔案協(xié)同管理”。然而,對(duì)標(biāo)國(guó)際實(shí)踐經(jīng)驗(yàn),我國(guó)的科學(xué)數(shù)據(jù)歸檔格式管理還面臨一些亟待破解的重點(diǎn)問(wèn)題。

        (一)科研檔案管理規(guī)劃未包含科學(xué)數(shù)據(jù)歸檔格式管理內(nèi)容

        科學(xué)數(shù)據(jù)從創(chuàng)建、處理、利用,到作為科研檔案歸檔和長(zhǎng)期保存的不同時(shí)期會(huì)在格式、使用、目的和價(jià)值上出現(xiàn)多種變化。而科研項(xiàng)目研發(fā)周期較長(zhǎng),項(xiàng)目結(jié)束后,數(shù)據(jù)的歸檔備份和長(zhǎng)期服務(wù)難以執(zhí)行。[35]根據(jù)中國(guó)科學(xué)院檔案館于2021年對(duì)院內(nèi)重大科技項(xiàng)目科學(xué)數(shù)據(jù)管理情況進(jìn)行的問(wèn)卷調(diào)查結(jié)果,約88%的被調(diào)研項(xiàng)目產(chǎn)生的科學(xué)數(shù)據(jù)格式多樣,且暫無(wú)格式統(tǒng)一的考慮或要求。[36]鑒于此,應(yīng)在科研項(xiàng)目成立之初就制定科學(xué)數(shù)據(jù)歸檔的格式管理計(jì)劃并將其納入整個(gè)數(shù)據(jù)生命周期之中。目前,各行各業(yè)對(duì)于科研檔案中的科學(xué)數(shù)據(jù)歸檔格式管理探索均處于起步階段。政府相關(guān)部門亟須發(fā)揮主導(dǎo)作用,協(xié)同檔案部門、科學(xué)數(shù)據(jù)部門及大數(shù)據(jù)部門,共同制定針對(duì)科學(xué)數(shù)據(jù)歸檔格式管理的政策、規(guī)劃或具體措施,進(jìn)一步明確相關(guān)主體職責(zé)、工作流程等,以有效推動(dòng)科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存工作進(jìn)展。

        (二)科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存格式標(biāo)準(zhǔn)規(guī)范有待完善

        科學(xué)數(shù)據(jù)格式更新迭代迅速的背景下,相關(guān)標(biāo)準(zhǔn)規(guī)范成為科學(xué)數(shù)據(jù)在歸檔和長(zhǎng)期保存時(shí)格式選取的首要依據(jù)。當(dāng)前,我國(guó)就歸檔和長(zhǎng)期保存格式方面表達(dá)較為完整的國(guó)家標(biāo)準(zhǔn)是《電子文件歸檔與電子檔案管理規(guī)范》(GB/T 18894—2016),雖然該標(biāo)準(zhǔn)提出了電子文件歸檔格式應(yīng)具備開(kāi)放性、軟硬件無(wú)關(guān)性、顯示一致性、可轉(zhuǎn)換性和易用性的要求,并規(guī)定了電子文件應(yīng)以通用格式形成、收集并歸檔,或在歸檔前轉(zhuǎn)換為通用格式,[37]但未進(jìn)一步指出滿足歸檔要求的具體格式有哪些及未規(guī)定何為通用格式,導(dǎo)致可操作性較弱,難以落實(shí)。此外,盡管我國(guó)檔案領(lǐng)域已有關(guān)于電子文件、電子檔案格式管理的相關(guān)標(biāo)準(zhǔn),但尚未有針對(duì)科學(xué)數(shù)據(jù)這一特殊對(duì)象的格式管理標(biāo)準(zhǔn)規(guī)范出臺(tái)。該方面的標(biāo)準(zhǔn)規(guī)范還需要結(jié)合不同學(xué)科、不同領(lǐng)域的科學(xué)數(shù)據(jù)特征進(jìn)行個(gè)性化深入研究。

        (三)檔案領(lǐng)域科學(xué)數(shù)據(jù)歸檔格式管理工具與方法應(yīng)用不足

        科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存格式管理離不開(kāi)有效的方法和工具,當(dāng)前我國(guó)科研檔案管理實(shí)踐中尚未應(yīng)用系統(tǒng)的格式管理方法和通用的格式管理工具。以中國(guó)科學(xué)院數(shù)字檔案移交接收系統(tǒng)為例,主要通過(guò)格式著錄和四性檢測(cè)管理科學(xué)數(shù)據(jù)格式,格式的相關(guān)著錄項(xiàng)包括“格式名稱”“格式版本”“格式描述”“計(jì)算機(jī)文件大小”“容量”,但在實(shí)際著錄過(guò)程中存在字段空缺情況;四性檢測(cè)中涉及格式問(wèn)題的執(zhí)行情況也缺乏具體指導(dǎo)。此外,更缺少關(guān)于格式遷移、格式監(jiān)測(cè)等工具、系統(tǒng)的統(tǒng)一配置。

        四、對(duì)我國(guó)科學(xué)數(shù)據(jù)歸檔格式管理的啟示

        基于對(duì)檔案機(jī)構(gòu)與科學(xué)數(shù)據(jù)管理機(jī)構(gòu)的科學(xué)數(shù)據(jù)格式管理調(diào)研結(jié)果,針對(duì)當(dāng)前國(guó)內(nèi)在科學(xué)數(shù)據(jù)歸檔格式管理上面臨的問(wèn)題,我國(guó)應(yīng)當(dāng)積極借鑒國(guó)外的先進(jìn)經(jīng)驗(yàn),在規(guī)劃設(shè)計(jì)、指南制定及工具應(yīng)用等方面加大投入力度,形成符合國(guó)情的科學(xué)數(shù)據(jù)歸檔與長(zhǎng)期保存格式管理方法,從而提升我國(guó)科學(xué)數(shù)據(jù)的歸檔與長(zhǎng)期保存能力。

        (一)將科學(xué)數(shù)據(jù)歸檔格式管理納入科研檔案管理規(guī)劃

        科學(xué)數(shù)據(jù)長(zhǎng)期保存是一項(xiàng)系統(tǒng)工程,需要建立覆蓋科學(xué)數(shù)據(jù)生命周期的格式管理計(jì)劃,明確不同階段的管理目標(biāo)和內(nèi)容。在科研檔案中,尤其關(guān)注歸檔和長(zhǎng)期保存階段的格式管理目標(biāo)和內(nèi)容,既需要制度、標(biāo)準(zhǔn)、指南等管理層面的支持,還需要格式識(shí)別、驗(yàn)證、表征、評(píng)估和遷移等技術(shù)手段的支撐。

        我國(guó)檔案機(jī)構(gòu)應(yīng)加強(qiáng)與科學(xué)數(shù)據(jù)中心等科學(xué)數(shù)據(jù)管理部門的合作,充分融合科學(xué)數(shù)據(jù)中心的技術(shù)優(yōu)勢(shì)和檔案機(jī)構(gòu)在歸檔、長(zhǎng)期保存方面的建制化優(yōu)勢(shì),共同就制定格式指南、開(kāi)發(fā)應(yīng)用格式管理工具、實(shí)施格式遷移策略等在內(nèi)的格式管理方法加強(qiáng)統(tǒng)一制度建設(shè)和應(yīng)用實(shí)踐。以美國(guó)國(guó)會(huì)圖書館為例,它將保障數(shù)字格式的可持續(xù)性作為其數(shù)字保存戰(zhàn)略規(guī)劃目標(biāo)的關(guān)鍵部分,包括制定數(shù)字內(nèi)容格式的戰(zhàn)略規(guī)劃,提供當(dāng)前與新興格式的信息清單及所需工具和詳細(xì)文檔,識(shí)別并描述具有長(zhǎng)期可持續(xù)發(fā)展?jié)摿Φ母袷剑R(shí)別存在風(fēng)險(xiǎn)的格式并制定策略以維護(hù)其內(nèi)容的完整性,[38]為科學(xué)數(shù)據(jù)格式管理提供了管理層面的支持與技術(shù)手段的支撐。

        (二)制定科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存格式指南

        檔案機(jī)構(gòu)應(yīng)在遵循現(xiàn)有標(biāo)準(zhǔn)規(guī)范的基礎(chǔ)上,針對(duì)歸檔科學(xué)數(shù)據(jù)格式特征制定更加科學(xué)的歸檔和長(zhǎng)期保存格式推薦指南,可以從以下三方面進(jìn)行。一是明確和細(xì)化科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存格式的選擇原則,增強(qiáng)對(duì)業(yè)務(wù)部門、管理部門在實(shí)踐中的指導(dǎo)作用。二是建立全面的科學(xué)數(shù)據(jù)格式體系,劃分常規(guī)通用格式、學(xué)科通用格式和專有格式。[39]當(dāng)前科學(xué)數(shù)據(jù)種類豐富多樣,應(yīng)從數(shù)據(jù)類型、學(xué)科領(lǐng)域等維度對(duì)歸檔科學(xué)數(shù)據(jù)格式進(jìn)行充分的調(diào)研分析。如生物學(xué)領(lǐng)域常見(jiàn)的科學(xué)數(shù)據(jù)格式有FASTA(Fast All Sequences in A)、FASTQ(Fast Quality Score)、SAM(Se? quence Alignment/Map)和BAM(Binary Align? ment/Map),地球科學(xué)領(lǐng)域常見(jiàn)的科學(xué)數(shù)據(jù)格式有SHP(Shapefile)、NetCDF(Network Common Data Form)、GeoTIFF(Georeferenced Tagged Image File Format)。三是分級(jí)別推薦格式,如首選格式、可接受格式和不接受格式,為后續(xù)格式分類管理工作提供基礎(chǔ)。

        (三)加強(qiáng)科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存格式管理技術(shù)工具的應(yīng)用

        面對(duì)大量的科學(xué)數(shù)據(jù)格式,合理利用科學(xué)的技術(shù)和工具是檔案機(jī)構(gòu)開(kāi)展科學(xué)數(shù)據(jù)歸檔格式管理的高效手段。一是關(guān)注科學(xué)數(shù)據(jù)格式的創(chuàng)新與發(fā)展,開(kāi)發(fā)符合歸檔和長(zhǎng)期保存需求的科學(xué)數(shù)據(jù)格式,提升格式自身的長(zhǎng)期可持續(xù)性。例如,圍繞電子文件長(zhǎng)期保存需求,我國(guó)自主研發(fā)了OFD系列格式,具有完全自主知識(shí)產(chǎn)權(quán)、技術(shù)門檻較低、便于網(wǎng)絡(luò)傳輸、可定制等優(yōu)勢(shì),是基本符合國(guó)際電子文檔長(zhǎng)期保存相關(guān)原則和要求的保存格式。[40]二是引進(jìn)國(guó)外成熟的科學(xué)數(shù)據(jù)格式管理工具。目前國(guó)外數(shù)字保存領(lǐng)域常用的工具包括DROID、JHOVE2、DRAMBORA等,通過(guò)引進(jìn)國(guó)外先進(jìn)工具可以降低自身的研發(fā)成本。三是注重研發(fā)符合我國(guó)特色的科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存格式管理工具,以增強(qiáng)技術(shù)自主性和安全性,防止數(shù)據(jù)泄露和篡改。此外,檔案機(jī)構(gòu)在搭建數(shù)字檔案館(室)平臺(tái)時(shí),應(yīng)將格式管理工具嵌入其中,使之與檔案管理流程深度契合,提高格式管理信息化和自動(dòng)化水平。

        五、結(jié)語(yǔ)

        科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存格式管理是檔案機(jī)構(gòu)保障科學(xué)數(shù)據(jù)長(zhǎng)期可訪問(wèn)的重要手段。國(guó)際上已經(jīng)形成了相對(duì)成熟的科學(xué)數(shù)據(jù)格式管理方法,包括格式管理要求、推薦指南、技術(shù)工具等,在此基礎(chǔ)上本研究提出我國(guó)檔案機(jī)構(gòu)應(yīng)將科學(xué)數(shù)據(jù)歸檔格式管理納入科研檔案管理規(guī)劃、制定科學(xué)數(shù)據(jù)歸檔和長(zhǎng)期保存格式指南及加強(qiáng)格式管理技術(shù)工具的應(yīng)用的建議,有助于為檔案機(jī)構(gòu)開(kāi)展科學(xué)數(shù)據(jù)歸檔格式管理提供參考借鑒。科學(xué)數(shù)據(jù)格式學(xué)科領(lǐng)域性強(qiáng)、版本更新迭代迅速,未來(lái)可以結(jié)合具體的學(xué)科領(lǐng)域、格式類型進(jìn)一步完善科學(xué)數(shù)據(jù)格式管理方法的適用性。

        注釋及參考文獻(xiàn):

        [1]高婷.電子文件長(zhǎng)期保存格式標(biāo)準(zhǔn)研究[D].武漢:武漢大學(xué),2018:42-46.

        [2][32]耿志杰,陳佳慧.荷蘭數(shù)據(jù)歸檔和網(wǎng)絡(luò)服務(wù)中心的科學(xué)數(shù)據(jù)長(zhǎng)期保存機(jī)制[J].圖書館論壇,2021,41(11):128-135.

        [3]JULIANA G,VESKA G,MARIANA G.Scien? tific data formats:Proceedings of the 9th WSEAS inter? national conference on applied informatics and commu? nication [C].Wisconsin:World Scientific and Engineer? ing Academy and Society,2009:19-24.

        [4]張?bào)?版式文檔OFD格式及其在文檔管理中的應(yīng)用研究[D].沈陽(yáng):遼寧大學(xué),2021:20.

        [5]夏偉偉,張照余.圖像電子文件的歸檔格式及其轉(zhuǎn)換研究[J].檔案管理,2017(1):50-51;26.

        [6]陶水龍.三維數(shù)據(jù)歸檔策略研究[J].檔案學(xué)研究,2018(6):101-104.

        [7]朱志赟.STEP作為存檔格式保存三維模型信息能力評(píng)估[J].蘭臺(tái)世界,2019(10):106-109.

        [8]黃玉明.電子文件存檔格式需求分析與戰(zhàn)略研究[J].檔案學(xué)通訊,2010(2):63-66.

        [9]肖秋會(huì),高婷.電子文件長(zhǎng)期保存格式標(biāo)準(zhǔn)研究[J].信息資源管理學(xué)報(bào),2017,7(2):81-86.

        [10]徐擁軍,龍家慶.我國(guó)電子文件長(zhǎng)期保存格式標(biāo)準(zhǔn)優(yōu)化策略研究:兼與英、美、加、澳的比較分析[J].電子政務(wù),2020(8):113-124.

        [11]錢毅.基于長(zhǎng)期保存視角的電子檔案格式管理研究[J].檔案學(xué)通訊,2016(6):52-57.

        [12]周祺,張照余.電子檔案文件格式登記與管控系統(tǒng)構(gòu)建[J].檔案與建設(shè),2023(2):58-61.

        [13]XIE J,ZHANG M,MA Y Q.Using format mi? gration and preservation metadata to support digital pres? ervation of scientific data:2019 IEEE 10th international conference on software engineering and service science(ICSESS)[C].Beijing: the Institute of Electrical and Elec? tronics Engineers,2019:1-6.

        [14]Digital Preservation Coalition. Digital preser? vation Handbook [EB/OL]. [2024-05-16]. https : // www.dpconline.org/handbook.

        [15][23]Digital Curation Centre. Digital curation manual Instalment on“file formats”[EB/OL].(2007-10-29)[2024-05-16].https://www.dcc.ac.uk/resources/curation-reference-man? ual/completed-chapters/file-formats.

        [16]NationalArchivesofAustralia.Digitalpreserva? tionplaning[EB/OL].[2024-05-16].https://www.naa. gov.au/information-management/information-man? agement-legislation/digital-preservation-planning.

        [17]Swedish National Data Service. Checklist for data management plan[EB/OL].(2024-03-19)[2024-05- 16].https://snd.se/en/manage- data/guides/dmpchecklist.

        [18]National Archives and Records Administra? tion. Digital preservation strategy 2022-2026[EB/OL].(2022- 06- 27) [2024- 05- 16].https://www.archives. gov/preservation/digital-preservation/strategy.

        [19]Archives New Zealand .Digital preservation[EB/OL].(2024-01-16)[2024-05-16].https://www. archives.govt.nz/about- us/our- work/preservation/ digital-preservation.

        [20]Archives New Zealand. Digital preservation statement[EB/OL].(2023-12-12)[2024-05-16].https://www.archives.govt.nz/about- us/our- work/preser? vation/digital-preservation/digital-preservation-state? ment#0-1--introduction-.

        [21][38]Library of Congress. Sustainability of digi? tal formats: planning for library of congress collections[EB/OL].(2023-06-28)[2024-05-16]. https://www. loc.gov/preservation/digital/formats/index.html.

        [22]JOHNSTON L.Creating a holdings format profile and formatriskanddigitalPreservationprioritizationmatrixatthenation? al archives and records administration[EB/OL].[2024- 05- 16]. https://www.researchgate.net/publication/328074564_Creat? ing_a_Holdings_Format_Profile_and_Format_Risk_and_Digi? tal_Preservation_Prioritization_Matrix_at_the_National_Ar? chives_and_Records_Administration.

        [24]SOURCEFORGE DROID[EB/OL].(2014-04-16)[2024-05-16].https://sourceforge.net/projects/droid/.

        [25]LibraryofCongress.JHOVE2 Project[EB/OL].[2024-05-16].https://www.digitalpreservation.gov/partners/jhove2. html.

        [26]LI C,ZHENG X H,MENG X,et al.A meth? odology for measuring the preservation durability of dig? ital formats[J].Journal of Zhejiang University SCIENCE C,2010(11):872-881.

        [27]The National Archives. The technical registry PRONOM[EB/OL].[2024- 05- 16].https://www.na? tionalarchives.gov.uk/PRONOM/Default.aspx.

        [28]ExLibris. Rosetta [EB / OL]. [2024-05-16]. https : // www. exlibris. com. cn/products/rosetta-dig? ital-asset-management-and-preservation/.

        [29]張民.科研數(shù)據(jù)的遷移和保存元數(shù)據(jù)研究[D].蘭州:蘭州大學(xué),2013:8.

        [30]Archives New Zealand. File format migration[EB/OL].(2018-03-20)[2024-05-16].https://www. archives.govt.nz/manage-information/how-to-man? age-your-information/digital/file-format-migration.

        [31]The National Archives. File format conversion[EB / OL]. [2024-05-16]. https : // www. nationalar? chives.gov.uk/dc-guidance.

        [33]中華人民共和國(guó)國(guó)家檔案局.科學(xué)技術(shù)研究檔案管理規(guī)定[EB/ OL].(2020- 10- 09) [2024- 05- 16].https://www.saac.gov.cn/ daj/yaow/202010/601f6491eabb4a2aa207685fb7a07c28.shtml.

        [34]中華人民共和國(guó)國(guó)家檔案局.中辦國(guó)辦印發(fā)《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》[EB/OL].(2021-06-09)[2024- 05- 16].https://www.saac.gov.cn/daj/toutiao/ 202106/ecca2de5bce44a0eb55c890762868683.shtml.

        [35]朱艷華,高瑜蔚,李坤.科技計(jì)劃形成的科學(xué)數(shù)據(jù)匯交國(guó)家標(biāo)準(zhǔn)實(shí)踐分析與思考建議:以20個(gè)國(guó)家科學(xué)數(shù)據(jù)中心為例[J].標(biāo)準(zhǔn)科學(xué),2024(7):11-19.

        [36]張靜,潘亞男,單嵩巖.檔案管理視角下我國(guó)科學(xué)數(shù)據(jù)長(zhǎng)期保存現(xiàn)存問(wèn)題與對(duì)策分析[J].檔案與建設(shè),2023(10):61-64.

        [37]中華人民共和國(guó)國(guó)家檔案局.電子文件歸檔與電子檔案管理規(guī)范:GB/T 18894—2016[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2016:7-8.

        [39]張靜,付玥甜,何思源,等.重大科技項(xiàng)目科學(xué)數(shù)據(jù)歸檔路徑初探[J].檔案學(xué)通訊,2024(4):37-43.

        [40]黃建峰,戴敏,袁平.OFD標(biāo)準(zhǔn)在“三包兩結(jié)構(gòu)一體化”電子檔案規(guī)范管理模式中的應(yīng)用研究[J].檔案學(xué)研究,2022(6):103-107.

        作者單位:1.中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心2.中國(guó)科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院信息資源管理系3.中國(guó)科學(xué)院檔案館

        猜你喜歡
        科研檔案檔案管理
        如何規(guī)范檔案管理
        檔案管理中的電子檔案管理
        檔案管理與企業(yè)內(nèi)部控制關(guān)系的思考
        試論科研檔案工作者應(yīng)具備的素養(yǎng)要求
        議高??蒲袡n案管理存在的問(wèn)題及對(duì)策
        談高校二級(jí)學(xué)院科研檔案管理者的素質(zhì)
        淺析科研檔案整理工作
        如何做好醫(yī)院科研檔案管理工作
        基于云計(jì)算的高??蒲袡n案管理模式探析
        論科研項(xiàng)目檔案管理
        西藏科技(2015年12期)2015-09-26 12:13:40
        日本熟妇色xxxxx日本妇| 最新国产主播一区二区| 激情五月天伊人久久| 亚洲都市校园激情另类| 黄色三级国产在线观看| 丰满人妻猛进入中文字幕| 亚洲av综合永久无码精品天堂| 四川老熟妇乱子xx性bbw| 午夜福利视频合集1000| 亚洲人成综合网站在线| 日本av在线精品视频| 情头一男一女高冷男女| 日韩大片高清播放器大全| 亚洲欧美一区二区三区| 国产自产av一区二区三区性色| 国产又湿又爽又猛的视频| 亚洲 日本 欧美 中文幕| 人人妻人人狠人人爽天天综合网| 免费无码黄动漫在线观看| 中文字幕无码精品亚洲资源网久久| 国产jk在线观看| 精品国产亚洲人成在线观看| 日本亚洲视频免费在线看| 日本黑人亚洲一区二区| 深夜放纵内射少妇| 免费无码毛片一区二区三区a片| 亚洲中文字幕乱码免费| 魔鬼身材极品女神在线 | 人妻诱惑中文字幕在线视频| 亚洲国产成人片在线观看无码| 欧美巨大xxxx做受l| 国产v精品成人免费视频400条| av男人操美女一区二区三区| 日韩中文字幕版区一区二区三区| 国产亚洲精品aaaa片小说| 亚洲区在线| 中文字幕一区二区三区喷水| www国产亚洲精品| 无码国产69精品久久久久孕妇| 亚洲综合性色一区| 小草手机视频在线观看|