亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)字保存的格式管理

        2019-11-28 07:11:48
        海峽科技與產(chǎn)業(yè) 2019年7期
        關(guān)鍵詞:標準

        李 淳

        中國北方車輛研究所,北京 100072

        格式是為了存儲數(shù)字信息而使用的特殊編碼方式,是對數(shù)字對象的內(nèi)容信息進行交換和表示的一種重要標準,也是一個數(shù)字對象能否被有效使用的重要因素。數(shù)字保存必須考慮格式問題。

        隨著信息技術(shù)的發(fā)展,各種新格式不斷涌現(xiàn),進行有效的格式管理,了解格式本身完整的標識信息,選擇有效的格式,才能保證數(shù)字內(nèi)容的可持續(xù)性。

        1 數(shù)字保存的格式選擇原則

        1.1 所選格式適用于多種環(huán)境

        格式能在不同環(huán)境下使用,即能在不同操作系統(tǒng)、不同軟硬件平臺上使用,不受平臺的限制。可以減少管理程序與管理費用,便于資源共享。這類格式兼容性強,更便于數(shù)字內(nèi)容從一種載體介質(zhì)轉(zhuǎn)移到另一種載體介質(zhì),或從一種數(shù)字平臺轉(zhuǎn)換到另一種數(shù)字平臺??梢越档臀募L期保存中因遷移而帶來的數(shù)據(jù)丟失風(fēng)險。

        1.2 所選格式支持從專用環(huán)境向通用環(huán)境遷移

        在許多新的應(yīng)用領(lǐng)域,經(jīng)常會使用特有的專用格式。由于特定需求,一些通用格式也被改為不通用的專用格式。如果這些文件數(shù)據(jù)支持從專用環(huán)境中遷移出來,就有利于文件的長期保存,特別是元數(shù)據(jù)及系統(tǒng)文件的完好保存。

        1.3 所選格式標準化程度較高

        標準化的主要目的就是能夠盡可能地兼容不同的產(chǎn)品。選用標準格式可以保證數(shù)據(jù)的易傳性與共享性,減少文件保存過程中數(shù)據(jù)丟失的風(fēng)險。

        1.4 所選格式被用戶廣泛支持

        被用戶廣泛使用的格式,即使暫時不是標準,因為其主導(dǎo)了市場,已形成事實標準,其他的應(yīng)用系統(tǒng)與數(shù)據(jù)也會以它為規(guī)范,以達到兼容的目的。廠家也更可能為該格式的更新提供遷移路徑,最大限度地保證新舊版本之間的兼容性,從而降低長期保存中數(shù)據(jù)丟失的風(fēng)險。

        1.5 所選格式可擴展性強

        文件在長期保存過程中,環(huán)境數(shù)據(jù)、元數(shù)據(jù)等都有可能發(fā)生變更。這就要求所選格式形成的文檔,在不干擾文件內(nèi)容真實性、完整性的前提下,能夠支持信息的擴展或變更。

        1.6 所選格式能夠記錄文件處理過程

        理想的文件格式要能夠記錄下該文件內(nèi)容的所有變動狀況,如文件創(chuàng)建者、何時創(chuàng)建、文件大小、變更記錄等。這些信息詳細揭示了文件的處理情況。

        2 數(shù)字保存的推薦格式

        在長期保存的實踐活動中,不同的組織機構(gòu)為指導(dǎo)內(nèi)部的數(shù)字保存過程,根據(jù)自身的需求和特點,形成了比較成熟的格式規(guī)范。這些推薦格式具有一定的指導(dǎo)意義,值得借鑒。

        2.1 FDA 格式規(guī)范

        美國佛羅里達數(shù)字檔案項目(Florida Digital Archive,F(xiàn)DA),針對文本、圖形圖像、聲音視頻、程序、電子表格等形式的數(shù)字內(nèi)容,推薦詳細的存儲格式。

        2.2 美國國會圖書館格式規(guī)范

        美國國會圖書館格式規(guī)范研究文本和音樂作品、靜態(tài)圖像作品、音頻作品、運動圖像作品、軟件和電子游戲、數(shù)據(jù)集/數(shù)據(jù)庫這六大類內(nèi)容的格式和相關(guān)標準。推薦使用可持續(xù)的格式,遵循一定的技術(shù)標準,數(shù)字保存才更可靠,也更節(jié)約成本。

        2.3 UK Data Archive 格式規(guī)范

        UK Data Archive 擁有英國最大的社會科學(xué)和人文科學(xué)的數(shù)字研究數(shù)據(jù)館藏,其格式規(guī)范支持數(shù)據(jù)的共享、重復(fù)利用和保存。數(shù)字內(nèi)容使用標準格式進行保存,有利于數(shù)據(jù)的解讀、交換和傳遞。保證數(shù)字資源長期保存最穩(wěn)妥的方法就是將數(shù)據(jù)轉(zhuǎn)換成標準格式。

        3 數(shù)據(jù)保存的重要格式

        文件格式品類繁雜,數(shù)量眾多,各有特點、優(yōu)勢和適用場合。在長期保存中有幾種代表性格式。

        3.1 PDF/Archive (PDF/A)

        PDF/A 一直是業(yè)內(nèi)的重要標準,可長期安全地保存文件,還可始終如一地顯示文件效果。PDF/A 創(chuàng)建速度快,文檔體積小,支持數(shù)字簽名,獨立于軟硬件、可進行可靠的數(shù)據(jù)交換,易于更新、搜索,保存成本低,長期持續(xù)可靠,是電子文件長期保存最理想的文檔格式之一,被廣泛用于保存文本數(shù)字對象。

        3.2 JPEG

        聯(lián)合圖像專家小組(Joint Photographic Experts Group,JPEG),其系列格式具有較好的壓縮率,失真率較低,圖像品質(zhì)好,存儲容量小,傳遞和呈現(xiàn)速度快,支持廣泛,有一定的技術(shù)優(yōu)勢,是長期保存中主要的圖像保存格式之一。

        3.3 TIFF

        標簽圖像文件格式(Tagged Image File Format,TIFF)是一種主要用來存儲照片和藝術(shù)圖的圖像文件格式,廣泛應(yīng)用于對質(zhì)量要求較高的圖像的存儲與轉(zhuǎn)換。通過在文件頭中包含的“標簽”,它能在一個文件中處理多幅圖像和數(shù)據(jù)。標簽?zāi)軌驑嗣鲌D像的基本幾何尺寸,定義圖像數(shù)據(jù)的排列。

        TIFF 結(jié)構(gòu)靈活,適應(yīng)性強,壓縮損失率低,能可靠、高質(zhì)量地存儲圖像,已成為圖像文件格式的一種標準,絕大部分圖像系統(tǒng)都支持這種格式,是保存圖像時的首選格式之一。

        3.4 MPEG

        MPEG 是標準的視頻壓縮編碼技術(shù)。主要利用具有運動補償?shù)膸g壓縮編碼技術(shù),減小時間冗余度;利用DCT 技術(shù),減小圖像的空間冗余度;利用熵編碼,減小信息統(tǒng)計冗余度。這幾種技術(shù)的綜合運用,大大增強了壓縮性能。

        MPEG 文件具有高壓縮比,容量小,節(jié)約保存空間和成本,失真率低,可以較完整地記錄聲音和視頻,是長期保存中保存音頻和視頻的理想格式,得到了廣泛的應(yīng)用[1]。

        4 數(shù)字保存的格式工具

        數(shù)字保存的格式工具主要功能包括文件識別和格式驗證。文件識別是判定一個數(shù)字對象預(yù)定格式的過程;格式驗證是鑒別一個數(shù)字對象是否符合格式的語法和語義規(guī)則的過程。

        4.1 DROID

        數(shù)字記錄對象識別(Digital Record Object Identificaition,DROID)是英國國家檔案館開發(fā)的免費應(yīng)用軟件,使用存儲在PRONOM 中的登記信息實現(xiàn)格式的自動識別。文件首先被讀進內(nèi)存,然后通過一個循環(huán)完成文件與內(nèi)部登記信息的匹配,并把匹配的內(nèi)部登記信息及其相關(guān)格式記入結(jié)果列表中,再根據(jù)文件的擴展名,即外部登記信息,做進一步的分析處理。

        DROID軟件工具能夠自動識別200多種文件格式,記錄文件類型、版本、大小、修改時間等,能夠及時發(fā)現(xiàn)文件格式的風(fēng)險,提高數(shù)字格式的可持續(xù)性,支持數(shù)據(jù)容量縮減,節(jié)約存儲成本[2]。

        4.2 Fido

        數(shù)字對象格式識別工具(Format Identification for Digital Objects,F(xiàn)ido)是使用Python 編寫的開源命令行應(yīng)用程序,是使用PRONOM 格式簽名的識別工具。識別結(jié)果按照PRONOM 兼容的持久唯一標識符PUIDs進行報告。Fido 覆蓋了PRONOM 數(shù)據(jù)庫的所有格式[3]。

        4.3 MET

        元數(shù)據(jù)抽取工具(Metadata Extraction Tool,MET)由新西蘭國家圖書館開發(fā)。它從一系列不同格式的數(shù)字文件(包括PDF、圖像、聲音、Office等格式)中,抽取保存元數(shù)據(jù),并將這些元數(shù)據(jù)以標準格式XML 輸出,供長期保存使用。該程序打開的所有文件都為只讀,保證了原始文件的完整性。該工具只讀取文件頭部信息,所以整個抽取過程速度很快[4]。

        4.4 JHOVE2

        JHOVE2 由加利福尼亞數(shù)字圖書館、Protico、斯坦福大學(xué)開發(fā),是在著名的JHOVE 工具上改進的一個開源軟件,受到美國國會圖書館的國家數(shù)字信息基礎(chǔ)設(shè)施和保存項目的資助。JHOVE2 的功能包括識別、特征提取、評估和策略[5]。

        4.5 FITS

        文件識別工具集(File Information Tools,F(xiàn)ITS)是哈佛大學(xué)圖書館開發(fā)的信息系統(tǒng)開源軟件,是一些外部工具的包裝器。除了具有識別的功能,還可以用于特征提取和驗證。FITS 將所有的本地輸出轉(zhuǎn)換成通用格式FITS XML。

        4.6 Apache Tika

        Apache Tika 是Java 語言的開源工具集,利用現(xiàn)有的解析類庫,從文檔中探測和抽取元數(shù)據(jù)和結(jié)構(gòu)化文本內(nèi)容。主要功能包括偵測文檔的類型、字符編碼、語言等其他現(xiàn)有文檔的屬性,并在此基礎(chǔ)上提取結(jié)構(gòu)化的文字內(nèi)容[6]。

        5 小結(jié)

        格式管理貫穿數(shù)據(jù)保存生命周期的各個階段,是數(shù)字保存的重點問題。目前,格式管理越來越受到重視,但是存在的問題仍然有待進一步探討和研究。

        猜你喜歡
        標準
        2022 年3 月實施的工程建設(shè)標準
        忠誠的標準
        當代陜西(2019年8期)2019-05-09 02:22:48
        標準匯編
        上海建材(2019年1期)2019-04-25 06:30:48
        美還是丑?
        你可能還在被不靠譜的對比度標準忽悠
        一家之言:新標準將解決快遞業(yè)“成長中的煩惱”
        專用汽車(2016年4期)2016-03-01 04:13:43
        2015年9月新到標準清單
        標準觀察
        標準觀察
        標準觀察
        91九色人妻精品一区二区三区| 呦系列视频一区二区三区| 亚洲熟妇少妇任你躁在线观看无码 | 国产做国产爱免费视频| 婷婷五月综合缴情在线视频| 91精品国产91热久久p| 亚洲av区一区二区三区| 亚洲av色欲色欲www| 最新高清无码专区| 日本久久久免费高清| 一区二区三区国产天堂| 日本精品久久久久中文字幕| 精品久久久噜噜噜久久久| 一区二区三区内射视频在线观看| av免费在线播放一区二区| 精品久久久久久无码专区| 特黄a级毛片免费视频| 五月天无码| 精品久久人妻av中文字幕| 成人午夜福利视频后入| 精品一区二区三区在线观看视频| 无码一区二区丝袜| 偷拍综合在线视频二区日韩| 免费成人在线电影| 在线视频这里只有精品| 日本在线免费一区二区三区| 久久亚洲道色综合久久| 野花社区视频www官网| 免费一级国产大片| 国产丝袜美腿中文字幕| 成人av鲁丝片一区二区免费| 国产精品毛片无遮挡高清| 国产精品成人有码在线观看| www国产亚洲精品| 亲子乱aⅴ一区二区三区下载| japanese色国产在线看视频| 久久久精品人妻一区二区三区游戏| 亚洲中文字幕成人无码| 亚洲A∨无码国产精品久久网| 日本免费三片在线视频| 国产a级毛片久久久精品毛片|