艾文蜀
(中國電子科技集團(tuán)公司第三十八研究所,合肥 230088)
隨著互聯(lián)網(wǎng)的快速發(fā)展,信息逐漸被網(wǎng)絡(luò)化、數(shù)字化。目前,媒體資料越來越多,媒體資源90 %的數(shù)據(jù)是視頻、圖片等多媒體非結(jié)構(gòu)化數(shù)據(jù),并且這些數(shù)據(jù)呈現(xiàn)指數(shù)級增長,在這些非結(jié)構(gòu)化數(shù)據(jù)(音視頻、圖片、文檔)中,以視頻為主的聲像資料比重越來越大,已經(jīng)逐步成為最重要的數(shù)字化資產(chǎn)。這些資料一旦缺乏科學(xué)有效的管理,必然會影響媒體資料的有效利用,同時也不利于實(shí)現(xiàn)數(shù)字化、信息化的檔案建設(shè)目標(biāo)。
隨著我國經(jīng)濟(jì)形勢、政策改革的巨大變化,近幾年檔案數(shù)字化開發(fā)利用的形式和特點(diǎn)也發(fā)生了較大的變化。為適應(yīng)新形勢和新環(huán)境下的檔案歸檔利用工作,必須更加認(rèn)真思考、探索及分析,采納相應(yīng)的政策,改善數(shù)字檔案歸檔存儲利用工作,不斷提升檔案編研利用等服務(wù)。
目前,很多科研單位對數(shù)字化資產(chǎn)沒有進(jìn)行任何規(guī)范化、流程化的管理,對媒體資源的收集、管理及利用沒有統(tǒng)一管理的數(shù)字系統(tǒng)。數(shù)字化資產(chǎn)管理中存在的主要問題表現(xiàn)在以下幾個方面。
第一,海量的音視頻及其他數(shù)字化聲像資料的數(shù)量和容量龐大,靠人工及簡單目錄化方式實(shí)行高效管理幾乎不可能,自動化管理極為困難。
第二,聲像資料處于管理失控的無序狀態(tài),產(chǎn)生的數(shù)據(jù)往往會因保存不當(dāng)而丟失,控制權(quán)限不合適低密級人員越級利用,從而使檔案的保密性無法得到安全保障。
第三,日常業(yè)務(wù)工作中,需要不斷查詢歷史聲像資料,應(yīng)用傳統(tǒng)的人工方式和資料柜管理,檢索過程非常緩慢煩瑣。即使在計(jì)算機(jī)上搜索,從大量文件中查找到所需要的資料,甚至只是某個視頻鏡頭,也是一件耗時耗力的工作。對于大多數(shù)文檔、照片、視頻,只能進(jìn)行簡單的題目檢索,無法進(jìn)行全文檢索,獲取信息和資料速度慢,工作效率低下。
第四,有大量歷史聲像資料急需數(shù)字化搶救,保存時間過長會導(dǎo)致部分?jǐn)?shù)據(jù)丟失,急需開展數(shù)字化采集整理工作。
第五,數(shù)字化視頻節(jié)目和素材每年不斷增加,尤其是后續(xù)高清素材越來越多,也需要新系統(tǒng)來存儲和管理這些高清音視頻資源。
針對聲像檔案管理混亂無序、資源無法集中存檔的局面,首先應(yīng)構(gòu)建檔案信息集中管理系統(tǒng)平臺,實(shí)現(xiàn)媒體檔案(將所有需要系統(tǒng)管理的聲像資料統(tǒng)稱為資源)的綜合管理。保存的目的是保存數(shù)據(jù)信息的內(nèi)容、物理形式和功能,對其進(jìn)行分類、歸檔、管理,即使時間流逝,技術(shù)發(fā)生變化,依然能對存檔數(shù)據(jù)進(jìn)行調(diào)取,實(shí)現(xiàn)可檢索、可調(diào)用。
明確聲像檔案管理范圍:需要能夠支持各類聲像資料、數(shù)字資源的管理,包括各類音視頻、圖片、文檔等文件資源,并且在聲像檔案基礎(chǔ)上建立多組管理對象,如各類會議、各種活動、領(lǐng)導(dǎo)視察來訪、外事接待等產(chǎn)生的所有照片、錄像、錄音、解說詞、發(fā)言。
規(guī)范聲像檔案編目:對收集歸檔的資源對象制定相對應(yīng)的著錄編目規(guī)范,可以對所有數(shù)字資源進(jìn)行描述。編目的基本元數(shù)據(jù)項(xiàng)應(yīng)包含信息本身產(chǎn)生的一些源數(shù)據(jù),再進(jìn)行分層編目并細(xì)化。
統(tǒng)籌聲像檔案組織:不同資源模式下,為不同的歸檔檔案建立相關(guān)的檔案組織和規(guī)章制度,以實(shí)現(xiàn)對歸檔檔案的快速定位和檢索。
統(tǒng)一聲像檔案管理流程:為后續(xù)工作建立并組織合理的檔案采集編目利用流程,也一并為各種檔案信息建立有利于內(nèi)外部的檔案資源管理、檢索下載等流程。對自身檔案實(shí)體和檔案信息的管理、服務(wù)等各項(xiàng)業(yè)務(wù)工作從起始到完成,需由不同部門、不同職位,經(jīng)不同環(huán)節(jié)協(xié)調(diào)及順序工作來實(shí)現(xiàn)完整過程。
構(gòu)建聲像檔案管理模式:依據(jù)現(xiàn)實(shí)中檔案資源保存的場景,對各類不相同的檔案對象和檔案信息管理人員、建立人員、利用人員創(chuàng)建不相同的多種場景。聲像檔案不能獨(dú)立成類,應(yīng)和與其內(nèi)容相關(guān)的紙質(zhì)文檔建立有機(jī)聯(lián)系,不僅要建立管理制度,還要制定相應(yīng)細(xì)則。為了使館藏的珍貴原始聲像檔案能夠永久保存,共享服務(wù)于大眾,同時能快速檢索到自己需要的影像資源,安全便捷地進(jìn)行管理存儲,實(shí)現(xiàn)通過網(wǎng)絡(luò)查閱、預(yù)覽、播放,關(guān)鍵需要解決對音視頻、照片等多媒體載體產(chǎn)生的媒體檔案采集收集、整理編目、信息存儲、查詢檢索和信息發(fā)布等問題?,F(xiàn)有的媒體檔案管理系統(tǒng)已成為創(chuàng)建數(shù)字檔案館這一過程中不可或缺的重要組成部分。
先進(jìn)的媒體檔案管理系統(tǒng)所具備的技術(shù)亮點(diǎn),是以“高管控、高質(zhì)量、高可用、高效率”為原則,為用戶提供媒體檔案資產(chǎn)搶救、管理、利用等一系列整體的解決方案。其優(yōu)勢包括先進(jìn)的技術(shù)、構(gòu)架和設(shè)計(jì)理念,具有良好的互聯(lián)互通性,支持多格式、泛媒體,工作流程靈活、簡潔,可以滿足不同用戶的需求。需做到設(shè)備先進(jìn)、系統(tǒng)科學(xué)、功能實(shí)用、接口開放、維護(hù)方便。為聲像檔案的歸檔、整理、編目、檢索、瀏覽等一系列工作保駕護(hù)航,且需要滿足聲像檔案格式轉(zhuǎn)換、編目審核、安全完整和下載輸出等各功能要求,確保聲像檔案數(shù)字化工作順利開展。中國電子科技集團(tuán)公司第三十八研究所經(jīng)過兩年的考察時間,在多方協(xié)調(diào)促進(jìn)下成功上線了聲像檔案媒體資產(chǎn)管理系統(tǒng)(以下簡稱“檔案媒資系統(tǒng)”),解決了當(dāng)前音像資料老化和存儲、管理的一些迫切問題,以下簡單介紹該系統(tǒng)。
1.人性化的軟件設(shè)計(jì)
用戶功能操作界面層次分明、新穎耐看,系統(tǒng)界面布局合理、簡單易用;所有上傳、下載任務(wù)實(shí)時監(jiān)控,使得用戶對任務(wù)狀態(tài)一目了然;圖片和視頻上傳時,后臺自動提取相關(guān)信息,如拍攝日期、拍攝像素、文件格式、拍攝人等,實(shí)現(xiàn)部分?jǐn)?shù)據(jù)自動化處理;視頻文件系統(tǒng)內(nèi)嵌一套傳輸服務(wù),做到隨時隨地上傳、下載文件,并且支持?jǐn)帱c(diǎn)續(xù)傳(圖1)。
圖1 聲像檔案媒體資產(chǎn)管理系統(tǒng)上傳界面
2.功能齊全、操作簡單
多種來源的資料采集方式,與獨(dú)立軟件配合使用,可實(shí)現(xiàn)文件、光盤、藍(lán)光等全介質(zhì)的批量上傳;自動識別該視頻資料是否有低質(zhì)量文件,如果沒有則后臺自動生成低碼率文件用于瀏覽,保證了音視頻文件入庫的同時存在兩份(高低質(zhì)量各一份);支持元數(shù)據(jù)信息自定義,包括分類自定義、編目體系自定義、編目數(shù)據(jù)自定義;支持多業(yè)務(wù)系統(tǒng)數(shù)據(jù)(實(shí)體文件及元數(shù)據(jù))交換,方便檔案移交;高效全文檢索引擎,提供全文模糊查詢、編目查詢、主題檢索等(圖2)。
圖2 聲像檔案媒體資產(chǎn)管理系統(tǒng)檢索界面
本系統(tǒng)對于集中管理的檔案資源提供全文檢索、分類檢索功能,簡單直觀、高效維護(hù)。在資源管理、歸檔遷移等方面,具有國內(nèi)超前的智能化技術(shù),系統(tǒng)在資源調(diào)用、共享、管控等方面有很大優(yōu)勢。
3.流程方便明晰,泛媒體、多格式支持
在使用過程中,整個流程一目了然,沒有繁雜的操作,網(wǎng)絡(luò)結(jié)構(gòu)成熟。系統(tǒng)本身包含自己的工作流監(jiān)控,并可與交互平臺的流程管理無縫集成。其工作流程可以定義系統(tǒng)內(nèi)部工作環(huán)節(jié)與走向,配置各環(huán)節(jié)的執(zhí)行參數(shù)與執(zhí)行人員等。下圖以照片歸檔為例(圖3)。
圖3 聲像檔案媒體資產(chǎn)管理系統(tǒng)照片歸檔流程
基于文件方式的存儲管理模式,對存檔文件的格式?jīng)]有任何限制;支持各類視頻文件、音頻文件、文本文件(Word、Excel、TXT等)及圖片文件(JPG、GIF等);支持多格式轉(zhuǎn)碼文件;支持視頻文件高清格式。
對傳統(tǒng)介質(zhì),如VO錄像帶、IMAX錄像帶、DV帶等進(jìn)行采集,生成數(shù)字化檔案信息,同時生成相應(yīng)的初始編目信息。上傳下載模塊支持Web網(wǎng)頁登錄,應(yīng)具備至少5個端口同時高速運(yùn)作的寬帶,不限制同時瀏覽的端口數(shù)量。具備批量采集轉(zhuǎn)碼和批量編目功能,同時還可以對采集的音像素材進(jìn)行簡單裁切、合成的編輯工作,以達(dá)到歸檔的要求。將文件格式轉(zhuǎn)化成AVI、MPG4、JPG等多種通用格式,用于內(nèi)外檔案信息的交換。
4.成熟、完備的存儲管理
使用安全、可靠、高效的多級存儲體系,智能化地進(jìn)行在線、近線、離線資料的統(tǒng)一管理。在設(shè)計(jì)過程中充分考慮系統(tǒng)的安全性,本所在提供高性能的虛擬化服務(wù)器資源的同時,也為數(shù)據(jù)備份提供了雙控制器系統(tǒng)和冗余電源。數(shù)據(jù)存儲的可使用有效容量大于200T,每臺核心服務(wù)器在配置的時候系統(tǒng)盤和數(shù)據(jù)盤也全部采用冗余配置,采用文件存儲服務(wù)器與系統(tǒng)服務(wù)器兩個獨(dú)立的硬件系統(tǒng),文件存儲服務(wù)器具有雙備份功能,最大化保證數(shù)據(jù)不易損壞和丟失,同時源數(shù)據(jù)設(shè)備與備份存儲設(shè)備Raid級別均采用Raid 6方式。
整個系統(tǒng)具有完善的應(yīng)急方案,對在系統(tǒng)安裝及運(yùn)行過程中出現(xiàn)的故障和問題,都能及時指出排解方法和手段。在線對網(wǎng)絡(luò)運(yùn)行情況進(jìn)行記錄和監(jiān)測,對于不同用戶進(jìn)行權(quán)限的嚴(yán)格區(qū)分和限制。
5.穩(wěn)定、安全、可靠
嚴(yán)密的用戶安全訪問機(jī)制,保證內(nèi)容訪問權(quán)限;系統(tǒng)內(nèi)置強(qiáng)大的工作流導(dǎo)航和模塊應(yīng)用,支持在流程中任意環(huán)節(jié)設(shè)置操作權(quán)限,文件流轉(zhuǎn)過程中,嚴(yán)格把控利用權(quán)限,防止誤操作。嚴(yán)格的QA機(jī)制保障產(chǎn)品的穩(wěn)定和可靠,降低維護(hù)的代價。
在應(yīng)用服務(wù)器上安裝SFTP服務(wù)器是因?yàn)槊襟w檔案管理系統(tǒng)中有“超大附件”電子文件上傳功能,而所上傳的視頻文件大多是超過10 G的文件,為了優(yōu)化超大附件上傳功能,故需要借用SFTP服務(wù)端。
與傳統(tǒng)聲像檔案素材比較,數(shù)字化聲像檔案的優(yōu)點(diǎn)就是可以無損重復(fù)利用,鑒于計(jì)算機(jī)網(wǎng)絡(luò)的開放性及可擴(kuò)展性,聲像檔案能夠被比較容易地再利用,真正成為用戶可以周轉(zhuǎn)流通的媒體“檔案”,而不像傳統(tǒng)聲像素材被沉淀在庫房、藏館內(nèi)。
遵循安全性的重要原則,在網(wǎng)絡(luò)系統(tǒng)構(gòu)建方面,整個系統(tǒng)要保證軟件不受病毒感染、黑客攻擊,具有高度的安全和保密性,系統(tǒng)硬件選型也以安全、穩(wěn)定為主。
6.全新概念,強(qiáng)大的資源轉(zhuǎn)換
采用先進(jìn)的、成熟的資源轉(zhuǎn)換和管理技術(shù),從系統(tǒng)集成角度、設(shè)備選型、搜索技術(shù)及先進(jìn)的數(shù)據(jù)計(jì)算存貯技術(shù)平臺等入手,最大化地符合聲像資料行業(yè)規(guī)范和標(biāo)準(zhǔn),滿足與OA系統(tǒng)、PDM系統(tǒng)等的相關(guān)接口協(xié)議。從而實(shí)現(xiàn)聲像檔案資源共享,服務(wù)社會。
為迎接信息時代科技發(fā)展的挑戰(zhàn),加快媒體檔案管理系統(tǒng)的建設(shè),以適應(yīng)現(xiàn)代信息技術(shù)發(fā)展的基本流向,本系統(tǒng)在其整個生命周期內(nèi)可保持一定的先進(jìn)性。在信息數(shù)字化、管理網(wǎng)絡(luò)化背景下,通過對多媒體信息資源的統(tǒng)籌管控,為深入挖掘聲像檔案的知識價值和利用價值、拓展聲像檔案的利用渠道提供成熟的軟硬件環(huán)境。在提高自身業(yè)務(wù)水平的過程中,應(yīng)充分借助計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)去繼續(xù)探索聲像檔案的價值,從而實(shí)現(xiàn)知識共享,最大限度地發(fā)揮聲像檔案的文化潛質(zhì),不斷提升檔案在科研單位中的創(chuàng)新能力和發(fā)展需求。