摘要:為了更好地管理和利用精準扶貧數(shù)碼照片和音視頻檔案,進一步挖掘其內(nèi)在價值,為互聯(lián)網(wǎng)上利用提供便利,需要開發(fā)一個統(tǒng)一標準的專題數(shù)據(jù)庫應用平臺。文章分析了精準扶貧數(shù)碼照片音視頻檔案專題數(shù)據(jù)庫的理論研究和實踐現(xiàn)狀,提出了專題數(shù)據(jù)庫應用平臺開發(fā)的思路和框架,設計了專題數(shù)據(jù)庫的資源體系和軟件系統(tǒng)功能模塊,為專題數(shù)據(jù)庫應用平臺軟件系統(tǒng)的開發(fā)和建設奠定了理論基礎(chǔ)。
關(guān)鍵詞:精準扶貧 檔案專題數(shù)據(jù)庫 應用平臺
2013年習近平總書記提出了精準扶貧的重要思想,2020年11月23日,全國832個貧困縣脫貧攻堅圓滿收官,這是人類發(fā)展歷史上同貧困進行斗爭的偉大勝利。為記錄我國的這一壯舉和脫貧攻堅歷程,2016年國家檔案局、國務院扶貧辦共同制訂的《精準扶貧檔案管理辦法》,要求收集和保存精準扶貧工作中形成的對國家、社會有保存價值的文字、圖表、音像、電子數(shù)據(jù)等各種形式和載體的歷史記錄。很多省(市、自治區(qū))都制定了自己的“脫貧攻堅檔案管理辦法及其工作實施細則”,有條件的地方正在逐步開展精準扶貧數(shù)碼照片音視頻檔案專題數(shù)據(jù)庫的建設。數(shù)據(jù)庫應用平臺是檔案專題數(shù)據(jù)庫的重要組成部分,它既是承載檔案數(shù)字資源的倉儲和容器,也是支持檔案資源開發(fā)利用的一套軟硬件系統(tǒng)。
(一)理論研究情況
檔案專題數(shù)據(jù)庫建設方面的研究起始于2000年前后,當年的學者認為計算機專題數(shù)據(jù)庫是檔案編研的新形勢。[1]在此之后學術(shù)界產(chǎn)生的成果大致可分為兩大類,第一類是關(guān)于檔案專題數(shù)據(jù)庫建設的概念、理念、原則、方法、流程和質(zhì)量控制等具體建設方法的研究。比較有代表性的有:2003年周長華提出的檔案專題數(shù)據(jù)庫建設的基本理念和方法。[2]2012年孫瑾和郭彥軍提出了構(gòu)建基于質(zhì)量控制理論的檔案專題數(shù)據(jù)庫建設流程。[3]第二類是針對某類專題檔案數(shù)據(jù)建設的現(xiàn)狀、問題及對策研究。該類研究的專題對象包括園林檔案、民生檔案、防雷檔案、邊疆歷史檔案、民間檔案文獻、婚姻檔案、手札檔案、新冠疫情檔案等。比如2012年劉永祥提出了高校檔案專題數(shù)據(jù)庫平臺建設的系統(tǒng)框架和功能模塊等內(nèi)容。[4]2015年劉彩云等提出的網(wǎng)絡環(huán)境下數(shù)字檔案資源共建共享問題。[5]2020年趙鑫強等提出的要針對新型冠狀病毒疫情檔案開展檔案專題數(shù)據(jù)庫平臺建設。[6]
(二)實踐現(xiàn)狀和問題
1、缺乏明確的建庫目標和方案,數(shù)據(jù)庫難以發(fā)揮其利用效益。通過對云南省、昆明市、楚雄州、玉溪市、尋甸縣、大姚縣等地檔案館的實地調(diào)研,目前為止除了省級檔案館和幾個縣級館正在開展建庫工作外,大部分地方都還沒有開展該項工作。一是因為數(shù)據(jù)庫建設的目標和方案不明確,數(shù)據(jù)庫建設的原則和思路不清晰,導致具體工作難以實施。二是因為專題數(shù)據(jù)庫建設工作費時費力,局館分離的情況下相關(guān)建設機構(gòu)主體責任不明確,加上大家普遍認為數(shù)據(jù)庫的使用效益不高,大家沒有做該項工作的積極性。比如楚雄州檔案館曾經(jīng)建設了10多個專題數(shù)據(jù)庫,但是這些數(shù)據(jù)平時基本沒人用,脫離了專題數(shù)據(jù)庫建設和利用的初衷。
2、缺乏統(tǒng)一的建設標準和規(guī)范,數(shù)據(jù)庫及其應用平臺的建設質(zhì)量難以保證。目前對于精準扶貧檔案專題數(shù)據(jù)庫的建設還沒有一套可以共同遵循的建設標準和規(guī)范,資源建設的質(zhì)量參差不齊,內(nèi)容各異。專題數(shù)據(jù)庫建設所涉及的標準規(guī)范包括資源收集和整理標準、元數(shù)據(jù)設置標準、數(shù)據(jù)加工著錄標準、軟硬件接口標準、平臺性能和功能標準、硬件型號和參數(shù)標準等,制定并建立有關(guān)檔案專題數(shù)據(jù)庫的建設標準體系勢在必行。[7]數(shù)據(jù)資源的質(zhì)量是專題數(shù)據(jù)庫持續(xù)發(fā)揮效益的關(guān)鍵,應用平臺的質(zhì)量是數(shù)據(jù)庫順利提供利用的保障,如果沒有統(tǒng)一的標準,數(shù)據(jù)庫提供的服務質(zhì)量將難以保證。
3、缺乏一套科學有效的數(shù)據(jù)庫應用平臺軟件,資源的整合與共享難以實現(xiàn)。檔案專題數(shù)據(jù)庫與檔案管理系統(tǒng)是兩個不同概念,在數(shù)據(jù)信息、目的作用、產(chǎn)生過程、收錄規(guī)模、使用范圍、組織方式等方面均存在不同。[8]雖然大多數(shù)檔案館建設專題數(shù)據(jù)庫都是在檔案管理系統(tǒng)中進行創(chuàng)建,但是,筆者認為專題數(shù)據(jù)庫應用平臺與檔案管理系統(tǒng)應分開建設。檔案管理系統(tǒng)從功能設置和系統(tǒng)架構(gòu)方面都無法適應專題數(shù)據(jù)庫建設的需要,其兼容性和擴展性不足,資源體系和類型混亂,難以有效管理每條數(shù)據(jù),無法實現(xiàn)資源的整合與共建共享。
(一)專題數(shù)據(jù)庫應用平臺開發(fā)的思路
1、開發(fā)目標。開發(fā)目標可以指導和檢驗平臺的設計效果,使數(shù)據(jù)庫的社會效益和經(jīng)濟效益最優(yōu)。精準扶貧數(shù)碼照片音視頻檔案專題數(shù)據(jù)庫應用平臺開發(fā)的第一個目標是建成專題門戶網(wǎng)站。通過設計各級頁面,開發(fā)算法先進的檢索系統(tǒng)和界面,滿足專題數(shù)據(jù)庫資源的在線瀏覽、檢索、下載和宣傳展示需求。第二個目標是建成后臺管理系統(tǒng),集成數(shù)據(jù)和網(wǎng)址管理功能,有效管理數(shù)據(jù)庫中的元數(shù)據(jù)和檔案資源,并對相關(guān)數(shù)據(jù)進行統(tǒng)計分析。第三個目標是建成數(shù)據(jù)庫支持系統(tǒng)。針對精準扶貧數(shù)碼照片音視頻檔案進行硬件參數(shù)優(yōu)化,支持用戶的日常利用需求。[9]
2、開發(fā)主體。首先,可以由國家檔案局建設一個統(tǒng)一的專題數(shù)據(jù)庫應用平臺,該平臺免費提供給全國的所有檔案館使用。應用平臺可以通過公開招標的形式由第三方信息技術(shù)公司根據(jù)檔案館的管理要求和用戶的利用需求進行開發(fā)。其次,各級檔案館也可以根據(jù)實際情況分別建設自己的應用平臺。數(shù)據(jù)采集和加工著錄等具體工作可以由各級檔案館完成,各級檔案局負責資源的內(nèi)容與質(zhì)量審核。州(市)級檔案館負責應用平臺的建設指導和培訓,州(市)級檔案局負責資源的形式與規(guī)范性審核。省級檔案館制定本省的數(shù)據(jù)庫資源體系并提出統(tǒng)一的資源建設要求和軟件功能設計要求,省級檔案局負責提供平臺的日常管理、維護和技術(shù)支持。國家檔案局負責制定相關(guān)的政策、規(guī)范和標準。
3、質(zhì)量控制。第一,應用平臺應滿足軟件設計基本原則,即針對性和標準化、易升級性和可擴展性、先進性與適用性、安全性與可靠性、經(jīng)濟性與實用性。第二,根據(jù)軟件生命周期理論和瀑布型生命周期模型,專題數(shù)據(jù)庫應用平臺的設計屬于其第三個階段,此階段主要根據(jù)需求分析的結(jié)果,對整個軟件系統(tǒng)進行設計,如系統(tǒng)框架設計,數(shù)據(jù)庫功能設計等。[10]第三,專題數(shù)據(jù)庫應用平臺開發(fā)時應綜合考慮系統(tǒng)結(jié)構(gòu)合理性、響應及時性、操作方便性、功能完整性等軟件性能指標,制定系統(tǒng)運行監(jiān)督機制和評價方法,以保障平臺建設的質(zhì)量。
(二)專題數(shù)據(jù)庫應用平臺的應用框架
精準扶貧數(shù)碼照片音視頻檔案專題數(shù)據(jù)庫應用平臺的框架共包括五個部分,如圖1所示。基礎(chǔ)層是檔案館的原有軟硬件基礎(chǔ),數(shù)據(jù)層檔案館的資源基礎(chǔ),這兩部分是支撐數(shù)據(jù)庫建設的基本條件。應用層是面向用戶的功能,服務層是用戶利用的通道,這兩部分主要面向用戶提供服務。管理層是對應用層、數(shù)據(jù)層和基礎(chǔ)層進行管理的一套軟件系統(tǒng)和管理機制,主要提供給管理人員使用。
(一)專題數(shù)據(jù)庫資源體系構(gòu)建
1、數(shù)據(jù)庫資源體系層級結(jié)構(gòu)。通過對現(xiàn)有精準扶貧數(shù)碼照片音視頻檔案資源類型和內(nèi)容的研究,數(shù)據(jù)庫的資源分類方法可采用“類型——收集單位級別——主題”的復式分類法來制定。具體層級如表1所示。
2、數(shù)碼照片和音視頻檔案的元數(shù)據(jù)。元數(shù)據(jù)是用于描述每一個精準扶貧數(shù)碼照片音視頻檔案電子文件屬性特征及其內(nèi)容信息的結(jié)構(gòu)化數(shù)據(jù),由若干字段名稱、關(guān)系、約束及其著錄內(nèi)容組成,是建立統(tǒng)一標準規(guī)范的重要環(huán)節(jié)。專題檔案數(shù)據(jù)庫的字段設置可以參考“DublinCore”“錄音錄像類電子檔案元數(shù)據(jù)方案”“照片類電子檔案元數(shù)據(jù)方案”進行設計。數(shù)碼照片和音視頻檔案共用的元數(shù)據(jù)字段主要包括檔案館名稱、文件類型、檔號、題名、描述、責任者、時間、主題分類、來源、采集設備、保管期限、利用權(quán)限、全文鏈接、文件名稱、文件大小、校驗碼、版權(quán)信息、分辨率、碼率、圖像尺寸等,字段的類型包括字符型、日期型、枚舉型、數(shù)值型等。這些字段名稱是專題數(shù)據(jù)庫應用平臺中資源管理模塊設計的重要依據(jù)和基礎(chǔ),不同的專題數(shù)據(jù)庫應用平臺之間的數(shù)據(jù)能否共享與互通也取決于這些字段的設計是否能夠統(tǒng)一標準。
(二)專題數(shù)據(jù)庫應用平臺軟件系統(tǒng)功能設計
1、前臺網(wǎng)站系統(tǒng)的布局和功能
(1)各級頁面的功能和布局。前臺網(wǎng)站既是用戶利用數(shù)據(jù)庫的主要途徑,也是數(shù)據(jù)庫提供服務的主要窗口,其板塊布局、色彩搭配、界面設計、顯示方式等都將影響用戶的使用體驗。專題數(shù)據(jù)庫網(wǎng)站可分為簡單型與復雜型兩種,前者只包含檢索界面,后者還包含首頁、二級列表頁面和三級詳情頁面共四個組成部分。首頁由網(wǎng)站標識、數(shù)據(jù)庫名稱、欄目導航、資源展示模塊、登錄模塊、簡單檢索框、相關(guān)鏈接等元素組成,其中欄目導航按照數(shù)據(jù)庫資源體系層級結(jié)構(gòu)來設置。二級頁面有兩部分,一是欄目導航。用戶可以通過樹形欄目導航選擇類別后瀏覽數(shù)據(jù)庫中的所有資源。二是檢索結(jié)果。用戶可以在此頁面上進一步勾選檢索范圍或者進行二次檢索。三級詳情頁面可以完整顯示每條數(shù)據(jù)的詳細著錄信息,同時可以方便快捷地在相鄰或相似數(shù)據(jù)之間進行切換。此外,檢索界面應包括簡單檢索和高級檢索,高級檢索可實現(xiàn)組合檢索和專業(yè)檢索,同時支持模糊與精確匹配。
(2)數(shù)據(jù)資源的獲取與權(quán)限控制機制。由于檔案有密級這一特殊性,檔案的查閱、瀏覽和獲取就需要進行專門的限制和控制。對于機密檔案,只有獲得特殊許可后才可在內(nèi)部查閱,禁止對外傳播。此類檔案在前臺網(wǎng)站上只能查到檔號和題名,沒有其他信息。用戶可以根據(jù)檔號到檔案館申請,檔案館通過管理員賬號登錄之后幫用戶查閱相關(guān)檔案。比如重要部門的內(nèi)部會議影像記錄等。對于限制檔案。根據(jù)查閱到的檔案題名等信息,用戶通過實名注冊后可以向管理員在線申請,經(jīng)管理員同意后臨時開通該用戶對該檔案的利用權(quán)限,在一定時段內(nèi)在線瀏覽檔案原件信息,但不能下載和傳播。比如涉及個人隱私的檔案。對于普通檔案。任何人通過網(wǎng)絡都可以檢索到檔案的基本信息,但如果要下載全文,需通過實名登錄和認證。對于公開檔案。任何人在任何時間地點都可以通過網(wǎng)絡查閱、下載和傳播。比如公開的宣傳片和新聞報道等。
2、后臺管理系統(tǒng)的模塊和功能
(1)檔案資源管理模塊。資源管理模塊主要是實現(xiàn)管理員對數(shù)據(jù)資源的有效管理。一是數(shù)據(jù)管理功能。實現(xiàn)單條數(shù)據(jù)的增、刪、改、查以及批量數(shù)據(jù)的規(guī)范性檢查與入庫。二是資源體系管理功能。把數(shù)據(jù)庫的資源體系結(jié)構(gòu)通過樹形目錄進行管理,可以針對各類型和層級的資源分別設置需要的屬性、功能和權(quán)限。三是內(nèi)容審核功能。用戶可以通過網(wǎng)站為數(shù)據(jù)庫新增資源,但增加的資源需要經(jīng)過審核后才能進入數(shù)據(jù)庫。四是推薦管理功能。該功能可以對特定用戶發(fā)送推送信息,也可以對網(wǎng)站的推送欄目進行設置。五是字段管理功能??蓪崿F(xiàn)各類型資源的字段模板、元數(shù)據(jù)、著錄規(guī)范的修改,對每個字段內(nèi)容和屬性進行設置。
(2)網(wǎng)站和用戶的管理模塊。該模塊主要是實現(xiàn)管理員對網(wǎng)站和用戶的有效管理。一是頁面管理功能。實現(xiàn)更改前臺網(wǎng)站的頁面布局,更換各類元素,改動欄目導航,切換主題等操作。二是用戶管理功能。實現(xiàn)用戶賬號密碼的管理以及用戶級別、用戶組、用戶收藏、用戶角色的管理。三是消息管理功能。實現(xiàn)對各類通知、廣播、系統(tǒng)和管理員消息以及用戶基本信息、留言和評論的管理。四是權(quán)限管理功能。權(quán)限管理分為三類,第一類通過IP或賬號控制每條資源的編輯、修改和增刪權(quán)限,同時也可以控制后臺瀏覽某個欄目、某類資源、某個子庫的權(quán)限。第二類主要是控制前臺網(wǎng)站各級頁面和每條數(shù)據(jù)的訪問、檢索、瀏覽和下載的權(quán)限以及元數(shù)據(jù)信息顯示的詳細程度。第三類是賬號權(quán)限控制。通過設置賬號級別控制每個賬號在前后臺可以操作的功能和享有的權(quán)限。
(3)系統(tǒng)和數(shù)據(jù)庫管理模塊。該模塊主要是實現(xiàn)管理員對系統(tǒng)和設備的有效管理。一是數(shù)據(jù)統(tǒng)計和分析功能。通過該功能可以進一步開發(fā)和挖掘檔案資源的潛在價值。具體功能包括日志管理,資源結(jié)構(gòu)數(shù)據(jù)、平臺應用數(shù)據(jù)和用戶行為數(shù)據(jù)的分析,這些數(shù)據(jù)是開展大數(shù)據(jù)開發(fā)應用的基礎(chǔ)資源。二是數(shù)據(jù)庫管理功能。管理建庫的基本信息,包括數(shù)據(jù)字典、數(shù)據(jù)庫配置、模板、備份等功能。三是系統(tǒng)參數(shù)設置功能。該功能主要是對系統(tǒng)軟硬件參數(shù)進行設置以及對終端設備進行管理。包括服務器管理、系統(tǒng)工具、系統(tǒng)維護、安全中心等功能。
精準扶貧數(shù)碼照片音視頻檔案專題數(shù)據(jù)庫應用平臺建成后,其優(yōu)化、維護和更新是一項長期的工作。應強化數(shù)據(jù)庫應用平臺的安全意識,采取必要的措施保障數(shù)據(jù)安全,及時排除數(shù)據(jù)庫運行過程過中的硬件故障、網(wǎng)絡故障、系統(tǒng)故障和應用故障。各級檔案館應事先制定機房應急預案,按照預防為主、快速反應、分級負責、以人為本、常備不懈的原則進行處理。通過互聯(lián)網(wǎng)和專題數(shù)據(jù)庫應用平臺管理和利用精準扶貧數(shù)碼照片音視頻檔案,將永久記錄脫貧攻堅偉大歷程,充分展示人類歷史的跨越式發(fā)展,豐富國家記憶的新時代內(nèi)涵,夯實鄉(xiāng)村振興的工作基礎(chǔ)。
*本文系2020年云南省省級黨群系統(tǒng)決策咨詢課題“云南精準扶貧數(shù)碼照片音視頻檔案專題數(shù)據(jù)庫建設與應用方法研究”的階段性研究成果。
參考文獻:
[1]陳鳳麗.檔案編研的新形式:計算機專題數(shù)據(jù)庫[J].北京檔案,2000(11):24-25.
[2]周長華.高校檔案專題數(shù)據(jù)庫建設的理念及方法[J].揚州大學學報(高教研究版),2003(03):56-57.
[3]孫遜.對檔案專題數(shù)據(jù)庫建設的思考[J].檔案管理,2009(03):23-24.
[4]劉永祥,周榮.高等學校檔案專題數(shù)據(jù)庫平臺建設研究——以昆明理工大學檔案專題數(shù)據(jù)庫平臺建設為例[J].云南檔案,2012(12):56-58.
[5]劉彩云,蔡娜.網(wǎng)絡環(huán)境下數(shù)字檔案跨資源共建共享——以汶川地震文獻專題數(shù)據(jù)庫建設為例[J].山西檔案,2015(04):73-76.
[6]趙鑫強,方路.新型冠狀病毒疫情檔案專題數(shù)據(jù)庫建設初探[J].檔案管理,2020(05):56-57.
[7]李蓉.基于成渝地區(qū)雙城經(jīng)濟圈構(gòu)建檔案專題數(shù)據(jù)庫的構(gòu)想[J].四川檔案,2020(05):32-34.
[8]高建輝,邱志鵬.少數(shù)民族文獻信息資源特色數(shù)據(jù)庫應用平臺的分析與設計[J].圖書館學研究,2020(14):49-56.
[9]孔曉.軟件工程中的常用軟件生命周期模型[J].電子技術(shù)與軟件工程,2017(14):58.
[10]張嚴心.信息化背景下高校電子文件管理的前端控制[J].無線互聯(lián)科技,2021,18(01):95-96.
作者單位:楚雄師范學院