顏丙通
(蘇州市職業(yè)大學(xué) 圖書(shū)館,江蘇 蘇州 215104)
在新發(fā)展理念的指引下,以滿(mǎn)足各類(lèi)用戶(hù)需求為中心,提供全面、系統(tǒng)的基本服務(wù)和特色化、精準(zhǔn)化的增值服務(wù)為目標(biāo)的“互聯(lián)網(wǎng)+檔案服務(wù)”正成為人們開(kāi)發(fā)與利用檔案的新模式并快速崛起。自2002年11月《全國(guó)檔案信息化建設(shè)實(shí)施綱要》實(shí)施起,全國(guó)檔案信息化建設(shè)先后經(jīng)歷了前期準(zhǔn)備、規(guī)劃布局、正式啟動(dòng)和全面實(shí)施四個(gè)重要階段。在此期間,檔案信息化建設(shè)在標(biāo)準(zhǔn)制定、應(yīng)用系統(tǒng)開(kāi)發(fā)、服務(wù)平臺(tái)搭建、資源建設(shè)和安全管理等方面都取得了較大的進(jìn)展,但同時(shí)也存在著資源共享度不高、線(xiàn)上事務(wù)辦理能力不足等突出問(wèn)題[1-2]。深究?jī)?nèi)因,檔案信息資源的融合水平低是導(dǎo)致這一現(xiàn)象的重要根源。
檔案應(yīng)用系統(tǒng)中的數(shù)據(jù)主要有三種形式:①結(jié)構(gòu)化數(shù)據(jù)。以關(guān)系型數(shù)據(jù)庫(kù)表示和存儲(chǔ)的二維形式數(shù)據(jù),如dBase、FoxPro、Oracle、Access、SQL Server等數(shù)據(jù)庫(kù)文件,通常包括DBF、DBA、MDB、NSF等格式。②半結(jié)構(gòu)化數(shù)據(jù)。介于結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)之間的一種數(shù)據(jù)類(lèi)型,以樹(shù)、圖形式表示和存儲(chǔ)的自描述數(shù)據(jù),如網(wǎng)頁(yè)、電子郵件等,通常包括XML、HTML、JSON等格式。③非結(jié)構(gòu)化數(shù)據(jù)。無(wú)固定結(jié)構(gòu)的數(shù)據(jù),如文檔、圖片、視頻、音頻等,通常包括TXT、DOC、XLS、PDF、TIFF、JPEG、BMP、AVI等格式[3]。
數(shù)據(jù)質(zhì)量是評(píng)價(jià)檔案信息資源融合水平的決定性因素。從數(shù)據(jù)管理的全流程分析,無(wú)論是檔案數(shù)據(jù)采集、著錄、導(dǎo)入、審核、校驗(yàn),還是整合、開(kāi)發(fā)、利用,都在一定程度上影響檔案系統(tǒng)的數(shù)據(jù)質(zhì)量。從實(shí)踐來(lái)看,檔案數(shù)據(jù)著錄不規(guī)范、電子文件證據(jù)價(jià)值難以認(rèn)定、檔案數(shù)字化副本質(zhì)量不高等問(wèn)題普遍存在,導(dǎo)致檔案數(shù)據(jù)質(zhì)量總體偏低,為檔案信息資源融合埋下了隱患。
數(shù)據(jù)的多源性與非均衡性,以及應(yīng)用系統(tǒng)中目錄數(shù)據(jù)庫(kù)結(jié)構(gòu)和數(shù)據(jù)交換格式的差異性,決定了檔案信息資源分布的離散化,主要表現(xiàn)為同一檔案應(yīng)用系統(tǒng)中數(shù)據(jù)間的分類(lèi)邏輯性不強(qiáng),跨平臺(tái)檔案應(yīng)用系統(tǒng)中數(shù)據(jù)間的內(nèi)容關(guān)聯(lián)度不高,檔案數(shù)據(jù)總體上呈現(xiàn)低耦合的“碎片化”分布。
數(shù)據(jù)的同質(zhì)化是檔案信息資源融合需要長(zhǎng)期克服的難點(diǎn)??陀^上,一方面國(guó)家對(duì)各類(lèi)型、載體的應(yīng)歸檔文件已有明確的業(yè)務(wù)規(guī)范和工作標(biāo)準(zhǔn),各立檔單位必須嚴(yán)格執(zhí)行并接受指導(dǎo)和監(jiān)督;另一方面現(xiàn)行的業(yè)務(wù)規(guī)范或工作標(biāo)準(zhǔn)間不乏相互重疊的歸檔內(nèi)容,如城建檔案館與建設(shè)單位的建設(shè)項(xiàng)目檔案館藏?cái)?shù)據(jù)重疊,不同立檔單位間相同內(nèi)容不同保管期限的檔案數(shù)據(jù)重疊等。主觀上,檔案工作者在工作能力、知識(shí)背景,以及對(duì)檔案業(yè)務(wù)的綜合把握能力上存在差異,歸檔后形成的數(shù)據(jù)出現(xiàn)不同程度的同質(zhì)化現(xiàn)象。
信息資源是檔案工作的生命線(xiàn),也是實(shí)現(xiàn)檔案信息資源融合的根基。檔案信息資源供給方應(yīng)切實(shí)鞏固和加強(qiáng)檔案信息資源的總體優(yōu)勢(shì),著眼于社會(huì)發(fā)展和用戶(hù)需求,以供給側(cè)結(jié)構(gòu)性改革為主線(xiàn),以資源建設(shè)為中心,強(qiáng)化職能定位,充分挖掘潛能,不斷創(chuàng)新工作方式和服務(wù)理念,從而為社會(huì)各方面提供多元化、精準(zhǔn)化的服務(wù),保持持久的生命力和競(jìng)爭(zhēng)優(yōu)勢(shì)。
信息化建設(shè)和資源開(kāi)發(fā)是檔案信息資源融合的關(guān)鍵技術(shù)路線(xiàn),其中質(zhì)量控制和數(shù)據(jù)挖掘是重中之重。一方面政府要圍繞檔案信息化、標(biāo)準(zhǔn)化和規(guī)范化建設(shè),統(tǒng)籌解決檔案信息資源的差異化分布;另一方面政府要開(kāi)展檔案信息資源規(guī)劃和數(shù)據(jù)挖掘,優(yōu)化資源分布圖譜,探索“大數(shù)據(jù)”背景下檔案信息資源智能索引與數(shù)字化開(kāi)發(fā)的可行路徑,提升檔案工作者對(duì)資源的整體認(rèn)識(shí)水平和綜合開(kāi)發(fā)能力。
集成管控和知識(shí)協(xié)同是實(shí)現(xiàn)檔案信息資源融合共享的必由之路。檔案信息資源融合應(yīng)以檔案應(yīng)用集成系統(tǒng)為基礎(chǔ)實(shí)現(xiàn)資源的集成管控,借助分布式信息交互網(wǎng)絡(luò)服務(wù)平臺(tái),面向用戶(hù)多元化、深層次需求,促進(jìn)檔案知識(shí)傳播與轉(zhuǎn)化,構(gòu)建“互聯(lián)網(wǎng)+”背景下檔案知識(shí)協(xié)同的立體化應(yīng)用場(chǎng)景,并加快由被動(dòng)型、“點(diǎn)到點(diǎn)”、線(xiàn)狀單維的信息服務(wù)向主動(dòng)型、“面到面”、立體多維的知識(shí)服務(wù)轉(zhuǎn)型升級(jí)。
根據(jù)總體目標(biāo)定位,本研究從數(shù)據(jù)質(zhì)量控制、信息資源規(guī)劃、系統(tǒng)集成管控、知識(shí)協(xié)同共享、安全風(fēng)險(xiǎn)防控五個(gè)方面對(duì)檔案信息資源融合進(jìn)行功能設(shè)計(jì)。檔案信息資源融合策略模型如圖1所示。
檔案信息資源的源頭質(zhì)量控制主要有以下五點(diǎn):一是加強(qiáng)電子文件的采集、傳輸、驗(yàn)證與存儲(chǔ)的管理,開(kāi)展存量與新增檔案資源的規(guī)范化數(shù)據(jù)著錄,做好入館數(shù)據(jù)的審核與質(zhì)量校驗(yàn);二是根據(jù)《數(shù)字檔案館建設(shè)指南》《企業(yè)數(shù)字檔案館(室)建設(shè)指南》等文件開(kāi)展規(guī)范化建設(shè),加快檔案信息化專(zhuān)項(xiàng)工作進(jìn)程;三是在信息化過(guò)程中,適時(shí)創(chuàng)建基于全文內(nèi)容識(shí)別技術(shù)的檔案信息資源基礎(chǔ)數(shù)據(jù)庫(kù),形成檔案“大數(shù)據(jù)”的資源支撐;四是在全國(guó)范圍內(nèi)統(tǒng)一目錄數(shù)據(jù)庫(kù)結(jié)構(gòu)和數(shù)據(jù)交換格式技術(shù)標(biāo)準(zhǔn),制訂數(shù)據(jù)異構(gòu)、低質(zhì)、離散、同質(zhì)背景下檔案信息資源質(zhì)量控制的系統(tǒng)解決方案;五是綜合運(yùn)用內(nèi)容評(píng)估法、上下文評(píng)估法、評(píng)分評(píng)估法[4],建立數(shù)據(jù)審核校驗(yàn)機(jī)制和質(zhì)量評(píng)估體系。
圖1 檔案信息資源融合策略模型
信息資源規(guī)劃(information resource planning,IRP)的目的是通過(guò)信息流的暢通和信息資源的高效利用,向用戶(hù)提供便捷、精準(zhǔn)的公共信息服務(wù),充分保障公民的文化權(quán)[5],而開(kāi)展深層次的信息挖掘是達(dá)成檔案信息資源規(guī)劃愿景的有效舉措。因此,檔案信息資源融合應(yīng)遵循客戶(hù)關(guān)系管理(customer relationship management,CRM)理念,以IRP為指引,借助數(shù)據(jù)挖掘技術(shù)創(chuàng)建“需求——資源”間的關(guān)聯(lián)對(duì)應(yīng)關(guān)系,具體可從以下兩方面著手:一是以信息化建設(shè)為抓手,深刻把握檔案信息資源的專(zhuān)業(yè)門(mén)類(lèi)、內(nèi)容成分、主題分布、檔案數(shù)量、價(jià)值形態(tài)等社會(huì)檔案館藏結(jié)構(gòu)特征,建立健全檔案信息資源基礎(chǔ)數(shù)據(jù)庫(kù);二是做好信息重構(gòu)與整合,引入語(yǔ)義網(wǎng)、決策樹(shù)、神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)挖掘技術(shù)[6],創(chuàng)建資源間的邏輯關(guān)聯(lián)和路徑指引,開(kāi)展主題、專(zhuān)題、特色等檔案信息資源庫(kù)建設(shè),形成網(wǎng)絡(luò)化、分布式的資源分布圖譜,有效地解決資源的差異性和非均衡性,削弱“資源稟賦”帶來(lái)的數(shù)據(jù)孤立、信息遲滯、運(yùn)轉(zhuǎn)低效等弊端。
系統(tǒng)集成的基本原理是在信息系統(tǒng)之間建立數(shù)據(jù)通道,實(shí)現(xiàn)不同信息系統(tǒng)之間的數(shù)據(jù)調(diào)用和相關(guān)數(shù)據(jù)同步[7]。檔案應(yīng)用系統(tǒng)集成平臺(tái)通過(guò)業(yè)務(wù)流程重組、技術(shù)支撐架構(gòu)、標(biāo)準(zhǔn)規(guī)范設(shè)計(jì)、管理運(yùn)維措施,促進(jìn)檔案應(yīng)用系統(tǒng)的集成管控,實(shí)現(xiàn)跨平臺(tái)、跨系統(tǒng)的檔案信息資源互通。檔案應(yīng)用系統(tǒng)集成管控圖如圖2所示。
由圖2可知,檔案應(yīng)用系統(tǒng)集成平臺(tái)可分為四個(gè)單元:①業(yè)務(wù)流程重組單元。該單元以用戶(hù)需求為中心,分析梳理檔案應(yīng)用系統(tǒng)內(nèi)各類(lèi)資源支持的業(yè)務(wù)功能(職能),開(kāi)展流程抽取和流程聚類(lèi),通過(guò)各業(yè)務(wù)流程間和流程內(nèi)部的緊密協(xié)作,對(duì)面向線(xiàn)狀單維的“點(diǎn)到點(diǎn)”單一功能需求與服務(wù)模式進(jìn)行重新設(shè)計(jì),以立體多維的“面到面”多元化功能需求與服務(wù)模式為導(dǎo)向,實(shí)施流程重組與優(yōu)化。②技術(shù)支撐架構(gòu)單元。該單元明確需求用戶(hù)、利用服務(wù)、業(yè)務(wù)模塊、流程集成、數(shù)據(jù)管理等子系統(tǒng)的技術(shù)實(shí)施方案和技術(shù)指標(biāo)體系。③標(biāo)準(zhǔn)規(guī)范設(shè)計(jì)單元。該單元以檔案應(yīng)用系統(tǒng)中的信息資源為對(duì)象,明確數(shù)據(jù)模型、數(shù)據(jù)格式、數(shù)據(jù)類(lèi)型、數(shù)據(jù)字段、數(shù)據(jù)接口的通用規(guī)則和方法,制定基于全國(guó)統(tǒng)一的目錄數(shù)據(jù)庫(kù)結(jié)構(gòu)和數(shù)據(jù)交換格式標(biāo)準(zhǔn)。④管理運(yùn)維措施單元。該單元統(tǒng)籌建立檔案應(yīng)用系統(tǒng)集成平臺(tái)的管理機(jī)制、運(yùn)行機(jī)制和維護(hù)機(jī)制。
圖2 檔案應(yīng)用系統(tǒng)集成管控圖
深化“放管服”,推進(jìn)知識(shí)協(xié)同可從以下三方面著手:一是管理上要求各參與方理順職能分工,明確崗位權(quán)責(zé),優(yōu)化工作流程;二是業(yè)務(wù)上要求檔案工作者做好信息資源的保管、開(kāi)發(fā)等工作;三是服務(wù)上要求借助檔案“大數(shù)據(jù)”和云平臺(tái)建設(shè),推進(jìn)專(zhuān)題、特色、主題、定題等檔案知識(shí)庫(kù)建設(shè),以資源智能化匹配用戶(hù)精準(zhǔn)需求為技術(shù)手段,以服務(wù)滿(mǎn)意度提升為績(jī)效導(dǎo)向,構(gòu)建基于信息感知、網(wǎng)絡(luò)傳輸、服務(wù)交互的智慧檔案館[8]。
信息資源及其應(yīng)用系統(tǒng)的安全運(yùn)行是實(shí)現(xiàn)檔案信息資源融合共享的重要保障。防范安全風(fēng)險(xiǎn)的主要措施如下:①建立健全信息安全管理制度,規(guī)劃實(shí)施信息安全技術(shù)保障,完善信息安全基礎(chǔ)設(shè)施;②加強(qiáng)檔案信息化和電子文件安全管理制度建設(shè),對(duì)照信息安全等級(jí)保護(hù)的相關(guān)要求[9],從物理安全、技術(shù)安全、管理安全出發(fā),采用相應(yīng)的安全保障技術(shù)方法(容災(zāi)備份、數(shù)據(jù)加密、權(quán)限控制等)[10];③配備必要的安全運(yùn)行設(shè)施,全方位保障電子文件在捕獲、存儲(chǔ)、加工、保管和開(kāi)發(fā)過(guò)程中檔案信息資源的真實(shí)性、完整性和可靠性。
檔案信息資源來(lái)源的多向性、質(zhì)量的規(guī)范性、規(guī)劃的科學(xué)性、挖掘的精準(zhǔn)性、整合的復(fù)雜性、系統(tǒng)集成的交互性、運(yùn)行的安全性等因素給資源融合工作帶來(lái)了嚴(yán)峻挑戰(zhàn),這就要求檔案工作者全方位提升自身能力,更多承擔(dān)信息管理員、審核員、規(guī)劃師和知識(shí)提供者的時(shí)代職責(zé)。同時(shí),隨著“智慧城市”“智慧政府”概念的提出[11],檔案人員要搶抓機(jī)遇、勇立潮頭、敢于擔(dān)當(dāng),為促進(jìn)政府綜合信息服務(wù)能力提升貢獻(xiàn)“檔案智慧”。
蘇州市職業(yè)大學(xué)學(xué)報(bào)2020年4期