常大偉 溫芳芳
[摘要]基于信息融合的檔案知識服務,是借助信息融合的理念和技術,對檔案信息資源、用戶需求信息等進行綜合處理與協同利用,推動檔案信息資源在數據層面的關聯和知識層面的重構,實現面向用戶需求的檔案知識發(fā)現和知識服務的過程。論文構建了由一個目標、兩種資源、三個模塊、四個環(huán)節(jié)構成的基于信息融合的檔案知識服務框架,并從多源信息獲取、信息綜合處理、信息融合和檔案知識服務方面,探討了基于信息融合的檔案知識服務實現流程。
[關鍵詞]檔案服務知識服務檔案信息資源信息融合用戶需求
[分類號]G270
The Research on Archives Knowledge Service Based on Information Fusion
Chang Dawei, Wen Fangfang
(School of Information Management of Wuhan University, Wuhan, Hebei, 430072)
Abstract: Archives knowledge service based on information fusion is a process of realizing useroriented archives knowledge discovery and knowledge service. It relies on information fusion ideas and technologies to synthesize, cooperate archives information resources and user demands, promote association of archives information resources at the data layer and its reconstruction at the knowledge level. This paper constructed a framework of archives knowledge service consisting one goal, two kinds of resources, three modules and four links, discussed flow chart of it from the aspect of multisource information acquiring, information synthesizing, information integration and archives knowledge service.
Keywords: Archive Service;Archives Knowledge Service;Archive Information Resources;Infor? mation Fusion
服務是檔案工作的生命線,也是檔案工作的出發(fā)點和落腳點[1]。2016年,《全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》出臺,要求到2020年“檔案利用服務模式創(chuàng)新和檔案信息開放取得實質性進展;檔案信息整合共享程度明顯提升,檔案利用服務更加便捷普惠,方便人民群眾的檔案利用體系更加完善”[2],進一步明確了檔案服務工作的目標和要求。在此背景下,如何通過檔案服務理念創(chuàng)新、服務手段優(yōu)化和服務模式變革,推動檔案服務內容由實體服務向數字化服務發(fā)展,服務職能由行政服務向社會化服務過渡,服務模式由信息服務向知識服務轉型[3],就成為檔案界需要重點關注的內容之一。鑒于此,本文以檔案知識服務為主線,以信息融合為切入點,在明晰基于信息融合的檔案知識服務內涵的基礎上,構建了基于信息融合的檔案知識服務的理論框架,探討了基于信息融合的檔案知識服務的實現流程,以期推動檔案知識服務的實踐應用。
1基于信息融合的檔案知識服務的提出
信息融合是綜合利用多種信息處理技術,對多源信息資源進行加工和協同利用,使不同形式的信息相互補充,以獲得對同一事物或目標更客觀、更本質認識的過程[4]。信息融合借助加權平均法、卡爾曼濾波、貝葉斯估計法和基于神經網絡、模糊邏輯、距離熵、隨機理論等融合算法,在聚類分析、數據關聯、本體構建、語義分析、數據挖掘等技術的支持下,對多源、多模態(tài)信息進行綜合處理,將大量多源、異構、動態(tài)、碎片化、不確定及稀疏的數據源、信息源、知識源相融合,挖掘出隱含的、有價值的、尚未被發(fā)現的新知識[5]。信息融合在多源信息處理和深層知識發(fā)現方面具有一定的優(yōu)勢,已被廣泛應用于農業(yè)知識服務、數字參考咨詢知識融合、集群知識融合與創(chuàng)新、知識庫構建等具體領域。
結合信息融合與檔案知識服務的相關理論,筆者認為基于信息融合的檔案知識服務,是借助信息融合的理念和技術,對檔案信息資源、用戶需求信息等進行綜合處理與協同利用,推動檔案信息資源在數據層面的關聯和知識層面的重構,實現面向用戶需求的檔案知識發(fā)現和知識服務的過程。具體來講,基于信息融合的檔案知識服務,首先借助信息整合、信息聚類、關聯分析等信息融合技術,對多源異構的檔案信息資源進行協同開發(fā),挖掘和發(fā)現其蘊含的知識要素,形成檔案知識空間,實現檔案信息資源的融合;其次,對分散多元的用戶需求信息進行獲取、組織和分析,構建用戶需求模型,揭示用戶檔案知識需求的特征、偏好和趨勢等,實現用戶需求信息的融合;最后,將基于檔案信息資源融合的檔案知識空間和基于用戶需求信息融合的用戶需求模型進行匹配,實現檔案知識服務的應用融合,推動面向需求的檔案知識服務的發(fā)展。
2基于信息融合的檔案知識服務的框架構建
檔案知識服務的實質是通過采集、整合、挖掘檔案信息資源,為用戶提供知識內容和問題解決方案[6]??梢钥闯?,檔案知識服務主要由檔案知識發(fā)現、用戶需求揭示和檔案知識服務提供三個核心要素組成。據此,本文構建了由一個目標(檔案知識服務)、兩種資源(檔案信息資源和用戶需求信息)、三個模塊(檔案信息資源融合、用戶需求信息融合和檔案知識服務應用融合)、四個環(huán)節(jié)(多源信息獲取、信息綜合處理、信息融合和檔案知識服務)構成的基于信息融合的檔案知識服務框架。
其中,檔案信息資源是檔案知識發(fā)現的資源基礎,代表著檔案知識服務的資源供給;用戶需求信息是知識需求揭示的重要依據,代表著檔案知識服務的社會需求;檔案信息資源融合是對檔案信息資源的再組織,是檔案知識發(fā)現的重要手段,其結果是形成檔案知識空間;用戶需求信息融合是對用戶需求信息進行綜合處理,揭示用戶的檔案知識需求,其結果是形成用戶需求模型;檔案知識服務應用融合是在檔案信息資源融合和用戶需求信息融合的基礎上,以社會需求為導向、以資源供給為基礎、以實際應用為依據進行的二次融合,其結果是形成檔案知識內容和問題解決方案;多源信息獲取、信息綜合處理、信息融合、檔案知識服務四個環(huán)節(jié),是基于信息融合的檔案知識服務實現的具體流程;檔案知識服務是整個框架的出發(fā)點和落腳點,通過一定的方式將檔案知識服務應用融合形成的檔案知識內容和問題解決方案提供給檔案用戶,滿足檔案用戶的知識需求。如圖1所示。
3基于信息融合的檔案知識服務的實現流程
圍繞多源信息獲取、信息綜合處理、信息融合和檔案知識服務四個環(huán)節(jié),從檔案信息資源獲取、用戶需求信息獲取、檔案信息資源綜合處理、用戶需求信息綜合處理、檔案信息資源融合、用戶需求信息融合、檔案知識服務應用融合、檔案知識服務八個方面,詳細解析基于信息融合的檔案知識服務的實現流程。
3.1多源信息獲取
(1)檔案信息資源獲取
在基于信息融合的檔案知識服務中,檔案信息資源獲取就是結合我國檔案事業(yè)體制條塊分割的現狀和檔案信息資源存在形態(tài)的發(fā)展趨勢,通過機制體制的設計、技術方法的應用等多種方式,對多源異構的檔案信息資源進行匯集,形成檔案信息資源集合。為增強多源異構檔案信息資源的獲取能力,首先要加強國家數字檔案資源整合與服務機制的頂層設計,建立由“國家數字檔案資源調查方案、整合模式、服務機制、保障體系”所組成的、具有普適性的國家數字檔案資源整合與服務的框架[7],推動館際合作視閾下的檔案信息資源整合,構建檔案信息資源跨機構獲取的路徑[8];其次,拓展檔案信息資源獲取的資源范圍,加強網站、社交媒體等生成的新媒體文件的歸檔和整理工作;再次,推動檔案信息資源獲取和整合的技術研究,探索元數據技術、跨庫存取技術、數據庫整合技術等在檔案信息資源整合中的應用;最后,在檔案信息資源的獲取過程中,還應該考慮到檔案信息資源的知識產權和信息安全保護等內容。
(2)用戶需求信息獲取
網絡環(huán)境下檔案用戶的活動空間、分布特征及利用需求都發(fā)生了極大的變化。檔案用戶的泛在性及需求的多元性[9],增加了檔案機構進行用戶需求信息獲取、用戶需求研究和檔案知識服務的難度。根據檔案知識服務對象性質的不同,檔案知識服務可大致劃分為面向黨政機構和面向社會公眾兩種類型。從目前檔案知識服務的實際來看,面向黨政機構的檔案知識服務占據主導地位,面向社會公眾的檔案知識服務處于從屬地位,但對于社會公眾檔案知識服務的潛在需求也需要給予重視。為黨政機構提供檔案知識服務是檔案機構工作的重要內容,在長期的檔案知識服務過程中形成了關于黨政機構檔案知識需求的系統信息記錄,可將這一部分需求信息進行收集、整理、開發(fā)和存儲,構建檔案需求信息數據庫;而社會公眾的檔案知識需求,表現得較為零碎和分散,這一部分檔案需求信息的獲取難度較大,但可通過收集用戶在檔案服務平臺上的檢索記錄和瀏覽足跡等信息,開展檔案用戶需求調查、鼓勵用戶利用社交媒體進行檔案需求表達等方式,獲取社會公眾的相關需求信息,并將其補充到前述檔案需求信息數據庫中。需要注意的是,檔案用戶知識需求信息的獲取是一個動態(tài)持續(xù)的過程,需要在提供檔案知識服務的同時不斷收集和整理新的需求信息,為構建用戶需求模型提供條件。
3.2信息綜合處理
(1)檔案信息資源綜合處理
檔案信息資源綜合處理的目的,是為檔案信息資源融合以及檔案知識管理系統、檔案知識庫等檔案知識空間的構建,提供有序化、綜合性的信息資源。檔案信息資源綜合處理就需要針對檔案信息資源多源、多結構、多模態(tài)等特點,利用數據歸一、數據映射、異構數據加權、數據過濾等方式對檔案信息資源進行數據預處理,規(guī)范檔案信息資源的描述和組織方式;通過關聯揭示、領域本體構建和語義標注等,建立檔案信息資源底層特征與高層語義之間的映射關系,形成新的具有多重關聯的信息集合。通過檔案信息資源的綜合處理,推動信息資源從淺層次的信息組織向深層次的知識化組織轉向,從單維的、孤立的、不成體系的信息資源集合向多維的、內容關聯的、系統化的知識空間轉變[10],為檔案信息資源融合的實現提供支持。
(2)用戶需求信息綜合處理
用戶需求信息綜合處理的目的,是對用戶需求信息的特征進行抽取、組織和關聯,構建用戶需求模型。首先,在用戶需求信息獲取和預處理的基礎上,識別和分析能夠反映用戶需求的信息,如檔案用戶類型、檔案利用頻次、利用時段、利用主題、利用內容、利用領域等,抽取具有典型特征的關鍵詞或主題詞,構建基于檔案用戶信息需求的領域詞典;其次,將前文構建的檔案需求信息數據庫或用戶檢索記錄文本等,與基于檔案用戶信息需求的領域詞典進行匹配,提取用戶需求特征,構建用戶需求特征向量空間;最后,在用戶需求特征向量空間構建的基礎上,進一步對用戶需求特征進行聚類和分析,揭示檔案用戶知識需求的深層次規(guī)律和利用需求的整體發(fā)展特點與趨勢。
3.3信息融合
(1)檔案信息資源融合
經過對檔案信息資源的綜合處理,已經初步形成檔案知識化利用的資源支撐體系。在檔案信息融合階段,更加注重利用多種信息技術對檔案信息資源進行多方面、多層次的綜合處理,促進檔案信息資源的協同利用、知識重構和知識發(fā)現。在協同利用方面,圍繞特定的檔案知識服務內容,通過檔案信息資源的聚類和關聯,實現多源檔案信息資源的相互補充和印證,提高檔案知識挖掘和服務的精確性與完整性;在知識重構方面,利用聚類分析、知識關聯、知識聚合等方法,對在內容、特征、屬性等方面具有關聯關系的檔案信息資源進行知識化組織,形成圍繞服務主題的各類檔案知識類型和檔案知識網絡;在知識發(fā)現方面,借助數據挖掘、語義分析等信息技術,挖掘檔案信息資源蘊含的深層次的知識因子和價值要素,構建檔案知識空間。
(2)用戶需求信息融合
用戶需求信息融合在信息融合思想和信息處理流程方面,與檔案信息資源融合具有很大的一致性,相關技術處理手段就不再累述。相對而言,用戶需求信息融合的側重點主要集中在如何在用戶需求特征向量空間的支持下,準確地抽取和揭示用戶需求的內容、特點等信息,并通過用戶需求信息的組織和建模,構建能夠反映用戶需求主題、需求層次、需求領域等的用戶需求模型。用戶需求模型是有效開展檔案知識服務的重要依據,可以為檔案知識服務方案的制定和策略的實施提供指引,改善當前檔案知識服務目標不明確、內容不清晰的狀況。
(3)檔案知識服務應用融合
在一定的規(guī)則支持下,通過檔案知識空間與用戶需求模型的對接和匹配,建立起檔案知識與用戶需求的數據關聯,并圍繞用戶需求進行檔案知識要素的抽取、聚類、挖掘和知識方案的生成,實現檔案知識服務的應用融合,進而實現了用戶需求引導下的檔案知識開發(fā)與服務,推動了檔案用戶需求與檔案信息資源供給之間的良性互動,提升檔案知識服務的效能。
3.4檔案知識服務
通過信息融合,檔案信息資源在數據層面改變了以往相互孤立的狀態(tài),在知識層面形成了較為完整的檔案知識體系,為檔案知識服務的開展提供了更為充分的條件。這就需要進一步創(chuàng)新檔案知識服務的模式,優(yōu)化檔案知識服務的內容,完善檔案知識服務的策略,以提升檔案知識服務能力。在檔案知識服務模式創(chuàng)新方面,目前已經形成了基于新興技術的個性化檔案知識服務模式、基于內容管理與開發(fā)的檔案知識服務模式、基于流程優(yōu)化的全方位檔案知識服務模式和依托管理機制的檔案知識服務模式等四種模式[11],為基于信息融合的檔案知識服務模式的創(chuàng)新提供了重要借鑒。這就要求在綜合分析不同模式優(yōu)缺點和適用性的基礎上,結合具體的需求環(huán)境和服務場景,探索基于信息融合的檔案知識服務的應用問題;在檔案知識服務內容優(yōu)化方面,可利用基于信息融合的檔案知識服務在檔案用戶需求與檔案信息資源融合方面的優(yōu)勢,根據用戶需求模型發(fā)掘出的常規(guī)性需求提供結構化檔案知識服務,也可以根據不同用戶的個性化需求提供即時性檔案知識服務;在檔案知識服務策略完善方面,通過構建檔案知識庫、檔案知識管理系統、檔案知識服務平臺等,提供檔案知識問答、檔案知識檢索、檔案知識導航、檔案知識推送等自助式檔案知識服務,或檔案知識制定、檔案知識決策支持等協助式檔案知識服務。
4總結
檔案知識服務是深化檔案服務內涵,提升檔案服務價值的重要方式。為推動檔案知識服務的發(fā)展,本文以信息融合為研究的切入點,在探討基于信息融合的檔案知識服務的內涵和研究的需求與條件的基礎上,構建了基于信息融合的檔案知識服務框架,并從多源信息獲取、信息綜合處理、信息融合和檔案知識服務方面重點探討了基于信息融合的檔案知識服務的實現流程。整體來講,目前基于信息融合的檔案知識服務在理論研究和技術實現方面尚處于探索階段,其實踐應用還面臨著一系列的問題。這就要求,一方面加強基于信息融合的檔案知識服務的理論研究,充分借鑒不同學科、不同領域的信息融合理論和方法,探索適合多源異構檔案信息資源融合的模式和策略;另一方面,強化信息技術在檔案知識服務中的應用創(chuàng)新,加大信息集成、多模態(tài)信息融合、本體構建、數據挖掘等技術在檔案信息資源融合與檔案知識服務中的應用研究。
參考文獻
[1]李明華.在全國檔案局長館長會議上的工作報告[J].中國檔案,2017(1):16-24.
[2]全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要[EB/OL].[2017-10-14](2016-04-07). http://www.saac.gov.cn/news/2016-04/07/content_136280.htm.
[3]周鑫,倪麗娟,陳媛媛.國內檔案服務研究進程探析[J].檔案學研究,2017(2):68-73.
[4]化柏林.多源信息融合方法研究[J].情報理論與實踐,2013(11):16-19.
[5]祝振媛,李廣建.“數據—信息—知識”整體視角下的知識融合初探——數據融合、信息融合、知識融合的關聯與比較[J].情報理論與實踐,2017(2):12-18.
[6]畢建新,鄭建明.用戶目標驅動的檔案知識服務模型研究[J].浙江檔案,2014(8): 16-19.
[7]孫俐麗,吳建華.關于國家數字檔案資源整合與服務機制頂層設計的初步思考[J].檔案學研究,2016(1):57-61.
[8]張衛(wèi)東,孫振嘉.館際合作視閾下我國檔案文化資源整合路徑研究[J].檔案學通訊,2017(4):63-67.
[9]張衛(wèi)東.基層化與網絡化:新環(huán)境下檔案用戶資源整合與培育策略[J].檔案學研究,2017(1):42-46.
[10]陳蘭杰,侯鵬娟.數字文獻資源關聯關系揭示方法研究[J].圖書館,2015(2):41-45.
[11]牛力,袁亞月,韓小汀.對檔案信息知識化利用的幾點思考[J].檔案學研究,2017(3):26-33.