安艷茹
摘 要:隨著計算機技術(shù)、網(wǎng)絡技術(shù)以及存儲技術(shù)的飛速發(fā)展,公司的信息資源也在日益增加,眾多種類的信息資源都是以一種零散的、孤立的狀態(tài)存在著,相互之間缺乏聯(lián)系。針對公司目前多數(shù)IT 系統(tǒng)的信息資源管理分散,數(shù)據(jù)資源難于被訪問和共享,服務只具備簡單數(shù)據(jù)查詢且資源定位能力薄弱的現(xiàn)狀,對現(xiàn)有信息服務模式進行了分析,提出了基于信息資源整合和統(tǒng)一搜索模型,實現(xiàn)資源的跨庫檢索、統(tǒng)一顯示和二次檢索等功能來解決目前公司數(shù)據(jù)檢索中遇到的種種困難。
關(guān)鍵詞:信息服務 資源整合 統(tǒng)一搜索 信息資源
中圖分類號:G25 文獻標識碼:A 文章編號:1674-098X(2014)12(c)-0242-01
公司經(jīng)過多年的信息化建設、創(chuàng)新造就了大批類型多樣化、分布異構(gòu)化的應用系統(tǒng),這些應用系統(tǒng)的信息資源管理分散、共享困難,形成彼此隔離的信息孤島。如何集成、組織和管理眾多應用系統(tǒng)的數(shù)字資源,統(tǒng)一各個資源的信息格式,屏蔽分布的各系統(tǒng)間的差別,為用戶提供快速并發(fā)的跨庫檢索服務,是公司信息化建設亟待解決的問題。
1 設計思路
目前公司內(nèi)部已經(jīng)形成了多個業(yè)務系統(tǒng),包括OA系統(tǒng)、ERP系統(tǒng)、PDM系統(tǒng)、MES系統(tǒng)等,各業(yè)務系統(tǒng)之間在應用或數(shù)據(jù)等層面上是彼此分離的,它們分別采用了不同的數(shù)據(jù)庫系統(tǒng)以及使用了不同的應用開發(fā)技術(shù),各系統(tǒng)的業(yè)務邏輯不同且在建設上沒有遵循統(tǒng)一的標準。因此,首先要實現(xiàn)信息整合,需要靈活高效地從各個應用系統(tǒng)中抽取數(shù)據(jù),填充數(shù)據(jù),并使之與應用系統(tǒng)同步,完成其數(shù)據(jù)集成,其中采用的重要技術(shù)是ETL,即數(shù)據(jù)的抽取、轉(zhuǎn)換和加載可以在數(shù)據(jù)集成的過程中保證數(shù)據(jù)的一致、解決數(shù)據(jù)沖突、進行有效的元數(shù)據(jù)管理等一系列問題。其次建立統(tǒng)一檢索平臺,對不同應用系統(tǒng)數(shù)據(jù)源的整合,實現(xiàn)跨平臺的無縫鏈接,用戶只需一個檢索指令,在一個統(tǒng)一的界面上一次查詢所需信息,將不同類型、不同結(jié)構(gòu)、不同環(huán)境、不同用法的各類數(shù)據(jù)庫納入統(tǒng)一檢索系統(tǒng),使用戶能方便、高效地獲取所需信息。
2 實現(xiàn)方案
使用人員在搜索信息時,不僅希望能夠找到信息,而且能從豐富多樣的信息中迅速找出所需要的信息。從這一點考慮,統(tǒng)一檢索系統(tǒng)不僅要有廣泛的信息內(nèi)容,而且這些內(nèi)容是經(jīng)過組織、篩選后選擇出來的對用戶需求價值高的信息,這樣才能保障提供有效的信息檢索服務。具體信息資源整合與統(tǒng)一檢索平臺模型如圖1所示。
(1)數(shù)據(jù)層。
我公司是科研、生產(chǎn)一體化的大型制造企業(yè),擁有數(shù)量繁多的各類應用系統(tǒng),特別是在PDM、MES、門戶、OA等系統(tǒng)中蘊含數(shù)量巨大的專業(yè)文檔、數(shù)模文件、管理規(guī)定等海量數(shù)據(jù)。通過建立底層數(shù)據(jù)交換平臺來聯(lián)系橫貫整個企業(yè)的異構(gòu)系統(tǒng)、應用、數(shù)據(jù)源等,完成企業(yè)內(nèi)部系統(tǒng)之間數(shù)據(jù)無縫共享和交換的需要。
(2)數(shù)據(jù)整合層。
數(shù)據(jù)整合是企業(yè)應用集成的重要環(huán)節(jié),ETL負責將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù),如關(guān)系數(shù)據(jù)、數(shù)據(jù)文件等抽取到臨時中間層后進行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉庫或數(shù)據(jù)集中,成為聯(lián)機分析處理、數(shù)據(jù)挖掘的基礎。這樣可以使更多的人更充分地使用已有數(shù)據(jù)資源,減少資料收集、數(shù)據(jù)采集等重復勞動和相應費用,從而滿足用戶提取和轉(zhuǎn)換大量數(shù)據(jù)的需要。
(3)業(yè)務層。
業(yè)務層通過采集和索引子系統(tǒng)、信息加工處理子系統(tǒng)、個性化子系統(tǒng)、配置統(tǒng)計子系統(tǒng)等系統(tǒng)來提供業(yè)務信息集成服務。采集和索引子系統(tǒng)采用分布式異構(gòu)訪問技術(shù)和知識庫技術(shù),集成多種數(shù)據(jù)源驅(qū)動,可訪問任何一種半結(jié)構(gòu)化以及關(guān)系型數(shù)據(jù),從這些資源獲取信息內(nèi)容,并對所有內(nèi)容建立索引。信息加工處理子系統(tǒng)提供分析工具,這些工具不僅能分析數(shù)據(jù)庫數(shù)據(jù)還能分析現(xiàn)有的網(wǎng)頁信息,并將信息以易用的形式再現(xiàn)給用戶;個性化子系統(tǒng)提供先進的移動搜索方式,通過用戶名、密碼方式登錄來為信息用戶提供個性化服務,幫助用戶簡單準確直觀的獲取內(nèi)容和信息;配置統(tǒng)計子系統(tǒng)提供豐富的基于Web的管理界面,用于創(chuàng)建、配置和管理搜索集合,監(jiān)測和控制系統(tǒng)的組成部分,提供大多數(shù)數(shù)據(jù)資源的配置信息,用戶“按需索求”,在線自動更新資源配置信息,確保資源的有效訪問。
(4)表示層。
用戶搜索的體驗異常重要,要符合流行的Google,百度展現(xiàn)要求為展現(xiàn)基礎,以企業(yè)內(nèi)部應用為搜索界定范圍,以應用產(chǎn)生的業(yè)務數(shù)據(jù)為搜索目標,以企業(yè)的所有員工為搜索服務的提供對象。因此,要按橫跨企業(yè)內(nèi)部多業(yè)務域、多應用的核心級別項目來提供不同的展現(xiàn)模版供其調(diào)用。
3 結(jié)語
目前,公司信息化資源的飛速增長給用戶帶來了豐富的資源,但同時也給公司資源檢索系統(tǒng)提出了更高的要求。為提高用戶的檢索效率,提升信息化服務質(zhì)量,設計了信息資源整合與統(tǒng)一檢索平臺模型,提供系統(tǒng)的相應功能,能夠便捷的將各類信息呈現(xiàn)給各級用戶,改變了以往系統(tǒng)建設多年用戶缺乏體驗的情況。同時,這種信息服務模式降低了使用門檻,提高了操作友好度,解決了檢索效率低的問題。
參考文獻
[1] 樸巖,陳遠平,及俊川.基于統(tǒng)一搜索的信息服務平臺[J].計算機系統(tǒng)應用,2010,19(11):132-138.
[2] 王慶恒,馬自衛(wèi),李高虎.統(tǒng)一檢索服務關(guān)鍵技術(shù)的研究與實現(xiàn)[J].現(xiàn)代圖書情報技術(shù),2010,191(4):18-23.
[3] 張宏偉,齊明明.基于元數(shù)據(jù)倉儲的統(tǒng)一檢索系統(tǒng)研究[J].圖書館學刊,2014,36(9):19-21.endprint