楊佳星
摘 要:關(guān)聯(lián)數(shù)據(jù)是信息時代下信息技術(shù)以及數(shù)據(jù)處理技術(shù)解決組織、共享、管理與服務(wù)信息的最新延伸技術(shù)。企業(yè)檔案管理是企業(yè)管理中難度較高的一項管理工作,企業(yè)檔案信息整合是指根據(jù)企業(yè)檔案信息的特點,圍繞特定主題或?qū)ο?,將分散、異?gòu)、無序的檔案信息進(jìn)行組織整理的活動過程。通過企業(yè)檔案信息整合可以集中反映某一主題或?qū)ο蟮木唧w情況、發(fā)展趨勢等內(nèi)容,從而更好的為企業(yè)服務(wù)。文章通過SWOT分析法,分析了關(guān)聯(lián)數(shù)據(jù)技術(shù)在企業(yè)數(shù)字化檔案資源轉(zhuǎn)向數(shù)據(jù)化檔案資源整合應(yīng)用中的優(yōu)勢劣勢以及相應(yīng)的對策。
關(guān)鍵詞:關(guān)聯(lián)數(shù)據(jù)應(yīng)用;企業(yè)檔案信息;SWOT分析
1 企業(yè)檔案信息資源整合與關(guān)聯(lián)數(shù)據(jù)
1.1 企業(yè)檔案信息資源整合內(nèi)涵
企業(yè)檔案作為企業(yè)原始的真實的活動記錄,其內(nèi)容有著不可替代的價值。但檔案信息的價值是需要通過有序的收集、整理、加工才能得到體現(xiàn)的。傳統(tǒng)企業(yè)檔案管理模式通常是按照國家規(guī)定綱目進(jìn)行分類設(shè)定的,但傳統(tǒng)模式管理下的檔案,信息分散且個別有異構(gòu)的特點,使利用受限。
企業(yè)檔案信息整合服務(wù)指根據(jù)企業(yè)檔案信息的特點,圍繞特定主題或?qū)ο?,將分散、異?gòu)、無序的檔案信息進(jìn)行組織整理的工作。例如:在行政管理類檔案中開展整合專業(yè)技術(shù)職稱信息、公司人事任免信息、企業(yè)科技檔案項目成果等信息,為企業(yè)在職工職稱評定、職務(wù)晉升等工作中,方便快速地檢索出所需的檔案信息,能極大地簡化辦事流程,提高工作效率;又如:通過對同一主題科技檔案信息的整合收集,從而為以后同一類型的項目提供參考依據(jù)或為某一領(lǐng)域的研究與技術(shù)突破提供有效的數(shù)據(jù)支持。
可以說企業(yè)檔案信息整合是一項可以幫助企業(yè)提高檔案利用效率、提升企業(yè)檔案增值服務(wù)、有利于檔案信息資源共享、影響企業(yè)科學(xué)決策、增強(qiáng)企業(yè)競爭力的工作。
1.2 關(guān)聯(lián)數(shù)據(jù)定義、本質(zhì)及應(yīng)用
1.2.1 關(guān)聯(lián)數(shù)據(jù)定義
“關(guān)聯(lián)數(shù)據(jù)”是一種用來組織、發(fā)布和鏈接各類數(shù)據(jù)、信息和知識的方法,運用網(wǎng)絡(luò)技術(shù)、信息技術(shù)等全新數(shù)據(jù)處理技術(shù)對現(xiàn)有各類的資源進(jìn)行整合,使其在同一網(wǎng)絡(luò)基礎(chǔ)上構(gòu)建一張計算機(jī)可以理解的語義數(shù)據(jù)網(wǎng)絡(luò),使任何人都能夠準(zhǔn)確、高效、可靠地查找、利用這些相互關(guān)聯(lián)的信息與知識。
關(guān)聯(lián)數(shù)據(jù)繼承了Web技術(shù)中的超文本傳輸協(xié)議(HTTP)和統(tǒng)一資源定位符(URI),采用數(shù)據(jù)資源描述框架(RDF)來描述各類“資源”對象。RDF用統(tǒng)一資源標(biāo)識符(URI)標(biāo)識事物,用簡單的屬性及屬性值來描述資源并組合成為一個陳述(被稱為陳述的主體、謂詞和客體),即RDF三元組(RDF triples),可被用于表達(dá)任何可在Web上被標(biāo)識的事物的信息。此外,關(guān)聯(lián)數(shù)據(jù)采用SPARQL(Simple Pro-tocol and RDF Query Language)技術(shù)作為檢索查詢語言和數(shù)據(jù)獲取協(xié)議,它可以檢索任何用 RDF來表示的信息資源。
1.2.2 關(guān)聯(lián)數(shù)據(jù)本質(zhì)與應(yīng)用
關(guān)聯(lián)數(shù)據(jù)的本質(zhì)是通過定義“統(tǒng)一資源標(biāo)識符(URI)”規(guī)范,使用戶利用 HTTP 機(jī)制和 URI 機(jī)制獲取關(guān)聯(lián)化的數(shù)字信息資源,并打破封閉環(huán)境、減少數(shù)據(jù)冗余、形成關(guān)聯(lián)訪問,使信息資源關(guān)聯(lián)整合。關(guān)聯(lián)數(shù)據(jù)技術(shù)可以對不同類型的信息資源(如文件、圖片、音頻、視頻等)賦予相同標(biāo)準(zhǔn)規(guī)范的URI定位,這保證了數(shù)據(jù)資源的一致性,從而有機(jī)會打破數(shù)據(jù)壁壘與信息孤島;同時通過對不同類型信息資源的URI定位,還可以挖掘不同類型資源之間的隱性關(guān)系,實現(xiàn)同一主題或?qū)ο筚Y源的融合,形成信息關(guān)聯(lián),方便檢索利用;
我國對關(guān)聯(lián)數(shù)據(jù)在檔案管理中的應(yīng)用研究起步較晚,歐洲數(shù)據(jù)圖書館早在2008就通過OWL語言,對第一次世界大戰(zhàn)的相關(guān)檔案資料進(jìn)行了重新編譯以及資源整合,法國國家檔案管早在2011年就發(fā)布了敘詞表,并提供PDF格式的查詢服務(wù)。
2 關(guān)聯(lián)數(shù)據(jù)應(yīng)用于企業(yè)檔案信息資源整合中的SWOT分析
2.1 優(yōu)勢分析
1)關(guān)聯(lián)數(shù)據(jù)的優(yōu)勢。關(guān)聯(lián)數(shù)據(jù)的優(yōu)勢在于其數(shù)據(jù)信息的開放性與關(guān)聯(lián)性,隨著公開數(shù)據(jù)規(guī)模不斷擴(kuò)大,最終形成數(shù)據(jù)間的交互網(wǎng)絡(luò)??梢杂行Т蚱苽鹘y(tǒng)檔案管理中,不同分類檔案、異構(gòu)檔案之間的界限。對檔案資源整合有良好的促進(jìn)作用。
另外通過HTTP協(xié)議、URI定位可以對資源進(jìn)行更為準(zhǔn)確的定位,在傳統(tǒng)檔案管理模式下,同一主題檔案信息資源整合過程中,可能會涉及多種門類檔案,而在查詢中需要分別檢索所涉及門類檔案的信息,以獲取想要的信息資源。而基于關(guān)聯(lián)數(shù)據(jù)的檔案信息整合技術(shù),可以將查詢分解為只涉及單個檔案門類的查詢模式,現(xiàn)在階段在檔案資源整合工作主要分為收集、整理、分類、整合、利用五個主要環(huán)節(jié),在關(guān)聯(lián)數(shù)據(jù)的支持下,可以提高數(shù)據(jù)分析以及挖掘,實現(xiàn)數(shù)據(jù)的全程控制,充分滿足檔案資源整合的各項數(shù)據(jù)處理技術(shù)需求。
2)企業(yè)檔案自身的優(yōu)勢。企業(yè)檔案信息資源多為結(jié)構(gòu)化或半結(jié)構(gòu)化的信息資源,著錄格式與存儲格式也依照國家、公司有關(guān)規(guī)定執(zhí)行。因此據(jù)有格式的規(guī)范性,這有利于關(guān)聯(lián)數(shù)據(jù)的統(tǒng)一轉(zhuǎn)換與整合;此外企業(yè)檔案作為企業(yè)的原始真實的活動記錄,還具有憑證價值與情報價值;具有價值且規(guī)范性的企業(yè)檔案資源非常適合作為數(shù)據(jù)關(guān)聯(lián)中轉(zhuǎn)站,用于信息交換和語義互操作。
2.2 劣勢分析
1)檔案資源開放權(quán)限與閱讀權(quán)限。關(guān)聯(lián)數(shù)據(jù)在企業(yè)檔案信息資源整合中應(yīng)用的最大阻力是關(guān)聯(lián)數(shù)據(jù)主要針對公開性的開放數(shù)據(jù),而企業(yè)檔案資源數(shù)據(jù)中有許多數(shù)據(jù)是封閉性的非公開數(shù)據(jù),部分檔案資料屬于企業(yè)機(jī)密有著嚴(yán)格的獲取以及閱讀權(quán)限要求,導(dǎo)致存在矛盾,這也是關(guān)聯(lián)數(shù)據(jù)在企業(yè)檔案信息資源整合中的劣勢所在。封閉性的企業(yè)檔案資源沒有辦法利用關(guān)聯(lián)數(shù)據(jù)技術(shù)實現(xiàn)對應(yīng)的檔案資源整合。
2)企業(yè)檔案標(biāo)準(zhǔn)化程度低。由于企業(yè)檔案資源在不同的歷史時期所依據(jù)的著錄標(biāo)準(zhǔn)不同以及在企業(yè)不同歷史時期企業(yè)檔案信息的產(chǎn)生環(huán)節(jié)和產(chǎn)生渠道不同,導(dǎo)致檔案信息標(biāo)準(zhǔn)化程度低,標(biāo)準(zhǔn)化較低直接影響了檔案信息組織的質(zhì)量,導(dǎo)致資源之間的關(guān)聯(lián)和語義操作的實在出現(xiàn)障礙。
2.3 機(jī)遇分析
1)企業(yè)自身發(fā)展的需要。企業(yè)檔案信息資源整合有利于挖掘檔案信息資源,提高檔案利用效率;有利于檔案信息集成,實現(xiàn)檔案增值服務(wù);有利于檔案信息共享,增強(qiáng)企業(yè)競爭力。而關(guān)聯(lián)數(shù)據(jù)技術(shù)是實現(xiàn)企業(yè)檔案信息資源整合的一條可行之路。
2)存在可借鑒的實踐成果。目前國外已經(jīng)已經(jīng)開展了關(guān)聯(lián)數(shù)據(jù)應(yīng)用于檔案工作中的相關(guān)研究,如:Linking Lives是英國聯(lián)合信息系統(tǒng)委員會(JISC)資助的項目,用于將Archives Hub中的檔案資源關(guān)聯(lián)數(shù)據(jù)化。
國內(nèi)也開展了一系列的研究工作,如黃欣在《關(guān)聯(lián)數(shù)據(jù)在照片檔案管理中的應(yīng)用研究》中,具體闡述了關(guān)聯(lián)數(shù)據(jù)應(yīng)用的必要性、原則、RDF鏈接制作方法、基礎(chǔ)數(shù)據(jù)構(gòu)建、元數(shù)據(jù)核心集基礎(chǔ)數(shù)據(jù)庫建設(shè)、數(shù)據(jù)庫關(guān)聯(lián)等一系列的研究成果;
2.4 挑戰(zhàn)分析
關(guān)聯(lián)數(shù)據(jù)技術(shù)在企業(yè)檔案信息資源整合中遇到的主要威脅來自于:檔案數(shù)據(jù)的安全性難以保障。檔案信息數(shù)據(jù)安全是檔案信息管理的根本工作之一,而關(guān)聯(lián)數(shù)據(jù)的公開性是管理數(shù)據(jù)應(yīng)用于企業(yè)檔案資源整合中所必需面對的問題。關(guān)聯(lián)數(shù)據(jù)一般通過PDF以及API等格式進(jìn)行開發(fā),此類API密鑰防盜性較弱,非常容易出現(xiàn)泄漏和入侵等現(xiàn)象,讓數(shù)據(jù)存在風(fēng)險,影響檔案資源的數(shù)據(jù)安全。
3 管理數(shù)據(jù)在企業(yè)檔案資源整合應(yīng)用中的策略
3.1 優(yōu)化檔案著錄標(biāo)準(zhǔn)
首先應(yīng)依據(jù)關(guān)聯(lián)數(shù)據(jù)特點,重新優(yōu)化檔案著錄標(biāo)準(zhǔn),以實現(xiàn)著錄字段向關(guān)聯(lián)數(shù)據(jù)映射,以滿足檔案資源整合的需要;其次,對于現(xiàn)有檔案資源標(biāo)準(zhǔn)化程度低的情況,研究公司發(fā)展脈絡(luò),補(bǔ)充必要信息;
3.2 構(gòu)建統(tǒng)一利用平臺
通過構(gòu)建統(tǒng)一的檢索利用平臺,可以在提供跨種類檔案信息檢索的基礎(chǔ)上,為用戶構(gòu)建參考咨詢或決策建議系統(tǒng)。再通過完善語義推理機(jī)制以及知識挖掘,向用戶提供個性化、可定制的檔案信息資源。以實現(xiàn)檔案信息精確推送從而影響科學(xué)決策、科研生產(chǎn),提升企業(yè)競爭力。
3.3 鼓勵員工參與
應(yīng)鼓勵公司員工參與檔案信息整合利用中來。應(yīng)該在開放員工檢索利用的基礎(chǔ)上,允許普通用戶對檔案資源進(jìn)行簡單的組織分類、添加標(biāo)簽,通過簡單的組織分類可以研究不同用戶需求,從而改進(jìn)本體推理并優(yōu)化檔案信息推送準(zhǔn)確率。
參考文獻(xiàn)
[1]冷裕波.企業(yè)檔案信息整合服務(wù)研究[J].檔案學(xué)通訊,2011,06
[2]呂元智.數(shù)字檔案資源知識“關(guān)聯(lián)”組織研究[J].檔案學(xué)研究,2012.06
[3]馬寅源.關(guān)聯(lián)數(shù)據(jù)應(yīng)用于檔案知識服務(wù)的SWOT分析及策略[J].檔案與建設(shè),2017(02):17-20+12.
[4]宋香蕾,加小雙.多學(xué)科視角下的檔案學(xué)理論研究進(jìn)展(之二)——管理學(xué)視角[J].山西檔案,2017(01):11-17.
[5]徐鶴田.國家治理視野下的大數(shù)據(jù)審計工作模式研究——基于SWOT分析[J].中國內(nèi)部審計,2017(01):77-82.
[6]周耀林,賈聰聰.“互聯(lián)網(wǎng)+”戰(zhàn)略下數(shù)字檔案信息服務(wù)發(fā)展策略研究——基于SWOT框架的分析選擇[J].檔案學(xué)通訊,2016(04):56-61.
[7]梁俊娜.廣西北部灣經(jīng)濟(jì)區(qū)農(nóng)民工遠(yuǎn)程教育培訓(xùn)模式的SWOT分析及對策研究[J].廣西廣播電視大學(xué)學(xué)報,2014,25(03):23-28.