解玉蘭
摘要:本文從大數(shù)據(jù)分析方法在企業(yè)檔案管理中的應(yīng)用現(xiàn)狀出發(fā),結(jié)合相關(guān)資料為未來利用大數(shù)據(jù)進(jìn)行檔案管理提出了一些建議,并闡述了在實施過程中需要注意的一些事項。
關(guān)鍵詞:大數(shù)據(jù)分析;企業(yè);檔案管理
一、引言
信息時代下,大數(shù)據(jù)、云計算等各種新興技術(shù)層出不窮,其中大數(shù)據(jù)是以容量大、類型多和應(yīng)用價值高為主要特征的數(shù)據(jù)集合。在企業(yè)的檔案管理中應(yīng)用大數(shù)據(jù)技術(shù)有利于對企業(yè)運營管理過程中產(chǎn)生的各種數(shù)據(jù)進(jìn)行深度挖掘,最終形成數(shù)據(jù)分析報告為企業(yè)管理層的相關(guān)決策提供支持,對于提高企業(yè)核心競爭力具有積極意義。
二、大數(shù)據(jù)分析方法在企業(yè)檔案管理應(yīng)用現(xiàn)狀
(1)有關(guān)大數(shù)據(jù)的探究活動更加深入
世界最權(quán)威雜志《科學(xué)》于2008年開始開設(shè)了大量的大數(shù)據(jù)專欄,帶動了國內(nèi)外的很多專家紛紛開始了對大數(shù)據(jù)的應(yīng)用研究,在經(jīng)過一系列研究之后大數(shù)據(jù)基本已經(jīng)能夠分成四部分:科學(xué)、技術(shù)、應(yīng)用和工程。目前技術(shù)的大數(shù)據(jù)應(yīng)用是兩個主要研究方向,并且當(dāng)前對大數(shù)據(jù)的研究更加成熟,企業(yè)在大數(shù)據(jù)技術(shù)的應(yīng)用方面也不斷增強。
(2)檔案資源是企業(yè)做出決策的依據(jù)
企業(yè)在進(jìn)行相關(guān)決策的時候必須要保證信息數(shù)據(jù)的準(zhǔn)確性,否則容易導(dǎo)致決策無效。所謂企業(yè)檔案是指企業(yè)在日常生產(chǎn)經(jīng)營過程中形成的各種形式的對國家或者社會、職工具有保留意義的文件材料,企業(yè)的檔案能夠讓企業(yè)更好地采集和搜索相關(guān)信息,通過最優(yōu)方式對信息進(jìn)行開發(fā)和利用,屬于企業(yè)的無形資產(chǎn)。隨著信息技術(shù)和互聯(lián)網(wǎng)應(yīng)用的飛速發(fā)展,大數(shù)據(jù)已經(jīng)得到了企業(yè)領(lǐng)導(dǎo)的更多重視,由此可以看出在企業(yè)檔案管理中提高大數(shù)據(jù)技術(shù)的應(yīng)用對于提高企業(yè)競爭力具有重要意義。
三、企業(yè)利用大數(shù)據(jù)分析方法進(jìn)行檔案數(shù)據(jù)管理的建議
充分而且全面的掌握企業(yè)的信息資源是保證企業(yè)生產(chǎn)經(jīng)營決策和各種管理決策良好利用大數(shù)據(jù)技術(shù)的前提,企業(yè)的整個信息資源利用管理過程中都不能忽視對于信息的利用,要按照資源運作周期全面掌握信息數(shù)據(jù),同時還要做好數(shù)據(jù)的保存工作,做好相關(guān)數(shù)據(jù)信息的格式化預(yù)操作。常見大數(shù)據(jù)分析方法包括可視化分析、數(shù)據(jù)挖掘、預(yù)測分析、語義分析和數(shù)據(jù)質(zhì)量管理。
(1)數(shù)據(jù)質(zhì)量管理提升企業(yè)檔案數(shù)據(jù)的資源品質(zhì)
當(dāng)前企業(yè)的數(shù)據(jù)大都呈現(xiàn)出了4V特點,傳統(tǒng)的數(shù)據(jù)管理形式已經(jīng)不能滿足對數(shù)據(jù)的處理和分析,目前使用比較廣泛的是數(shù)據(jù)并行處理系統(tǒng)和非關(guān)系型的數(shù)據(jù)庫,將ETL工具移入到云計算平臺系統(tǒng)對于數(shù)據(jù)的清洗、重復(fù)檢測和缺失數(shù)據(jù)處理、邏輯錯誤檢測都有重要意義,有利于保證企業(yè)檔案數(shù)據(jù)資源的數(shù)據(jù)質(zhì)量。
(2)可視化分析提升企業(yè)檔案數(shù)據(jù)資源可理解性
大數(shù)據(jù)的可視化分析就是在大數(shù)據(jù)自動分析數(shù)據(jù)的同時,利用可視化界面和人機交互技術(shù)提高人對數(shù)據(jù)的洞察力。企業(yè)檔案數(shù)據(jù)資源的可視化分析就是將檔案數(shù)據(jù)生成各種報表以及文本、視頻等,方便決策制定者理解運用。以企業(yè)中的文本數(shù)據(jù)可視化為例,標(biāo)簽云是目前比較流行的文本可視化技術(shù),能夠?qū)n案文本中潛在的主題進(jìn)行分類、邏輯結(jié)構(gòu)和詞頻重要度直觀的展現(xiàn)出來,成為企業(yè)決策的依據(jù),相類似的還有很多不同類型的檔案信息可視化技術(shù),如網(wǎng)絡(luò)數(shù)據(jù)可視化、時間序列可視化等。
(3)語義引擎實現(xiàn)企業(yè)檔案數(shù)據(jù)資源的智能提取
信息時代下全球信息儲存量暴漲,傳統(tǒng)的百度搜索引擎僅僅能夠滿足對關(guān)鍵詞的匹配搜索,檢索的準(zhǔn)確率比較低,檢索結(jié)果的關(guān)聯(lián)度也不強。實現(xiàn)高質(zhì)量的搜索體驗和智能提取是語義搜索引擎的主要優(yōu)勢。語義引擎是在語義網(wǎng)的發(fā)展帶動下來實現(xiàn)語義搜索的引擎,能夠通過分析搜索者的語義檢索請求來理解搜索者的真正意圖,對語義分析通過語言處理進(jìn)行概念匹配。企業(yè)人事檔案中應(yīng)用語義引擎,能夠分析該檔案中人的職務(wù)和級別,提取出姓名、級別、時間等關(guān)鍵信息,提高檢索命中率。
(4)數(shù)據(jù)挖掘發(fā)現(xiàn)企業(yè)檔案數(shù)據(jù)資源的隱性價值
數(shù)據(jù)挖掘又稱為數(shù)據(jù)庫知識再發(fā)現(xiàn),就是分析數(shù)據(jù)之間的關(guān)聯(lián)性。主要的數(shù)據(jù)挖掘方法有機器學(xué)習(xí)法和神經(jīng)網(wǎng)絡(luò)方法等。在大數(shù)據(jù)分析中,數(shù)據(jù)挖掘是核心,對企業(yè)來說檔案數(shù)據(jù)數(shù)據(jù)由企業(yè)正常運行管理中形成的檔案數(shù)據(jù)和企業(yè)運行過程中遺存在互聯(lián)網(wǎng)上的數(shù)據(jù)組成。前者通過運用聚類、關(guān)聯(lián)等方式對企業(yè)內(nèi)部數(shù)據(jù)進(jìn)行挖掘,為創(chuàng)新人員的決策提供數(shù)據(jù)支持,后者通過網(wǎng)絡(luò)輿情及時跟蹤獲得市場前沿信息,調(diào)整企業(yè)的競爭策略。
四、大數(shù)據(jù)分析方法運用于企業(yè)檔案管理中的注意事項
(1)控制成本
使用大數(shù)據(jù)分析方法要借助一定的運算工具,需要企業(yè)進(jìn)行相關(guān)投入,由于信息具有一定的復(fù)雜性因此很難控制好成本投入,要求企業(yè)提高自己的成本控制能力,盡量做到低投入高產(chǎn)出,增加大數(shù)據(jù)分析帶來的利潤增加。
(2)增強時效性
大數(shù)據(jù)中運用的數(shù)據(jù)動態(tài)性比較強,因此在分析過程中要認(rèn)識到這種特性帶來的影響,若是信息的時效性得不到保證,那么決策的制定也就不能及時發(fā)揮作用。其實大數(shù)據(jù)分析方法的關(guān)鍵環(huán)節(jié)在于建模,只要在建模過程中保持高度敏感和靈活,保證模型與數(shù)據(jù)更新之間不脫節(jié)就能保證信息的時效陛。
(3)重視人文情感
在企業(yè)檔案管理中,大數(shù)據(jù)分析方法具有一定的客觀性,因此也導(dǎo)致其存在一個明顯問題——缺少人文感情。受到此方面的制約導(dǎo)致數(shù)據(jù)分析無法具體表達(dá)用戶情感,盡管大數(shù)據(jù)分析的工作效率比較高,但是畢竟是一種機械式的運算程序,人文精神關(guān)懷方面為零。
五、結(jié)語
在大數(shù)據(jù)時代背景之下,企業(yè)檔案管理中應(yīng)用大數(shù)據(jù)分析方法具有重要意義,一方面有利于幫助企業(yè)的管理者在制定企業(yè)發(fā)展決策的時候提供科學(xué)依據(jù);另一方面有助于通過企業(yè)的運營數(shù)據(jù)分析來降低企業(yè)的運行成本,提高市場競爭力,在企業(yè)檔案管理中科學(xué)運用大數(shù)據(jù)技術(shù)將會為企業(yè)發(fā)展做出巨大貢獻(xiàn)。
(作者單位:大唐湘潭發(fā)電有限責(zé)任公司)