楊鴻華
摘要:檔案管理工作在信息技術(shù)的推動下獲得了快速發(fā)展,將數(shù)據(jù)挖掘技術(shù)引入到檔案管理系統(tǒng)中是實現(xiàn)檔案管理目標和提升檔案管理價值的必然要求,本文在介紹了數(shù)據(jù)挖掘技術(shù)及其與檔案管理工作關(guān)系的基礎(chǔ)上,重點從檔案分類、檔案收集、檔案保管三個方面研究了數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)中的應用。
關(guān)鍵詞:檔案管理系統(tǒng);數(shù)據(jù)挖掘技術(shù);應用
1引言
信息時代背景下的檔案管理模式不斷受到網(wǎng)絡(luò)技術(shù)和計算機信息技術(shù)發(fā)展的沖擊和挑戰(zhàn),人們對信息需求具有多維性和及時性的特征,因此信息時代背景下的檔案管理模式和檔案管理系統(tǒng)必須滿足人們不斷增長的海量信息需求以及最大程度上縮短信息獲取的等待時間,實踐表明將數(shù)據(jù)挖掘技術(shù)引入到檔案管理系統(tǒng)中具有非常重要的作用和價值。
2數(shù)據(jù)挖掘技術(shù)及其應用概述
數(shù)據(jù)挖掘技術(shù)是伴隨著信息技術(shù)的革新和人工智能的發(fā)展而得到廣泛應用和不斷發(fā)展的一項技術(shù),目前其已經(jīng)在包括檔案管理系統(tǒng)在內(nèi)的廣大領(lǐng)域中得到了廣泛而深入的應用,伴隨著數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)中的應用,相關(guān)的檔案信息收集、數(shù)據(jù)處理、數(shù)據(jù)利用的速度和質(zhì)量都得到了大幅度提高,大大地推動了檔案管理事業(yè)的發(fā)展。
數(shù)據(jù)挖掘技術(shù)通常使用分類法、關(guān)聯(lián)法、粗糙集法等對采集的數(shù)據(jù)進行多維度分析整合,從而得到隱藏其中的知識、規(guī)律和模式,決策者基于數(shù)據(jù)挖掘的結(jié)果進行決策可以顯著提高決策的科學性、準確性和針對性,提高對未來行為和事情的預見性。
在使用數(shù)據(jù)挖掘技術(shù)之前,必須有可供挖掘的大量數(shù)據(jù)存在,只有滿足這個前提才能使用相關(guān)的方法對數(shù)據(jù)進行分析、整理從而得到相應的結(jié)果,數(shù)據(jù)挖掘后得到的結(jié)果可以在過程控制、信息管理、數(shù)據(jù)維護、查詢優(yōu)化、決策分析等方面得到廣泛的應用。數(shù)據(jù)挖掘技術(shù)及其應用同時又是一個跨學科的技術(shù),其與人工智能技術(shù)、計算機技術(shù)、數(shù)據(jù)倉庫技術(shù)和統(tǒng)計學方法理論等緊密相連,同時數(shù)據(jù)挖掘技術(shù)中還會大量應用到遺傳算法、神經(jīng)網(wǎng)絡(luò)等技術(shù)。
3檔案管理系統(tǒng)中數(shù)據(jù)挖掘技術(shù)的應用
檔案管理系統(tǒng)中數(shù)據(jù)挖掘技術(shù)的應用不僅是信息時代背景下檔案管理工作的客觀要求,同時也是新時代背景下實現(xiàn)檔案管理價值的重要方法和途徑。歸納綜合起來檔案管理系統(tǒng)中數(shù)據(jù)挖掘技術(shù)的應用主要體現(xiàn)在以下幾個方面:
3.1檔案分類中數(shù)據(jù)挖掘技術(shù)的應用
檔案分類是檔案管理的基礎(chǔ)工作,數(shù)據(jù)挖掘技術(shù)的決策樹算法可以依據(jù)一定的規(guī)則將不同種類不同屬性的檔案快速區(qū)分開來,對符合一定規(guī)則和屬性的檔案進行歸整,大大提高檔案管理員的歸類速度,提高檔案檢索速度和效率。檔案分類中數(shù)據(jù)挖掘技術(shù)的具體工作流程為:在眾多具有不同特征的數(shù)據(jù)集中挑選出訓練集,訓練集是指已經(jīng)完成分類工作的數(shù)據(jù)集,基于此訓練集構(gòu)建符合既定規(guī)則的分類模型,然后將該分類模型應用到?jīng)]有完成分類工作的訓練集,這種檔案分類可以幫助檔案管理者對信息用戶的特點和行為進行分類總結(jié),并可以根據(jù)其個人愛好定制和推薦用戶感興趣的信息,諸如基于用戶的職業(yè)、性別、學歷、愛好以及瀏覽習慣等信息分析和推斷出用戶的偏好,這種基于數(shù)據(jù)挖掘的差異化和個性化分析可以幫助用戶提高獲取有效信息的速度,從而提高檔案管理的有效性和價值水平。值得注意的是要在檔案分類中正確使用決策樹算法要處理好分裂屬性的選擇和訓練數(shù)據(jù)分類的有效性。
3.2檔案收集中數(shù)據(jù)挖掘技術(shù)的應用
檔案收集中數(shù)據(jù)挖掘技術(shù)的應用主要是基于數(shù)據(jù)庫內(nèi)的數(shù)據(jù)描述來構(gòu)建數(shù)據(jù)模型,將數(shù)據(jù)樣本與數(shù)據(jù)模型進行對比并找出差異,如果發(fā)現(xiàn)測試樣本模型與構(gòu)建的數(shù)據(jù)模型相吻合,那么就按照測試樣本模型的分類方法對事務(wù)進行分類。檔案收集中數(shù)據(jù)挖掘技術(shù)的應用要求對檔案信息庫進行全面分析和綜合測度以得到科學的描述方案,并對已知概念模型和相關(guān)數(shù)據(jù)集進行科學描述,然后將模型與測試樣本進行比較來檢查模型的準確程度,如果反復測試后模型表現(xiàn)出較高的準確性,那么就將該模型作為標準模型,這是檔案管理個性化功能實現(xiàn)的基礎(chǔ)。將數(shù)據(jù)挖掘技術(shù)應用到檔案收集中可以提高檔案收集工作的有效性,從而為后續(xù)的檔案分類和檔案信息預測工作創(chuàng)造良好的前提條件,這也是檔案管理個性化和功能定制化得以實現(xiàn)的重要保障。
3.3檔案保管中數(shù)據(jù)挖掘技術(shù)的應用
檔案保管的目的是保留用戶的檔案信息防止檔案流失。對于企業(yè)來說留住老員工的成本遠遠要比重新聘用新員工的成本要低,研究和保管老員工的檔案信息是留住老員工手段的重要方法之一,通過對老員工檔案流失記錄的分析、挖掘和整合,從中可以發(fā)現(xiàn)導致員工流失的原因并及時地采取補救措施,這在現(xiàn)代企業(yè)人力資源檔案管理中具有十分重要的地位,國內(nèi)外許多大公司已經(jīng)率先應用并取得了一定的成績。檔案管理活動的目標是為了滿足管理者對于檔案信息的需求,將數(shù)據(jù)挖掘技術(shù)應用到檔案日常保管管理中可以提高檔案工作的效率和效能,同時也可以將檔案管理工作與人力資源管理工作緊密結(jié)合起來。
4 結(jié)論
數(shù)據(jù)挖掘技術(shù)是現(xiàn)代信息化技術(shù)的重要領(lǐng)域,也是人工智能(AI)和商務(wù)智能(BI)領(lǐng)域的重要支撐技術(shù),具有重要的實際應用價值和發(fā)展前景。檔案管理系統(tǒng)中數(shù)據(jù)挖掘技術(shù)的應用,大幅度地提升了檔案管理工作的效率和檔案信息查詢檢索的速度,隨著檔案管理現(xiàn)代化的不斷推薦、新的需求不斷提出以及計算機技術(shù)的發(fā)展,因此有必要進一步加強檔案管理工作中數(shù)據(jù)挖掘技術(shù)的應用,從而有效快捷地實現(xiàn)檔案管理的現(xiàn)代化。
參考文獻:
[1]於立勇.計算機數(shù)據(jù)挖掘技術(shù)應用在檔案信息管理系統(tǒng)中的探討[J].電腦知識與技術(shù),2012(02).
[2]黃華.數(shù)據(jù)挖掘分析在檔案管理方面的應用[J].網(wǎng)絡(luò)安全技術(shù)與應用,2009(04).
[3]周碧珍.淺析計算機數(shù)據(jù)挖掘技術(shù)在檔案信息管理系統(tǒng)中的應用[J].黑龍江科技信息,2009(01).
[4]彭皖民.基于用戶檔案管理的數(shù)據(jù)挖掘分析[J].河南科技, 2008(04).endprint