王俊姝
(國家廣播電影電視總局哈爾濱監(jiān)測臺,黑龍江 哈爾濱 150089)
在數(shù)字檔案信息化管理過程中,數(shù)據(jù)挖掘是一個(gè)重要的環(huán)節(jié)。數(shù)據(jù)挖掘的定義并不復(fù)雜,它主要是從大量的、隨機(jī)的信息數(shù)據(jù)中,提取一些有價(jià)值的信息材料的過程。這些數(shù)據(jù)信息可能是結(jié)構(gòu)化特點(diǎn),也可能具備半結(jié)構(gòu)化的特點(diǎn),或者是一些異構(gòu)型的數(shù)據(jù)。在挖掘過程中,其知識數(shù)據(jù)獲得方法可能是歸納方法、演繹方法或者其他方法。我們通過對上述環(huán)節(jié)的應(yīng)用,可以促進(jìn)信息管理環(huán)節(jié)的開展,確保其決策支持環(huán)節(jié)、查詢環(huán)節(jié)、過程控制環(huán)節(jié)等的協(xié)調(diào),實(shí)現(xiàn)其數(shù)據(jù)維護(hù)系統(tǒng)的優(yōu)化??傊瑪?shù)據(jù)挖掘模式的開展,需要應(yīng)用到一系列的統(tǒng)計(jì)技術(shù),比如人工智能應(yīng)用技術(shù)、數(shù)理統(tǒng)計(jì)應(yīng)用技術(shù)、機(jī)械學(xué)應(yīng)用技術(shù)、人工神經(jīng)網(wǎng)絡(luò)技術(shù)等。
數(shù)據(jù)挖掘模式的開展,是當(dāng)今時(shí)代的應(yīng)用趨勢,通過對未來信息管理趨勢的分析,可以做出一些遠(yuǎn)見的知識環(huán)節(jié)的決策。當(dāng)然,數(shù)據(jù)挖掘的最終目標(biāo)是提取數(shù)據(jù)庫中的一個(gè)隱含的、有價(jià)值的數(shù)據(jù)信息,其功能又是比較廣泛的。比如關(guān)聯(lián)分析性,通過對數(shù)據(jù)庫內(nèi)大量數(shù)據(jù)信息的相互關(guān)聯(lián),來滿足現(xiàn)實(shí)工作的需要。在關(guān)聯(lián)規(guī)則應(yīng)用過程中,通過對不同事物之間的關(guān)聯(lián)性的控制,保證其整體應(yīng)用環(huán)節(jié)的優(yōu)化。在該應(yīng)用程序中,聚類程序也是非常必要的,其按照一定的方法將信息數(shù)據(jù)進(jìn)行合理的集合的劃分,有利于數(shù)據(jù)信息的深入挖掘聚類技術(shù)的發(fā)展,提升了人們對于客觀現(xiàn)實(shí)的認(rèn)識,從而優(yōu)化了概念描述及其偏差分析環(huán)節(jié),這需要進(jìn)行數(shù)學(xué)分類學(xué)模式及其一般模式識別方法的應(yīng)用。
通過其自動(dòng)預(yù)測模式的開展,可以就數(shù)據(jù)庫內(nèi)的某些信息數(shù)據(jù)進(jìn)行分類及其預(yù)測,通過對其預(yù)測性信息的尋找,確保重要的數(shù)據(jù)類的模型的描述,并且進(jìn)行未來數(shù)據(jù)趨勢的預(yù)測。當(dāng)然,上述環(huán)節(jié)的開展,需要計(jì)算機(jī)信息數(shù)據(jù)與人力的配合。在數(shù)據(jù)挖掘過程中,通過概念描述模式的應(yīng)用,可以進(jìn)行某一類對象內(nèi)涵的具體探究。
在數(shù)據(jù)挖掘方案的優(yōu)化過程中,資源類數(shù)據(jù)是重要的應(yīng)用程序,這需要進(jìn)行館藏檔案的數(shù)字化的處理,從而進(jìn)行不同的電子檔案的探究。在其電子文件中心各種檔案環(huán)節(jié)得到應(yīng)用,比如檔案的軟件收集信息模式、檔案信息網(wǎng)建設(shè)環(huán)節(jié)、信息維護(hù)管理等。我們通過對某些機(jī)構(gòu)的檔案用戶個(gè)人信息需求的探究,確保事業(yè)單位的檔案信息方案的應(yīng)用。比如我們可以就WEB訪問信息挖掘技術(shù)展開應(yīng)用,進(jìn)行一些數(shù)據(jù)之間的有效關(guān)聯(lián),進(jìn)行不同模式的用戶興趣模型的構(gòu)造,確保檔案信息的整體效益的優(yōu)化。
在工作過程中,要進(jìn)行事業(yè)單位的檔案網(wǎng)WEB服務(wù)器的用戶相關(guān)信息的收集,并且要經(jīng)過一系列的清洗、轉(zhuǎn)換,以方便統(tǒng)計(jì)分析的用戶展開數(shù)據(jù)庫信息的查閱。這需要我們就事業(yè)單位檔案信息資源體系的健全,通過對數(shù)據(jù)挖掘模式的更新,確保事業(yè)單位檔案結(jié)構(gòu)的綜合效益的提升。這需要我們進(jìn)行檔案管理軟件及其檔案網(wǎng)的應(yīng)用,確保檔案資源利用率的有效分析,確保一些較大需求量的傳統(tǒng)載體檔案的數(shù)字化。
在事業(yè)單位檔案館藏管理過程中利用文本挖掘,運(yùn)用關(guān)聯(lián)、分類、聚類等方法,從海量檔案信息中按照相關(guān)專題進(jìn)行挖掘、分類、加工、整理和有序化重組,構(gòu)建特色檔案信息庫及各類專題檔案信息庫等。從做好事業(yè)單位檔案館信息管理工作的角度出發(fā),數(shù)據(jù)挖掘?yàn)閮?yōu)化館藏信息和對未來工作的預(yù)測發(fā)揮重要作用。
在事業(yè)單位工作過程中,要就用戶的借閱信息展開關(guān)聯(lián)性的分析,進(jìn)行不同檔案信息之間的關(guān)聯(lián)規(guī)則及其比例關(guān)系的分析,確保館藏信息的優(yōu)化。在事業(yè)檔案檔案管理過程中,要對不同種類的文檔集合內(nèi)容展開積極的分類、總結(jié),做好一系列的關(guān)聯(lián)分析工作,通過對歸納總結(jié)模式的應(yīng)用,確保檔案工作的未來發(fā)展趨勢的探究。事業(yè)單位檔案館的管理類數(shù)據(jù)包括:智能監(jiān)控系統(tǒng)、消防系統(tǒng)、溫濕度控制系統(tǒng)、智能密集架、數(shù)據(jù)管理系統(tǒng)、數(shù)據(jù)利用系統(tǒng)等在日常工作產(chǎn)生大量的管理類數(shù)據(jù)。我們得用數(shù)據(jù)挖掘工具在這類看似無用的數(shù)據(jù)中提取有價(jià)值的知識并運(yùn)用到事業(yè)單位檔案館工作中,并在事業(yè)單位檔案館的現(xiàn)代化建設(shè)中發(fā)揮作用。
在日常工作中,事業(yè)單位的檔案工作的重點(diǎn)是通過工作人員的操作,進(jìn)行社會服務(wù)質(zhì)量的提升。在數(shù)據(jù)挖掘的應(yīng)用過程中,事業(yè)單位通過對檔案工作的個(gè)性化、智能化模式的應(yīng)用,滿足當(dāng)下社會對于事業(yè)單位的檔案管理需要。通過對智能檢索系統(tǒng)的應(yīng)用,可以極大的調(diào)用用戶的興趣,確保其檢索策略的不斷修正,保證用戶的個(gè)人興趣的積極檢索。當(dāng)然,通過對數(shù)據(jù)挖掘模式的應(yīng)用,可以有目的性的進(jìn)行檔案信息的開拓,針對其研究成果展開評價(jià),并且及時(shí)的提供給用戶,確保事業(yè)單位的檔案管理的二次開發(fā),以滿足當(dāng)下的事業(yè)單位檔案管理的需要。網(wǎng)絡(luò)最初只是科學(xué)家與研究人員之間交換文件的軟件,把因特網(wǎng)用于教育和研究可以得到政府的補(bǔ)貼。我國大學(xué)圖書館有撥款支持,數(shù)字圖書館的網(wǎng)絡(luò)檔案館是不贏利的,產(chǎn)出是教學(xué)和科研的長期社會效益。今天,因特網(wǎng)已經(jīng)越來越商業(yè)化了,網(wǎng)絡(luò)在數(shù)字經(jīng)濟(jì)中已成為極具潛力的技術(shù)投資對象。事業(yè)單位數(shù)字圖書館也可以考慮建立以贏利為目的的網(wǎng)絡(luò)檔案庫,采用網(wǎng)絡(luò)商務(wù)中的一些商務(wù)模式,例如網(wǎng)絡(luò)廣告、旗幟廣告、贊助廣告、訂閱、B2C等。收入可用于事業(yè)單位數(shù)字圖書館網(wǎng)絡(luò)檔案館建設(shè)的滾動(dòng)發(fā)展。
事業(yè)單位通過對數(shù)據(jù)挖掘技術(shù)的應(yīng)用,可以滿足當(dāng)下的數(shù)字化檔案管理的需要,確保其綜合運(yùn)作效益的提升,以更好的進(jìn)行現(xiàn)實(shí)工作的開展。
[1]耿珺.計(jì)算機(jī)信息系統(tǒng)安全防護(hù)措施探討[J].信息與電腦(理論版),2011(06).
[2]張新剛,李偉.高校數(shù)字化檔案信息安全的影響因素與對策[J].南陽師范學(xué)院學(xué)報(bào),2011(07).
[3]王喜銀.基于集控站模式的智能門禁系統(tǒng)的研制與開發(fā)[J].中國科技信息,2011(16).