陳思音 齊齊哈爾市人力資源和社會(huì)保障信息中心
隨著科學(xué)技術(shù)的迅速發(fā)展,計(jì)算機(jī)技術(shù)作為科技前沿技術(shù),已經(jīng)被廣泛應(yīng)用到社會(huì)的各個(gè)行業(yè),滲透到各個(gè)領(lǐng)域,推動(dòng)著各行各業(yè)的快速發(fā)展。我國(guó)十分重視在檔案管理系統(tǒng)中引入計(jì)算機(jī)技術(shù),特別是大數(shù)據(jù)支撐下的計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù),其能夠快速實(shí)現(xiàn)檔案管理系統(tǒng)中的數(shù)據(jù)檢索,真正促進(jìn)檔案管理在技術(shù)層面上的全面創(chuàng)新發(fā)展,進(jìn)而推動(dòng)計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)價(jià)值的實(shí)現(xiàn),因此我國(guó)檔案管理系統(tǒng)應(yīng)廣泛應(yīng)用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)?;谶@一點(diǎn),深入闡述檔案管理系統(tǒng)中應(yīng)用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的意義和價(jià)值。
現(xiàn)階段,隨著社會(huì)快速發(fā)展,社會(huì)群體的需求不斷增加,檔案管理的對(duì)象也在不斷增多,而傳統(tǒng)的檔案管理方式效率較低,技術(shù)水平不足導(dǎo)致其不能滿足如今日益增長(zhǎng)的社會(huì)需求,因此我國(guó)檔案管理系統(tǒng)應(yīng)全面引入計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)。在檔案管理系統(tǒng)中應(yīng)用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)首先可以更好地保障檔案管理的信息安全,其次可以更快地進(jìn)行檔案數(shù)據(jù)檢索,提高工作效率,最后就是有利于檔案管理系統(tǒng)中的檔案數(shù)據(jù)庫(kù)建設(shè),可實(shí)現(xiàn)對(duì)海量檔案數(shù)據(jù)的存儲(chǔ),真正解決檔案管理過(guò)程中存儲(chǔ)需求高,存儲(chǔ)難度大等問(wèn)題。因此,基于大數(shù)據(jù)的計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)對(duì)檔案管理的創(chuàng)新發(fā)展有重要的作用。
作為一種全新的數(shù)據(jù)處理技術(shù),大數(shù)據(jù)支撐下的計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)本身對(duì)數(shù)據(jù)是十分敏感的,它可以周而復(fù)始地不斷進(jìn)行計(jì)算機(jī)數(shù)據(jù)挖掘,通過(guò)設(shè)置對(duì)應(yīng)的數(shù)據(jù)挖掘程序,在沒(méi)有取得預(yù)期效果的情況下不斷返回上一層,再一次按照程序進(jìn)行數(shù)據(jù)挖掘,直到圓滿完成任務(wù)。因此,大數(shù)據(jù)挖掘技術(shù)對(duì)檔案數(shù)據(jù)檢索有很大的推動(dòng)作用,能夠幫助檔案管理輕松完成對(duì)數(shù)據(jù)挖掘和數(shù)據(jù)檢索的任務(wù)要求。
檔案數(shù)據(jù)十分龐大,任何形式的檔案都有其存在的意義和價(jià)值。在檔案管理工作中,檔案管理人員需要對(duì)檔案數(shù)據(jù)進(jìn)行整理、分類、存儲(chǔ)及篩選。其中要根據(jù)檔案數(shù)據(jù)的價(jià)值來(lái)選擇保存時(shí)間、保存方式及保存地點(diǎn),而價(jià)值越高的檔案,使用頻率越高,在使用過(guò)程中也最容易存在安全問(wèn)題。傳統(tǒng)檔案管理中的安全會(huì)涉及檔案本身的保存安全及數(shù)據(jù)存儲(chǔ)安全兩方面,如若管理不當(dāng),就可能會(huì)出現(xiàn)檔案紙張被毀、檔案數(shù)據(jù)丟失等問(wèn)題,甚至一些機(jī)密檔案也面臨被泄露的危機(jī),從而給檔案管理造成巨大損失。因此檔案信息的安全性是檔案管理中最為重要的,檔案本身的機(jī)密性特質(zhì)要求在對(duì)檔案的保密和開(kāi)放利用上要做到對(duì)立統(tǒng)一,即重視保密就很難強(qiáng)調(diào)開(kāi)放利用,而頻繁利用顯然就不利于保密,這種關(guān)系在傳統(tǒng)檔案管理中是對(duì)立的,不可調(diào)和的。但是依托大數(shù)據(jù)的計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)在檔案管理中的應(yīng)用可以很好解決這一難題,計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)將不同數(shù)據(jù)庫(kù)的檔案進(jìn)行等級(jí)劃分,再通過(guò)加密及設(shè)置訪問(wèn)權(quán)限的方式來(lái)確保檔案隨取隨用,提高了檔案的安全性,也做到了檔案保密信息的等級(jí)劃分。
同時(shí),大數(shù)據(jù)支撐下的計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)在檔案管理中的應(yīng)用還能夠提高檔案管理的效率,通過(guò)大數(shù)據(jù)技術(shù)可以提升檔案調(diào)取過(guò)程中數(shù)據(jù)挖掘的速度,實(shí)現(xiàn)檔案數(shù)據(jù)的高速重復(fù)調(diào)取,從而獲得更快、更準(zhǔn)確的檔案。計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)將傳統(tǒng)檔案管理需要管理人員不斷鑒定、篩選、提取的檔案數(shù)據(jù)變得更加便捷,將人的主觀能動(dòng)性轉(zhuǎn)變?yōu)檎`差低的計(jì)算機(jī)提取檔案,最大程度地確保了檔案的安全性,降低了檔案在人為提取過(guò)程中可能丟失的概率??傊?,在大數(shù)據(jù)支撐下,計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)為檔案的篩選、提取、分類以及保存提供了更加科學(xué)、合理的方式,從而提高了檔案信息管理的效率,確保了檔案信息管理的安全,使其更符合當(dāng)前的現(xiàn)實(shí)需求,真正解決了檔案數(shù)量增加帶來(lái)的難題。
檔案本身具有機(jī)密性,因此檔案的借閱往往是一對(duì)一的,除非是已經(jīng)超過(guò)了時(shí)限的檔案,才會(huì)逐步向全社會(huì)開(kāi)放,但是這都是有明確限制范圍的。而在實(shí)際操作過(guò)程中,部分檔案管理人員因?yàn)椴皇煜n案信息,工作效率低下,甚至出現(xiàn)檔案借閱違規(guī)等情況。因此,提高檔案信息的使用效率成為檔案管理不可忽視的一點(diǎn)。如檔案管理人員在聽(tīng)到借閱人員的描述后沒(méi)有明確其需求,導(dǎo)致調(diào)閱的檔案并不能滿足借閱人員的需求,進(jìn)而需要重新調(diào)閱等,周而復(fù)始,只會(huì)降低工作效率,影響雙方溝通,給借閱人帶來(lái)不好的借閱體驗(yàn)。而現(xiàn)在,借助計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)可以很好地解決這一問(wèn)題,可以通過(guò)設(shè)置關(guān)鍵詞的方式明確借閱者所需要的檔案信息,然后通過(guò)大范圍篩選之后,由借閱者自己進(jìn)行最終確認(rèn)。這樣既避免了雙方無(wú)效溝通的問(wèn)題,同時(shí)也能更好地讓檔案管理人員關(guān)注和明確借閱者所借閱的檔案信息,解決檔案使用效率較低的問(wèn)題。
檔案管理屬于服務(wù)類管理工作,如何提高服務(wù)質(zhì)量一直都是檔案管理部門值得思考的問(wèn)題。檔案本身機(jī)密性高,加密檔案更是只有極少部分人才能深入了解。判斷大眾的借閱等級(jí)需要檔案管理人員調(diào)取借閱人員的借閱記錄,而這種記錄往往是全省甚至是全國(guó)統(tǒng)一的,借助互聯(lián)網(wǎng)和大數(shù)據(jù)技術(shù),在全國(guó)各地隨時(shí)都能調(diào)取借閱者的檔案信息。這樣有助于檔案管理人員隨時(shí)調(diào)取,隨時(shí)核實(shí),隨時(shí)查看,降低了檔案管理人員的工作難度,從而有效提高了檔案管理的服務(wù)質(zhì)量。
在實(shí)際應(yīng)用過(guò)程中,檔案管理工作開(kāi)展所涉及的內(nèi)容很多,檔案管理人員首先要進(jìn)行檔案分類,但是傳統(tǒng)的分類方法費(fèi)時(shí)費(fèi)力,效率低下,因此可以采用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù),建立一個(gè)決策樹(shù)算法,按照一定的規(guī)則進(jìn)行檔案數(shù)據(jù)的信息分類、篩選、整理,這樣就可以實(shí)現(xiàn)對(duì)檔案的分類工作,極大地提高工作效率。在計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的應(yīng)用過(guò)程中,從大量不同類別數(shù)據(jù)中選擇部分?jǐn)?shù)據(jù)組合成訓(xùn)練集,應(yīng)用到未分類檔案中,將不同屬性的檔案信息進(jìn)行分類和整理,做好鏈接。這樣檔案管理者就能更好地幫助借閱者進(jìn)行檔案信息的調(diào)取展示,借閱者任意調(diào)取一條檔案信息后,就會(huì)跳出對(duì)應(yīng)的推薦欄目,這些推薦欄目所提供的檔案信息都是與之有關(guān)聯(lián)或者類似的檔案集,從而實(shí)現(xiàn)智能化的檔案信息推薦。這種數(shù)據(jù)分析可以幫助借閱者在短時(shí)間內(nèi)獲取自己需要的相關(guān)檔案信息,既節(jié)約時(shí)間又提高了效率,保證了檔案數(shù)據(jù)的價(jià)值得到充分發(fā)揮。
對(duì)于檔案管理人員而言,計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的運(yùn)用涉及很多方面,除了進(jìn)行檔案分類之外,還可以通過(guò)數(shù)據(jù)信息描述建立一個(gè)對(duì)應(yīng)的數(shù)據(jù)模型,通過(guò)計(jì)算機(jī)模型樣本與數(shù)據(jù)模型之間的對(duì)比,找到二者差異,從而進(jìn)行有針對(duì)性的分類處理。以測(cè)試樣本模型為基準(zhǔn)進(jìn)行檔案信息分類,可以保證信息庫(kù)的精準(zhǔn)度和數(shù)據(jù)信息的全面性,甚至可以通過(guò)不斷細(xì)化已有的數(shù)據(jù)模型來(lái)與測(cè)試樣本進(jìn)行對(duì)比,當(dāng)一個(gè)模型測(cè)試通過(guò)之后,就可以收集到檔案管理中,從而更好地實(shí)現(xiàn)對(duì)檔案的管理。同時(shí),這種基于數(shù)據(jù)庫(kù)分類而創(chuàng)建的檔案數(shù)據(jù)模型,還能夠有效甄別檔案類型,進(jìn)行差異化比對(duì),從而找到不同檔案對(duì)同一事件在描述上的差異性,更好地進(jìn)行檔案信息甄別。這樣更有利于進(jìn)行檔案信息篩選、分類、整理及對(duì)檔案信息的準(zhǔn)確調(diào)取。
檔案是一種服務(wù)于大眾的數(shù)據(jù)信息,傳統(tǒng)檔案管理中對(duì)服務(wù)的價(jià)值體現(xiàn)十分不明顯,只能滿足借閱者的借閱需求。但是檔案的內(nèi)在價(jià)值顯然不僅僅只有這一點(diǎn),基于計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)應(yīng)用的檔案管理可以強(qiáng)化自己在服務(wù)層面的價(jià)值,將服務(wù)管理的效果體現(xiàn)出來(lái),通過(guò)建立檔案數(shù)據(jù)庫(kù)以及檔案分類管理模型,可以更好地進(jìn)行檔案信息對(duì)比,從而獲得對(duì)應(yīng)檔案信息之間的差異,這種差異通過(guò)篩選甄別之后,可能存在潛在的價(jià)值。比如挖掘有些年代的案底,找到案底之間的差異性。幫助公安機(jī)關(guān)以及其他政府機(jī)關(guān)破案辦事等,也能提高檔案數(shù)據(jù)對(duì)于受眾的服務(wù)效果,滿足其對(duì)檔案信息的精準(zhǔn)化需求等。這些舉措都放大了檔案的內(nèi)在價(jià)值,并將這種信息數(shù)據(jù)挖掘作為服務(wù)價(jià)值。
基于大數(shù)據(jù)的計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)不僅能解決數(shù)據(jù)挖掘的問(wèn)題,還能解決數(shù)據(jù)傳輸、檔案數(shù)據(jù)不統(tǒng)一、檔案信息不健全等問(wèn)題,通過(guò)搭建統(tǒng)一的數(shù)據(jù)信息網(wǎng)絡(luò),實(shí)現(xiàn)高速檔案信息傳輸,從而保證全國(guó)各地都能夠隨時(shí)調(diào)取、收集、整合相關(guān)的檔案信息,真正意義上實(shí)現(xiàn)了檔案數(shù)據(jù)之間的互通,讓檔案信息調(diào)取變得更加輕松,讓檔案數(shù)據(jù)使用變得更加便捷,推動(dòng)了檔案信息管理改革。
在檔案管理中,現(xiàn)代信息技術(shù)運(yùn)用最為廣泛的是決策樹(shù)結(jié)構(gòu),決策樹(shù)結(jié)構(gòu)能夠科學(xué)化開(kāi)展檔案管理,以基于不同指令要求的箭頭來(lái)代表數(shù)據(jù)分析過(guò)程中的檔案信息篩選方向,通過(guò)關(guān)鍵詞進(jìn)行搜索引導(dǎo),以此來(lái)保證檔案管理運(yùn)行過(guò)程中的資料分析以及策略優(yōu)化。首先建立對(duì)應(yīng)的數(shù)據(jù)庫(kù),將檔案信息統(tǒng)一收集整理到數(shù)據(jù)庫(kù)中;其次相關(guān)檔案管理人員針對(duì)需要調(diào)取的檔案信息進(jìn)行搜索并找到問(wèn)題答案,通過(guò)對(duì)應(yīng)的數(shù)據(jù)分析計(jì)算,將搜索結(jié)果按照使用頻率進(jìn)行排列;最后再進(jìn)行有針對(duì)性的數(shù)據(jù)挖掘、分析歸納,從而找到符合調(diào)取需求的相關(guān)數(shù)據(jù)。因此,決策樹(shù)結(jié)構(gòu)在檔案資料的查找中可以實(shí)現(xiàn)效果權(quán)衡評(píng)定和問(wèn)題檢索設(shè)定的雙重執(zhí)行;同時(shí),在問(wèn)題搜索過(guò)程中還可以依托檔案管理中的相關(guān)數(shù)據(jù)存儲(chǔ)來(lái)進(jìn)行科學(xué)的基礎(chǔ)條件檢索,并按照有序排列的方式來(lái)展現(xiàn)搜索結(jié)果。這種基于大數(shù)據(jù)的決策樹(shù)結(jié)果可以實(shí)現(xiàn)對(duì)檔案管理數(shù)據(jù)的分析排查,通過(guò)全面性衡量及針對(duì)目標(biāo)的概率分析來(lái)保證獲取數(shù)據(jù)信息的準(zhǔn)確性,同時(shí)提高了獲取數(shù)據(jù)的效率。
在檔案管理中,通過(guò)大數(shù)據(jù)技術(shù)進(jìn)行檔案管理創(chuàng)新融合,應(yīng)注重檔案管理的科學(xué)性,同時(shí)還要依靠數(shù)字技術(shù)實(shí)現(xiàn)對(duì)檔案數(shù)據(jù)的精準(zhǔn)化獲取。這樣十分有利于實(shí)現(xiàn)檔案管理的精細(xì)化。同時(shí)基于大數(shù)據(jù)的科學(xué)性遺傳算法,可以在更改一定數(shù)據(jù),確定好相關(guān)提取范圍之后對(duì)相關(guān)的檔案實(shí)現(xiàn)精準(zhǔn)控制,同時(shí)依據(jù)遺傳性數(shù)據(jù)的特點(diǎn)進(jìn)行有效篩選,確定資料的差異性收集,真正做到科學(xué)地進(jìn)行數(shù)據(jù)規(guī)避,實(shí)現(xiàn)資料的全覆蓋。因此,依托大數(shù)據(jù)的檔案管理在工作中使用遺傳算法,通過(guò)科學(xué)化管控?cái)?shù)據(jù)確保數(shù)據(jù)管理以及開(kāi)發(fā)的有效性,保證檔案管理能夠長(zhǎng)期穩(wěn)定地進(jìn)行信息檢索,并且能夠隨時(shí)升級(jí)使用。
總而言之,在信息技術(shù)飛速發(fā)展的今天,全面推動(dòng)檔案管理信息化建設(shè)具有重要意義和價(jià)值。檔案信息管理可以借助計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)進(jìn)行創(chuàng)新發(fā)展,從而真正提高檔案信息管理的工作效率,確保檔案管理質(zhì)量穩(wěn)步提高。同時(shí)信息技術(shù)可以將檔案信息的存儲(chǔ)和利用發(fā)揮到極致,還能夠?yàn)闄n案信息的查詢服務(wù)提供保障。在采取計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)整合檔案信息的過(guò)程中,通過(guò)建立不同的檔案數(shù)據(jù)庫(kù),實(shí)現(xiàn)各檔案管理服務(wù)數(shù)據(jù)庫(kù)之間的聯(lián)系,確保檔案信息能夠快速穩(wěn)定地傳輸,從而保證檔案信息管理的優(yōu)質(zhì)服務(wù)。