黃順杰 海南熱帶海洋學(xué)院
計(jì)算機(jī)挖掘技術(shù)能夠通過(guò)統(tǒng)計(jì)、分析和檢索,對(duì)信息數(shù)據(jù)進(jìn)行科學(xué)管理,利用了統(tǒng)計(jì)學(xué)的抽樣法和計(jì)算機(jī)的人工智能技術(shù),可以對(duì)數(shù)據(jù)信息進(jìn)行整理、分析和歸納。能夠在人們需要信息時(shí),為人們提供技術(shù)依據(jù),幫助人們?cè)邶嫶蟮臄?shù)據(jù)信息庫(kù)中,尋找到準(zhǔn)確、有效的信息。
計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)擁有兩種形式,一種形式是描述型,通過(guò)對(duì)數(shù)據(jù)信息所擁有的共性規(guī)律進(jìn)行描述,找出數(shù)據(jù)信息中具有標(biāo)志性和普標(biāo)性的信息,并對(duì)其進(jìn)行描述,從而提供這一類型的數(shù)據(jù)信息特征和規(guī)律。另一種是預(yù)測(cè)性,通過(guò)對(duì)已知數(shù)據(jù)信息的分析,推測(cè)另一類數(shù)據(jù)信息特征和規(guī)律。
計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的工作方法有三種,一種是分類法,這是計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)最常見(jiàn)的形式。通過(guò)對(duì)數(shù)據(jù)信息進(jìn)行分析,將其進(jìn)行歸類,并根據(jù)分類決定數(shù)據(jù)的等級(jí),對(duì)部分?jǐn)?shù)據(jù)進(jìn)行處理和分析,將剩下的數(shù)據(jù)進(jìn)行測(cè)試和檢驗(yàn),達(dá)標(biāo)后再進(jìn)行歸類。第二種是關(guān)聯(lián)法,它是計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)中,最簡(jiǎn)便和使用的方法。對(duì)數(shù)據(jù)信息進(jìn)行分析,并將其準(zhǔn)確的描述。第三種是粗糙集,粗糙集能夠應(yīng)對(duì)不具有穩(wěn)定性的數(shù)據(jù)信息內(nèi)容,能夠在沒(méi)有提供多余信息的情況下,進(jìn)行簡(jiǎn)潔的算法。
運(yùn)用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù),對(duì)檔案信息進(jìn)行收集和整理,利用技術(shù)構(gòu)建完整的數(shù)據(jù)信息庫(kù),將檔案數(shù)據(jù)信息錄入到計(jì)算機(jī)數(shù)據(jù)庫(kù)中,并對(duì)數(shù)據(jù)信息進(jìn)行有效的分析和整理,提取信息的主要特征和規(guī)律。通過(guò)計(jì)算機(jī)數(shù)據(jù)信息庫(kù)的建立,能夠在檔案信息管理的整理環(huán)節(jié),起到重要的簡(jiǎn)化作用,只需要利用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù),對(duì)信息進(jìn)行準(zhǔn)確的錄入,就可以實(shí)現(xiàn)檔案信息的管理,無(wú)需大量的耗費(fèi)人工和時(shí)間,充分的提高了檔案信息的整理時(shí)間和準(zhǔn)確度。
檔案信息價(jià)值鑒定管理,是信息整理環(huán)節(jié)中的一項(xiàng)內(nèi)容,需要對(duì)檔案信息進(jìn)行有效的分析,將檔案信息的價(jià)值進(jìn)行分級(jí),利用檔案信息的級(jí)別,可以將信息按照價(jià)值、重要程度以及詳細(xì)程度進(jìn)行分類、分級(jí)。提高檔案信息的質(zhì)量,優(yōu)化檔案信息管理,并能通過(guò)價(jià)值鑒定,對(duì)檔案信息進(jìn)行科學(xué)、合理的分配。
檔案信息管理的歸類環(huán)節(jié),在檔案信息管理中有著重要的地位和作用。在信息價(jià)值鑒定環(huán)節(jié)的基礎(chǔ)上,為檔案信息進(jìn)行更加細(xì)致的歸類。利用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù),可以快速、準(zhǔn)確的對(duì)信息進(jìn)行分析和劃分,對(duì)信息的主要特征和規(guī)律進(jìn)行提取,能夠根據(jù)實(shí)際進(jìn)行多種類別的劃分,比如就可以根據(jù)信息價(jià)值、信息涉及方面、信息時(shí)間等特征和規(guī)律進(jìn)行劃分。運(yùn)用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù),能夠?qū)n案信息管理的正確性和穩(wěn)定性進(jìn)行提高,改變了人工檔案信息歸類,耗費(fèi)時(shí)間并且準(zhǔn)確度不高的情況,通過(guò)對(duì)歸類環(huán)節(jié)的科學(xué)、嚴(yán)謹(jǐn)管理,能夠?yàn)榻酉聛?lái)的檔案管理工作帶來(lái)幫助,并打下良好的基礎(chǔ)。
在通過(guò)計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù),對(duì)檔案信息管理的整理和歸類后,為了方便查找和檢索檔案信息,要將檔案信息進(jìn)行編目,也就是給檔案信息編制目錄和標(biāo)引。
利用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)所做出來(lái)的數(shù)據(jù)平臺(tái),對(duì)所有的檔案信息進(jìn)行分類過(guò)后,將信息的特征和規(guī)律進(jìn)行總結(jié)和分析,將每個(gè)檔案信息的分類,做好主題標(biāo)引,比如想要查找園林設(shè)計(jì)方面的信息,就可以在數(shù)據(jù)庫(kù)中輸入園林設(shè)計(jì)。并按照人名、主題、分類等方式進(jìn)行編排,形成各種類型的全面目錄。
檔案信息具有著分散、量大、煩雜、固本等多種情況,在傳統(tǒng)的檔案信息管理中,大多是紙質(zhì)檔案信息,后來(lái)才出現(xiàn)了電子檔案信息。計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù),將檔案信息的管理進(jìn)行了細(xì)化,并且強(qiáng)化了管理,無(wú)論是紙質(zhì)還是電子,都能夠通過(guò)技術(shù)進(jìn)行有效的保存。對(duì)于紙質(zhì)檔案,可以進(jìn)行數(shù)據(jù)庫(kù)的歸檔、分類,運(yùn)用原有的紙質(zhì)檔案保存方法,進(jìn)行保存,在通過(guò)數(shù)據(jù)信息庫(kù),對(duì)檔案信息進(jìn)行保護(hù)和標(biāo)注。也可以將具有一定價(jià)值或者孤本的紙質(zhì)檔案信息進(jìn)行電子影印,將其上傳到云端或數(shù)據(jù)庫(kù)中,避免丟失和損壞。而電子檔案信息的保存,相對(duì)就簡(jiǎn)單很多,通過(guò)上傳數(shù)據(jù)庫(kù),可以復(fù)制和有效的保存信息,使信息能夠完整和準(zhǔn)確。計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的出現(xiàn),極大的改變了原有的檔案信息結(jié)構(gòu)和內(nèi)容,提高了管理、查閱檔案信息的效率。
現(xiàn)代化信息技術(shù)的出現(xiàn),改變了人們的生活和工作方式與內(nèi)容,方便了人們的生活和工作,為檔案信息的現(xiàn)代化技術(shù)管理帶來(lái)了幫助,不僅提高了信息管理的效率與質(zhì)量,還能通過(guò)計(jì)算機(jī)挖掘技術(shù)將檔案信息進(jìn)行整理和分析,為檔案信息管提供技術(shù)支持。
[1]韓樹(shù)河.計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)及其在檔案信息管理系統(tǒng)中的應(yīng)用探討[J].電子科學(xué)技術(shù),2016,03(06):774-777.
[2]曾雪峰.計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)開(kāi)發(fā)及其在檔案信息管理中的運(yùn)用研究[J].科技創(chuàng)新與應(yīng)用,2016(09):285.