王煒
【摘要】 改革開(kāi)放以來(lái),我國(guó)的綜合國(guó)力在不斷的壯大,經(jīng)濟(jì)社會(huì)也在不斷的發(fā)展,各行各業(yè)隨著經(jīng)濟(jì)的積累也在不斷發(fā)展。計(jì)算機(jī)技術(shù)和信息技術(shù)的發(fā)展也突飛猛進(jìn)。信息的總數(shù)在不斷的上升,為了更好的對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì),一些新的數(shù)據(jù)統(tǒng)計(jì)的方式應(yīng)勢(shì)而生。為能更方便提取有效數(shù)據(jù)的工作起了推進(jìn)的作用。本文將對(duì)遺傳算法在數(shù)據(jù)中的應(yīng)用進(jìn)行全面的分析和研究。希望可以對(duì)數(shù)據(jù)的統(tǒng)計(jì)和提取有效數(shù)據(jù)的工作在日后的工作中起到借鑒性的作用。
【關(guān)鍵詞】 遺傳算法 數(shù)據(jù)挖掘 應(yīng)用 研究
引言
計(jì)算機(jī)技術(shù)的不斷發(fā)展,信息技術(shù)的不斷進(jìn)步,使得數(shù)據(jù)庫(kù)中的數(shù)據(jù)越來(lái)越多,越來(lái)越細(xì),也越來(lái)越雜亂。想要在這么多繁雜的數(shù)據(jù)中,快速有效的提取出有用的數(shù)據(jù)信息。傳統(tǒng)的數(shù)據(jù)的提取方式已經(jīng)不能再適應(yīng)科學(xué)技術(shù)的進(jìn)步和發(fā)展,數(shù)據(jù)挖掘的出現(xiàn),正好彌補(bǔ)了數(shù)據(jù)在提取過(guò)程中的這一缺點(diǎn)[1]。數(shù)據(jù)挖掘可以從大量繁雜的數(shù)據(jù)中,提取出一些有用的數(shù)據(jù),大大減少了在數(shù)據(jù)提取工作中的時(shí)間消耗。提高了工作效率的同時(shí),節(jié)約的工作時(shí)間。
一、數(shù)據(jù)挖掘的現(xiàn)狀研究
近幾年來(lái)對(duì)數(shù)據(jù)挖掘的研究主要集中在幾個(gè)問(wèn)題上。一是研究專門用于挖掘知識(shí)方面的數(shù)據(jù)的形式化語(yǔ)言。二是對(duì)不同類型的數(shù)據(jù)進(jìn)行處理工作,主要是對(duì)相互關(guān)聯(lián)的數(shù)據(jù)和一些較為復(fù)雜的數(shù)據(jù)進(jìn)行挖掘時(shí)的研究工作。三是對(duì)此題目研究興趣的分析研究。四是對(duì)數(shù)據(jù)庫(kù)中不同類型的數(shù)據(jù)的挖掘工作的研究。五是對(duì)不同數(shù)據(jù)算法的研究,目前主要且常用的數(shù)據(jù)算法有:并行式的算法、分布式的算法和增量的挖掘研究。六是對(duì)數(shù)據(jù)挖掘結(jié)果的研究。
二、遺傳算法的現(xiàn)狀研究
目前在對(duì)遺傳算法的研究主要集中在四個(gè)大問(wèn)題上。其一是研究有關(guān)于遺傳算法的理論,遺傳算法理論的主要內(nèi)容包括:影響算法的有關(guān)設(shè)置,有關(guān)的專業(yè)數(shù)學(xué)統(tǒng)計(jì)解釋等。其二是遺傳算法的改進(jìn),在不斷發(fā)展的技術(shù)進(jìn)步的影響下,遺傳算法的方式也需要不斷的隨之改進(jìn),能更好的在龐大數(shù)據(jù)中進(jìn)行計(jì)算分析[2]。其三是研究,并行化的遺傳算法,這一問(wèn)題的研究對(duì)遺傳算法的發(fā)展有具有重要意義。其四是研究遺傳算法與其他技術(shù)能否混合使用,這一研究的目的是為了提高其工作的速度,節(jié)省工作時(shí)間。
三、遺傳算法與數(shù)據(jù)研究之間的關(guān)系
數(shù)據(jù)挖掘與遺傳算法之間是相互包含的關(guān)心,數(shù)據(jù)挖掘包含遺傳算法,遺產(chǎn)算法是數(shù)據(jù)挖掘中眾多算法中的一種,但是是最主要的一種。由于遺傳算法的重要性和在數(shù)據(jù)挖掘中所占有的重要地位,遺傳算法適應(yīng)的范圍越來(lái)越廣,有關(guān)技術(shù)部門對(duì)其的重視程度也隨之增加。遺傳算法在諸多方面得到應(yīng)用,逐漸成為了數(shù)據(jù)挖掘領(lǐng)域中,新的具有重要意義的研究性課題。
四、數(shù)據(jù)挖掘的應(yīng)用
數(shù)據(jù)挖掘已經(jīng)運(yùn)用到越來(lái)越多的行業(yè)當(dāng)中,數(shù)據(jù)挖掘應(yīng)用的工作也得到了很好的落實(shí)。但是在數(shù)據(jù)挖掘?qū)嶋H應(yīng)用的過(guò)程中還是存在著一些問(wèn)題。數(shù)據(jù)挖掘應(yīng)用的領(lǐng)域越廣泛,受到的挑戰(zhàn)就越大。這些挑戰(zhàn)分別體現(xiàn)在不同領(lǐng)域的運(yùn)用中。例如生物學(xué)領(lǐng)域的數(shù)據(jù)挖掘,金融領(lǐng)域的數(shù)據(jù)挖掘,電信領(lǐng)域的數(shù)據(jù)挖掘等諸多方面。由于這些領(lǐng)域的數(shù)據(jù)都比較繁雜,所以挖掘的工作就會(huì)不同程度的存在一些難度問(wèn)題。
五、遺傳算法中存在的不足
遺傳算法雖然是數(shù)據(jù)挖掘中最主要的算法之一,但是遺傳算法本身還是存在著一定的不足方面。在遺傳算法進(jìn)行工作中,如果算法的工作目標(biāo)不確定,就會(huì)影響遺傳算法的工作進(jìn)行,減低遺傳算法的工作效率[3]。遺傳算法由于受到一定模式的影響,在對(duì)較多相似的數(shù)據(jù)進(jìn)行提取時(shí)可能會(huì)影響遺傳算法的工作速度,遺傳算法的靈活能力較低。在對(duì)參考數(shù)據(jù)的設(shè)置過(guò)程中理論依據(jù)不完善,容易造成在進(jìn)行數(shù)據(jù)的運(yùn)算過(guò)程中不能較快、較好的找到可以參考的數(shù)值,延誤數(shù)據(jù)運(yùn)算的工作。
六、遺傳算法在數(shù)據(jù)挖掘中的應(yīng)用分析
數(shù)據(jù)挖掘主要是對(duì)一些數(shù)據(jù)量大,且種類多,相似度高數(shù)據(jù)進(jìn)行的提取有效數(shù)據(jù)的過(guò)程和對(duì)有效數(shù)據(jù)的計(jì)算過(guò)程,為了更好的達(dá)到這個(gè)目的。就要對(duì)數(shù)據(jù)挖掘中最主要的計(jì)算方式,遺傳算法進(jìn)行完善和創(chuàng)新,只有不斷的完善,總結(jié)出最科學(xué)的算術(shù)系統(tǒng),才能更好的完成大量數(shù)據(jù)運(yùn)算的工作。
七、結(jié)語(yǔ)
通過(guò)上文的分析,可以看出,數(shù)據(jù)挖掘在對(duì)數(shù)據(jù)進(jìn)行提起的工作中的運(yùn)用越來(lái)越廣泛。數(shù)據(jù)挖掘較傳統(tǒng)的數(shù)據(jù)提取方式來(lái)說(shuō),具有許多優(yōu)勢(shì)。數(shù)據(jù)挖掘的工作時(shí)間更短、提取數(shù)據(jù)的速度更快、工作效率更高等這些是數(shù)據(jù)挖掘的優(yōu)勢(shì)之處。
為了更好的利用數(shù)據(jù)挖掘,就要求相關(guān)人員在以后的工作中能更加注重?cái)?shù)據(jù)挖掘這方面的研究。希望本文的分析能對(duì)以后的研究工作起到借鑒作用,為以后的研究工作打下良好的數(shù)據(jù)基礎(chǔ)。
參 考 文 獻(xiàn)
[1]劉建華,王勇,洪月好.遺傳算法編碼設(shè)計(jì)及其在數(shù)據(jù)挖掘中的應(yīng)用[J].上海電力學(xué)院學(xué)報(bào),2005,(03):244-248.
[2]王淑靜,賈兆紅,王亮等.遺傳算法在決策支持系統(tǒng)和數(shù)據(jù)挖掘中的應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,2006,(08):35-37.
[3]李智玲,張亦軍,胡彧.基于粗糙集的遺傳算法在數(shù)據(jù)挖掘中的應(yīng)用[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2009,3(09):127-129