亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向大規(guī)模數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘系統(tǒng)的設(shè)計(jì)

        2010-08-15 00:52:53
        科技傳播 2010年7期
        關(guān)鍵詞:數(shù)據(jù)類型數(shù)據(jù)挖掘聚類

        張 毅

        四川省宜賓市第一人民醫(yī)院網(wǎng)絡(luò)中心,四川宜賓 644000

        1 數(shù)據(jù)挖掘的概念和分類分析

        1.1 數(shù)據(jù)挖掘的概念

        數(shù)據(jù)挖掘系統(tǒng)是信息化自然進(jìn)化的結(jié)果,在信息科技時(shí)代,隨著數(shù)據(jù)庫(kù)技術(shù)的不斷發(fā)展及數(shù)據(jù)庫(kù)管理系統(tǒng)的廣泛應(yīng)用,數(shù)據(jù)庫(kù)中存儲(chǔ)的數(shù)據(jù)量急劇增大,在大量的數(shù)據(jù)背后隱藏著許多重要的信息。信息中包含大量的數(shù)據(jù),如何從大量的數(shù)據(jù)中獲取有用的知識(shí)是我們面臨的一個(gè)重要而且緊迫的課題。數(shù)據(jù)挖掘技術(shù)正是從這樣的商業(yè)角度出發(fā)孕育而生的。 簡(jiǎn)單的說(shuō),數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中提取或挖掘知識(shí)。數(shù)據(jù)挖掘步驟可以與用戶或知識(shí)庫(kù)交互的平臺(tái)。

        1.2 數(shù)據(jù)挖掘數(shù)據(jù)庫(kù)的類型分類

        數(shù)據(jù)挖掘系統(tǒng)可以根據(jù)挖掘的數(shù)據(jù)類型分類。數(shù)據(jù)庫(kù)系統(tǒng)本身可以根據(jù)不同的標(biāo)準(zhǔn)分類,每一類可以需要自己的數(shù)據(jù)挖掘技術(shù),這樣就可以根據(jù)數(shù)據(jù)類型分類。

        2 Golden-Eye系統(tǒng)簡(jiǎn)介

        數(shù)據(jù)挖掘融 合了數(shù)據(jù)庫(kù)技術(shù),人工智能和統(tǒng)計(jì)學(xué)是目前的研究熱點(diǎn)、為了能夠集成當(dāng)前數(shù)據(jù)挖掘的主要技術(shù)并使它們協(xié)同工作,在進(jìn)行數(shù)據(jù)挖掘基本算法研究的基礎(chǔ)上研制開(kāi)發(fā)了一個(gè)數(shù)據(jù)挖掘系統(tǒng)-Golden-Eye-系統(tǒng)實(shí)現(xiàn)了數(shù)據(jù)控制研究中的一些 最新成果,集成了泛化、數(shù)據(jù)清洗這兩個(gè)數(shù)據(jù)準(zhǔn)備操作以及關(guān)聯(lián)規(guī)則發(fā)現(xiàn),例外規(guī)則發(fā)現(xiàn)、時(shí)序模 式發(fā)現(xiàn)、分類器構(gòu)造、聚類分析等基本數(shù)據(jù)挖掘操作,并實(shí)現(xiàn)了對(duì)挖掘操作的基本管理和結(jié)果和圖形化顯示,整個(gè)框架設(shè)計(jì)充分體現(xiàn)了系統(tǒng)的完整性、協(xié)調(diào)性和高效性;自底向上將存儲(chǔ)控 制模塊、數(shù)據(jù)預(yù)處理模塊、挖掘操作模塊、挖掘庫(kù)管理模塊有機(jī)地結(jié)合在一起,在底層實(shí)現(xiàn)了對(duì)包括中間結(jié)果在內(nèi)的數(shù)據(jù)的統(tǒng)一管理,在上層為用戶提供了可視化的界面,實(shí)驗(yàn)結(jié)果表明,該系統(tǒng) 能夠在大規(guī)模數(shù)據(jù)庫(kù)上成功地完成用戶所指定的數(shù)據(jù)挖掘操作。

        3 Golden-Eye系統(tǒng)的特點(diǎn)

        集成了泛化、數(shù)據(jù)清洗、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、時(shí)序模式(sequential pattern)發(fā)現(xiàn)、分類、聚類等多種基本數(shù)據(jù)挖掘操作。

        集成了一些新的操作和新的算法,比如改進(jìn)的DBSCAN聚類算法以及例外規(guī)則發(fā)現(xiàn)、數(shù)據(jù)清洗、類別屬性(categorical attribute)聚類這些數(shù)據(jù)挖掘領(lǐng)域里較新的操作。

        能處理大規(guī)模的數(shù)據(jù)級(jí),測(cè)試的最大記錄數(shù)目達(dá)到了10000000條以上。

        在系統(tǒng)框架的設(shè)計(jì)上充分考慮到了系統(tǒng)的完整性、協(xié)調(diào)性和高效性。

        4 Golden-Eye系統(tǒng)的展望

        我們開(kāi)發(fā)的數(shù)據(jù)挖掘系統(tǒng)Golden-Eye成功地集成了數(shù)據(jù)挖掘和數(shù)據(jù)準(zhǔn)備的幾個(gè)方面的功能。從結(jié)構(gòu)上看,系統(tǒng)利用挖掘庫(kù)將各個(gè)挖掘操作松散且一致地結(jié)合起來(lái),便于擴(kuò)充新的挖掘操作模塊;從功能上看,我們集成了一些新興的數(shù)據(jù)挖掘操作;從實(shí)現(xiàn)上看,我們實(shí)現(xiàn)了一些自創(chuàng)或者經(jīng)過(guò)改進(jìn)的算法。

        當(dāng)然,本系統(tǒng)還存在著一些不足之處。首先,對(duì)各挖掘操作的集成還不夠緊密,挖掘操作只能簡(jiǎn)單地按順序進(jìn)行;其次,系統(tǒng)并未考慮與DBMS和OLAP工具的集成。

        我們還需要在以下幾個(gè)方面做更多的工作:

        1)集成簡(jiǎn)單的數(shù)據(jù)庫(kù)操作和數(shù)據(jù)倉(cāng)庫(kù)操作;

        2)更緊密地集成各個(gè)數(shù)據(jù)挖掘操作;

        3)在現(xiàn)有平臺(tái)的基礎(chǔ)上開(kāi)發(fā)新的挖掘操作。

        5 數(shù)據(jù)挖掘未來(lái)研究方向

        當(dāng)前,數(shù)據(jù)挖掘研究方興未艾,,其研究與開(kāi)發(fā)的總體水平相當(dāng)于數(shù)據(jù)庫(kù)技術(shù)在90年代所處的地位,迫切需要類似于關(guān)系模式,數(shù)據(jù)系統(tǒng)和SQL查詢語(yǔ)言等理論和方法的指導(dǎo),才 能使數(shù)據(jù)挖掘的應(yīng)用得以普遍推廣。預(yù)計(jì)在本世紀(jì),數(shù)據(jù)挖掘的研究還會(huì)形成更大的高潮,研究焦點(diǎn)可能會(huì)集中到以下幾個(gè)方面:

        發(fā)現(xiàn)語(yǔ)言的形式化描述,即研究專門用于知識(shí)發(fā)現(xiàn)的數(shù)據(jù)挖掘語(yǔ)言,也許會(huì)像SQL語(yǔ)言一樣走向形式化和標(biāo)準(zhǔn)化;

        尋求數(shù)據(jù)挖掘過(guò)程中的可視化方法,使知識(shí)發(fā)現(xiàn)的過(guò)程能夠被用戶理解,也便于在知識(shí)發(fā)現(xiàn)的過(guò)程中進(jìn)行人機(jī)交互;

        研究在網(wǎng)絡(luò)環(huán)境下的數(shù)據(jù)挖掘技術(shù)(WebMining),特別是在因特網(wǎng)上建立DMKD服務(wù)器,并且與數(shù)據(jù)庫(kù)服務(wù)器配合,實(shí)現(xiàn)分布式數(shù)據(jù)采掘;

        加強(qiáng)對(duì)各種非結(jié)構(gòu)化數(shù)據(jù)的開(kāi)采(DataMiningforAudio&Video),如對(duì)文本數(shù)據(jù),圖形數(shù)據(jù),視頻圖像數(shù)據(jù),聲音數(shù)據(jù)乃至綜合多媒體數(shù)據(jù)的開(kāi)采;

        處理的數(shù)據(jù)將會(huì)涉及到更多的數(shù)據(jù)類型,這些數(shù)據(jù)類型或者比較復(fù)雜,或者是結(jié)構(gòu)比較獨(dú)特。為了處理這些復(fù)雜的數(shù)據(jù),就需要一些新的和更好的分析和建立模型的方法,同時(shí)還會(huì)涉及到為處理這些復(fù)雜或獨(dú)特?cái)?shù)據(jù)所做的費(fèi)時(shí)和復(fù)雜數(shù)據(jù)準(zhǔn)備的一些工具和軟件。

        6 結(jié)論

        需求牽引與市場(chǎng)推動(dòng)是永恒的,將首先滿足信息時(shí)代用戶的急需,大量的基于數(shù)據(jù)挖掘的決策支持軟件產(chǎn)品將會(huì)問(wèn)世。只有從數(shù)據(jù)中有效地提取信息,從信息中及時(shí)地發(fā)現(xiàn)知識(shí),才能為人類的思維決策和戰(zhàn)略發(fā)展服務(wù),也只有到那時(shí),數(shù)據(jù)才能夠真正成為與物質(zhì),能源相媲美的資源,信息時(shí)代才會(huì)真正到來(lái)。

        [1]魏藜,錢海蕾,錢衛(wèi)寧,王焱,周傲英.數(shù)據(jù)挖掘原型系統(tǒng)軟件學(xué)報(bào),2001(8).

        [2]王小虎,韓家偉.數(shù)據(jù)挖掘的概念與技術(shù).計(jì)算機(jī)工程與設(shè)計(jì),2002(10).

        [3]錢衛(wèi)寧,周傲英.一個(gè)面向大規(guī)模數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘系統(tǒng),2009(1).

        猜你喜歡
        數(shù)據(jù)類型數(shù)據(jù)挖掘聚類
        詳談Java中的基本數(shù)據(jù)類型與引用數(shù)據(jù)類型
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        如何理解數(shù)據(jù)結(jié)構(gòu)中的抽象數(shù)據(jù)類型
        基于DBSACN聚類算法的XML文檔聚類
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        基于改進(jìn)的遺傳算法的模糊聚類算法
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
        自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        天堂av一区二区在线| 精品无码专区久久久水蜜桃| 四虎永久在线精品免费观看地址| 谁有在线观看av中文| 美女脱掉内裤扒开下面让人插| 一区二区特别黄色大片| 久久精品国产亚洲综合av| 亚洲午夜成人精品无码色欲| 中文天堂国产最新| 亚洲综合色丁香婷婷六月图片| 亚洲va成无码人在线观看| 全部亚洲国产一区二区| 日韩av激情在线观看| 欧美一区二区三区激情| 久久精品国产99久久丝袜| 亚洲国产都市一区二区| 99久久精品费精品国产一区二| 国产强被迫伦姧在线观看无码| 久久久国产乱子伦精品作者| 国产性生交xxxxx免费| 欧美日韩免费一区中文字幕| 日本二区视频在线观看| 国产一级一片内射视频播放| 国产人妻久久精品二区三区老狼 | 欧洲熟妇乱xxxxx大屁股7| 国产熟女自拍视频网站| 中文字幕人妻av四季| 欧美成人国产精品高潮| 亚洲日韩国产精品第一页一区| 国产精品涩涩涩一区二区三区免费| 国产一区二区在三区在线观看| 天堂av在线美女免费| 国产亚洲精品aaaaaaa片| 亚洲中文无码精品久久不卡| 午夜视频在线观看国产19| 亚洲色成人网站www永久| 国产精自产拍久久久久久蜜| 中文字幕成人精品久久不卡| 男女做羞羞事的视频网站| 亚洲国产欧美日韩欧美特级| 日韩精品国产自在欧美|