亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘技術(shù)的發(fā)展趨勢

        2016-02-22 17:24:47何俊
        西部皮革 2016年24期
        關(guān)鍵詞:數(shù)據(jù)挖掘分析

        何俊

        (西華大學(xué),四川 成都 610039)

        數(shù)據(jù)挖掘技術(shù)的發(fā)展趨勢

        何俊

        (西華大學(xué),四川 成都 610039)

        數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。數(shù)據(jù)挖掘通常與計(jì)算機(jī)科學(xué)有關(guān),并通過統(tǒng)計(jì)、在線分析處理、情報(bào)檢索、機(jī)器學(xué)習(xí)、專家系統(tǒng)(依靠過去的經(jīng)驗(yàn)法則)和模式識別等諸多方法來實(shí)現(xiàn)。

        數(shù)據(jù)挖掘;發(fā)展

        1 數(shù)據(jù)挖掘的發(fā)展

        數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。這個(gè)定義包括好幾層含義:數(shù)據(jù)源必須是真實(shí)的、大量的、含噪聲的;發(fā)現(xiàn)的是用戶感興趣的知識;發(fā)現(xiàn)的知識要可接受、可理解、可運(yùn)用;并不要求發(fā)現(xiàn)放之四海皆準(zhǔn)的知識,僅支持特定的發(fā)現(xiàn)問題。

        與數(shù)據(jù)挖掘相近的同義詞有數(shù)據(jù)融合、人工智能、商務(wù)智能、模式識別、機(jī)器學(xué)習(xí)、知識發(fā)現(xiàn)、數(shù)據(jù)分析和決策支持等。

        ——何為知識?從廣義上理解,數(shù)據(jù)、信息也是知識的表現(xiàn)形式,但是人們更把概念、規(guī)則、模式、規(guī)律和約束等看作知識。人們把數(shù)據(jù)看作是形成知識的源泉,好像從礦石中采礦或淘金一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫中的數(shù)據(jù);也可以是半結(jié)構(gòu)化的,如文本、圖形和圖像數(shù)據(jù);甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)的知識可以被用于信息管理,查詢優(yōu)化,決策支持和過程控制等,還可以用于數(shù)據(jù)自身的維護(hù)。因此,數(shù)據(jù)挖掘是一門交叉學(xué)科,它把人們對數(shù)據(jù)的應(yīng)用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持。在這種需求牽引下,匯聚了不同領(lǐng)域的研究者,尤其是數(shù)據(jù)庫技術(shù)、人工智能技術(shù)、數(shù)理統(tǒng)計(jì)、可視化技術(shù)、并行計(jì)算等方面的學(xué)者和工程技術(shù)人員,投身到數(shù)據(jù)挖掘這一新興的研究領(lǐng)域,形成新的技術(shù)熱點(diǎn)。

        2 數(shù)據(jù)挖掘的功能

        數(shù)據(jù)挖掘綜合了各個(gè)學(xué)科技術(shù),有很多的功能,當(dāng)前主要功能如下:

        (1)分類:按照分析對象的屬性、特征,建立不同的組類來描述事物。例如:銀行部門根據(jù)以前的數(shù)據(jù)將客戶分成了不同的類別,現(xiàn)在就可以根據(jù)這些來區(qū)分新申請貸款的客戶,以采取相應(yīng)的貸款方案。

        (2)聚類:識別出分析對內(nèi)在的規(guī)則,按照這些規(guī)則把對象分成若干類。例如:將申請人分為高度風(fēng)險(xiǎn)申請者,中度風(fēng)險(xiǎn)申請者,低度風(fēng)險(xiǎn)申請者。

        (3)關(guān)聯(lián)規(guī)則和序列模式的發(fā)現(xiàn):關(guān)聯(lián)是某種事物發(fā)生時(shí)其他事物會(huì)發(fā)生的這樣一種聯(lián)系。例如:每天購買尿布的人也有可能購買啤酒,比重有多大,可以通過關(guān)聯(lián)的支持度和可信度來描述。與關(guān)聯(lián)不同,序列是一種縱向的聯(lián)系。例如:今天銀行調(diào)整利率,明天股市的變化。

        (4)預(yù)測:把握分析對象發(fā)展的規(guī)律,對未來的趨勢做出預(yù)見。例如:對未來經(jīng)濟(jì)發(fā)展的判斷。

        (5)偏差的檢測:對分析對象的少數(shù)的、極端的特例的描述,揭示內(nèi)在的原因

        需要注意的是:數(shù)據(jù)挖掘的各項(xiàng)功能不是獨(dú)立存在的,在數(shù)據(jù)挖掘中互相聯(lián)系,發(fā)揮作用。

        3 數(shù)據(jù)挖掘應(yīng)用現(xiàn)狀

        數(shù)據(jù)挖掘的應(yīng)用非常廣泛,只要該產(chǎn)業(yè)有分析價(jià)值與需求的數(shù)據(jù)庫,皆可利用數(shù)據(jù)挖掘工具進(jìn)行有目的的發(fā)掘分析。常見的應(yīng)用案例多發(fā)生在零售業(yè)、制造業(yè)、財(cái)務(wù)金融保險(xiǎn)、通訊及醫(yī)療服務(wù):

        (1)商場從顧客購買商品中發(fā)現(xiàn)一定的關(guān)聯(lián)規(guī)則,提供打折、購物券等促銷手段,提高銷售額。

        (2)保險(xiǎn)公司通過數(shù)據(jù)挖掘建立預(yù)測模型,辨別出可能的欺詐行為,避免道德風(fēng)險(xiǎn),減少成本,提高利潤。

        (3)在制造業(yè)中,半導(dǎo)體的生產(chǎn)和測試中都產(chǎn)生大量的數(shù)據(jù),就必須對這些數(shù)據(jù)進(jìn)行分析,找出存在的問題,提高質(zhì)量。

        (4)電子商務(wù)的作用越來越大,可以用數(shù)據(jù)挖掘?qū)W(wǎng)站進(jìn)行分析,識別用戶的行為模式,保留客戶,提供個(gè)性化服務(wù),優(yōu)化網(wǎng)站設(shè)計(jì)。

        4 數(shù)據(jù)挖掘技術(shù)未來的研究方向

        當(dāng)前,DMKD研究正方興未艾,預(yù)計(jì)在21世紀(jì)還會(huì)形成更大的高潮,研究焦點(diǎn)可能會(huì)集中到以下幾個(gè)方面:

        (1)形式化描述的語言,即研究專門用于知識發(fā)現(xiàn)的數(shù)據(jù)挖掘語言DMQL,類似SQL語言一樣走向形式化和標(biāo)準(zhǔn)化。

        (2)可視化的數(shù)據(jù)挖掘過程,尋求數(shù)據(jù)挖掘過程中的可視化方法,使知識發(fā)現(xiàn)的過程易于被用戶理解和操縱,可使數(shù)據(jù)挖掘過程成為用戶業(yè)務(wù)流程的一部分,也便于在知識發(fā)現(xiàn)的過程中進(jìn)行人機(jī)交互;包括數(shù)據(jù)用戶化呈現(xiàn)與交互操縱兩部分。

        (3)Web網(wǎng)絡(luò)中數(shù)據(jù)挖掘的應(yīng)用,特別是在Internet上建立數(shù)據(jù)挖掘服務(wù)器,與數(shù)據(jù)庫服務(wù)器配合,實(shí)現(xiàn)數(shù)據(jù)挖掘,從而建立強(qiáng)大的數(shù)據(jù)挖掘引擎與數(shù)據(jù)挖掘服務(wù)市場。

        (4)融合各種異構(gòu)數(shù)據(jù)的挖掘技術(shù),加強(qiáng)對各種非結(jié)構(gòu)化數(shù)據(jù)的開采(Data Mining for Audio&Video),如對文本數(shù)據(jù)、圖形數(shù)據(jù)、視頻圖像數(shù)據(jù)、聲音數(shù)據(jù)乃至綜合多媒體數(shù)據(jù)的開采。

        (5)處理的數(shù)據(jù)將會(huì)涉及到更多的數(shù)據(jù)類型,這些數(shù)據(jù)類型或者比較復(fù)雜,或者是結(jié)構(gòu)比較獨(dú)特。為了處理這些復(fù)雜的數(shù)據(jù),就需要一些新的和更好的分析和建立模型的方法,同時(shí)還會(huì)涉及到為處理這些復(fù)雜或獨(dú)特?cái)?shù)據(jù)所做的費(fèi)時(shí)和復(fù)雜數(shù)據(jù)準(zhǔn)備的一些工具和軟件。

        5 總結(jié)

        不管怎樣,需求牽引與市場推動(dòng)是永恒的,只有從數(shù)據(jù)中有效地提取信息,從信息中及時(shí)地發(fā)現(xiàn)知識,才能為人類的思維決策和戰(zhàn)略發(fā)展服務(wù)。也只有到那時(shí),數(shù)據(jù)才能夠真正成為與物質(zhì)、能源相媲美的資源,信息時(shí)代才會(huì)真正到來。

        [1] 劉瑩.基于數(shù)據(jù)挖掘的商品銷售預(yù)測分析[J].科技通報(bào),2014,(07).

        [2] 徐進(jìn)華.基于灰色系統(tǒng)理論的數(shù)據(jù)挖掘及其模型研究[D].北京交通大學(xué),2009.

        [3] 俞馳.基于網(wǎng)絡(luò)數(shù)據(jù)挖掘的客戶獲取系統(tǒng)研究[D].西安電子科技大學(xué),2009.

        [4] 馮軍.數(shù)據(jù)挖掘在自動(dòng)外呼系統(tǒng)中的應(yīng)用[D].北京郵電大學(xué),2009.

        何俊(1995—),男,漢族,四川西充人,本科,西華大學(xué),軟件工程專業(yè)。

        TP18

        A

        1671-1602(2016)24-0021-01

        猜你喜歡
        數(shù)據(jù)挖掘分析
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        隱蔽失效適航要求符合性驗(yàn)證分析
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢分析
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        中西醫(yī)結(jié)合治療抑郁癥100例分析
        在線教育與MOOC的比較分析
        數(shù)據(jù)挖掘的分析與探索
        河南科技(2014年23期)2014-02-27 14:18:43
        日本视频一区二区三区在线| 精品久久久久久中文字幕| 久久国产成人午夜av影院| 久久99久久99精品免观看不卡| 四虎国产精品免费久久| 伊人狠狠色丁香婷婷综合| 亚洲成人欧美| 熟女白浆精品一区二区| 国产激情小视频在线观看| 亚洲中文字幕精品乱码2021| 2019nv天堂香蕉在线观看| 精品免费久久久久久久| 国产在线无码一区二区三区| 大伊香蕉精品视频一区| 日本一区二区视频免费在线观看| 91九色极品探花内射| a黄片在线视频免费播放| 免费人成在线观看| a级国产乱理伦片在线播放| 久久精品国产免费观看99| 国产一区二区三区视频了| 国产亚洲精品一区在线| 无码a级毛片免费视频内谢| 精品无码中文字幕在线| 国产精品情侣露脸av在线播放| 国产精品久久国产三级国| 亚洲人成网站色在线入口口| 国产乱子伦| a级黑人大硬长爽猛出猛进 | 国产内射爽爽大片视频社区在线| 激情 人妻 制服 丝袜| 亚洲熟妇网| 久久se精品一区二区国产| 国产亚洲一区二区毛片| 蜜臀av一区二区三区久久| 高潮内射双龙视频| a级黑人大硬长爽猛出猛进 | 亚洲情久久久精品黄色| 亚洲av成人一区二区三区本码| 久久成人国产精品| 色爱区综合五月激情|