亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘的系統(tǒng)構(gòu)成與發(fā)展趨勢(shì)

        2009-03-30 04:52:54崔永君
        新媒體研究 2009年3期
        關(guān)鍵詞:數(shù)據(jù)倉庫數(shù)據(jù)挖掘可視化

        [摘要]隨著人們認(rèn)識(shí)和管理水平的提高,對(duì)客觀世界的描述愈來愈全面,存儲(chǔ)的數(shù)據(jù)量愈來愈大,然而,對(duì)數(shù)據(jù)庫中數(shù)據(jù)的開發(fā)應(yīng)用主要是檢索查詢,效率很低,此外,相當(dāng)數(shù)量的數(shù)據(jù)具有很強(qiáng)的時(shí)效性,數(shù)據(jù)的價(jià)值隨著時(shí)間的推移而迅速降低,決策者迫切需要從海量數(shù)據(jù)庫中提取有價(jià)值知識(shí)的工具。就數(shù)據(jù)挖掘的功能、應(yīng)用及發(fā)展問題進(jìn)行分析。

        [關(guān)鍵詞]數(shù)據(jù)挖掘系統(tǒng)發(fā)展趨勢(shì)

        中圖分類號(hào):TP3文獻(xiàn)標(biāo)識(shí)碼;A文章編號(hào):1671-7597(2009)0210057-01

        數(shù)據(jù)挖掘一詞是在1989年8月于美國底特律市召開的第十一屆國際聯(lián)合人工智能學(xué)術(shù)會(huì)議上正式形成的。從1995年開始,每年主辦一次KDD國際學(xué)術(shù)會(huì)議,將KDD和數(shù)據(jù)挖掘方面的研究推向了高潮,從此數(shù)據(jù)挖掘一詞開始流行??焖僭鲩L(zhǎng)的海量數(shù)據(jù)收集存放在若干大型數(shù)據(jù)庫中,如果沒有強(qiáng)有力的工具來幫助,其結(jié)果是重要的決策不是基于數(shù)據(jù)庫中豐富的信息,而是基于決策者的直覺。為此,決策者追切需要從海量數(shù)據(jù)庫中提取有價(jià)值知識(shí)的工具,數(shù)據(jù)挖掘技術(shù)正是為滿足上述要求而產(chǎn)生的。

        一、數(shù)據(jù)挖掘的定義與構(gòu)成

        數(shù)據(jù)挖掘(Data Mining),又稱信息發(fā)掘(Knowledge Discovery),是用自動(dòng)或半自動(dòng)化的方法在數(shù)據(jù)中找到潛在的,有價(jià)值的信息和規(guī)則。數(shù)據(jù)挖掘技術(shù)來源于數(shù)據(jù)庫,統(tǒng)計(jì)和人工智能。數(shù)據(jù)挖掘系統(tǒng)的構(gòu)成主要有以下方面:

        (1)數(shù)據(jù)庫、數(shù)據(jù)倉庫和其他信息庫:這是一個(gè)或一組數(shù)據(jù)庫、數(shù)據(jù)倉庫、電子表格或其他類型的信息庫。(2)數(shù)據(jù)庫或數(shù)據(jù)倉庫服務(wù)器:根據(jù)用戶的數(shù)據(jù)挖掘請(qǐng)求,數(shù)據(jù)庫或數(shù)據(jù)倉庫服務(wù)器負(fù)責(zé)提取相關(guān)數(shù)據(jù)。(3)知識(shí)庫:這是領(lǐng)域知識(shí),用于指導(dǎo)搜索,或評(píng)估結(jié)果模式的興趣度。(4)數(shù)據(jù)挖掘引擎:這是數(shù)據(jù)挖掘系統(tǒng)基本的部分,由一組功能模塊組成,用于特征化、關(guān)聯(lián)、分類、聚類分析以及演變和偏差分析。(5)模式評(píng)估模塊:通常,此成分使用興趣度度量,并與數(shù)據(jù)挖掘模塊交互,以便將搜索聚焦在有趣的模式上。它可能使用興趣度閥值過濾發(fā)現(xiàn)的模式。模式評(píng)估模塊也可以與挖掘模塊集成在一起,這依賴于所用的數(shù)據(jù)挖掘方法的實(shí)現(xiàn)。(6)圖形用戶界面:本模塊在用戶和挖掘系統(tǒng)之間通信,允許用戶和系統(tǒng)交互,制定數(shù)據(jù)挖掘查詢或任務(wù),提供信息、幫助搜索聚焦,根據(jù)數(shù)據(jù)挖掘的中間結(jié)果進(jìn)行探索式數(shù)據(jù)挖掘。此外,此成分還允許用戶瀏覽數(shù)據(jù)庫和數(shù)據(jù)倉庫模式或數(shù)據(jù)結(jié)構(gòu),評(píng)估挖掘的模式,以不同的形式對(duì)模式可視化。

        二、數(shù)據(jù)挖掘的應(yīng)用

        數(shù)據(jù)挖掘技術(shù)的潛在應(yīng)用是十分廣泛的,從政府管理決策、商業(yè)經(jīng)營、科學(xué)研究和工業(yè)企業(yè)決策支持等各個(gè)領(lǐng)域都可以找到數(shù)據(jù)挖掘技術(shù)的用武之地。下面列舉出目前開展得比較活躍的數(shù)據(jù)挖掘的應(yīng)用方向:

        (1)市場(chǎng)營銷:預(yù)測(cè)顧客的購買行為;劃分顧客群體。(2)銀行業(yè):偵測(cè)信用卡的欺詐行為;客戶信譽(yù)分析。(3)生產(chǎn)、銷售和零售業(yè):預(yù)測(cè)銷售額;決定庫存量:批發(fā)點(diǎn)分布的規(guī)劃、調(diào)度。(4)制造:預(yù)測(cè)機(jī)器故障:發(fā)掘影響生產(chǎn)能力的關(guān)鍵因素。經(jīng)紀(jì)業(yè)和安全交易:預(yù)測(cè)債券價(jià)格的變化;預(yù)報(bào)股票價(jià)格升降;決定交易的最佳時(shí)刻。(5)保險(xiǎn)業(yè):分析決定醫(yī)療保險(xiǎn)額的主要因素;預(yù)測(cè)顧客保險(xiǎn)的模式。(6)計(jì)算機(jī)硬件和軟件:監(jiān)測(cè)磁盤驅(qū)動(dòng)故障;估計(jì)潛在的安全漏洞。(7)政府和防衛(wèi):估計(jì)軍事裝備轉(zhuǎn)移的成本;預(yù)測(cè)資源的消耗;評(píng)估軍事戰(zhàn)略。(8)醫(yī)藥:驗(yàn)證藥物的治療機(jī)理:醫(yī)藥公司劃分出哪部分大夫會(huì)再次購買某類藥品。(9)交通:航空公司可以根據(jù)歷史資料尋找乘客的旅行模式,改進(jìn)航線的設(shè)置。(10)電信:電話公司評(píng)估哪一類客戶會(huì)在短期內(nèi)轉(zhuǎn)向別的公司或其它服務(wù)項(xiàng)目,從而限制對(duì)這部分客戶的廣告投入。(11)公司經(jīng)營管理:評(píng)價(jià)客戶信譽(yù);評(píng)估部門業(yè)績(jī);評(píng)估員工業(yè)績(jī):監(jiān)測(cè)子公司或部門財(cái)務(wù)舞弊行為。

        三、數(shù)據(jù)挖掘的發(fā)展趨勢(shì)

        1、算法效率和可伸縮性。目前,數(shù)據(jù)庫的規(guī)模呈指數(shù)增長(zhǎng),Mb規(guī)模的數(shù)據(jù)庫已經(jīng)很普遍。在商業(yè)數(shù)據(jù)庫中,Gb和Tb規(guī)模的數(shù)據(jù)庫也已經(jīng)在使用。當(dāng)把WWW包括進(jìn)來的時(shí)候,Pb規(guī)模的數(shù)據(jù)庫正在出現(xiàn)。

        2、處理不同類型的數(shù)據(jù)和數(shù)據(jù)源。目前數(shù)據(jù)挖掘系統(tǒng)處理的數(shù)據(jù)庫大多是關(guān)系數(shù)據(jù)庫。隨著數(shù)據(jù)庫應(yīng)用范圍的日益擴(kuò)大和規(guī)模、功能的日益完善,數(shù)據(jù)庫中將包含大量復(fù)雜的數(shù)據(jù)類型。如結(jié)構(gòu)化的數(shù)據(jù),復(fù)雜的數(shù)據(jù)對(duì)象,混合文本,多媒體數(shù)據(jù),時(shí)空數(shù)據(jù),事務(wù)數(shù)據(jù)及歷史數(shù)據(jù)等,甚至出現(xiàn)新的數(shù)據(jù)庫模型,因此保證數(shù)據(jù)挖掘系統(tǒng)能有效的處理此類數(shù)據(jù)庫中的數(shù)據(jù)是非常重要的。

        3、數(shù)據(jù)挖掘系統(tǒng)的交互性。數(shù)據(jù)挖掘中操作者的適當(dāng)參與能加速數(shù)據(jù)挖掘過程。一方面,交互界面接收用戶的檢索、查詢要求和數(shù)據(jù)挖掘策略,為用戶表達(dá)要求和策略提供了方便;另一方面,交互界面又把生成的結(jié)果傳遞給用戶,由于生成的結(jié)果可以是多種多樣,因此,準(zhǔn)確而直觀地描述挖掘結(jié)果和友好而高效的用戶界面一直是研究的重要課題。

        4、Web挖掘。由于Web上存在大量信息,并且Web在當(dāng)今社會(huì)扮演越來越重要的角色,有關(guān)Web內(nèi)容挖掘、Web日志挖掘和因特網(wǎng)上的數(shù)據(jù)挖掘服務(wù),將成為數(shù)據(jù)挖掘中一個(gè)最為重要和繁榮的子領(lǐng)域。

        5、數(shù)據(jù)挖掘中的隱私保護(hù)與信息安全。數(shù)據(jù)挖掘能從不同的角度、不同的抽象層上看待數(shù)據(jù),這將潛在地影響數(shù)據(jù)的私有性和安全性。隨著計(jì)算機(jī)網(wǎng)絡(luò)的日益普及,研究數(shù)據(jù)挖掘可能導(dǎo)致的非法數(shù)據(jù)入侵是實(shí)際應(yīng)用中需要解決的問題之一。

        6、探索新的應(yīng)用領(lǐng)域。信息產(chǎn)業(yè)的發(fā)展為數(shù)據(jù)挖掘提供了廣闊的空間,數(shù)據(jù)挖掘技術(shù)的應(yīng)用范圍將不斷得到拓寬,特別是在生物工程、商業(yè)智能、網(wǎng)絡(luò)服務(wù)等領(lǐng)域的應(yīng)用將成為新的研究熱點(diǎn)。同時(shí)由于通用數(shù)據(jù)挖掘系統(tǒng)在處理特定應(yīng)用問題時(shí)有其局限性,因此,目前的一種趨勢(shì)是開發(fā)針對(duì)特定應(yīng)用的數(shù)據(jù)挖掘系統(tǒng)。

        7、數(shù)據(jù)挖掘語言的標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)的數(shù)據(jù)挖掘語言或有關(guān)方面的標(biāo)準(zhǔn)化工作將有助于數(shù)據(jù)挖掘系統(tǒng)的研究和開發(fā),有利于用戶學(xué)習(xí)和使用數(shù)據(jù)挖掘系統(tǒng)。研究專門用于知識(shí)發(fā)現(xiàn)的數(shù)據(jù)挖掘語言,也許會(huì)像SQL語言一樣走向形式化和標(biāo)準(zhǔn)化。

        8、可視化數(shù)據(jù)挖掘??梢暬瘮?shù)據(jù)挖掘是從大量數(shù)據(jù)中發(fā)現(xiàn)知識(shí)的有效途徑。目前數(shù)據(jù)挖掘的可視化僅體現(xiàn)在結(jié)果的簡(jiǎn)單描述,而數(shù)據(jù)可視化、挖掘過程和結(jié)果可視化,將揭開數(shù)據(jù)挖掘神秘的面紗,使其變得更為生動(dòng)、形象和具體。數(shù)據(jù)和結(jié)果的圖形展示可以放大、縮小、平移、旋轉(zhuǎn)和變換角度,使分析人員和用戶更加容易理解,將大大推動(dòng)數(shù)據(jù)挖掘工具在發(fā)現(xiàn)知識(shí)和數(shù)據(jù)分析中的應(yīng)用。

        總之,數(shù)據(jù)挖掘的可視化具有重要的理論意義和應(yīng)用價(jià)值。隨著計(jì)算機(jī)計(jì)算能力的發(fā)展和業(yè)務(wù)復(fù)雜性的提高,數(shù)據(jù)的類型會(huì)越來越多、越來越復(fù)雜,數(shù)據(jù)挖掘?qū)l(fā)揮出越來越大的作用。

        作者簡(jiǎn)介:

        崔永君,男,碩士,遼寧開原人,講師,計(jì)算機(jī)網(wǎng)絡(luò)研究方向。

        猜你喜歡
        數(shù)據(jù)倉庫數(shù)據(jù)挖掘可視化
        基于CiteSpace的足三里穴研究可視化分析
        基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
        云南化工(2021年8期)2021-12-21 06:37:54
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        基于CGAL和OpenGL的海底地形三維可視化
        “融評(píng)”:黨媒評(píng)論的可視化創(chuàng)新
        基于數(shù)據(jù)倉庫的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        分布式存儲(chǔ)系統(tǒng)在液晶面板制造數(shù)據(jù)倉庫中的設(shè)計(jì)
        電子制作(2016年15期)2017-01-15 13:39:15
        探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉庫技術(shù)的應(yīng)用
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        欧美freesex黑人又粗又大 | 久久精品亚洲国产av网站 | 18禁真人抽搐一进一出在线| 无码少妇一级AV便在线观看| 免费无码黄网站在线观看| 日本女优久久精品久久| 欧美大屁股xxxx高潮喷水| 精品人妻系列无码人妻免费视频| 麻豆密入视频在线观看| 亚洲狠狠久久五月婷婷| 免费又黄又爽又色的视频| 99久久99久久精品国产片果冻| 99精品视频69v精品视频免费| 精品国产日韩亚洲一区在线| 天堂中文а√在线| 亚洲国产精品久久久久秋霞1| 黄 色 成 年 人 网 站免费| 日韩中文字幕不卡在线| 色777狠狠狠综合| 高清无码一区二区在线观看吞精| 日韩精品高清不卡一区二区三区| 亚洲一区二区三区特色视频| 午夜内射中出视频| 国产精品女同一区二区久久| 日韩一区二区av伦理| 日本少妇春药特殊按摩3| 男女超爽视频免费播放| 国产区高清在线一区二区三区| 日韩中文字幕一区二区二区| 国产亚洲2021成人乱码| 一本到无码AV专区无码| 综合久久一区二区三区| 免费国产黄网站在线观看视频| 亚洲女人被黑人巨大进入| 男人的av天堂狠狠操| 久久精品国产熟女亚洲| 精品久久久久久久久久中文字幕| 国产精品反差婊在线观看| 日韩精品中文字幕一区二区| 国产在线观看无码免费视频| 国产一区二区牛影视|