亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        解析數(shù)據(jù)挖掘中的聚類分析及其在控制中的應(yīng)用

        2014-04-29 00:00:00卓廣平

        摘 要:從大量的數(shù)據(jù)中,挖掘出有價(jià)值知識(shí)的方法稱之為數(shù)據(jù)挖掘,它在或即將在工業(yè)、農(nóng)業(yè)、教育、學(xué)術(shù)等諸多社會(huì)領(lǐng)域得到廣泛的重視。數(shù)據(jù)挖掘包括諸多方面,如頻繁項(xiàng)集挖掘、分類、離群點(diǎn)檢測(cè)等。而聚類分析是一個(gè)重要領(lǐng)域,根據(jù)一定的規(guī)律與要求,對(duì)事物進(jìn)行洞察分析,并且隨著模糊數(shù)學(xué)、概率論、統(tǒng)計(jì)理論等的深入研究,開(kāi)始用各種數(shù)學(xué)方法討論一些聚類問(wèn)題。本文主要探討了模糊聚類分析的應(yīng)用。

        關(guān)鍵詞:模糊數(shù)學(xué);聚類分析;數(shù)據(jù)挖掘

        中圖分類號(hào):TP311.13

        聚類分析是一種科學(xué)的數(shù)學(xué)方法,是按照一定的要求和規(guī)律,對(duì)事物進(jìn)行分類分析,屬于數(shù)量統(tǒng)計(jì)多元分析的一個(gè)分支。隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展,在大量未知數(shù)據(jù)分類中,聚類分析得到了很好的應(yīng)用[1]。由于在分類過(guò)程中,常常應(yīng)用模糊數(shù)學(xué)方法,使得聚類分析顯得尤為自然,與實(shí)際相符合。模糊聚類分析,可對(duì)事物的特征、相似性和親疏程度等進(jìn)行分類和分析。

        1 聚類分析介紹

        數(shù)據(jù)挖掘(Data Mining)是從大量、有噪聲、模糊和不完全、隨機(jī)的數(shù)據(jù)中,挖掘提取出隱含在數(shù)據(jù)中不為人知的、有價(jià)值的數(shù)據(jù)信息的過(guò)程[2]。其中,挖掘的有價(jià)值信息可用于過(guò)程控制、信息管理、決策支持等,同時(shí)可用于系統(tǒng)的數(shù)據(jù)維護(hù)。數(shù)據(jù)挖掘?qū)儆诤w廣泛的交叉學(xué)科,是一門綜合了人工智能、機(jī)械學(xué)習(xí)、數(shù)據(jù)庫(kù)和數(shù)據(jù)統(tǒng)計(jì)等多個(gè)研究領(lǐng)域的技術(shù)[3]。

        數(shù)據(jù)挖掘中的聚類(Clustering)是一種觀察式的學(xué)習(xí),這種學(xué)習(xí)不依靠帶符號(hào)的訓(xùn)練實(shí)例、預(yù)先的定義等,是通過(guò)研究對(duì)象間的相似性,將數(shù)據(jù)進(jìn)行分類或分簇。在同一簇中的數(shù)據(jù),相似度較高,但是不同簇中的數(shù)據(jù)對(duì)象,差別比較大[4]。其中,數(shù)據(jù)對(duì)象的相似度,按照對(duì)象屬性值計(jì)算,一般用距離對(duì)相似度進(jìn)行描述。

        數(shù)據(jù)挖掘?qū)垲惙治龅囊笕缦拢阂皇强缮炜s性強(qiáng),用于處理各種類型及級(jí)別的數(shù)據(jù)對(duì)象;二是對(duì)噪聲數(shù)據(jù),比如未知數(shù)據(jù)、空值等可進(jìn)行處理;三是決定輸入?yún)?shù)領(lǐng)域知識(shí)最小化,對(duì)結(jié)果的敏感度高,可直接決定聚類質(zhì)量。

        聚類分析在數(shù)據(jù)挖掘中的市場(chǎng)分析中得到廣泛應(yīng)用,可在客戶基本數(shù)據(jù)庫(kù)中,挖掘出不同的客戶群,并描述其特征。由于是一種數(shù)據(jù)挖掘功能,可獨(dú)立獲得數(shù)據(jù)分布,并觀察各個(gè)簇的特點(diǎn),同時(shí)對(duì)特定的數(shù)據(jù)進(jìn)行分析,為其他算法提供預(yù)處理步驟等。

        2 模糊聚類數(shù)學(xué)原理及聚類分析

        2.1 模糊聚類數(shù)學(xué)原理。模糊數(shù)學(xué)是扎德提出的一種理論,在諸多領(lǐng)域均產(chǎn)生重要影響,本文僅介紹模糊矩陣、模糊關(guān)系等。

        定義一:假設(shè)V、U是兩個(gè)論域,R是V*U的模糊子之一,屬于它的隸屬函數(shù):R:V*U→[0,1]。確定U中元素u與V中元素v的關(guān)系程度,也就稱R為V與U的模糊關(guān)系。

        定義二:模糊關(guān)系的傳遞性、對(duì)稱性以及自反性。

        定義三:模糊矩陣:假設(shè)矩陣R=(rij)m*n,則成R為一個(gè)模糊矩陣。

        2.2 模糊聚類分析的應(yīng)用。數(shù)據(jù)挖掘中具有多種聚類算法,比如基于密度、劃分和網(wǎng)絡(luò)等的算法中。如何選擇算法,主要需要考慮數(shù)據(jù)類型、聚類應(yīng)用和目的等。同時(shí),可采用多種算法,尋找對(duì)象數(shù)據(jù)之間的聯(lián)系。由于關(guān)系數(shù)據(jù)表中含有不同類型的數(shù)據(jù),改進(jìn)模糊數(shù)學(xué)中對(duì)純數(shù)據(jù)型數(shù)據(jù)的分析,使模糊聚類分析可得到直接應(yīng)用和分析。

        2.2.1 原始數(shù)據(jù)標(biāo)準(zhǔn)化。對(duì)于模糊聚類分析來(lái)說(shuō),假設(shè)U為一個(gè)分類數(shù)據(jù)對(duì)象全體,其中的每一個(gè)數(shù)據(jù)對(duì)象均可用一個(gè)矩陣來(lái)表示,這樣就得到一個(gè)樣本數(shù)量為n的屬性矩陣。在實(shí)際關(guān)系數(shù)據(jù)表中,包括布爾型、數(shù)值型和空值等各種類型的數(shù)據(jù),且由于聚類目的的不同,需要分析原始數(shù)據(jù)中的若干因素,而不需分析其全部屬性。所以,這就需要對(duì)原始數(shù)據(jù)做相應(yīng)的處理,以消除變量對(duì)分類的影響[5]。

        按照各種屬性對(duì)原始數(shù)據(jù)標(biāo)準(zhǔn)化,可分為以下幾種類型:一是間隔類型,數(shù)據(jù)值采用銷售額、長(zhǎng)度等數(shù)值型數(shù)據(jù)表示。數(shù)據(jù)標(biāo)準(zhǔn)化后,對(duì)于離散性或連續(xù)性小的數(shù)據(jù),可區(qū)間方法加以離散;如數(shù)據(jù)的離散性大,可通過(guò)標(biāo)準(zhǔn)差公式和極差標(biāo)準(zhǔn)化公式來(lái)處理。標(biāo)準(zhǔn)差公式如下:

        極差標(biāo)準(zhǔn)化公式如下:

        二是有序類型:屬性值有序等級(jí)表示,比如教授、助教和講師等。布爾型數(shù)據(jù)屬于有序類型,對(duì)有序類型數(shù)據(jù)的標(biāo)準(zhǔn)化,可將同屬性數(shù)據(jù)歸為一類,通過(guò)所占數(shù)據(jù)數(shù)據(jù)的百分率進(jìn)行標(biāo)準(zhǔn)化。

        其中,nc表示某種同屬性值數(shù)據(jù)個(gè)數(shù)。

        2.2.2 相似度計(jì)算。各樣本關(guān)系間的計(jì)算,采用兩種度量表示其接近程度,一種是相似度r,表示樣本間相似程度,r越接近1,則表示樣本間相似度高;二是距離d,假設(shè)兩個(gè)樣本為m維空間中的點(diǎn),兩點(diǎn)間的距離d越小,則表示相似度越高。

        兩個(gè)樣本之間的這種基于距離的關(guān)系,在統(tǒng)計(jì)學(xué)中,一般采用如下做法:為構(gòu)造模糊關(guān)系矩陣,用相似度描述樣本間的關(guān)系。按照各類對(duì)象的屬性,完成標(biāo)準(zhǔn)化后,計(jì)算各樣本之間的相似度。計(jì)算公式如下:

        2.2.3 聚類分析。確定了模糊相似矩陣之后,還應(yīng)確定閾值β,然后通過(guò)編網(wǎng)法聚類,防止矩陣自乘。假設(shè)R=(rij)m*n為任意模糊相似矩陣,j為矩陣的列,初值1,j的聚類包括a、[j]及[h]:

        A:如果第j類未能聚類,繼續(xù),否則轉(zhuǎn)(E)。

        B:求出所有≥閾值的元素的行,然后加入到各個(gè)聚類中。

        C:對(duì)于聚類中的元素i,求出第i列中≥閾值的元素;如聚類中的元素已全部求出,轉(zhuǎn)(E)。

        D:如果ik在j聚類中,忽略,否則將其加入到聚類中。

        E:j++;如果j≤n,轉(zhuǎn)(A);否則停止。

        3 聚類分析的應(yīng)用

        筆者從樣本數(shù)據(jù)中選取部分?jǐn)?shù)據(jù),分析模糊聚類分析的應(yīng)用。X1:沿海地區(qū);X2:固定資產(chǎn)原值利稅/百元;X3:資金利稅率;X4:產(chǎn)值利稅率;X5:銷售收入利稅/百元;X6:銷售成本利稅/百元;X7:流動(dòng)資金周轉(zhuǎn)次數(shù)。

        第一步:原始數(shù)據(jù)標(biāo)準(zhǔn)化。略。第二步:采用夾角余弦法計(jì)算各個(gè)數(shù)據(jù)的相似度;第三步:確定合適的閾值,假設(shè)為0.95。

        表2 相似度矩陣表

        經(jīng)過(guò)上述步驟,可完成聚類。但是在實(shí)際應(yīng)用中,同樣可對(duì)屬性聚類,用以判斷屬性在樣品中的重要性,進(jìn)而賦予不同權(quán)值。

        而模糊聚類程序的設(shè)計(jì),可采用三層處理模塊來(lái)實(shí)現(xiàn)。詳見(jiàn)圖1。

        4 結(jié)束語(yǔ)

        在數(shù)據(jù)挖掘技術(shù)不斷提高的背景下,挖掘數(shù)據(jù)庫(kù)中隱含的、有價(jià)值的知識(shí),成為其主要的目標(biāo)。筆者在本文中,結(jié)合相關(guān)的文獻(xiàn)資料,主要討論了對(duì)數(shù)據(jù)庫(kù)中各種類型數(shù)據(jù)的處理,從數(shù)據(jù)挖掘與聚類分析的內(nèi)涵、模糊數(shù)學(xué)理論及模糊聚類分析的應(yīng)用等方面做了分析,相信它在當(dāng)今大數(shù)據(jù)時(shí)代中也會(huì)得到某些借鑒。

        參考文獻(xiàn):

        [1]聶承啟,聶偉強(qiáng).數(shù)據(jù)挖掘中的模糊聚類分析[J].計(jì)算機(jī)工程與應(yīng)用,2013(33):184-186.

        [2]劉貴龍,張偉.模糊聚類分析在文本分類中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2013(39):110-111.

        [3]徐海洋,王國(guó)安,王萬(wàn)森.模糊聚類分析在數(shù)據(jù)挖掘中的應(yīng)用[J].中國(guó)新技術(shù)新產(chǎn)品,2011(13):245-246.

        [4]彭學(xué)軍.聚類分析在數(shù)據(jù)挖掘中的應(yīng)用探究[J].科教文匯(理工科研),2010(12):124-125.

        [5]唐小琴,代淑媛.數(shù)據(jù)挖掘中聚類分析的技術(shù)方法[J].微計(jì)算機(jī)信息,2013(10):119-120.

        作者簡(jiǎn)介:卓廣平(1972.07-),男,副教授,從事計(jì)算機(jī)教學(xué)和科研,研究方向:人工智能與數(shù)據(jù)挖掘。

        作者單位:太原師范學(xué)院,太原 030619

        在线观看免费人成视频色9| 亚洲av综合av国一区二区三区| 在线人妻va中文字幕| 亚洲精品无码精品mv在线观看| 亚洲精品国产suv一区88| 国产真实乱人偷精品人妻| 欧洲AV秘 无码一区二区三| 男女动态视频99精品| 在线观看国产成人av天堂野外| 色欲综合一区二区三区| 大地资源在线播放观看mv| 探花国产精品三级在线播放| 少妇特殊按摩高潮对白| 青青草大香蕉视频在线观看| 国产日产欧洲系列| 厨房玩丰满人妻hd完整版视频 | 亚洲国产av无码专区亚洲av| 国产亚洲av人片在线观看| 麻豆国产VA免费精品高清在线| 亚洲一区二区懂色av| 亚洲av无码乱码精品国产| 国产精品无码午夜福利| 日本精品网| 日韩国产自拍成人在线| 国产女主播一区二区三区| 激烈的性高湖波多野结衣| 久久97精品久久久久久久不卡| 免费人成黄页网站在线观看国内| 日韩中文字幕不卡在线| 国产精品国产三级国产专播| 久久久精品欧美一区二区免费| 91久久国产情侣真实对白| 国产另类人妖在线观看| 欧美性xxxxx极品老少| 在线亚洲欧美日韩精品专区| 国产精品久久久久免费看| 久久精见国产亚洲av高清热| 无码无套少妇毛多18p| 麻豆亚洲av永久无码精品久久| 在线你懂| 亚洲激情一区二区三区不卡|