亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        聚類分析算法的分析與評價

        2019-11-30 02:24:03李芝峰張妍
        電子技術(shù)與軟件工程 2019年7期
        關(guān)鍵詞:方法模型

        文/李芝峰 張妍

        1 引言

        在信息時代存儲人類活動的文本、視頻、圖像和音頻數(shù)據(jù)龐大,把數(shù)據(jù)對象有效的區(qū)分開是一個熱門的研究課題。

        聚類分析算法是深度學(xué)習(xí)中的一個常用的算法,它根據(jù)對象差異,把不同類的對象區(qū)分開。聚類分析算法的目標(biāo)是把混雜在一起的數(shù)據(jù)盡可能的分隔開,使同一類對象的相似程度盡可能大,使不同對象的相似程度盡可能的小。聚類分析算法是一種無監(jiān)督學(xué)習(xí)的模式。目前聚類方法大體有以下類別:基于層次聚類算法、基于劃分聚類算法、基于密度聚類算法、基于網(wǎng)格聚類算法、基于模型聚類算法、基于模糊聚類算法。隨著理論研究的不斷深入,聚類分析算法已經(jīng)在語音分離、視頻人臉檢測、圖像皮膚檢測以及其他領(lǐng)域取得了不錯的研究結(jié)果。

        2 聚類分析算法

        聚類方法分類不是很明確,聚類方法大體可以分為:基于層次聚類算法、基于劃分聚類算法、基于密度聚類算法、基于網(wǎng)格聚類算法、基于模型聚類算法、基于模糊聚類算法。聚類方法包含著其他幾種聚類分析算法,存在的每一種聚類分析算法都有這自己長處和短處。

        2.1 劃分法

        劃分法保持簇內(nèi)對象相似性高,簇外對象差異高。該方法的劃分大多是基于距離的,其原理是:首先選擇K個初始聚類中心點;然后數(shù)據(jù)加入到距離中心點最近中;其次重新計算新類中心點,并作為新的中心點。

        基于劃分聚類算法有K-means算法、k-modes算 法、k-prototypes算 法、k-medoids算 法、CLARA算 法、CLARANS算 法、Focused CLARAN算法、PCM算法等其他算法。這類算法的優(yōu)點是實現(xiàn)簡單、時間復(fù)雜度和空間復(fù)雜度低,缺點是容易出現(xiàn)局部最優(yōu)、對噪聲很敏感、對初始中心點選取敏感、不能解決非凸數(shù)據(jù)。

        2.2 層次法

        層次法是對數(shù)據(jù)對象進(jìn)行分解,可以是自上而下的策略,也可以是自下而上的策略,目前自下而上的聚合策略使用較多。該方法可以是基于距離或者密度或者連通性,自下而上的原理是:首先將給定的N個對象分為N類;然后計算兩個類距離最小并進(jìn)行合并;其次重新計算類之間的距離。

        基于層次聚類算法有CURE算法、ROCK算法、變色龍算法CHEMALOEN算法、SBAC算法、BIRCH算法、BUBBLE算法、BUBBLE-FM算法等其他算法。這類算法的優(yōu)點時是可解釋性好、可以解決非球形簇,缺點是時間復(fù)雜度高、并且不能更正以前計算錯誤。

        2.3 密度法

        密度法是為了解決不規(guī)則形狀的聚類方法。該方法是將密集的滿足條件的點歸類起來,并使合并起來的高密度區(qū)域劃分為密度相連點最大集合的簇。該方法是基于密度的,其原理是:首先找到一個數(shù)據(jù)核心點;然后找到以該數(shù)據(jù)核心點為中心的密度相連的其他數(shù)據(jù)點,進(jìn)行下一步的區(qū)域擴(kuò)充。

        基于密度聚類算法有基于密度的噪聲應(yīng)用空間聚類DBSCAN、DBLASD算法等其他算法。這類算法的優(yōu)點是對噪聲點出現(xiàn)不敏感、可以識別多種規(guī)則形狀的聚類,缺點是輸入?yún)?shù)會很大程度上影響聚類結(jié)果、對較稀的聚類和密度較大且離得較近的類區(qū)分不是很有效。

        2.4 網(wǎng)格法

        網(wǎng)格法是將數(shù)據(jù)對象轉(zhuǎn)化成一定數(shù)目的單元格并會形成網(wǎng)狀結(jié)構(gòu)。該方法是基于密度的,其原理是:首先采用降維措施,將N維空間降維成單維空間并分割成等長的段;然后根據(jù)網(wǎng)格單元中含有數(shù)據(jù)量的閾值,將大于閾值的視為高密度單元,否則視為低密度單元;其次將相連的高密度單元識別為同一個簇。

        基于網(wǎng)格聚類算法有小波聚類算法WaveCluster、基于密度和網(wǎng)格聚類算法CLIQUE等其他算法。這類算法的優(yōu)點是時間復(fù)雜度低,缺點是算法對輸入的參數(shù)很敏感、區(qū)分不規(guī)則分布的數(shù)據(jù)很困難、維度災(zāi)難。

        2.5 模型法

        模型法是一個模型一個類,然后使用合適的數(shù)據(jù)集去不斷的訓(xùn)練這個認(rèn)為合適的模型,這樣訓(xùn)練出來的模型可能很符合數(shù)據(jù)的密度分布函數(shù)。在使用到的數(shù)據(jù)集是由概率分布所組成的前提下,該方法才能有效進(jìn)行下去。

        現(xiàn)在基于模型聚類算法有統(tǒng)計方案和神經(jīng)網(wǎng)絡(luò)方案兩種方案,其中統(tǒng)計學(xué)方案算法有COBWEB算 法、CLASSIT算 法、AutoClass算法等其他算法;神經(jīng)網(wǎng)絡(luò)方案算法有SOMs算法等其他算法。這類算法的優(yōu)點是劃分類以概率形式展現(xiàn)出來,缺點是執(zhí)行效率不高。

        2.6 模糊法

        模糊法是采用了模糊集合的理論,是為了克服非此即彼的分類缺點,該算法假設(shè)了數(shù)據(jù)是以概率的形式屬于其中一個聚類。

        基于模糊聚類算法有FCM算法。這類算法優(yōu)點是能夠得到一個參考樣本分類結(jié)果可能性的計算方法,缺點是算法性能過渡依賴初始聚類中心的選擇。

        3 結(jié)束語

        本文中的聚類算法能夠較好的實現(xiàn)數(shù)據(jù)的分類。存在的每一種聚類算法都是為了更好的解決現(xiàn)實中的分類問題而存在。每一種聚類算法都是有自己的適應(yīng)場景,也都有自己的優(yōu)缺點。聚類算法雖然能夠?qū)?shù)據(jù)進(jìn)行分類,但是還是存在聚類數(shù)目是否自動問題,聚類算法優(yōu)點不能夠充分利用的問題,以及大規(guī)模數(shù)據(jù)和高維度數(shù)據(jù)處理能力的問題等其他問題。

        猜你喜歡
        方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        學(xué)習(xí)方法
        可能是方法不對
        3D打印中的模型分割與打包
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        三年片免费观看影视大全视频| 免费的黄网站精品久久| 亚洲无人区乱码中文字幕动画| 亚洲中文字幕日产无码| 污污内射在线观看一区二区少妇 | 国产高清丝袜美腿视频在线观看| 野花视频在线观看免费| 免费不卡在线观看av| 色婷婷五月综合亚洲小说| 久久人妻av无码中文专区| 亚洲天堂av在线免费观看| 欧美多人片高潮野外做片黑人| 亚洲av永久无码精品秋霞电影影院| 国产av无码专区亚洲草草| 99久久婷婷亚洲综合国产| 国产尤物精品视频| 少妇内射视频播放舔大片| 久久久久久国产福利网站| 亚洲女厕偷拍一区二区| 亚洲 中文 欧美 日韩 在线| 久久精品一区二区免费播放| 日本肥老熟妇在线观看| 三区中文字幕在线观看| 免费无码一区二区三区蜜桃| 亚洲中文字幕无线无码毛片| 精品自拍偷拍一区二区三区| 人妻少妇精品中文字幕专区| 999久久久国产精品| 久久综合视频网站| 亚洲狠狠久久五月婷婷| 四虎成人精品国产永久免费无码| 少妇高潮惨叫久久久久久| 国产一区二区三区高清视频| 91精品国产福利在线观看麻豆| 成人国内精品久久久久一区| 国产免费网站看v片元遮挡| 国产一区二区三区护士| 久久人人爽爽爽人久久久| 亚洲饱满人妻视频| 亚洲蜜桃视频在线观看| 日韩欧美中文字幕公布|