亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于相似度的多標簽分類算法優(yōu)化*

        2022-03-17 10:16:46
        計算機與數(shù)字工程 2022年2期
        關(guān)鍵詞:分類

        劉 云 肖 添 肖 雪

        (昆明理工大學(xué)信息工程與自動化學(xué)院 昆明 650500)

        1 引言

        近年來,多標簽分類問題被廣泛研究,不同于傳統(tǒng)分類問題,多標簽分類的每個樣本實例同時包含兩個及兩個以上標簽數(shù)量。因此,這些標簽不再互斥[1~2]。為了更深入研究多標簽分類問題,很多學(xué)者提出了許多多標簽分類方法,主要包括基于支持向量機[3],神經(jīng)網(wǎng)絡(luò)[4],樸素貝葉斯[5],決策樹[6],K 近鄰(KNN)[7]等方法?,F(xiàn)存的分類算法存在分類精度不高,不能有效處理類別不均衡數(shù)據(jù)等問題[8]。

        Elisseeff 等[9]提出一種向量機的多標簽分類算法(a Ranking Multi-class Support Vector Machine,RankSVM),此方法中利用排序函數(shù)計算值決定順序排名,求解二次規(guī)劃的凸目標函數(shù)得出類標簽集合。Zhang[10]等研究了一種多標簽K 近鄰算法(Multi-label K Nearest Neighbor Algorithm,ML-KNN),此方法的目標是尋找每類訓(xùn)練樣本的近鄰標簽數(shù),對構(gòu)建實例概率函數(shù),計算貝葉斯類先驗概率和類條件概率預(yù)測測試實例的類標簽集合。

        本文提出基于相似度的多標簽分類算法(Multi-label Classification based on Similarity,SMLC),首先對實例進行相似度函數(shù)的構(gòu)建,同時進行并行計算,然后利用決策函數(shù)加權(quán)或?qū)W習閾值函數(shù)預(yù)測實例類標簽集合。仿真結(jié)果表明,與RankSVM 和ML-KNN 算法進行對比分析,SMLC 算法在多標簽分類任務(wù)中的各性能指標上表現(xiàn)最優(yōu)。

        2 模型建立

        式中·,· 代表兩個實例向量的內(nèi)積,d表示多項式次數(shù),c 表示代價函數(shù)多項式由高階項轉(zhuǎn)化為低階項的正則項。計算測試實例xi的標簽權(quán)重f(xi),xi所包含的標簽集標簽權(quán)重計算公式如下式所示:

        3 SMLC算法

        3.1 算法描述

        為進一步預(yù)測實例標簽集,本文研究提出一種

        根據(jù)訓(xùn)練數(shù)據(jù)D'={(x1,y1),…,(xN,yN)},預(yù)測未知實例xi的類標簽集合。首先,根據(jù)前文的相似度多項式函數(shù)(4)可知每個訓(xùn)練實例(xj,yj)∈D′相似度為Φ(xi,xj)(1 ≤j≤N),若訓(xùn)練實例屬于同一個標簽集k∈y′(即大小相同),則實例相似性可通過加權(quán)計算。相同類標簽k∈y′的訓(xùn)練數(shù)據(jù)D′的實例xi的相似性可通過式(6)表示:

        式中|fk(x)表示未知測試實例xi標簽k∈y的置信度。假設(shè)線性模型t(x)=w,f(x) +b(t(·)為閾值函數(shù)),給定訓(xùn)練集D,可根據(jù)式(10)學(xué)習閾值函數(shù):

        上式中,

        3.2 復(fù)雜度分析

        計算訓(xùn)練實例xi中每個非零元素xj的相似度值,并且計算對應(yīng)測試實例特征值時間復(fù)雜度僅為

        4 仿真分析

        4.1 數(shù)據(jù)集和評價指標

        為了評估本文研究的多標簽分類算法有效性,選取了著名的Mulan Library[12]多標簽數(shù)據(jù)集進行仿真測試,表1描述了測試數(shù)據(jù)集的具體信息。

        表1 仿真數(shù)據(jù)集

        在多標簽分類任務(wù)中,其性能評價指標比單標簽分類更為復(fù)雜和全面,下面對算法評價指標進行定義,給定測試數(shù)據(jù)集D,測試實例xi∈RM,需預(yù)測標簽集為h:χ→2K,多標簽學(xué)習算法輸出函數(shù)f:χ×y→R,其中fk( )xi為標簽k∈y對于未知測試實例xi的置信度,多標簽分類中把有效預(yù)測最大標簽集合作為評價一個分類算法好壞。為了證明算法的有效性,選取了多標簽分類的常用評價指標如下[13~15]。

        1)漢明損失(Hamming Loss,HL):

        對于任何p,指標函數(shù)Ⅱ[ ]p=1 且p 成立,否則為0。ED(f)=0 時性能最佳,該指標評估排名最高的標簽不在相關(guān)標簽集中的次數(shù)。該指標值越小則說明算法性能越好。該指標衡量測試樣本平均包含多少標簽。指標值越大表明算法性能越優(yōu)。

        4.2 仿真分析

        將所提出的SMLC算法與Rank-SVM、ML-KNN算法進行仿真分析的結(jié)果統(tǒng)計于表2和表3中。

        表2 在emotions數(shù)據(jù)集中性能分析

        表3 在CLA500數(shù)據(jù)集中性能分析

        從上表2、3 可看出,與RankSVM 和ML-KNN算法對比,SMLC 算法在漢明損失、1-錯誤率、覆蓋率、排名損失、平均準確率五個多標簽分類性能指標上表現(xiàn)最優(yōu)。

        5 結(jié)語

        有效提高多標簽分類準確度成為重要研究方向。本文提出基于相似度的多標簽分類算法SMLC,該算法首先構(gòu)建實例相似度函數(shù),再采用并行計算方式算出相似值,最后通過加權(quán)計算類標簽集合權(quán)重或者學(xué)習閾值方法預(yù)測類標簽集合。仿真結(jié)果表明,對比RankSVM、ML-KNN 算法,SMLC算法在多標簽分類任務(wù)中多個評價指標上表現(xiàn)更好。

        猜你喜歡
        分類
        2021年本刊分類總目錄
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        星星的分類
        我給資源分分類
        垃圾分類,你準備好了嗎
        分類討論求坐標
        數(shù)據(jù)分析中的分類討論
        按需分類
        教你一招:數(shù)的分類
        亚洲AV无码中文AV日韩A| 性色av闺蜜一区二区三区 | 亚洲精品午夜精品国产| 亚洲天堂av黄色在线观看| 久久亚洲精品情侣| 亚洲av日韩av高潮潮喷无码| 国产午夜精品久久久久99| 亚洲人妻av综合久久| 亚洲av免费手机在线观看| 欧美天天综合色影久久精品| a在线免费| 看大陆男女真人草逼视频| 99噜噜噜在线播放| 最近最新中文字幕| 国产亚洲sss在线观看| 亚洲av高清一区三区三区| 免费无码专区毛片高潮喷水| 风韵饥渴少妇在线观看| 国产精品黄色片在线观看| 日本在线一区二区免费| 国产成人综合美国十次| 欧美日本国产va高清cabal| 亚洲色AV天天天天天天| 深夜黄色刺激影片在线免费观看| 亚洲中文字幕久久精品无码a| 久久久久无码国产精品不卡| 黑人一区二区三区在线| 中文字幕一区久久精品| 黑人上司粗大拔不出来电影| 亚洲伊人久久大香线蕉影院| 久久国产精品懂色av| 亚洲乱码国产乱码精华| 狠狠色综合网站久久久久久久| 精品一区二区三区在线视频观看 | 久久精品国产6699国产精| 美国黄色av一区二区| 亚洲国产精品久久电影欧美| 国产v视频| 成年人视频在线播放麻豆| 亚洲av永久无码精品网站| 97久久天天综合色天天综合色hd |