亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于大數(shù)據(jù)的混合屬性圖像冗余特征聚類算法

        2021-11-13 06:10:12蔡小愛張海民
        關(guān)鍵詞:語義聚類混合

        蔡小愛,張海民

        (1.宣城職業(yè)技術(shù)學(xué)院 信息與財(cái)經(jīng)學(xué)院,安徽 宣城 242000;2.安徽信息工程學(xué)院 計(jì)算機(jī)與軟件工程學(xué)院,安徽 蕪湖 241000)

        0 引 言

        圖像中蘊(yùn)含的不同特征為圖像管理、存儲(chǔ)、分類以及聚類等工作帶來了前所未有的挑戰(zhàn)[1-3],如何有效對(duì)圖像中的不同特征進(jìn)行準(zhǔn)確聚類,降低圖像冗余特征對(duì)圖像特征聚類結(jié)果的影響已經(jīng)成為圖像處理領(lǐng)域需要共同面對(duì)的問題。[4,5]

        針對(duì)圖像處理問題,相關(guān)學(xué)者與研究人員經(jīng)過了長(zhǎng)時(shí)間的研究與實(shí)踐,得出了不同的聚類方法。文獻(xiàn)[6]提出了基于多模態(tài)特征的醫(yī)學(xué)圖像聚類方法,對(duì)不同幀的圖像進(jìn)行特征提取,采用慣性測(cè)量單元對(duì)相機(jī)云頂進(jìn)行解算,根據(jù)解算結(jié)果獲取前后兩幀圖像中的特征點(diǎn),進(jìn)行特征點(diǎn)匹配,得到匹配結(jié)果,根據(jù)匹配結(jié)果對(duì)特征進(jìn)行融合。實(shí)驗(yàn)結(jié)果表明,該方法可以適應(yīng)不同的動(dòng)態(tài)場(chǎng)景,但是該方法存在聚類結(jié)果精準(zhǔn)度不高的問題,影響聚類結(jié)果的可靠性。文獻(xiàn)[7]提出了自適應(yīng)空間信息MRF的FCM遙感圖像聚類方法,根據(jù)遙感圖像中的空間結(jié)構(gòu)特征,建立空間引力模型,同時(shí),建立一個(gè)描述空間信息的馬爾科夫隨機(jī)場(chǎng),將其引入帶空間引力模型中,對(duì)圖像中的邊緣細(xì)節(jié)信息進(jìn)行保存,從而實(shí)現(xiàn)對(duì)遙感圖像的聚類。實(shí)驗(yàn)結(jié)果表明,該方法的聚類效果優(yōu)于一般聚類方法,但是在聚類效率方面還有待提升。文獻(xiàn)[8]提出了基于因子圖模型的動(dòng)態(tài)圖半監(jiān)督聚類算法,該方法通過捕捉動(dòng)態(tài)圖的節(jié)點(diǎn)屬性與邊鄰接屬性,獲取節(jié)點(diǎn)的快照信息,并對(duì)這些信息進(jìn)行分類聚類。實(shí)驗(yàn)結(jié)果表明,該方法能夠滿足聚類結(jié)果的先驗(yàn)知識(shí),能夠捕捉動(dòng)態(tài)的演化規(guī)律,但是該方法與上述傳統(tǒng)方法類似,在聚類結(jié)果準(zhǔn)確性與聚類時(shí)間方面存在不足。

        為了解決傳統(tǒng)方法在圖像聚類結(jié)果與聚類時(shí)間等方面的不足,提出基于大數(shù)據(jù)的混合屬性圖像冗余特征聚類算法,充分考慮多種混合屬性圖像的特性,通過大數(shù)據(jù)技術(shù)實(shí)現(xiàn)對(duì)其冗余特征的有效聚類。本文研究的主要?jiǎng)?chuàng)新點(diǎn)如下:

        (1)通過建立圖像聚類目標(biāo)函數(shù),實(shí)現(xiàn)對(duì)圖像混合屬性特征的分類,降低了特征誤分率。

        (2)采用大數(shù)據(jù)挖掘技術(shù)對(duì)混合屬性圖像的冗余特征進(jìn)行進(jìn)一步聚類,提升了特征聚類的全面性。

        (3)最后,通過實(shí)驗(yàn)驗(yàn)證了所設(shè)計(jì)方法的聚類效果,從多方面驗(yàn)證了該方法的應(yīng)用價(jià)值。

        1 混合屬性圖像冗余特征聚類算法

        相對(duì)于具備相同屬性的圖像類別而言,混合屬性圖像特征提取算法需要花費(fèi)更多的時(shí)間進(jìn)行類別劃分,并且在劃分中還要保證劃分結(jié)果的準(zhǔn)確性,以保障聚類精度。為此,考慮到圖像的語義屬性、非語義屬性[9],在進(jìn)行特征聚類之前首先對(duì)混合屬性進(jìn)行具體分析,然后建立圖像特征聚類的目標(biāo)函數(shù),借助大數(shù)據(jù)挖掘技術(shù)獲取最終的聚類結(jié)果。

        1.1 混合屬性圖像分析

        在混合屬性圖像分析中將零樣本圖像分類數(shù)據(jù)集Shoes[10]作為理論基礎(chǔ),根據(jù)該理論得到混合屬性圖像構(gòu)造示意圖,如圖1所示。

        圖1 混合屬性圖像構(gòu)造示意圖

        根據(jù)圖1可知,可以將圖像的屬性劃分為語義屬性和非語義屬性,其中,語義屬性是指圖像中包含某種語義信息,具體包括視覺層、對(duì)象層和概念層,視覺層具體指顏色、紋理和形狀等內(nèi)容;對(duì)象層具體指某一對(duì)象在某一時(shí)刻的狀態(tài);概念層是指圖像中最接近人類理解的東西。而非語義屬性是指圖像不具備語義信息,即除語義信息之外的內(nèi)容。在實(shí)際分類中,可以采用稀疏編碼方法實(shí)現(xiàn)對(duì)圖像屬性進(jìn)行分類,通過稀疏編碼方法重構(gòu)圖像低層特征,重構(gòu)后的圖像不具備語義信息,即可將其歸為非語義屬性一類,而剩余部分即為語義屬性。同時(shí),采取重復(fù)操作的方式保證屬性分類的準(zhǔn)確性。

        根據(jù)稀疏編碼方法實(shí)現(xiàn)混合屬性圖像分類,針對(duì)混合屬性圖像的語義屬性建立一個(gè)語義屬性集合A,A={a1,a2,a3,a4,...,an},非語義屬性集合B,B={b1,b2,...,bn}。由于傳統(tǒng)方法在進(jìn)行屬性分析時(shí),得到的圖像屬性相似性過高,導(dǎo)致圖像屬性模糊不清,為了避免該問題的出現(xiàn),將上述屬性作為圖像特征分類的依據(jù),避免不同屬性特征之間的混淆,同時(shí),由于圖像特征屬性具有有限性[11],因此,針對(duì)不同的圖像特征進(jìn)行稀疏編碼,并對(duì)編碼后的圖像屬性進(jìn)行重新定義:將語義屬性與非語義屬性進(jìn)行混合形成混合屬性,有助于實(shí)現(xiàn)對(duì)相似類別的有效區(qū)分,二者之間相互輔助并不會(huì)對(duì)特征分類造成影響。

        1.2 建立圖像聚類目標(biāo)函數(shù)

        根據(jù)混合屬性圖像分析結(jié)果,建立一個(gè)圖像樣本集,S={s1,s2,...,si},其中,i表示樣本圖像個(gè)數(shù),si表示第i個(gè)樣本的特征值。用l表示特征類別數(shù)量,其為一個(gè)正整數(shù),在對(duì)圖像特征進(jìn)行聚類之前,首先對(duì)特征類別進(jìn)行劃分,在圖像樣本集中獲取圖像類別Sl。

        由于混合屬性圖像的樣本集中包含了大量的樣本類型,因此,進(jìn)行類別劃分的任務(wù)量非常大,為了獲取較為精準(zhǔn)的劃分結(jié)果,可以通過建立一個(gè)分類矩陣來實(shí)現(xiàn)。[12]在建立分類矩陣之前,先設(shè)定一個(gè)目標(biāo)函數(shù),以其作為分類準(zhǔn)則:

        (1)

        其中:Gs表示圖像維度;Cs表示概率約束;ai表示語義屬性特征的隸屬度;bi表示非語義屬性特征的隸屬度。

        通過歐幾里得距離實(shí)現(xiàn)對(duì)樣本圖像特征之間的差異性測(cè)度,具體可以通過公式(2)實(shí)現(xiàn):

        (2)

        其中:φ表示混合類型目標(biāo);αi表示樣本的底層特征;λ表示權(quán)重衰減系數(shù)。

        假設(shè)樣本圖像之間不僅具有數(shù)值混合特征,而且具有類屬混合特征,則不同樣本可以通過公式(3)進(jìn)行表示:

        (3)

        根據(jù)公式(3)可以獲得混合類型目標(biāo)v1和v2之間的差異性測(cè)度:

        g(v1,v2)=g(v0,v0)+μ(v1,v2)

        (4)

        其中:v0表示特征之間的差異系數(shù);g表示一個(gè)權(quán)值,用于調(diào)節(jié)不同特征在目標(biāo)函數(shù)中所占的比例;μ表示圖像特征類型的模糊劃分結(jié)果。

        聯(lián)立公式(1)-(3)獲取更新之后的目標(biāo)函數(shù):

        G'

        (5)

        根據(jù)更新后的目標(biāo)函數(shù)對(duì)圖像混合屬性特征進(jìn)行分類時(shí),為了使誤分率控制在最低值,可以通過模糊劃分的形式,分別獲取混合類型目標(biāo)v1和v2的最小值,以此實(shí)現(xiàn)對(duì)混合屬性圖像樣本的有效劃分。

        1.3 大數(shù)據(jù)挖掘下混合屬性圖像冗余特征聚類的實(shí)現(xiàn)

        上文通過建立圖像聚類目標(biāo)函數(shù)獲取了混合屬性圖像目標(biāo)劃分結(jié)果,以劃分結(jié)果為基礎(chǔ),采用大數(shù)據(jù)挖掘技術(shù)對(duì)混合屬性圖像的冗余特征進(jìn)行聚類。[13-15]由于傳統(tǒng)方法沒有針對(duì)特征集中的圖像冗余特征進(jìn)行具體分析,導(dǎo)致聚類結(jié)果的全面性較差,為此,本文采用數(shù)據(jù)挖掘技術(shù)對(duì)混合屬性圖像的冗余特征進(jìn)行挖掘,以挖掘結(jié)果為基礎(chǔ),再通過聚類集成算法實(shí)現(xiàn)對(duì)冗余特征的聚類。[16]

        首先,根據(jù)混合屬性特征的隸屬度,設(shè)置冗余特征挖掘時(shí)需滿足的條件:

        (6)

        其中:Ci表示特征集中的子項(xiàng);Vi表示特征離散程度;Vim表示特征丟失量;an-1表示語義屬性特征中的冗余特征;bn-1表示非語義屬性特征中的冗余特征。

        在滿足上述條件的情況下,可以挖掘出圖像冗余特征,根據(jù)挖掘結(jié)果采用聚類集成算法實(shí)現(xiàn)冗余特征聚類,具體實(shí)現(xiàn)步驟如下:

        (1)將bigging思想[17]作為樣本挖掘的基礎(chǔ),首先通過樣本抽樣實(shí)現(xiàn)對(duì)冗余特征的進(jìn)一步采集與挖掘,由于運(yùn)用bigging思想會(huì)得到多個(gè)樣本子集,因此,運(yùn)用K-means方法再進(jìn)行深層次的挖掘,該方法可以保證聚類結(jié)果近似于實(shí)際樣本特征結(jié)果,在最大程度上實(shí)現(xiàn)對(duì)冗余特征的聚類。[18]

        (2)以運(yùn)用K-means方法獲取的聚類結(jié)果為基礎(chǔ),采用聚類集成思想將聚類結(jié)果形成一個(gè)聚類集,并對(duì)聚類結(jié)果進(jìn)行總結(jié)。

        (3)建立一個(gè)互聯(lián)矩陣,對(duì)聚類結(jié)果進(jìn)行分層,再進(jìn)行特征合并,合并結(jié)果作為最終聚類的依據(jù),以此來降低異常值對(duì)聚類結(jié)果的影響,保障聚類結(jié)果的精度。圖2為混合屬性圖像冗余特征聚類流程圖。

        圖2 混合屬性圖像冗余特征聚類流程圖

        根據(jù)上述分析,實(shí)現(xiàn)了對(duì)混合屬性圖像冗余特征的聚類,下面對(duì)該方法的聚類優(yōu)勢(shì)進(jìn)行分析:

        (1)該方法可以在冗余特征聚類樣本一致的條件下,對(duì)特殊的樣本進(jìn)行有效聚類,解決了傳統(tǒng)方法僅面向單一圖像屬性的問題。

        (2)聚類結(jié)果中不僅包含語義特征集合,又包含非語義特征集合,聚類結(jié)果的覆蓋面較廣,說明該方法具有全面性的優(yōu)勢(shì)。

        2 仿真實(shí)驗(yàn)驗(yàn)證

        為了驗(yàn)證所設(shè)計(jì)基于大數(shù)據(jù)的混合屬性圖像冗余特征聚類算法的有效性,以聚類精度與聚類時(shí)間為實(shí)驗(yàn)指標(biāo),分別采用所設(shè)計(jì)方法、文獻(xiàn)[6]方法、文獻(xiàn)[7]和文獻(xiàn)[8]方法進(jìn)行聚類性能測(cè)試。

        2.1 實(shí)驗(yàn)環(huán)境設(shè)置與數(shù)據(jù)集構(gòu)造

        在進(jìn)行測(cè)試之前,首先對(duì)實(shí)驗(yàn)環(huán)境與實(shí)驗(yàn)中涉及的參數(shù)進(jìn)行具體設(shè)置,由于采取的是仿真實(shí)驗(yàn)的模式,因此,將不同方法均搭載在同一個(gè)仿真平臺(tái)上,該平臺(tái)的參數(shù)如表1所示。

        以表1所示的硬件設(shè)計(jì)條件為基礎(chǔ),對(duì)實(shí)驗(yàn)數(shù)據(jù)集進(jìn)行構(gòu)建。為了提升聚類結(jié)果的全面性,選取的數(shù)據(jù)樣本中具有10個(gè)特征,具體分為類屬型與數(shù)值型兩個(gè)類別,每組類別具有3個(gè)正態(tài)分布的特征點(diǎn)。數(shù)據(jù)集中總共包含500個(gè)樣本,樣本集中的圖像大小均為1 500~8 500pxl,對(duì)500個(gè)樣本通過疊加的方式將特征點(diǎn)由二維擴(kuò)展到三維模式。同時(shí),對(duì)不同類型的特征進(jìn)行賦值,具體賦值方法為:對(duì)大部分特征類型賦予相同的類屬值,余下的部分賦予不同的類屬值,需要注意的是,該操作應(yīng)該在隨機(jī)的條件下進(jìn)行,并且每個(gè)特征的類屬值并不代表其類別信息。

        表1 仿真平臺(tái)參數(shù)設(shè)置

        在完成實(shí)驗(yàn)環(huán)境設(shè)置與數(shù)據(jù)集構(gòu)造之后,進(jìn)行實(shí)驗(yàn)操作,為了保障實(shí)驗(yàn)結(jié)果的一致性與可靠性,不同方法統(tǒng)一在表1設(shè)置的實(shí)驗(yàn)環(huán)境下進(jìn)行訓(xùn)練,并且實(shí)驗(yàn)時(shí)間保持一致。

        2.2 實(shí)驗(yàn)結(jié)果及其分析

        以不同類型圖像為測(cè)試目標(biāo),為測(cè)試所設(shè)計(jì)方法的通用性,在樣本圖像數(shù)量不同的條件下,采用不同方法對(duì)混合屬性圖像冗余特征進(jìn)行聚類,以聚類精度為對(duì)比指標(biāo),得出不同方法的聚類結(jié)果,如圖3所示。

        圖3 不同方法聚類精度對(duì)比

        分析圖3可知,采用不同方法對(duì)混合屬性圖像冗余特征進(jìn)行聚類時(shí),當(dāng)?shù)螖?shù)為8次時(shí),文獻(xiàn)[6]方法的聚類精度為28%,文獻(xiàn)[7]方法的聚類精度為42%,文獻(xiàn)[8]方法的聚類精度為29%,所設(shè)計(jì)方法的聚類精度為69%。并且所設(shè)計(jì)方法的聚類精度最高值達(dá)到了90%以上,明顯高于傳統(tǒng)方法,并且優(yōu)勢(shì)從開始聚類到聚類結(jié)束能夠一直保持,說明所設(shè)計(jì)方法在聚類精度方面具有顯著性優(yōu)勢(shì)。這是由于所設(shè)計(jì)方法在進(jìn)行冗余特征聚類之前,首先建立一個(gè)圖像聚類目標(biāo)函數(shù),在滿足該目標(biāo)函數(shù)的前提下,再通過數(shù)據(jù)挖掘技術(shù)挖掘出冗余特征,從而提升了特征挖掘精度。

        為了進(jìn)一步驗(yàn)證所設(shè)計(jì)方法的全面性,以聚類時(shí)間為實(shí)驗(yàn)指標(biāo),對(duì)比不同方法的聚類性能,結(jié)果如圖4所示。

        圖4 不同方法聚類時(shí)間對(duì)比

        分析圖4可知,所設(shè)計(jì)方法下混合屬性圖像冗余特征聚類時(shí)間明顯低于傳統(tǒng)方法,其聚類時(shí)間始終低于0.75s,最低聚類時(shí)間僅為0.53s,雖然最低聚類時(shí)間與文獻(xiàn)[8]方法相同,但是傳統(tǒng)方法的聚類時(shí)間最高值均達(dá)到了0.9s以上,不同方法之間的差距仍然十分明顯。通過對(duì)比可知,所設(shè)計(jì)方法具有較高的聚類精度,可以在最短的時(shí)間內(nèi)對(duì)海量冗余特征進(jìn)行有效聚類。這是由于該方法通過對(duì)混合屬性圖像的分析,針對(duì)不同圖像特征進(jìn)行稀疏編碼,有助于實(shí)現(xiàn)對(duì)相似類別特征的有效區(qū)分,降低了后續(xù)特征聚類的難度,為特征聚類提供了便利。

        綜合上述實(shí)驗(yàn)結(jié)果可知,所設(shè)計(jì)方法在特征聚類時(shí)間和聚類精度方面具有明顯的優(yōu)勢(shì),降低了圖像處理難度,可以有效排除圖像中的冗余特征,為圖像分割、圖像融合、圖像分類等圖像處理手段提供良好的基礎(chǔ),可廣泛應(yīng)用于圖像處理領(lǐng)域中。

        3 結(jié)束語

        面向不同屬性圖像進(jìn)行冗余特征聚類時(shí),由于圖像屬性在類屬與數(shù)值方面的差異性,傳統(tǒng)方法并不能有效對(duì)不同類型特征進(jìn)行處理,僅能夠?qū)我粚傩赃M(jìn)行有效聚類,在面向混合屬性圖像特征處理時(shí),存在聚類時(shí)間較長(zhǎng)和聚類精度較低的問題,為此,提出基于大數(shù)據(jù)的混合屬性圖像冗余特征聚類算法。通過分析混合屬性圖像特征,建立目標(biāo)函數(shù),在滿足目標(biāo)函數(shù)的基礎(chǔ)上,采用數(shù)據(jù)挖掘技術(shù)對(duì)冗余特征進(jìn)行分類,最終根據(jù)分類結(jié)果實(shí)現(xiàn)特征聚類。實(shí)驗(yàn)結(jié)果表明,所設(shè)計(jì)方法在聚類時(shí)間與聚類精度方面均優(yōu)于傳統(tǒng)方法,充分展示了該方法的聚類性能,可以為圖像處理領(lǐng)域提供可靠的技術(shù)支撐。雖然所設(shè)計(jì)方法取得了明顯的效果,但是為了從深層次提升該方法的應(yīng)用價(jià)值,接下來會(huì)將聚類全面性作為研究目標(biāo),進(jìn)一步提升方法性能。

        猜你喜歡
        語義聚類混合
        混合宅
        一起來學(xué)習(xí)“混合運(yùn)算”
        語言與語義
        基于DBSACN聚類算法的XML文檔聚類
        油水混合
        “上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
        基于改進(jìn)的遺傳算法的模糊聚類算法
        一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
        認(rèn)知范疇模糊與語義模糊
        混合所有制
        熟妇丰满多毛的大隂户| 综合成人亚洲网友偷自拍| av手机在线观看不卡| 天天碰免费上传视频| 亚洲欧洲日产国码高潮αv| 国产成人香蕉久久久久| 在线观看一区二区三区国产| 少妇被又大又粗又爽毛片久久黑人| 97久久人人超碰超碰窝窝| 亚洲中文字幕无码久久2018| 大又黄又粗又爽少妇毛片| 精品一二三四区中文字幕| 男女啪啪无遮挡免费网站| 亚洲男人的天堂精品一区二区| 亚洲一区二区三区一区| 久久免费看黄a级毛片| 国产亚洲精品资源在线26u| 精选麻豆国产AV| 国产一区二区三区av观看| 日本一区二区三区爆乳| 精品久久人人爽天天玩人人妻| 天天中文字幕av天天爽| 亚洲最大av在线精品国产| 777米奇色狠狠俺去啦| 91av精品视频| 国产一区二区三区影片| 日本高清乱码中文字幕| 尤物视频在线观看| 香蕉国产人午夜视频在线观看| 亚洲中文乱码在线视频| 内射口爆少妇麻豆| 国产精品久久久久免费a∨| 亚洲精品二区在线观看| 中国人在线观看免费的视频播放 | 台湾佬自拍偷区亚洲综合| 男人的天堂av网站一区二区| 国产精品自拍视频在线| 久久久中日ab精品综合| 国产98在线 | 免费| 一区二区久久精品66国产精品| 日本一区二区三级在线观看|