亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        層疊圖像空間位置特征的自適應(yīng)標(biāo)注仿真研究

        2021-11-19 08:17:58王培培陳斯宇
        計(jì)算機(jī)仿真 2021年10期
        關(guān)鍵詞:語(yǔ)義聚類文獻(xiàn)

        王培培,陳斯宇

        (吉林大學(xué),吉林 長(zhǎng)春 130000)

        1 引言

        由于共享信息的不斷膨脹,網(wǎng)絡(luò)中圖像的數(shù)量也在快速增長(zhǎng),其中隱藏著復(fù)雜且眾多的信息量,因此,如何對(duì)網(wǎng)絡(luò)上的圖像信息進(jìn)行有效而迅速的管理成為了當(dāng)今時(shí)代的熱點(diǎn)問(wèn)題。圖像自動(dòng)標(biāo)注是解決圖像檢索過(guò)程中至關(guān)重要的步驟,這一過(guò)程取決于檢索過(guò)程中圖像的內(nèi)容,計(jì)算機(jī)根據(jù)圖像的內(nèi)容自動(dòng)生成圖像對(duì)應(yīng)的標(biāo)注性關(guān)鍵字[1-3]。在圖像檢索過(guò)程中,經(jīng)常采用三種特征,分別為:顏色特征、形狀特征和紋理特征[4-6]。其中顏色特征可以最簡(jiǎn)單的描述一副圖像的視覺(jué)特征;形狀特征可以最本質(zhì)的決定整幅圖像的含義,同時(shí)可以最直接的用于對(duì)圖像進(jìn)行識(shí)別;紋理特征可以描述圖像結(jié)構(gòu)與顏色分布,是刻畫像素鄰域灰度空間分布的一種特征。圖像自動(dòng)標(biāo)注作為實(shí)現(xiàn)圖像高層語(yǔ)言的理解,通過(guò)計(jì)算機(jī)生成圖像的語(yǔ)言描述,幫助人類迅速有效地理解圖像,具有重要的實(shí)用價(jià)值。文獻(xiàn)[7]融合PLSA和隨機(jī)游走模型的自動(dòng)圖像方法,對(duì)已經(jīng)標(biāo)注的圖像文本信息,構(gòu)建一個(gè)非對(duì)等模態(tài)的PLSA模型,來(lái)計(jì)算圖像初始語(yǔ)言標(biāo)注,然后與相關(guān)聯(lián)的視覺(jué)信息構(gòu)建標(biāo)注圖像,在所構(gòu)建的相似性圖像上隨機(jī)游走,進(jìn)一步分析初始語(yǔ)言標(biāo)注的潛在語(yǔ)言關(guān)聯(lián),最終獲得圖像的精準(zhǔn)化語(yǔ)言標(biāo)注,該方法能夠更好的標(biāo)注圖像效果和檢索性能,然而,該方法過(guò)于依賴圖像的視覺(jué)特性,很容易引起多義和同義現(xiàn)象。文獻(xiàn)[8]采用一種小波域K-Means遙感圖像分類標(biāo)注算法,利用K-Means提取遙感圖像的紋理特征,對(duì)遙感圖像在小波域的分布特征進(jìn)行濾波處理,利用語(yǔ)義對(duì)濾波后的圖像采取矢量分割歸類,對(duì)快速標(biāo)注的圖像進(jìn)行視覺(jué)分析,該方法能夠?qū)ψ兓膱D像得到更好的檢測(cè)結(jié)果,但是在分割的過(guò)程中很容易造成過(guò)分割和欠分割的現(xiàn)象。文獻(xiàn)[9]基于多特征融合與PLSA-GMM的圖像自動(dòng)標(biāo)注方法,在圖像檢索過(guò)程中提取顏色特征、形狀特征和紋理特征,然后融合PLSA與GMM構(gòu)建圖像底層特征和所標(biāo)注的關(guān)鍵詞之間的聯(lián)系,實(shí)現(xiàn)對(duì)圖像的自動(dòng)標(biāo)注,采用Corel 5k數(shù)據(jù)庫(kù)驗(yàn)證結(jié)果表明該方法能夠較好的對(duì)圖像進(jìn)行標(biāo)注,但圖像處理的效率較低。

        基于以上研究的優(yōu)缺點(diǎn),本文根據(jù)圖像在空間位置上的特征關(guān)系,將判別模型與生成模型的優(yōu)點(diǎn)相結(jié)合來(lái)提高圖像標(biāo)注的性能,通過(guò)構(gòu)建層疊圖像標(biāo)注模型與自適應(yīng)劃分標(biāo)注的方法相結(jié)合,利用相對(duì)很少的訓(xùn)練圖像實(shí)現(xiàn)更好的標(biāo)注結(jié)果,增強(qiáng)圖像區(qū)域自適應(yīng)劃分標(biāo)注的精度,有利于增強(qiáng)圖像的畫質(zhì)感,提高圖像標(biāo)注的效率。

        2 圖像空間位置特征

        對(duì)于任意一幅圖像,人類更容易被與周圍事物反差相對(duì)較大的事物所吸引。圖像的位置特征在人類視覺(jué)方面有著至關(guān)重要的影響。相鄰區(qū)域的高度對(duì)比,與相距較遠(yuǎn)區(qū)域的高度對(duì)比,人類的視覺(jué)通常對(duì)前者的沖擊更為敏感。回想人類對(duì)事物觀察的情景,人類常常通過(guò)轉(zhuǎn)動(dòng)視角把吸引自己的事物匯聚在視角中心。與此相似,在圖像采集過(guò)程中,圖像的空間位置特征屬于圖像標(biāo)注的一部分,假設(shè)圖像在空間中的某點(diǎn)Q,其在空間坐標(biāo)系中的坐標(biāo)表示為(X,Y,Z),左右視覺(jué)像的平面坐標(biāo)分別表示為(ul,vl)和(ur,vr),在空間中圖像的位置關(guān)系如圖1所示。

        圖1 空間中圖像的位置關(guān)系

        在空間視覺(jué)系統(tǒng)中,通過(guò)建立在同一個(gè)視覺(jué)坐標(biāo)系下的圖像,得到兩組關(guān)于空間三維信息的線性方程,可以表示為

        (al1-ulcl1)·X+(al2-ulcl2)·Y+(al3-ulcl3)·Z

        =ulZl-Xl(bl1-vlcl1)·X+(bl2-vlcl2)·Y

        +(bl3-vlcl3)·Z

        =vl·Zl-Yl

        (1)

        (ar1-urcr1)·X+(ar2-urcr2)·Y+(ar3-urcr3)·Z

        =urZr-Xr(br1-vrcr1)·X+(br2-vrcr2)·Y

        +(br3-vrcr3)·Z

        =vr·Zr-Yr

        (2)

        其中,(al1,al2,al3)、(bl1,bl2,bl3)、(cl1,cl2,cl3)和(Xl,Yl,Zl)分別表示左視覺(jué)的參數(shù)坐標(biāo);(ar1,ar2,ar3)、(br1,br2,br3)、(cr1,cr2,cr3)和(Xr,Yr,Zr)分別表示右視覺(jué)的參數(shù)坐標(biāo)。假設(shè)所使用的左右視覺(jué)參數(shù)均為已知,且對(duì)視覺(jué)模型進(jìn)行構(gòu)建,已知左右視覺(jué)坐標(biāo)(ul,vl)、(ur,vr)和內(nèi)外參數(shù),即可求解點(diǎn)Q的空間位置坐標(biāo)(X,Y,Z),用方程可表示為

        aX+bY+cZ=1

        (3)

        其中,H=(a,b,c)T表示已知的方程系數(shù)。將圖像空間位置引入到測(cè)試過(guò)程中,利用區(qū)域輪廓距離圖像中心的大小構(gòu)建空間位置特征函數(shù),提高圖像區(qū)域顯著性。歸一化后的圖像位置特征函數(shù)表示為

        (4)

        Ei即表示第i個(gè)圖像區(qū)域的位置特征函數(shù),且滿足Ei∈[0,1];(xi,yi)點(diǎn)表示第i個(gè)圖像區(qū)域的質(zhì)點(diǎn)坐標(biāo);H和W分別表示圖像區(qū)域的高度和寬度。通過(guò)上述公式便可求解出空間中的任意圖像坐標(biāo)點(diǎn),求出對(duì)應(yīng)的空間位置。

        3 層疊圖像標(biāo)注模型分析

        本文提出的層疊圖像標(biāo)注模型主要思想是利用自適應(yīng)算法給一幅待標(biāo)注的圖像進(jìn)行聚類,然后判斷這幅待標(biāo)注圖像的類別,選取其中類別概率相對(duì)高的幾種聚類作為該圖像的相關(guān)圖像集合,利用模型和待標(biāo)注圖像的相關(guān)圖像集合對(duì)圖像進(jìn)行標(biāo)注。

        在本文的層疊自動(dòng)標(biāo)注模型中,將待標(biāo)注的圖像分配到其對(duì)應(yīng)的聚類里面,這相當(dāng)于圖像標(biāo)注中的第一層標(biāo)注(主題標(biāo)注),主題標(biāo)注是給待標(biāo)注的圖像標(biāo)注幾個(gè)待選擇的主題內(nèi)容,所謂的主題是對(duì)所有的訓(xùn)練圖像進(jìn)行聚類得到的,因此每個(gè)聚類下所有的圖像內(nèi)容都應(yīng)與主題一一對(duì)應(yīng),主題概念只針對(duì)同一個(gè)視覺(jué)下的抽象概念,不具備實(shí)際意義。

        本文通過(guò)構(gòu)建圖像和關(guān)鍵詞的方法構(gòu)建兩者之間的聯(lián)系。將每個(gè)關(guān)鍵詞和所對(duì)應(yīng)的圖像構(gòu)成一個(gè)集合,同個(gè)集合中的圖像最少對(duì)應(yīng)某一種相同的關(guān)鍵詞,這樣圖像集合的個(gè)數(shù)便取決于所標(biāo)注的詞匯個(gè)數(shù)。由于實(shí)際生活中同一種場(chǎng)景里面的不同物體之間必然存在著某種客觀聯(lián)系,因此通過(guò)相同的語(yǔ)義目標(biāo)所建立的同一個(gè)集合里不同物體之間一定會(huì)存在著直接或間接的聯(lián)系,這樣就可以方便的建立相似場(chǎng)景里圖像和關(guān)鍵詞之間的關(guān)系了。

        根據(jù)以上分析,需要設(shè)計(jì)迭代算法,選擇最優(yōu)圖像集合對(duì)相關(guān)圖像進(jìn)行拓展,在層疊圖像標(biāo)注模型中,對(duì)待標(biāo)注圖像進(jìn)行訓(xùn)練的權(quán)值用公式可表示為

        (5)

        (6)

        (7)

        (8)

        那么第t+1次迭代時(shí)對(duì)應(yīng)圖像的權(quán)值用公式可表示為

        (9)

        (10)

        (11)

        綜上所述,待標(biāo)注圖像集合迭代算法終止條件用公式可表示為:

        (12)

        其中,αbn表示按降序排列時(shí)相對(duì)應(yīng)圖像的權(quán)值;R表示最終所選定圖像集合的大小;θ表示相鄰兩次迭代相對(duì)應(yīng)圖像差值的閾值大??;?表示迭代次數(shù)閾值大小。

        4 自適應(yīng)圖像標(biāo)注

        每幅圖像區(qū)域和標(biāo)注詞之間并不是完全對(duì)應(yīng)關(guān)系,上節(jié)的目的只是為了找到整幅待標(biāo)注圖像中最合適的若干標(biāo)注詞,為了準(zhǔn)確找到圖像標(biāo)注詞,本節(jié)采用自適應(yīng)劃分標(biāo)注的方法對(duì)圖像進(jìn)行標(biāo)注。

        按照密度運(yùn)行的多樣性可知,應(yīng)在圖像區(qū)域里面確定一個(gè)最優(yōu)的標(biāo)注,把每幅圖片打包成一個(gè)整體,經(jīng)過(guò)自適應(yīng)劃分后,將圖像作為包中的一個(gè)典范。假設(shè)把標(biāo)注集合C(x(t))的圖像bi作為一個(gè)包,圖像塊zi∈bi作為包中的一個(gè)典范,就圖像集合R而言,在自適應(yīng)劃分標(biāo)注中,圖像集合用公式可表示為

        G={Fi,Hi}·Ki

        (13)

        其中,G表示學(xué)習(xí)樣本;Hi表示Fi相對(duì)應(yīng)的標(biāo)注集合;Ki表示學(xué)習(xí)樣本G中圖像的個(gè)數(shù)。就h∈H而言,如果圖像Fi中有一樣的標(biāo)注,可將其規(guī)定為正包,不一樣的標(biāo)注規(guī)定為負(fù)包。通過(guò)計(jì)算zi與正負(fù)包之間的距離,能夠求得zi在不同標(biāo)注值h下的得分值。那么選擇最大得分值所對(duì)應(yīng)的圖像標(biāo)注便是圖像的最佳標(biāo)注,得分值用公式表示為

        (14)

        其中,F(xiàn)Z(u,v)表示標(biāo)注為v時(shí)圖像u所對(duì)應(yīng)的得分值FZ;minFi表示在圖像空間位置范圍內(nèi),與典范圖像u最近的Fi包中的任何一個(gè)典范圖像;maxFi表示圖像空間位置范圍內(nèi),與典范圖像u最遠(yuǎn)的Fi包中的任何一個(gè)典范圖像;minFi和maxFi應(yīng)分別滿足如下公式

        (15)

        (16)

        綜上所述,可以通過(guò)求得分值FZ最大時(shí)的標(biāo)注作為圖像典范的最佳標(biāo)注,因此便可以實(shí)現(xiàn)圖像區(qū)域的自適應(yīng)劃分標(biāo)注。

        5 仿真與結(jié)果分析

        為了驗(yàn)證提出的層疊圖像空間位置特征自適應(yīng)標(biāo)注方法的可行性,本文在Corel5k數(shù)據(jù)包上進(jìn)行實(shí)驗(yàn),該數(shù)據(jù)包包含多組圖片集合共10000幅圖像,每個(gè)數(shù)據(jù)包中包含相同主題的圖像有200幅,每幅圖像中有2~10個(gè)左右的關(guān)鍵詞,總計(jì)關(guān)鍵詞為520個(gè)。將圖像的視覺(jué)特征劃分為64×64的圖像區(qū)域,并將圖像區(qū)域劃分成1618維度的特征向量,其中顏色特征為162維度、形狀特征為240維度、紋理特征為118維度。最后將這些特征聚集成為視覺(jué)圖像,把每幅圖像打成一個(gè)包,從而構(gòu)建層疊圖像標(biāo)注模型。

        5.1 語(yǔ)義標(biāo)注結(jié)果

        為了驗(yàn)證本文設(shè)計(jì)的標(biāo)注性能,在Corel5k數(shù)據(jù)包上,將最佳性能的98個(gè)關(guān)鍵詞和總計(jì)的520個(gè)關(guān)鍵詞分別構(gòu)成集合,基于語(yǔ)義標(biāo)注結(jié)果對(duì)文獻(xiàn)[7]、文獻(xiàn)[8]、文獻(xiàn)[9]和本文的方法進(jìn)行對(duì)比。語(yǔ)義標(biāo)注結(jié)果如表1所示。

        表1 語(yǔ)義標(biāo)注結(jié)果

        從表1中可以看出,本文提出的自適應(yīng)標(biāo)注算法標(biāo)注結(jié)果明顯優(yōu)于其它幾種算法,即使當(dāng)一些關(guān)鍵詞沒(méi)有顯示在最初標(biāo)注的情況下,但通過(guò)本文算法在某種程度上也能使多數(shù)關(guān)鍵詞標(biāo)注在圖像中。本文提出的算法在最佳性能關(guān)鍵詞為98個(gè)時(shí),語(yǔ)義標(biāo)注的結(jié)果分別高出文獻(xiàn)[7]、文獻(xiàn)[8]和文獻(xiàn)[9]約13%、19%和26%。總關(guān)鍵詞為520個(gè)時(shí),對(duì)圖像語(yǔ)義標(biāo)注結(jié)果明顯優(yōu)于文獻(xiàn)[7]、文獻(xiàn)[8]和文獻(xiàn)[9],且語(yǔ)義標(biāo)注的結(jié)果分別高出18%、20%和28%,表明本文方法具有更好的特征識(shí)別效果與標(biāo)注的全面性。

        5.2 標(biāo)注性能分析

        為了進(jìn)一步驗(yàn)證本文提出方法的可行性,基于Corel5k數(shù)據(jù)包上,在總關(guān)鍵詞為520、標(biāo)注詞由2個(gè)增加到10個(gè)時(shí),將圖像標(biāo)注的準(zhǔn)確性與文獻(xiàn)[7]、文獻(xiàn)[8]和文獻(xiàn)[9]進(jìn)行橫向?qū)Ρ?,有關(guān)準(zhǔn)確性的對(duì)比結(jié)果如圖2所示。

        圖2 圖像標(biāo)注準(zhǔn)確性對(duì)比結(jié)果

        從圖中可以看出,當(dāng)標(biāo)注詞由2個(gè)增加到10個(gè)時(shí),圖像標(biāo)注的準(zhǔn)確率呈下降的趨勢(shì),但與其它三種方法相比,本文所提的自適應(yīng)劃分標(biāo)注方法具有最好的標(biāo)注性能,準(zhǔn)確率最高。標(biāo)注準(zhǔn)確率在關(guān)鍵詞高達(dá)到10個(gè)時(shí),分別高出文獻(xiàn)[7]、文獻(xiàn)[8]和文獻(xiàn)[9]約15.7%、20.3%和35.2%。

        6 結(jié)束語(yǔ)

        隨著網(wǎng)絡(luò)信息的快速發(fā)展,網(wǎng)絡(luò)上的圖像信息管理成為了人們關(guān)注的重點(diǎn)問(wèn)題,針對(duì)這一情況,本文提出了層疊圖像空間位置特征的自適應(yīng)標(biāo)注方法。首先,類比人類采集圖像的過(guò)程,根據(jù)圖像的空間位置特征求解出空間中的任意圖像坐標(biāo)點(diǎn),歸一化圖像位置特征函數(shù),求出對(duì)應(yīng)的空間位置。其次,對(duì)待標(biāo)注的圖像進(jìn)行聚類,選取其中類別概率相對(duì)高的幾種聚類作為該圖像的相關(guān)圖像集合,利用迭代算法對(duì)待標(biāo)注圖像進(jìn)行擴(kuò)展。最后,按照密度運(yùn)行的多樣性,把標(biāo)注集合的圖像作為一個(gè)包,求解出最大得分值對(duì)應(yīng)的圖像,得到最佳標(biāo)注。實(shí)驗(yàn)結(jié)果表明,本文提出的自適應(yīng)劃分標(biāo)注算法能夠充分利用圖像包含的特征,分析標(biāo)注出更多的關(guān)鍵詞,提高標(biāo)注的全面性,同時(shí)也顯著提高了標(biāo)注的準(zhǔn)確性。

        猜你喜歡
        語(yǔ)義聚類文獻(xiàn)
        Hostile takeovers in China and Japan
        速讀·下旬(2021年11期)2021-10-12 01:10:43
        語(yǔ)言與語(yǔ)義
        Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
        大東方(2019年12期)2019-10-20 13:12:49
        基于DBSACN聚類算法的XML文檔聚類
        The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
        The Role and Significant of Professional Ethics in Accounting and Auditing
        商情(2017年1期)2017-03-22 16:56:36
        “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
        基于改進(jìn)的遺傳算法的模糊聚類算法
        一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
        認(rèn)知范疇模糊與語(yǔ)義模糊
        日本一区二区高清视频| 欧美性猛交xxxx乱大交蜜桃| 亚洲日韩AV秘 无码一区二区| 亚洲成人色黄网站久久| 免费久久久一本精品久久区| 最新国产美女一区二区三区| 免费夜色污私人影院在线观看| 亚洲成av人在线观看天堂无码| a国产一区二区免费入口| 成人a在线观看| 国产精品无码mv在线观看| 大地资源在线播放观看mv| 91人妻无码成人精品一区91| 一区二区三区国产大片| 国产激情视频免费在线观看| 国产成本人片无码免费2020| 精品中文字幕久久久人妻| 91精品人妻一区二区三区蜜臀| 国产自拍偷拍视频免费在线观看 | 少妇熟女天堂网av天堂| 精品无码国产自产在线观看水浒传 | 蜜桃视频一区二区三区在线| 日本视频一中文有码中文| 中文字幕一区日韩精品| 国内少妇人妻丰满av| 99久久国产一区二区三区| 国产三级视频不卡在线观看| 国语对白做受xxxxx在线| 亚洲国产精品久久久久秋霞1| 免费看黄在线永久观看| 欧美疯狂性受xxxxx喷水| 麻豆亚洲av永久无码精品久久| 亚洲色欲色欲大片WWW无码| 亚洲成人av大片在线观看| 久久97久久97精品免视看| 国产做无码视频在线观看浪潮| 日韩狼人精品在线观看| 国产不卡精品一区二区三区| 国产无遮挡无码视频免费软件| 亚洲中文字幕av天堂| 国内精品国产三级国产|