亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于離散余弦變換基函數(shù)迭代的人臉圖像識別

        2020-03-19 04:39:54于萬波王香香王大慶
        圖學(xué)學(xué)報 2020年1期
        關(guān)鍵詞:傅里葉圖像識別識別率

        于萬波, 王香香, 王大慶

        (大連大學(xué)信息工程學(xué)院,遼寧 大連 116622)

        在圖像識別、圖像追蹤、視頻檢索等領(lǐng)域,圖像特征提取、表示與操作是關(guān)鍵技術(shù)。目前圖像特征包括顏色、紋理、形狀特征及空間關(guān)系特征等,從不同的角度反映圖像的特性與共性等[1-6]。

        使用神經(jīng)網(wǎng)絡(luò)提取圖像特征,如文獻[7]給出的深度學(xué)習(xí)(deep learning)方法具有較好的識別效果。神經(jīng)網(wǎng)絡(luò)方法已經(jīng)逐漸成為一種新的圖像特征表示方式。

        基于混沌理論的圖像識別及理解也有相關(guān)文獻刊載,不過目前仍處于探索階段[8-11]。

        文獻[12-13]發(fā)現(xiàn)一個正弦函數(shù)與一個隨機多項式函數(shù)構(gòu)成動力系統(tǒng),在一定的參數(shù)區(qū)間內(nèi), 混沌的概率接近 90%;在文獻[14]中,使用三角函數(shù)作為輔助函數(shù),迭代得到圖像的近似混沌吸引子,應(yīng)用于 Yalefaces數(shù)據(jù)庫,識別率達到 80%。之所以三角函數(shù)具有較好的混沌特性,是由于其振蕩且多數(shù)位置的導(dǎo)數(shù)絕對值較大??紤]到三角函數(shù)的這種特性,在大腦皮層柱狀結(jié)構(gòu)的啟發(fā)下,嘗試用離散余弦變換基函數(shù)代替正弦函數(shù)作為輔助函數(shù),構(gòu)造動力系統(tǒng)進行研究。

        離散余弦變換(discrete cosine transform,DCT)基函數(shù)在信號處理、圖像壓縮等領(lǐng)域中有著重要的應(yīng)用,這其中可能存在著尚未發(fā)現(xiàn)的機理。

        1 DCT基函數(shù)矩陣與圖像構(gòu)成動力系統(tǒng)

        1.1 DCT基函數(shù)矩陣

        DCT是由基函數(shù)組合而成的。其圖像在空間中呈現(xiàn)出一種形似封閉的凸凹形體,且值域在[-1,1]之間,如圖1所示。

        1.2 DCT基函數(shù)與圖像構(gòu)成動力系統(tǒng)

        DCT基函數(shù)記為E(u,v),圖像函數(shù)記為G(u,v),給定初始值,然后使用式u=z1,v=z2進行迭代,得到動力系統(tǒng),即

        一般當p,q與M,N約數(shù)較少,或者當p,q較大時,動力系統(tǒng)的混沌特性較強,序列不愿意陷入到周期點,圖 2(a)是迭代用的灰度圖像(即式(1)中的G(u,v)),圖2(b)是式(2)迭代后的軌跡(序列)點集,其中p=192,q=128;圖2(c)是當p=192,q=193時迭代后的軌跡(序列)點集;當p=192,q=128時,E(u,v)只有4個值,也就是說,最后u的值只有 4個,也只能在圖像上4條橫線上進行迭代;圖2(d)是當p=255,q=255時的序列點集。

        圖1 離散余弦函數(shù)圖像

        圖2 人臉圖像與不同DCT基函數(shù)的迭代吸引子

        1.3 DCT基函數(shù)作用下的圖像吸引子

        取Yalefaces數(shù)據(jù)庫中的N組(即N個人的)圖像,令p=253,q=251,隨機生成256個迭代初始值(點),每個初始值迭代20次,將大于5的記載下來,得到吸引子。通過初步觀察可以發(fā)現(xiàn),同組圖像的吸引子從形狀上是相似的。下節(jié)將給出具體生成吸引子以及圖像識別方法。

        2 圖像迭代識別方法

        2.1 圖像迭代識別方法

        DCT基函數(shù)作為輔助函數(shù)的迭代識別方法:

        (1) 清空內(nèi)存中存儲的變量。

        (2) 生成DCT基函數(shù)矩陣:①給定M,N,p,q值,計算DCT基函數(shù)矩陣E,對于常用的人臉庫,令M=256,N=256;②將矩陣E的元素調(diào)整為1到256。將E的每個元素加1然后除以2,再乘以256,取整。

        (3) 讀入每組圖像并計算平均特征:①讀入 1幅圖像(適當裁剪邊緣效果較好),用插值方法調(diào)整到256×256大小,存儲在數(shù)組G中,計算G與E迭代得到的吸引子點陣;②計算每一個圖像的吸引子點陣的二維傅里葉變換,變換后的矩陣稱為特征陣,特征存儲在數(shù)組Y(j,i, : ,:)中,表示第j組的第i幅圖像特征。計算每一組圖像的各個特征和平均值,即把每組圖像特征陣相加然后除以該組圖像個數(shù)。將特征存儲在數(shù)組Fea(jj, : ,:)中,jj表示第幾組,后面兩維表示特征。

        (4) 計算要識別圖像的特征:與(3)中第一步計算每組圖像的特征相同,(重新)隨機生成k個初始值,對于每個初始值均迭代d次,將每次迭代后的(u,v)位置記載下來,存儲在數(shù)組R(:,:)中,即將R(u,v)的值設(shè)置為1,直至每個初始值都計算存儲完畢。計算R的二維傅里葉變換,存儲在數(shù)組Rfft中,這就是該圖像的特征。

        (5) 計算Rfft與Fea(jj,:,:)中的每一組的特征的相關(guān)系數(shù),相關(guān)系數(shù)最大的就認為是該組圖像,即是這個人。例如當jj=5時,相關(guān)系數(shù)最大,那么就認為該圖像是第5個人。

        (6) 輸出結(jié)果:對于0≤p≤255,0≤q≤255,都能識別出160個以上,一半以上的p,q識別出165個(識別率100%),總體識別率超過0.969 7。識別率超過了文獻[15]中的 87.21%和文獻[16]中的91.83% (使用了深度學(xué)習(xí)方法)。

        實驗中每一組的所有圖像均參加訓(xùn)練。另計算傅里葉變換使用Matlab中的fft2函數(shù);計算相關(guān)系數(shù)使用Matlab中的corrcoef函數(shù)。

        2.2 未參加訓(xùn)練的圖像識別效果

        在實驗中,待識別的每幅圖像(每組 11幅)都參加了訓(xùn)練,對每組的前10幅圖像進行訓(xùn)練,最多可以識別出163幅,此時p=255,q=255。若以前 5幅圖像進行訓(xùn)練,那么對于165幅圖像,最多可以識別出 142幅(此時p=255,q=255)。識別率為0.860 6,只有23幅圖像沒有識別出來,平均每組有1.533幅圖像沒有識別出來。

        該方法對訓(xùn)練過的圖像敏感,即對于參加過訓(xùn)練的圖像,識別出的概率大于沒有參加訓(xùn)練的圖像。這有待于進一步分析研究。

        2.3 機理分析

        該方法具有較高識別率的主要原因有2個,一個是每幅圖像的吸引子是穩(wěn)定的,即對于不同的初始值,當離散余弦基函數(shù)矩陣一定時,吸引子的形狀,特別是頻域特性非常穩(wěn)定。例如,每組的第 7幅圖像因為比較暗,所以吸引子比較小,但是將吸引子進行傅里葉變換后,每組第7幅圖的識別效率明顯提高。盡管吸引子圖形大小不同,點集之間有微小的錯位(即混沌的初值敏感性),但是形狀相似的圖像吸引子的頻域特性極其相似。之所以該方法對每幅圖像的記憶辨析能力極強,是因為每幅圖像特征均存儲在一個稀疏矩陣中,個性表達能力極強。

        以上方法是將吸引子矩陣進行二維傅里葉變換,實際上,將吸引子矩陣投影到一維,計算一維傅里葉變換,然后計算相關(guān)系數(shù),效果也較好。

        3 CMU PIE人臉庫的識別效果

        為驗證該方法的有效性,再利用人臉庫 CMU PIE進行實驗。

        3.1 對于原低分辨率圖像識別

        利用2.1節(jié)的方法,使用式(2)對離散余弦矩陣進行調(diào)整,即先計算其最大值、最小值,然后將矩陣調(diào)整到[0,1]之間,再乘以圖像的寬或高N(一般將圖像的寬高調(diào)整為一樣大小)。

        其中,max和min分別為原DCT基函數(shù)矩陣A的最大值和最小值;B為調(diào)整后得到的新矩陣。

        每張圖像進行調(diào)整,將其灰度值(利用插值方法)調(diào)整到1與N之間,有利于迭代產(chǎn)生質(zhì)量較好的吸引子。

        Pose05_64×64圖像庫內(nèi)有68個人,每人49幅圖像,共3 332幅圖像。每幅圖像均為64×64大小,現(xiàn)使用64×64圖像直接進行識別,離散余弦基函數(shù)的M,N均取值為64。隨機生成36個初始值(點),每個初始值迭代50次,大于40次時記錄(u,v)。對于多數(shù)p,q,識別率大于80%,每幅識別時間小于0.1 s。一半以上的p,q識別率超過83%。

        統(tǒng)計結(jié)果見表1。

        使用文獻[14]中的正弦函數(shù)作為輔助函數(shù),用于Pose05_64×64圖像,識別率不超過0.8,說明DCT方法優(yōu)于文獻[14]中的正弦函數(shù)方法。并且DCT方法更易于調(diào)整參數(shù),可根據(jù)圖像等特點給出參數(shù)。

        表1 Pose05_64×64圖像識別效果

        因為特征矩陣是稀疏的,并且要進行傅里葉變換,所以計算特征時,可以求和后除以小于49的數(shù)。另外,從統(tǒng)計結(jié)果看,p,q是奇素數(shù)時效果好。

        當p=63,q=57時,最多可識別出 1 505幅圖像,識別率達到1505/1632×100%=92.22%。

        因為識別是利用動力系統(tǒng)的周期點分布,所以在此實驗中,當?shù)螖?shù)較少時(大于2小于15),體現(xiàn)的是個性,當?shù)螖?shù)多于 15次時,主要記載的是圖像的共性。

        3.2 插值調(diào)整到128×128大小

        當把 Pose05_64×64數(shù)據(jù)庫中的人臉圖像調(diào)整到128×128時,識別效果有所提高。

        表2中每組用時20 min,平均每幅用時0.073 5 s。

        表2 調(diào)整分辨率后識別效果統(tǒng)計

        未識別出的圖像如圖 3所示。其原因包括灰度、表情等,還有混沌的偶然因素,因此可用多個p,q值綜合起來進行識別。不同的p,q提取圖像特征的部位是有差別的。

        圖3 未識別出的人臉圖像

        人臉圖像灰度過亮或過暗時,影響迭代操作,搜索過亮平滑區(qū)域與過暗區(qū)域,以區(qū)域平均值為基礎(chǔ)從中間到外圍輻射狀修正灰度值,調(diào)整灰度后,識別率有較大提高。

        3.3 插值調(diào)整到256×256大小

        事實上,將CMU PIE數(shù)據(jù)庫中的圖像調(diào)整到256×256時,效果最好。

        對離散余弦矩陣調(diào)整,再對每幅圖像進行調(diào)整,調(diào)整到[256,256,256]內(nèi)。

        對于Pose05_64×64數(shù)據(jù)庫,多數(shù)p,q的識別率均超過了 90%,對于 Pose09_64×64圖像庫,多數(shù)p,q均超過了95%。

        在實驗中,所有圖像均參加了訓(xùn)練。圖 4是Pose05_64×64數(shù)據(jù)庫的前3組圖像與1,2,3組圖像的組特征的相關(guān)系數(shù)比較圖。由于圖像數(shù)量所限,只取前3組(每組50個)為例展示。

        實驗中也發(fā)現(xiàn),如果不使用傅里葉變換,直接計算相關(guān)系數(shù),那么識別率極差。說明傅里葉變換的重要性,也說明圖像的吸引子是輪廓形狀相似,但是大小以及位置并不相同。

        圖4 當p=253,q=249時的相關(guān)系數(shù)比較

        4 結(jié) 束 語

        本文利用 DCT基函數(shù)作為輔助函數(shù)與圖像函數(shù)構(gòu)成動力系統(tǒng),迭代產(chǎn)生的混沌吸引子可以作為圖像特征用于圖像識別。這是一種新的圖像特征提取方法,該方法主要是進行迭代運算,簡單、運行速度快。利用這種特征在Yelefaces數(shù)據(jù)庫以及其他人臉數(shù)據(jù)庫上進行實驗,在經(jīng)過訓(xùn)練的情形下,15組 165幅的Yalefaces數(shù)據(jù)庫識別率能夠達到100%,68人3 332幅圖像的數(shù)據(jù)庫識別率能夠超過99%。該結(jié)果再一次預(yù)示利用混沌描述表達復(fù)雜信息的可能性,同時這種構(gòu)造混沌的方法也是混沌理論研究的一個實例。圖像混沌吸引子更大的意義可能不在于對人臉的識別,而是在于顯示了用點集(或者說利用混沌迭代)表達概念的可能性。該方法本質(zhì)上與Hopfield反饋網(wǎng)絡(luò)相似,每次迭代得到的是不同位置上的 0,1數(shù)據(jù),可以作為深度學(xué)習(xí)的一個階段性方法,與卷積網(wǎng)絡(luò)等深度學(xué)習(xí)方法結(jié)合在一起使用。

        猜你喜歡
        傅里葉圖像識別識別率
        基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測
        計算機工程(2020年3期)2020-03-19 12:24:50
        基于Resnet-50的貓狗圖像識別
        電子制作(2019年16期)2019-09-27 09:34:50
        高速公路圖像識別技術(shù)應(yīng)用探討
        基于真耳分析的助聽器配戴者言語可懂度指數(shù)與言語識別率的關(guān)系
        雙線性傅里葉乘子算子的量化加權(quán)估計
        基于小波降噪的稀疏傅里葉變換時延估計
        圖像識別在物聯(lián)網(wǎng)上的應(yīng)用
        電子制作(2018年19期)2018-11-14 02:37:04
        圖像識別在水質(zhì)檢測中的應(yīng)用
        電子制作(2018年14期)2018-08-21 01:38:16
        提升高速公路MTC二次抓拍車牌識別率方案研究
        高速公路機電日常維護中車牌識別率分析系統(tǒng)的應(yīng)用
        手机av男人天堂免费网址| 成全高清在线播放电视剧| 久久香蕉国产线看观看网| 亚洲性爱区免费视频一区| 自拍视频在线观看国产| 欧美牲交a欧美牲交aⅴ| 国产乱子伦视频大全| 欧美黑人xxxx性高清版| 日韩一级137片内射视频播放| 亚洲天堂av免费在线| 亚洲悠悠色综合中文字幕| 野花社区视频在线观看| 四虎精品影视| 最新国产主播一区二区| 青青草狠吊色在线视频| 国产av一区二区精品凹凸| 97久久超碰国产精品2021 | 国产国拍精品亚洲av在线观看| 人妻体内射精一区二区三四| 亚洲欧美日韩高清专区一区| 青青草针对华人超碰在线| 日韩人妻美乳中文字幕在线| 丰满少妇高潮惨叫久久久| 在线观看午夜亚洲一区| 国产亚洲精品hd网站| 久久精品亚洲国产av网站| 国产国产裸模裸模私拍视频| 欧美亚州乳在线观看| 国产精品丝袜一区二区三区在线| 国产毛片视频一区二区| 天天影视性色香欲综合网| 精品亚洲欧美高清不卡高清| 极品少妇一区二区三区四区视频 | 十八岁以下禁止观看黄下载链接 | 欧美激情一区二区三区成人 | 在线观看国产激情免费视频| 在线亚洲高清揄拍自拍一品区 | av一区二区在线免费观看| 色欲人妻综合aaaaa网| 四虎永久免费影院在线| 久久久一本精品久久久一本|