王棲榕,黃樟燦
(武漢理工大學(xué)理學(xué)院,武漢 430070)
(?通信作者電子郵箱huangzc@whut.edu.cn)
油畫圖像是一種重要的藝術(shù)創(chuàng)作和民族文化遺產(chǎn),利用優(yōu)美的表征形式,體現(xiàn)人類文化面貌,傳達人類思想感情,是人類認識世界的一種獨特而美妙的方式。幾千年來,人類創(chuàng)作了大量的油畫圖像,使得大量的、不同藝術(shù)風(fēng)格的中西方油畫作品的分類成為了一項難題[1]。
早在18 世紀末,已有學(xué)者利用物理化學(xué)方法鑒定油畫作品的歷史年代以及顏料構(gòu)成,從而判斷油畫作品的真?zhèn)我约爱嫾业纳矸?。Spyros 等[2]提出了一種無損的核磁共振法分析油畫作品的老化程度,從而判斷油畫作品所屬的年代。Chaplin 等[3]利用拉曼光譜法采集顏料的光譜,根據(jù)顏料的光譜判斷油畫作品的年代,從而推斷油畫作品畫家的身份。Wang 等[4]提出了一種高光譜圖像的特征融合方法,將物理方法與空間特征方法融合,對國畫進行真?zhèn)舞b定。以上物理化學(xué)方法為油畫真?zhèn)舞b定提供了有效的工具,但其需要作品的實物,操作復(fù)雜,且只能針對某一幅作品進行分析,無法對數(shù)字油畫作品進行分析,也無法將藝術(shù)風(fēng)格與畫家聯(lián)系起來,因此不適用于作家藝術(shù)風(fēng)格的提取研究。
針對以上問題,目前較多學(xué)者運用人工智能、機器學(xué)習(xí)等算法對油畫的筆觸特征提取進行研究。Berezhnoy等[5]針對油畫的筆觸特征提出一種主流方向提取技術(shù),用于自動提取人眼無法識別的油畫筆觸方向。Li等[6]針對梵高作品提出了一種融合邊緣檢測與聚類分割的筆觸特征提取方法,用于提取油畫的筆觸特征,從而區(qū)別梵高的作品與其他同期畫家的作品。Lamberti 等[7]針對梵高的作品提出了一種無監(jiān)督的提取筆觸方向、長度、寬度的方法。對油畫作品筆觸的研究,需要高度清晰的數(shù)字圖像數(shù)據(jù),這種數(shù)據(jù)不易獲得,而且文獻[5-7]的研究都是針對梵高的作品進行筆觸的提取,不具有普適性,無法應(yīng)用于作品的分類。
Sablating 等[8]提出了一種應(yīng)用于人物臉部的分層特征提取算法,有效提取了油畫的筆觸特征。這項研究只適用于人臉部的特征提取,而且沒有對所提取的特征進行有效性證明。Levy 等[9]提出融合最近鄰判斷的遺傳算法(Genetic Algorithm,GA),但其正確率較低。Shamir等[10]提出通過計算特征相似度的方法對油畫作品進行分類,該方法對于油畫作品所屬流派的分類比較準確,但對于所屬畫家的分類正確率較低。根據(jù)流派對油畫作品進行分類的研究方法大多基于神經(jīng)網(wǎng)絡(luò),需要大量訓(xùn)練集;但每個畫家的作品數(shù)量過少,根據(jù)畫家進行分類時,用神經(jīng)網(wǎng)絡(luò)不適合。
以上研究均未考慮油畫關(guān)鍵區(qū)域?qū)τ彤嬶L(fēng)格的影響,籠統(tǒng)地對油畫進行全局或局部的特征提取,導(dǎo)致其對油畫的描述無法有效體現(xiàn)畫家的藝術(shù)風(fēng)格。
針對上述研究存在的不足,本文結(jié)合顏色特征分析油畫每一個區(qū)域的信息含量,以及每個特征與畫家風(fēng)格的關(guān)聯(lián)程度,提出了一種基于顏色的關(guān)鍵區(qū)域油畫描述法。首先,結(jié)合區(qū)域主色調(diào)占比與顏色熵定義了油畫區(qū)域的信息豐富度,提出了一種選取油畫關(guān)鍵區(qū)域的方法,通過度量油畫區(qū)域的信息豐富度選取具有代表性的區(qū)域作為油畫的關(guān)鍵區(qū)域。其次,本文提出了融合Fisher Score 的關(guān)鍵區(qū)域特征描述法,選取有效的顏色特征,剔除無效甚至對分類造成干擾的特征,更有效地描述畫家的藝術(shù)風(fēng)格。然后,利用樸素貝葉斯(Naive Bayes Classifier,NBC)分類器對油畫進行分類。最后,通過實驗對比發(fā)現(xiàn),本文方法能夠有效提取代表畫家風(fēng)格的油畫區(qū)域與有效的顏色特征,并更加準確地對油畫進行分類。同時,信息豐富度度量的定義為其他領(lǐng)域研究提供了新的思路。
信息是個很抽象的概念,信息的多少很難衡量,直到信息論之父克勞德·艾爾伍德·香農(nóng)提出了信息熵的概念并用數(shù)學(xué)語言闡明了概率與信息冗余度的關(guān)系?!靶畔㈧亍币辉~是從熱力學(xué)中借過來的,熱熵表示分子狀態(tài)混亂程度,信息熵描述信源的不確定度。信息熵計算式如下:
其中:p(xi)表示事件xi出現(xiàn)的概率,且。
由式(1)可以看出,信息熵具有單調(diào)性、非負性、累加性。單調(diào)性即如果有某個事件發(fā)生概率過高,概率越高,則信息量越低。非負性即信息熵不為負。累加性即多隨機事件同時發(fā)生的總不確定性的度量可以表示為不確定性的度量的和。所以信息熵作為有效度量信息多少的量被廣泛應(yīng)用于集成電路、圖像檢索等領(lǐng)域。
信息熵能夠較為準確地衡量一幅圖像中信息的多少,本文為了選取能夠同時體現(xiàn)油畫整體特征與細節(jié)特征的區(qū)域,結(jié)合信息熵與油畫的特點,提出油畫的信息豐富度度量,具體內(nèi)容見第2章。
Fisher Score 廣泛應(yīng)用于特征選擇,其主要思想是認為鑒別能力強的特征的表現(xiàn)是類內(nèi)差異盡可能小,類間差距盡可能大。假設(shè)數(shù)據(jù)中有n個樣本屬于C個類別,每個類分別包括ni個樣本,則單個特征的Fisher Score為:
其中:k表示第k維;SB、SW分別表示第k維特征在訓(xùn)練樣本集上的類間方差和類內(nèi)方差。由式(2)可以看出,當(dāng)?shù)趉維特征的類間方差SB越大,類內(nèi)方差SW越小,則Jfisher(k)越大。
為了提取油畫更有效的特征,從而更準確描述油畫的藝術(shù)風(fēng)格,本文結(jié)合Fisher Score 進行特征選取,具體方法于3.2節(jié)中描述。
關(guān)鍵區(qū)域是一幅油畫的指紋,所以一個關(guān)鍵區(qū)域應(yīng)該具有這幅油畫的主要特征并且能夠代表這幅油畫。因此,如何選取油畫的關(guān)鍵區(qū)域非常重要。油畫作品重視運用色彩深淺、光線明暗來表現(xiàn)物象。油畫色彩具有色相、明度、純度、冷暖等屬性,色彩的精心和巧妙運用可以反映物體的明暗,使整幅作品的質(zhì)感和空間感更好[1],還能夠傳達畫家的情緒和情感。油畫的顏色分布是油畫識別和搜索的有效工具,所以本文通過油畫的顏色特征定義油畫區(qū)域信息豐富度,并根據(jù)信息豐富度檢測選取油畫的關(guān)鍵區(qū)域。
不同的畫家對顏色的偏好不同,多數(shù)畫家都有自己無意或有意形成的顏色風(fēng)格。例如:荷蘭畫家梵高前期的作品善于利用暗色表達對資本主義現(xiàn)實的悲憤之情,后期則鐘情于黃色的植物以表達他對自然與生命的熱愛以及對旺盛生命力的強烈渴望;盧梭癡迷于大自然中綠色的風(fēng)景,表現(xiàn)他天真直率浪漫的性格;倫勃朗的畫作富含各種赭色、深褐色和大地色調(diào);莫奈則喜歡將白色和綠色作為主色調(diào)[11]。這些事實證明主色調(diào)的占比對于油畫的識別非常關(guān)鍵,是選取關(guān)鍵區(qū)域的一個重要指標。本文定義了主色調(diào)占比,具體如下:
其中:S是區(qū)域的面積大??;m=(m1,m2,…,mi,…)為區(qū)域中各種顏色的像素點數(shù)量,mi表示區(qū)域中第i種顏色的數(shù)量。
顏色不僅能體現(xiàn)一個畫家的情感與思想,同樣能夠體現(xiàn)一個畫家的繪畫技巧與功底。達芬奇提出利用明暗變化來構(gòu)造凹凸感[11],不同的畫家在構(gòu)造明暗變化時有不同的習(xí)慣與技巧。盡管盧梭偏好綠色,但是他的作品中運用深淺亮度等不同的綠色生動地刻畫了靜物。而莫奈傾向于運用“凌亂”的色彩展現(xiàn)景色的朦朧美。在一幅油畫中,復(fù)雜的區(qū)域相較于顏色單調(diào)的區(qū)域更能夠體現(xiàn)畫家的技術(shù)和不同畫家的不同習(xí)慣。所以顏色豐富度是關(guān)鍵區(qū)域選擇的另一個重要指標。
信息熵[12-13]用來度量信息的多少,其定義如式(1)。Zachary[14]提出利用信息熵度量圖片的信息量,也就是將信息熵的應(yīng)用到圖像中顏色豐富度度量,即為顏色熵。顏色熵[15]的大小反映顏色信息量的多少:
其中:P(i)是顏色值i在區(qū)域中出現(xiàn)的頻率。R的值越大,該區(qū)域的信息量越豐富,所以本文通過顏色熵衡量區(qū)域的顏色豐富度。
在一幅油畫的某個區(qū)域中,主色調(diào)占比與顏色豐富度是互相影響的。當(dāng)一個區(qū)域的主色調(diào)占比高時,很容易導(dǎo)致顏色豐富度低,反之亦然。所以本文根據(jù)主色調(diào)占比與顏色豐富度的調(diào)和定義區(qū)域的信息豐富度,具體如下:
其中,S、m、P(i)的含義與2.1、2.2節(jié)中相同。
式(5)能夠有效檢測具有代表性的油畫關(guān)鍵區(qū)域,更大程度地反映油畫的信息,避免無效區(qū)域的影響,降低計算復(fù)雜度。
畫家的藝術(shù)風(fēng)格主要體現(xiàn)在其對色彩的應(yīng)用以及運筆的習(xí)慣,本文根據(jù)式(4)計算油畫區(qū)域的信息豐富度,并選取信息豐富度最高的區(qū)域作為一幅油畫的關(guān)鍵區(qū)域。油畫的關(guān)鍵區(qū)域能夠最大限度地保留油畫的整體特征,體現(xiàn)畫家對色彩的應(yīng)用,并更加突出表現(xiàn)油畫的細節(jié)紋理,體現(xiàn)畫家的運筆習(xí)慣。圖1為關(guān)鍵區(qū)域檢測選取的3個結(jié)果示例,左側(cè)為油畫原圖,右側(cè)(每個箭頭所指圖片)是本文方法選取的關(guān)鍵區(qū)域。
圖1 關(guān)鍵區(qū)域選取結(jié)果示例Fig.1 Examples of key region selection
提取有效特征是關(guān)鍵區(qū)域描述的關(guān)鍵,在第2 章中已經(jīng)選取了信息豐富度高的關(guān)鍵區(qū)域,在此基礎(chǔ)上,對關(guān)鍵區(qū)域的有效特征進行提取,即能得到一幅油畫圖像的特征。由于油畫圖像具有豐富的色彩,所以本文提取油畫圖像的R、G、B、H、S、V 顏色直方圖特征(包括顏色均值μ、方差σ2、傾斜度μs、峭度μk、能量μN)與由顏色變化而形成的紋理特征(包括對比度CON、角度方向二階矩ASM、熵ENT、均值MEAN),計算式[16]分別如下:
其中,P(i)是第i種顏色在圖像中出現(xiàn)的頻率。
其中:p(i)是第i級灰度差分gΔ(x,y)出現(xiàn)的頻率;gΔ(x,y)的所有可能取值共有b級。取圖像內(nèi)任意一點(x,y),則該點與其相鄰點(x+Δx,y+Δy)的灰度差分的計算式為:
根據(jù)式(6)~(14)分別計算油畫6 個顏色分量H、S、V、R、G、B的上述9個特征,共6×9=54個特征,將這些特征分別記為Ai(i=1,2,…,54)。則每一幅油畫可以被描述為一個54維的向量F=(f1,f2,…,fn),其中:n=54,fi是對特征Ai的度量。
一幅油畫的顏色特征非常多,但是由于油畫的部分顏色特征對于油畫的分類沒有作用,甚至?xí)蓴_分類結(jié)果。為了能夠更準確地對油畫進行分類,剔除對油畫描述形成干擾的特征,本文對所提取的特征進行評估并選取優(yōu)秀特征。類內(nèi)差異越小、類間差異越大的特征,與其所屬類的關(guān)聯(lián)程度越高,表明特征越優(yōu)秀。Fisher Score 能夠計算每一個特征與其所屬類的相關(guān)聯(lián)程度。關(guān)聯(lián)程度越高的特征得分越高,關(guān)聯(lián)程度越低的特征得分越低。所以本文利用Fisher Score[17]對每一個特征進行評估。
其中:Wfi是fi對應(yīng)特征Ai的權(quán)重得分,反映特征Ai對分類的影響權(quán)重,Wfi越大的特征越重要;N是類別的數(shù)目(畫家的個數(shù))是所有訓(xùn)練集中特征Ai特征值fi的均值;是第c類訓(xùn)練集中特征Ai特征值fi的均值;是第c類訓(xùn)練集中特征值fi的方差。特征Ai的Wfi越大,同一個畫家不同畫作之間的特征值越接近,不同畫家畫作之間的特征值差距越大。
通過式(15)對3.1 節(jié)中提取的特征進行評估,并選取重要性占比達到80%的前n'個特征,對關(guān)鍵區(qū)域進行描述,得到油畫的描述F=(f1',f2',…,fn'')。
為了驗證本文關(guān)鍵區(qū)域算法的有效性,將第3 章所提取的特征利用樸素貝葉斯分類器對油畫進行分類。
為了驗證本文方法所提取的藝術(shù)風(fēng)格特征的有效性,本文利用所提取的特征對油畫進行分類。樸素貝葉斯廣泛應(yīng)用于文本分類與畫作分類,其分類的結(jié)果通常優(yōu)于其他分類器,本節(jié)簡單介紹樸素貝葉斯分類器。
樸素貝葉斯分類器[18-19]是經(jīng)典的機器學(xué)習(xí)算法之一,原理簡單,容易實現(xiàn),對小規(guī)模數(shù)據(jù)表現(xiàn)好,廣泛應(yīng)用于文本分類[20-22]。樸素貝葉斯的原理是利用條件概率與先驗概率計算后驗概率。每一幅油畫都由一個n維的特征向量F=(f1,f2,…,fn)表述,畫家的集合為C=(c1,c2,…,ck)。樸素貝葉斯分類油畫,即利用一幅油畫的每一個特征fi計算一幅油畫F為某一個畫家cj所作的概率,計算式如下:
其中P(f1,f2,…,fn)對所有類別都為常量。
對于F,后驗概率P(cj|F)越大,則說明F屬于cj的可能性越大。F所屬類別的計算式如下:
由于每個特征相互獨立,則式(17)可轉(zhuǎn)化為:
分別計算出P(cj)與P(fi|cj)后,返回后驗概率最大的類別,即可得到F的類別。
本文方法流程如圖2所示。首先,根據(jù)第2章對油畫信息豐富度的定義度量并選取油畫關(guān)鍵區(qū)域;然后,提取關(guān)鍵區(qū)域的顏色特征得到油畫的初步描述F=(f1,f2,…,f54);再通過Fisher Score評估每個特征的重要性并選取部分權(quán)重大的特征得到油畫的最終描述F=(f1',f2',…,fn'')。重復(fù)此步驟得到m幅油畫的描述,作為訓(xùn)練數(shù)據(jù)集,訓(xùn)練得到樸素貝葉斯分類器。最后用樸素貝葉斯分類器對新的油畫進行分類。
圖2 基于關(guān)鍵區(qū)域的油畫描述與分類流程Fig.2 Flowchart of oil painting description and classification based on key region
假設(shè)訓(xùn)練數(shù)據(jù)集的特征維數(shù)為n,訓(xùn)練樣本個數(shù)為m。對于一幅油畫,在關(guān)鍵區(qū)域選取階段,假設(shè)一幅油畫被檢測h次;在關(guān)鍵區(qū)域描述階段,計算n個特征的特征值,利用Fisher Score 對n個特征進行評估,采用快速排序法對n個特征排序;上述步驟為并列操作,則對于描述一幅油畫的算法循環(huán)過程,語句的執(zhí)行頻度為f(h) +g(n)=h+n+n+nlogn=h+nlogn。所以,描述m幅油畫算法的全部循環(huán)過程,其語句的執(zhí)行頻度為mh+mnlogn。對于樸素貝葉斯,本文選取n個特征中重要性占比達80%的前n'個特征,假設(shè)標定值為|c|個[23],那么其計算復(fù)雜度為O(mn'2|c|)。當(dāng)每種特征的重要性都相同時,n'的值最大為0.8n,此時樸素貝葉斯的計算復(fù)雜度為O(mn2|c|)。因此本文方法的時間復(fù)雜度為O(mh+mn2|c|),在可接受范圍內(nèi)。
為了驗證本文方法的性能,基于Windows 7 操作系統(tǒng)、Intel Core i7-4790 CPU 處理器、8 GB 內(nèi)存、Matlab R2018a 仿真環(huán)境,進行了仿真實驗。一位畫家畢生的作品數(shù)量較少,本文盡可能多地搜集數(shù)據(jù)集,分別建立了數(shù)據(jù)庫1與數(shù)據(jù)庫2。數(shù)據(jù)庫1包括亨利·盧梭、文森特·梵高、克勞德·莫奈3位畫家各40 幅作品,共120 幅油畫,其中,90 幅作為訓(xùn)練集,30 幅作為測試集。數(shù)據(jù)庫2 包括文森特·梵高、克勞德·莫奈、皮埃爾·奧古斯特·雷諾阿、馬克·羅斯科、杰克遜·波洛克、瓦西里·康定斯基、薩爾瓦多·達利、馬克斯·恩斯特、喬治·德·基里科9 位畫家各57 幅作品,共513 幅油畫,其中,360 幅作為訓(xùn)練集,153 幅作為測試集。圖3 為油畫數(shù)據(jù)的示例(數(shù)據(jù)來源為https://www.wikiart.org/),本文實驗圖像大小均為768×640。
為了驗證本文Fisher Score 特征提取的必要性,在實驗1中對比了未經(jīng)Fisher Score 特征選擇的普通分類器與結(jié)合Fisher Score 特征選擇的分類器依據(jù)畫家與流派的分類結(jié)果。為了驗證本文整體算法的有效性,在實驗2 中對比了本文方法與文獻[9]方法、文獻[10]方法對于依據(jù)畫家與流派的分類結(jié)果。由于文獻[10]的主要工作為提取油畫的多種特征,所以將其方法定義為Features-FS(Feature selected by Fisher Score)。
圖3 10位畫家油畫作品示例Fig.3 Examples of oil paintings by 10 painters
5.1.1 油畫描述
本實驗首先根據(jù)式(5)檢測每幅油畫的關(guān)鍵區(qū)域,然后提取關(guān)鍵區(qū)域的R、G、B、H、S、V 顏色直方圖特征(包括顏色均值、方差、傾斜度、峭度、能量)與由顏色變化而形成的紋理特征(包括對比度、角度方向二階矩、熵、均值)。
一般的分類直接根據(jù)上述方法提取的特征對油畫進行分類。結(jié)合Fisher Score 的分類(FS-Classifier),在特征提取后,再根據(jù)式(15),計算畫家的訓(xùn)練集油畫的每個特征的Wf,選取重要性占比80%的前n'個特征,得到每幅油畫的描述F=作為數(shù)據(jù)集。
本文分別根據(jù)畫家的身份與流派將油畫分類。根據(jù)畫家的油畫分類,將盧梭、梵高、莫奈3 位畫家的90 幅油畫作為訓(xùn)練集,30幅作為測試集。首先提取油畫的54維特征對油畫進行描述,并利用Fisher Score 對特征進行評估,按權(quán)重由大到小排序選取權(quán)重得分最高的前24 個特征,具體為:A1,A3,A5,A7,A8,A10,A11,A14,A15,A16,A17,A18,A19,A21,A25,A28,A32,A36,A37,A43,A45,A46,A52,A54。根據(jù)流派的油畫分類,將印象派畫家梵高、莫奈、雷諾阿,抽象表現(xiàn)主義派畫家羅斯科、波洛克、康定斯基和超現(xiàn)實主義派畫家達利、恩斯特、德·基里科等9位畫家的360幅畫作為訓(xùn)練集,153幅畫作為測試集。同樣提取54 維特征,并利用Fisher Score 進行特征評估,按權(quán)重由大到小排序選取權(quán)重得分最高的前27 個特征,具體為:A5,A14,A16,A17,A18,A19,A23,A24,A25,A26,A28,A30,A32,A33,A34,A35,A36,A39,A41,A43,A44,A45,A48,A50,A52,A53,A54。
5.1.2 參數(shù)尋優(yōu)
對于每一種分類器,利用未經(jīng)過Fisher Score 特征選取的54 維油畫描述的90 幅油畫的測試數(shù)據(jù)集,采用網(wǎng)格搜索算法,設(shè)置搜索區(qū)間為(0,40],支持向量機(Support Vector Machine,SVM)的參數(shù)搜索步長為0.1,其他分類器(K最近鄰(K-Nearest Neighbor,KNN)與隨機森林)參數(shù)搜索步長為1。將訓(xùn)練集以7∶2 的方式進行分割,使用交叉驗證對每組參數(shù)的表現(xiàn)進行評估,運行50 次,取平均正確率最高的參數(shù)作為最終參數(shù),得到的最優(yōu)參數(shù)如表1所示,最優(yōu)的SVM 核函數(shù)為多項式函數(shù)。決策樹C4.5、樸素貝葉斯(NBC)的樹深、節(jié)點數(shù)等不作限制。
表1 各個分類器使用的參數(shù)Tab.1 Parameters of different classifiers
5.1.3 不同分類器分類結(jié)果對比
表2 對比了普通方法(一般分類器)的分類結(jié)果與結(jié)合Fisher Score關(guān)鍵區(qū)域描述(FS-Classifiers)的分類結(jié)果正確率。所用的分類器包括K最近鄰(KNN)算法[24]、SVM[25]、決策樹C4.5、隨機森林[26]與樸素貝葉斯。由表2可以看出,依據(jù)畫家分類的結(jié)果,一般分類器的分類結(jié)果正確率最高達到了83.33%,與目前已有研究的正確率相當(dāng),證明了本文關(guān)鍵區(qū)域提取算法的有效性;且結(jié)合Fisher Score 分類結(jié)果的正確率明顯要高于普通的分類器。依據(jù)流派分類的結(jié)果,一般分類器的分類結(jié)果最高達到了82.35%,結(jié)合Fisher Score 分類結(jié)果的正確率達到了90.20%。樸素貝葉斯在一般分類器與結(jié)合Fisher Score 的分類器中,性能都是最優(yōu)的。融合Fisher Score的樸素貝葉斯(FS-NBC)的分類結(jié)果正確率最高,依據(jù)畫家分類的正確率達到了90%,依據(jù)流派分類的正確率達到了90.20%。
表2 普通方法與FS-Classifier的正確率比較 單位:%Tab.2 Accuracy comparison of normal methods and FS-Classifier unit:%
為了驗證本文方法的有效性,本實驗對比本文方法與現(xiàn)有的其他油畫分類方法的分類正確率效果。本文利用式(5)檢測選取得到油畫的關(guān)鍵區(qū)域,并通過Fisher Score 評價選擇有效特征得到油畫描述F=(f1,f2,…,f24)后,利用樸素貝葉斯對測試集進行分類。文獻[9]方法提取了每幅油畫的30 個特征,沒有對特征進行權(quán)重評估,利用融合最近鄰(Nearest Neighbor,NN)的遺傳算法(Genetic Algorithm,NN-GA)對油畫進行分類,依據(jù)畫家分類的正確率為80%,比本文方法低10 個百分點;依據(jù)流派分類的正確率為82.35%,比本文方法7.85 個百分點。文獻[10]方法不僅提取油畫的顏色直方圖特征、紋理特征,還提取邊緣統(tǒng)計特征、Zernike 特征、Haralick特征等,并通過Fisher Score 選取548 種特征,最后用SVM 對油畫進行分類得到了最高的正確率,依據(jù)畫家分類的正確率為83.33%,依據(jù)流派分類的正確率為90.84%。
本文方法僅提取油畫的54 個顏色直方圖特征,并通過Fisher Score 選取其中的24 個特征。如5.1 節(jié)中表2 所示,本文結(jié)合Fisher Score 的SVM 的分類結(jié)果,依據(jù)畫家分類的正確率為83.33%,與Features-FS 提取多種特征的結(jié)果相當(dāng),表明了本文方法關(guān)鍵區(qū)域檢測方法的有效性。如表3 所示,本文方法依據(jù)畫家的分類結(jié)果正確率為90%,比Features-FS 高6.67 個百分點。本文方法依據(jù)流派的分類正確率達到了90.20%,與Features-FS 的正確率90.84%相當(dāng),但Features-FS提取的特征數(shù)遠多于本文方法。
表3 不同方法的分類正確率比較 單位:%Tab.3 Classification accuracy comparison of different methods unit:%
從以上實驗結(jié)果可以看出,本文提出的基于關(guān)鍵區(qū)域的油畫描述法操作簡單、分類結(jié)果正確率高,能更有效地描述油畫的畫家藝術(shù)風(fēng)格。
受人類指紋識別與虹膜識別的啟發(fā),本文提出了基于關(guān)鍵區(qū)域的油畫描述法。首先,通過計算油畫區(qū)域的信息豐富度,選取具有代表性的區(qū)域作為關(guān)鍵區(qū)域,使得所選區(qū)域能更有效地體現(xiàn)畫家的藝術(shù)風(fēng)格;其次,提取關(guān)鍵區(qū)域的顏色特征,并通過Fisher Score 方法計算每個特征對于油畫的重要性,選取重要的特征對關(guān)鍵區(qū)域進行描述,利用關(guān)鍵區(qū)域的特征描述油畫。最后,利用樸素貝葉斯對其進行分類。實驗結(jié)果表明,本文所提出的方法優(yōu)于現(xiàn)有的傳統(tǒng)全局與局部特征提取方法,依據(jù)畫家的分類結(jié)果的正確率達到了90%,依據(jù)流派的分類結(jié)果正確率達到了90.20%。本文依據(jù)油畫的顏色特征對油畫進行分類,未考慮輪廓、筆觸等特征,下一步的工作中,將綜合考慮多個方面提高分類的正確率。