田凱 杜鵬 杭州電子科技大學(xué)數(shù)字媒體與藝術(shù)設(shè)計學(xué)院
基于C#的圖像分類系統(tǒng)實現(xiàn)
田凱 杜鵬 杭州電子科技大學(xué)數(shù)字媒體與藝術(shù)設(shè)計學(xué)院
本文介紹了基于C#的圖像分類系統(tǒng)的實現(xiàn)。目前,支持向量機是分類研究中的熱點,它建立在統(tǒng)計學(xué)理論基礎(chǔ)上的,相比與神經(jīng)網(wǎng)絡(luò)分類和傳統(tǒng)分類方法具有較高的泛化性能。本文研究了圖像的顏色特征在圖像分類中的作用,并對顏色特征基本理論做了簡要的說明。同時對核函數(shù)在SVM分類器中對圖像分類的影響做了扼要論述。在C#平臺上建立了一個使用SVM分類器的圖像分類系統(tǒng),并討論了組成系統(tǒng)的各個模塊及其功能。
支持向量機 核函數(shù) 特征提取 圖像分類
人類的活動產(chǎn)生了大量的數(shù)字圖像。然而,爆炸式增長的數(shù)字圖像卻給人們帶來了困擾。大量的圖像涵蓋了各領(lǐng)域的信息,人們從還量的圖像中獲得想要的信息的難度增大。因此,人們要求計算機對圖像的自動分類檢索能力有更大的提升,從而能更快、更有效的獲得目標信息。支持向量機有廣泛的應(yīng)用前景,本文主要是通過核函數(shù)來對SVM分類器進行研究,然后在VS2010C#平臺上實現(xiàn)一個基于支持向量機的圖像分類系統(tǒng)。
本文使用C#平臺基于支持向量機算法對圖像進行分類,包括圖像數(shù)據(jù)庫、圖像特征提取、分類器三個模塊。圖像數(shù)據(jù)庫的數(shù)據(jù)內(nèi)容是從Web等處下載的若干圖像共222張圖片作為系統(tǒng)的數(shù)據(jù)庫。對于圖像類別的選擇主要是特征明顯,易于從色彩上區(qū)分。圖像特征提取部分主要是對輸入的文件和數(shù)據(jù)庫的訓(xùn)練集進行圖像特征提取,其一,數(shù)據(jù)庫中的訓(xùn)練集進行圖像特征的提取,把這些圖像特征值進行處理后輸入到相應(yīng)的文件中,然后執(zhí)行分類器算法,生成分類模型;其二,對測試樣本(輸入的圖像)進行圖像特征提取,然后執(zhí)行分類模型,生成預(yù)測結(jié)果。SVM的分類模塊主要是輸入的圖像和數(shù)據(jù)庫的圖像進行匹配,整個分類器的關(guān)鍵是圖像特征提取和分類器算法,分類器的算法包括多項式核函數(shù)、高斯核函數(shù)、卡方核以及直方圖交叉核等。不同的核函數(shù)引起原理不一樣多分類結(jié)果的影響也不一樣。
統(tǒng)計學(xué)習(xí)的出現(xiàn)和完善,再到結(jié)構(gòu)風(fēng)險最小化原理的提出,這些為支持向量機的出現(xiàn)提供了理論基礎(chǔ),支持向量機的主要作用就是利用小樣本提供的信息去在模式繁復(fù)程度性和學(xué)習(xí)能力中間找出最優(yōu)價值的方案,期望得到良好的發(fā)展進步和泛化能力。傳統(tǒng)的模式識別方法都是建立在經(jīng)驗風(fēng)險最小化的基礎(chǔ)上的,只在樣本數(shù)量趨近于無于無窮大時才有理論上的性能保障。而支持向量機是基于統(tǒng)計學(xué)理論為研究小樣本情況下的模糊識別模式。支持向量機是在有限數(shù)據(jù)及、非線性和維度較高的模式識別問題中展示了其良好的學(xué)習(xí)能了,在解決過學(xué)習(xí)和欠學(xué)習(xí)問題、局部最小值問題等有更佳的發(fā)展?jié)摿Α?/p>
核函數(shù)的功能就是將輸入空間中的線性不可分問題,通過非線性變化映到某個高維空間中,然后在高維空空間中求出一個最優(yōu)分類平面,在進行線性分類,以此來提高學(xué)習(xí)機器的非線性計算能力。高維空間的所有值都是通過的核函數(shù)映射而得到的,我們不需要知道映射后的空間向量來進行計算最優(yōu)平面,甚至不需要知道具體的映射,維數(shù)的改變只影響了內(nèi)積運算,不會影響到算法的復(fù)雜度。
人眼對色彩圖像比對黑白圖像的有更豐富的主觀視覺感受,為了有效的利用科學(xué)技術(shù),尤其是利用計算來處理圖像的色彩信息,就必須用定量的方法來對圖像的色彩信息進行描述,建立彩色模型。人們對圖像彩色的描述具有多樣性,選擇恰當?shù)姆椒▉肀硎穷伾欠浅1匾?,在圖像處理的自動分析中,顏色特征的表達方式不止依靠提前決定的顏色模型,但是顏色空間的數(shù)據(jù)在計算機是以數(shù)字形式儲存和顯示的,和人對色彩空間的帶感情色的感官并不一致。人們對色彩的感覺與許多的所處空間的物理現(xiàn)象、人當時心理狀態(tài)和生理效果有關(guān),是一種比較復(fù)雜的化學(xué)反應(yīng)關(guān)系。普通情況下,我們獲取的圖像都是使用RGB顏色空間描述,但是HSV顏色空間更符合人類視覺感知,因此在進行某些圖像處理的時候,可以根據(jù)需要將圖像從RGB顏色空間模型轉(zhuǎn)化成HSV顏色空間模型。
隨著網(wǎng)絡(luò)技術(shù)和新興多媒體技術(shù)的迅速發(fā)展,人們對于圖像數(shù)據(jù)的搜索和分類要求越來越高。本文對支持向量機在圖像分類方面進行了研究,主要有:其一,研究了支持向量機的發(fā)展進程;其二,研究了核函數(shù)對SVM分類器性能的影響,分析了核函數(shù)參數(shù)的選擇方法;其三,研究了基于圖像內(nèi)容分類的基本原理,并對圖像顏色提取技術(shù)做了簡單的探索。
[1]張文博.多類別智能分類器方法研究[D].西安電子科技大學(xué),2014
[2]高錦.基于SVM的圖像分類[D].西北大學(xué),2010
[3]淦艷.多核學(xué)習(xí)算法及其在人臉檢測中的應(yīng)用[D].重慶師范大學(xué),2015