楊霈
(蘭州理工大學,甘肅蘭州,730050)
圖像處理是一種利用計算機分析圖像以達到預期結(jié)果的技術。圖像處理一般指數(shù)字圖像處理,而數(shù)字圖像指由工業(yè)相機、攝像機、掃描儀等設備捕捉到的二維數(shù)組,數(shù)組中的元素稱為像素,元素的值稱為灰度值[1]。
計算機圖像識別技術和人識別圖像在原理上沒有本質(zhì)區(qū)別,只是機器沒有人的感覺。人類圖像識別不僅僅是依賴于整個圖像在腦中的映像、我們依賴于圖像本身特點然后對圖像進行分類,然后對每個類別圖像識別的特點識別圖像。當我們看到一張圖片時,我們的大腦會迅速產(chǎn)生聯(lián)想。在“看”和“想”之間有一個快速的識別過程,這與搜索的過程類似。在這個過程中,我們的大腦已經(jīng)在存儲記憶的分類的類別中看是否有存儲的記憶或與圖像具有相似的特征,從而識別圖像。類似的是機器圖像識別技術,它通過分類提取重要特征,排除冗余信息來識別圖像。這些由機器提取出來的特征一般是十分明顯的,機器識別的速度也因此提高。在計算機的視覺識別中,圖像的內(nèi)容往往是用圖像特征來描述的[2]。
圖1 圖形用戶界面示意圖
MATLAB GUI(又稱圖形用戶界面),它的含義是以圖形化方式顯示的計算機操作用戶界面,是MATLAB 用戶可視化交互式的工具,運用GUI 生成的操作界面用戶可以不用瀏覽繁冗的代碼而進行操作[3]。
圖形用戶界面(GUI)是由窗口、鍵、游標、菜單、文本指令和其他對象組成的用戶界面。用戶通過某些方法(如鼠標或鍵盤)選擇和激活這些圖形對象,使計算機產(chǎn)生反應,如計算、繪圖、顯示結(jié)果等。本文通過用戶界面將展示對圖像的二值化,處理邊緣,水果分類最終實現(xiàn)水果識別并保存結(jié)果[4]。
圖像的二值化處理是將圖像上的點的灰度值設置為為0 或255,于是圖像呈現(xiàn)出明顯的黑白效果也就是獲得黑白圖像[5]。
二值圖像中的一種主要處理是對所提取的目標圖形進行形態(tài)分析。而形態(tài)處理中最基本的是腐蝕與膨脹。腐蝕處理的作用是將目標圖形收縮。其中用得到結(jié)構(gòu)元素,結(jié)構(gòu)元素是指具有某種確定形狀的基本結(jié)構(gòu)元素,例如,一定大小的矩形,圓或者菱形等。本文先對圖像進行了降噪處理和平滑邊界處理再把圖像灰度化再進行腐蝕處理。本文隨機打開一張事先準備好的圖片進行二值化處理結(jié)果如圖2-4 所示。
邊緣提取就是在數(shù)字圖像中對圖片輪廓的處理。對于邊界處,灰度值變化比較劇烈的地方就稱為邊緣。也就是拐點(函數(shù)發(fā)生凹凸性變化的點)是二階導數(shù)為零的點,并不是一階導數(shù),因為一階導數(shù)為零,表示的是極值點。保留圖像灰度變化較大的區(qū)域是邊緣提取的一般方法,從數(shù)學的角度來看,最直觀的方法是差分(數(shù)字圖像差分)[6]。
圖3 灰度圖像
圖4 二值化處理圖像
邊緣檢測的基本思想是利用邊緣增強算子對圖像的局部邊緣進行突出,然后定義像素的“邊緣強度”,通過設置閾值來提取邊緣點。由于噪聲和模糊,監(jiān)測的邊界可能在某一點變寬或破裂。因此,邊界檢測就包括:(1)通過邊緣算子提取反映灰度變化的邊緣點集。(2)在邊緣點集合中消除一些邊界點或填充邊界不連續(xù)點,并將這些點連接成一條完整的線。在邊緣化處理前一般先進行圖像降噪已獲得合適的圖像邊沿,本文對圖像的邊緣提取如圖5 所示。
圖5 邊緣提取圖形
圖像識別技術的過程一般包括信息獲取、預處理、特征提取與選擇、分類器設計和分類決策這幾個步驟[7]。
信息獲取有很多方法如把光或聲信息通過傳感器轉(zhuǎn)化為電信息。通俗來說就是把研究對象的基本信息以某種方式轉(zhuǎn)換成機器可以理解的信息。預處理主要是指對圖像進行去噪、平滑、變換等操作,從而增強圖像的重要特征。特征提取與選擇:我們研究的圖像是多種多樣的,若想?yún)^(qū)分它們,就必須通過它們自身的特征來識別它們,獲取這些特征就是提取特征。特征提取需要提取有用的特征一般選取明顯的特征這樣才能識別相應的物體,這就是特征選擇。特征提取與選擇是圖像識別過程中的關鍵技術之一。分類器設計是指通過訓練得到一個識別規(guī)則,通過這個規(guī)則可以得到一個特征分類,從而提高識別率。分類決策是對被識別的對象在特征空間中進行分類更好地識別所研究對象的具體類別。
在本文中在去噪的基礎上先建立了HSV 色素模型(表示色相、飽和度和亮度)。計算各個水果的平均HSV 數(shù)值并求得水果的最小HSV 值,利用regionprops 函數(shù)獲得各個聯(lián)通區(qū)域的屬性值(中心點坐標,外接橢圓的長短軸長度,面積),隨后計算各個水果的似圓特征比(長軸/短軸),再獲得以每個水果重心為中心點的邊長為30 的正方形內(nèi)的像素的rgb 值,利用以上條件通過比對獲得最終分類結(jié)果。譬如:西瓜就需要面積最大,似圓性小于1.4,b 值大于1,通過for循環(huán)就可找到西瓜。
圖6 圖像識別結(jié)果
也就是進行了預處理,信息獲取,特征提取與選擇,分類器設計。
我們可以通過該算法實現(xiàn)的水果識別并為教導幼兒實現(xiàn)電子識別水果提供方便。
本文通過對水果圖像進行灰度,邊界,腐蝕,去噪處理并把了每個水果相應的rgb 值并轉(zhuǎn)化為相應的hsv 色素模型并獲得相應值,計算每個水果的規(guī)格大?。娣e,似圓性,獲得以每個水果重心為中心點的邊長為30 的正方形內(nèi)的像素的rgb 值),通過比較獲得最后分類結(jié)果。
本文前景廣闊不僅可以適用于水果識別還可以用于其他物體識別比如不同的杯具茶具,足球籃球等多種多樣的物體。