張重,黃美艷,司統(tǒng)振,劉爽
[摘 要] 計(jì)算機(jī)視覺主要是利用一些機(jī)械設(shè)備代替人類完成對(duì)目標(biāo)的跟蹤、檢測(cè)和分類等任務(wù),是應(yīng)用廣泛的一門綜合性學(xué)科。數(shù)字圖像處理是將圖像與數(shù)字進(jìn)行相互轉(zhuǎn)化并且能夠被計(jì)算機(jī)識(shí)別,通過計(jì)算機(jī)對(duì)圖像進(jìn)行操作的一門學(xué)科。計(jì)算機(jī)視覺是數(shù)字圖像處理課程的進(jìn)一步延伸,將兩者融合在一起能夠讓學(xué)生熟練掌握理論知識(shí),并進(jìn)一步將知識(shí)遷移到計(jì)算機(jī)視覺學(xué)習(xí)上,使學(xué)生由淺入深學(xué)習(xí),開闊視野。
[關(guān) 鍵 詞] 計(jì)算機(jī)視覺;數(shù)字圖像處理;課程融合
[中圖分類號(hào)] G642 [文獻(xiàn)標(biāo)志碼] A [文章編號(hào)] 2096-0603(2018)10-0080-01
計(jì)算機(jī)視覺對(duì)三維重建、物體分類以及目標(biāo)檢測(cè)等起著重要的作用。隨著技術(shù)的發(fā)展,應(yīng)用計(jì)算機(jī)視覺的領(lǐng)域更加廣泛,其中包含了圖像的處理與圖像內(nèi)容理解。該技術(shù)主要是通過計(jì)算機(jī)軟件對(duì)圖像進(jìn)行具體操作與分析,使計(jì)算機(jī)能夠分析理解。計(jì)算機(jī)視覺與數(shù)字圖像處理相融合,有利于使學(xué)生快速掌握?qǐng)D像處理的基本原理和操作方法,能夠快速地把圖像理論應(yīng)用到計(jì)算機(jī)視覺當(dāng)中,達(dá)到理論知識(shí)與實(shí)際操作的有效結(jié)合。為此,我們以學(xué)習(xí)理論知識(shí)、進(jìn)行軟件基本操作以及學(xué)習(xí)與計(jì)算機(jī)視覺有關(guān)知識(shí)點(diǎn)為主線進(jìn)行敘述。
計(jì)算機(jī)視覺與數(shù)字圖像處理課程融合的研究方案主要包括下面幾個(gè)步驟:(1)學(xué)習(xí)數(shù)字圖像處理的相關(guān)知識(shí),能夠讓學(xué)生快速入門;(2)理論結(jié)合實(shí)踐,利用MATLAB對(duì)圖像進(jìn)行處理;(3)學(xué)習(xí)與計(jì)算機(jī)視覺相關(guān)的知識(shí)點(diǎn),對(duì)圖像處理的知識(shí)點(diǎn)進(jìn)行拓展。
一、數(shù)字圖像處理基本內(nèi)容的學(xué)習(xí)
數(shù)字圖像處理的本質(zhì)是對(duì)圖像像素點(diǎn)的處理,主要掌握三個(gè)方面,分別是通過對(duì)圖像進(jìn)行空間、色彩、亮度的變化提高圖像的視覺質(zhì)量;把提取的圖像特征用于計(jì)算機(jī)分析,來研究圖像;圖像的編碼和壓縮用于圖像的分類存儲(chǔ)。掌握基本的數(shù)字圖像處理算法:圖像變換,如傅里葉變化;圖像保真壓縮;簡單的圖像分割算法;圖像描述,應(yīng)用于對(duì)目標(biāo)的二維描述向三維描述的發(fā)展;多種類型圖像識(shí)別算法。
在學(xué)生理解數(shù)字圖像處理的基本知識(shí)及常用的處理算法之后,為了證明圖像處理中的相關(guān)知識(shí)與計(jì)算機(jī)視覺的分類問題密切相關(guān),我們要求學(xué)生掌握Bag-of-words(BoW)結(jié)構(gòu)框架。學(xué)習(xí)BoW框架中包含的特征提取、聚類等操作,熟練掌握編碼和池化的算法以及如何進(jìn)行分類等一系列完整的圖像處理和計(jì)算機(jī)識(shí)別過程。
二、利用MTALAB對(duì)圖像進(jìn)行處理
利用MATLAB對(duì)圖像進(jìn)行處理是書本知識(shí)與實(shí)踐相聯(lián)系的重要方式。把MATLAB應(yīng)用在該領(lǐng)域,不僅能夠促進(jìn)對(duì)理論的理解,更能提高學(xué)生的學(xué)習(xí)興趣。
(一)學(xué)習(xí)MATLAB基礎(chǔ)知識(shí)
了解MATLAB的工作區(qū)域、快捷鍵、工具箱和一些基本函數(shù),學(xué)會(huì)調(diào)試程序,設(shè)置斷點(diǎn),改正程序的簡單錯(cuò)誤等。
(二)在MATLAB中實(shí)現(xiàn)常用的圖像處理操作
利用MATLAB中的相關(guān)函數(shù)或者參考相關(guān)程序?qū)D像進(jìn)行變換、分割等基本操作。通過實(shí)際動(dòng)手操作和MATLAB形象化的展示讓學(xué)生更加深刻地掌握?qǐng)D像處理的基本操作方法。
(三)在MATLAB下運(yùn)行BoW代碼
首先在MATLAB下運(yùn)行BoW代碼,學(xué)會(huì)設(shè)置路徑、單步運(yùn)行、調(diào)用軟件包等操作。然后單步運(yùn)行程序,并進(jìn)入程序內(nèi)部查看重要函數(shù),了解圖像分類的基本原理并在這個(gè)過程中熟練應(yīng)用MATLAB的快捷鍵。
三、學(xué)習(xí)計(jì)算機(jī)視覺的相關(guān)知識(shí)點(diǎn)
計(jì)算機(jī)視覺進(jìn)一步延伸了圖像處理知識(shí),我們從三個(gè)方面深入學(xué)習(xí)與該技術(shù)相關(guān)的知識(shí)點(diǎn)。首先,從圖像的邊緣檢測(cè)到圖像匹配再到圖像三維重建。圖像的邊緣檢測(cè)是圖像匹配的前提,通過邊緣檢測(cè)對(duì)圖像進(jìn)行分割、特征提取,進(jìn)一步進(jìn)行圖像匹配,對(duì)匹配好的二維圖像進(jìn)行三維重現(xiàn)。其次,從濾波器到卷積神經(jīng)網(wǎng)絡(luò)。濾波器在圖像處理中主要用于去噪,而在計(jì)算機(jī)視覺中用于卷積層的特征提取。最后,從直方圖到圖像內(nèi)容理解。直方圖體現(xiàn)圖像像素出現(xiàn)的頻數(shù),將直方圖生成思想用于圖像的表示,可以進(jìn)一步加強(qiáng)學(xué)生對(duì)圖像內(nèi)容理解領(lǐng)域的了解。
四、結(jié)語
本文提出計(jì)算機(jī)視覺與圖像處理課程融合的研究方案,以學(xué)習(xí)理論知識(shí)、進(jìn)行軟件基本操作以及學(xué)習(xí)與計(jì)算機(jī)視覺的相關(guān)知識(shí)點(diǎn)為主線引導(dǎo)學(xué)生循序漸進(jìn)。從圖像處理的基本知識(shí)點(diǎn)延伸到計(jì)算機(jī)視覺的知識(shí),拓寬了學(xué)生的知識(shí)面,極大地提高了學(xué)生的創(chuàng)新能力。
參考文獻(xiàn):
A Krizhevsky,I Sutskever, GE Hinton.Imagenet classification with deep convolutional neural networks[J].International Conference on Neural Information Processing System,2012,60(2).