南京郵電大學(xué)通信與信息工程學(xué)院 鄧麗珍 朱 虎
“圖像與視頻處理”課程立體化教學(xué)研究
——以歸一化互相關(guān)圖像匹配為例
南京郵電大學(xué)通信與信息工程學(xué)院 鄧麗珍 朱 虎
【摘要】立體化教學(xué)逐漸成為高校工科專業(yè)教師教學(xué)的一種重要的教學(xué)方法,本文針對工科課程“圖像和視頻處理”的教學(xué),提出了“實(shí)際意義和應(yīng)用→定義→數(shù)學(xué)原理→編碼→三維效果演示”全方位立體化的教學(xué)模式,該模式把工科理論和數(shù)學(xué)依據(jù)以及編程實(shí)踐渾然天成般的融合在一起,從而全面提高學(xué)生的理論創(chuàng)新和實(shí)際動(dòng)手能力。本文以圖像匹配里的歸一化互相關(guān)匹配為例,深入闡述了立體化教學(xué)模式實(shí)現(xiàn)的具體過程。
【關(guān)鍵詞】圖像和視頻處理;立體化教學(xué);歸一化互相關(guān);Matlab編程
圖像和視頻處理是信息技術(shù)中的一門新興學(xué)科,它在軍事、安保、醫(yī)學(xué)、遙感、氣象等領(lǐng)域得到了廣泛應(yīng)用?!皥D像和視頻處理”課程是高等工科院校通信工程、電子信息工程、廣播電視工程和自動(dòng)化等專業(yè)的一門重要專業(yè)課,是南京郵電大學(xué)廣播電視工程專業(yè)開設(shè)的本科生主干課程。該課程是圖像與廣播電視工程專業(yè)學(xué)生本科階段接觸的第一門專業(yè)基礎(chǔ)課程,向?qū)W生介紹了圖像與視頻處理方面的基礎(chǔ)知識。該課程主要將數(shù)字圖像、視頻等媒體信息的處理技術(shù)有機(jī)地融合在一起,揭示其內(nèi)在的聯(lián)系,以便讓學(xué)生在有限的學(xué)習(xí)時(shí)間內(nèi)掌握更系統(tǒng)、更全面的知識。
“圖像和視頻處理”課程是一門對數(shù)學(xué)推理能力和編程動(dòng)手能力都要求比較高的課程。傳統(tǒng)的照本宣科式的教學(xué)方式,忽略了學(xué)生的理論聯(lián)系數(shù)學(xué)和實(shí)踐能力培養(yǎng),缺乏綜合應(yīng)用能力的訓(xùn)練,導(dǎo)致學(xué)生面對具體應(yīng)用問題無從下手。為了加深學(xué)生對該課程理論的數(shù)學(xué)基礎(chǔ)的掌握和增強(qiáng)學(xué)生解決實(shí)際問題的能力,在教學(xué)內(nèi)容和教學(xué)方法上進(jìn)行改革,在教學(xué)中引入立體教學(xué)法。通過工科的定義聯(lián)系數(shù)學(xué)原理在到編程實(shí)現(xiàn),最后到實(shí)驗(yàn)結(jié)果立體顯示的方式,來鞏固所學(xué)理論知識,加深學(xué)生對抽象理論知識的理解和感性認(rèn)識,同時(shí)更好地培養(yǎng)學(xué)生的理論功底和創(chuàng)新能力,進(jìn)而達(dá)到學(xué)以致用的目的。
本文在結(jié)合了“圖像和視頻處理”課程中的具體內(nèi)容的基礎(chǔ)上,作者提出一種“圖像和視頻處理”課程教學(xué)中的立體化教學(xué)模式。該教學(xué)模式分為“實(shí)際意義和應(yīng)用→定義→數(shù)學(xué)原理→編碼→三維效果演示”的五個(gè)教學(xué)環(huán)節(jié),五個(gè)環(huán)節(jié)環(huán)環(huán)相扣,相互依存,把工科定義和數(shù)學(xué)理論以及編程實(shí)踐渾然天成般的融合在一起。通過對實(shí)際意義和應(yīng)用的講解提高學(xué)生學(xué)習(xí)的興趣,從而引出工科定義,通過分析其數(shù)學(xué)意義,提高學(xué)生對其理論的數(shù)學(xué)依據(jù)的理解,可以更好的激勵(lì)學(xué)生的創(chuàng)造性思維;然后,通過編程實(shí)驗(yàn)和三維效果演示,使原本很抽象的內(nèi)容變得簡單生動(dòng)。另外,為了滿足學(xué)生實(shí)踐的要求,可以布置課后編程作業(yè),這樣不但可以鞏固所學(xué)知識,還可提高學(xué)生的動(dòng)手能力。
下面我們將以圖像和視頻處理里面的圖像匹配中的歸一化互相關(guān)為例,將介紹如何把枯燥無味的歸一化互相關(guān)匹配算法,轉(zhuǎn)化為實(shí)際意義和應(yīng)用→定義→數(shù)學(xué)原理→編碼→三維效果演示的立體化教學(xué)方式。
圖像匹配是“圖像和視頻處理”課程中一節(jié)重要的內(nèi)容。圖像匹配技術(shù)在生活和工作中有著廣泛的應(yīng)用,根據(jù)相關(guān)專家統(tǒng)計(jì)大約有40%的機(jī)器視覺應(yīng)用中需要用到圖像匹配技術(shù)。圖像匹配技術(shù)有著極其廣泛的應(yīng)用,從工業(yè)流水線的自動(dòng)監(jiān)控到軍事上的目標(biāo)檢測識別與跟蹤、從遙感中的資源分析到氣象中的氣象預(yù)報(bào)、從醫(yī)療中的醫(yī)療診斷到交通管理的智能交通、從文字識別到圖像數(shù)據(jù)庫檢索以及景物分析中的變化檢測等等,幾乎現(xiàn)代生活中的每一處都能見到圖像匹配技術(shù)。
所謂圖像匹配是指在一幅(或一批)圖像中尋找與給定目標(biāo)圖像相似的圖像或者圖像區(qū)域(子圖像)的過程。通常將已知目標(biāo)圖像稱為基準(zhǔn)圖(或者模板圖),而將待搜索圖像中可能與它對應(yīng)的子圖稱作該模板的待匹配的目標(biāo)圖像。圖像匹配是在來自不同時(shí)間或者不同視角的同一場景的兩幅或多幅圖像之間尋找對應(yīng)關(guān)系,基準(zhǔn)圖可以比實(shí)時(shí)圖大也可以比實(shí)時(shí)圖小?;ハ嚓P(guān)匹配算法是一種最基本的灰度統(tǒng)計(jì)匹配方法,它要求參考圖像和待匹配圖像具有相似的灰度和尺度信息。歸一化互相關(guān)匹配算法是一種經(jīng)典的互相關(guān)的匹配算法,經(jīng)常寫為NCC(Normalized Cross Correlation)算法,其通過計(jì)算模板圖像和待匹配圖像的互相關(guān)系數(shù)值來確定匹配的相似程度,互相關(guān)系數(shù)最大時(shí)對應(yīng)的搜索窗口的位置決定了模板圖像在待匹配圖像中的位置。NCC的相關(guān)矩陣公式定義為:
其中,h(x,y)和f(x,y)表示實(shí)時(shí)圖像H和模板圖像F在(x,y)位置像素點(diǎn)的灰度值。NCC算法具有很高的準(zhǔn)確性和適應(yīng)性。
通過觀察互相關(guān)匹配的公式,我們可以聯(lián)想到中學(xué)數(shù)學(xué)學(xué)過的柯西不等式:
把工科的理論聯(lián)系到學(xué)生所學(xué)的數(shù)學(xué)知識里面,有助于學(xué)生深化理解理論,為將來進(jìn)行科研創(chuàng)新打下良好的基礎(chǔ)。這要求授課教師有著更強(qiáng)的責(zé)任心,而且需要扎實(shí)的理論功底和數(shù)學(xué)分析能力。
“圖像和視頻處理”課程所授內(nèi)容都可以通過計(jì)算機(jī)編程來進(jìn)行試驗(yàn)和測試,通過實(shí)驗(yàn)的結(jié)果和效果,從而直觀的再現(xiàn)課程所講述的內(nèi)容,提高學(xué)生的學(xué)習(xí)興趣和建立學(xué)生動(dòng)手創(chuàng)新的自信心。當(dāng)然,這要求教師具備極強(qiáng)的編程能力和將理論與編程代碼相結(jié)合的解釋能力,現(xiàn)場講解編程思想和演示編程過程,不僅可以熏陶學(xué)生處理的思路和提高學(xué)生的編程技巧,而且可以很好的建立起學(xué)生發(fā)現(xiàn)問題解決問題的興趣和能力。
本文應(yīng)用MATLAB R2014a影像處理工具箱中提供的相關(guān)函數(shù)和命令,對數(shù)字圖像進(jìn)行互相關(guān)匹配去識別基準(zhǔn)圖,其核心代碼和注釋如下:
scene = im2double(imread(‘1.jpg’));%讀取目標(biāo)圖像并轉(zhuǎn)為雙精度浮點(diǎn)型
template = im2double(imread(‘1_template.jpg’));%讀取基準(zhǔn)圖像并轉(zhuǎn)為雙精度浮點(diǎn)型
[template_height,template_width]=size(template);%輸出目標(biāo)圖像大小
[scene_height,scene_width]=size(scene);%輸出基準(zhǔn)圖像大小
for i=1:scene_height-template_height
for j=1:scene_width-template_width
temp_picture=imcrop(scene,[j,i,template_width-1,template_height-1]);
r(i,j)=corr2(temp_picture,template); %計(jì)算互相關(guān)系數(shù)
end
end
figure, surf(r), shading flat,hold on %畫出三維互相關(guān)系數(shù)的峰值圖像。
scene = im2double(imread(‘1.jpg’));%讀取目標(biāo)圖像并轉(zhuǎn)為雙精度浮點(diǎn)型
[x,i]=max(r), [y,j]=max(max(r)),i=i(j); %找出相關(guān)系數(shù)的峰值的位置
plot(j:j+template_width,i,’r’);%畫紅色的匹配結(jié)果框
plot(j:j+template_width,i+template_height,'r');
plot(j,i:i+template_height,'r');
plot(j+template_width,i:i+template_height,'r');
figure,imshow(template,[]); %顯示匹配結(jié)果
課堂上通過運(yùn)行代碼,用來演示利用互相關(guān)匹配算法的實(shí)現(xiàn)過程,具體的實(shí)驗(yàn)結(jié)果見圖1。
圖1 互相關(guān)匹配算法實(shí)例
最后,讓學(xué)生課后思考和實(shí)驗(yàn)習(xí)題;針對傳統(tǒng)的互相關(guān)匹配方法計(jì)算速度比較慢的缺點(diǎn),采用什么方法可以提高算法的實(shí)時(shí)性,改進(jìn)要有數(shù)學(xué)依據(jù)和實(shí)驗(yàn)驗(yàn)證。這樣,完成了學(xué)生可以在課堂上見到從實(shí)際意義和應(yīng)用到定義,再到數(shù)學(xué)原理和編碼,和最后的三維效果演示的整個(gè)全方位的立體化教學(xué)過程,從而增加對理論認(rèn)識的深度,掌握理論付諸于實(shí)踐的編程技術(shù)和實(shí)驗(yàn)技巧,同時(shí)提供相應(yīng)方法實(shí)現(xiàn)的源代碼供學(xué)生參考學(xué)習(xí)。再增加學(xué)生的課后實(shí)驗(yàn)和擴(kuò)展,這樣可以達(dá)到全方面的引導(dǎo)和提高學(xué)生的創(chuàng)新學(xué)習(xí)能力。
本文根據(jù)“圖像和視頻處理”課程的具體特點(diǎn)和特色,通過結(jié)合理論的數(shù)學(xué)依據(jù)和具體可見的編程演示實(shí)驗(yàn),提出了實(shí)際意義和應(yīng)用→定義→數(shù)學(xué)原理→編碼→三維效果演示的立體化教學(xué)方式。這種教學(xué)方式即可以提高了學(xué)生的學(xué)習(xí)興趣和動(dòng)手能力,而且能夠增強(qiáng)學(xué)生的數(shù)學(xué)分析能力和激發(fā)學(xué)生的理論創(chuàng)新能力。將圖像和視頻處理的專業(yè)知識和實(shí)際應(yīng)用、數(shù)學(xué)以及編程實(shí)驗(yàn)有機(jī)結(jié)合起來,使得學(xué)生可以即掌握圖像和視頻處理課程知識和相關(guān)技術(shù),也提高了學(xué)生的專業(yè)素質(zhì)和創(chuàng)新能力。
參考文獻(xiàn)
[1]章毓晉.圖像工程(下)圖像處理[M].北京∶清華大學(xué)出版社,2006.3.
[2]岡薩雷斯著,阮秋琦譯.數(shù)字圖像處理(matlab 版)[M].北京∶電子工業(yè)出版社,2009.5.
[3]朱虎,盧官明,謝世朋.“數(shù)字電視原理”理論實(shí)踐一體化教學(xué)研究[J].電子世界,2014(13)∶54.
[4]梅中輝,李曉飛,圖像與視頻處理教學(xué)過程中的若干思考[J].科技資訊,2009(26)∶232.
基金項(xiàng)目:南京郵電大學(xué)教改基金(編號:JG00215JX66)。
作者簡介:
鄧麗珍(1985—),女,安徽宿州人,博士,講師,研究方向:信號處理與模式識別。