高直 朱志浩
關(guān)鍵詞:機(jī)器視覺(jué)課程;教學(xué)方法;圖像匹配;教學(xué)效果
0 引言
隨著人工智能技術(shù)的飛速發(fā)展,基于機(jī)器視覺(jué)識(shí)別技術(shù)的應(yīng)用成為了很多行業(yè)的發(fā)展契機(jī),如無(wú)人駕駛[1]、工業(yè)機(jī)器人抓取[2]、人工智能[3]、交通監(jiān)控[4]、人臉識(shí)別[5]等。這一系列的應(yīng)用都離不開(kāi)圖像匹配技術(shù),因此,圖像匹配研究已經(jīng)成為當(dāng)前機(jī)器視覺(jué)領(lǐng)域的一個(gè)熱點(diǎn)。
機(jī)器視覺(jué)課程是新工科建設(shè)的產(chǎn)物,以互聯(lián)網(wǎng)和工業(yè)智能為核心,著力培養(yǎng)創(chuàng)新型、應(yīng)用型人才,華東理工大學(xué)于2021 年1 月起已經(jīng)開(kāi)設(shè)跨學(xué)科、跨專(zhuān)業(yè)的機(jī)器視覺(jué)算法課程[6]。機(jī)器視覺(jué)課程屬于一門(mén)多學(xué)科交叉課程,具有較強(qiáng)的應(yīng)用性,能夠培養(yǎng)學(xué)生的高階思維[7]。
圖像匹配技術(shù)已經(jīng)較為成熟,理論知識(shí)扎實(shí),應(yīng)用十分廣泛,如在醫(yī)學(xué)領(lǐng)域,通過(guò)圖像匹配技術(shù)對(duì)醫(yī)學(xué)圖像進(jìn)行分析,醫(yī)生能夠結(jié)合分析結(jié)果獲取更多的有效信息[8];如在航空航天領(lǐng)域,利用圖像匹配技術(shù)能夠提高飛行器的自主導(dǎo)航精度[9]。因此圖像匹配技術(shù)不僅能夠降低教師的教學(xué)難度,同時(shí)也能使學(xué)生盡快步入機(jī)器識(shí)別領(lǐng)域,激發(fā)學(xué)生的學(xué)習(xí)興趣。
1 機(jī)器視覺(jué)課程現(xiàn)狀
從目前的機(jī)器視覺(jué)課程教學(xué)來(lái)看,存在一些不足。
⑴ 教學(xué)模式死板,課堂乏味無(wú)趣,學(xué)生積極性不高
該課程在一些院校形成了較固定的教學(xué)模式。老師通常以板書(shū)和PPT 的形式向?qū)W生傳輸知識(shí),學(xué)生學(xué)習(xí)動(dòng)力不足,缺乏積極主動(dòng)性。學(xué)生的學(xué)習(xí)成績(jī)多為考核理論知識(shí),學(xué)生平時(shí)少學(xué)甚至不學(xué)也能夠靠突擊背誦知識(shí)點(diǎn)過(guò)關(guān),考過(guò)后就忘。
⑵ 教學(xué)內(nèi)容局限,資源配置不均
目前因?yàn)闄C(jī)器視覺(jué)課程是多學(xué)科交叉課程,故該課程的內(nèi)容過(guò)于廣泛,內(nèi)容深度對(duì)于初學(xué)者而言較難掌握。所采用的課本或教材陳舊,繁瑣的公式推導(dǎo)多,知識(shí)更新慢,與社會(huì)需求脫節(jié)。
⑶ 案例陳舊,致使學(xué)生盲目跟從學(xué)習(xí)
課程實(shí)踐對(duì)工科學(xué)生而言,尤為重要,機(jī)器視覺(jué)課程實(shí)踐對(duì)于剛接觸這一領(lǐng)域的學(xué)生來(lái)說(shuō),有些實(shí)踐項(xiàng)目案例陳舊,而且多以算法的數(shù)學(xué)推導(dǎo)為主,這只會(huì)讓學(xué)生陷入復(fù)雜繁瑣的數(shù)學(xué)邏輯中去。學(xué)生面對(duì)實(shí)際應(yīng)用,只會(huì)跟隨老師操作,不能理解“為什么”,遇到問(wèn)題不知所措。學(xué)生沒(méi)有參與度,最終為了考核死記硬背蒙混過(guò)關(guān),無(wú)法體現(xiàn)教師的教學(xué)水平。
2 圖像匹配技術(shù)
在不同條件下獲得的圖像因角度、灰度等影響產(chǎn)生差異,圖像匹配就是通過(guò)對(duì)比方法識(shí)別出這些存在差異的圖像中的相同特征,其所用到的對(duì)比方法就是圖像匹配算法。圖像匹配算法主要分兩大類(lèi):基于灰度的匹配算法和基于特征?;诨叶鹊膱D像匹配算法是利用圖像的像素灰度值信息,其包含了圖像記錄的所有信息,利用灰度信息建立兩幅圖像之間的相似性度量,采用搜索方法找到使得相似性度量值達(dá)到最大或最小變換模型的參數(shù),因此該方法計(jì)算量過(guò)大,難以達(dá)到實(shí)時(shí)性要求;基于特征點(diǎn)的圖像匹配算法是目前的主流算法,其最大的優(yōu)點(diǎn)是能夠?qū)z測(cè)出來(lái)的特征點(diǎn)通過(guò)特征描述呈現(xiàn)并根據(jù)相似原則完成匹配,在受到圖像角度、灰度、旋轉(zhuǎn)等影響下都有較好的適應(yīng)能力[9]。圖像匹配的流程如圖1 所示。
圖像匹配算法經(jīng)過(guò)多年的研究也出現(xiàn)了很多經(jīng)典的算法,如SURF 和SIFT 兩種算法。2004 年,Low 等提出了一種尺度不變特征變化算法SIFT(Scale Invariant Feature Transform),在大多數(shù)情況下,該算法都取得了滿(mǎn)意的匹配效果,但是SIFT 描述符運(yùn)算復(fù)雜,處理時(shí)間長(zhǎng),對(duì)于相似結(jié)構(gòu)的圖像會(huì)有大量誤匹配點(diǎn)產(chǎn)生。在SIFT 算法的基礎(chǔ)上,Bay 等提出了耗時(shí)更短的加速魯棒特征(SURF)算法,SURF 算法通過(guò)對(duì)海森行列式算法的簡(jiǎn)化,大大提升了運(yùn)算速度。
諸多研究人員又在SURF 算法的基礎(chǔ)上提出改進(jìn),對(duì)SURF 算法的改進(jìn)大都在圖像預(yù)處理、特征提取和模板匹配這三部分。對(duì)圖像預(yù)處理部分的改進(jìn),主要是為了之后能獲取更多的圖像特征信息;對(duì)特征提取部分的改進(jìn)大都通過(guò)對(duì)描述符的降維或采用其他描述符來(lái)完成特征描述,以加快計(jì)算速度等;對(duì)于模板匹配部分的改進(jìn)大多是通過(guò)添加約束條件實(shí)現(xiàn)對(duì)匹配結(jié)果精準(zhǔn)度的提高。
3 圖像匹配在機(jī)器視覺(jué)課程中的優(yōu)勢(shì)分析
機(jī)器視覺(jué)課程的基本內(nèi)容是圖像匹配技術(shù),學(xué)生通過(guò)學(xué)習(xí)圖像匹配技術(shù),可以由淺入深的掌握機(jī)器視覺(jué)技術(shù)。因此,面對(duì)機(jī)器視覺(jué)課程的現(xiàn)狀,圖像匹配技術(shù)能夠帶來(lái)諸多優(yōu)勢(shì)。
3.1 對(duì)機(jī)器視覺(jué)課程的改進(jìn)
⑴ 理論與軟硬件教學(xué)相結(jié)合,提高學(xué)生的應(yīng)用技能能力
圖像匹配技術(shù)對(duì)于整個(gè)機(jī)器視覺(jué)領(lǐng)域而言難度較低,學(xué)生易于接受,以SURF 算法為例,國(guó)外諸多大學(xué)針對(duì)SURF 算法已經(jīng)開(kāi)設(shè)多年相關(guān)課程,通過(guò)讓學(xué)生在掌握SURF 算法的基礎(chǔ)上,運(yùn)用SURF 算法實(shí)現(xiàn)機(jī)器視覺(jué)中的一些應(yīng)用,提高了學(xué)生的實(shí)踐能力,也不會(huì)因難度過(guò)大導(dǎo)致學(xué)生學(xué)習(xí)動(dòng)力不足。對(duì)于國(guó)外大學(xué)的教學(xué)理念,可以取長(zhǎng)補(bǔ)短,先熟悉編程環(huán)境,讓學(xué)生充分利用網(wǎng)絡(luò)資源,查閱相關(guān)文獻(xiàn),了解經(jīng)典圖像匹配算法,這些算法經(jīng)典透徹,學(xué)生容易掌握。建立科研小組,能夠調(diào)動(dòng)學(xué)生的積極主動(dòng)性,將理論知識(shí)運(yùn)用到實(shí)踐中,讓學(xué)生自己動(dòng)手,編寫(xiě)相關(guān)程序,能夠增強(qiáng)學(xué)生對(duì)Vs、Python、Matlab 等開(kāi)發(fā)環(huán)境的掌握能力,同時(shí)也能激發(fā)學(xué)生的思考和創(chuàng)新能力??蒲行〗M的成立使學(xué)習(xí)效果評(píng)價(jià)更科學(xué)合理,既避免了學(xué)生為應(yīng)付理論考試的突擊背誦,也能體現(xiàn)教師的教學(xué)水平。
⑵ 調(diào)動(dòng)學(xué)生的學(xué)習(xí)興趣
圖像匹配技術(shù)發(fā)展至今,在很多領(lǐng)域都發(fā)揮著極其重要的作用,呈現(xiàn)出一系列的應(yīng)用成果,可以將互聯(lián)網(wǎng)上的諸多成功案例通過(guò)視頻的形式給學(xué)生進(jìn)行講解,讓學(xué)生感受到這門(mén)課程的有趣之處,也能讓學(xué)生對(duì)自己的未來(lái)有所規(guī)劃,理解為什么學(xué)習(xí)這門(mén)課程該課程的學(xué)習(xí)對(duì)自己以后參加工作有何用處,將最新的應(yīng)用實(shí)例呈現(xiàn)給學(xué)生,能夠調(diào)動(dòng)學(xué)生對(duì)機(jī)器視覺(jué)課程的學(xué)習(xí)興趣,也能夠讓學(xué)生對(duì)自己學(xué)習(xí)的方向有更深的見(jiàn)解,拓展學(xué)生的思維。
3.2 教學(xué)案例分析
下面通過(guò)教學(xué)案例說(shuō)明圖像匹配技術(shù)在“機(jī)器視覺(jué)”課程教學(xué)中的應(yīng)用。
以SURF 算法為例,SURF 算法的基本流程同其他匹配算法一致主要分為三部分:特征點(diǎn)的檢測(cè)取、特征點(diǎn)提取與描述、特征匹配。SURF 算法一種比例和旋轉(zhuǎn)不變的興趣點(diǎn)檢測(cè)器和描述符(如圖2),SURF算法中借用積分圖像概念來(lái)減小算法的計(jì)算量,將圖像與高斯二階微分模板的濾波轉(zhuǎn)換為對(duì)積分圖像的加減運(yùn)算,通過(guò)二階Hessian 矩陣完成特征點(diǎn)的檢測(cè),對(duì)于一個(gè)圖像P = (x,y) 上的圖像尺度為δ 的點(diǎn)X?的Hessian 矩陣為:
利用Harr 小波響應(yīng)確定特征點(diǎn)的主方向,并將同主方向水平的Haar 小波響應(yīng)值定義為dx 和dy,通過(guò)計(jì)算他們的絕對(duì)值之和得到每個(gè)子區(qū)域的四個(gè)特征向量,計(jì)算所有的矩形區(qū)域塊得到64 維的特征描述子。
特征匹配通常是采用歐式距離的方法,針對(duì)基準(zhǔn)圖像中的某一個(gè)特征點(diǎn),在待匹配圖像中搜索出距離最近的特征點(diǎn),歐式距離越小,則相似程度越高,當(dāng)小于給定閾值時(shí)則判定匹配成功。
以圖2 為案例,該教學(xué)主要目的時(shí)使學(xué)生掌握處理圖像、特征檢測(cè)、特征提取及圖像匹配等基本技能,鍛煉學(xué)生軟件開(kāi)發(fā)能力。
讓學(xué)生根據(jù)教材圖像處理的基礎(chǔ)算法動(dòng)手編程,將圖像轉(zhuǎn)換為灰度圖像,對(duì)于灰度圖像進(jìn)行特征提取,特征提取部分對(duì)圖像匹配的精度和速度都具有重要影響,圖像的特征包含:顏色、形狀等[10],對(duì)于這部分可以著重講解。匹配結(jié)果如圖3 所示,讓學(xué)生采用歐氏距離的特征匹配進(jìn)行對(duì)比分析,引導(dǎo)學(xué)生通過(guò)互聯(lián)網(wǎng)資料查閱學(xué)習(xí),理解這兩種算法的區(qū)別,同時(shí)也能夠讓學(xué)生在查閱學(xué)習(xí)的過(guò)程中看是否能夠發(fā)現(xiàn)創(chuàng)新點(diǎn),通過(guò)創(chuàng)新更進(jìn)一步提高圖像匹配的精準(zhǔn)性和實(shí)時(shí)性。通過(guò)案例的學(xué)習(xí),為機(jī)器視覺(jué)課程打下基礎(chǔ)。
4 結(jié)束語(yǔ)
通過(guò)對(duì)機(jī)器視覺(jué)課程的研究,分析了現(xiàn)如今機(jī)器視覺(jué)課程存在的問(wèn)題,并提出改進(jìn)建議,探索了圖像匹配技術(shù)在機(jī)器視覺(jué)課程教學(xué)中的優(yōu)勢(shì),并通過(guò)案例分析了圖像匹配技術(shù)機(jī)器視覺(jué)課程的重要性,讓學(xué)生以圖像匹配技術(shù)為媒介對(duì)機(jī)器視覺(jué)課程建立一個(gè)完整的學(xué)習(xí)體系,由粗淺到深入,完成機(jī)器視覺(jué)的課程,取得了較好的教學(xué)效果。