楊森泉,丁 凡,陳景華,劉建軍,胡松喜
(韶關學院 智能工程學院,廣東 韶關 512005)
“新工科”人才指的是具備工程實踐能力、創(chuàng)新能力、國際競爭力的高素質(zhì)復合人才,不僅要求學校培養(yǎng)跨學科、跨專業(yè)人才,同時要求培養(yǎng)學生能夠?qū)⑺鶎W技術與經(jīng)濟、社會、管理等方面知識進行融合,引領未來科技和產(chǎn)業(yè)的發(fā)展[1]。
在“新工科”背景下,要求電子信息類學生能夠緊跟時代發(fā)展,著重提升自己的創(chuàng)新思維、持續(xù)學習能力和實踐能力[2]。數(shù)字圖像處理是電子信息類專業(yè)課程體系中一門多學科交叉融合的專業(yè)課,它涉及了高等數(shù)學、線性代數(shù)、信號與系統(tǒng)、數(shù)字信號處理等多門課程內(nèi)容[3]。
在5G、人工智能等新興產(chǎn)業(yè)技術的推動下,數(shù)字圖像處理技術發(fā)展日新月異,對數(shù)字圖像處理課程的教學模式、教學方法和教學手段都提出了針對性的要求[4]。本文探討了新工科背景下,基于企業(yè)實訓的數(shù)字圖像處理課程改革實踐,以韶關學院電子系和廣州粵嵌校企共建的“眾創(chuàng)空間”為平臺,發(fā)揮廣州粵嵌通信科技股份有限公司的行業(yè)優(yōu)勢,通過“以訓促學”的“穿透式”教學改革思路,以實訓項目成果作為人才培養(yǎng)成效的外化評價指標,消除新工科人才培養(yǎng)需求與企業(yè)實訓和需求之間的鴻溝,著力于提高新工科人才培養(yǎng)質(zhì)量,充分體現(xiàn)新工科人才培養(yǎng)特點的立體化教學資源[5]。
大多數(shù)應用型本科大學的電子信息專業(yè)都開設了數(shù)字圖像處理課程。但是,由于知識點繁瑣、散亂,而數(shù)字圖像課程理論起點高、公式復雜,而且學生的物理知識和信號處理知識基礎普遍不牢固,因此很難理解課程本身知識體系[6]。而對于教師而言,在數(shù)字圖像處理課程教學實踐中普遍存在以下問題:
(1)該課程教學存在課程內(nèi)容多、教學實驗學時少的矛盾,如何在有限的課時時間內(nèi)解釋課程的基本理論和相關應用知識點是一個挑戰(zhàn)。
(2)課程的實驗僅停留在驗證性實驗上,缺乏全面性和創(chuàng)新性,知識點單一,無法培養(yǎng)學生的綜合編程能力和解決實際應用問題的能力。
(3)理論知識難以掌握的問題。該課程理論知識的算法原理難度大,對于一些基礎知識掌握不扎實的學生來說,在理解學習上存在較大障礙。
(4)在傳統(tǒng)的教學過程中,實驗大多使用一些基本知識內(nèi)容,難以有效地調(diào)動學生的學習積極性和主動性,更談不上培養(yǎng)學生的創(chuàng)新和實踐能力[7-8]。
針對以上問題,本文從課程實訓方面討論應用廣州粵嵌科技實訓項目在數(shù)字圖像處理課程實踐的改革,采用線上線下相結合的方法,線上采取觀看錄制好的訓練營課程,以作為教材不同章節(jié)內(nèi)容的補充;實訓方面通過與廣州粵嵌校企共建教學實驗室和實習實訓平臺,促進與企業(yè)先進技術的對接,激發(fā)學生學習熱情和積極性,提高學生動手實踐能力。
教學實訓作為電子信息類人才培養(yǎng)的關鍵環(huán)節(jié),而且數(shù)字圖像處理是一門實踐性非常強的課程,通過實踐課程有利于加強學生對算法的理解,鞏固對圖像處理的理論知識,提高動手能力和知識綜合運用能力。
下面簡要列舉韶關學院與廣州粵嵌校企共建的三個實訓內(nèi)容,分別是CIFAR-10圖像分類、人臉表情分類和車牌識別。
CIFAR-10圖像分類是一個公開的測試集,其涵蓋了飛機、汽車、鳥、貓、鹿、狗、青蛙、馬、船以及卡車10個類別圖像,如圖1所示。
圖1 CIFAR-10圖像分類示例
實訓過程中使用經(jīng)典的Residual Network殘差網(wǎng)絡模型進行識別[9],在一個帶GPU的電腦上進行訓練后,能達到最高70%的識別精度。通過這個實訓課程,讓學生懂得深度學習的三個步驟:建立模型、損失函數(shù)和參數(shù)學習。同時,可以進一步引導學生通過修改網(wǎng)絡模型、設置不同的學習率以及使用不同的損失函數(shù),提高識別準確率。
通過一個簡單的圖像二分類識別,將圖片中的人臉表情分為正面和負面表情。如果表情為微笑、興奮,則分為正面表情;如果為傷心、哭泣,則為負面表情。模型示例如圖2所示。
圖2 人臉表情分類示例
本實訓首先是對圖像臉部中心區(qū)域進行檢測,識別出人臉感興趣區(qū)域,其次對識別出的臉部中心區(qū)域進行裁剪,然后再對圖片進行歸一化處理。構建包含兩個卷積層、一個全連接層和一個激活層的簡單神經(jīng)網(wǎng)絡模型對歸一化后的圖像進行訓練,訓練完成后再利用測試集進行測試,通過調(diào)整參數(shù)和網(wǎng)絡層,識別準確率最大能達到95%。
車牌識別實訓是一個圖像多分類任務,需要將車牌圖像中的每個字符進行分割后識別,最后將車牌圖像轉(zhuǎn)換為文字輸出,如圖3所示。
圖3 車牌識別實例
本次實訓使用一個車牌字符數(shù)據(jù)集,包含了32 370張大小為20×20像素的圖片,總共有66組數(shù)字和字符,數(shù)據(jù)集的90%圖片用于訓練,10%圖片用于測試;網(wǎng)絡使用經(jīng)典的AlexNet網(wǎng)絡[10];訓練過程采用動量優(yōu)化法參數(shù)學習,學習率設為0.01,動量大小為0.9,迭代次數(shù)設為100;損失函數(shù)使用交叉熵損失函數(shù)。經(jīng)過以上訓練過程,車牌的識別率達到97.6%。
本文在“新工科”更強調(diào)學科的實用性、交叉性與綜合性背景下,從校企聯(lián)合協(xié)同育人出發(fā),對數(shù)字圖像處理課程實訓進行改革,設計相關教學實訓案例。通過實訓案例,學生可以接觸到當下圖像處理的主流技術,并能體驗真實企業(yè)項目常用的方法;可以讓學生從實訓中學習相關的操作及其實際運用,加強學生實踐動手和解決問題能力,為其在日后投入工作提供了較好的技術支持與幫助。