摘要:針對本科自動化專業(yè)“機器學習”課程的特點及教學過程中出現(xiàn)的問題,文章提出了基于項目驅動的課程改革思路,在教學內容、授課模式和考核體系3個方面進行了深入研究。文章詳細闡述了以點帶面的教學內容組織方法、以項目引導的教學模式實施策略以及以成果為導向的多元化考核體系評價方法等改革舉措,以優(yōu)化課程教學效果,提升學生的理論素養(yǎng)與實踐能力。
關鍵詞:“機器學習”;教學改革;項目導向;多元化考核
中圖分類號:G642""文獻標志碼:A
0"引言
人工智能(Artificial Intelligence)的概念最早于20世紀50年代提出。在“圖靈測試”的概念提出和達特茅斯學院會議的推動下,人工智能的研究正式起步[1]。近幾十年來,人工智能領域不斷取得了突破性的研究進展,由于其在經(jīng)濟增長、技術創(chuàng)新和社會服務等方面的巨大潛力,各國政府紛紛加大了對該領域的投入[2]。歐盟于2018年推出了《歐盟人工智能戰(zhàn)略》,美國在2019年發(fā)布了《美國人工智能倡議》。為了把握科技前沿機遇,發(fā)展新型生產力,為全球人工智能領域貢獻中國智慧,我國于2017年出臺了《新一代人工智能發(fā)展規(guī)劃》,明確提出到2030年將中國打造為全球人工智能創(chuàng)新中心的戰(zhàn)略目標。
相對于人工智能巨大的發(fā)展前景,我國人工智能從業(yè)人員儲備稍顯不足。截至2020年,我國人工智能領域人才仍短缺,需求缺口超過 500 萬,國內的供求比更是達到1∶10[3]。作為人工智能的核心技術領域,機器學習在人工智能產業(yè)的崗位需求中占據(jù) 39.1%的份額,但相關技術方向的人才十分稀缺,供需比例僅為 0.23。為提高國家人工智能人才戰(zhàn)略儲備,教育部于 2018 年發(fā)布了《高等學校人工智能創(chuàng)新行動計劃》,旨在推進高校人工智能學科和專業(yè)的建設,優(yōu)化高校人工智能教育及研究,加強高層次人工智能人才的培養(yǎng)。各高校根據(jù)教育部的相關指示精神,陸續(xù)開展人工智能相關的教學工作,而作為人工智能核心的“機器學習”課程更是受到了廣泛的重視。
“機器學習”領域人才的培養(yǎng)依賴于教學方法對該領域技術快速更新迭代和廣泛實踐應用現(xiàn)狀的適應。傳統(tǒng)教學方法通常側重于固定教材和理論知識的灌輸,難以適配機器學習領域快速的算法更新和技術進步。此外,“機器學習”強調數(shù)據(jù)驅動和項目實踐,要求學生通過實驗來獲取洞察并解決實際問題。傳統(tǒng)教學方法缺乏合適的實踐環(huán)境,難以為學生提供深入探索數(shù)據(jù)分析與模型優(yōu)化技能的機會??梢姡瑐鹘y(tǒng)教學方法在靈活性、實用性和時效性方面無法滿足“機器學習”領域的需求。
課程教學的3大支柱(課程內容、教學方式與評估方法)共同決定了教學的質量與效果。本文提出通過以點帶面的課程內容設置,在兼顧“機器學習”基礎與前沿知識的同時,構建完整的學習路徑。教學方式強調實踐與互動,采用項目驅動和數(shù)據(jù)導向的教學方法,幫助學生在真實環(huán)境中運用所學理論。評估方法應多樣化,以全面評估學生的理論掌握程度、技術技能水平和實踐能力,從而激發(fā)學生積極參與并持續(xù)改進。通過對這3個方面的改革,課程能夠更加精準和高效地培養(yǎng)學生在快速發(fā)展的“機器學習”領域中保持競爭力。
1"開課現(xiàn)狀及存在問題
河南理工大學本科自動化專業(yè)自2020年起開設“模式識別與機器學習”課程,包括32學時的課堂教學和4學時的實驗教學,每年選課人數(shù)約200名。得益于人工智能的快速發(fā)展,學生對學習“機器學習”課程的熱情逐年高漲,但隨之出現(xiàn)的問題是學生的學習效果差異明顯。根據(jù)對選課學生的調研分析,結合“機器學習”課程的特點,影響學生學習效果的主要原因可以歸納為如下幾個方面。
1.1"數(shù)學基礎涉及廣
作為數(shù)據(jù)科學的重要組成部分,“機器學習”要求從業(yè)者具備扎實的數(shù)學基礎,尤其在統(tǒng)計學、概率論、線性代數(shù)和優(yōu)化理論等學科領域的基本知識方面。這些數(shù)學工具不僅是構成理解和設計機器學習算法的基礎,也是進行數(shù)據(jù)分析、模式識別和優(yōu)化模型性能的關鍵。全面的數(shù)學基礎對于理解“機器學習”的原理、設計高效的算法并進行性能評估具有重要意義。
數(shù)學本身就是一個復雜且抽象的存在。而現(xiàn)在,學生不僅需要投入大量時間來掌握這些理論,還需要將其應用于數(shù)據(jù)分析和算法設計,完成從理論到實踐的遷移。然而,由于課程時間有限,學生在短期內難以同時消化這些知識并建立完整的知識體系,在學習過程中面臨較大的時間壓力和實踐難度。
1.2"學習內容跨度大
機器學習的研究領域范圍廣泛,整體上可分為傳統(tǒng)機器學習和深度學習2大類。傳統(tǒng)的機器學習側重于從結構化數(shù)據(jù)中找尋規(guī)律,要求從業(yè)者深刻理解其背后的數(shù)學原理和統(tǒng)計理論。而深度學習則更注重網(wǎng)絡架構的構建和損失函數(shù)的設計,依賴于大規(guī)模數(shù)據(jù)集進行訓練,對計算資源和優(yōu)化技術的需求更高。
傳統(tǒng)機器學習和深度學習領域的廣泛性與交叉性不僅要求學生具備廣博的知識儲備和實踐技能,還要求能夠在不同學習內容之間實現(xiàn)有效的遷移與應用。課程內容的復雜性和多樣性使得學生在短時間內難以全面掌握,進而增加了學習過程中的壓力與挑戰(zhàn)。
1.3"編程能力要求高
“機器學習”作為一門高度實踐性的課程,對編程能力有著嚴格的要求。有效地編寫和調試機器學習模型不僅需要扎實的編程基礎,還要求學習者具備數(shù)據(jù)結構和算法領域的知識,以優(yōu)化數(shù)據(jù)處理和算法性能。穩(wěn)固的編程基礎不僅影響算法的實現(xiàn),還直接關系到機器學習創(chuàng)新和應用的有效性。
面對大量的編程任務與技術細節(jié),學生可能難以快速掌握實際操作的技巧。此外,解決實踐中不斷出現(xiàn)的問題也需要很強的邏輯思維與調試能力,尤其當調試和優(yōu)化模型的過程變得復雜,編程門檻成為學生學習和應用機器學習的主要障礙。
1.4"課程內容更新快
與“自動控制原理”等經(jīng)典課程不同,機器學習是一個快速發(fā)展的學科,不斷有新的算法和技術涌現(xiàn)。因此,授課內容不僅需要涵蓋機器學習領域的經(jīng)典知識,還必須及時更新,反映最新的技術進展和前沿研究成果。
不斷涌現(xiàn)的新算法和技術要求學生持續(xù)學習,保持對最新發(fā)展動態(tài)的追蹤,加大了知識掌握的難度。此外,學生不僅要牢固掌握經(jīng)典知識,還須及時吸收新的技術和理論,在經(jīng)典與前沿之間取得平衡。同時,技術的快速發(fā)展使得固定的學習路徑難以明確,學生需要自我引導,合理規(guī)劃學習方式。新技術往往伴隨著新的工具和框架,學生必須不斷學習新的開發(fā)環(huán)境,將所學理論有效應用于實際項目中。
上述因素中,學生反映最多的2個問題是數(shù)學推導和編程能力的困惑。數(shù)學推導的問題在于需要掌握的內容繁雜并且難以將數(shù)學推導與實際工程場景相聯(lián)系。對于編程能力,學生普遍反映對Python語言了解較少,缺乏面向對象編程的思維和實際項目的編程經(jīng)驗。由于數(shù)學推導和編程能力的欠缺,學生不可避免地產生畏難情緒,導致大部分學生在充分感受機器學習算法的魅力之前便陷入迷茫狀態(tài)。這種情況無疑對學生和教師來說都是巨大的損失。
整體來說,“機器學習”是一門理論與實踐緊密結合、內容復雜且實效性高的課程[4-5]。在有限的課時內,如何幫助學生抓住課程的核心,激發(fā)他們的學習興趣,同時培養(yǎng)創(chuàng)造力和獨立思考能力,是一項極具挑戰(zhàn)性的任務。
2"“機器學習”教學改革策略
基于上述分析,為提高“機器學習”課程的教學質量,使學生能夠理解課程內容、掌握核心技能并保持學習熱情,課題組對“機器學習”的課堂教學進行了探索性改革。通過優(yōu)化課程結構,完善教學方法,改進考核模式,充分調動學生的學習積極性,通過持續(xù)反饋機制及時調整教學內容,以滿足學生的學習需求,確保他們掌握這門課程的關鍵知識和技能,進一步鞏固和拓展學習效果。具體措施如下。
2.1"以點帶面的教學內容組織
為了凸顯算法教學在“機器學習”課程中的核心地位,同時兼顧學生數(shù)學思維與編程能力的培養(yǎng),課題組采用線上線下混合教學模式,其中,線下課堂以算法教學為主,而數(shù)學思維和編程能力的培養(yǎng)則主要依靠線上自學,輔以線下課堂討論[6-9]。算法教學的目標是引導學生掌握機器學習算法的完整流程。鑒于課時容量的限制,算法教學內容主要圍繞監(jiān)督學習中的分類和回歸算法等經(jīng)典主題展開。在教學過程中,以確保教學內容精煉且充分滿足課程目標為原則,其他內容則鼓勵學生通過自學獲取。
基于這一思想,如圖1所示,課題組將教學內容按照數(shù)學推導、編程能力、算法細分以及教學反饋4個層面進行組織,具體內容表述如下。
2.1.1"數(shù)學推導
以矩陣運算、標量求導、鏈式法則和梯度下降為第一主線,以概率分布和交叉熵為第二主線。其中第一主線構成了解決機器學習計算方法的基礎,而第二主線則為數(shù)據(jù)建模提供了理論支持。2條主線通過矩陣運算與概率分布的結合,將統(tǒng)計特性嵌入計算框架,使學生能夠理解數(shù)據(jù)在多維空間的特征,進而應用標量求導、鏈式法則和梯度下降優(yōu)化模型參數(shù)。這種雙重主線的配合,使學生不僅能掌握數(shù)學推導過程,還能系統(tǒng)學習算法實現(xiàn),從而構建起全面而深入的知識體系。
2.1.2"編程能力
編程能力的培養(yǎng)涵蓋了PyCharm開發(fā)環(huán)境配置、Anaconda虛擬環(huán)境使用和Python編程等方面。在PyCharm和Anaconda的部分,重點指導學生掌握代碼優(yōu)化與維護、版本控制、虛擬環(huán)境隔離等內容,為機器學習算法開發(fā)打下堅實的工具應用基礎。對于Python編程部分,鑒于學生已具備C語言基礎,重點介紹Python的特色功能,包括數(shù)據(jù)類型(列表、元組、字典等)與面向對象編程方法。面向對象編程內容涵蓋類與對象的基本原理,使學生能夠設計更模塊化和易維護的代碼。此外,還須詳細講解Python的第三方庫,特別是傳統(tǒng)機器學習庫Scikit-Learn和深度學習庫PyTorch的應用。Scikit-Learn提供豐富的預處理、建模與評估功能,用于分類、回歸和聚類等任務的實現(xiàn);PyTorch憑借靈活的動態(tài)圖機制,支持卷積神經(jīng)網(wǎng)絡(CNN)、循環(huán)神經(jīng)網(wǎng)絡(RNN)等深度學習網(wǎng)絡的開發(fā)與優(yōu)化。這一系列的學習使學生能夠有效地管理、組織和處理數(shù)據(jù),系統(tǒng)地實現(xiàn)、優(yōu)化和評估各類機器學習算法,形成完備的技術體系。
2.1.3"算法細分
算法內容細分為多個模塊,包括算法推理、模型評估與選擇、特征工程與數(shù)據(jù)預處理以及綜合項目。每個模塊都明確了學習目標、核心知識點和實際應用,以確保學生系統(tǒng)掌握機器學習算法的完整流程并具備實際操作能力。算法推理提供深入的數(shù)學原理和案例分析,模型評估模塊則強調模型選擇與優(yōu)化策略。通過綜合項目,學生將鞏固理論知識并培養(yǎng)獨立解決實際問題的能力。模塊化的教學內容確保了課程的精煉與全面,為學生自主學習與應用提供了完善的學習路徑。
2.1.4"教學反饋
定期通過問卷或訪談獲取學生的學習反饋,持續(xù)優(yōu)化課程內容和教學策略。
通過這種以點帶面的教學內容組織方式,以算法作為課程核心,數(shù)學基礎和編程能力作為支撐面,使課程重點突出、內容精簡。由此,學生則可以具備充分的基礎知識支撐,確保能夠掌握核心知識內容并保持對機器學習的興趣。
2.2"以項目導向的教學模式實施
在確定教學內容之后,下一項關鍵任務是提升學生在“機器學習”算法中的學習效率。當前通常依賴經(jīng)典的公共數(shù)據(jù)集(如鳶尾花分類和波士頓房價預測)進行算法講解。然而,這些數(shù)據(jù)集年代久遠,難以滿足現(xiàn)代應用的需求。以鳶尾花數(shù)據(jù)集為例,該數(shù)據(jù)集僅包含 150 個樣本,每個樣本也僅包括 4 個特征(花萼和花瓣的長度與寬度)。雖然學生對花朵圖像很熟悉,但對花萼這一概念完全陌生,更不清楚如何測量其長度和寬度。這導致學生難以理解特征提取在機器學習過程中的作用,甚至產生輕視心理,忽視深入掌握算法優(yōu)化和數(shù)據(jù)工程的機會。另外,與當前動輒數(shù)以萬計的現(xiàn)代數(shù)據(jù)集相比,鳶尾花數(shù)據(jù)集無法充分展現(xiàn)現(xiàn)代機器學習數(shù)據(jù)的多樣性與復雜性,也不適合訓練更復雜的模型。
為此,課題組采用了項目驅動的教學理念,在該理念的指導下,學生通過構建月季花與薔薇花的二分類數(shù)據(jù)集,從數(shù)據(jù)采集、標注到模型訓練與評估的全過程參與其中,承擔數(shù)據(jù)采集者、標注者、數(shù)據(jù)分析師等角色,確保了項目的可操作性和數(shù)據(jù)的質量。在此過程中,學生學會了如何劃分訓練集與測試集、如何通過數(shù)據(jù)增強技術處理樣本分布不均衡等問題, 全面理解了精確率、召回率和 F1 分數(shù)等評價指標的應用,學會在任務中靈活選擇并優(yōu)化分類算法并使用交叉驗證和各種指標評估模型性能。通過項目的實施,學生掌握了從數(shù)據(jù)采集到模型開發(fā)與評估的實際技能,為將理論知識應用于實際項目奠定了堅實的基礎。
在回歸算法項目中,學生利用 Pandas 庫收集和預處理上證指數(shù)的歷史數(shù)據(jù),包括開盤價、收盤價、最高價、最低價和成交量等特征,使用前 5 個交易日的樣本預測當日開盤價。通過線性回歸、LASSO 和 LSTM 等模型進行預測,并借助正則化、交叉驗證、樹深度限制和早停策略來防止過擬合。通過隨機森林計算特征重要性、相關性分析和 PCA 等工具篩選重要特征,并使用均方誤差(MSE)和決定系數(shù)(R2)來評估模型的性能與有效性。通過這些工具和策略,學生深入理解了特征選擇、模型正則化和評估方法。通過這套工具和方法,學生深入掌握了正則化、特征選擇和模型評估的知識,能夠有效解決模型過擬合與特征優(yōu)化等問題,全面理解回歸算法的實用性與應用策略。
相比基于經(jīng)典數(shù)據(jù)集的傳統(tǒng)案例式教學,以項目為導向的教學模式充分考慮了知識的鮮活度、趣味性和實用性?;陧椖繉虻恼n堂教學,學生能夠掌握最新算法和模型的開發(fā)流程,體驗從數(shù)據(jù)采集、建模到模型評估的全過程,提高理論與實踐結合的能力,提升了教學質量。
2.3"多元化考核模式評價
考核方式是指引學生學習過程的方向標。合理的考核模式不僅可以提高學生的認知能力,還能提升總體學習成效與滿意度。閉卷考試的考核方式雖然在高等教育中仍占據(jù)主導地位,但其在評估“機器學習”效果方面存在明顯的局限性。這是因為,閉卷考試通常強調知識記憶和復現(xiàn),而機器學習需要學生理解并應用復雜概念來解決實際問題,這些能力在閉卷考試下難以得到有效評估[10-12]。如圖2所示,考慮到實際的項目導向在教學過程中的重要作用,在考核過程中,課題組依然貫徹了這一原則,采用了線上基礎考核、線下項目考核、課程實驗考核等綜合考核方式。
圖2"考核方式結構
線上考核旨在確保學生掌握課程所需的數(shù)學理論基礎、算法概念和Python編程技巧,重點評估他們對數(shù)學知識和理論框架的理解以及獨立完成編程任務的能力。線上考核的權重占總體成績的30%。
線下項目旨在培養(yǎng)學生的項目實踐能力,強化他們解決實際問題的技巧。學生可選擇獨立或團隊合作的形式參與項目,完成指定或自選的機器學習任務。項目從數(shù)據(jù)采集與清洗、模型設計與開發(fā)到結果分析與結課報告形成,涵蓋整個機器學習工作流程。結課報告要求詳細描述項目流程、數(shù)據(jù)處理、模型選擇、評估和結果分析,按完整性、創(chuàng)新性和格式規(guī)范性評分。通過答辯考核項目完成情況、團隊合作、創(chuàng)新與實踐能力以及對項目細節(jié)的掌握和展示。線下項目的權重占總體成績的60%。
課程實驗實驗旨在培養(yǎng)學生在實驗環(huán)境下應用所學知識解決具體問題的能力。實驗涉及傳統(tǒng)機器學習和深度學習的開發(fā)、訓練和評估,讓學生在真實的實驗場景中鍛煉技能。課程實驗的權重占總體成績的10%
通過明確的權重、目標和考核標準,綜合考核方式將確保學生全面掌握“機器學習”的理論知識、實際應用和實踐技巧。
3"結語
本文通過分析本科自動化專業(yè)“機器學習”課程的特點以及傳統(tǒng)教學過程中存在的問題,從課堂內容、授課模式以及考核方式等方面進行了改革探析。貫徹以項目為主導教學思想,在教學內容上加強產出導向的內容設計,在教學手段上注重其他混合式教學模式的引入,在考核方式上有針對性地設計線上線下相結合的多元化引導式評價機制,助力學生成長成才,確保學生愿意學,學得懂,學得會。
參考文獻
[1]MOUNIER-KUHN P E.The institute blaise-pascal (1946-1969) from couffignal’s "machine to artificial intelligence[J].Annals of the History of Computing,1989(4):257-261.
[2]MACLURE J.The new AI spring:a deflationary view[J].AI amp; society,2020(3):747-750.
[3]任社宣.人工智能工程技術人員就業(yè)景氣現(xiàn)狀分析報告[J].中國人力資源社會保障,2022(2):31-33.
[4]季波,李魏,呂薇,等.人工智能本科人才培養(yǎng)的美國經(jīng)驗與啟示:以卡內基梅隆大學為例[J].高等工程教育研究,2019(6):194200.
[5]萬琳,裴小兵,張倩,等.面向軟件工程專業(yè)的機器學習課程實踐教學探究[J].計算機教育,2021(4):155-158.
[6]韋南,殷麗華,寧洪,等.本科“機器學習”課程教學改革初探[J].網(wǎng)絡與信息安全學報,2022(4):182-189.
[7]馮曉英,陳青,曹鳳余.新技術在遠程教育中的應用:托尼·貝茨博士訪談錄[J].中國遠程教育,2007(7):21-25.
[8]孫海法,劉運國,方琳.案例研究的方法論[J].科研管理,2004(2):107-112.
[9]李潔,魏宇軒,武妍,等.機器學習課程中遞進式實驗案例設計[J].計算機教育,2022(1):134-138.
[10]李志義,王澤武.成果導向的課程教學設計[J].高教發(fā)展與評估,2021(3):91-98.
[11]張大良.優(yōu)化課程體系加強課程建設[J].中國大學教學,2018(12):10-12.
[12]徐曉辰,李廣宇,宋宇寧.“新工科”背景下結合OBE理念的教學設計與實踐[J].工業(yè)和信息化教育,2021(10):45-48.
(編輯"沈"強)
Project-driven teaching of “Machine Learning”: a new educational paradigm for automation specialties
LI "Bingfeng1, XU Qinghua2, WANG Keping1, QIAO Meiying1
(1.School of Electrical Engineering and Automation, Henan Polytechnic University, Jiaozuo 454000, China;
2.Library and Archives,Henan Polytechnic University, Jiaozuo 454003, China)
Abstract: "This paper explores the characteristics and issues of undergraduate “Machine Learning” courses in automation specialties, proposing a project-driven curriculum reform approach. The study delves into three main areas: curriculum content, teaching modes, and assessment systems. It elaborates on teaching methods that use specific topics to guide broader content organization, project-based teaching implementation strategies, and a results-oriented diverse assessment system for reform measures. These initiatives aim to optimize teaching effectiveness and enhance students’ theoretical knowledge and practical skills.
Key words: “Machine Learning”; educational reform; project-oriented; diverse assessment