陳本晶
關(guān)鍵詞:高職建模;人工智能;假設(shè)檢驗;描述性分析;機器學(xué)習(xí)
中圖法分類號:TP311 文獻標(biāo)識碼:A
1引言
高職院校的任務(wù)是培養(yǎng)適應(yīng)生產(chǎn)、建設(shè)一線的高素質(zhì)技能型應(yīng)用人才,教學(xué)體系是產(chǎn)學(xué)研一體化,教學(xué)以“必需”“夠用”為度?!案叩葦?shù)學(xué)”是高職理工科專業(yè)必修的公共基礎(chǔ)課程,由于學(xué)生數(shù)學(xué)基礎(chǔ)普遍比較薄弱,且“高等數(shù)學(xué)”課程具有抽象性的特點,對學(xué)生的邏輯思維、推理能力又有較高要求,學(xué)生對數(shù)學(xué)學(xué)習(xí)畏難情緒明顯。由于學(xué)習(xí)興趣偏低、學(xué)習(xí)信心不足等多方面因素,導(dǎo)致高職院?!案叩葦?shù)學(xué)”課程教學(xué)現(xiàn)狀及教學(xué)效果不理想。高職院校對數(shù)學(xué)建模的教育教學(xué)普遍較弱化,對數(shù)學(xué)建模競賽的重視程度普遍不夠。對于“數(shù)學(xué)建模”課程,大多數(shù)高職院校也是將其作為選修課,甚至不開設(shè),只是在建模競賽前集中培訓(xùn)一段時間。因此,數(shù)學(xué)建模競賽對高職學(xué)生來說是非常具有挑戰(zhàn)性的比賽,是學(xué)校里最優(yōu)秀最勇敢的學(xué)生才敢于參與的比賽。
2近30年中國數(shù)學(xué)建模競賽發(fā)展趨勢
數(shù)學(xué)建模是走在時代前沿、與時俱進的競賽,建模的考點都是結(jié)合社會時事和經(jīng)濟熱點的選題??v觀30年全國大學(xué)生數(shù)學(xué)建模競賽,從無到有,從小到大,辦成了世界上數(shù)學(xué)建模競賽方面規(guī)模最大的一個賽事,從1992年第一屆全國大學(xué)生數(shù)學(xué)建模競賽到1998年,只有A,B兩道題可選,從1999年開始,全國大學(xué)生數(shù)學(xué)建模競賽分為本科組和??平M進行,本科學(xué)生只能參加本科組競賽,不能參加??平M競賽。專科(高職高專)學(xué)生一般參加??平M競賽,也可參加本科組競賽。1999年到2018年,有A,B,C,D四道題可選,其中A,B題為本科組選題,C,D題為??平M選題。2019年到2022年,有A,B,C,D,E五道題可選,其中A,B,C題為本科組選題,D,E題為??平M選題。
從1992年第一次舉辦全國首屆競賽到2022年的30年來,優(yōu)化模型一直是建模的主角,每年至少都會有一道關(guān)于優(yōu)化的題目。近年來,建模的發(fā)展歷程從優(yōu)化模型、評價模型為主,到逐漸向統(tǒng)計模型大數(shù)據(jù)處理技術(shù)和人工智能方向轉(zhuǎn)變。例如,2012年,A題“葡萄酒的質(zhì)量分析與評價”,2013年,D題“城市公共自行車服務(wù)系統(tǒng)運行狀況和效率分析”,2014年,C題“關(guān)于生豬養(yǎng)殖場經(jīng)營管理的研究”,2015年,C題“眾籌筑屋規(guī)劃方案設(shè)計模型”,主要考察優(yōu)化、評價模型。2016年,D題“電池剩余放電時間預(yù)測”,2017年,C題“顏色與物質(zhì)濃度辨識”,主要考查統(tǒng)計預(yù)測、回歸模型。2018年,C題“大型百貨商場會員畫像描繪”,2019年,E題“薄利多銷分析”,2020年,E題“校園供水系統(tǒng)智能管理”,需要處理規(guī)模幾十萬條甚至上百萬條的海量數(shù)據(jù)以及具備數(shù)據(jù)挖掘能力。2021年,E題“中藥材的鑒別”,2022年,C題“古代玻璃制品的成分分析與鑒別”,偏向人工智能、機器學(xué)習(xí)。因此,高職數(shù)學(xué)建模競賽也需要逐步引入人工智能算法與技術(shù),人工智能在高職數(shù)學(xué)建模中的教育教學(xué)勢在必行。建模常用的軟件也從Lingo,Matlab,Excel,SPSS,到Python,其中Lingo,Matlab,Python要求學(xué)生具備編程能力,有較好的編程基礎(chǔ),Excel,SPSS操作簡單,但是也需要學(xué)生對統(tǒng)計思想有深刻理解才能恰當(dāng)應(yīng)用。對高職學(xué)生來說,他們系統(tǒng)訓(xùn)練的時間較少,建模思路、編程能力、論文寫作的每一關(guān)都不容易通過。但是,即使困難重重,依然有一屆又一屆不畏艱難的學(xué)子迎難而上,將建模競賽進行到底,能夠“賽出風(fēng)格、賽出水平”。
3近6年全國大學(xué)生數(shù)學(xué)建模競賽??平M競賽題目及主要考點
表1匯總了??平M近6年競賽題目及主要考點,從中可以看到,建模競賽隨時代熱點的改變而改變。
4推進人工智能教學(xué),重視實踐操作
目前,在“數(shù)學(xué)建?!闭n程中講授人工智能的相關(guān)教學(xué)內(nèi)容較少,建模教材以成熟的優(yōu)化、評價、統(tǒng)計模型為主,許多教師也是在邊學(xué)邊教,加之高職院校學(xué)生的數(shù)學(xué)底子薄,因此,在“數(shù)學(xué)建?!闭n程中引入人工智能相關(guān)內(nèi)容要根據(jù)學(xué)生的實際學(xué)習(xí)情況,以學(xué)生能夠接受的方式逐步推進。其中,既要注重人工智能理論的講解,更要注重人工智能算法及相關(guān)軟件的應(yīng)用,目的是讓學(xué)生能夠利用人工智能算法與理論去解決數(shù)學(xué)建模相關(guān)的問題。研究最近幾年的數(shù)學(xué)建模賽題發(fā)現(xiàn),應(yīng)用在數(shù)學(xué)建模競賽中最多的人工智能算法有購物籃推薦算法、神經(jīng)網(wǎng)絡(luò)算法、模擬退火算法、遺傳算法、機器學(xué)習(xí)等,而在使用人工智能相關(guān)軟件方面,用得最多的是Matlab,Python。高職“數(shù)學(xué)建?!闭n程中講授人工智能相關(guān)內(nèi)容時,應(yīng)從案例著手,讓學(xué)生實際動手編寫程序或者配置參數(shù)來解決數(shù)學(xué)建模問題。
5SPSSPRO為高職學(xué)生參加數(shù)學(xué)建模競賽解燃眉之急
雖然利用Matlab,Python可以靈活編寫程序,但是高職學(xué)生普遍沒有編程基礎(chǔ),
編寫出一段理想的代碼困難重重。而SPSSPRO是一款區(qū)別于SPSS,SAS傳統(tǒng)客戶端模式的全新在線數(shù)據(jù)分析平臺。建模中的十大經(jīng)典算法都可以用SPSSPRO來實現(xiàn)。在統(tǒng)計類問題的建模中,往往涉及大量的數(shù)據(jù)需要進行處理、分析,而SPSSPRO界面友好、功能強大,且對原始數(shù)據(jù)的格式兼容性較強。目前,SPSSPRO上線了200多種算法模型,包含統(tǒng)計建模、機器學(xué)習(xí)、規(guī)劃求解等模塊,常用的層次分析法、主成分分析、線性回歸、時間序列模型等模型求解都可以用SPSSPRO來解決,而且所有的算法模型都是免費使用。同時,這些分析方法的底層算法、分析結(jié)果和SPSS軟件是一致的。因此,對高職學(xué)生來說,用此平臺進行建模競賽是極其友好的,可以放心使用。我們只需要三步操作,即可完成一個復(fù)雜的模型計算。操作步驟:(1)打開SPSSPRO,上傳數(shù)據(jù);(2)拖拽變量,點擊開始分析;(3)系統(tǒng)自動分析出結(jié)果,含分析步驟、關(guān)鍵名詞解釋、圖表、圖表說明等結(jié)果,可免費復(fù)制、導(dǎo)出代碼,也可導(dǎo)出PDF,Word文檔,十分方便。
6 SPSSPRO的使用方法
下文以2022年數(shù)學(xué)建模國賽C題“古代玻璃制品的成分分析與鑒別”為例,可以全部使用SPSSPRO來做,其中機器學(xué)習(xí)分類功能是SPSS,Excel軟件無法代替的。模型建立與求解過程如下。
根據(jù)題目中四個問題,首先對數(shù)據(jù)進行初步整理:將表單1的4個定性數(shù)據(jù)賦值。異常值處理:將表單2中成分比例累加后介于85%~105%之間的數(shù)據(jù)視為有效數(shù)據(jù),將文物編號15和17的數(shù)據(jù)刪除。缺失值處理:表單2和表單3未檢測到成分的單元格填充值為0。
針對問題1:(1)使用SPSSPRO機器學(xué)習(xí)分類決策樹對相關(guān)玻璃文物的表面風(fēng)化與其玻璃類型、紋飾和顏色的關(guān)系進行分析,結(jié)果得到風(fēng)化與玻璃類型關(guān)系最大,紋飾其次,顏色最次;(2)根據(jù)對玻璃類型和有無風(fēng)化、化學(xué)成分含量平均值做二維列聯(lián)表,得到高鉀玻璃風(fēng)化后二氧化硅含量增多,氧化鉀、鈣、鋁、鐵等指標(biāo)含量迅速減少,鉛鋇玻璃風(fēng)化后二氧化硅含量減少,五氧化二磷、二氧化硫指標(biāo)含量增加,其他變化不大;(3)針對表面有無風(fēng)化,用SPSSPRO描述性統(tǒng)計得到風(fēng)化前后的玻璃化學(xué)成分平均值數(shù)據(jù),根據(jù)概率統(tǒng)計中的參數(shù)估計點和區(qū)間估計知識,可以估計風(fēng)化前的含量。
針對問題2:(1)針對表單1和表單2,用SPSSPRO描述性統(tǒng)計列聯(lián)分析得到高鉀玻璃氧化鉀含量多,鉛鋇玻璃氧化鉛、氧化鋇含量多,高鉀玻璃無風(fēng)化的數(shù)量多,鉛鋇玻璃風(fēng)化的數(shù)量多;(2)使用SPSSPRO機器學(xué)習(xí)分類、隨機森林模型進行分類,得到訓(xùn)練集,測試集準(zhǔn)確率都是100%,分類效果非常好。
針對問題3:(1)針對未知類別玻璃,鑒別其所屬類型,使用SPSSPRO機器學(xué)習(xí)分類、隨機森林模型進行預(yù)測,結(jié)果與權(quán)威機構(gòu)公布的參考結(jié)果一致;(2)根據(jù)判別分析其屬于哪一類玻璃概率大小與0.5進行比較,可以對其判別結(jié)果的敏感性進行分析,也可以使用SPSSPRO機器學(xué)習(xí)分類決策樹、神經(jīng)網(wǎng)絡(luò)分類進行判別,比較結(jié)果的相同程度和差異性大小。
針對問題4:(1)針對不同類別的玻璃文物樣品,使用相關(guān)性分析其化學(xué)成分之間的關(guān)聯(lián)關(guān)系,有些化學(xué)成分相關(guān)性很高;(2)用獨立樣本T檢驗比較不同類別樣品之間的化學(xué)成分差異性,其存在顯著差異。
7結(jié)束語
在人工智能時代,相關(guān)軟件功能被不斷開發(fā)及應(yīng)用,建模競賽指導(dǎo)教師要積極學(xué)習(xí)新技術(shù),有責(zé)任、有義務(wù)深入淺出指導(dǎo)建?;顒?,千方百計降低建模難度,引導(dǎo)更多的學(xué)生參與數(shù)學(xué)建模競賽。這可以讓“一次參賽,終身受益”的數(shù)學(xué)建模競賽指導(dǎo)方針落地,惠及更多的學(xué)生,以賽促學(xué)、以賽促教,引導(dǎo)更多的學(xué)生體驗建模的快樂。