余建熙河南經貿職業(yè)學院
數據處理方法在數學建模競賽中的應用
余建熙
河南經貿職業(yè)學院
在總結數學建模競賽歷屆考題解題模式的前提下,從數據解析、插值與擬合、數據仿真、回歸解析等四個層面歸納了數據處理方法與數學軟件在數據建模比賽中的運用,能夠在數學建模中,為如何選擇數據處理模式帶來啟發(fā)。
數據處理;數學建模;比賽;運用;探討
數學建模是使用數學語言對實際疑問進行精簡、抽象與描繪,構建解答問題的數學模型,同時使用電腦技術予以輔助,對解答的成果進行解析與檢測,最終獲得化解具體疑問的預案。在數學建模階段,大量的實驗參數要予以解析,必須使用電腦軟件來協助進行整合,這個流程就是數據建模中的數據處置。利用特定的處置手段從實驗參數中摸索出其規(guī)律,進而將看似無關的參數結合起來分析。在模型建設的初期,使用既定的數據處理模式能夠有效解讀問題所闡述的模型變量間的聯系,進行初始規(guī)劃。一部分模型可以使用統計解析的方法予以建立,例如回歸分析法與時序分析法等。
通常,數據建模搜集與提供的原始數據絕大多數都以電子表格的形式存在,電子表格軟件具備參數排列、選擇、實效性、分類總結、內部函數換算等多重能力,用來對參數實施初級整合,比如使用關鍵詞排列、根據數據或范圍進行選擇,分類總結,換算最大值與最小值、頻數、方差等,同時電子表格還具備繪圖能力,比如描繪散點圖、曲線圖、直方圖等,對參數的發(fā)展趨勢進行預估與解析等。
在建模比賽中,應對參數實施處置,最常見的方法是參數插值與參數擬合的方法。比如1998年美國賽A題中的生物組織切片版塊就運用了三維插值方法;1994年國賽A題在演算山體海拔的時候,參數插值方法就被合理運用;2001年國賽中血管三維重建問題也運用了相同的方法;2003年國賽“非典”版塊就使用數據擬合的模式觀測數據走勢并完成處置;2004年國賽醉酒行駛問題本質上也利用了擬合的方法;2005年國賽降水量報告的考評也利用了插值的方法;2006年國賽B題艾滋病診斷評價與治療功效的預估也使用了參數擬合的方法;2011年國賽中城鎮(zhèn)表面土層重金屬污染問題也動用了插值與擬合方法。
擬合方法可以從實驗參數的解讀中,給定某既有函數的參數或解出某類近似函數,讓所獲得的近似函數與已有參數形成較好的擬合度。而在數據有偏差的情況下,不需要解出近似函數要經過的所有數據點,只需要解答在既定態(tài)勢下映射參數改變情況的近似函數的模式被稱為數據擬合。而參數插值是根據既有數據點的實驗情況,根據某種插值方法來得出未知數據點的參數。
(一)數據插值
因為實驗環(huán)境的不同,加上實驗參數量小的原因,在既有參數可靠的基礎上,利用函數插值方法可以插值出兩類數據點間的一些數據點,所繪出的數據曲線會通過全部實驗數據點。所挑選的插值函數的類別不一,逼近的功效與光滑度也是不一樣的。常用的插值方法為:lagrange插值、分段線性插值、Hermite插值、三次樣插值,上述模式都是分段插值模式。Matlab內形成的功能函數具備分段插值的能力而無需編寫函數流程,比如interpl(一維插值)、interp2、interp3、intern,當中一維與二維插值使用頻率較高。一維插值函數的表達式是:yi=interpl(x,y,xi,method),當中(x,y)是插值節(jié)點,xi是被插值點,yi是xi位置的插值數據,默認態(tài)勢下插值方法為分段線性插值,nearest為相近位置的插值,linear是線性插值,spline為三次樣條插值,cubic是立方插值。需要注意的是,所有插值模式中x必然是單調的,而且xi要在x的數值選取范疇中。二維插值的函數能夠寫成:z=interp2(x,y,z,x,y,method)。
(二)參數擬合
在變化多端的環(huán)境中,可以直接運用實驗參數建立模型,找到因果變量間的聯系,進而預判未來的情景,如此構建的模型被稱為擬合模型。使用擬合模型將實驗室參數約束在一定范圍內,利用數學表達式從數目層面近似表述因果變量間的聯系。擬合模型的建立能夠對不同變量的實驗參數實施觀察、總結,最后明確要使用的參數。
擬合模型基本上可以劃分為線性擬合、多項式擬合與曲線擬合。在Matlab內可以憑借函數polyval()與Isqcurvefit()達成擬合,在spss內憑借MENU與對話框測評,要同時挑選多種方法對擬合程度進行比對。為了最后選擇出較佳的方法,應先描繪出散點圖并參考參數的分布趨勢,最終敲定使用何種辦法。
數學建模中無法脫離電腦仿真技術,當中隨機性模擬為常規(guī)算法。數學建模中的數據仿真通常包含數學仿真以及電腦仿真兩種。數學仿真要用到數學方程式,在既定的建立條件下要通過數學表達式進行模擬仿真。使用電腦對體系的數學模式進行實驗,叫做電腦仿真。通過電腦仿真模式能夠變更仿真系統的結構與數據,便于對模型的解析。電腦仿真模式中蒙特卡洛算法使用頻率較高,這種算法還有另外一個名稱,那就是隨機性模擬方法。
此外,使用隨機函數對要求解的疑問實施隨機樣本的抽取,取得樣本,觀察樣本值,統籌解析,最后獲得所要解答問題的參數。例如全國大學生數學建模競賽1997年A題“零件參數預設”版塊,算題中所有元件均顯示出不同的標定值與容差等級,要求解出元件的最優(yōu)結合模式。又比如利用計算流程較為繁瑣的數學表達式,從108類容差中選擇合適的預案,求解過程極為繁雜而且難度較大。只能通過電腦仿真模式來求出問題的答案。當中的一種求解方法就是使用蒙特卡洛算法予以解答,尋找到優(yōu)化后的預案,在每一元件的可行區(qū)間根據正態(tài)分布隨機挑選一個標定數據與一個容差數據,使用蒙特卡洛算法仿真出大批的預案,并挑選最佳預案。
②徐小軍,王曉偉.淺析新時期高校思想政治教育科學定位的現實依據[J].沙洋師范高等??茖W校學報.2010(1):28-30
③孟磊,杜鵬.高校輔導員隊伍建設淺析[J].科學時代(上半月).2010(09):121-123
④丁旭峰,新形勢下高職院校輔導員素質與能力建設初探[J].職業(yè)時空.2007(09):75-76
⑤夏孟軍.新時期高校輔導員素養(yǎng)的應然與實然分析[J].大學教育科學,2008,4:73-76
⑥張劍峰,曹茂昌.論高校輔導員素質與能力要求[J].黑龍江省政法管理干部學院學報,2009,3:158-160
⑦吳井水.論新形勢下高校輔導員的工作能力要素[J].赤峰學院學報(自然科學版),201026(4):173-174
⑧丁旭峰.新形勢下高職院校輔導員素質與能力建設初探[J].職業(yè)時空.2007(09):75-76
⑨吳井水.論新形勢下高校輔導員的工作能力要素[J].赤峰學院學報(自然科學版),201026(4):173-174
⑩張劍峰,曹茂昌.論高校輔導員素質與能力要求[J].黑龍江省政法管理干部學院學報,2009,3:158-160
?王權海.研究型輔導員的內涵及特征[J].吉林廣播電視大學學報,2010,3:29-30
?余南飛.新時期高校輔導員素質建設研究[D].復旦大學,2011
?蔡國慶.毛澤東的青年社會學思想及現代啟示[J].山西青年管理干部學院學報,2007,20(4):1-3
?謝維和.“青年社會”的命題—關于青年社會學的一種結構性探新[J].中國青年研究,1992,4:14-17
?劉芳,王興波.高校輔導員的綜合素質和實踐能力研究[J].教育與職業(yè),2010,24:38-39
?劉素霞.做新時代的高校輔導員——80后輔導員VS 90后大學生.才智,2012年19期
?葛振.關于高校學習型輔導員隊伍建設的思考[D].天津大學,2011.
?韓雪,吳翔.論新時期高校輔導員素質能力的培養(yǎng).現代商貿工業(yè).2010年第11期:269-270
[1]胡錦濤在全國加強和改進大學生思想政治教育工作會議上發(fā)表重要講話,人民日報,2005-01-19(1)
[2]徐小軍,王曉偉.淺析新時期高校思想政治教育科學定位的現實依據[J].沙洋師范高等??茖W校學報.2010(1):28-30
[3]孟磊,杜鵬.高校輔導員隊伍建設淺析[J].科學時代(上半月).2010(09):121-123
[4]丁旭峰,新形勢下高職院校輔導員素質與能力建設初探[J].職業(yè)時空.2007(09):75-76
[5]夏孟軍.新時期高校輔導員素養(yǎng)的應然與實然分析[J].大學教育科學,2008,4:73-76
[6]張劍峰,曹茂昌.論高校輔導員素質與能力要求[J].黑龍江省政法管理干部學院學報,2009,3:158-160
[7]吳井水.論新形勢下高校輔導員的工作能力要素[J].赤峰學院學報(自然科學版),201026(4):173-174
[8]王權海.研究型輔導員的內涵及特征[J].吉林廣播電視大學學報,2010,3:29-30
[9]余南飛.新時期高校輔導員素質建設研究[D].復旦大學,2011
[10]蔡國慶.毛澤東的青年社會學思想及現代啟示[J].山西青年管理干部學院學報,2007,20(4):1-3
[11]謝維和.“青年社會”的命題—關于青年社會學的一種結構性探新[J].中國青年研究,1992,4:14-17
[12]劉芳,王興波.高校輔導員的綜合素質和實踐能力研究[J].教育與職業(yè),2010,24:38-39
[13]劉素霞.做新時代的高校輔導員——80后輔導員VS 90后大學生.才智,2012年19期
[14]葛振.關于高校學習型輔導員隊伍建設的思考[D].天津大學,2011.
[15]韓雪,吳翔.論新時期高校輔導員素質能力的培養(yǎng).現代商貿工業(yè).2010年第11期:269-27