【摘要】本文說明了MATLAB在數(shù)學(xué)建模中數(shù)據(jù)處理時(shí)的應(yīng)用,其中包括通過數(shù)據(jù)的平滑化處理、數(shù)據(jù)的標(biāo)準(zhǔn)化處理,數(shù)據(jù)的歸一化處理對數(shù)據(jù)進(jìn)行預(yù)處理,并闡述了這些數(shù)據(jù)預(yù)處理方法的原理以及方法,給出了相應(yīng)的MATLAB程序,對于MATLAB在數(shù)學(xué)建模中應(yīng)用提出相關(guān)思考。
【關(guān)鍵詞】MATLAB ; 數(shù)學(xué)建模 ; 數(shù)據(jù)處理
【中圖分類號】G64 【文獻(xiàn)標(biāo)識碼】B 【文章編號】2095-3089(2017)04-0219-01
一、Matlab在數(shù)學(xué)建模中數(shù)據(jù)處理時(shí)的應(yīng)用
在數(shù)學(xué)建模過程中往往需要對問題中給出的大量數(shù)據(jù)或圖表等進(jìn)行分析,此時(shí)MATLAB的數(shù)據(jù)處理功能以及繪圖功能都能得到很好的應(yīng)用。對于多元數(shù)據(jù),當(dāng)各變量的量綱和數(shù)量級不一致時(shí),往往需要對數(shù)據(jù)進(jìn)行預(yù)處理,以消除量綱和數(shù)量級的限制,便于分析。無論是人工觀測的數(shù)據(jù)還是由數(shù)據(jù)采集系統(tǒng)獲取的數(shù)據(jù),都會不可避免地疊加上“噪聲”干擾(反映在曲線圖形上就是一些“毛刺和尖峰”)。為了提高數(shù)據(jù)的質(zhì)量,必須對數(shù)據(jù)進(jìn)行平滑處理(去噪聲干擾)。由于得到的變量數(shù)據(jù)往往會由于量綱不同,而導(dǎo)致數(shù)據(jù)之間無法進(jìn)行比較,在這種情況下,就需要進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)處理以消除變量間的量綱關(guān)系,從而使數(shù)據(jù)具有可比性。
二、Matlab在數(shù)學(xué)建模模型建立和求解中的應(yīng)用
在模型建立過程中,往往需要對之前處理完的數(shù)據(jù)進(jìn)行大量的分析,以尋找他們之間線性或者非線性以及一些特定的關(guān)系,這些分析有自然會設(shè)計(jì)的大量的運(yùn)算,而這些運(yùn)算靠人工在短時(shí)間內(nèi)是無法完成的。具有強(qiáng)大的計(jì)算功能的MATLAB可以在短時(shí)間內(nèi)幫助我們完成計(jì)算。下面舉幾個(gè)例子說明MATLAB在模型建立過程中的應(yīng)用。
(一)通過因子分析建立回歸方程建立預(yù)測模型
因子分析的就是用少數(shù)幾個(gè)因子去描述許多指標(biāo)或因素之間的聯(lián)系,即將相關(guān)比較密切的幾個(gè)變量歸在同一類中,每一類變量就成為一個(gè)因子,以較少的幾個(gè)因子反映原資料的大部分信息。運(yùn)用這種研究技術(shù),我們可以方便地找出影響消費(fèi)者購買、消費(fèi)以及滿意度的主要因素是哪些,以及它們的影響力運(yùn)用這種研究技術(shù),我們還可以為市場細(xì)分做前期分析。
例.(2015年同夢杯校賽)根據(jù)70、80、90年代暢銷與不暢銷的歌曲音樂特性建立數(shù)學(xué)模型來預(yù)測歌曲的暢銷程度。部分?jǐn)?shù)據(jù)如下:
借助MATLAB軟件分以下步驟進(jìn)行因子分析:
對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理;計(jì)算相關(guān)系數(shù)矩陣R;計(jì)算初等載荷矩陣;選擇m(m<=4)個(gè)主因子;計(jì)算因子得分,并進(jìn)行綜合評價(jià)。
通過相關(guān)分析,得出音樂性指標(biāo)F與銷售量y之間的相關(guān)系數(shù)為0.7938,表明兩者之間存在較強(qiáng)相關(guān)關(guān)系(x1,x2,x3,x4分別代表之前選出的特征變量)。
(二)采用支持向量分類機(jī)法建立預(yù)測模型
支持向量機(jī)是數(shù)據(jù)挖掘中的一項(xiàng)新技術(shù),是借助于最優(yōu)化方法來解決機(jī)器學(xué)習(xí)問題的新工具,最初由V.Vapnik 等人提出,近幾年來在其理論研究和算法實(shí)現(xiàn)等方面都取得了很大的進(jìn)展,開始成為克服“維數(shù)災(zāi)難”和過學(xué)習(xí)等困難的強(qiáng)有力的手段,它的理論基礎(chǔ)和實(shí)現(xiàn)途徑的基本框架都已形成。支持向量機(jī)方法是建立在統(tǒng)計(jì)學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理基礎(chǔ)上的,根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折衷,以求獲得最好的推廣能力。
例:(暑期數(shù)模集訓(xùn)第一題)根據(jù)所給的已知流行程度的文章的文本特征建立數(shù)學(xué)模型對文章的流行程度進(jìn)行預(yù)測。處理后的部分?jǐn)?shù)據(jù)如下:
根據(jù)前期的數(shù)據(jù)處理與相關(guān)分析,決定采取支持向量分類機(jī)法建立預(yù)測模型,采用支持向量分類機(jī)法建立預(yù)測模型的MATLAB部分程序,程序運(yùn)行后得出的部分預(yù)測結(jié)果如下:
部分預(yù)測結(jié)果:(0代表文章流行,1代表文章不流行)
三、個(gè)人對MATLAB在數(shù)學(xué)建模中應(yīng)用的一些看法
數(shù)學(xué)建模是通過對實(shí)際問題的抽象和簡化,引入一些數(shù)學(xué)符號、變量和參數(shù),用數(shù)學(xué)語言和方法建立變量參數(shù)間的內(nèi)在關(guān)系,得出一個(gè)可以近似刻畫實(shí)際問題的數(shù)學(xué)模型,進(jìn)而對其進(jìn)行求解、模擬、分析檢驗(yàn)的過程。它大致分為模型準(zhǔn)備、模型假設(shè)、模型構(gòu)成、模型求解、模型分析、模型檢驗(yàn)及應(yīng)用等步驟。這一過程往往需要對大量的數(shù)據(jù)進(jìn)行分析、處理、加工,建立和求解復(fù)雜的數(shù)學(xué)模型,這些都是手工計(jì)算難以完成的,往往在計(jì)算機(jī)上進(jìn)行實(shí)現(xiàn)。在目前用于數(shù)學(xué)建模的軟件中,MATLAB強(qiáng)大的數(shù)值計(jì)算、繪圖以及多樣化的工具箱功能,能夠快捷、高效地解決數(shù)學(xué)建模所涉及的眾多領(lǐng)域的問題。MATLAB 以其卓越的功能和簡單精練的編程語言,將我們從繁重的手工計(jì)算和高級語言程序調(diào)試中徹底解脫出來,可以在最短的時(shí)間內(nèi)實(shí)現(xiàn)和檢驗(yàn)我們的計(jì)算方法。在數(shù)學(xué)建模過程中,要較熟的使用MATLAB,需要的一定的學(xué)習(xí)和編寫程序的能力,而這些能力需要平時(shí)的訓(xùn)練以及應(yīng)用,所以要想快捷地進(jìn)行數(shù)模建模中相關(guān)問題的計(jì)算,還需要我們平時(shí)多學(xué)習(xí),多應(yīng)用MATLAB。
參考文獻(xiàn)
[1]卓金武.MATLAB在數(shù)學(xué)建模中的應(yīng)用[M].北京市:北京航空航天大學(xué)出版社,2011.
[2]宋知用.MATLAB在語音信號分析與合成中的應(yīng)用[M].北京市:北京航空航天大學(xué)出版社,2013.
作者簡介:張嘉煒(1996.01-),男,浙江慈溪人,研究方向?yàn)閿?shù)學(xué)與應(yīng)用數(shù)學(xué)。