羅佳佳
(南華大學(xué)附屬第二醫(yī)院,湖南衡陽421001)
預(yù)測分析是數(shù)據(jù)挖掘的一個(gè)重要任務(wù).預(yù)測的目的是從歷史數(shù)據(jù)中自動推導(dǎo)出對給定數(shù)據(jù)的推廣描述,從而能對未來數(shù)據(jù)進(jìn)行預(yù)測[1].Matlab是一個(gè)高級的數(shù)值分析、處理與計(jì)算軟件,廣泛應(yīng)用于工程計(jì)算、控制設(shè)計(jì)、信號處理與通訊、圖像處理、信號檢測、金融建模設(shè)計(jì)與分析等領(lǐng)域.
本文收集達(dá)能餅干的銷售數(shù)據(jù),使用MATLAB對收集的數(shù)據(jù)進(jìn)行數(shù)據(jù)擬合,建立回歸預(yù)測模型,對未來銷量做出預(yù)測,以便挖掘出有價(jià)值信息反饋給管理者和決策者.
研究在學(xué)生中銷量很大的餅干.選取“達(dá)能”作為此次研究的主體對象,選取“奧利奧”作為同類商品.并假設(shè)“達(dá)能”餅干的銷量主要與同類產(chǎn)品的價(jià)格以及廣告投入有關(guān).
根據(jù)代理商提供的原始數(shù)據(jù),標(biāo)準(zhǔn)化奧利奧的價(jià)格,得到整理后數(shù)據(jù).表1中“125G奧利奧餅干單價(jià)”是由“150G奧利奧餅干單價(jià)”換算過來的,比較“125G奧利奧餅干單價(jià)”與“125G達(dá)能餅干單價(jià)”,“奧利奧”的平均價(jià)格高出約0.2元,表1中的“125G奧利奧餅干標(biāo)準(zhǔn)單價(jià)”就是由“125G奧利奧餅干單價(jià)”減去0.2得來的.經(jīng)此處理,達(dá)能和奧利奧就存在競爭關(guān)系了.
表1 2009-2010年達(dá)能餅干與同類產(chǎn)品單價(jià)的原始數(shù)據(jù)
通過之前的分析,假設(shè)影響“達(dá)能”餅干銷量的主要因素是與同類產(chǎn)品的差價(jià)以及廣告投入,于是得下表2.
表2 2009-2010年達(dá)能餅干與同類產(chǎn)品差價(jià)、廣告投入及銷量
令,y-達(dá)能餅干的銷量;x1-達(dá)能與奧利奧餅干的差價(jià);x2-達(dá)能餅干的廣告投入;分別將x1和x2與y在MATLAB進(jìn)行數(shù)據(jù)擬合,從圖1、圖2可以發(fā)現(xiàn)x1與y近似線性相關(guān),x2與y近似二次相關(guān).
圖1 達(dá)能餅干銷量與同類餅干差價(jià)比較
使用多元線性回歸模型y=β0+β1x1+ε來擬合餅干銷售量隨餅干與同類餅干差價(jià)的變化.
使用多元線性回歸模型y=β0+β1x2+β2x+ε來擬合餅干銷售量隨餅干廣告投入的變化.
圖2 達(dá)能餅干銷量受廣告投入影響
假設(shè)x1和x2與y之間有多項(xiàng)式回歸關(guān)系,建立模型:y= β0+β1x1+β2x2+β3x+ε,其中,y為被解釋變量(因變量);x1,x2為解釋變量(回歸變量,自變量);β0,β1,β2,β3為回歸系數(shù);ε為隨機(jī)誤差(均值為0的正態(tài)分布隨機(jī)變量).
使用MATLAB統(tǒng)計(jì)工具箱,輸入命令:
(其中alpha為顯著性水平,缺省時(shí)為0.05)
輸出的結(jié)果為:
參數(shù) 參數(shù)估計(jì)值 置信區(qū)間β0 5.2719 [0.9260 9.6179]β1 0.2029 [0.0580 0.3477]β2 -1.3147 [-2.4475 -0.1819]β3 0.0997 [0.0264 0.1731]R2=0.9389 F=102.4673 p =0.0000
R2=0.9389說明y的93.89%可由模型確定;而F遠(yuǎn)超F(xiàn)檢驗(yàn)的臨界值,故也認(rèn)為模型擬合度優(yōu)秀,事實(shí)上,F(xiàn)=,說明F與R2檢驗(yàn)等效;p值是與F對應(yīng)的概率,由于p遠(yuǎn)小于α(α =0.05),故回歸模型成立.再觀察參數(shù)的置信區(qū)間,均不包含0點(diǎn),說明模型很好地符合了實(shí)際情況.
從函數(shù)關(guān)系可以看出,價(jià)格優(yōu)勢可以增加銷量,增加廣告投入亦可以增加銷量.
差價(jià)x1=奧利奧餅干價(jià)格x3-達(dá)能餅干價(jià)格x4
我們欲控制x1的值來達(dá)到較為理想的銷量.在實(shí)際操作中,可以根據(jù)估計(jì)x3的值來確定x4的值.現(xiàn)在我們控制差價(jià)x1=0.2 元,廣告投入 x2=8.1 萬元.
在MATLAB中輸入命令:
得到在此條件下y的銷量:
銷售量的預(yù)測區(qū)間為[1.2071 -0.0900,1.2071+0.0900](置信度 95%),即預(yù)測銷量的范圍在[1.1171,1.2971]之間(置信度95%).
實(shí)際應(yīng)用中,我們可以把上限12.971萬筒作為庫存管理的目標(biāo)值,而把下限11.171萬筒用來把握公司的現(xiàn)金流.若估計(jì)x3=3.5,設(shè)定x4=3.3,則有95%的把握知道銷售額在3.3 × 11.171=36.8(萬元)以上.
根據(jù)模型的預(yù)測,可以看出:達(dá)能餅干的銷量與同類產(chǎn)品的價(jià)格優(yōu)勢關(guān)系密切,且價(jià)格與銷售量的大小呈現(xiàn)負(fù)相關(guān),說明適當(dāng)?shù)膬r(jià)格優(yōu)勢可以增加餅干的銷量;而餅干銷售量和廣告費(fèi)用的投入呈現(xiàn)正相關(guān),說明適當(dāng)?shù)脑黾语灨傻膹V告投入可以增加商品的銷售.適當(dāng)保持價(jià)格優(yōu)勢和提高廣告投入,達(dá)能餅干的銷售量將得到保證.
統(tǒng)計(jì)中的回歸分析最主要的應(yīng)用是用來預(yù)測,考慮餅干的價(jià)格變化不是很大,本文采用的預(yù)測數(shù)據(jù)是近兩年代理商提供的直接數(shù)據(jù),借助Matlab強(qiáng)大的矩陣處理能力,實(shí)現(xiàn)了達(dá)能餅干銷量的有效預(yù)測分析.
[1]孫雷.回歸技術(shù)在超市商品銷售趨勢預(yù)測模型中的應(yīng)用[J].江蘇廣播電視大學(xué)學(xué)報(bào),2008,(5):51-53.
[2]劉鋒.數(shù)學(xué)建模[M].南京:南京大學(xué)出版社,2005.
[3]張宜華.精通 MATLAB5[M].北京:清華大學(xué)出版社,1999.