任文武 靳洪震
摘 要:本文針對"拍照賺錢"的任務定價問題,采用逐步回歸的方法從4個影響指標中挑選出影響顯著的指標來建立回歸模型。分析出任務與會員之間的距離以及會員的位置對任務定價的回歸模型影響顯著,發(fā)現(xiàn)任務位置越偏僻、會員與任務之間的距離越大從而導致任務定價越高。因此在對任務定價時,首先要考慮任務的位置,任務位置越偏,則任務定價越高;其次考慮會員與任務的距離,任務與會員距離越大,任務定價也會相應提高。
關鍵詞:逐步回歸分析 最小二乘法
0 引言
“拍照賺錢”是眾包形式下移動互聯(lián)網(wǎng)的一種自助式服務模式。這種基于移動互聯(lián)網(wǎng)的自助式勞務眾包平臺,為企業(yè)提供各種商業(yè)檢查和信息搜集,相比傳統(tǒng)的市場調(diào)查方式可以大大節(jié)省調(diào)查成本,而且有效地保證了調(diào)查數(shù)據(jù)真實性,縮短了調(diào)查的周期。因此APP成為該平臺運行的核心,而APP中的任務定價又是其核心要素。如果定價不合理,有的任務就會無人問津,而導致商品檢查的失敗。因此制定合理的定價方案具有重要意義。
1 模型的建立與求解
本文設計新的任務定價方案,并和原方案進行比較。即需要對原方案進行優(yōu)化,我們分為以下幾個步驟進行求解。
由于影響因變量的因素可能很多,且個別因素對因變量的影響很小,那么誤差平方和不會由于包含這些因素而減少,相反會因為因素的增加可能使誤差變得更大,影響了整體的穩(wěn)定性。故針對此問題本文采用逐步回歸的方法從諸多影響因素中挑選出影響顯著的因素來建立回歸模型[1]。
1.1模型的建立
對于多元線性回歸模型 y=av+b ,在滿足模型經(jīng)典假設下可利用最小二乘估計法估計參數(shù), 參數(shù)估計量為 ,經(jīng)典假設是“沒有完全的多重共線性”, 但在現(xiàn)實經(jīng)濟問題分析中, 解釋變量間不可能完全線性無關。如果解釋變量v1,v2,v3…vi 之間存在線性相關關系, 則必有 ,從而 不存在,參數(shù)的最小二乘估計量不唯一,即最小二乘估計法失效, 此時模型存在多重共線性[2]。
逐步回歸分析法不僅可以對多重共線性進行檢驗, 同時也是處理多重共線性問題的一種有效方法。采用逐步加入法來做分析。
STEP1:根據(jù)經(jīng)濟學規(guī)律或者相關主觀經(jīng)驗分析,選出可能相關的自變量,設為v1,v2,v3…vi
STEP2:用每一個自變量分別對被解釋變量y建立回歸模型, 得到i個回歸模型
STEP3: STEP1進行參數(shù)估計, 并進行檢驗, 選擇通過檢驗的模型中殘差平方和最小的模型作為首選模型; 或選取擬和優(yōu)度最大的回歸方程作為首選模型。
STEP4:在首選模型中逐個增加其他解釋變量, 重新進行線性回歸。若新增加的解釋提高了回歸方程的擬和優(yōu)度,且回歸方程中其他參數(shù)統(tǒng)計值仍然顯著, 就在模型中保留該解釋變量;若新增加的解釋變量沒有提高回歸方程的擬和優(yōu)度, 就不在模型中保留該解釋變量; 若新增加的解釋變量提高了回歸方程的擬和優(yōu)度, 但回歸方程中某些參數(shù)的數(shù)值或高了回歸方程的擬和優(yōu)度, 但回歸方程中某些參數(shù)的數(shù)值或符號等受到顯著影響, 說明模型中存在多重共線性。步驟為:
①對上述i- 1個模型分別進行最小二乘估計, 得到每個模型的擬和優(yōu)度和參數(shù)的 t 檢驗統(tǒng)計量;
②將v1,v2,v3…vi分別帶入STEP2, 建立模型, 得到:
③進行多重共線性分析, 如果加入新變量的模型中的系數(shù)數(shù)值甚至符號發(fā)生了重大變化, 以至結果無法接受, 則極可能存在多重共線性, 新變量不能引入模型;
④在多重共線性的模型或多重共線性不顯著的模型中,選擇對R2 進行提高最顯著的那個模型, 進行下一步驟;
⑤建立F 統(tǒng)計量:
,其中 n為樣本數(shù),Q(j) 表示模型包括j 個變量時的殘差平方和,給定顯著水平,查表得到Fa ;
⑥如果Fj>Fa ,則加入新變量,否則新變量不能加入;
⑦重復步驟①到⑥, 直到建立滿意的模型為止;
1.2模型的求解:
假設任務定價關于4個指標之間的函數(shù)關系為:y=a1v1+a2v2+a3v3+a4v4+b
其中ai 為待估參數(shù),b為常量。用最小二乘法進行估計得:
,參數(shù)v1、v2、v3、v4 對應的p 值為0.46、0.47、0.008、0.097。對模型進行white 異方差檢驗得p=0.891 ,原假設H0 模型是同方差,接受原條件,即不存在異方差。序列相關性檢驗,DW=d=1.85 ,du=1.83 ,滿足du 雖然F0.05(,)= 運用最小二乘法逐一求對各解釋變量的回歸估計方程[3],結果如表1所示 顯著水平取0.05時,查得F(1,29) =4.18。 由于自變量v4 的 ,且參數(shù)估計的P 值偏大,說明v4對y 的回歸模型不顯著,表明會員信譽值與任務定價并無很大的聯(lián)系。 關于自變量v2 的回歸顯著性并不高,但對于變量v1 可以繼續(xù)進入下一步回歸,選取各方面檢驗結果達到較佳的v1為第一入選變量,去掉v4 對y的影響,做第二次回歸。 顯著水平取0.05時,查表F0.05(2,28)=3.34,F(xiàn)0.05(1,28)=4.20 ,從表9中可以看出,隨著變量的逐個加入,變量y 方程的改進基本不變。由于F1=42.1、F2=51.2 ,且都大于F0.05(1,18)=4.41 ,說明模型整體上是顯著的,對模型進行white 異方檢驗得p=0.87,認為模型不存在方差;對模型進行序列相關性檢驗,由于,DW=d=2.02,du=1.67 ,滿足du 參考文獻: [1] 司守奎,《數(shù)學建模算法與應用》[M],北京:國防工業(yè)出版社,2011.8. [2]賀江舟,龔明福,范君華,孫紅專,張利莉. 逐步回歸及通徑分析在主成分分析中的應用[J]. 新疆農(nóng)業(yè)科學,2010,47(03):431-437. [3] 李松臣,張世英. 基于逐步回歸法的人口出生率影響因素分析[J]. 統(tǒng)計與決策,2008,(04):7-9. [2017-09-17]. DOI:10.13546/j.cnki.tjyjc.2008.04.010