劉忠青,昝道廣
(山東科技大學(xué)電氣信息系,濟(jì)南 250031)
“拍照賺錢”是基于移動互聯(lián)網(wǎng)下的一種自助服務(wù)模式,用戶通過下載并且注冊App成為會員后,可以在App上領(lǐng)取拍照任務(wù)來賺取App對任務(wù)所標(biāo)定的酬金。相比傳統(tǒng)的市場調(diào)查方式,通過這種基于移動互聯(lián)網(wǎng)的自助式勞務(wù)眾包平臺來為企業(yè)提供各種商業(yè)檢查和信息搜集,能夠更加節(jié)省調(diào)查成本,并且能夠有效保證調(diào)查數(shù)據(jù)的真實(shí)性,且縮短了調(diào)查周期。因此APP成為該平臺運(yùn)行的核心,而APP中的任務(wù)定價又是其核心要素。如果定價不合理,有的任務(wù)就會無人問津,而導(dǎo)致商品檢查的失敗。
根據(jù)附件中所給出的數(shù)據(jù),由此考慮以下三個問題:
(1)通過研究附件一中項(xiàng)目的任務(wù)定價規(guī)律,分析任務(wù)未完成的原因。
(2)給出對附件一中的項(xiàng)目設(shè)計新的任務(wù)定價方案,并與原方案進(jìn)行比較。
(3)在實(shí)際生活中,多個任務(wù)可能分布位置十分相近,導(dǎo)致用戶會爭相選擇,可以將多個任務(wù)組合在一起打包發(fā)布。請思考在該種情況下如何修改前面的定價模型,會對任務(wù)的完成情況帶來怎樣的改變。
(4)請?jiān)O(shè)計出針對于附件三中的新項(xiàng)目的任務(wù)定價方案,同時評價定價方案的實(shí)施情況。
(1)假設(shè)任務(wù)定價不考慮所在位置經(jīng)濟(jì)水平與交通因素。
(2)假設(shè)每個會員的位置信息、信譽(yù)度以及預(yù)定限額在完成問題四的新項(xiàng)目時不發(fā)生變化。
(3)假設(shè)問題三、四中同一類任務(wù)的定價相同。
首先進(jìn)行數(shù)據(jù)清洗,剔除數(shù)據(jù)異常項(xiàng),對附件一、二中的經(jīng)緯度歸一化處理。利用GPSspg軟件將附件一中所有經(jīng)緯度信息導(dǎo)入,查詢出已結(jié)束任務(wù)位置所對應(yīng)的具體地點(diǎn)??紤]到附件一中任務(wù)定價和任務(wù)經(jīng)度、任務(wù)緯度、每個任務(wù)到所有會員的平均距離有關(guān),故假設(shè)任務(wù)經(jīng)度、任務(wù)緯度、每個任務(wù)到所有會員的平均距離與任務(wù)定價之間呈多元線性關(guān)系進(jìn)行分析,建立多元線性回歸模型進(jìn)行定量分析。
圖1 歸一化處理結(jié)果圖
圖2 已結(jié)束任務(wù)地理分布圖
首先查閱文獻(xiàn)[1]得出由兩點(diǎn)的經(jīng)緯度得出兩點(diǎn)的實(shí)際地理距離公式:
其中Δ為兩點(diǎn)之間的距離,λ1,λ2分別為兩點(diǎn)的經(jīng)度,?1,?2分別為兩個點(diǎn)的緯度。利用Python得到每個任務(wù)到所有會員的平均距離:
y=ax1+bx2+cx3+ε
其中y表示每個任務(wù)定價,a、b、c指偏回歸系數(shù),x1為緯度,x2為經(jīng)度,x3為每個任務(wù)到所有會員的平均距離。
對附件一中的已結(jié)束任務(wù)選取前500個樣本進(jìn)行分析。利用MATLAB軟件得出各個系數(shù)的值,所以多元線性回歸模型為:
y=68.6692+1.1129x1+4.4192x2-0.1818x3
R2=0.0239,F(xiàn) 統(tǒng)計量為 6.7809,p值為0.0002,誤差方差s2為19.9503。根據(jù)回歸模型,當(dāng)p的值大于0.05時,表示所求的系數(shù)為合理,顯然所得的p<0.05,則根據(jù)數(shù)據(jù)建立的多元線性回歸模型成立。
綜上,該多元線性回歸模型可以定量的描述任務(wù)定價與任務(wù)位置以及平均距離之間的關(guān)系。因此,將此模型作為附件一中已結(jié)束任務(wù)定價規(guī)律的模型表示。
通過劃分任務(wù)定價區(qū)間,利用MATLAB、Excel得出以下結(jié)果圖和價格區(qū)間完成情況表得出任務(wù)未完成度與任務(wù)定的高低、任務(wù)的位置、會員的位置,以及會員的預(yù)定限額與信譽(yù)度之間的關(guān)系。
圖3 已結(jié)束任務(wù)分布圖
圖4 會員分布情況圖
圖5 定價區(qū)間[68,70.5]
圖6 定價區(qū)[68,70.5]
圖7 定價區(qū)間[71,73.5]
圖8 定價區(qū)間[74,85]
結(jié)合未完成原因分析,對會員到任務(wù)ti的距離li小于等于平均距離Li的每個任務(wù)到所有會員的平均距離為半徑的范圍內(nèi)的會員的平均信譽(yù)度Cˉ與平均預(yù)定限額,并歸一化處理:
運(yùn)用MATLAB軟件使用BP神經(jīng)網(wǎng)絡(luò)模型,來建立任務(wù)定價與任務(wù)的經(jīng)緯度、每個會員到任務(wù)的平均距離,以及平均信譽(yù)額度與平均預(yù)定限額的關(guān)系模型,分為輸入層、隱藏層與輸出層。
圖10 BP神經(jīng)網(wǎng)絡(luò)模型構(gòu)造示意圖
(1)輸入層
通過以上對附件一中的數(shù)據(jù)處理和優(yōu)化最終得到513條任務(wù)完成度為1的數(shù)據(jù),將其中的400條數(shù)據(jù)作為訓(xùn)練集輸入,123條數(shù)據(jù)作為測試集輸入用于驗(yàn)證關(guān)系模型的正確性。
(2)隱藏層
通過建立兩層隱藏層進(jìn)行訓(xùn)練,第一層為15個神經(jīng)元,第一層為20個神經(jīng)元。使用tansig(s)函數(shù)和purelin(s)函數(shù)對每個隱藏層的接收到的數(shù)據(jù)進(jìn)行處理。
(3)輸出層
使用輸出層輸出任務(wù)定價的預(yù)測數(shù)據(jù),即任務(wù)的定價值。
通過MATLAB運(yùn)行訓(xùn)練集的數(shù)據(jù)得到任務(wù)定價模型:
Y1=f2(f1(x1W1+b1)×W2+b2)
其中:
然后對神經(jīng)網(wǎng)絡(luò)模型利用123條測試數(shù)據(jù)進(jìn)行驗(yàn)證,則得到以下結(jié)果:
圖11 數(shù)據(jù)擬合曲線圖
最后以300條任務(wù)完成度為0的數(shù)據(jù)作為輸入,得到一個新的定價方案為:
圖12 新價格方案任務(wù)價格示意圖
對附件一所有已結(jié)束任務(wù)進(jìn)行邏輯回歸模型的建立,以任務(wù)經(jīng)度、任務(wù)緯度、每個任務(wù)到所有會員的平均距離、每個任務(wù)的會員平均信譽(yù)值、以為自變量及任務(wù)定價為因變量,建立完成度回歸模型。將數(shù)據(jù)導(dǎo)入SPSS,得出完成度F模型:
F=1.21x1+3.219x2-0.098x3+0.013x4+0.095x5-9.24
式中:x1為任務(wù)經(jīng)度,x2為任務(wù)緯度,x3為每個任務(wù)到所有會員的平均距離,x4為可能做該任務(wù)的所有會員的平均信譽(yù)值,x5為可能做該任務(wù)的任何會員平均預(yù)定限額。
利用F 模型僅對附件一中任務(wù)完成度為0的任務(wù)進(jìn)行重新定價,得出重新定價之后的任務(wù)完成情況表
表1 重新定價完成情況比較
由表1可知,該方案的定價比原方案更合理,在一定程度在提高了任務(wù)完成率。
由于已結(jié)束任務(wù)分布十分密集,可以通過在同一時間點(diǎn)發(fā)布任務(wù)進(jìn)行打包,即通過提高同一時間點(diǎn)打包發(fā)布的任務(wù)數(shù)目來降低競爭程度大小。通過聚類分析將任務(wù)劃分為k類,使k類任務(wù)中的每一類的發(fā)布時間相同。聚類分析的具體步驟如下:
(1)通過附件一得出已結(jié)束任務(wù)經(jīng)度范圍屬于[22.49,23.87],已結(jié)束任務(wù)緯度范圍[112.68,114.49],分別在兩個經(jīng)度、緯度范圍內(nèi)通過Python程序隨機(jī)k次,得出k個初始中心經(jīng)緯度位置(ci,bi)(i=0,1,2,…,k)。
(2)首先對每個任務(wù)在k個中心點(diǎn)中找出距離最近的中心點(diǎn)ki,則A0j任務(wù)屬于以ki為中心的一類。通過求出中心點(diǎn)ki與每個任務(wù)的中心點(diǎn)作為新的ki。
(3)然后再進(jìn)行下一個任務(wù)的計算,重新進(jìn)行第二步。將最后一個任務(wù)歸類完畢。得到每個任務(wù)類的中心點(diǎn)經(jīng)緯度和每個任務(wù)的分類結(jié)果。
所有任務(wù)分為23類,通過將聚類得到23個中心點(diǎn)的經(jīng)緯度(ci,bi),同問題二利用Python編程求出每類任務(wù)到所有會員的平均距離、每個任務(wù)到所有會員的平均距離、每個任務(wù)的平均信譽(yù)值,如下圖:
圖13 任務(wù)中心所求示意圖
再利用定價模型Y得出k類任務(wù)定價,假設(shè)每一類中的任務(wù)定價相同,即屬于第i類的所有任務(wù)定價均為zi,利用問題二中已求數(shù)據(jù)平均距離、平均信譽(yù)值、平均預(yù)定限額分別代入到問題二任務(wù)完成度模型F中,得出每類任務(wù)中的完成數(shù)目,得出附件一中已結(jié)束任務(wù)打包前后任務(wù)完成情況表以及每個任務(wù)中心點(diǎn)的定價方案:
圖14 任務(wù)中心定價方案情況示意圖
表2 打包前后效果分析圖
由表2可知,打包之后任務(wù)完成度提高了20.03%,所以通過在同一時間點(diǎn)內(nèi)打包發(fā)布任務(wù)有利于提高完成度。
用Excel畫出新任務(wù)的分布,可以看出任務(wù)分布極其集中,這樣會使用戶爭相選擇,會嚴(yán)重增大會員的競爭激烈程度。故采用在同一時間點(diǎn)發(fā)布的原則進(jìn)行打包,通過聚類分析分為K類,利用Python編程求出每一類任務(wù)的中心點(diǎn)的經(jīng)緯度位置(ci,bi),并數(shù)據(jù)處理求解出可能做該任務(wù)的所有會員的平均信譽(yù)值、可能做該任務(wù)的所有會員的平均預(yù)定限額,進(jìn)而運(yùn)用定價模型Y得出每類任務(wù)定價,將K個定價分別代入F模型,得出K類中每類任務(wù)的完成個數(shù),將K類所有的任務(wù)中心點(diǎn),最后得出結(jié)果:
圖15 新任務(wù)中心定價方案情況示意圖
表3 新任務(wù)效果分析圖
本文通過研究已有的任務(wù)定價,分析未完成任務(wù)原因,在原基礎(chǔ)上改進(jìn)任務(wù)定價方案,對任務(wù)進(jìn)行打包分布,重新得出定價方案,應(yīng)用于不同的任務(wù)定價中。經(jīng)過驗(yàn)證,改進(jìn)后的任務(wù)定價方案提高了任務(wù)完成度。
[1]韓忠民.知經(jīng)緯度計算兩點(diǎn)精確距離:科技傳播:2011,11.
[2]姜啟源,謝金星.數(shù)學(xué)模型,北京:高等教育出版社,2010,9,
[3]韓婷,王金寶.數(shù)學(xué)建模入門與提高,北京:國防工業(yè)出版社,2013,8.
[4]葉其孝姜啟源.數(shù)學(xué)建模,北京:機(jī)械工業(yè)出版社,2009,8.
[5]方道元,韋明俊.數(shù)學(xué)建模,杭州:浙江大學(xué)出版社,2011,2.