,,
(1.安徽財經(jīng)大學金融學院,安徽 蚌埠 233000;2.安徽財經(jīng)大學統(tǒng)計與應用數(shù)學學院,安徽 蚌埠 233000)
眾包模式作為互聯(lián)網(wǎng)時代的自主式服務[1],吸引越來越多的人參與其中。眾包平臺利用互聯(lián)網(wǎng)的力量,將任務進行分解,派發(fā)到大眾手中。用戶通過完成任務獲得相應數(shù)量的資金報酬,企業(yè)得到需要的數(shù)據(jù)與調查問卷。不僅可以提高企業(yè)的調查效率,而且提高了調查問卷的準確性。平臺任務的定價作為一個核心要素[2],關系著任務的完成效率以及企業(yè)付出的成本。
本文數(shù)據(jù)來源于全國大學生數(shù)學建模競賽以及2017年廣州市薪資水平報告。為了確保模型嚴謹性,提出假設:(1)平臺會員都是理性經(jīng)濟人,在完成任務時會在成本和收益的關系之間進行取舍權衡[3]。(2)地球是一個光滑球體,忽略地球表面的地形起伏變化,并認為球體的半徑為地球的平均半徑,即R=6371.004。(3)會員不會因為交通擁堵問題導致任務未完成。(4)影響會員選擇的因素只有任務與會員的距離、位置熵和任務的價格。
圍繞“任務”和“會員”兩大主體進行分析[4],將任務標價作為因變量,任務的經(jīng)緯度坐標、任務的執(zhí)行情況、會員的地理位置、會員的信譽值以及會員預訂任務限額作為自變量,擬合因變量關于自變量的回歸函數(shù),代入價格檢驗回歸函數(shù)準確性。
因此首先對數(shù)據(jù)進行預處理,剔除與任務地點距離較大的會員坐標。劃定行動范圍,任何任務范圍內會員的任務限制、開始時間、信譽度與范圍內其他任務的位置熵決定了任務完成的可能性[5]。
圖1 定價模型的研究思路
2.3.1 確定可行范圍
設任務點Ai的緯經(jīng)度坐標為(xA,yA),會員點的緯經(jīng)度坐標為(xB,yB),根據(jù)經(jīng)緯度分布圖,得知任務點分布在東經(jīng)(112.6832,114.4936)到北緯(22.4931,23.8784)的范圍之內。
根據(jù)經(jīng)緯度計算公式的三角推導,兩點之間的經(jīng)緯度距離為
在經(jīng)緯網(wǎng)圖上,根據(jù)經(jīng)緯度計算兩點之間的距離。由于地點范圍差距較小,認為在這個地點范圍內,所有經(jīng)緯度的長度都相等,即1°=111km。在不考慮交通道路與障礙物的情況下,兩點之間的實際距離為
d=111*Δ
2.3.2 可行范圍內會員的情況
會員是理性經(jīng)濟人,其成本為花費的時間和距離,一定存在一個成本最大點,當會員與任務的距離大于r時,會員會選擇放棄任務。即在r內,會員才愿意花費時間與精力去完成該項任務。令會員點Bi與任務點Ai的距離Di,對于Bi,若Di≤r,提取Bi,否則舍棄。
則對于所有的未舍棄的會員點,給提取出的會員點一個新的符號Bi,影響因素預訂任務限額Ki、預訂任務開始時間Pi、信譽值Qi。任務點Ai的影響因素就是這些會員點的平均值,即:
同理
2.3.3 落入可行范圍內的其他任務
在一定范圍內,除會員數(shù)量可能影響任務的定價,任務之間的價格差異也會任務的定價產生影響。定義這種價格之間的相互影響為任務優(yōu)先度,任務優(yōu)先度越大,則任務對于會員的吸引力也就越大。
對于任務Ai,如果在半徑為r范圍的圓內,存在任務Aα,Aβ,Aγ,其任務標價分別為wi,wα,wβ,wγ,則任務Ai的任務優(yōu)先度為
在半徑范圍內不存在其他任務的情況下,即wα=wβ=wγ=0,此時σi=1。根據(jù)任務優(yōu)先度原則,此時對會員的吸引度最大。然而,現(xiàn)實情況下,人們往往無法對于偏遠任務產生接受的興趣,這與優(yōu)先度原則相違背。于是,對任務優(yōu)先度原則做一個補充,當范圍內不存在其他任務時,σi=0。
2.3.4 回歸函數(shù)的建立
建立價格與某個任務范圍內會員平均預訂限額、平均時間、平均榮譽值、任務優(yōu)先度之間的多元回歸函數(shù)
其中,β1,β2,β3,β4分別為影響因素的系數(shù),α1,α2,α3,α4分別為影響因素的指數(shù),為隨機誤差項。
利用excel求得835個任務點對應的任務點優(yōu)先度、范圍內的會員數(shù)、平均預訂限額、平均時間和平均榮譽數(shù)。預先繪制一張散點圖,觀察自變量與因變量之間的關系。
建立因變量y1任務標價,y2任務執(zhí)行情況;原始自變量a1緯度,a2經(jīng)度;自變量x1落入會員數(shù),x2平均預訂任務限額,x2平均預訂任務開始時間,x4平均信譽值,x5任務優(yōu)先度。
觀察圖2,y1與a2、x2和x5之間不存在任何關系;y1與a1存在正相關關系,與x1存在負相關關系;雖然y2與x2、x4不存在直接關系,但是與x1x3、x2x4存在負相關關系。
圖2 相關關系系數(shù)圖
根據(jù)y1與其他變量之間的相關系數(shù)不斷調整,得到五個變量之間的相關系數(shù)表。觀察表中數(shù)據(jù),Y1與A1的相關性最高,說明價格受地域因素影響較大;與X1*X4的相關性最低,說明價格受周邊會員榮譽總數(shù)影響較小。
表1 變量之間相關系數(shù)表
在擬合回歸的過程中,變量中含有0變量時,log函數(shù)無意義。將含有0邊量的值替換為Q,Q為無限趨向于0的數(shù),但不為0。
根據(jù)擬合結果,得到最終的定價規(guī)律函數(shù):
lny1=0.203432a1-0.052311lnx1+
0.027267lnx2x3-0.002199lnx1x4-0.410941
設計新的定價方案,并與原方案進行比較。綜合考慮任務分布以及完成情況,運用spss對任務進行分類,針對各區(qū)域不同情況分別進行討論。在定價規(guī)律的基礎上,引入用以修正任務價格的工資比以及用以修正任務可行范圍內會員數(shù)量的階層比,對佛山、廣州、深圳、東莞四個區(qū)域重新進行擬合回歸方程,得到新的定價模型。
K均值聚類法是基于劃分方法的聚類,算法過程較為簡單,執(zhí)行速度較快。在計算的過程中,需要輸入希望得到的聚類個數(shù)K,軟件會將數(shù)據(jù)劃分成K個類別。在實踐計算的過程中,K值由人為指定,包含較大的主觀性。
首先對K值做一個計算,利用Euclid距離先對于數(shù)據(jù)進行預分類,根據(jù)任務之間的歐氏距離生成聚類樹,取聚類比重為1時的聚類個數(shù)為K,如圖3。根據(jù)比重為1時水平線與聚類樹交點,取K=4。
根據(jù)對定價規(guī)律的研究,任務未完成的原因主要包含三大方面:定價不合理、周邊會員的數(shù)量和不活躍會員的比例。除此之外,建立模型我們還考慮了當?shù)氐慕?jīng)濟發(fā)達程度和勞動人口的比重。
表2可以看出,任務完成率越高,該地區(qū)的平均工資越低,低收入階層所占的比例也就越低。從實施情況來看,在經(jīng)濟并不發(fā)達的地區(qū),低收入階層的人數(shù)往往越多,他們更愿意在工作時間外干兼職來改善生活。
圖3 任務聚類樹
表2不同地區(qū)任務完成率、經(jīng)濟水平和低收入階層比例情況表
任務完成率平均工資(元/月)低收入階層比例佛山市48.91%384583.7%廣州市42.92%481167.9%東莞市98.21%356885.4%深圳市17.39%519962.5%
鑒于不同地區(qū)的不同情況,任務的定價和會員的實際工作能力也需要做出調整。根據(jù)工資水平占平均工資的比例和階層人數(shù)占平均階層人數(shù)的比例來對這兩項變量進行調整。
令不同地區(qū)的平均工資為Ii,低收入階層比例為Ki(i=1,2,3,4),改正后的變量遵循:
任務的完成率呈現(xiàn)區(qū)域性的特征,利用spss,針對任務完成度對835個任務點根據(jù)經(jīng)緯度和執(zhí)行情況以K=4進行聚類,得到四個聚類中心點。
表3 聚類中心點情況
將這四個中心點在地圖上表示出來,并根據(jù)聚類情況,劃分得到每一類的具體范圍。
觀察分類框圖并查詢地圖,四個區(qū)域分別可以擬合佛山市、廣州市、東莞市和深圳市四個行政區(qū)。結合深圳市與東莞市截然不同的完成情況,推測任務完成度與任務所在地的工資和階層分布有關。根據(jù)表2,計算出四市平均工資,并將各市平均工資比四市平均工資得到工資比,同理得到階層比,結果見表4。
表4 四個地區(qū)工資比和階層比
修正不同地區(qū)的定價模型,根據(jù)定價規(guī)律模型中的算法,工資比體現(xiàn)城市的物價水平/消費水平,因此將工資比用于對任務價格系數(shù)的修正。階層比體現(xiàn)用戶中有充分時間并且有意愿做這類可能費時且收入較低的任務人數(shù),因此將階層比用于任務可行范圍內會員數(shù)量系數(shù)的修正。經(jīng)過計算,得到四個區(qū)域不同的定價函數(shù)。
表5 不同地區(qū)的定價函數(shù)
圖4 任務點區(qū)域分類范圍
圖5 不同K值距離中心分布圖
將設計的定價方案與原方案進行比較:
y2=0.00723x1+4.90E-0.5x4
lny2=0.2034a1-0.0523lnx1+0.0273lnx1x2-0.0022lnx1x4-0.4109
對比兩個方案,當任務的完成度增加1單位時,范圍內會員數(shù)量增加0.072。將此線性關系運用到定價規(guī)律模型中,在價格不變的情況下,范圍內會員數(shù)量每增加-0.0523,其余變量將相應改變對應系數(shù)的單位,如表7。
表7 彈性變化表
通過上表,相對于初始值,大多數(shù)函數(shù)的彈性絕對值變化較大。在其他變量不變的情況下,增加一單位的任務完成率所需要改變的會員數(shù)量就越少,即任務完成率會相對增大。因此,分區(qū)后的定價規(guī)則可以提高任務完成率。
4.1.1 經(jīng)緯度
實際情況下,在計算經(jīng)緯度距離時需要考慮其弧度問題。設任務點Ai的經(jīng)緯度坐標為(aA,yA),會員點Bi的經(jīng)緯度坐標為(xB,yB),根據(jù)經(jīng)緯度分布圖,我們可以得知任務點分布在東經(jīng)(112.6832,114.4936)到北緯(22.4931,23.8784)的范圍之內,根據(jù)經(jīng)緯度計算公式的三角推導,兩點之間的距離為
d=sin(yA)·sin(yB)+cos(Ya)·cos(yB)·
cos(xA-xB)
4.1.2 任務優(yōu)先
σi是定義的任務優(yōu)先度計算公式,但是這是在考慮在Ai任務點附近存在其他任務點的情況。在半徑r范圍內不存在其他任務的情況下,此時σi=1。根據(jù)任務優(yōu)先度原則,此時對會員的吸引度最大?,F(xiàn)實情況下,對于偏遠地區(qū)的任務,人們往往無法產生接受的興趣,這與優(yōu)先度原則相違背。于是,對任務優(yōu)先度原則做一個補充,當范圍內不存在其他任務時,σi=0。
當聚類比重為1時,選取K=4。當變換聚類比重時,K可以取不同的值。若聚類比重小于1,則K可取K=7,8,9,10,11,將經(jīng)緯度導入MATLAB軟件[6],繪制其聚類中心點分布情況,并采用不同的顏色進行標注,見圖5。得到不同的K值下,聚類中心點不同,而且存在一定的距離。當K=9時,與其他聚類點重合的情況最高,說明K=9的取值合理[7]。
探究眾包平臺的定價規(guī)律,選取準確的影響因素并擬合回歸,能夠有效發(fā)現(xiàn)現(xiàn)有模式的不足。結合地區(qū)之間市場需求及物價水平的差異,對區(qū)域進行聚類劃分,尋求最佳的聚類中心點。根據(jù)聚類區(qū)域的不同,制定符合區(qū)域范圍內的定價策略。
參考文獻:
[1] 李景峰,梁明蕙.分享經(jīng)濟時代下基于互聯(lián)網(wǎng)的人力資源眾包模式初探[J].經(jīng)濟問題,2016(04):96-101.
[2] 姚山季,劉德文.眾包模式下顧客參與、顧客互動和新產品價值[J].財經(jīng)論叢,2016(10):85-95.
[3] 林素芬,林峰.眾包定義、模式研究發(fā)展及展望[J].科技管理研究,2015,35(04):212-217.
[4] 王姝,陳勁,梁靚.網(wǎng)絡眾包模式的協(xié)同自組織創(chuàng)新效應分析[J].科研管理,2014,35(04):26-33.
[5] 李龍一,王瓊.眾包模式用戶參與影響因素分析——基于社會交換理論的實證研究[J].現(xiàn)代情報,2014,34(05):17-23.
[6] 吳禮斌, 李柏年, 閆云俠.經(jīng)濟數(shù)學實驗與建模[M].北京:國防工業(yè)出版社, 2013.202-212.
[7] 楊桂元.數(shù)學建模[M].上海:上海財經(jīng)大學, 2015.