王 妍 朱家明 王欣宇 張一鳴
(1.安徽財經(jīng)大學統(tǒng)計與應用數(shù)學學院,安徽 蚌埠 233030;2.安徽財經(jīng)大學金融學院,安徽 蚌埠 233030)
當今社會,隨著移動互聯(lián)網(wǎng)的發(fā)展,各種基于網(wǎng)絡平臺的APP應運而生?!芭恼召嶅X”是移動互聯(lián)網(wǎng)下的一種自助式服務模式,用戶下載APP,注冊成為APP的會員,然后從APP上領取需要拍照的任務,便可賺取APP對任務所標定的酬金。這種基于移動互聯(lián)網(wǎng)的自助式勞務眾包平臺,為企業(yè)提供了各種商業(yè)檢查和信息搜集,相比傳統(tǒng)的市場調查方式可以大大節(jié)省調查成本,而且有效地保證了調查數(shù)據(jù)的真實性,縮短了調查周期,成為當下發(fā)展的一種新潮流。這種基于移動互聯(lián)網(wǎng)的自助式勞務眾包平臺,APP是該平臺的運行核心。而APP中,任務定價又是整個APP運行的核心要素。如果定價不合理,有的任務就會無人問津,而導致任務的失敗。因此筆者對“拍照賺錢”任務的定價問題進行研究,從而分析任務未完成的原因并設計一套新的任務定價方案。
本文數(shù)據(jù)來源于2017年全國大學生數(shù)學建模競賽B題中附件一:已結束項目任務數(shù)據(jù);附件二:會員信息數(shù)據(jù);附件三:新項目任務數(shù)據(jù);2016年廣東省統(tǒng)計年鑒。為了便于研究問題,提出以下幾條假設:⑴假設題目中的數(shù)據(jù)全部來自于同一款APP,用戶不存在體驗感受上的差異;(2)假設所有會員領取的拍照任務均是親自拍攝所得,不存在他人遠程幫忙的可能;(3)假設每一位會員只有一個賬戶,不存在一位會員開設多個賬戶的情況;(4)假設在對所有任務進行區(qū)域劃分時,每一個任務都屬于某一區(qū)域內(nèi),不存在某一任務出現(xiàn)在區(qū)域邊界線上的情況。
為了探究任務定價規(guī)律與任務未完成的原因,首先為便于距離計算需將經(jīng)緯度的坐標轉化為二維距離。其次需要對數(shù)據(jù)進行分類整理,結合數(shù)據(jù)可視化圖表探究任務點的分布規(guī)律與價格分布規(guī)律;繼而建立任務定價模型,在模型中引入決定價格變化的參數(shù)并對模型的優(yōu)劣性進行驗證;最后對任務未完成的原因進行具體的分析。
2.2.1 經(jīng)緯度坐標到二維距離的轉換
由于任務點與會員的位置信息都是以經(jīng)緯度坐標給出的,而且任務與會員之間的經(jīng)緯度差距不大,緯度主要集中在北緯22.49308312~23.87839806度之間,經(jīng)度主要集中在東經(jīng)112.6832583~114.4936096度之間,經(jīng)緯度的差值過小,直接利用角度差表現(xiàn)距離會造成較大誤差。加之考慮到地球表面曲面性的特點,為了便于直觀地反映各個點之間的位置關系,需要參考GPS導航軟件中將經(jīng)緯度轉化為實際直線距離的原理,把各個點的經(jīng)緯度坐標轉化為直線距離[1]。原理如下:
地球赤道的周長是40075.04公里,則每度在赤道上的長度計算公式為:
結合位置點的經(jīng)緯度坐標,任意兩點的距離計算公式為:
其中,A、B表示需要計算距離的兩個點,λ表示緯度,φ表示經(jīng)度。
根據(jù)上述原理,利用MATLAB進行編程,分別得到任意兩個位置點之間的平面距離。
2.2.2 任務點的分布
首先為了實現(xiàn)數(shù)據(jù)可視化,便于直觀地看出結果,將任務點經(jīng)緯度坐標批量導入地圖規(guī)劃軟件中(本文使用的是地圖無憂平臺),將全部任務點坐標標注在地圖上,得到平面圖如圖1所示。
圖1 任務點地理位置分布圖
從圖1任務分布圖中可以直觀地看出,所有的任務點都分布在廣東省,并且任務點呈現(xiàn)聚類趨勢,集中分布在廣州、深圳、佛山、東莞四個城市。對任務點的經(jīng)緯度坐標進行聚類分析,得到四個任務點群體的中心坐標為:深圳(114.061355,22.629373)、廣州(113.252081,23.172494)、佛山(113.130199,23.034212)、東莞(113.755707,23.042726)。
2.2.3 任務點的價格分布
對附件一的數(shù)據(jù)進行整理。為便于計算,將23種價格分成四個分布區(qū)間,并得到如表1所示的各個價格區(qū)間任務的分布情況。
表1 任務價格區(qū)間分布
由表1可以看出,超過一半任務的價格集中在66~68價格區(qū)間內(nèi),68.5~75價格區(qū)間中的任務占38.6%,80~85價格區(qū)間的任務占總體任務的5%不到。
將不同價格區(qū)間的任務點分布反映在地圖上,得到如圖2所示的分布圖,其中紅色表示66~68價格區(qū)間的任務,藍色表示68.5~71.5價格區(qū)間,紫色表示72~75價格區(qū)間,黑色表示價格是80和85的任務點。
圖2 不同價格區(qū)間內(nèi)的任務分布圖
從圖2可以看出:紅色的點集中在四個城市的中心區(qū)域,藍色和紫色的點沿道路向外分散在城市的郊區(qū)地帶,而黑色的點散亂分布,沒有明顯的分布規(guī)律。價格所呈現(xiàn)的特點為:任務集中在城市中心繁華地段時,定價會偏低,離市中心越遠,定價越高。
根據(jù)經(jīng)緯度坐標,對價格高的點進行數(shù)據(jù)挖掘,發(fā)現(xiàn)價格高的點一般都是政府機構、銀行、高檔賓館和大型商貿(mào)城等,這說明價格高的任務可能與任務自身的難易與屬性有關系,并且數(shù)量較少,分布具有隨機性。
2.3.1 任務定價模型
根據(jù)上述對價格分布規(guī)律的探究,得出:任務的價格主要是受到任務點地理位置和任務自身的難度兩個因素的影響。將地理位置對任務價格的影響定義為某點的繁華程度,它受到人口密度情況和經(jīng)濟狀況的綜合作用,不同城市具有不同的取值且越偏遠的地方取值越小。將任務自身難度定義為任務點的特征屬性,它的出現(xiàn)與否具有隨機性,所以特征屬性需要與隨機虛擬變量(0-1變量)結合使用。
現(xiàn)給出任務定價模型:
其中,P表示任務的價格,70表示基礎價格,
為城市繁華度帶來的價格變動,wj表示各城市由人口密度、GDP、人均消費水平等因素通過層次分析法得到的各城市繁華度權重,fij表示城市j對任務i的繁華度指標,g表示價格波動影響參數(shù);λi為任務自身因素而帶來的價格變動,為0-1隨機變量且1出現(xiàn)的概率為5%,b為[0,20]的隨機數(shù)。
一個任務點的地理位置越靠近市中心,繁華程度參數(shù)越大,價格越低;當虛擬變量為1的時候,任務點因自身原因加價,價格越高。
2.3.2 模型的完善
首先,選取人均GDP、平均工資、人口密度、工業(yè)總產(chǎn)值這四個指標來衡量城市的繁榮程度。2016年的四個城市指標數(shù)值如表2所示。
表2 四個城市經(jīng)濟與人口的指標數(shù)值
然后,使用層次分析法[3],將決策問題分為三個層次:目標層O、準則層C、方案層 P,每層有若干個元素,如圖3所示。
圖3 層次分析圖
其中,目標層:城市繁華程度。
準則層:人均 GDP、平均工資、人口密度、工業(yè)總產(chǎn)值。
方案層:廣州、深圳、佛山、東莞四個城市。
綜合實際經(jīng)驗和參考文獻分析可近似得到以下系數(shù):
a12=1:2,a13=1:3,a14=1:4,a23=2:3,a24=2:4,a34=3:4,
從而得到正互反矩陣:
經(jīng)過MATLAB歸一化處理,得到標準化特征向量:
w=(0.2857,0.3571,0.1429,0.2143)
即四個城市的權值分別為:0.2857,0.3571,0.1429,0.2143。
其次,由于同一個城市不同的區(qū)域繁華程度也各有差異,任務點的分布主要集中在每個城市半徑30公里之內(nèi)。通過對任務點價格的分析,發(fā)現(xiàn)價格在同一個城市呈現(xiàn)向外遞增的趨勢,而且繁華程度每五公里遞減一個等級(即每五公里價格遞減0.5單位),并且部分點落在兩個不同的城市任務圈內(nèi)。
由于高價位任務分布存在隨機性的特點,且高價位的任務占總體的5%左右。按照固定的5%的比例,隨機設定高價位的任務點,即為0-1隨機變量且1出現(xiàn)的概率為5%,并設定他們的特征屬性值為[0,20]的隨機數(shù)。
根據(jù)模型參數(shù)設定規(guī)律,通過MATLAB軟件進行編程,對每個任務點利用上述任務定價模型進行定價計算,得到預測價格。由于數(shù)據(jù)過多,現(xiàn)給出部分任務點的原有價格與預測價格數(shù)據(jù),如表4所示。
表4 部分價格預測值與原有價格的比較
2.3.3 模型的檢驗
為了能直觀地反映我們給出的任務定價模型是否符合原有規(guī)律,做出原假設:價格預測值與原有定價有顯著差異。利用SPSS將全部任務點的價格預測值與實際標價進行配對樣本的T檢驗[4],得到如表5所示的計算結果,結果拒絕原假設。
表5 成對樣本檢驗
(1)價位越高,完成率越低。根據(jù)表1任務價格區(qū)間分布情況可以看出,任務價格在65~68區(qū)間內(nèi)完成率為46.61017%,完成率最高。價格越高,完成率反而低,這可能與高價位任務難度大,地理位置偏遠,鮮有人特意為完成任務而到達某地有關。
(2)人均收入越高,完成率越低。結合已完成任務與未完成任務分布點的分布圖 (如圖4,紅色方塊表示未完成,紫色方塊表示已完成),可以看出東莞的任務完成率最高,廣州和佛山次之,深圳的任務完成率最低。綜合考慮城市的人均經(jīng)濟水平與邊際生產(chǎn)力分配理論,發(fā)現(xiàn)人均收入越大的地方,對任務的執(zhí)行率越低,即任務是否完成與地區(qū)的人均收入有關。
圖4 已完成與未完成任務分布圖
圖5 會員與未完成任務分布圖
(3)任務區(qū)域內(nèi)會員數(shù)量越少,完成率越低。通過對比未完成任務點的分布及會員位置的分布,不難看出,有些區(qū)域任務完成率低與會員分布稀少緊密相關。在局部地區(qū)軟件推廣不足,會員注冊人數(shù)較少,導致任務未完成,如圖5所示(其中紅色圓點表示未完成的任務分布,藍色星表示會員分布位置)。
(4)任務附近會員的信譽值越低,完成率越低。為了比較會員之間的差異,首先根據(jù)會員信譽值的大小將會員粗略地分成四類,然后根據(jù)四種不同的等級會員分布情況對比任務未完成點的分布圖,發(fā)現(xiàn)低等級會員分布越集中的地方任務未完成率越高,如圖6所示(灰色星代表會員信譽度較低的會員分布點,紅色表示未完成的任務分布)。
圖6 會員等級分布圖
首先綜合考慮會員的各項指標建立模糊綜合評價模型,將會員分成不同的等級,并賦予每個等級不同的數(shù)值,在原有的定價模型上加上會員等級這一新的影響因素。此時會員等級越高,可完成的任務數(shù)量越多,單價越低。最后利用所得的綜合得分對會員進行分級,再結合每一位會員的GPS經(jīng)緯度,便可得到四個城市會員的分級情況。
附件二中給出的會員指標存在多個,故先利用熵值法[3]對會員的幾個指標計算權重。
構建原始指標矩陣。假設有m個會員,n項指標,則原始指標數(shù)據(jù)矩陣為:
為了消除各評價指標的量綱影響,需對原始數(shù)據(jù)進行無量綱化處理。對于正向指標,計算方法為:
對于負向指標,計算方法為:
式中:Xij為無量綱化后的數(shù)據(jù)值,maxXj和minXj分別為j項指標的最大值和最小值。
對無量綱化后的數(shù)據(jù)進行歸一化處理,方法為:
式中:gj為差異性系數(shù),ej為熵值。
選取附件二中會員的預定任務限額、預定任務所需時間、信譽值這三個指標,經(jīng)過MATLAB軟件編程,得到權重矩陣為:
w=(0.3371,0.6271,0.0358)
在附件二中,代入求出第i項指標的權重,求出每一位會員的綜合得分,以此來對會員進行分級,得到各個等級會員的數(shù)量。再結合每一位會員的GPS經(jīng)緯度,可得到四個城市會員的分級情況,結果如表6所示。
表6 各城市各等級會員數(shù)量百分比
原有的任務定價模型為:
P=70+g(wj·fij)+λib
結合問題一中對任務未完成原因的分析我們可以發(fā)現(xiàn),會員的數(shù)量和信譽值均會對任務的完成率產(chǎn)生影響,而原模型中并未考慮到會員的影響因素??紤]到附件二中會員的信譽值和完成任務的時間等指標,以及上文得出的會員在各個城市的分布情況,因此需從會員的質與量兩個方面進行分析。
設j地區(qū)第i個任務會員的影響度為 hij,I是對應的價格影響參數(shù),各城市權重為設改進后的任務定價模型為:
P=70+g(wj·fij)+I(wj·hij)λib
經(jīng)過新的模型求解,得到新的定價方案部分如表7所示。
表7 部分任務點新預測價格的數(shù)值
通過表7可以看出,已完成任務的新舊定價差別不大,說明定價合理;未完成任務的新定價方案大多都高于原價格,推測對任務完成情況有利,綜上所述,新的定價方案優(yōu)于原定價方案。
改進后定價計算公式:
其中g和I分別為繁華度和會員因素對價格波動變化的修正參數(shù),wj·fij和 wj·hij為城市 j分別對任務i的繁華度指數(shù)和會員綜合指數(shù),將地區(qū)對任務的兩種因素指數(shù)作為自變量,變動范圍在[0,10]、[0,5]之間,最終定價視為因變量,隨機變量λ取0,任務的定價方案取經(jīng)緯度為113.9356769,22.51592012的定價為65.75。針對I和g的不同取值,運用MATLAB軟件編程進行靈敏度分析,得到結果如圖7所示。
由靈敏度分析可知,在價格變化出現(xiàn)波動時,等量的對應因素修正參數(shù)所引起的價格變化很小。故此次靈敏度分析效果較好,即兩種因素對價格變化的波動參數(shù)對最終價格的影響很小。
圖7 靈敏度分析圖
本文的突出特色是運用數(shù)據(jù)可視化和定性數(shù)據(jù)定量化分析。前者將GPS經(jīng)緯度轉化為平面地圖上多個點的分布,能更簡便、直觀地對數(shù)據(jù)進行觀察分析;后者將影響價格的不同因素定量化處理,能更直接地對定價產(chǎn)生影響。本文模型的應用背景是基于智能手機和移動互聯(lián)網(wǎng)的勞務眾包平臺,如外賣應用、滴滴打車、快遞跑腿服務平臺等都涉及到商品定價與地理位置、會員積極程度的關系,以上各模型在建模過程中通過相應的軟件檢驗,具有一定的合理性。