何丹
摘 要:近些年,在移動互聯(lián)網(wǎng)時代,自助式勞務(wù)眾包平臺發(fā)展非常快,它為企業(yè)提供多種多樣的信息,同時大大降低了調(diào)查成本。其基本模式是:用戶在APP上領(lǐng)取需要完成的任務(wù),賺取APP對任務(wù)所標(biāo)定的酬金。由于定價規(guī)則關(guān)系到任務(wù)是否能被完成,同時影響企業(yè)付出的成本,因此至關(guān)重要。本文根據(jù)不同任務(wù)的分布情況,結(jié)合任務(wù)周圍的會員情況,分別提出了單個任務(wù)定價模型和打包任務(wù)的定價模型。經(jīng)檢驗(yàn)、采用這兩種定價模型的任務(wù)完成率較高,且總價格較低,具有普遍推廣的價值。
關(guān)鍵詞:自助式勞務(wù);眾包平臺;定價規(guī)則;聚類算法
中圖分類號:F23 文獻(xiàn)標(biāo)識碼:Adoi:10.19311/j.cnki.1672-3198.2020.30.049
1 背景介紹
首先以“拍照賺錢”的形式來說明自助式勞務(wù)眾包的含義?!芭恼召嶅X”是近幾年來興起的一種建立在移動互聯(lián)網(wǎng)基礎(chǔ)上的自助式服務(wù)模式。其具體模式是用戶下載APP并注冊成為的會員,通過APP領(lǐng)取需要拍照的任務(wù),并賺取APP對任務(wù)所標(biāo)定的酬金。傳統(tǒng)的市場調(diào)查需要大量的人力和物力,消耗大量成本,相比之下,移動互聯(lián)網(wǎng)下的自助式勞務(wù)眾包平臺,可以為企業(yè)提供各種商業(yè)檢查和信息搜集方式,也可以節(jié)省不少調(diào)查成本。與此同時,適當(dāng)?shù)乜s短了調(diào)查的周期,也有效地確保了調(diào)查數(shù)據(jù)的可靠性。因此,APP成為該平臺運(yùn)行的核心,而APP中的任務(wù)定價又是其核心要素,這就使得定價的合理性顯得尤為重要。如果勞務(wù)眾包定價過低,就會出現(xiàn)沒有人接單的問題,從而導(dǎo)致任務(wù)無法完成。
2 單個任務(wù)的定價模型
首先采集一批成功完成的任務(wù)的經(jīng)緯度坐標(biāo)和價格,以及其周圍的會員的信息,包括會員的經(jīng)緯度坐標(biāo)、信譽(yù)值、參考其信譽(yù)值給出的任務(wù)開始預(yù)定時間和預(yù)定限額,以便從中學(xué)習(xí)合理的定價規(guī)則。
對于每個任務(wù),需要充分利用其周圍的會員信息。因此,首先通過對不同距離范圍內(nèi)會員人數(shù)和價格的相關(guān)系數(shù)分析,得出需要考慮的距離范圍。當(dāng)距離范圍在某一固定值時,會員個數(shù)和任務(wù)價格的相關(guān)系數(shù)絕對值達(dá)到最大,也就可以把這個距離作為需要考慮的范圍半徑,利用MATLAB作圖,結(jié)果如圖1。
當(dāng)考慮距離范圍為4.5km時相關(guān)系數(shù)絕對值達(dá)到最大值0.6。因此,以4.5km為界線,為每個任務(wù)計算在這個范圍內(nèi)的會員個數(shù)、會員信譽(yù)值和、開始預(yù)訂時間和、預(yù)定限額和。對這些變量進(jìn)行標(biāo)準(zhǔn)化處理,再用多元擬合的方法得到下式:
定價=-0.929*會員個數(shù)-0.618*會員信譽(yù)值和+0.665*開始預(yù)訂時間和+0.410*預(yù)訂限額和
至此得到了這四個參數(shù)和定價的關(guān)系。但無法用它們來進(jìn)行預(yù)測,因?yàn)槎囗?xiàng)式擬合的自變量、因變量都進(jìn)行了標(biāo)準(zhǔn)化處理,無法恢復(fù)到原始值。因此,采用神經(jīng)網(wǎng)絡(luò)模型來學(xué)習(xí)四個參數(shù)和價格的關(guān)系,從而進(jìn)行預(yù)測,神經(jīng)網(wǎng)絡(luò)的基本單元神經(jīng)元的示意圖如圖2。
該神經(jīng)元是一個以x1,x2,x3及截距+1為輸入值的運(yùn)算單元,其輸出為:
hW,b(x)=f(WTx)=f(z)=f(3i=1Wixi+b)
其中函數(shù)f被稱為“激活函數(shù)”,W為權(quán)重,z為x經(jīng)過線性變換的結(jié)果。本模型選用sigmoid函數(shù)作為激活函數(shù)。
而神經(jīng)網(wǎng)絡(luò)模型就是將許多個單一神經(jīng)元聯(lián)結(jié)在一起。使用圓圈來表示神經(jīng)網(wǎng)絡(luò)的輸入,標(biāo)上“+1”的圓圈被稱為偏置節(jié)點(diǎn)。神經(jīng)網(wǎng)絡(luò)最左邊的一層叫作輸入層,最右的一層叫作輸出層。中間所有節(jié)點(diǎn)組成的一層叫作隱藏層。按如下公式得到整個神經(jīng)網(wǎng)絡(luò)的輸出:
z(2)=W(1)x+b(1)
a(2)=f(z(2))
z(3)=W(2)a(2)+b(2)
hw,b(x)=a(3)=f(z(3))
其中,上標(biāo)代表層數(shù),a為每個神經(jīng)元的輸出值。在本模型中,輸入是每個任務(wù)周圍的會員數(shù)、會員信譽(yù)值和、開始預(yù)訂時間和、預(yù)定限額和,輸出是每個任務(wù)的價格。通過訓(xùn)練神經(jīng)元的各項(xiàng)參數(shù),使得預(yù)測得到的輸出和實(shí)際價格盡可能的相近。
檢驗(yàn)訓(xùn)練得到的模型,結(jié)果如圖4、圖5所示。
可以看到,誤差主要集中在標(biāo)準(zhǔn)線附近,且確定系數(shù)R較接近1。因此可以認(rèn)為該模型能較為準(zhǔn)確的擬合數(shù)據(jù)。用訓(xùn)練好的模型為任務(wù)重新定價,并重新用四個參數(shù)多項(xiàng)式擬合新定價。發(fā)現(xiàn)新得到的參數(shù)和原參數(shù)相近,證明單個任務(wù)模型的價格制定合理,任務(wù)完成率較高。
3 打包任務(wù)的定價模型
考慮到多個任務(wù)如果位置太過密集,會發(fā)生用戶對任務(wù)進(jìn)行爭搶的現(xiàn)象,于是我們選擇將這些任務(wù)聯(lián)合在一起打包發(fā)布。如果定價足夠高,那么會員理所當(dāng)然的會選擇完成這些打包任務(wù)。但是,從企業(yè)角度出發(fā),需要盡可能的降低定價從而節(jié)約成本。因此,如何在這兩者之間取得平衡成了問題的關(guān)鍵。具體定價方法如下:
首先采用基于密度的DBSCAN空間聚類算法,將分布集中的任務(wù)打包成一類。DBSCAN是一個比較典型的基于密度的聚類算法。其聚類定義簡單地說是根據(jù)密度可達(dá)關(guān)系得到最大密度相連的樣本的集合,它可以將較高密度的區(qū)域劃分為簇,并可將任意形狀的稠密數(shù)據(jù)集進(jìn)行聚類。事實(shí)上,DBSCAN與劃分和層次聚類方法是不同的。該算法的偽代碼如下:
輸入:包含n個對象的數(shù)據(jù)庫,半徑e,最少數(shù)目MinPts。
輸出:所有生成的簇,達(dá)到密度要求。
(1)Repeat。
(2)從數(shù)據(jù)庫中選取一個沒有處理的點(diǎn)。
(3)IF選取的點(diǎn)是核心對象THEN找出所有從該點(diǎn)密度可達(dá)的對象,形成一個簇。
(4)ELSE選取的點(diǎn)是邊緣點(diǎn)(非核心對象),跳出本次循環(huán),尋找下一個點(diǎn)。
(5)UNTIL所有的點(diǎn)都被處理。
分類之后,借用重心的概念,設(shè)定每一類任務(wù)的中心。設(shè)某個打包任務(wù)里有N個任務(wù),其中心的經(jīng)緯度計算公式如下:
中心緯度=Ni=1LatitudeiN(1)
中心緯度=Ni=1LongitudeiN(2)
之后,在打包任務(wù)之外的單個任務(wù)中搜索到距離最近的N個任務(wù)J1-N,它們的價格為PJ1-N,并計算它們離重心的距離dJ1-N。而打包任務(wù)距離重心的距離為d1-N。通過查閱路費(fèi)、心理學(xué)相關(guān)的資料,我們把1km行程的成本定為兩元(1.2元的汽油費(fèi)和0.8元的時間成本)。打包任務(wù)的價格公式如下:
P打包=Ni=1PJi-(Ni=1dJi)(3)
該公式很容易理解,聚類范圍內(nèi)的會員如果舍近求遠(yuǎn),則需要花費(fèi)更多的路費(fèi)、時間成本、機(jī)會成本等。而如果會員選擇距離他較近的打包任務(wù),則成本就會小得多。假設(shè)這些成本之差大于打包任務(wù)和單個任務(wù)的價格之差,也就是會員舍近求遠(yuǎn)多賺到的錢不足以抵消他來回的成本,那么會員更愿意選擇打包的任務(wù)。
帶入實(shí)驗(yàn)數(shù)據(jù),應(yīng)用打包定價模型,得到圖6。
可見,打包后的任務(wù)價格下降明顯。同時,由于一個打包任務(wù)只能由一個用戶完成,而之前這些任務(wù)可能由很多用戶分別完成。那么這些沒有搶到打包任務(wù)的用戶很大可能去選擇別的任務(wù)去完成,這樣又進(jìn)一步提高了任務(wù)完成率。
最后,和第二節(jié)中的方法相同,我們通過觀察多項(xiàng)式擬合的系數(shù)來判別任務(wù)完成度。和已完成任務(wù)的多項(xiàng)式參數(shù)相比,四項(xiàng)系數(shù)均比較相近。即:打包任務(wù)價格的制定和已完成任務(wù)的定價規(guī)則相近,完成度較高。
4 模型的評價與推廣
本文通過學(xué)習(xí)已完成任務(wù)的定價規(guī)律,提出了兩種新的定價模型,分別是來為單個任務(wù)定價,和將多個集中的任務(wù)打包發(fā)布的定價模型。通過將兩種模型預(yù)測出的定價和實(shí)際價格作比較,證明了它們具有良好的完成率,同時節(jié)約了企業(yè)的成本。另外,對于如何將任務(wù)進(jìn)行打包,采用了聚類方法,檢驗(yàn)結(jié)果表明該模型可以成功將分布集中的任務(wù)歸到一類。
移動互聯(lián)網(wǎng)經(jīng)濟(jì)飛速發(fā)展的形勢下,自助式勞務(wù)眾包平臺逐漸增多,使得企業(yè)能夠方便快捷地進(jìn)行各種商業(yè)檢查和信息收集,大大節(jié)省了企業(yè)的調(diào)研成本。此外,共享經(jīng)濟(jì)飛速發(fā)展,拼車、拼團(tuán)等商業(yè)模式也需要類似的定價方式。因此,本文中的定價模型具有廣泛的應(yīng)用前景。
參考文獻(xiàn)
[1]劉嚴(yán).多元線性回歸的數(shù)學(xué)模型 [J ].沈陽工程學(xué)院學(xué)報:自然科學(xué)版,2005,(Z1):128-129.
[2 ]張景陽,潘光友.多元線性回歸與BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型對比與運(yùn)用研究 [J ].昆明理工大學(xué)學(xué)報(自然科學(xué)版),2013,38(6):61-67.
[3 ]周水庚,范曄,周傲英,等.基于數(shù)據(jù)取樣的DBSCAN算法 [J ].小型微型計算機(jī)系統(tǒng),2010,21(12):1270-1273.