張宇
摘要: 隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的發(fā)展,像拍照賺錢(qián)等自助式勞務(wù)空間眾包平臺(tái)變得日益盛行。該文通過(guò)給出的拍照任務(wù)數(shù)據(jù),分析得到商品的任務(wù)定價(jià)規(guī)律,找出任務(wù)未完成的原因,再通過(guò)比較原標(biāo)價(jià)方案,給項(xiàng)目設(shè)計(jì)出一個(gè)合理的任務(wù)標(biāo)價(jià)方案。
Abstract: With the development of mobile Internet technology, self-service labor crowdsourcing platforms like photo-making earn money become more and more popular. Through the given camera task data, the article analyzes the task pricing rules of goods, finds out the reason of the task is not completed, and then designs a reasonable task price plan for the project by comparing the original price plan.
關(guān)鍵詞: 拍照賺錢(qián);任務(wù)定價(jià);多元線(xiàn)性回歸;聚類(lèi)分析;0-1檢驗(yàn);二元Logistic回歸
Key words: take pictures to make money;task pricing;multiple linear regression;cluster analysis;0-1 test;binary Logistic regression
中圖分類(lèi)號(hào):F272.1;F224 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-4311(2018)19-0085-06
0 引言
“拍照賺錢(qián)”是當(dāng)下使用互聯(lián)網(wǎng)來(lái)完成指定任務(wù)從而獲得酬勞的新興服務(wù)模式,同時(shí)帶給公司與客戶(hù)之間的合作新機(jī)遇。用戶(hù)對(duì)道路兩旁街景、店鋪,或是某種商品上架的拍攝,并且成功上傳圖片,就可獲得對(duì)任務(wù)所標(biāo)定的傭金。用戶(hù)也可以承包某個(gè)區(qū)域,也就是說(shuō),這個(gè)區(qū)域的拍照任務(wù)聯(lián)合在一起拍攝,這樣也會(huì)得到已經(jīng)標(biāo)定的對(duì)應(yīng)傭金。隨著互聯(lián)網(wǎng)的普及越來(lái)越大,用戶(hù)的創(chuàng)新創(chuàng)業(yè)熱情以及能力蘊(yùn)藏著巨大能量和價(jià)值,勞務(wù)眾包平臺(tái)能大大降低調(diào)查成本,打破傳統(tǒng)企業(yè)創(chuàng)新來(lái)源的局限,在范圍內(nèi)尋求各用戶(hù)創(chuàng)意支持,增加大眾的積極性,充分運(yùn)用公眾的智慧,同時(shí)有效保證了拍照數(shù)據(jù)的真實(shí)性,縮短了拍照的調(diào)查周期。
APP對(duì)任務(wù)的合理標(biāo)價(jià)以及拍照商品的位置和會(huì)員信息等是任務(wù)完成情況的重要要素。會(huì)員離拍攝商品距離遠(yuǎn),定價(jià)不合理等,都會(huì)導(dǎo)致拍攝任務(wù)完成情況不佳,而會(huì)員的地理位置、預(yù)定任務(wù)開(kāi)始時(shí)間、預(yù)定限額、信譽(yù)值也對(duì)任務(wù)的完成情況有重要影響[1]。
“拍照賺錢(qián)”模式的發(fā)展合理有效的擴(kuò)大了電商的營(yíng)業(yè)范圍,逐漸形成了一個(gè)全新的“無(wú)形商品”電子商務(wù)運(yùn)營(yíng)模式。這種模式迅速的崛起,但是理論研究明顯落后于社會(huì)實(shí)踐要求導(dǎo)致這種眾包平臺(tái)在進(jìn)一步的發(fā)展中明顯受阻[2,3],所以建立眾包平臺(tái)的出價(jià)是一種新興的服務(wù)標(biāo)價(jià)模型,它的建立大大豐富了服務(wù)標(biāo)價(jià)理論,具有十分強(qiáng)勁的理論實(shí)踐意義。
1 指標(biāo)體系的構(gòu)建
針對(duì)真實(shí)生活場(chǎng)景,根據(jù)深圳和廣州地區(qū)某一任務(wù)的任務(wù)及會(huì)員信息(任務(wù)信息包括:任務(wù)位置(GPS)、任務(wù)標(biāo)價(jià)、任務(wù)執(zhí)行情況。會(huì)員信息包括:會(huì)員位置(GPS)、預(yù)訂任務(wù)限額、預(yù)訂任務(wù)開(kāi)始時(shí)間、信譽(yù)值)探討影響“拍照賺錢(qián)”任務(wù)定價(jià)的因素,給出從區(qū)域位置問(wèn)題、用戶(hù)收益問(wèn)題、人力問(wèn)題三個(gè)維度探討拍照任務(wù)定價(jià)因素。
1.1 潛在價(jià)格影響因素分析[4]
對(duì)眾包平臺(tái)軟件任務(wù)進(jìn)行分析,從區(qū)域位置問(wèn)題、收益問(wèn)題、人力問(wèn)題三個(gè)維度提出5個(gè)可能影響軟件眾包價(jià)格因素的潛在因素。各個(gè)因素的度量方法及統(tǒng)計(jì)描述屬性如圖1所示。
1.2 聚類(lèi)分析
對(duì)樣品和指標(biāo)(變量)進(jìn)行分類(lèi)主要采用聚類(lèi)分析法,而求取樣品以及類(lèi)之間的距離有多種方法,其中主要使用歐式距離和最短距離法。
1.2.1 數(shù)據(jù)標(biāo)準(zhǔn)化
由于所選數(shù)據(jù)的量綱和數(shù)值大小都不一致,數(shù)值的變化范圍也不同,因此必須首先對(duì)所選數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,如果有n個(gè)樣本,n個(gè)樣本有m個(gè)指標(biāo),且每個(gè)變量可表示為xij,均值為
1.2.2 聚類(lèi)
距離:對(duì)樣品進(jìn)行聚類(lèi)時(shí),“靠近”往往由某種距離來(lái)刻畫(huà)。若每個(gè)樣品有p個(gè)指標(biāo),故每個(gè)樣品可以看成p維空間中的一個(gè)點(diǎn), n個(gè)樣品就組成p維空間中的n個(gè)點(diǎn),樣品與指標(biāo)構(gòu)成一個(gè)矩陣,此時(shí)就可以用距離來(lái)度量樣品之間的接近程度。
令xij表示第i個(gè)樣品的第j個(gè)指標(biāo), dij表示第i個(gè)樣品與第j個(gè)樣品之間的距離,最常見(jiàn)最直觀(guān)的計(jì)算距離的方法是:
當(dāng)各變量的測(cè)量值相差懸殊時(shí),為了計(jì)算的準(zhǔn)確性,需先將數(shù)據(jù)標(biāo)準(zhǔn)化,然后用標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行計(jì)算。
根據(jù)K-means聚類(lèi),對(duì)會(huì)員的位置信息(GPS)進(jìn)行聚類(lèi),得到6個(gè)聚類(lèi)中心的位置以及6個(gè)類(lèi)別的會(huì)員數(shù)量及位置,如表1。
1.3 相關(guān)性分析
相關(guān)分析是描述兩個(gè)變量間關(guān)系的密切程度,主要由相關(guān)系數(shù)值表示,當(dāng)相關(guān)系數(shù)r的絕對(duì)值越接近于1,則表示兩個(gè)變量間的相關(guān)性越顯著。雙變量系數(shù)測(cè)量的主要指標(biāo)有卡方類(lèi)測(cè)量、Spearman相關(guān)系數(shù)、Pearson相關(guān)系數(shù)等,由于項(xiàng)目任務(wù)的經(jīng)緯度數(shù)據(jù)為定距數(shù)據(jù),則在進(jìn)行兩者間的相關(guān)性檢驗(yàn)時(shí)用其中t統(tǒng)計(jì)量服從n-2個(gè)自由度的t分布。
軟件眾包任務(wù)標(biāo)價(jià)與各潛在因素之間的Pearson相關(guān)性分析計(jì)算結(jié)果詳見(jiàn)表2。在0.05的顯著性水平下,與軟件眾包任務(wù)標(biāo)價(jià)顯著相關(guān)的因素包括:任務(wù)距用戶(hù)距離x1、用戶(hù)密度x2、用戶(hù)平均信譽(yù)值x3、任務(wù)之間距離x4。
1.4 多元線(xiàn)性回歸模型
多元回歸分析是研究多個(gè)變量之間關(guān)系的回歸分析方法,確定變量之間數(shù)量的可能形式,并用數(shù)學(xué)模型表示如下:
式中b0為截?fù)?jù);b1,…,bk為偏回歸系數(shù);?著為殘差;
其中多元模型的矩陣表達(dá)式:
根據(jù)R方值的大小,可判斷出多元線(xiàn)性回歸方程的契合度,觀(guān)察模型后退5次得到R方值與標(biāo)準(zhǔn)估計(jì)的誤差,R2=0.715,可知方程的吻合性較高。
考慮到與軟件眾包標(biāo)價(jià)顯著相關(guān)的因素間有可能出現(xiàn)彼此相關(guān),即因素間不獨(dú)立的情況,如果直接使用這些因素建立多元回歸模型,模型中將出現(xiàn)多重共線(xiàn)性,造成回歸結(jié)果混亂。為了消除多重共線(xiàn)性對(duì)分析結(jié)果的干擾,我們采用具有最優(yōu)變量篩選效果的逐步回歸方法建立分析模型,不停地增加變量并考慮剔除之前的變量的可能性,直至增加變量已經(jīng)不能導(dǎo)致模型的殘差平方和顯著減少(F統(tǒng)計(jì)量檢驗(yàn)不通過(guò))或增加任一變量,該變量對(duì)標(biāo)價(jià)的影響均不顯著(t統(tǒng)計(jì)量檢驗(yàn)不通過(guò))。逐步回歸不僅使模型變得簡(jiǎn)單,還使自變量對(duì)因變量的影響清晰地展現(xiàn)出來(lái),結(jié)果更可信,也更容易解釋。使用逐步回歸方法建立軟件眾包標(biāo)價(jià)分析模型的過(guò)程中自變量逐個(gè)引入,邊引入邊檢查有沒(méi)有可能剔除某個(gè)變量。
建立模型,要對(duì)模型進(jìn)行擬合度檢驗(yàn),回歸方程的顯著性檢驗(yàn)就是檢驗(yàn)樣本回歸方程的變量的線(xiàn)性關(guān)系是否顯著,即能否根據(jù)樣本來(lái)推斷總體回歸方程中的多個(gè)回歸系數(shù)中至少有一個(gè)不等于0,主要是說(shuō)明樣本回歸方程R2的顯著性。檢驗(yàn)的方法用方差分析,這時(shí)因變量Y的總體變異系本分解為回歸平方和與誤差平方和,即表示為:
根據(jù)相關(guān)性的分析,任務(wù)標(biāo)價(jià)與任務(wù)距用戶(hù)距離、用戶(hù)密度、用戶(hù)平均信譽(yù)值、任務(wù)之間距離中相關(guān)性較大的幾項(xiàng),用SPSS分析多元線(xiàn)性回歸,得出線(xiàn)性關(guān)系的擬合方程。
根據(jù)表4中R方值的大小,可判斷出多元線(xiàn)性回歸方程的契合度,觀(guān)察模型后退4次得到R方值與標(biāo)準(zhǔn)估計(jì)的誤差,R2=0.604,可知方程的吻合性較高。最后由表5得到任務(wù)標(biāo)價(jià)與任務(wù)距用戶(hù)距離、用戶(hù)密度、用戶(hù)平均信譽(yù)值、任務(wù)之間距離的回歸方程為:
對(duì)m個(gè)任務(wù)價(jià)格的實(shí)際值和預(yù)測(cè)值比較后,得出β值,則認(rèn)為在置信水平β下,任務(wù)的實(shí)際價(jià)格與預(yù)測(cè)價(jià)格不存在顯著性差異。
分析表5的結(jié)果,可以知道,對(duì)于未完成的任務(wù)來(lái)說(shuō),313個(gè)評(píng)分檢驗(yàn)中,有78.6%的評(píng)價(jià)結(jié)果中,預(yù)測(cè)價(jià)格高于實(shí)際價(jià)格(置信水平為95%),說(shuō)明實(shí)際價(jià)格偏低,導(dǎo)致任務(wù)未完成。這樣的結(jié)果,符合之前實(shí)際情況,說(shuō)明模型可行性較強(qiáng)。
1.6 未完成原因的分析
根據(jù)模型以及圖2的分析,任務(wù)未完成主要是由于:①對(duì)比任務(wù)完成點(diǎn)距離用戶(hù)與未完成點(diǎn)的距離,可以得到未完成任務(wù)點(diǎn)距用戶(hù)的距離較已完成點(diǎn)偏遠(yuǎn),可能是由于用戶(hù)往往不太愿意前往距離遠(yuǎn)的地區(qū);②用戶(hù)密度高的區(qū)域相比低密度區(qū)域任務(wù)完成情況較好,大多因?yàn)橥粋€(gè)任務(wù)點(diǎn)被多個(gè)用戶(hù)共同預(yù)定,大大提高了該點(diǎn)任務(wù)的完成度;③用戶(hù)信譽(yù)值較高的區(qū)域任務(wù)完成度普遍較好,良好的用戶(hù)信譽(yù)值保障了該點(diǎn)的任務(wù)即使被用戶(hù)接單而不違約,則任務(wù)完成情況有所提高;④任務(wù)之間距離過(guò)大的區(qū)域相比任務(wù)間距密集區(qū)的用戶(hù)接單情況鮮有問(wèn)津,故完成度不高,往往是用戶(hù)會(huì)因?yàn)橥瓿善渲幸稽c(diǎn)任務(wù)而難以繼續(xù)完成另一點(diǎn)任務(wù),或者是兩點(diǎn)任務(wù)都難以完成,最終放棄這兩點(diǎn)的任務(wù),棄單也會(huì)導(dǎo)致任務(wù)未完成。同時(shí),不同地區(qū)的GDP值,地區(qū)之間的地形差異,交通發(fā)達(dá)情況,高程情況都有可能導(dǎo)致任務(wù)未完成。
2 優(yōu)化定價(jià)模型
2.1 選取影響因素的原則
完備性、客觀(guān)及可操作性原則。影響因素體系作為一個(gè)完整體系,可以從不同的方面反映任務(wù)定價(jià)不同,也可以反映整個(gè)任務(wù)定價(jià)的實(shí)時(shí)變化,保證回歸結(jié)果的客觀(guān)準(zhǔn)確性,體現(xiàn)不同影響因素對(duì)APP拍照賺錢(qián)任務(wù)定價(jià)的影響。影響因素體系的建立需要保證在實(shí)際的運(yùn)用中能夠體現(xiàn)其價(jià)值所在,所以選取每個(gè)因素都必須具有可操作性,從而使得整個(gè)影響因素體系簡(jiǎn)明,易操作有實(shí)際應(yīng)用功能。
映射原則。有時(shí)評(píng)價(jià)任務(wù)定價(jià)的某個(gè)目標(biāo)時(shí),很難找到直接反映該問(wèn)題的指標(biāo),這時(shí)我們可以從目標(biāo)實(shí)現(xiàn)所需要的某些現(xiàn)象進(jìn)行相關(guān)的映射提煉,即哪些現(xiàn)象可以反映我們所需的目標(biāo)的變化情況。
2.2 選取過(guò)程
影響因素的選取是一個(gè)抽象具體事物和反復(fù)錘煉的邏輯思維判斷過(guò)程。在尋求新的任務(wù)定價(jià)時(shí),任務(wù)和會(huì)員地理位置、會(huì)員信息、實(shí)際地域的交通、經(jīng)濟(jì)、地形差異等都會(huì)影響到對(duì)任務(wù)的定價(jià)影響,這就需要我們對(duì)復(fù)雜的指標(biāo)進(jìn)行精確的篩選。
根據(jù)指標(biāo)的選取原則,構(gòu)建的影響因素體系如圖3所示。
根據(jù)圖3,我們可以看出,為了構(gòu)建合理實(shí)際的任務(wù)定價(jià)因素體系,我們選取了八個(gè)影響因素,分別為:任務(wù)距用戶(hù)距離,單位區(qū)域用戶(hù)密度,用戶(hù)平均信譽(yù)值,任務(wù)之間相隔距離,區(qū)域的GDP總值,任務(wù)點(diǎn)附近的城市道路網(wǎng)密度,會(huì)員搶單時(shí)間,任務(wù)點(diǎn)附近的用戶(hù)限額總量。
2.3 相關(guān)性分析
雙變量系數(shù)主要測(cè)量指標(biāo)有很多,Pearson相關(guān)數(shù)據(jù)適用于聯(lián)合分布為二維正態(tài)分布的兩個(gè)隨機(jī)變量,Spearman相關(guān)系數(shù)對(duì)變量分布沒(méi)有要求。項(xiàng)目任務(wù)的各個(gè)數(shù)據(jù)的潛在因素與參與度的聯(lián)合分布不一定滿(mǎn)足正態(tài)分布,因此檢驗(yàn)時(shí)使用Spearman相關(guān)系數(shù)度量各潛在因素與參與度之間的相關(guān)性。Spearman相關(guān)系數(shù)計(jì)算時(shí)需先對(duì)數(shù)據(jù)排秩,其計(jì)算公式為:
其中t檢驗(yàn)服從自由度為n-2的t分布??紤]到與軟件眾包標(biāo)價(jià)顯著相關(guān)的因素間有可能。
2.4 影響因素的分析處理
2.4.1 定性分析
定性分析,是指依據(jù)現(xiàn)實(shí)驗(yàn)和主、客觀(guān)分析方法,對(duì)于某種事物的本質(zhì)屬性、發(fā)展趨勢(shì)或多種事物之間的相關(guān)關(guān)系給予直觀(guān)、概括性表述的一種分析方法。結(jié)合問(wèn)題一,八個(gè)因素對(duì)任務(wù)定價(jià)都有一定影響。任務(wù)距用戶(hù)距離越近,用戶(hù)越有可能接單;單位區(qū)域用戶(hù)密度高,則接單的用戶(hù)也會(huì)增多;較高的會(huì)員信譽(yù)值大大保證了接單用戶(hù)會(huì)及時(shí)完成接單任務(wù);任務(wù)之間相隔距離遠(yuǎn)會(huì)降低用戶(hù)接單興致,可能使得任務(wù)流單;區(qū)域的GDP總值可以間接表明該區(qū)域中的用戶(hù)數(shù)量,用戶(hù)接單執(zhí)行情況等信息;任務(wù)點(diǎn)附近的城市道路網(wǎng)密度越大,該區(qū)域用戶(hù)接單并完成越方便,可以加強(qiáng)該區(qū)域用戶(hù)的接單率;會(huì)員較早的搶單,則會(huì)更早的選擇較有利的任務(wù)位置,將接單情況將更好;任務(wù)點(diǎn)附近的用戶(hù)限額如果偏低,將抑制該區(qū)域任務(wù)接單并完成水平,說(shuō)明較高的用戶(hù)限額是有利的。
2.4.2 定量分析
①區(qū)域的GDP總值。把各個(gè)任務(wù)點(diǎn)的地理位置導(dǎo)入google地圖,利用智能交互軟件定位出每個(gè)位置所屬于的城市及區(qū)域,采集題中所給任務(wù)點(diǎn)經(jīng)緯度數(shù)據(jù),全都對(duì)應(yīng)落在了廣東省深圳市的南山區(qū)、寶安區(qū)、鹽田區(qū)、福田區(qū)、羅湖區(qū)、龍崗區(qū),和廣東省廣州市天河區(qū)、增城區(qū)、黃埔區(qū)、蘿崗區(qū)、番禺區(qū)、海珠區(qū)、白云區(qū)、荔灣區(qū)、南沙區(qū)、越秀區(qū)、花都區(qū)、從化區(qū),以及東莞市、佛山市、清遠(yuǎn)市和惠州市之中。收集這些行政區(qū)域2016年的GDP總量數(shù)據(jù)資料[6,7],并對(duì)任務(wù)點(diǎn)的位置與GDP數(shù)據(jù)一一配對(duì)組合。
②任務(wù)點(diǎn)附近的城市道路網(wǎng)密度。是指任一任務(wù)點(diǎn)周?chē)欢娣e下依道路網(wǎng)內(nèi)的道路中心線(xiàn)長(zhǎng)度與依道路網(wǎng)所服務(wù)的用地面積之比,利用Python編程,結(jié)合google智能交互軟件對(duì)每一任務(wù)點(diǎn),及任務(wù)點(diǎn)周邊道路長(zhǎng)度和用地面積的精確定位,任務(wù)標(biāo)價(jià)低區(qū)對(duì)應(yīng)著交通密集區(qū),把計(jì)算得出的每一個(gè)任務(wù)點(diǎn)道路網(wǎng)密度與該點(diǎn)位置一一匹配組合。
③會(huì)員搶單時(shí)間。定義為在一定區(qū)域范圍內(nèi)所有會(huì)員訂單搶單時(shí)間的平均值與這個(gè)區(qū)域內(nèi)任一一點(diǎn)的搶單時(shí)間的差值,先把所有搶單時(shí)間的單位轉(zhuǎn)化為“天”,利用Python分析計(jì)算得到每一任務(wù)點(diǎn)的會(huì)員搶單時(shí)間,再與該點(diǎn)經(jīng)緯度位置一一組合。
④任務(wù)點(diǎn)附近的用戶(hù)限額總量。在一定區(qū)域范圍內(nèi)所有會(huì)員訂單限額之和。
2.4.3 二元Logistic回歸模型
Logistic回歸屬于概率型非線(xiàn)性回歸,它是研究二分類(lèi)觀(guān)察結(jié)果與一些影響因素之間關(guān)系的一種多變量分析方法。例如,在流行病學(xué)研究中,經(jīng)常需要分析疾病與各危險(xiǎn)因素之間的定量關(guān)系,為了正確說(shuō)明關(guān)系,需要排除一些混雜因素的影響。對(duì)于線(xiàn)性回歸分析,由于應(yīng)變量Y是一個(gè)二值變量(通常取值1或0),不滿(mǎn)足應(yīng)用條件,尤其當(dāng)各因素都處于低水平或高水平時(shí),預(yù)測(cè)值Y值可能超出0~1范圍,出現(xiàn)不合理都現(xiàn)象。用Logistic回歸分析則可以較好的解決上述問(wèn)題。Logistic回歸模型的基本形式如下:
因此,對(duì)因變量P按照l(shuí)n(P/(1-P))的形式進(jìn)行對(duì)數(shù)變換,可以將Logistic回歸問(wèn)題轉(zhuǎn)化為線(xiàn)性回歸問(wèn)題,在按照多元線(xiàn)性回歸的方法求解回歸參數(shù)。對(duì)于P取值只有0和1的情況,在實(shí)際中不是直接對(duì)P進(jìn)行回歸,而是先定義一個(gè)單調(diào)連續(xù)的概率函數(shù)π:
然后只需要對(duì)原始數(shù)據(jù)進(jìn)行合理的映射處理,就可以用線(xiàn)性回歸方法得到回歸系數(shù),最后再根據(jù)π和P的映射關(guān)系進(jìn)行反映射得到P的值。
2.5 模型的求解
2.5.1 數(shù)據(jù)計(jì)算
根據(jù)公式任務(wù)點(diǎn)附近的城市道路網(wǎng)密度?籽=l/S
其中,L為路網(wǎng)內(nèi)道路總長(zhǎng)度;S為路網(wǎng)所服務(wù)的用地面積
其中,in為在一定區(qū)域范圍內(nèi)某一個(gè)會(huì)員的訂單限額。
2.5.2 相關(guān)性分析
通過(guò)Matlab計(jì)算得到各個(gè)影響因素的值。軟件眾包任務(wù)標(biāo)價(jià)與各潛在因素之間的Spearman相關(guān)性分析計(jì)算結(jié)果詳見(jiàn)表6。在0.05的顯著性水平下,與軟件眾包任務(wù)標(biāo)價(jià)顯著相關(guān)的因素包括:任務(wù)距用戶(hù)距離x1、用戶(hù)密度x2、用戶(hù)平均信譽(yù)值x3、任務(wù)之間距離x4、區(qū)域的GDP總值x5、任務(wù)點(diǎn)附近的城市道路網(wǎng)密度x6、會(huì)員搶單時(shí)間x7、任務(wù)點(diǎn)附近的用戶(hù)限額總量x8。
從任務(wù)標(biāo)價(jià)分析與任務(wù)限額總量因素的相關(guān)系分析,得出與搶單時(shí)間、路網(wǎng)密度、任務(wù)地區(qū)GDP相關(guān)性較為顯著,任務(wù)限額總量與任務(wù)標(biāo)價(jià)的相關(guān)性r=0.056>0.05,所以任務(wù)限額總量與任務(wù)標(biāo)價(jià)關(guān)系顯著性較差,將任務(wù)限額總量因素剔除。
根據(jù)表7中R方值的大小,可判斷出多元線(xiàn)性回歸方程的契合度,觀(guān)察模型后退4次得到R方值與標(biāo)準(zhǔn)估計(jì)的誤差,R2=0.537,可知方程的吻合性較高。結(jié)合問(wèn)題一,最后得到任務(wù)標(biāo)價(jià)與任務(wù)距用戶(hù)距離x1、用戶(hù)密度x2、用戶(hù)平均信譽(yù)值x3、任務(wù)之間距離x4、區(qū)域的GDP總值x5、任務(wù)點(diǎn)附近的城市道路網(wǎng)密度x6、會(huì)員搶單時(shí)間x7的回歸方程為:
2.5.3 Logistic回歸
先驗(yàn)數(shù)據(jù)的處理:
首先將附件一中的任務(wù)完成情況作為歷史完成情況來(lái)分析,根據(jù)合理推斷,在任務(wù)點(diǎn)歷史情況中處于完成情況下,如果設(shè)計(jì)的新定價(jià)比任務(wù)歷史價(jià)格高,那么該點(diǎn)實(shí)際情況一定也是完成。同理,也可以推斷出,在歷史情況中任務(wù)處于未完成情況下,如果任務(wù)點(diǎn)的新定價(jià)比歷史價(jià)格低,那么該點(diǎn)實(shí)際情況一定也是未完成。根據(jù)這種推理,我們將新的定價(jià)方案價(jià)格和附件價(jià)格對(duì)比,根據(jù)附件數(shù)據(jù)的完成情況分析得到了404組先驗(yàn)數(shù)據(jù)。接下來(lái)我們利用SPSS軟件以任務(wù)完成情況作為因變量、定價(jià)影響因素作為自變量建立二元Logistic回歸模型,根據(jù)404組先驗(yàn)數(shù)據(jù),預(yù)測(cè)得到剩下的423組數(shù)據(jù),最后綜合先驗(yàn)數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)發(fā)現(xiàn)新定價(jià)方案任務(wù)完成率(完成的任務(wù)個(gè)數(shù)占總?cè)蝿?wù)個(gè)數(shù)的比例)相比原方案提升了6.47%。
根據(jù)模型與原方案的對(duì)比,新任務(wù)定價(jià)方案考慮了:增加區(qū)域的GDP總值因素,相比之前更加精確的表明了該區(qū)域中的用戶(hù)數(shù)量,用戶(hù)接單執(zhí)行情況等信息;如果任務(wù)點(diǎn)附近的城市道路網(wǎng)密度增大,則該區(qū)域用戶(hù)更容易接單,更想接單;會(huì)員越早搶單則會(huì)越早的選擇較有利的任務(wù)位置,搶單時(shí)間一個(gè)重要影響因素;任務(wù)點(diǎn)附近的用戶(hù)對(duì)預(yù)定任務(wù)的限額也會(huì)影響任務(wù)定價(jià),說(shuō)明較高的用戶(hù)限額量有利。
3 模型的推廣
移動(dòng)互聯(lián)網(wǎng)的自助式勞務(wù)眾包平臺(tái)是目前基于“互聯(lián)網(wǎng)+”平臺(tái)的O2O(offlinc-to-online)經(jīng)營(yíng)模式,因此該平臺(tái)在市場(chǎng)上具有廣泛的應(yīng)用前景。此定價(jià)模型可以廣泛應(yīng)用于社會(huì)經(jīng)濟(jì)的各個(gè)領(lǐng)域內(nèi),不僅適用于分析不同位置APP定價(jià)高低程度,還可推廣運(yùn)用于出租車(chē)資源的“供求匹配”模型,以及國(guó)際油價(jià)行走趨勢(shì)研究等定價(jià)用戶(hù)需求關(guān)系的情況中。
參考文獻(xiàn):
[1]劉曉鋼.眾包中任務(wù)發(fā)布者出價(jià)行為的影響因素研究[D].重慶大學(xué),2012.
[2]高銘,王毅.眾包項(xiàng)目風(fēng)險(xiǎn)評(píng)估模型研究[J].管理現(xiàn)代化,2016(03):105-107.
[3]孫信昕.眾包環(huán)境下的任務(wù)分配技術(shù)研究[D].揚(yáng)州大學(xué),2016.
[4]安思錦,翟健.軟件眾包參與度影響因素分析及預(yù)測(cè)模型[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2015(10):9-16.