亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        軟件眾包的實(shí)例研究

        2018-08-07 08:05:48馬悅張楠
        科教導(dǎo)刊 2018年12期
        關(guān)鍵詞:數(shù)據(jù)挖掘

        馬悅 張楠

        摘 要 軟件眾包平臺(tái),這種基于移動(dòng)互聯(lián)網(wǎng)的自助式勞務(wù)眾包平臺(tái)不僅能夠快速為企業(yè)提供各種商業(yè)檢查和真實(shí)有效的信息搜集,還能夠?yàn)橛脩魩?lái)可觀收益。平臺(tái)的良性運(yùn)轉(zhuǎn)取決于平臺(tái)兩端企業(yè)和用戶,且企業(yè)與用戶無(wú)法直接溝通,因此只能依靠平臺(tái)對(duì)任務(wù)發(fā)布規(guī)則和任務(wù)標(biāo)價(jià)去促成雙方最大程度的滿意。依據(jù)已結(jié)束項(xiàng)目的數(shù)據(jù)聚集位置在地圖上的呈現(xiàn),市與市之間因?yàn)榈匦?、河流不同?dǎo)致城市規(guī)劃的區(qū)別,這也就導(dǎo)致了不同市之間定價(jià)的函數(shù)類型一致,但具體的函數(shù)卻不盡相同。除了位置與距離,更應(yīng)結(jié)合生活狀況考慮到會(huì)員分布、城市規(guī)劃、人口流量、經(jīng)濟(jì)發(fā)展能力這些客觀因素對(duì)定價(jià)的影響。在只有已結(jié)束項(xiàng)目完成情況做數(shù)據(jù)挖掘的情況下,第一代定價(jià)模型只能在任務(wù)經(jīng)緯度和任務(wù)標(biāo)價(jià)這三者之間進(jìn)行發(fā)掘。

        關(guān)鍵詞 軟件眾包 分區(qū)定價(jià) 數(shù)據(jù)挖掘 K-means聚類

        中圖分類號(hào):F270 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.16400/j.cnki.kjdkx.2018.04.030

        Software Crowdsourcing Case Study

        MA Yue, ZHANG Nan

        (College of Science, Yanbian University, Yanji, Jilin 133000)

        Abstract The software crowdsourcing platform, which is a self-service labor-based crowdsourcing platform based on mobile Internet, can not only provide enterprises with various business inspections and real and effective information collection, but also can bring considerable benefits to users. The benign operation of the platform depends on the enterprises and users at the two ends of the platform and the enterprises and users cannot directly communicate with each other. Therefore, the platform can only rely on the task publishing rules and the task price to promote the maximum satisfaction of both parties. According to the presentation of the data aggregation location of the completed project on the map, the difference between the city and the city due to different terrain and rivers leads to the difference in city planning, which leads to the same type of function of pricing among different cities, but the specific function is not exactly. In addition to location and distance, the influence of objective factors such as membership distribution, urban planning, population flow, and economic development capacity on pricing should be taken into account in conjunction with the living conditions. In the case of data mining only when the completion of the project has been completed, the first-generation pricing model can only be excavated between the task latitude and longitude and the task price.

        Keywords software crowdsourcing; partition pricing; data mining; K-means clustering

        0 引言

        “拍照賺錢”是時(shí)下非?;馃岬囊环N自助式服務(wù)模式,這種基于移動(dòng)互聯(lián)網(wǎng)的自助式勞務(wù)眾包平臺(tái)不僅能夠快速為企業(yè)提供各種商業(yè)檢查和真實(shí)有效的信息搜集,還能夠?yàn)橛脩魩?lái)可觀收益。用戶通過(guò)下載APP,注冊(cè)成為會(huì)員,便可以領(lǐng)取拍照任務(wù),上傳任務(wù)照片后賺取相應(yīng)酬金?!芭恼召嶅X”APP的核心要素是任務(wù)定價(jià)。如果定價(jià)過(guò)低,用戶完成任務(wù)所獲得的“利潤(rùn)”不能滿足預(yù)期,就會(huì)導(dǎo)致有些任務(wù)無(wú)法完成;如果定價(jià)過(guò)高,企業(yè)和APP平臺(tái)的利益無(wú)法得到最大的保障,因此要綜合考慮任務(wù)區(qū)域的經(jīng)濟(jì)狀況、任務(wù)的位置、會(huì)員的位置、會(huì)員的人數(shù)、信譽(yù)度等因素以確保三方的利益都能夠得到滿足。

        1 問(wèn)題及分析

        圖1(部分?jǐn)?shù)據(jù))是一個(gè)已結(jié)束項(xiàng)目的任務(wù)數(shù)據(jù),包含了每個(gè)任務(wù)的位置、定價(jià)和完成情況(“1”表示完成,“0”表示未完成);研究圖1中項(xiàng)目的任務(wù)定價(jià)規(guī)律,分析任務(wù)未完成的原因。

        圖1

        問(wèn)題要求研究圖1數(shù)據(jù)信息得出任務(wù)的定價(jià)模型的同時(shí)分析任務(wù)未完成的原因,基于大量任務(wù)的經(jīng)緯度信息,采用GEOQ軟件進(jìn)行任務(wù)的地點(diǎn)標(biāo)示,并通過(guò)數(shù)據(jù)挖掘去深度挖掘任務(wù)地點(diǎn)與任務(wù)標(biāo)價(jià)的關(guān)系,從而建立定價(jià)模型。

        發(fā)掘前對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,去掉噪聲數(shù)據(jù),而后按區(qū)分類進(jìn)一步對(duì)數(shù)據(jù)進(jìn)行篩選,以得到盡可能準(zhǔn)確的定價(jià)模型。每區(qū)的任務(wù)聚集分布很集中,且有些定價(jià)的分布呈現(xiàn)一定的環(huán)帶狀沿城市道路分布,因此通過(guò)K-means聚類找到每一區(qū)的中心點(diǎn),按照任務(wù)地與聚類中心的距離與任務(wù)定價(jià)來(lái)擬合曲線,進(jìn)而得到定價(jià)模型。

        首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,去掉噪聲數(shù)據(jù)后顯示大部分任務(wù)發(fā)布在廣東省的深圳市、廣州市、東莞市以及佛山市四市。再將篩選后的數(shù)據(jù)導(dǎo)入GEOQ,以定價(jià)為區(qū)分標(biāo)準(zhǔn)做出任務(wù)定價(jià)分布圖。經(jīng)分析,在對(duì)一些數(shù)據(jù)進(jìn)行模糊處理的情況下,可以將任務(wù)定價(jià)模式看做是四個(gè)同心環(huán)且四個(gè)環(huán)的大小不一致。四個(gè)環(huán)心的位置大致居于四市中心,因此可以將任務(wù)分為四類,每類任務(wù)的具體定價(jià)函數(shù)都不相同。理想情況是以四市的邊界線作為劃分任務(wù)類別的標(biāo)準(zhǔn),但考慮到環(huán)心的形狀以及操作的便捷性,將四市的邊界理想化,結(jié)合網(wǎng)上查詢獲得市區(qū)大致的經(jīng)緯度范圍劃分為四個(gè)矩形區(qū)。將任務(wù)進(jìn)行分類,篩除不屬于四個(gè)區(qū)的任務(wù),對(duì)四個(gè)區(qū)的任務(wù)定價(jià)規(guī)律分別建立數(shù)據(jù)模型。

        以一區(qū)為例,一區(qū)是廣州市的理想化矩形,對(duì)一區(qū)內(nèi)任務(wù)進(jìn)行經(jīng)緯度的二維K-means聚類,將得到的位置視為一區(qū)的任務(wù)中心,根據(jù)一區(qū)內(nèi)各個(gè)任務(wù)距任務(wù)中心的距離(為便于計(jì)數(shù)方便,距離值統(tǒng)一采用歐式距離的平方值)及該距離對(duì)應(yīng)的任務(wù)定價(jià),進(jìn)行二維k-means聚類分析得到22個(gè)分段點(diǎn),通過(guò)分段點(diǎn)與任務(wù)定價(jià)兩者進(jìn)行擬合獲取該區(qū)的任務(wù)定價(jià)模型。其他三區(qū)的任務(wù)定價(jià)模型與一區(qū)獲得方式一致。

        模型假設(shè):假設(shè)每一區(qū)有一個(gè)聚類中心、假設(shè)廣州、深圳、東莞、佛山等市囊括了所有定價(jià)標(biāo)準(zhǔn)的任務(wù)、假設(shè)可將廣州、深圳、東莞、佛山四市的邊界理想化為矩形。

        符號(hào)說(shuō)明:

        x 表示任務(wù)地點(diǎn)與中心位置的歐式距離的平方

        y 表示任務(wù)的標(biāo)價(jià)

        2 模型建立與求解

        項(xiàng)目定價(jià)規(guī)律:針對(duì)圖1中的數(shù)據(jù),首先進(jìn)行預(yù)處理去除噪聲數(shù)據(jù),根據(jù)構(gòu)造的任務(wù)分布圖將整個(gè)任務(wù)區(qū)域劃分為以四個(gè)市為主要區(qū)域的一區(qū)、二區(qū)、三區(qū)、四區(qū)。對(duì)每一區(qū)進(jìn)行經(jīng)緯度的二維K-means聚類(k=1),直接得到該區(qū)的任務(wù)中心坐標(biāo),因?yàn)槊總€(gè)區(qū)的定價(jià)模型都以自身所在區(qū)的中心位置和該區(qū)任務(wù)到中心位置的歐式距離有關(guān),因此每一區(qū)的定價(jià)模型都不一致。每區(qū)的經(jīng)緯度范圍及中心位置具體坐標(biāo)見(jiàn)表1。

        x=(a-c)2+(b-d)2

        調(diào)用編寫的MATLAB函數(shù)[s]=distance(B,C,n),其中B是表示某區(qū)的所有任務(wù)地的經(jīng)緯度及相應(yīng)定價(jià)的三維矩陣,C是該區(qū)的中心位置,n則表示B矩陣的行數(shù),函數(shù)返回值是每一個(gè)任務(wù)到中心位置的距離x及對(duì)應(yīng)定價(jià)的大小為n*2的矩陣s。因?yàn)閮r(jià)格有23個(gè)標(biāo)準(zhǔn),因此對(duì)矩陣s進(jìn)行二維k-means聚類(k=22)分析得到22個(gè)分段點(diǎn),對(duì)聚類得到的22對(duì)距離與定價(jià)的數(shù)據(jù)進(jìn)行擬合,從而得到任務(wù)定價(jià)模型如下:

        將信息導(dǎo)入GEOQ系統(tǒng),觀察發(fā)現(xiàn)在一區(qū)(廣州市)任務(wù)完成率為50%左右,二區(qū)(東莞區(qū))任務(wù)完成率可視為100%, 三區(qū)(深圳市)任務(wù)完成率大約為0,而四區(qū)(佛山市)任務(wù)完成率小于50%。

        將一區(qū)放大并結(jié)合該區(qū)城市規(guī)劃進(jìn)行具體分析。未完成任務(wù)主要聚集在該區(qū)的右上角,而此地的主要規(guī)劃為生態(tài)公園、森林公園、郊野公園等生態(tài)旅游區(qū)域以及高速干線,再結(jié)合該區(qū)的人口分布和人口流量圖可知,該區(qū)域的人口流量雖大,但是常駐人口很少,該區(qū)域的會(huì)員數(shù)也較少。因此,對(duì)于大多數(shù)會(huì)員來(lái)說(shuō),完成該區(qū)域任務(wù)的利益遠(yuǎn)遠(yuǎn)小于完成一區(qū)左下角商業(yè)區(qū)和住宅區(qū),所以該區(qū)右上角的任務(wù)執(zhí)行情況很差,而左下角執(zhí)行情況良好。

        二區(qū)城市規(guī)劃錯(cuò)落有致,沒(méi)有集群現(xiàn)象,任務(wù)分布較為均勻,任務(wù)地點(diǎn)可接受范圍內(nèi)都有會(huì)員的分布,且該區(qū)域的交通發(fā)達(dá),因此任務(wù)定價(jià)對(duì)會(huì)員的影響不大,該區(qū)的任務(wù)執(zhí)行情況最好。

        三區(qū)毗鄰香港地處珠江三角洲,且是中國(guó)改革開(kāi)放建立的第一個(gè)經(jīng)濟(jì)特區(qū),故而消費(fèi)水平與經(jīng)濟(jì)發(fā)展能力較高。且深圳市是熱門的旅游城市,區(qū)內(nèi)大多數(shù)地方為風(fēng)景區(qū),且人口數(shù)量少,會(huì)員聚群分布。三區(qū)具體任務(wù)執(zhí)行情況與城區(qū)規(guī)劃和城市經(jīng)濟(jì)發(fā)展的交叉圖。除左下角的南山區(qū)之外,會(huì)員聚集分布在繁華地帶,可以得知會(huì)員的經(jīng)濟(jì)水平較高,任務(wù)定價(jià)的標(biāo)準(zhǔn)小于這些會(huì)員的期望,因此完成情況很差。而南山區(qū)是深圳市的高新技術(shù)產(chǎn)業(yè)基地、高等教育基地等,此處社會(huì)階層復(fù)雜,存在對(duì)任務(wù)定價(jià)敏感的會(huì)員,因此南山區(qū)的任務(wù)執(zhí)行情況良好。

        四區(qū)的中心區(qū)域即佛山市的禪城區(qū)任務(wù)執(zhí)行情況差,其他地方情況良好。禪城區(qū)是佛山市五個(gè)行政轄區(qū)之一,是有名的文化發(fā)源地和國(guó)家歷史文化名城,是聞名的武術(shù)之鄉(xiāng)、成藥之鄉(xiāng)、民間藝術(shù)之鄉(xiāng),因此此地經(jīng)濟(jì)發(fā)展程度高,任務(wù)定價(jià)對(duì)會(huì)員的影響不大。

        3 模型評(píng)價(jià)與推廣

        問(wèn)題中針對(duì)圖1數(shù)據(jù)建立的模型是基于k-means算法得到離中心距離,任務(wù)標(biāo)價(jià)二維矩陣,通過(guò)軟件進(jìn)行擬合獲取模型。該模型將經(jīng)緯度與任務(wù)標(biāo)價(jià)囊括其中,對(duì)任務(wù)分布區(qū)域進(jìn)行集中分區(qū)處理,并模糊邊界,形成四個(gè)規(guī)整矩形區(qū)。這樣的好處在于清晰地顯示了各區(qū)的任務(wù)定價(jià)規(guī)律,直觀簡(jiǎn)便。但是也存在一定問(wèn)題,首先是K-means算法的弊端,它是一種應(yīng)聚類算法,指定聚散中心個(gè)數(shù),在事先不知道聚類的種類的前提下,會(huì)帶來(lái)一定誤差。其次,該算法需要不斷地進(jìn)行樣本分類調(diào)整,運(yùn)算時(shí)間長(zhǎng),不利于高效獲取數(shù)據(jù)。線性擬合獲取模型的同時(shí),并沒(méi)有進(jìn)行定量的數(shù)據(jù)分析,驗(yàn)證模型的合理性。在應(yīng)用方面缺乏實(shí)際證據(jù)證明模型的效性。

        參考文獻(xiàn)

        [1] 肖慧,滕麗.基于GeoDA的廣東省地級(jí)市經(jīng)濟(jì)發(fā)展水平空間差異研究[J].中國(guó)市場(chǎng),2017(7):39-41,44.

        [2] 翁藝丹,千慶蘭,陳穎彪,韓富狀.廣州人口空間均衡特征與經(jīng)濟(jì)關(guān)聯(lián)研究初探[J]. 廣州大學(xué)學(xué)報(bào)(自然科學(xué)版),2015.14(6):84-91.

        [3] 毛夏,徐蓉蓉,李新碩,王煜,李程,曾波,何宇華,劉錦泉.深圳市人口分布的細(xì)網(wǎng)格動(dòng)態(tài)特征[J].地理學(xué)報(bào),2010.65(4):443-453.

        [4] 郝偉.佛山市總部經(jīng)濟(jì)發(fā)展的SWOT分析[J].佛山科學(xué)技術(shù)學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2012.30(1):25-28.

        [5] 馮振華.基于DBSCAN聚類算法的研究與應(yīng)用[D].江南大學(xué),2016.

        猜你喜歡
        數(shù)據(jù)挖掘
        基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識(shí)別方法
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
        數(shù)據(jù)挖掘的分析與探索
        河南科技(2014年23期)2014-02-27 14:18:43
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開(kāi)發(fā)實(shí)踐
        无码专区无码专区视频网址| 国产97在线 | 亚洲| 精品人人妻人人澡人人爽牛牛| 性一交一乱一伦一视频一二三区| 亚洲av男人免费久久| 日韩a级精品一区二区| 国产精品自在线拍国产手机版| 99视频全部免费精品全部四虎| 精品国产乱码久久免费看| 精品女同一区二区三区免费战| 久久婷婷人人澡人人喊人人爽 | 久久老子午夜精品无码怎么打| 亚洲欧美日韩国产综合久| 加勒比一区二区三区av| 第一次处破女18分钟高清| 久久久精品人妻久久影视| 亚洲专区路线一路线二天美| 精品人妻一区二区三区不卡毛片| 国产香港明星裸体xxxx视频 | 国产成人高清精品亚洲一区| 国产亚洲精品国产精品| 国产av丝袜旗袍无码网站| 在线观看视频亚洲| 青青草绿色华人播放在线视频 | 日本亚洲视频免费在线看| 亚洲av综合av国产av中文| 国精产品一区二区三区| 久久洲Av无码西西人体| 少妇被按摩出高潮了一区二区| 亚洲国产av精品一区二区蜜芽| 2021国产最新在线视频一区| av在线不卡一区二区三区| 国产精品视频永久免费播放| 四虎影库久免费视频| 国产成人丝袜在线无码| 久草福利国产精品资源| 桃花影院理论片在线| 日本免费一区二区三区在线看| 久久影院最新国产精品| 色婷婷亚洲一区二区三区| 国产精品毛片无遮挡高清|