蔣偉進(jìn) 陳萍萍 張婉清 孫永霞 陳君鵬
①(湖南工商大學(xué)計(jì)算機(jī)學(xué)院 長(zhǎng)沙 410205)
②(武漢理工大學(xué)計(jì)算機(jī)學(xué)院 武漢 430073)
隨著移動(dòng)設(shè)備和無線通信技術(shù)的快速發(fā)展,催生了移動(dòng)群智感知技術(shù),智能終端設(shè)備都攜帶著不同類型的傳感器,比如全球定位系統(tǒng)、溫度傳感器、距離傳感器、麥克風(fēng)等,這些都可以用來收集和人們密切相關(guān)的各類數(shù)據(jù)[1],然后數(shù)據(jù)平臺(tái)實(shí)現(xiàn)對(duì)數(shù)據(jù)的加工(如清洗、評(píng)估、提取、聚合等操作)和向數(shù)據(jù)消費(fèi)者輸出標(biāo)準(zhǔn)化的可用數(shù)據(jù)[2],從而被運(yùn)用于各大應(yīng)用領(lǐng)域,如智能交通、公共服務(wù)、環(huán)境監(jiān)測(cè)、智能醫(yī)療等[3]。
在典型的群智感知系統(tǒng)中,由任務(wù)提供者、感知數(shù)據(jù)平臺(tái)、任務(wù)參與者3部分組成[4]。任務(wù)提供者向數(shù)據(jù)平臺(tái)提供發(fā)布的任務(wù)和相應(yīng)報(bào)酬,感知數(shù)據(jù)平臺(tái)負(fù)責(zé)數(shù)據(jù)的接收、集成、清理、分析和交易等[5],任務(wù)參與者接收平臺(tái)發(fā)布的任務(wù)信息,根據(jù)自身情況進(jìn)行回應(yīng),同時(shí)上報(bào)完成感知任務(wù)的能力,比如感知質(zhì)量或空間覆蓋[6]。數(shù)據(jù)平臺(tái)根據(jù)用戶的回應(yīng)按照利益最大化的目標(biāo)選擇一部分用戶來參與并支付一定的報(bào)酬,這個(gè)過程就稱為用戶招募[7]。被招募的用戶再執(zhí)行相應(yīng)的感知任務(wù)和把結(jié)果返回到平臺(tái)。最后平臺(tái)會(huì)對(duì)用戶完成的感知質(zhì)量進(jìn)行評(píng)估和記錄,使下一輪選擇出更合適的用戶。
在現(xiàn)有工作中,移動(dòng)群智感知系統(tǒng)很多是假設(shè)用戶的感知質(zhì)量已知,并在此基礎(chǔ)上采用特定的優(yōu)化目標(biāo)對(duì)用戶進(jìn)行招募[8]。然而現(xiàn)實(shí)生活中,移動(dòng)用戶的感知質(zhì)量往往是未知的,不僅平臺(tái)未知,用戶也難以確定自身的感知質(zhì)量,因?yàn)楦兄|(zhì)量不僅與用戶的感知環(huán)境、綜合素質(zhì)有關(guān),還與用戶的感知設(shè)備以及參與興趣相關(guān)[9]。雖然用戶的完成任務(wù)的感知質(zhì)量不一樣,但由于用戶擁有的感知設(shè)備是不變的,用戶習(xí)慣都不會(huì)發(fā)生明顯的變化,因此用戶的感知質(zhì)量滿足一定的分布條件,完成的感知任務(wù)越多,感知質(zhì)量的分布就越準(zhǔn)確[10]。因此本文研究的是在平臺(tái)不知道用戶的感知質(zhì)量或成本值的前提下,數(shù)據(jù)交易平臺(tái)如何建立合適的用戶招募機(jī)制,不僅需要在用戶執(zhí)行的過程學(xué)習(xí)其成本和感知質(zhì)量值,還需要盡最大可能保證移動(dòng)群智感知系統(tǒng)的高效性和利潤(rùn)最大化[11]。 而用戶感知質(zhì)量的未知給用戶招募造成了極大的挑戰(zhàn),平臺(tái)是應(yīng)該選取那些已經(jīng)被認(rèn)為是高質(zhì)量的用戶,還是選取其他可能具有更高質(zhì)量的用戶。這就是強(qiáng)化學(xué)習(xí)中的經(jīng)典問題–“探索”和“利用”[12]。為解決該難題,本文將用戶選擇問題建模成有預(yù)算的多臂老虎機(jī)模型,并采用基于置信區(qū)間上限的用戶招募算法來招募合適的用戶。
本文所做的貢獻(xiàn)主要由以下3個(gè)方面:
(1)本文是招募用戶的感知質(zhì)量未知的前提下,解決有限預(yù)算下的感知質(zhì)量最大化用戶招募問題。一般而言,數(shù)據(jù)平臺(tái)總是希望選擇那些感知能力強(qiáng)的系統(tǒng)用戶,然而在實(shí)際場(chǎng)景中平臺(tái)并不能事先獲得用戶的成本和感知質(zhì)量參數(shù),因此本文采用組合多臂賭博機(jī)(Combination Multi-Armed Bandit,CMAB)來形式化用戶感知能力的學(xué)習(xí)過程,并提出在理想情況和缺乏用戶成本參數(shù)情況下的用戶招募機(jī)制。
(2)在上述兩種情況下的用戶招募機(jī)制下,分別擴(kuò)展基本的置信區(qū)間上限 (Upper Confidence Bound, UCB)的公式,設(shè)計(jì)針對(duì)所有任務(wù)的感知質(zhì)量函數(shù),提出貪婪用戶招募策略,選擇最大化函數(shù)邊際值的移動(dòng)用戶。
(3)在不同設(shè)定情況下的實(shí)驗(yàn)結(jié)果表明提出的基于CMAB的用戶招募算法能夠有效地學(xué)習(xí)用戶的感知質(zhì)量值。
對(duì)于移動(dòng)群智感知,當(dāng)前學(xué)者所做的工作主要是用戶招募,在成本限制下選擇任務(wù)完成好即感知質(zhì)量高的參與者,同時(shí)采用激勵(lì)機(jī)制鼓勵(lì)用戶分享數(shù)據(jù)。劉琰等人[13]研究移動(dòng)群智感知的任務(wù)分發(fā),使參與者參加多個(gè)感知任務(wù),并提出多任務(wù)分配方法,在任務(wù)移動(dòng)總距離最短和參與者人數(shù)最少的目標(biāo)下選擇出最佳的參與者。周杰等人[14]選擇盡可能少的參與者來接受感知任務(wù),達(dá)到對(duì)指定地點(diǎn)集合的時(shí)空覆蓋這一質(zhì)量要求,定義了“t-時(shí)隙k-覆蓋”群智感知任務(wù),以最小代價(jià)完成該類任務(wù)。Wang等人[15]重點(diǎn)關(guān)注具有預(yù)算約束的覆蓋均衡用戶選擇(Coverage-Balancing User Selection, CBUS)問題,選擇一個(gè)適當(dāng)?shù)挠脩糇蛹垢兄秶M可能大且平衡,同時(shí)又滿足移動(dòng)群智感知活動(dòng)指定的預(yù)算。蔣偉進(jìn)等人[16]針對(duì)移動(dòng)用戶追求高回報(bào)的貪婪特性會(huì)使得招募成本偏高的問題提出一種針對(duì)團(tuán)體的群智感知招募激勵(lì)機(jī)制,解決了移動(dòng)用戶對(duì)數(shù)據(jù)進(jìn)行過高定價(jià)來提高利潤(rùn)的問題。Song等人[17]研究了任務(wù)分配策略,針對(duì)受歡迎的任務(wù)被大家所選擇,不受歡迎的任務(wù)往往無法分配到合適用戶的情況提出一種面向覆蓋的任務(wù)分配(Coverage-Oriented Task Assignment, COTA)策略,通過學(xué)習(xí)和利用工人的任務(wù)偏好來實(shí)現(xiàn)覆蓋范圍的任務(wù)分配,將不受歡迎的任務(wù)遷移到一些合格的工人上。Zhang等人[18]通過優(yōu)化任務(wù)的可靠性和空間多樣性來選擇參與者, 建立了兩個(gè)優(yōu)化目標(biāo)的激勵(lì)模型,再基于逆向拍賣設(shè)計(jì)兩個(gè)在線激勵(lì)機(jī)制。Chen等人[8]對(duì)如何選擇最合適的參與者提出一個(gè)均勻覆蓋和最大覆蓋的覆蓋評(píng)估,設(shè)計(jì)一個(gè)基于軌跡段的選擇方案。Xiao等人[19]針對(duì)用戶招募過程中每個(gè)用戶的感知質(zhì)量和招募成本不透露給其他用戶或平臺(tái)的目標(biāo),使用秘密共享方案設(shè)計(jì)了兩個(gè)安全的用戶招募協(xié)議。上述學(xué)者大多數(shù)是在已知用戶的感知質(zhì)量的基礎(chǔ)上優(yōu)化用戶人數(shù)和移動(dòng)距離,減少平臺(tái)預(yù)算,但未考慮用戶收集的感知數(shù)據(jù)質(zhì)量在實(shí)時(shí)變化的情況,這就需要我們對(duì)用戶的感知質(zhì)量進(jìn)行學(xué)習(xí),得到最適合用戶的任務(wù)分配。因此本文提出基于CMAB的用戶招募算法,利用強(qiáng)化學(xué)習(xí)來對(duì)用戶的感知質(zhì)量進(jìn)行學(xué)習(xí),實(shí)時(shí)與感知數(shù)據(jù)平臺(tái)交互,解決有限預(yù)算下任務(wù)感知質(zhì)量最大化問題。
表1 本文主要符號(hào)和釋義
u(Pr)代表在r輪次中所有用戶的感知質(zhì)量,每個(gè)任務(wù)完成的感知質(zhì)量再乘以相應(yīng)的權(quán)重。
定義2 有限預(yù)算下的感知任務(wù)的質(zhì)量最大化問題(Maximum Quality and Limit Budget,MaxQLimitB)可定義為
在基于UCB感知質(zhì)量公式上本文提出感知質(zhì)量函數(shù),如式(9)所示
然而在每輪選擇中,總有一些用戶的成本超過了成本預(yù)算限制。所以本文提出一種新穎的貪婪修復(fù)算法(Greedy Repair Algorithm, GRA),如表2所示。首先將所有預(yù)選的用戶都按感知質(zhì)量與成本比率降序排列,存儲(chǔ)在數(shù)組Q[0,1,···,n], 并采用標(biāo)志布爾數(shù)組F[i]標(biāo)識(shí)每個(gè)用戶的選擇狀態(tài),若F[i]=1表示該用戶被選中,F(xiàn)[i]=0則未被選中。在算法貪婪修復(fù)算法中,感知質(zhì)量成本比首先降序排列,依次選擇參與者,同時(shí)更改F[i]的狀態(tài),并計(jì)算累計(jì)的成本值Cost,當(dāng)累計(jì)成本大于預(yù)算時(shí)GRA并不會(huì)停止,它會(huì)從總成本減去當(dāng)前的所選參與者的成本,并將該參與者的狀態(tài)標(biāo)識(shí)為F[i]=0,接著重復(fù)上面的步驟,選擇盡可能多的參與者。
表2 貪婪修復(fù)算法(GRA)
因此感知質(zhì)量的函數(shù)值和招募成本的比率如式(13)所示
表3 基于CMAB 的用戶已知成本招募算法
該算法的基本思路是在初始化階段,選擇用戶的第1個(gè)選項(xiàng)來初始化相應(yīng)的參數(shù),在之后的用戶招募階段,結(jié)合貪婪修復(fù)算法,并在預(yù)算有限的前提下,每輪次選擇感知質(zhì)量和成本最大比率的移動(dòng)感知用戶,并更新用戶的成本參數(shù),獲得新的用戶成本,該算法時(shí)間復(fù)雜度為O(APLY),由于數(shù)組需要大小為 n 的臨時(shí)存儲(chǔ)空間,因此空間復(fù)雜度為O(n)。具體過程如表4所示。
表4 基于CMAB 的用戶未知成本招募算法
本文的實(shí)驗(yàn)是在預(yù)算有限的背景下,選擇感知質(zhì)量未知的用戶過程,驗(yàn)證基于CMAB的用戶招募算法學(xué)習(xí)用戶感知質(zhì)量的能力,即能否選擇高質(zhì)量的用戶。為了方便表述,在實(shí)驗(yàn)結(jié)果圖中,將算法2命名為已知的組合多臂賭博機(jī)算法(Combined Multi-Arm Bandit algorithm with Known Cost,KC-CMAB),將算法3命名為未知的組合多臂賭博機(jī)算法(Combined Multi-Arm Bandit algorithm with UnKnown Cost, UKC-CMAB),為了驗(yàn)證算法的高效性,分別采用ε-貪婪算法,基于預(yù)算的貪婪算法,基于質(zhì)量的貪婪算法,α-最優(yōu)算法進(jìn)行對(duì)比實(shí)驗(yàn),具體設(shè)置如下所示。
本文采用意大利羅馬地區(qū)320輛左右出租車的1個(gè)月以來真實(shí)數(shù)據(jù)集以及模擬數(shù)據(jù)集,羅馬數(shù)據(jù)集包括乘客上下車的日期和時(shí)間、出租車和乘客的位置、行程距離以及乘客人數(shù)。由于數(shù)據(jù)集過于龐大,計(jì)算的總成本過高,本文首次對(duì)數(shù)據(jù)集進(jìn)行處理:(1)選擇10 km×10 km的矩形區(qū)域作為空間限制。(2)在區(qū)域中,選取了數(shù)據(jù)集中m個(gè)乘客位置作為模擬平臺(tái)發(fā)布的感知任務(wù),取值范圍分別為[200,1000]。n輛出租車作為模擬的移動(dòng)用戶,取值范圍為 [50 200]。在本次實(shí)驗(yàn)中,m和n的默認(rèn)值分別設(shè)置為800,150,每個(gè)移動(dòng)用戶執(zhí)行任務(wù)的范圍為[6 15]。(3)每個(gè)感知任務(wù)采用圓盤覆蓋的方法,即以任務(wù)為中心,以250 m為半徑畫出圓盤,如果用戶在該圓盤范圍內(nèi),則執(zhí)行相關(guān)的任務(wù)。對(duì)于感知質(zhì)量的期望值qi表示用戶i訪問該位置的頻率。成本參數(shù)的期望值為范圍(0,1]的隨機(jī)生成數(shù),并采用高斯分布和均勻分布來設(shè)置感知質(zhì)量值和成本。模擬數(shù)據(jù)集是根據(jù)現(xiàn)有的方法生成模擬數(shù)據(jù),假設(shè)感知任務(wù)和參與者的位置均勻分布在一個(gè)10 km×10 km的2D空間中,經(jīng)緯度則均勻地分布在(0,1)中,此外,每個(gè)參與者都有一個(gè)反映過去完成任務(wù)情況的成本值,為了簡(jiǎn)便,用歐幾里得距離來量化感知任務(wù)位置與參與者所在位置的距離長(zhǎng)短,將考慮不同規(guī)模的參與者和任務(wù)對(duì)選擇結(jié)果的影響,分別從{200,500,1000}和{50,100,150,200}中選擇n個(gè)參與者和m個(gè)感知任務(wù)。
為了突出KC-CMAB算法的高效性,結(jié)合現(xiàn)有工作,分別設(shè)計(jì)4個(gè)算法來進(jìn)行對(duì)比實(shí)驗(yàn),第1個(gè)算法是 ε-貪婪算法(Epsilon-Greedy,簡(jiǎn)稱epsilon-Grd),該算法平衡利用和探索策略,以(1-ε)的概率選擇最大收益的參與者,以ε的概率隨機(jī)選擇1個(gè)參與者,實(shí)現(xiàn)探索策略,本實(shí)驗(yàn)將ε設(shè)置為0.1。第2個(gè)算法是α-最優(yōu)算法,已知所有用戶的感知質(zhì)量和成本參數(shù),能夠選擇出最佳用戶。第3個(gè)算法是基于預(yù)算的貪婪算法 (Budget-Greedy, budget-Grd),從預(yù)算角度下構(gòu)建組合多臂賭博機(jī)招募機(jī)制,將預(yù)算平均分配到每輪,并貪心地選擇成本比值較小的用戶,直到預(yù)算耗盡。第4個(gè)算法是基于質(zhì)量的貪婪算法 (Quality-Greedy,簡(jiǎn)稱quality-Grd)從質(zhì)量角度構(gòu)建組合多臂賭博機(jī)招募機(jī)制,來選擇感知質(zhì)量最大的用戶,不考慮用戶成本的大小,直至預(yù)算耗盡。
本實(shí)驗(yàn)將采用總?cè)蝿?wù)的感知質(zhì)量值作為實(shí)驗(yàn)測(cè)試結(jié)果指標(biāo),將從平臺(tái)每輪招募的人數(shù)Y、招募的用戶數(shù)量A、發(fā)布的任務(wù)數(shù)量P和預(yù)算的成本值B 4個(gè)指標(biāo)來進(jìn)行設(shè)定評(píng)估算法的性能。為了驗(yàn)證上述各個(gè)指標(biāo)從小到大增加,本算法是否有效性的問題。首先設(shè)定其中3個(gè)指標(biāo)不變,另外一個(gè)指標(biāo)將從小變大。參考前期實(shí)驗(yàn)基礎(chǔ),首先設(shè)置指標(biāo)不變的數(shù)值:預(yù)算B為10000,每輪招募人數(shù)Y為80,用戶數(shù)量A為150,任務(wù)數(shù)量P為800。測(cè)試總感知質(zhì)量分別隨著預(yù)算B、任務(wù)數(shù)量P、用戶數(shù)量A以及每輪招募人數(shù)Y的變化,驗(yàn)證算法是否還有效,具體如圖1–圖4所示。
圖1 總感知質(zhì)量與預(yù)算成本的關(guān)系
圖2 總感知質(zhì)量與任務(wù)數(shù)量的關(guān)系
圖3 總感知質(zhì)量與用戶數(shù)量的關(guān)系
圖4 總感知質(zhì)量與每輪招募人數(shù)的關(guān)系
隨著預(yù)算成本值的增大,各個(gè)算法的總感知質(zhì)量增大,但KC-CMAB和UKC-CMAB更接近α-Optimal算法,由圖1所示;因?yàn)殡S著預(yù)算的增大,每個(gè)用戶獲得收益更多,能夠激勵(lì)認(rèn)真地完成任務(wù),獲得不錯(cuò)的報(bào)酬,因此用戶感知質(zhì)量與成本的比率就越精確,數(shù)據(jù)平臺(tái)就越有可能選擇排在前面的高質(zhì)量的用戶。對(duì)于逐漸增大要完成的任務(wù)數(shù)量、整體算法先呈增大后減少的趨勢(shì),如圖2所示;因?yàn)閯傞_始的預(yù)算充足,增加任務(wù)數(shù)量,能使每個(gè)人的任務(wù)數(shù)量增多,對(duì)于KC-CMAB和UKCCMAB算法來說,能更多次學(xué)習(xí)用戶的感知質(zhì)量,從而提高用戶選擇的精度,但隨著任務(wù)數(shù)量越來越多,所得報(bào)酬大幅度減少,不能激勵(lì)用戶認(rèn)真完成任務(wù),從而降低了總?cè)蝿?wù)的感知質(zhì)量;隨著用戶數(shù)量的增多,對(duì)于數(shù)據(jù)平臺(tái)來說,擴(kuò)大了用戶選擇范圍,能夠探索出更多的優(yōu)秀用戶,在一定范圍內(nèi)能大大增高任務(wù)總的感知質(zhì)量,但由于預(yù)算有限,當(dāng)用戶范圍超過臨界值時(shí),任務(wù)的總感知質(zhì)量將逐漸變小,如圖3所示;隨著每輪用戶招募人數(shù)的增多,能夠在每一輪次中積極探索高質(zhì)量的用戶,但會(huì)使不同用戶執(zhí)行同樣的任務(wù),會(huì)大大增加數(shù)據(jù)冗余度,當(dāng)超過一定界限,總感知質(zhì)量逐漸減少,如圖4所示。實(shí)驗(yàn)結(jié)果證明:隨著預(yù)算,每輪招募人數(shù)、招募用戶數(shù)量和任務(wù)數(shù)量各個(gè)指標(biāo)從小到大增加,KC-CMAB和UKC-CMAB都整體優(yōu)于其他3種算法,接近于α-Optimal最優(yōu)算法,具有良好的自適應(yīng)性。
上述實(shí)驗(yàn)是設(shè)定預(yù)算B為10000的情況,沒有具體驗(yàn)證在不同預(yù)算下,每輪招募人數(shù)、招募用戶數(shù)量和任務(wù)數(shù)量對(duì)任務(wù)的總感知質(zhì)量的影響。接下來在本文的實(shí)驗(yàn)中設(shè)定不同預(yù)算值下的參數(shù)變量,第一為預(yù)算值B,范圍為5000~15000;第二為每輪招募人數(shù)Y,設(shè)置Y=50~120,間隔為10;第三為招募的用戶數(shù)量,設(shè)置A=60~200,間隔為20;第四為比較發(fā)布的任務(wù)數(shù)量,設(shè)置P=200~1000,間隔為200。設(shè)置的情況匯總?cè)绫?所示。
表5 算法2實(shí)驗(yàn)情況設(shè)定
對(duì)于情況1~情況4,如圖5–圖7所示,在每輪招募人數(shù)為20~50時(shí),5種算法的感知質(zhì)量差距相差不大,但KC-CMAB整體好于UKC-CMAB,epsilon-Grd, bridge-Grd, quality-Grd,跟α-Optimal接近,因?yàn)槠脚_(tái)每輪招募的人數(shù)Y越多,總輪次越少,如圖8所示,這表示用戶的選擇性擴(kuò)大,容易選中高質(zhì)量的用戶,但隨著招募的人數(shù)大大提高,個(gè)人所獲得收益降低,用戶積極性很可能降低,參與度不高,所獲得感知質(zhì)量降低,因此需要選擇合適的Y在有限成本下使感知質(zhì)量最大化。而UKC-CMAB的算法比KC-CMAB效果要差,但比其他3種算法效果好,因?yàn)樵撍惴ú粌H要學(xué)習(xí)成本,還要學(xué)習(xí)感知質(zhì)量,使結(jié)果最優(yōu)化。
圖5 總感知質(zhì)量和每輪招募用戶數(shù)量的關(guān)系(b=5000)
圖6 總感知質(zhì)量和每輪招募用戶數(shù)量的關(guān)系(b=10000)
圖7 總感知質(zhì)量和每輪招募用戶數(shù)量的關(guān)系(b=15000)
圖8 每輪次和每輪招募人數(shù)所占比率的關(guān)系
對(duì)于圖9–圖11所示,隨著招募用戶的增多,KC-CMAB和UKC-CMAB算法所獲得的感知質(zhì)量明顯大于其他3種算法,而KC-CMAB更接近α-最優(yōu)算法,達(dá)到α-Optimal最優(yōu)算法的80%以上,這表示文中提出的算法能夠充分選擇利用策略,學(xué)習(xí)選擇高質(zhì)量的用戶,而對(duì)于其他3種算法,容易陷入局部最優(yōu)化,未選擇最優(yōu)用戶。
圖9 感知質(zhì)量和用戶數(shù)量的關(guān)系(b=5000)
圖10 感知質(zhì)量和用戶數(shù)量的關(guān)系(b=10000)
圖11 感知質(zhì)量和用戶數(shù)量的關(guān)系(b=15000)
如圖12,圖13,圖14所示,隨著任務(wù)數(shù)量的增多,KC-CMAB和UKC-CMAB的感知質(zhì)量先增后降,在任務(wù)數(shù)1000達(dá)到感知質(zhì)量最大值,因?yàn)槿蝿?wù)數(shù)量越多,招募的用戶隨著增多,任務(wù)的成本降低,但會(huì)考慮到感知質(zhì)量越高的用戶,其成本越高這種情況,算法會(huì)優(yōu)先選擇感知質(zhì)量略差,但成本更低的用戶。
圖12 感知質(zhì)量和任務(wù)數(shù)量的關(guān)系(b=5000)
圖13 感知質(zhì)量和任務(wù)數(shù)量的關(guān)系(b=10000)
圖14 感知質(zhì)量和任務(wù)數(shù)量的關(guān)系(b=15000)
本文針對(duì)有限預(yù)算下用戶成本已知和未知的條件下最大感知質(zhì)量的用戶招募問題,在任務(wù)的感知質(zhì)量不斷變化的情況下提出一種基于CMAB模型的用戶招募算法,使移動(dòng)群智平臺(tái)能根據(jù)每輪用戶感知質(zhì)量的反饋,動(dòng)態(tài)調(diào)整自己的選擇,在下一輪選擇符合條件的高質(zhì)量用戶,使用戶招募在長(zhǎng)期的選擇中能夠獲得較好的平均感知質(zhì)量。但在用戶招募過程中,未考慮用戶為了高收益而提供虛假結(jié)果的情況,后續(xù)將針對(duì)如解決用戶為獲得報(bào)酬而做虛假任務(wù)的問題進(jìn)行大量研究。