張龍昌,白 靜
(1.宿遷學院 信息工程學院,江蘇 宿遷 223800;2.北京郵電大學深圳研究院,廣東 深圳 518038;3.東北財經(jīng)大學 管理科學與工程學院,遼寧 大連 116025)
云計算通過基礎(chǔ)設(shè)施即服務(wù)(IaaS)、平臺即服務(wù)(PaaS)提供大數(shù)據(jù)應(yīng)用運行環(huán)境,具體以軟件即服務(wù)(SaaS)形式提交給用戶,稱其為大數(shù)據(jù)服務(wù)。
QoS、情景、服務(wù)價格、服務(wù)品牌等眾多因素都會影響大數(shù)據(jù)服務(wù)的用戶滿意度;無限提升QoS不僅不能使用戶滿意度無限提高,且嚴重浪費資源;大數(shù)據(jù)服務(wù)周期長、數(shù)據(jù)遷移成本高、服務(wù)切換難度大,服務(wù)選取非常慎重;服務(wù)市場不斷變化,影響參與各方行為。
基于以上背景,從用戶滿意度視角出發(fā),揭示用戶滿意度形成機理,構(gòu)建情景感知的用戶滿意度模型,在此基礎(chǔ)上建立可信的服務(wù)評價方法和服務(wù)運行期博弈優(yōu)化方法,通過服務(wù)選取和服務(wù)運行優(yōu)化實現(xiàn)大數(shù)據(jù)服務(wù)提供的用戶滿意度最大化(研究所處位置見圖1),最終提出最大化用戶滿意度的大數(shù)據(jù)服務(wù)可信評價及博弈優(yōu)化方法。
圖1 大數(shù)據(jù)服務(wù)構(gòu)建模型
研究者從主、客觀兩個角度建立QoS模型的指標體系,主觀QoS屬性一般由用戶打分或使用語言短語進行評價,多用模糊數(shù)描述;客觀QoS屬性一般通過監(jiān)測的手段獲取信息,通常采用實數(shù)[1]、區(qū)間數(shù)[2]、概率或隨機過程描述。QoS不僅取決于服務(wù)本身,還取決于網(wǎng)絡(luò)、用戶終端環(huán)境等情景因素,如移動網(wǎng)絡(luò)、傳輸網(wǎng)絡(luò)、用戶終端環(huán)境等。QoS優(yōu)不一定會使用戶體驗(QoE)更好,為了使服務(wù)評價、選擇、組合的效果更好,一些從探索QoS和QoE間關(guān)系、基于QoE的服務(wù)優(yōu)化、服務(wù)的QoE評估等視角研究服務(wù)的用戶體驗。目前的QoS模型在全面揭示影響用戶滿意度的因素及其規(guī)律方面存在不足,相關(guān)研究成果也未能全面闡述用戶滿意度的形成機理,致使QoS優(yōu)的服務(wù)用戶滿意度卻不一定高,建立一個系統(tǒng)的、全面的描述用戶滿意度的模型成為迫切需要解決的問題。
通過服務(wù)提供商發(fā)布QoS、用戶經(jīng)驗QoS、監(jiān)控軟件監(jiān)控QoS三種渠道獲得QoS數(shù)據(jù),因用戶終端獲取QoS更能有效反應(yīng)服務(wù)狀態(tài),重點闡述用戶端獲取QoS。監(jiān)控軟件監(jiān)控QoS受環(huán)境因素影響較大,做不到任何時間、任何地點全面監(jiān)測;另外在用戶端監(jiān)測QoS或者用戶反饋QoS會引起用戶終端資源的占用和成本的增加,一些用戶會選擇搭便車。采用協(xié)同過濾等預(yù)測和推理的方法補齊缺失的QoS數(shù)據(jù)方法也有一定局限性,預(yù)測結(jié)果受數(shù)據(jù)規(guī)模、數(shù)據(jù)質(zhì)量、情景等因素影響,而以用戶經(jīng)驗為基礎(chǔ)的用戶滿意度數(shù)據(jù)缺失問題,更適合從用戶視角解決,因此有必要從激勵用戶角度解決用戶滿意度數(shù)據(jù)不全面問題,如何建立評價用戶提交用戶滿意度數(shù)據(jù)的激勵機制是一個基本問題。
用戶對自身利益的考慮,可能會選擇提交虛假Q(mào)oS經(jīng)驗,此類用戶為典型的“網(wǎng)絡(luò)水軍”和“網(wǎng)絡(luò)推手”。解決用戶經(jīng)驗QoS的可信性問題,通過設(shè)計算法對不可信QoS數(shù)據(jù)進行識別,從而獲得可信QoS數(shù)據(jù)?;跀?shù)據(jù)的識別預(yù)測方法具有較好的效果(識別準確率可達到90.5%)和較大的參考價值,但在場景變化時識別率不高,而用戶滿意度數(shù)據(jù)是以用戶的經(jīng)驗為基礎(chǔ),通過識別用戶的可信度即可識別數(shù)據(jù)的可信度。這是一種新的研究思路,如何建立評價用戶的可信度評估方法是必須解決的問題。
目前還較少有基于用戶滿意度的服務(wù)評價成果出現(xiàn),基于QoS的服務(wù)選擇和排序具有較高的參考價值,可以分為以下幾類:(1)基于協(xié)同過濾的服務(wù)選擇方法[3-4],在特定數(shù)據(jù)缺失條件下和用戶環(huán)境對QoS影響較大時,不失為一種有效的解決方案,但依賴用戶歷史QoS記錄,服務(wù)選擇的準確率與數(shù)據(jù)集強相關(guān),同時也存在數(shù)據(jù)的稀疏性和冷啟動等問題。(2)基于啟發(fā)式算法的服務(wù)選擇,可在大規(guī)模的組合服務(wù)選擇中以較合理的時間求得質(zhì)量較優(yōu)的解,遺傳算法[5]、粒子群算法[6]等較常見。在獲得組合服務(wù)計劃的全局最優(yōu)解和較快的執(zhí)行速度上具有較好的表現(xiàn),在執(zhí)行時間和解的最優(yōu)度間權(quán)衡,往往沒找到最優(yōu)解算法就已經(jīng)結(jié)束。(3)基于整數(shù)規(guī)劃的服務(wù)選擇[7],需要對所有可能的執(zhí)行計劃進行評估,效率隨著問題規(guī)模的增加而大幅度降低。(4)基于多屬性決策理論的服務(wù)選擇方法,首先構(gòu)造候選服務(wù)的QoS矩陣,并獲取用戶對各QoS屬性的偏好權(quán)重,再應(yīng)用層次分析法(AHP)[8]、逼近理想解的排序方法(TOPSIS)[9-10]等對候選服務(wù)進行評價和排序。能夠獲得局部最優(yōu)解,缺點是獲得偏好是個難題,對不同數(shù)據(jù)類型表示的QoS屬性需要提出新的決策方法。還有一些具有很高的價值算法,如基于博弈的服務(wù)選擇優(yōu)化[11]、基于投資組合理論的服務(wù)選擇[12]、基于多屬性組合拍賣等等。
大數(shù)據(jù)服務(wù)依賴于海量的異構(gòu)數(shù)據(jù),不僅同一數(shù)據(jù)中心很難,不同數(shù)據(jù)中心也很難出現(xiàn)功能相同而質(zhì)量不同的大數(shù)據(jù)服務(wù)。依據(jù)若干屬性構(gòu)成的用戶滿意度數(shù)據(jù),從多個備選服務(wù)中選擇用戶滿意度最高的服務(wù),采用多屬性決策方法更合理。將以往基于多屬性決策方法的服務(wù)選擇研究成果應(yīng)用于實現(xiàn)服務(wù)選取階段用戶滿意度最大化,仍存在以下問題需要解決:以往的QoS數(shù)據(jù)考慮用戶情景因素不夠充分,在用戶滿意度數(shù)據(jù)上有必要考慮用戶的情景因素,即數(shù)據(jù)的可信問題;用戶滿意度數(shù)據(jù)為若干次采集的數(shù)據(jù)序列,以往對數(shù)據(jù)的期望研究的較多,對數(shù)據(jù)的風險(即分布)研究的較少,即存在數(shù)據(jù)描述的不可信問題;進而缺少一種新的多屬性決策方法適應(yīng)該類數(shù)據(jù)描述。
從用戶角度的優(yōu)化,目標是使服務(wù)的QoS更好或成本更低:文獻[13]解決大規(guī)模的科學應(yīng)用以任務(wù)數(shù)據(jù)流形式在分布式和異構(gòu)資源云環(huán)境中的調(diào)度,實現(xiàn)最小化云應(yīng)用的期望執(zhí)行時間和經(jīng)濟成本,并保證系統(tǒng)資源的最大公平使用。也有文獻利用虛擬機技術(shù),對組合云服務(wù)的資源分配進行優(yōu)化,以最小化任務(wù)執(zhí)行時間為目標,設(shè)計了非競爭和競爭場景下的資源分配方案,在系統(tǒng)資源不足和資源競爭時輕工作量優(yōu)先策略更適合串行和并行任務(wù)。
從服務(wù)提供商角度的優(yōu)化,目標是在滿足用戶QoS約束情況下追求云資源利用率、服務(wù)吞吐量、服務(wù)提供商收益更高:文獻[14]在滿足用戶的時間需求的約束下,通過動態(tài)分配任務(wù)、調(diào)整虛擬機和調(diào)整主機盡量減少能量消耗。文獻[15]解決云計算環(huán)境下帶約束的性能和能耗的多目標優(yōu)化問題,追求高性能和低能耗。另有文獻建立SaaS服務(wù)提供商和IaaS服務(wù)提供商間的博弈模型,在價格和資源分配策略間尋求均衡解,實現(xiàn)SaaS服務(wù)提供商和IaaS服務(wù)提供商的收益最大化。
上述研究成果從用戶或服務(wù)提供商角度對服務(wù)運行期進行優(yōu)化,然而目前較少有研究方案可以同時兼顧用戶和服務(wù)提供商,比如優(yōu)化用戶收益(QoS,經(jīng)濟成本)的同時滿足其它約束,并且能夠使服務(wù)提供商也能獲得良好收益。
綜上分析,實現(xiàn)大數(shù)據(jù)服務(wù)用戶滿意度最大化,存在下述問題亟需解決:(1)缺乏完整用戶滿意度模型及全面、可信的用戶滿意度數(shù)據(jù)獲取方法;(2)缺乏實現(xiàn)用戶滿意度最大化的可信服務(wù)評價方法;(3)缺乏服務(wù)運行期實現(xiàn)用戶滿意度最大化的有效優(yōu)化方法。
基于用戶滿意度視角,該文以現(xiàn)實中大數(shù)據(jù)服務(wù)為研究對象,構(gòu)建數(shù)理模型建立完整的用戶滿意度模型及能獲取全面、可信的用戶滿意度數(shù)據(jù)方法。具體研究目標為:(1)揭示價格、用戶感知QoS、協(xié)商QoS、品牌形象、感知價值和情景等影響用戶滿意度的基本規(guī)律,建立能夠全面、準確描述用戶滿意度的模型,進而建立起用戶滿意度與各影響因素間的數(shù)理關(guān)系;(2)揭示評價用戶搭便車行為規(guī)律,建立有效的激勵機制激勵評價用戶參與用戶滿意度評價,構(gòu)建完備的用戶滿意度數(shù)據(jù);(3)探索服務(wù)評價中存在的用戶滿意度數(shù)據(jù)虛假問題,建立有效的評價用戶可信度評估方法,消除虛假用戶滿意度數(shù)據(jù),為可信的服務(wù)評價提供數(shù)據(jù)基礎(chǔ);(4)闡明云模型、TOPSIS基本原理,建立充分考慮情景因素的可信服務(wù)評價方法,能夠有效解決現(xiàn)有評價方法在可信度方面存在的不足;(5)揭示服務(wù)運行期服務(wù)參與者行為,明確QoS、價格與服務(wù)參與者收益的關(guān)系,建立服務(wù)運行期博弈優(yōu)化方法,最大化服務(wù)參與者收益。
在綜述大量文獻的基礎(chǔ)上,借鑒客戶滿意度模型(ACSI、ECSI、TCSI)構(gòu)建情景感知的用戶滿意度模型;從激勵評價用戶提交數(shù)據(jù)、評估評價用戶可信度識別虛假數(shù)據(jù)和提高服務(wù)評價算法可信度三方面實現(xiàn)大數(shù)據(jù)服務(wù)的可信評價;通過研究服務(wù)運行階段服務(wù)參與者行為及博弈機理,提出服務(wù)運行期博弈優(yōu)化方法,下面是具體研究內(nèi)容(各研究內(nèi)容間的關(guān)系見圖2)。
圖2 各研究內(nèi)容間的關(guān)系
圖3 采取的技術(shù)路線圖
傳統(tǒng)以QoS為基礎(chǔ)的服務(wù)評價能獲得QoS優(yōu)的服務(wù),研究、實踐證明QoS與用戶滿意度存在正向關(guān)系,但QoS達到一定閾值后用戶滿意度不再敏感,不斷提高QoS不僅不能顯著提高用戶滿意度,還會降低云資源利用率,損害服務(wù)提供商利益。此外,傳統(tǒng)以互聯(lián)網(wǎng)為背景的服務(wù)評價,較少考慮用戶情景(如環(huán)境、時間、位置、偏好)變化,因而較難準確地提供用戶滿意的QoS。針對以往QoS模型不能準確描述用戶滿意度問題,首先揭示價格、用戶感知QoS、協(xié)商QoS、品牌形象、感知價值和情景等因素影響用戶滿意度的規(guī)律,進而闡明用戶滿意度形成機理,研究在客戶滿意度模型基礎(chǔ)上構(gòu)建情景感知的用戶滿意度模型,最后研究模型的量化評估和優(yōu)化,為服務(wù)評價和服務(wù)運行期博弈優(yōu)化奠定基礎(chǔ)。
用戶滿意度來源于評價用戶,部分評價用戶選擇搭便車,直接導致用戶滿意度數(shù)據(jù)的稀疏、不全面。從激勵評價用戶提交數(shù)據(jù)角度解決該問題,首先研究服務(wù)評價過程中的評價用戶搭便車行為的測量方法,用以測量服務(wù)評價中搭便車程度;然后研究構(gòu)建博弈論框架下評價用戶貢獻行為模型,觀察用戶貢獻行為的動態(tài)過程,分析個體評價用戶搭便車行為存在的必然性以及由此引致的“公地悲劇”問題;進而基于委托代理理論和虛擬支付,研究評價用戶貢獻的激勵機制,從而引導自私型評價用戶貢獻用戶滿意度,提升評價用戶對服務(wù)評價的貢獻水平。
“網(wǎng)絡(luò)水軍”和“網(wǎng)絡(luò)推手”提供虛假用戶滿意度數(shù)據(jù),從評價用戶可信視角出發(fā),識別誠信度不高的評價用戶,進而拒絕其滿意度數(shù)據(jù)。首先基于統(tǒng)計分析角度,借鑒個人征信體系構(gòu)建基本思想,建立服務(wù)交易中評價用戶的行為檔案,進而研究基于Logistic回歸的動態(tài)評價用戶可信度評估方法;接著基于人的認知行為角度,借鑒社會網(wǎng)絡(luò)理論研究基于社會網(wǎng)絡(luò)的動態(tài)評價用戶可信度評估方法;最后研究兩種可信度評估方法的綜合評估方案。
來源于不同情景不同評價用戶的滿意度數(shù)據(jù)隨機性和模糊性較強,如何建立可信的服務(wù)評價方法實現(xiàn)服務(wù)選取階段的用戶滿意度最大化是迫切需要解決的關(guān)鍵問題。分析基于情景的用戶相似規(guī)律并設(shè)計用戶相似計算方法,進一步研究基于Top-K查詢的情景相似用戶查詢算法,獲取與請求用戶相似的評價用戶滿意度數(shù)據(jù);研究云模型(包含期望、熵、超熵三個數(shù)字特征)的構(gòu)建機理及用戶滿意度數(shù)據(jù)的云模型表示,探索云模型的擬合方法,設(shè)計并行的用戶滿意度云發(fā)生器;研究云模型的距離計算和比較方法,分析典型多屬性決策理論-TOPSIS基本原理,深入研究基于云模型的TOPSIS評價方法,解決現(xiàn)有評價方法評價結(jié)果可信度不高這一關(guān)鍵問題。
在服務(wù)運行期對服務(wù)進行優(yōu)化是另外一個迫切需要解決的關(guān)鍵問題。單方行為較難準確地對用戶滿意度產(chǎn)生影響,不能做到服務(wù)市場、QoS、用戶滿意度變化情況下的服務(wù)參與者收益達到帕累托最優(yōu)狀態(tài),從最大化服務(wù)參與者收益角度出發(fā),研究服務(wù)運行階段的博弈優(yōu)化方法,解決現(xiàn)有優(yōu)化模型在服務(wù)優(yōu)化實踐中存在的亟需解決的問題。兩種情形的博弈優(yōu)化:若SaaS、PaaS、IaaS服務(wù)作為整體由獨立服務(wù)提供商提供,則研究用戶與服務(wù)提供商的兩方動態(tài)博弈模型;若SaaS、PaaS、IaaS服務(wù)分別由不同服務(wù)提供商提供,因SaaS、PaaS服務(wù)提供商具有共同特征,除了自身提供軟件服務(wù)外,還代理IaaS服務(wù)提供商向用戶出售IaaS服務(wù),將其定義為應(yīng)用服務(wù)(SaaS/PaaS)提供商,則研究用戶、應(yīng)用服務(wù)提供商和基礎(chǔ)設(shè)施服務(wù)提供商三方博弈模型。上述研究內(nèi)容需要解決的關(guān)鍵科學問題為:(1)如何建立服務(wù)選取階段的最大化用戶滿意度的可信大數(shù)據(jù)服務(wù)評價方法是必須解決的關(guān)鍵科學問題。(2)在服務(wù)市場變動條件下,如何確定服務(wù)運行期的價格、QoS,使服務(wù)參與者收益達到帕累托最優(yōu)狀態(tài),促使大數(shù)據(jù)服務(wù)效用最大化,是另一個關(guān)鍵科學問題。
首先,利用調(diào)查法、統(tǒng)計分析法結(jié)合客戶滿意度模型(ACSI、ECSI、TCSI),揭示相關(guān)因素影響大數(shù)據(jù)服務(wù)的用戶滿意度規(guī)律;查閱相關(guān)文獻資料,總結(jié)分析客戶滿意度理論最新研究成果,闡明大數(shù)據(jù)服務(wù)的用戶滿意度形成機理,構(gòu)建情景感知的用戶滿意度模型;使用結(jié)構(gòu)方程模型(SEM)對構(gòu)建的滿意度模型進行評估和優(yōu)化。接著,在Hadoop云平臺上的數(shù)字資源大數(shù)據(jù)服務(wù)和遙感大數(shù)據(jù)服務(wù),測量服務(wù)評價過程中評價用戶的搭便車行為,在博弈論框架下分析大數(shù)據(jù)服務(wù)評價中的用戶貢獻行為,進一步歸納出搭便車存在的必然性和導致的問題,借鑒委托代理理論思想建立評價用戶參與評價激勵機制。然后,分別采用統(tǒng)計方法和社會網(wǎng)絡(luò)方法對評價用戶可信度進行評估,建立起符合實際應(yīng)用的評價用戶可信度評估方法。通過情景感知的用戶滿意度模型、評價用戶參與評價激勵機制、評價用戶可信度評估方法的研究獲取完備、可信的用戶滿意度數(shù)據(jù),在此基礎(chǔ)上通過情景相似的用戶滿意度Top-K查詢選取更加可信的用戶滿意度數(shù)據(jù),以此建立用戶滿意度云模型,構(gòu)建基于云模型的可信服務(wù)評價方法,進而實現(xiàn)服務(wù)選取階段的用戶滿意度最大化。在服務(wù)運行階段,通過對服務(wù)參與者間的博弈分析,建立服務(wù)參與者間的兩方博弈和三方博弈模型,求解服務(wù)市場變化情況下,在用戶對收益滿意時,服務(wù)提供商所采取的策略,實現(xiàn)服務(wù)運行期的用戶滿意度最大化。
4.2.1 情景感知的用戶滿意度模型研究方案
(1)揭示相關(guān)因素影響用戶滿意度的規(guī)律。首先研究客戶滿意度模型相關(guān)文獻及應(yīng)用現(xiàn)狀,結(jié)合服務(wù)的QoS模型、服務(wù)協(xié)商,總結(jié)影響用戶滿意度的相關(guān)因素。一級指標包括協(xié)商QoS、感知QoS、品牌形象、感知價值、價格、用戶滿意度、用戶抱怨、情景,繼續(xù)研究二級指標。同時繼續(xù)查閱消費者行為、云服務(wù)領(lǐng)域最新文獻,挖掘用戶滿意度的影響因素,并通過調(diào)查法采集用戶的真實需求,即采用理論歸納和定性實證方法解決指標結(jié)構(gòu)合理性問題;利用SPSS中的KMO和Bartlett檢驗指標是否有效,即采用因子顯性分析解決指標有效性問題;結(jié)合主成分因子分析和定性賦值評價解決指標權(quán)重問題,最終確定指標結(jié)構(gòu)和權(quán)重大小。
(2)闡明用戶滿意度形成機理??偨Y(jié)分析ACSI、ECSI、TCSI用戶滿意度模型,揭示其構(gòu)成機理,結(jié)合大數(shù)據(jù)服務(wù)特點,在情景感知的用戶滿意度模型的指標框架體系下,闡明模型的結(jié)構(gòu)與指標的關(guān)系(見圖4),將繼續(xù)深入研究。在定性實證方面,邀請專家對模型進行評價。
圖4 情景感知的用戶滿意度模型
(3)模型量化評估和優(yōu)化。在Hadoop平臺上數(shù)字資源大數(shù)據(jù)檢索服務(wù)和遙感大數(shù)據(jù)分析服務(wù),基于情景感知的用戶滿意度模型設(shè)計調(diào)查問卷,對觀測變量進行數(shù)據(jù)收集。根據(jù)數(shù)據(jù)質(zhì)量使用結(jié)構(gòu)方程模型(SEM)進行相關(guān)參數(shù)估算,進行模型契合度(也叫擬合度)估算,通過參數(shù)估計中出現(xiàn)的偏差對最終應(yīng)用模型進行修正。有多種軟件可以處理SEM,常用的有LISREL、AMOS和PLS,在綜合分析常用三種軟件優(yōu)缺點的基礎(chǔ)上,結(jié)合研究實際情況,采用一種或多種軟件進行數(shù)據(jù)處理。
4.2.2 評價用戶參與評價激勵機制研究方案
(1)大數(shù)據(jù)服務(wù)評價中搭便車行為測量。首先進行主動測量,即在數(shù)字資源大數(shù)據(jù)檢索服務(wù)和遙感大數(shù)據(jù)分析服務(wù)中植入監(jiān)測程序,記錄服務(wù)請求、服務(wù)應(yīng)答、收到的評價等日志信息;其次,調(diào)查Google、亞馬遜、阿里巴巴云服務(wù)的用戶評價情況;最后,總結(jié)測量和調(diào)查結(jié)果,分析評價用戶貢獻的行為特征,初步歸納出用戶貢獻行為具有志愿和收益共享性而成本(包括占用IT資源、時間等)獨擔兩種特征,繼續(xù)深入探索其它特征。
(2)博弈論框架下構(gòu)建評價用戶貢獻行為模型?;谠u價用戶貢獻行為特征的分析,做出以下假設(shè):大數(shù)據(jù)服務(wù)評價中評價用戶是理性(自私)的;一次評價任務(wù)只能由調(diào)用服務(wù)的用戶完成;大數(shù)據(jù)服務(wù)與評價用戶是委托代理的關(guān)系。效用模型構(gòu)建:設(shè)n個用戶調(diào)用大數(shù)據(jù)服務(wù)并且需要提交評價,評價用戶期望效用最大化模型為:
(1)
其中,至少m個評價用戶提交評價的收益R被所有用戶共享,成本ci由評價用戶獨自承擔,γi是評價用戶i選擇提交評價的概率,γvi是至少m個評價用戶選擇提交評價的概率(當用戶i選擇不提交評價),用戶i的效用Eui是關(guān)于ci、R、γi、γvi的函數(shù)。
博弈分析:首先從兩個局中人的非零和博弈入手來研究兩個評價用戶之間行為決策的相互影響,分析兩個評價用戶在不同策略選擇條件下的收益與損失;接著將問題拓展到多個評價用戶情況,轉(zhuǎn)變?yōu)樵u價用戶i與其他評價用戶之間的博弈。
模型驗證與分析:首先,從評價用戶角度出發(fā),通過實驗觀察評價用戶數(shù)量固定時在不同評價概率下的收益;接著,通過動態(tài)建模,觀察隨著評價用戶數(shù)量的增加,個體評價用戶的評價概率與大數(shù)據(jù)服務(wù)整體評價概率的變化情況;進而通過觀察評價用戶貢獻行為的動態(tài)過程,解釋大數(shù)據(jù)服務(wù)評價中個體評價用戶“搭便車”行為存在的必然性。
(3)基于委托代理的評價用戶貢獻激勵機制。成本收益是影響評價用戶對大數(shù)據(jù)服務(wù)評價貢獻水平的重要因素,若能給予評價用戶一定的報酬,彌補評價用戶貢獻的損失,將會提升評價用戶的貢獻意愿。擬通過虛擬支付方式對于評價用戶的貢獻行為給予一定獎勵,這種獎勵可通過虛擬貨幣進行量化;基于委托代理理論,構(gòu)建評價用戶貢獻激勵機制。
首先,確定評價用戶貢獻的產(chǎn)出函數(shù)Y、成本函數(shù)C、最優(yōu)激勵合同函數(shù)S(Y)、大數(shù)據(jù)服務(wù)期望效用函數(shù)E(Y-S(Y))與評價用戶的期望效用函數(shù)E(S(Y)-C)(分別考慮風險中性和風險規(guī)避型兩種評價用戶)。
然后,基于委托代理,大數(shù)據(jù)服務(wù)為委托人,評價用戶為代理人,IR為參與約束(體現(xiàn)評價用戶在貢獻水平與收益間權(quán)衡),IC為激勵約束(體現(xiàn)評價用戶使自己效用最大化的努力水平),建立基本激勵模型為:
(2)
接著,在基本激勵模型基礎(chǔ)上研究完全信息條件下的激勵模型,此時激勵約束條件不起作用,可以設(shè)置任意滿足參與約束條件的強制合同實現(xiàn)任何貢獻水平。這里同樣考慮評價用戶風險中性和風險規(guī)避兩種情況。
進一步,在基本激勵模型基礎(chǔ)上研究不完全信息條件下的激勵模型。不論對評價用戶的激勵機制如何,評價用戶總是會選擇最優(yōu)的貢獻水平以最大化自身效用,用戶的激勵約束起作用,只能通過最優(yōu)激勵合同的設(shè)置誘使用戶選擇被期望的貢獻水平。
最后,在數(shù)字資源大數(shù)據(jù)檢索服務(wù)和遙感大數(shù)據(jù)分析服務(wù)評價上,驗證該激勵機制對大數(shù)據(jù)服務(wù)評價中評價用戶搭便車行為的擬制效果。
4.2.3 評價用戶可信度評估方法研究方案
首先采用基于Logistic回歸的動態(tài)可信度評估方法評估,再使用基于社會網(wǎng)絡(luò)的可信度評估方法評估,最后將兩種方法的評估結(jié)果進行綜合。
(1)基于Logistic回歸的動態(tài)可信度評估方法。首先,以情景感知的用戶滿意度模型為基礎(chǔ),從評價用戶特征、評價信息、服務(wù)協(xié)商、服務(wù)質(zhì)量、情景、評價用戶抱怨等維度抽取可信度影響變量。然后,采用Logistic回歸模型計算評價用戶可信度,計算方程如下:
(3)
其中,xk(k=1,2,…,m)為影響變量(為消除不同量綱的影響,擬采用min-max標準化或z-score標準化),xj(j=0,1,…,m)為技術(shù)系數(shù),Logistic回歸值p∈(0,1)為評價用戶可信概率。最后,分別取一千個左右樣本作為訓練集和一百個左右樣本作為測試集,對模型進行驗證和分析。
在觀察期內(nèi),評價用戶的可信度是動態(tài)變化的,擬采用馬爾可夫鏈對評價用戶可信度進行動態(tài)預(yù)測。不可信評價用戶評分往往是極端的好或極端的差,評價用戶每提交一次評價后計算其是否為極端樣本,擬采用x-μ≤δCv計算(其中x為評價用戶提交的評分,Cv為離差系數(shù),μ為所有評分的均值估計,δ為所有評分的標準差估計),累計k次為一個狀態(tài),當k大于某個閾值時為不可信,從而獲得評價用戶可信等級的全體狀態(tài)空間。接著,由訓練樣本計算出各狀態(tài)出現(xiàn)的概率,進而動態(tài)預(yù)測評價用戶可信度。
最后,仍然采用Logistic回歸模型綜合靜態(tài)可信度預(yù)測和動態(tài)可信度預(yù)測。
(2)基于社會網(wǎng)絡(luò)的可信度評估方法。評價用戶提交評價后,對近期內(nèi)情景相似的m個匿名評價用戶的滿意度評價進行打分,基于打分建立評價用戶間信任的社會網(wǎng)絡(luò)關(guān)系(見圖5)。其中u0為被評估評價用戶,u1、u2、u3為直接給u0打分評價用戶,u4、u5、ui為間接給u0打分評價用戶。
圖5 評價用戶的信任關(guān)系
影響可信度評估模型的因子還可能有可信度評分次數(shù)、時間權(quán)重、評分用戶的可信度、情景相似度等,分別設(shè)計上述影響因子的計算方法,在此基礎(chǔ)上建立直接可信度評估模型和間接可信度評估模型,進而建立基于社會網(wǎng)絡(luò)的評價用戶可信度評估方法。
4.2.4 基于云模型的可信服務(wù)評價研究方案
大數(shù)據(jù)服務(wù)評價以用戶滿意度數(shù)據(jù)為基礎(chǔ),是多屬性決策問題,采用以下方案實現(xiàn)可信的服務(wù)評價。
(1)情景相似的用戶滿意度Top-K查詢。選取請求用戶情景相似的用戶滿意度數(shù)據(jù)作為服務(wù)評價數(shù)據(jù)更為可信。情景因素包括主觀因素(如偏好)和客觀因素(如時間、位置)。主觀因素描述請求用戶和評價用戶偏好的向量,兩者相似度體現(xiàn)為線性相關(guān)程度,實際應(yīng)用中因素的數(shù)目大于1并且假定用戶能明確給出各因素的評分,因此其相似度計算擬采用皮爾遜相關(guān)系數(shù);客觀因素相似度計算,擬采用歐幾里德距離。對于量綱不同,擬采用min-max標準化或z-score標準化,通過實驗分析兩者在不同數(shù)據(jù)量下的適用性。
大數(shù)據(jù)服務(wù)評價以相似度最大的k個用戶滿意度數(shù)據(jù)為基礎(chǔ),從而轉(zhuǎn)換為數(shù)據(jù)維度為2(主觀因素和客觀因素)的Top-K查詢問題,若采用加權(quán)和計算相似度有f(ti)=w1*f(s)+w2*f(o),ti∈T且1≤i≤m(T為數(shù)據(jù)集,m為數(shù)據(jù)集的勢),w1、w2為權(quán)重且w1+w2=1,f(s)≥0為主觀因素相似度,f(o)≥0為客觀因素相似度。首先,按照各服務(wù)器計算和存儲能力對用戶滿意度數(shù)據(jù)進行水平劃分,劃分方式擬采用隨機劃分、按時間序列劃分、哈希劃分、基于網(wǎng)格劃分,顯然按時間序列劃分最為簡潔,通過實驗分析驗證這些劃分方式的優(yōu)劣?;跀?shù)據(jù)劃分特點設(shè)計基于MapReduce的用戶滿意度數(shù)據(jù)的Top-K查詢算法。
(2)基于云模型的用戶滿意度表示。不確定的用戶滿意度評分,導致分值的分布隨機而模糊,擬采用云模型描述,增加服務(wù)評價的可信度。用戶滿意度指標i評分數(shù)據(jù)的云模型擬表示為Ci=(Exi,Eni,Hei),其中Exi為評分分布的期望,Eni為評分分布的熵,Hei為評分分布熵的熵。借鑒逆向云發(fā)生器的思想,擬采用統(tǒng)計和理論推導相結(jié)合的方法,研究多個云模型擬合方法。最后,在MapReduce框架下設(shè)計并行處理的逆向云發(fā)生器,解決面向海量數(shù)據(jù)時逆向云發(fā)生器效率低的問題。
(3)基于云模型的大數(shù)據(jù)服務(wù)評價。擬采用多屬性決策中常用的有效方法TOPSIS。用戶滿意度由多個云模型描述的指標構(gòu)成,在分析TOPSIS的基本原理基礎(chǔ)上,解決以下兩個問題:為消除不同量綱對評價結(jié)果的影響,擬借鑒正太分布的標準化方法,將各指標進行標準化;擬采用統(tǒng)計和理論推導相結(jié)合方法計算云模型的距離和比較云模型大小。最后,借鑒TOPSIS的基本思想,設(shè)計出基于云模型的大數(shù)據(jù)服務(wù)評價方法。
4.2.5 服務(wù)運行期的博弈優(yōu)化方法研究方案
(1)服務(wù)運行期的兩方動態(tài)博弈模型。若SaaS、PaaS、IaaS服務(wù)作為整體由獨立服務(wù)提供商提供,則為獨占壟斷市場中的用戶和服務(wù)提供商之間動態(tài)博弈(是一種討價還價博弈)。
博弈過程:用戶感知到服務(wù)QoS、價格或市場信號,根據(jù)自身的收益函數(shù)決定對服務(wù)的支付意愿并完成購買,實現(xiàn)自身效用最大化;服務(wù)提供商感知到用戶行為(這里主要指用戶抱怨)和市場信號,調(diào)整服務(wù)價格或QoS,以實現(xiàn)收益最大化;兩方交替進行討價還價,用戶收益達到用戶滿意,則博弈結(jié)束。
用戶和服務(wù)提供商的收益函數(shù):用戶收益是服務(wù)QoS、價格、以及用戶感知的市場信號的函數(shù),體現(xiàn)為用戶滿意度,基于情景感知的用戶滿意度模型建立用戶收益函數(shù);服務(wù)提供商的收益為總收益、總成本以及服務(wù)提供商感知的市場信號的函數(shù),總收益體現(xiàn)為某時刻所有用戶的付費,總成本為某時刻向用戶提供服務(wù)付出的開銷,深入探索服務(wù)提供商的收益函數(shù)。
博弈方的行動集:獨占壟斷市場中只有一個服務(wù)提供商為相同需求用戶提供服務(wù),此時博弈參與方為用戶和服務(wù)提供商,同時假定可伸縮的云資源提供可保證服務(wù)QoS穩(wěn)定;用戶可能采取的策略空間是{增量購買服務(wù),減量購買服務(wù)},服務(wù)提供商可能采取的策略空間是{提升QoS,降低QoS,提升價格,降低價格}。
基于上述分析,建立討價還價博弈模型,用戶與服務(wù)提供商進行博弈,用戶收益達到用戶滿意,博弈結(jié)束,此時用戶滿意度較高。
(2)服務(wù)運行期的三方博弈模型。
SaaS、PaaS服務(wù)提供商提供軟件服務(wù),兩者具有共同特征,必須運行在IaaS上,除了自身提供軟件服務(wù)外還代理IaaS服務(wù)提供商向用戶出售IaaS服務(wù),將其定義為應(yīng)用服務(wù)(SaaS/PaaS)提供商,則為獨占壟斷市場中的用戶、應(yīng)用服務(wù)提供商和基礎(chǔ)設(shè)施服務(wù)提供商之間動態(tài)博弈。
博弈過程:用戶感知到服務(wù)QoS、價格或市場信號,根據(jù)自身的收益函數(shù)決定對服務(wù)的支付意愿并完成購買,實現(xiàn)自身效用最大化;應(yīng)用服務(wù)提供商感知到用戶行為(這里主要指用戶抱怨)和市場信號,根據(jù)自身的收益函數(shù)調(diào)整服務(wù)價格或QoS,以實現(xiàn)收益最大化;基礎(chǔ)設(shè)施服務(wù)提供商感知到應(yīng)用服務(wù)提供商行為和市場信號,調(diào)整基礎(chǔ)設(shè)施服務(wù)價格或QoS,以實現(xiàn)收益最大化;三方按順序進行多次博弈,用戶收益達到用戶滿意,則博弈結(jié)束。
參照兩方動態(tài)博弈中的用戶收益函數(shù)和服務(wù)提供商收益函數(shù),基于三方博弈過程,建立三方博弈中的用戶收益函數(shù)、應(yīng)用服務(wù)提供商收益函數(shù)、基礎(chǔ)設(shè)施服務(wù)提供商收益函數(shù)。
參照兩方動態(tài)博弈中的用戶策略空間和服務(wù)提供商策略空間,基于三方博弈過程,建立三方博弈的用戶策略空間、應(yīng)用服務(wù)提供商策略空間和基礎(chǔ)設(shè)施服務(wù)提供商策略空間。
基于上述分析,建立三方博弈模型,對模型求解,進而得出用戶收益達到滿意時,應(yīng)用服務(wù)和基礎(chǔ)設(shè)施服務(wù)提供商在最大化自身收益情況下采取的策略。
對大數(shù)據(jù)服務(wù)QoS保障的國內(nèi)外研究現(xiàn)狀及發(fā)展動態(tài)進行了系統(tǒng)的總結(jié)和分析,圍繞研究目標和關(guān)鍵科學問題詳細介紹了相關(guān)研究內(nèi)容和擬采用的研究方案。下一步將對提出的研究內(nèi)容進行深入探索,在初步研究方案基礎(chǔ)上提出高效、可行的問題解決方案。密切關(guān)注邊緣計算和智能技術(shù)的發(fā)展,研究其對大數(shù)據(jù)服務(wù)QoS保障技術(shù)帶來的新挑戰(zhàn)和新機遇。