,,,
(浙江工業(yè)大學 計算機科學與技術(shù)學院,杭州 310023)
Web在科技的進步和信息的更新交替中進入了“2.0時代”,同時由于各種信息更新速度的加快,互聯(lián)網(wǎng)的數(shù)據(jù)資源也同步進入了大數(shù)據(jù)云時代,在某種程度上,網(wǎng)絡(luò)垃圾和無效資源也越來越多,當普通用戶想要尋找某種有用的資源時,如何在海量數(shù)據(jù)中篩選出特定的資源變成一個急需解決的問題。
搜索引擎作為人們獲取信息的渠道和關(guān)鍵,始終是各大互聯(lián)網(wǎng)公司的一個爭奪的熱點。當人們坐下來,打開電腦,面對龐大的互聯(lián)網(wǎng)世界時,第一件事情往往就是打開搜索引擎,輸入關(guān)鍵字,從而以最快的速度找到自己想要的信息。但是同樣存在明顯的缺陷,即對用戶的文化水平有一定程度的門檻,有一部分人不知道如何聯(lián)想到并精確的概括自己的目標信息,從而錯過很多實時信息;還有一些用戶并沒有絕對明確的目標,只是想瀏覽一些自己感興趣的話題,并不想要通過某些關(guān)鍵字使得信息狹隘化,因為有些關(guān)鍵字之間的共同信息領(lǐng)域很??;還有一些用戶對感興趣的話題并不能用幾個關(guān)鍵字去概括,因而無法定位到自己想要的數(shù)據(jù)資料。然而對數(shù)據(jù)信息的制造者而言,由于現(xiàn)在互聯(lián)網(wǎng)的競爭非常激烈,希望自己的信息被關(guān)注被采納、用戶量節(jié)節(jié)攀升也不是一件容易的事情。在這種情況背景下,數(shù)據(jù)推薦應(yīng)需而生。對于用戶而言,數(shù)據(jù)推薦系統(tǒng)可通過云計算,在使用界面里主動跳出或許對用戶有價值的信息,從而使用戶達到自己的目的,得到更好地使用體驗;而對于制造者,數(shù)據(jù)推薦可以在一定程度上合理地把信息推銷給潛在用戶,從而增加自己的點擊量,這對于雙方而言是一個共贏的局面。
現(xiàn)如今,數(shù)據(jù)推薦引擎適用范圍非常廣泛,尤其值得關(guān)注的就是近幾年發(fā)展迅猛的電子商務(wù)平臺,以淘寶為例:當使用者搜索過某類商品以后,它就會儲存這個點擊數(shù)據(jù)同時進行某種用戶偏好的計算統(tǒng)計,結(jié)合商家的綜合排位和對淘寶平臺的廣告買位,在使用者平臺上進行個人化的反饋,使用者就會很容易的注意到自己感興趣的信息,同時商家獲取更多的點擊量和利潤,淘寶自身也獲得巨額利潤,這是一個“三贏”的結(jié)果。再如分享交互類的社交平臺,以新浪微博為例,建立推薦的機制,向用戶推薦好友的搜索熱點和關(guān)注人分享的內(nèi)容,使得每一個使用者的界面都是獨特的個人化的,而且這都是使用者一手操辦,所以這些信息對于使用者而言是感興趣的有價值的。同時被關(guān)注者也可以利用這種關(guān)注量和影響力獲得經(jīng)濟利益,平臺作為秩序的維持者和信息資料的擁有者也可以獲得巨大的利益。就目前而言,信息推薦系統(tǒng)在各大領(lǐng)域都產(chǎn)生了良好的效果和不可或缺的作用,用戶也逐漸習慣和信賴信息推薦系統(tǒng),可以說這是一個成功的機制。
國內(nèi)外學者和研究機構(gòu)從不同的視角對多源異構(gòu)數(shù)據(jù)和推薦方法進行了研究。
從RSS推薦技術(shù)方向出發(fā)的代表性工作主要有:Hao Han等人[1]在RSS推送的基礎(chǔ)上構(gòu)造網(wǎng)絡(luò)新聞文章內(nèi)容自動提取系統(tǒng),可以從新聞網(wǎng)頁中提取對用戶有價值的文章內(nèi)容;陳鋒等人[6]對信息服務(wù)資源進行聚合需求分析,提出了一種基于RSS推送技術(shù)的信息服務(wù)內(nèi)容聚合服務(wù)方式。
其次,協(xié)同過濾推送是目前主要使用的推送方式之一,協(xié)同過濾推送不僅可以實現(xiàn)信息的推送,而且可以根據(jù)用戶的興趣實現(xiàn)個性化推送。目前對協(xié)同過濾推送技術(shù)研究中具有代表性的有:郭艷紅等人[7]提出了一種基于稀疏矩陣的個性化改進策略,能夠避免用戶之間相似度不密切的關(guān)系,提高了矩陣在稀疏情況的預測準確度。李聰、梁昌勇等人[8]提出了基于領(lǐng)域最鄰近的協(xié)同過濾推薦算法,使數(shù)據(jù)的稀疏性得到了降低,提高了推薦準確性。
從數(shù)據(jù)傳輸方向出發(fā)的代表性工作主要是Menglan Hu等人[2]設(shè)計了一種分階段獲取云端分享數(shù)據(jù)的算法,能夠有效地控制數(shù)據(jù)的傳輸成本。國內(nèi)的許富龍、劉明等人[9]進一步提出了一種基于相對距離感知的動態(tài)數(shù)據(jù)傳輸策略,采用傳感器節(jié)點到匯聚點的相對距離來計算節(jié)點傳輸概率的大小,并以此作為消息傳輸時選擇下一跳的依據(jù)。
在利用推送技術(shù)實現(xiàn)系統(tǒng)的研究中,中國科學院軟件研究所的劉鑫、陳偉[10]提出了一種基于AJAX和Server Push的web樹組件,為用戶提供了類似于在windows資源管理器中對目錄樹操作的基本功能和用戶體驗。
但以上方法均只是通過修改推送方式而實現(xiàn)對單一數(shù)據(jù)源進行推薦,并沒有過多考慮多源異構(gòu)數(shù)據(jù)的個性化推薦問題,也沒能實現(xiàn)云推薦。本文提出的USDR模型面向多源異構(gòu)數(shù)據(jù),通過將用戶數(shù)據(jù)和系統(tǒng)數(shù)據(jù)分類來快速得到用戶和系統(tǒng)的不同推薦度,以實現(xiàn)數(shù)據(jù)的高效推薦。
在數(shù)據(jù)物流云推送平臺中,各類云數(shù)據(jù)數(shù)量龐大,種類繁多,根據(jù)系統(tǒng)服務(wù)種類大致可以分為成績查詢服務(wù)、工資數(shù)據(jù)服務(wù)、排隊服務(wù)、交通數(shù)據(jù)服務(wù)、購物信息服務(wù)、股票期貨服務(wù)、多媒體數(shù)據(jù)推送服務(wù)等。
由于是基于云推送的數(shù)據(jù)物流服務(wù)平臺,平臺中許多系統(tǒng)會提供類似的服務(wù),比如3種股票軟件都通過本平臺為客戶提供金融數(shù)據(jù)推送,但是其中一款股票軟件是收費軟件,數(shù)據(jù)推送響應(yīng)時間更快、推送的服務(wù)更多,但價格也是同類股票軟件中最高的。除了相同類型的服務(wù)中出現(xiàn)的情況,用戶數(shù)據(jù)信息之間也存在不同,用戶將會根據(jù)自己的基礎(chǔ)信息選擇不同的服務(wù)。比如交通數(shù)據(jù)服務(wù)中,有些用戶可能上班時間比較自由,那么他們可以選擇上下班高峰期過后的道路數(shù)據(jù)推送服務(wù),而有些用戶需要準時到達單位,那么推送給他們當時的路況數(shù)據(jù),可以使他們選擇在上下班高峰期避開一些擁堵路段;同樣,購物信息服務(wù)中,經(jīng)濟條件好的用戶可能比較偏好奢侈品,而經(jīng)濟條件一般的用戶則偏好于普通實用的商品,所以在推送數(shù)據(jù)時就會有一定的差異性,需要建立用戶和系統(tǒng)的關(guān)系數(shù)據(jù)模型。
當用戶請求獲取一種類型的服務(wù)時,數(shù)據(jù)物流服務(wù)平臺應(yīng)該自動根據(jù)現(xiàn)平臺中相同類型的系統(tǒng)和用戶自身的數(shù)據(jù),推送給用戶最合適的服務(wù),這樣就既能滿足用戶的功能性需求,同時也滿足了用戶的個性化需求。
用戶數(shù)據(jù)主要可以分為用戶基礎(chǔ)數(shù)據(jù)、時間數(shù)據(jù)、地點數(shù)據(jù)、用戶偏好數(shù)據(jù)、歷史數(shù)據(jù)等。
系統(tǒng)數(shù)據(jù)主要可以分為服務(wù)類型數(shù)據(jù)(如成績查詢服務(wù)、金融股票服務(wù)等)、服務(wù)介紹以及這些服務(wù)的范圍(價格、位置)。這些系統(tǒng)中的數(shù)據(jù)結(jié)構(gòu)多樣,類型復雜,并且有些數(shù)據(jù)是動態(tài)變化的。為了能夠有效的處理這些云數(shù)據(jù),本文提出了USDR模型。
根據(jù)上文中的分析可以看出,用戶數(shù)據(jù)基本可以劃分為五類:
用戶基本數(shù)據(jù)(BasicData):包括用戶姓名、性別、身份證、電話、出身日期、職業(yè)、畢業(yè)學校、愛好、出生地等。
時間數(shù)據(jù)(TimeData):記錄用戶使用系統(tǒng)的日期和時間,同時也記錄用戶所在的時區(qū)。
地點數(shù)據(jù)(LocationData):用于記錄用戶所在的位置,包括城市,住所和工作地。
環(huán)境數(shù)據(jù)(EnvironmentData):記錄當日天氣情況,溫度等。
用戶偏好數(shù)據(jù)(PerferenceData):記錄用戶的偏好情況,如運動、電影、理財、旅游、讀書等。
歷史數(shù)據(jù)(HistoryData):記錄用戶曾經(jīng)使用的系統(tǒng)服務(wù),常用的理財,消費記錄以及日志數(shù)據(jù)等。
通過UML工具可以很清晰的看出用戶各類數(shù)據(jù)之間的關(guān)系,并且通過設(shè)置主鍵顯示出各條屬性的重要程度,具體如圖1所示。
圖1 用戶數(shù)據(jù)模型
系統(tǒng)數(shù)據(jù)服務(wù)有成績查詢服務(wù)、工資數(shù)據(jù)服務(wù)、銀行排隊服務(wù)、交通數(shù)據(jù)服務(wù)、酒店預訂服務(wù)、股票期貨服務(wù)、多媒體數(shù)據(jù)推送服務(wù)。這些系統(tǒng)都屬于不同的領(lǐng)域,這些系統(tǒng)的數(shù)據(jù)類型復雜程度高,數(shù)量大,若不進行建模將很難進行云推送,在對系統(tǒng)數(shù)據(jù)進行建模之后也更利于數(shù)據(jù)的個性化推薦,本章選擇具有代表性的成績查詢服務(wù)系統(tǒng)和多媒體數(shù)據(jù)服務(wù)系統(tǒng)進行系統(tǒng)數(shù)據(jù)模型建模。
2.2.1 成績查詢服務(wù)系統(tǒng)
成績查詢服務(wù)系統(tǒng)主要為在校學生提供每個學期結(jié)束之后的成績查詢服務(wù),首先最高層應(yīng)該為用戶的類型,為本科生、碩士研究生還是博士研究生,確定了學生類型之后需要到各個學院中查詢數(shù)據(jù),由于很多學院中的必修課是相同的,所以為了避免重復的查詢接下來模型中將分為必修課和選修課以及實踐活動。最終得到各門功課的成績。最后學生得到了該門課的成績之后,還需要對老師進行評價。
系統(tǒng)數(shù)據(jù)模型再結(jié)合用戶數(shù)據(jù)模型可以看出,在用戶數(shù)據(jù)模型中的用戶偏好,畢業(yè)院校就可以更加精確地給用戶推送推薦數(shù)據(jù),同時這種分層的結(jié)構(gòu)能使云推送更加高效。
2.2.2 多媒體數(shù)據(jù)服務(wù)系統(tǒng)
多媒體數(shù)據(jù)服務(wù)相對于成績查詢服務(wù)將會復雜很多,多媒體數(shù)據(jù)服務(wù)各種系統(tǒng)中,可以將數(shù)據(jù)的類型分為文字數(shù)據(jù)、音頻數(shù)據(jù)、視頻數(shù)據(jù)、圖文數(shù)據(jù)等。根據(jù)多媒體服務(wù)的不同類型和用戶的偏好將分為新聞,體育,娛樂,游戲,電影等,然后再對具體需要推送的數(shù)據(jù)進行分類。
系統(tǒng)數(shù)據(jù)模型主要元素包括基本數(shù)據(jù)、功能數(shù)據(jù)和其他數(shù)據(jù):
基礎(chǔ)數(shù)據(jù)(SerBasicData):主要是對系統(tǒng)服務(wù)的基本描述,包括服務(wù)提供商,服務(wù)類型,服務(wù)ID,服務(wù)名稱,服務(wù)簡介等數(shù)據(jù)。
功能數(shù)據(jù)(SerFunctionData):主要對服務(wù)中的功能性參數(shù)進行描述,即服務(wù)輸入輸出參數(shù),服務(wù)的接口參數(shù),最終服務(wù)執(zhí)行結(jié)果等。
其他數(shù)據(jù):主要有些系統(tǒng)需要定位數(shù)據(jù),天氣數(shù)據(jù)等其他因素。
傳統(tǒng)的推薦算法有皮爾遜相關(guān)系數(shù)法、向量余弦法、斯皮爾曼相關(guān)系數(shù)法等等,在不同的領(lǐng)域中,需要選取不同的相似度計算方法。由于云數(shù)據(jù)的特殊性,本文重新設(shè)計了基于USDR的個性化云推送推薦算法,根據(jù)用戶、系統(tǒng)的相似值來計算推薦的系統(tǒng)數(shù)據(jù)。本章的模型中存在用戶數(shù)據(jù)和系統(tǒng)數(shù)據(jù)兩種數(shù)據(jù)類型,針對該模型設(shè)計了基于用戶的云推薦算法和基于系統(tǒng)的云推薦算法。
基于用戶的云推薦算法主要目的在于計算兩個用戶的相似度,本算法中主要使用用戶行為相似度來計算用戶的類似喜好。本算法由兩部分組成:一部分采用用戶基礎(chǔ)屬性來決定用戶的相似程度,通過計算得出的基本屬性差異越小,則相似程度越高;第二部分是偏好、位置和服務(wù)記錄數(shù)據(jù)等,通過查看用戶的地理位置和歷史感興趣的系統(tǒng)的數(shù)值,該數(shù)值越大,則用戶之間的相似程度越高,最后計算總相似度。
3.1.1 基礎(chǔ)屬性相似度
基礎(chǔ)屬性一般都是數(shù)值類型,如性別,年齡,畢業(yè)院校等。對于數(shù)值型屬性,只需要計算絕對值之差|D|=|Attr1-Attr2|。對于名稱型的基礎(chǔ)數(shù)據(jù),一般取值類型比較單一,就可以采用二進制編碼的方式來表示,比如性別:男、女,分別對應(yīng)00、01。其他以此類推。最終將用戶全部名稱型數(shù)據(jù)編碼串聯(lián)起來,行成一個二進制串。
不同的數(shù)值型屬性的絕對值最大與最小的差距為[α1,αn],然后把這個區(qū)間劃分為n-1個相等的區(qū)間{[α1,α2],[α2,α3],...,[αn-1,αn]},對每個區(qū)間給予相應(yīng)的數(shù)值{0,1,2,3...n},當用戶的數(shù)值型屬性絕對值落在某個區(qū)間時,即可得出屬性間的距離Dbnum。對于名稱型屬性,通過確定編碼位數(shù)n,然后將每個取值通過格雷編碼,然后依次鏈接起來,最后通過計算海明距離,得到名稱型屬性距離DH。定義用戶A和B,每個基礎(chǔ)屬性的權(quán)重值為wi,則所有屬性權(quán)重值滿足:
(1)
對于數(shù)值型的屬性距離Dbnum,根據(jù)上面的解釋,定義不同的取值區(qū)間:
若α∈[α1,α2],則dbnum=0;
若α∈[α2,α3],則dbnum=1;
.......
若α∈[αn-1,αn],則dbnum=n-1;
數(shù)值屬性的距離計算為:
(2)
對于名稱型的屬性距離Dbnum,則對不同的取值進行編碼。將用戶的全部名稱屬性編碼串聯(lián)起來,形成二進制串At;采用At的海明距離來計算用戶名稱屬性的距離。
DH=wDhm(DbnumA,DbnumB)
(3)
最終得到2個用戶A與B的基礎(chǔ)屬性距離:
(4)
通過差值DA-B可以看出,DA-B越小,相似度則越大,DA-B越大,則相似度越小。
3.1.2 用戶偏好相似度
若給定用戶A和B,N(A)表示用戶A的偏好相似度集合,N(B)表示用戶B的偏好相似度集合(如時間,位置,系統(tǒng)使用情況等),運用余弦公式相似度計算公式:
(5)
表1 用戶偏好表
從表1的用戶偏好可以得出:用戶A對{成績,金融,酒店}方面的系統(tǒng)感興趣,用戶B對{成績,工資}方面的系統(tǒng)感興趣,所以可以計算出用戶A和用戶B的偏好相似度,如下所示:
用余弦公式計算用戶間兩兩的相似度之后,算法通過綜合分析基礎(chǔ)數(shù)據(jù)相似度和用戶偏好數(shù)據(jù)相似度后,再進行推薦,推薦度公式如6所示:
(6)
公式中,DA-B為基礎(chǔ)數(shù)據(jù)的差值,N(i)表示對項目i有偏好的用戶組,Re(u,k)表示存在與用戶A偏好類似的用戶組。Wab描述用戶A與用戶B的相似度,ybi表示用戶B對項目i的偏好程度。
基于系統(tǒng)的云推薦算法和基于用戶偏好的推薦算法有些類似,主要通過以下兩步完成:首先計算系統(tǒng)之間的相似程度,然后根據(jù)相似度生成系統(tǒng)推薦列表。
根據(jù)余弦公式可得系統(tǒng)的相似度:
(7)
(8)
假設(shè)有a,b,c,d,e5個系統(tǒng),同時存在A,B,C,D,E5位用戶,對每位用戶偏好的項目用矩陣表示:
用戶A:偏好a,b,c系統(tǒng),用矩陣表示為:
用戶B:偏好a,b,d系統(tǒng),用矩陣表示為:
用戶C:偏好a,d系統(tǒng),用矩陣表示為:
用戶D:偏好b,c,e系統(tǒng),用矩陣表示為:
用戶E:偏好a,e系統(tǒng),用矩陣表示為:
將A,B,C,D,E矩陣全部相加之后可得矩陣S,S[i][j]則表示同時對系統(tǒng)i和系統(tǒng)j都偏好的用戶數(shù)量。
得到相似度矩陣之后,通過公式(7)計算用戶a對系統(tǒng)i的推薦度:
Recommdsys(a,i)=∑i∈N(u)∩S(i,k)wij
(9)
公式(9)中表示當前用戶的偏好集合,S(i,k)表示與系統(tǒng)i比較相似的K個系統(tǒng)的集合,wij是系統(tǒng)i與系統(tǒng)j的相似度。將該推薦度從大到小排列,采用TOP-N的方式取前N個系統(tǒng)推薦給用戶。
為了達到更好的用戶體驗,為用戶提供個性化的推薦服務(wù),基于USDR模型運行過程如圖2所示,首先根據(jù)用戶注冊數(shù)據(jù)為用戶建模,其次為平臺中每個系統(tǒng)進行建模,當模型構(gòu)建完成之后,分析用戶注冊數(shù)據(jù)中的基礎(chǔ)屬性數(shù)據(jù),計算出基礎(chǔ)屬性相似度,再算出用戶偏好屬性相似度,最后同理算出基于系統(tǒng)的云推送推薦算法,最終為用戶推送推薦數(shù)據(jù)。
通過分別計算用戶和系統(tǒng)數(shù)據(jù)的推薦度會導致結(jié)果比較粗糙,為了使得云推薦算法更加精確,將用戶數(shù)據(jù)推薦度加入到系統(tǒng)數(shù)據(jù)推薦度中,得出綜合推薦度列表,將使推薦度的結(jié)果更加準確和方便,更加方便于下一步的云推送。如何使用基于USDR模型的云推薦算法得出用戶推薦度列表的具體流程如圖3所示。
圖2 基于USDR模型運行過程
圖3 基于USDR模型的云推薦算法運行流程
1)查看用戶歷史記錄數(shù)據(jù)表,若用戶的歷史數(shù)據(jù)為空,則說明為新注冊用戶,那么就執(zhí)行步驟2),否則執(zhí)行步驟5);
2)查看用戶基礎(chǔ)數(shù)據(jù)中的好友表,若有好友,則執(zhí)行步驟3),若無,則執(zhí)行步驟4);
3)使該用戶分別與每位好友分別用公式DA-B進行計算,得出相似度,查看相似度在設(shè)定的權(quán)重值內(nèi)的用戶與該用戶關(guān)系最密切的好友,執(zhí)行步驟4);
4)使用公式(4)計算所有在權(quán)重值范圍內(nèi)的好友的偏好推薦度Recommenduser,加入用戶推薦列表中,執(zhí)行步驟5);
5)使用公式(7)計算的歷史數(shù)據(jù)表中每個系統(tǒng)的推薦度RecommendSystem,將這些系統(tǒng)放入推薦列表,執(zhí)行步驟6);
6)將步驟4)和步驟5)中的Recommenduser和RecommendSystem分別平方,再求和開根號得出綜合推薦度:
Recommendgeneral=
(10)
7)根據(jù)綜合推薦度,加入到綜合推薦度列表。
本文使用云推薦方法在安卓和iOS中進行了測試,云數(shù)據(jù)來源于成績系統(tǒng),工資系統(tǒng)和微影視系統(tǒng),采集到數(shù)據(jù)后將數(shù)據(jù)的主要權(quán)重值分為:用戶權(quán)限,用戶登錄時間,用戶發(fā)布/訂閱的模式(一對多/一對一),用戶登錄數(shù)量,傳輸數(shù)據(jù)量。權(quán)重w是經(jīng)過綜合考慮而確定的。目前數(shù)據(jù)物流云推送平臺中存在的系統(tǒng)如圖4所示。
圖4 用戶登錄平臺選擇偏好的系統(tǒng)
用戶在手機端進行注冊,主要需要將用戶基礎(chǔ)數(shù)據(jù)和偏好信息填寫完畢,方便接下來的云推薦系統(tǒng)給用戶推薦個性化內(nèi)容。當用戶基礎(chǔ)數(shù)據(jù)、偏好數(shù)據(jù)和系統(tǒng)數(shù)據(jù)都進行綁定之后,得到如圖5所示的界面,此時平臺已經(jīng)根據(jù)云推薦算法將推薦數(shù)據(jù)放入推薦列表中,等待下一步的云推送。
圖5 用戶功能頁面
為衡量本文提出的USDR云推薦算法的能力,從算法效率、系統(tǒng)數(shù)量、平均傳輸率,通信率,靜置時流量等方面來對算法有效性進行評估。
首先測試單機中的普通推薦算法和云推送平臺中的推薦算法進行比較,單機使用Windows8 64位操作系統(tǒng),8GB內(nèi)存,10臺虛擬機同樣使用Windows8 64位操作系統(tǒng),8GB內(nèi)存,分別計算虛擬數(shù)據(jù)量為10~100萬的數(shù)據(jù)量。
圖6 單機與云平臺中推薦算法效率對比
為了得到當在數(shù)據(jù)量相同時運算速度與虛擬機數(shù)據(jù)的關(guān)系,實驗中使用50萬的數(shù)據(jù)量,分別測試虛擬機數(shù)量為5~10臺時云推薦算法運行的效率。
圖7 虛擬機數(shù)量不同對推薦算法的影響
平均傳輸率是指數(shù)據(jù)傳輸平均的“倍速”數(shù)。單倍數(shù)傳輸時,即可記為1倍速,普通推送的平均傳輸率為10倍速,在數(shù)據(jù)量相同時,結(jié)果如表2所示。
表2 平均傳輸率數(shù)據(jù)表 %
通信率是指單位時間內(nèi)用戶與云推送平臺的通信次數(shù),測試用戶是否愿意使用該平臺進行數(shù)據(jù)推送,并同時測試了在通信次數(shù)高的時候會不會產(chǎn)生其他問題(結(jié)果如圖8所示),普通的推薦算法通信率基本不變是由于在推送任務(wù)隊列消息的整個過程中一直都會向服務(wù)器發(fā)送請求,而本文提出的云推薦方法處于信息收集階段,隨著系統(tǒng)的運行,任務(wù)數(shù)量增多,優(yōu)勢就逐漸顯示出來,在任務(wù)數(shù)越多時,花費的通信量反而變少。
圖8 通信率變化圖
靜置時流量是指在手機靜置時由于推送而產(chǎn)生的額外流量,測試云推送平臺是否會因為通信率的改善而產(chǎn)生大量流量,分別使用云推送平臺和傳統(tǒng)推送平臺進行測試(如表3所示),實驗結(jié)果表明云推送平臺在移動設(shè)備靜置時間較長情況下流量消耗少于傳統(tǒng)推送平臺。
表3 靜置時流量對比
本文針對傳統(tǒng)的推送方式在推送多源異構(gòu)數(shù)據(jù)時遇到的效率低,實時性差等問題,設(shè)計了面向多源異構(gòu)數(shù)據(jù)的云推送平臺來滿足云推送環(huán)境,并通過USDR模型解決了多源異構(gòu)數(shù)據(jù)推送問題,滿足了用戶需求。
然而,該平臺能否滿足所有的用戶需求,能否供海量用戶使用還需要進行驗證,云推送平臺本身的性能提升以及各種演化方式將是本文下一步的研究內(nèi)容。相信隨著這些關(guān)鍵問題的攻破,面向多源異構(gòu)數(shù)據(jù)的云推送平臺將為用戶帶來更好的推送體驗。