尚明生
(1.中國科學(xué)院 重慶綠色智能技術(shù)研究院,重慶4007142;2.電子科技大學(xué) 大數(shù)據(jù)研究中心,成都 611731)
推薦系統(tǒng):從個性化算法到算法的個性化1
尚明生
(1.中國科學(xué)院重慶綠色智能技術(shù)研究院,重慶4007142;2.電子科技大學(xué)大數(shù)據(jù)研究中心,成都611731)
推薦系統(tǒng)已經(jīng)得到廣泛研究和應(yīng)用并產(chǎn)生了巨大價值。作者提出推薦算法個性化的概念,并將推薦系統(tǒng)劃分為非個性化系統(tǒng)、個性化推薦系統(tǒng)、算法參數(shù)個性化的推薦系統(tǒng),以及推薦算法個性化的系統(tǒng)。指出了推薦系統(tǒng)兩個全新的研究方向,并初步展示了其在推薦效果提升上的巨大潛力。
推薦系統(tǒng);個性化推薦;算法參數(shù)的個性化;推薦算法的個性化
互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展使得大量的信息同時呈現(xiàn)在我們面前,例如淘寶上有8億件商品,百度收錄超過百億的中文網(wǎng)頁。面對如此眾多的信息,用戶往往很難快速地找到自己想要的內(nèi)容,這就是信息過載問題。目前解決信息過載問題主要有兩個技術(shù):搜索引擎[1]和推薦系統(tǒng)[2]。搜索引擎往往被動地返回與用戶給定查詢關(guān)鍵字相關(guān)的內(nèi)容,而推薦系統(tǒng)可以主動預(yù)測用戶可能感興趣的信息。事實上,目前搜索引擎在不斷植入推薦技術(shù),而且從長遠來看,推薦系統(tǒng)將是解決信息過載問題的最終手段。推薦系統(tǒng)可以推薦的“信息”包括的種類很廣,比如電子商務(wù)系統(tǒng)中的商品、社交網(wǎng)絡(luò)中的朋友、約會網(wǎng)站中的相親對象等等。為方便,本文后續(xù)將推薦的對象根據(jù)上下文分別稱之為對象或者產(chǎn)品。
總的來說,推薦系統(tǒng)的發(fā)展經(jīng)歷了從非個性化到個性化的過程。在推薦系統(tǒng)中,推薦算法是最為核心和關(guān)鍵的因素。當前已經(jīng)提出很多個性化推薦算法,很多學(xué)者也從不同的角度對推薦算法進行了分類。文獻[2-3]對推薦系統(tǒng)進行了比較全面的綜述,文獻[4]對最近的一些工作進行了總結(jié),特別是基于物理思想的推薦算法研究。推薦算法一般分為預(yù)測和排序兩個階段。最簡單的推薦算法僅是一個排序算法,它根據(jù)一定的機制對所有商品排序后,將排隊靠前的對象推薦給用戶。這種算法不具有個性化,因為每個用戶得到的推薦列表是一樣的。稍微復(fù)雜的推薦算法,將用戶的歷史行為信息考慮在內(nèi),為用戶推薦其未來可能關(guān)注的對象。在這種算法作用下,由于不同的用戶其歷史選擇行為不同,所以得到的推薦結(jié)果也不同,用戶由此得到了互不相同的個性化的推薦結(jié)果。
然而,在現(xiàn)有的推薦系統(tǒng)中,往往使用單一的推薦算法,或者即使采用多種算法進行整合,但經(jīng)過各種參數(shù)調(diào)優(yōu)后的推薦算法由于各個參數(shù)在使用時對所有用戶都是固定不變的,仍然可以視為一個單一的推薦算法。然而研究表明不同用戶在選擇產(chǎn)品時往往具有不同的模式,例如文獻[5]表明,經(jīng)驗豐富的用戶善于發(fā)現(xiàn)小眾對象,而新手往往選擇流行產(chǎn)品。事實上,隨著互聯(lián)網(wǎng)技術(shù)的持續(xù)發(fā)展,用戶變得越來越多元化,對系統(tǒng)中所有用戶使用單一的算法,已經(jīng)不能滿足用戶的需求。文獻[6]提出一種個性化推薦算法,通過為不同的用戶設(shè)置不同的參數(shù)來混合兩個算法,相比固定參數(shù)而言,獲得了更好的推薦效果。我們稱其為算法參數(shù)個性化的推薦算法。
理想的推薦系統(tǒng),應(yīng)該是每個用戶都采用最適合他們自己的推薦算法?;诖耍疚奶岢隽送扑]算法個性化的概念。由此,我們將推薦系統(tǒng)劃分為非個性化推薦系統(tǒng)、(傳統(tǒng)的)個性化推薦系統(tǒng)、算法參數(shù)個性化的推薦系統(tǒng),以及最終的,推薦算法個性化的推薦系統(tǒng)。本文將選擇幾個主流的推薦算法,在典型數(shù)據(jù)集上對幾個主要評價指標進行對比,來展示算法個性化的推薦系統(tǒng)的巨大潛力。本文的結(jié)構(gòu)安排如下:第2部分介紹各個推薦算法,第3部分對各個算法進行簡單對比,最后給出總結(jié)和討論。
本節(jié)中,我們將按照從非個性化推薦系統(tǒng)到算法個性化推薦系統(tǒng)的劃分,選擇各自代表性的推薦算法進行簡單介紹。
1.1 非個性化推薦
在個性化推薦出現(xiàn)之前,已經(jīng)在廣泛使用推薦技術(shù)。例如,各種各樣的排行榜事實上就起到了推薦的效果,報刊雜志還有各類的編輯推薦欄等等,其中最簡單和典型的非個性化推薦算法是基于產(chǎn)品流行性的推薦算法(記為Popular)。Popular算法將當前被用戶選擇次數(shù)最多,也就是最受歡迎的產(chǎn)品推薦給用戶。該算法的實現(xiàn)首先需要對產(chǎn)品的度(產(chǎn)品當前被選擇的次數(shù))進行統(tǒng)計,然后按照產(chǎn)品度從大到小的順序進行排序,排除掉用戶已經(jīng)選擇過的產(chǎn)品,將其他產(chǎn)品推薦給用戶。
1.2 個性化推薦算法
非個性化推薦算法呈現(xiàn)給用戶幾乎一模一樣的推薦列表,顯然不能滿足用戶的個性化需求,于是個性化推薦算法登上歷史舞臺。目前已有很多個性化推薦算法被提出,例如基于用戶的協(xié)同過濾[7](UCF)、基于產(chǎn)品的協(xié)同過濾[8](ICF)、基于熱傳導(dǎo)的算法[9](HeatS)以及基于物質(zhì)擴散的算法[10](Diffuse)等。基于矩陣分解(Matrix Factorization)的算法也被大量提出和應(yīng)用于推薦系統(tǒng)[11]。此外,有研究者試圖將現(xiàn)有的推薦算法進行混合的推薦算法[11](HHP),在真實系統(tǒng)中,通常是若干算法的整合得到一個實用的推薦算法,其整合的參數(shù)通?;趯W(xué)習(xí)得到,在應(yīng)用中通常所有用戶的算法參數(shù)是一樣的。
最早的而且應(yīng)用最廣泛的推薦算法是協(xié)同過濾推薦算法。1994年提出的UCF算法的基本思路是“相似的用戶喜歡相似的產(chǎn)品”。當預(yù)測目標用戶對某產(chǎn)品的喜好程度時,UCF關(guān)注與目標用戶相似的其他用戶對該產(chǎn)品的喜好,將這些用戶對該產(chǎn)品的喜好進行加權(quán),預(yù)測目標用戶對該產(chǎn)品的喜好,權(quán)重就是目標用戶與其他用戶的相似度。用戶相似度的計算基于用戶過去的選擇行為,余弦相似度是一種常用的相似度計算方法。
其中,Γi表示用戶i選擇過的產(chǎn)品集合,ki是用戶i的度,顯然ki=|Γi|。求出目標用戶與其他用戶的相似度之后,即可進行預(yù)測評分。UCF為用戶i預(yù)測產(chǎn)品α的得分為:
基于用戶的協(xié)同過濾具有很好的可解釋性,但在實際應(yīng)用中,由于用戶眾多且數(shù)目經(jīng)常變動,且用戶評分的產(chǎn)品數(shù)目不多,因此基于用戶的協(xié)同過濾推薦算法其實很難找到合適的興趣相投的鄰居??紤]到產(chǎn)品通常比較固定,文獻[8]提出了基于產(chǎn)品的協(xié)同過濾推薦算法(ICF)。當預(yù)測目標用戶對某產(chǎn)品的喜好時,ICF關(guān)注目標用戶對與該產(chǎn)品相似的產(chǎn)品的喜好,將這些喜好值進行加權(quán),形成目標用戶對該產(chǎn)品的喜好,權(quán)重是其他產(chǎn)品與該產(chǎn)品的相似度。相似度的計算基于產(chǎn)品過去被選擇的記錄,常用的相似度指標有余弦相似度等。ICF首先計算產(chǎn)品之間的相似度并基于相似度進行預(yù)測評分。產(chǎn)品間的相似度定義為:
根據(jù)產(chǎn)品的相似度,即可進行預(yù)測評分
基于產(chǎn)品的相似度解決了系統(tǒng)中用戶數(shù)目較多且經(jīng)常變動的問題,然而,在考慮產(chǎn)品相似度時,簡單考慮兩個產(chǎn)品共同評分的用戶數(shù)目,卻沒有對這些用戶加以區(qū)分,事實上,不同的用戶具有不同的特征,比如他們選擇的產(chǎn)品數(shù)目不同。文獻[9]提出了一種基于物理傳播過程的推薦算法HeatS,文獻[10]提出了與HeatS算法對應(yīng)的Diffuse算法。HeatS算法和Diffuse算法在實質(zhì)上仍然是一種基于產(chǎn)品相似度的推薦算法,但是在相似度的計算過程中,不僅考慮產(chǎn)品的度,還考慮了用戶的度。
HeatS算法和Diffuse算法計算產(chǎn)品間相似度的公式分別為:
HeatS算法和Diffuse算法將用戶對產(chǎn)品的偏好信息建模為二部圖網(wǎng)絡(luò),推薦算法是資源在該二部圖上的傳播機制。目標用戶被賦予一定的初始資源,而目標用戶得到的最終資源反映了用戶對產(chǎn)品的偏好程度。算法為用戶預(yù)測產(chǎn)品的得分為:
1.3 算法參數(shù)的個性化
熱傳導(dǎo)算法和物質(zhì)擴散算法在計算產(chǎn)品相似度時,同時考慮到了用戶度和產(chǎn)品度,相比于協(xié)同過濾算法,具有更好的推薦準確性。然而經(jīng)過仔細研究發(fā)現(xiàn),從資源傳播的角度講,Diffuse算法只考慮了目標產(chǎn)品的度,而HeatS則只考慮了源產(chǎn)品的度。為了更全面地刻畫用戶和產(chǎn)品,文獻[12]又提出了一種基于物質(zhì)擴散和熱傳導(dǎo)的混合算法 HHP,通過調(diào)節(jié)混合參數(shù) λ,可以設(shè)定兩算法的權(quán)重。該算法則同時考慮了用戶度,目標產(chǎn)品的度,源產(chǎn)品的度,此時產(chǎn)品相似度的計算公式為:
HHP算法通過調(diào)參為系統(tǒng)決策出唯一的混合參數(shù),將一個固定的推薦模式作用于系統(tǒng)中的所有用戶,沒有對不同用戶加以區(qū)分。事實上,系統(tǒng)中不同用戶具有不同的個性,比如有的用戶比較從眾,偏好流行產(chǎn)品,有的用戶則更偏好冷門產(chǎn)品[5]。原始的 HHP算法為系統(tǒng)中的所有用戶設(shè)定一個固定的混合參數(shù),并不能滿足用戶多元化的需求。如果為每個用戶設(shè)置一個個性化的混合參數(shù),應(yīng)該可以得到更好的推薦效果。
在文獻[6]中,提出了 UHHP算法,該算法為每個用戶關(guān)聯(lián)一個個性化的混合參數(shù)λi。通過研究發(fā)現(xiàn),用戶的個性化混合參數(shù)λi與用戶選擇產(chǎn)品的平均度di成正比。于是,設(shè)定UHHP中計算兩產(chǎn)品相似度的機制為:
其中,di是用戶過去所選擇產(chǎn)品的平均度,dmax是最大產(chǎn)品度,γ是可調(diào)參數(shù)。UHHP算法將用戶的最優(yōu)混合參數(shù)λi與用戶所選產(chǎn)品平均度di進行關(guān)聯(lián),從而為不同用戶設(shè)定了不同的個性化混合參數(shù),滿足了用戶的多元化需求。新提出的算法UHHP相比于HHP算法推薦效果得到顯著改善。
1.4 推薦算法的個性化
在算法參數(shù)個性化部分,我們對單一算法HHP進行了研究,通過將 HHP中的混合參數(shù)進行用戶級的個性化處理,推薦效果得到了顯著改善,從而實現(xiàn)了對不同用于對應(yīng)不同算法參數(shù)的個性化。事實上,用戶可選擇的算法并不局限于單一算法,系統(tǒng)中通常會存在多個算法。理想的推薦系統(tǒng),應(yīng)該是每個用戶都采用最適合他們自己的推薦算法。
推薦算法的個性化的實現(xiàn)方式一般來講有兩大類:其一是是把選擇權(quán)交給用戶,系統(tǒng)提供某種機制讓用戶實現(xiàn)算法的自主選擇;其二是系統(tǒng)通過深入挖掘每個人的行為模式,自動發(fā)現(xiàn)用戶最佳的推薦算法,并提供一種機制讓用戶確認。
本節(jié)將對上述方法進行對比,我們會看到,從非個性化算法到個性化推薦算法,以及到算法參數(shù)個性化到個性化的推薦算法演進獲得的性能提升。
2.1 方法
我們使用基準數(shù)據(jù)集MovieLens數(shù)據(jù)集來測試推薦算法的性能。MovieLens(http://movielens.umn.edu)是一個電影推薦網(wǎng)站,用戶對電影進行評分,評分等級從1-5。評分為1表明用戶不喜歡該電影;評分為5表示用戶非常喜歡該電影。MovieLens100K數(shù)據(jù)集包含943個用戶對1 682部電影的10萬條評分記錄。本文中對MovieLens數(shù)據(jù)集進行粗粒度化處理,即忽略小于3分的評分,只關(guān)注用戶喜歡的部分。處理后的數(shù)據(jù)集包含943個用戶,1 572個電影,用戶選擇82 520項。該數(shù)據(jù)集可以用二部圖來表示,網(wǎng)絡(luò)中有兩類結(jié)點分別是用戶結(jié)點和產(chǎn)品結(jié)點,如果用戶喜歡產(chǎn)品α,則在兩個結(jié)點之間建立一條連邊(i,α)。
為了測試不同算法的表現(xiàn),將數(shù)據(jù)集劃分為訓(xùn)練集ET和測試集EP,且ET∪EP,ET∩EP=?。訓(xùn)練集作為算法的已知信息,以預(yù)測那些未知的評分;測試集則用于評估算法的表現(xiàn)。通常情況下,從評分記錄中隨機抽取出一部分數(shù)據(jù)作為訓(xùn)練集,其余數(shù)據(jù)作為測試集。本文按照訓(xùn)練集∶測試集=9∶1的比例對數(shù)據(jù)集進行了隨機劃分。我們進行了5次劃分,最終的實驗結(jié)果取5次實驗的平均。
目前有很多指標用于刻畫推薦算法的推薦效果,對于二部圖結(jié)構(gòu)數(shù)據(jù)來說,最重要的兩個指標是排序準確度指標和分類準確度。排序準確度考查整個推薦列表中,用戶喜歡的產(chǎn)品所在的位置,典型的例子如文獻[7]提出的平均排序分(RS)。對于測試集中一條邊(i,α),它的排序分定義如下:
表1 UHHP算法與HHP算法性能對比
圖1 不同推薦算法作為最佳算法的用戶覆蓋比例
表2 最佳算法相對單一推薦算法的性能改進
其中,li,α表示在用戶i的測試集中出現(xiàn)的產(chǎn)品α在推薦列表中的排序位置,Li是用戶i的推薦列表的總長度。系統(tǒng)的RS是測試集中所有邊的排序分的平均值。此外,RSkα≤x表示只關(guān)注小度產(chǎn)品(度不大于x的產(chǎn)品)的排序時,系統(tǒng)的平均排序分。根據(jù)經(jīng)驗[9],通常取x=10。同理,RSi表示用戶i的平均排序分。顯然RS越小,表明推薦效果越好。
分類準確度指標衡量的是推薦系統(tǒng)能夠正確預(yù)測用戶喜歡或者不喜歡某個商品的能力。目前最常用的類準確度指標[13]準確率(precision)、召回率(recall),這兩個指標只關(guān)注推薦列表的前L個產(chǎn)品。Precision和recall越大,表明推薦效果越好。
對于某一用戶i,其推薦準確率為系統(tǒng)推薦的L個商品中用戶喜歡的商品所占的比例,則用戶的推薦準確率如下。其中Hi(L)表示用戶i的前L個推薦列表中,用戶喜歡的產(chǎn)品個數(shù)。系統(tǒng)的推薦準確率為用戶推薦準確率的平均。
召回率表示一個用戶喜歡的商品被推薦的概率,定義為推薦列表中用戶喜歡的商品與系統(tǒng)中用戶喜歡的所有商品的比率。對于用戶i,其召回率為如下,其中Li表示測試集中用戶i喜歡的產(chǎn)品的數(shù)目。系統(tǒng)的召回率為用戶召回率的平均。
我們將對比第2節(jié)提到的各個算法:Popular、UCF、ICF、Diffuse、HeatS以及 HHP,由于理想算法目前并未發(fā)現(xiàn),我們考慮理想的情況,也就是前面5種算法中,對某個用戶而言結(jié)果最好的算法設(shè)為其最佳選擇算法,從而實現(xiàn)算法的個性化。我們首先考慮算法參數(shù)個性化情況下的推薦性能提升,為參照,也將最佳參數(shù)選擇的算法進行對比;其次考慮最佳個性化算法時的性能。
2.2 結(jié)果與分析
2.2.1 參數(shù)個性化算法的性能
表1給出了參數(shù)個性化算法和原有混合算法的幾個指標對比,其中Ideal_HHP為每個用戶選擇最佳參數(shù)的理想算法,IR1和IR2分別為UHHP算法和Ideal_HHP相對于原始算法HHP的改進率。由表1可以看出,UHHP相對原始 HHP算法在各個指標上都有所提升,注意到HHP算法已經(jīng)是調(diào)優(yōu)后的情況,而且 UHHP算法的參數(shù)僅僅是其中的一個試探,所以這個結(jié)果還是很不錯的。進一步,如果考慮理想?yún)?shù)的情況,個性指標都有大幅提升。這個結(jié)果表明,參數(shù)個性化算法具有非常顯著的性能改善。
2.2.2 算法個性化系統(tǒng)的性能
首先,圖1統(tǒng)計了最佳推薦算法為以上算法的用戶占所有用戶的比例。從中可以看出,有接近40%的用戶,其最佳推薦算法為Diffuse算法,超過35%的用戶,其最佳推薦算法為 ICF算法,接近18%的用戶,其最佳推薦算法為 HeatS算法,其余用戶的最佳推薦算法為 Popular和 UCF算法。由此可見,不同的用戶確實有不同的最佳推薦算法。
其次,表2給出了每個用戶使用其最佳的推薦算法(稱為 BestEnsemble)進行推薦時,推薦效果改善程度。從實驗結(jié)果看出,如果每個用戶都使用其最佳推薦算法進行推薦,相比于單一推薦算法,推薦效果能得到顯著提高。尤其是對于RS類指標,最佳集成算法得到顯著改善,但對于 precision和recall指標,則有小幅度的下降。
本文提出了推薦算法參數(shù)的個性化,以及推薦算法的個性化的概念,并在典型數(shù)據(jù)集上對典型評價指標進行了對比分析,結(jié)果表明無論參數(shù)的個性化或者算法的個性化都能極大地提升原有推薦算法的性能,這為推薦系統(tǒng)領(lǐng)域的下一步發(fā)展開辟了新的方向。
依托本文的工作,還有很多重要的工作要做,比如在算法參數(shù)的個性化中,通過實驗我們發(fā)現(xiàn)用戶的最優(yōu)混合參數(shù)與用戶選擇產(chǎn)品的平均度di具有正相關(guān)性,所以我們通過UHHP算法來模擬這種正相關(guān)關(guān)系。在UHHP算法中,通過建立用戶的個性化混合參數(shù)λi與用戶所選擇產(chǎn)品的平均度di的關(guān)聯(lián)關(guān)系,我們?yōu)椴煌挠脩舻玫絺€性化的混合參數(shù)λi,但是λi與是有差別的,所以UHHP算法相比于 Ideal_HHP算法,提高幅度有限。如何更精確地模擬得到用戶的最優(yōu)個性化混合參數(shù),從而推薦效果更接近Ideal_HHP算法,這個問題仍然值得繼續(xù)研究。
另一方面,如果我們可以根據(jù)用戶的特性建立用戶與其最佳推薦算法的關(guān)聯(lián),將進一步解決算法的個性化使用問題。我們期望將系統(tǒng)中的所有用戶按照其最佳推薦算法分成若干個群體。例如圖1中,我們將用戶按照Popular、UCF、ICF、Diffuse和HeatS分成了5個群體,其中用戶群k(k=1,2,3,4,5)表示的是最佳推薦算法為算法k的用戶集合。這需要我們首先找到類內(nèi)用戶的共同特點,以及類間用戶的不同特點,這個內(nèi)容有待繼續(xù)研究。
致謝:本文實驗由關(guān)遠同學(xué)完成,在此致謝!
[1]SERGEY B,LAWRENCE P.The anatomy of a large-scale hypertextual web search engine[J].Comput.Netw.ISDN Syst,1998,30:107-117.
[2]ADOMAVICIUSG,TUZHILIN A.Toward the next generation of recommender systems:a survey of the state-of-the-art and possible extensions[J].IEEE Trans.Knowl.Data.Eng,2005,17:734-749.
[3]EKSTRAND M D,RIEDL JT,KONSTAN JA.Collaborative filtering recommender systems[J].Foundations and Trends?in Human-Computer Interaction,2011,4(2):175-243.
[4]LüL Y,MEDO M,YEUNG C H,et al.Recommender systems[J].Physics Reports,2012,519:1-49.
[5]SHANG M S,LüL Y,ZHANG Y C,et al.Empirical analysis of web-based user-object bipartite networks[J].EPL,2010,90(4):48006.
[6]GUAN Y,ZHAO D,ZENG A,et al.Preference of online users and personalized recommendations[J].Physica A:Statistical Mechanics and its Applications,2013,392(16):3417-3423.
[7]RESNICK P,IACOVOU N,SUCHAK M,et al.GroupLens:an open architecture for collaborative filtering of netnews[C]//Proceedings of the 1994 ACM conference on Computer supported cooperative work.New York:ACM,1994:175-186.
[8]LINDEN G,SM ITH B,YORK J.Amazon.com recommendations:item-to-item collaborative Filtering[J].IEEE Internet Computing,2003,7(1):76-80.
[9]ZHANG Y C,BLATTNER M,YU Y K.Heat conduction process on community networks as a recommendation model[J].Phys. Rev.Lett,2007,99:154301.
[10]ZHOU T,REN J,MEDO M,et al.Bipartite network projection and personal recommendation Phys[J].Rev.E,2007,76:046115.
[11]BELL R,KOREN Y,VOLINSKY C.Modeling relationships atmultiple scales to improve accuracy of large recommender systems[C]//Proc.KDD.New York:ACM,2007:95-104.
[12]ZHOU T,KUSCSIK Z,LIU JG,et al.Solving the apparent diversity-accuracy dilemma of recommender systems[J].Proc.Natl. Acad.Sci,2010,107:4511.
[13]HERLOCKER J L,KONSTAN J A,TERVEEN K,et al.Evaluating collaborative filtering recommender systems[J].ACM T Inform Syst,2004,22:5-53.
Recommender Systems:From Personalized Algorithm to Individualized Algorithm
SHANG Mingsheng
(1.Chongqing Institute of Green and Intelligent Technology,Chinese Academy of Sciences,Chongqing 400714,China;2.The BigData Research Center,University of Electronic Science and Technology of China,Chengdu 611731,China)
Recommender systems have been widely studied and applied.In this paper,the concept of individual recommendation algorithm is proposed,and accordingly the recommender systems are classified into four types:the non-personalized system,the personalized recommender system,the algorithm parameters personalized recommender system,and the individual recommender system.This paper thus suggests two new research directions of the recommender systems,and shows preliminary potential for the considerable improvementin commercial use.
recommender system;personalized recommender system;individual recommender system
TP301
A
10.16246/j.issn.1673-5072.2016.01.009
1673-5072(2016)01-0061-06
2015-12-25
國家自然科學(xué)基金項目(61370150,61433014)
尚明生(1973—),男,重慶大足人,博士,教授,博士生導(dǎo)師,主要從事大數(shù)據(jù)相關(guān)的理論和應(yīng)用研究。
尚明生,E-mail:msshang@uestc.edu.cn