亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        區(qū)塊鏈在個性化推薦系統(tǒng)中的應(yīng)用研究綜述

        2022-05-13 05:32:48許小穎陳熙陳源謝永靖
        大數(shù)據(jù) 2022年3期
        關(guān)鍵詞:區(qū)塊文獻算法

        許小穎,陳熙,陳源,謝永靖

        華南理工大學(xué)工商管理學(xué)院,廣東 廣州 510640

        0 引言

        互聯(lián)網(wǎng)的飛速發(fā)展,給用戶帶來了極大的便利。然而,在網(wǎng)絡(luò)信息量快速增長的同時,也出現(xiàn)了嚴重的“信息過載”問題,導(dǎo)致用戶難以從海量的數(shù)據(jù)中獲取真正有用的信息,降低了信息的利用效率。推薦系統(tǒng)是解決該問題的有效手段,它由一系列智能推薦算法組成,通過信息過濾的方式為每個用戶推薦可能感興趣的內(nèi)容[1]。推薦系統(tǒng)已經(jīng)在許多領(lǐng)域發(fā)揮著不可或缺的作用,特別是在電子商務(wù)領(lǐng)域,個性化推薦加快了用戶的決策過程[2],不僅提高了用戶的滿意度,也增加了商品的銷量[3-4]。

        盡管推薦系統(tǒng)在研究上和應(yīng)用上已經(jīng)取得了一定的進展,但是依然面臨著許多問題。在數(shù)據(jù)層面上,現(xiàn)有中心化的數(shù)據(jù)收集和存儲方式使得用戶的隱私保護和數(shù)據(jù)安全受到嚴重威脅。此外,推薦系統(tǒng)的有效性嚴重依賴于用戶數(shù)據(jù)的豐富程度和準確程度[5]。但受缺乏激勵、缺少信任等不利因素的影響,用戶提供和共享數(shù)據(jù)的意愿不高,數(shù)據(jù)的真實性也難以保證。在系統(tǒng)實現(xiàn)層面上,傳統(tǒng)推薦系統(tǒng)的黑箱操作模式使得推薦流程的透明度較低,用戶對推薦邏輯難以理解,嚴重影響了用戶對推薦結(jié)果的信任程度。

        近年來,區(qū)塊鏈技術(shù)的迅速發(fā)展為解決上述問題提供了嶄新的思路。區(qū)塊鏈是比特幣等數(shù)字加密貨幣的核心技術(shù),以分布式記賬為基礎(chǔ),具有去中心化、難以篡改、可追溯、可編程、公開透明和集體維護等特征。由于區(qū)塊鏈的獨特優(yōu)勢,越來越多的學(xué)者開始分別從數(shù)據(jù)層面和系統(tǒng)實現(xiàn)層面研究區(qū)塊鏈技術(shù)對推薦系統(tǒng)的優(yōu)化和改進,有望從根本上應(yīng)對數(shù)據(jù)安全和隱私保護、數(shù)據(jù)共享、數(shù)據(jù)可信和推薦透明度等方面的挑戰(zhàn),從而解決推薦系統(tǒng)存在的安全隱患和信任危機問題。

        然而,目前國內(nèi)外還缺乏對區(qū)塊鏈在推薦系統(tǒng)中應(yīng)用的研究綜述。因此,本文將對近年來推薦系統(tǒng)面臨的主要問題和區(qū)塊鏈技術(shù)帶來的機遇進行歸納總結(jié),并通過對已有文獻的梳理,明晰區(qū)塊鏈在推薦系統(tǒng)中應(yīng)用的研究現(xiàn)狀,提出未來的研究重點和方向。

        1 推薦系統(tǒng)的研究現(xiàn)狀和挑戰(zhàn)

        1.1 推薦系統(tǒng)簡介

        推薦系統(tǒng)可以被定義為一種應(yīng)用,其核心是推薦算法。推薦系統(tǒng)的主要目的是在特定的場景下,探索用戶的偏好,并從海量的數(shù)據(jù)中找到用戶可能感興趣的信息,為用戶生成推薦列表。作為解決信息過載的一種有效手段,推薦系統(tǒng)受到產(chǎn)業(yè)界和學(xué)術(shù)界的廣泛關(guān)注。

        基于推薦原理的差異,傳統(tǒng)的推薦算法可以分為3種主要的類型[6], 分別是協(xié)同過濾的推薦算法、基于內(nèi)容的推薦算法和混合推薦算法。除了這些傳統(tǒng)的推薦算法,在推薦系統(tǒng)的發(fā)展過程中也演變出許多效果顯著的改進算法,比如基于社交的推薦算法[7]、跨領(lǐng)域的推薦算法[8]等。在近幾年的文獻中,深度學(xué)習(xí)以其強大的表達能力,逐漸成為推薦領(lǐng)域采用的主流算法;對抗學(xué)習(xí)、強化學(xué)習(xí)、嵌入技術(shù)和注意力機制等技術(shù)也受到廣泛關(guān)注,這些技術(shù)的應(yīng)用顯著提高了推薦算法的整體性能。

        1.2 現(xiàn)有推薦系統(tǒng)的挑戰(zhàn)

        推薦系統(tǒng)在快速發(fā)展的同時,也面臨著許多挑戰(zhàn),具體表現(xiàn)在數(shù)據(jù)和系統(tǒng)實現(xiàn)兩個層面。在數(shù)據(jù)層面上,傳統(tǒng)的推薦系統(tǒng)被部署在中心化服務(wù)器上,數(shù)據(jù)安全和隱私保護、數(shù)據(jù)共享、數(shù)據(jù)可信問題一直是制約推薦系統(tǒng)發(fā)展的主要障礙;在系統(tǒng)實現(xiàn)層面上,傳統(tǒng)推薦系統(tǒng)呈現(xiàn)給用戶的是一個無法觀察和理解的黑箱,推薦邏輯不透明導(dǎo)致的用戶信任程度低成為不可忽視的重要問題。

        1.2.1 數(shù)據(jù)安全和隱私保護問題

        推薦引擎一般架構(gòu)在存儲、計算資源充足的中心化服務(wù)器上,推薦數(shù)據(jù)中心化平臺進行收集和存儲,這些數(shù)據(jù)往往包含用戶的隱私信息,例如姓名、位置和偏好等。這種集中式的存儲方式使得用戶產(chǎn)生的數(shù)據(jù)被平臺控制,平臺可在未經(jīng)用戶同意的情況下將數(shù)據(jù)轉(zhuǎn)賣給第三方[9],導(dǎo)致用戶隱私的泄露。針對數(shù)據(jù)安全和隱私保護問題,一些企業(yè)提出了隱私保護政策來減少用戶的風(fēng)險感知,提高透明度;然而,這些政策并不能從技術(shù)層面保證用戶的匿名性和數(shù)據(jù)的安全性、可控性[10]。也有一些學(xué)者提出了保護用戶隱私的數(shù)據(jù)存儲和挖掘方法,包括完全同態(tài)加密[11]和安全多方計算[12]。但當數(shù)據(jù)量增大時,推薦計算的復(fù)雜度顯著增加。

        此外,這種存儲在集中服務(wù)器上的客戶數(shù)據(jù)也可能遭到黑客的惡意攻擊,用戶隱私暴露風(fēng)險大,在數(shù)據(jù)保護和安全方面非常脆弱。例如2018年,黑客利用系統(tǒng)漏洞竊取了臉書(Facebook)近5 000萬用戶的個人信息。如何從根本上解決數(shù)據(jù)安全和隱私保護問題,已經(jīng)成為目前大多數(shù)推薦系統(tǒng)面臨的難題之一。

        1.2.2 數(shù)據(jù)共享問題

        在推薦領(lǐng)域中,許多流行的推薦方法(例如協(xié)同過濾算法)往往面臨著用戶評分數(shù)據(jù)的稀疏性和冷啟動問題。針對推薦數(shù)據(jù)稀疏問題,現(xiàn)有的解決途徑主要集中在充分利用已有的數(shù)據(jù)上。一些學(xué)者提出采用數(shù)據(jù)降維技術(shù),將高維稀疏數(shù)據(jù)映射到低維空間,從而更有效地利用有限的數(shù)據(jù)。例如Wang X H等人[13]采用卷積矩陣分解處理推薦系統(tǒng)中的高度稀疏數(shù)據(jù),以捕獲更深層次的關(guān)系。此外,還有一些研究試圖充分挖掘用戶評分以外的其他信息作為補充。例如Reshma R等人[14]從社交網(wǎng)絡(luò)中獲取用戶間的信任關(guān)系和用戶個人資料的相似性,結(jié)合評分數(shù)據(jù)進行推薦。這些方法都是在數(shù)據(jù)稀疏的前提下,盡可能多地從有限的現(xiàn)有數(shù)據(jù)中提取有用信息,對數(shù)據(jù)稀疏問題有一定的緩和作用。

        然而,這些方法并沒有從數(shù)據(jù)源的角度出發(fā)來提高數(shù)據(jù)供給的數(shù)量。數(shù)據(jù)共享是緩解數(shù)據(jù)稀疏性問題的有效途徑,包括單個用戶數(shù)據(jù)的分享和不同平臺間數(shù)據(jù)的共享。為了促進數(shù)據(jù)供給,現(xiàn)有電商平臺通常采用粗粒度的激勵方式,即根據(jù)用戶反饋的數(shù)據(jù)量,給予一定的平臺積分獎勵,這雖然在一定程度上增加了反饋的數(shù)據(jù)量,但也為推薦系統(tǒng)引入了大量無效數(shù)據(jù),降低了推薦的質(zhì)量[15]。因此,需要根據(jù)數(shù)據(jù)實際價值和使用效果對用戶進行精細化的激勵。然而,在現(xiàn)有中心化平臺的條件下,推薦系統(tǒng)的運行均為黑箱化,透明性和公平性無法保證,精細化的激勵機制也難以實施。同時,由于平臺之間缺乏信任,無法保障數(shù)據(jù)使用的安全透明,跨平臺跨領(lǐng)域的數(shù)據(jù)共享難以真正實現(xiàn)[16]。

        1.2.3 數(shù)據(jù)可信問題

        除了需要確保數(shù)據(jù)的豐富性,真實有效的數(shù)據(jù)源也是推薦系統(tǒng)進行精準推薦的基礎(chǔ)。然而,由于用戶與平臺之間缺乏信任、商家與平臺合謀等情況的存在,推薦系統(tǒng)數(shù)據(jù)源的真實性難以保證。例如,在一些電商平臺,許多商家為了提高自身的信譽,會雇傭大量網(wǎng)絡(luò)寫手為自己撰寫虛假好評,甚至刪除和修改用于推薦的用戶數(shù)據(jù)。另外,現(xiàn)有電商平臺大多采用粗粒度的激勵方式,用戶為了獲取更多激勵,會出現(xiàn)隨意填寫反饋的現(xiàn)象,這給推薦系統(tǒng)帶來了大量的無效數(shù)據(jù),平臺難以對用戶所反饋數(shù)據(jù)的質(zhì)量進行有效的驗證和控制。

        針對數(shù)據(jù)可信問題,現(xiàn)有研究主要集中在如何抵御推薦攻擊上。通常所說的推薦攻擊指針對協(xié)同過濾推薦系統(tǒng)的攻擊,在這種攻擊中,惡意用戶通過注入大量虛假信息來改變推薦結(jié)果,這可能會降低用戶對推薦系統(tǒng)的客觀性和準確度的信任[17]。針對這些攻擊,現(xiàn)有研究聚焦于兩種應(yīng)對方式。一種是檢測推薦攻擊,然后消除或降低這些攻擊對推薦的影響[18],例如Tong C等人[19]提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的方法來挖掘用戶評分行為的深層特征,有效地檢測推薦攻擊。另一種是設(shè)計更加健壯的算法[20],例如Yuan F等人[21]提出一種基于神經(jīng)網(wǎng)絡(luò)推薦模型的通用對抗訓(xùn)練框架,通過加入人工噪聲數(shù)據(jù)進行協(xié)同訓(xùn)練,提高模型的魯棒性。目前,關(guān)于推薦系統(tǒng)的魯棒性研究還比較少,而攻擊策略卻層出不窮。

        1.2.4 推薦透明度問題

        推薦透明指讓用戶了解推薦系統(tǒng)給出特定推薦結(jié)果的原因,這將直接影響用戶對推薦系統(tǒng)的滿意程度和對推薦結(jié)果的信任程度[22],而讓用戶信任并采納推薦結(jié)果,才是推薦系統(tǒng)發(fā)揮作用的關(guān)鍵所在。目前,大多數(shù)研究通過推薦解釋的方式來提高推薦系統(tǒng)的透明度。例如,亞馬遜在采用協(xié)同過濾推薦時,通過“買過本商品的用戶還買了……”向用戶提供推薦解釋[23]。然而,現(xiàn)有方法只是由中心化平臺告知用戶某個商品被推薦的原因,推薦過程仍然是個黑箱流程,推薦的透明度遠遠不夠。因此,提高推薦透明度仍然是目前推薦系統(tǒng)面臨的主要挑戰(zhàn)之一。

        綜上所述,目前以數(shù)據(jù)驅(qū)動的推薦系統(tǒng)仍然面臨著諸多問題,亟須一種創(chuàng)新性的解決方案從根本上打破當前困局。近年來,區(qū)塊鏈技術(shù)的迅速發(fā)展為解決上述問題提供了嶄新的思路。區(qū)塊鏈具有去中心化、難以篡改、可追溯、可編程、公開透明和集體維護等特征,為解決推薦系統(tǒng)中的數(shù)據(jù)安全和隱私保護、數(shù)據(jù)共享、數(shù)據(jù)可信和推薦透明度問題提供了技術(shù)支撐。

        2 區(qū)塊鏈技術(shù)的優(yōu)勢

        2.1 區(qū)塊鏈技術(shù)及特征

        早期的區(qū)塊鏈作為比特幣系統(tǒng)中的底層支撐技術(shù),是一個含有塊鏈式數(shù)據(jù)結(jié)構(gòu)且難以篡改偽造的分布式賬本。而區(qū)塊鏈發(fā)展至今,其本身的內(nèi)涵與技術(shù)已發(fā)生了很多變化??傮w來說,區(qū)塊鏈技術(shù)是一項綜合了加密算法、共識機制、P2P網(wǎng)絡(luò)、智能合約等計算機技術(shù)的全新的基礎(chǔ)架構(gòu)和技術(shù)體系。

        區(qū)塊鏈一般具有以下幾個技術(shù)特征。

        ● 去中心化。區(qū)塊鏈建立在P2P網(wǎng)絡(luò)的基礎(chǔ)上,參與網(wǎng)絡(luò)的各個節(jié)點分散對等地參與協(xié)作,共同維護數(shù)據(jù),達成共識。網(wǎng)絡(luò)內(nèi)部并不需要中心化的管理機構(gòu),當某個節(jié)點出現(xiàn)故障或自由加入和退出網(wǎng)絡(luò)時,整個系統(tǒng)都能維持正常運行,單一機構(gòu)對系統(tǒng)的影響大大降低。

        ● 公開透明。去中心化使得每個節(jié)點都能平等地發(fā)送和接收區(qū)塊鏈網(wǎng)絡(luò)中的消息,除了各方被加密的私有信息,區(qū)塊鏈中的完整數(shù)據(jù)都能被任何節(jié)點查看和記錄,整個區(qū)塊鏈系統(tǒng)的運作對于節(jié)點來說都是公開透明的。

        ● 數(shù)據(jù)可信。數(shù)據(jù)的安全性主要體現(xiàn)在兩方面:難以篡改偽造和可追溯。難以篡改偽造指由于共識機制的作用,數(shù)據(jù)一旦通過驗證并寫入?yún)^(qū)塊鏈后就難以篡改,而偽造的數(shù)據(jù)難以使得各方節(jié)點達成共識,從而不被承認;可追溯指區(qū)塊鏈存儲數(shù)據(jù)的塊鏈式結(jié)構(gòu)有利于針對某一狀態(tài)查出與其相關(guān)的所有操作歷史。難以篡改偽造和可追溯這兩點,再加上公開透明的特性,使得區(qū)塊鏈上的數(shù)據(jù)是真實可信的。

        ● 匿名性。區(qū)塊鏈中采用了非對稱加密算法來保護用戶節(jié)點的身份信息,用戶對外公布的只是加密后的哈希地址,而其他用戶無法從該地址中讀取任何有效信息,這為用戶提供了隱私安全保障。

        2.2 區(qū)塊鏈技術(shù)在推薦系統(tǒng)中的應(yīng)用價值

        區(qū)塊鏈以其去中心化、加密匿名和數(shù)據(jù)的防偽溯源等特性,使得脫離中心化管理成為一種可能,在解決現(xiàn)有推薦系統(tǒng)面臨的問題上具有重要的應(yīng)用價值。

        在數(shù)據(jù)安全和隱私保護問題上,首先,區(qū)塊鏈的去中心化消除了第三方控制的需要,可以有效降低中心化數(shù)據(jù)節(jié)點存在的安全風(fēng)險;其次,區(qū)塊鏈內(nèi)置的數(shù)字簽名和加密技術(shù)方案,可與認證、訪問控制等安全對策相結(jié)合,提高數(shù)據(jù)安全性,保護用戶隱私[24];最后,在區(qū)塊鏈網(wǎng)絡(luò)中,交易的整個過程被記錄在區(qū)塊鏈上,具有難以篡改和可追溯性,為數(shù)據(jù)所有者帶來更大的透明度,保護數(shù)據(jù)不被濫用。

        在數(shù)據(jù)共享問題上,區(qū)塊鏈去中心化的結(jié)構(gòu)使得數(shù)據(jù)交易不需要中介機構(gòu),結(jié)合加密技術(shù)和智能合約可構(gòu)建全新的信任模式,保障交易安全快速完成;其次,由于其公開透明和難以篡改等特性,結(jié)合智能合約和代幣機制,可以有效解決多方協(xié)同中激勵計算與利益分配的信任問題。

        在數(shù)據(jù)可信問題上,區(qū)塊鏈采用基于共識的數(shù)據(jù)更新機制,可以在一定程度上消除不可信數(shù)據(jù)的影響,并結(jié)合代幣激勵機制來確保誠實用戶的利益;此外,鏈上數(shù)據(jù)具有難以篡改和可追溯性,避免數(shù)據(jù)被惡意修改的風(fēng)險。

        在推薦透明度問題上,對用戶數(shù)據(jù)的使用全過程進行跟蹤和客觀記錄,使得數(shù)據(jù)具有難以篡改和可追溯的特點,從而提高了推薦系統(tǒng)內(nèi)部的透明性和可信性;同時,結(jié)合智能合約,將區(qū)塊鏈與推薦系統(tǒng)進行深度融合,可以提高整個推薦算法的透明度。

        區(qū)塊鏈通過可信任的點對點傳輸、難以篡改的數(shù)據(jù)存儲和可追溯的數(shù)據(jù)查看,解決了多方協(xié)同的信任問題,讓用戶更加信任推薦系統(tǒng)及其應(yīng)用平臺,并愿意提供更加真實有效的數(shù)據(jù),從而建立起平臺的信任生態(tài),促進推薦系統(tǒng)的良性發(fā)展。目前已有不少研究關(guān)注到了區(qū)塊鏈技術(shù)帶來的機遇,區(qū)塊鏈在信譽系統(tǒng)[24-26]、用戶評價[24]和電子商務(wù)[10]中的應(yīng)用受到了越來越多的關(guān)注,這也進一步推動了區(qū)塊鏈與推薦系統(tǒng)的結(jié)合。

        3 區(qū)塊鏈在推薦系統(tǒng)中的應(yīng)用現(xiàn)狀

        通過篩選國內(nèi)外主要檢索源中符合主題的文獻,對文獻的時間分布、類型分布等方面進行分類統(tǒng)計,并從主要研究問題和評估指標兩個層面對區(qū)塊鏈在推薦系統(tǒng)中的應(yīng)用情況進行深入分析,明晰區(qū)塊鏈在推薦系統(tǒng)中的應(yīng)用現(xiàn)狀。

        3.1 文獻檢索方法

        在文獻具體篩選方法層面,本文分別以(“recommend”or“recommendation”or“recommender”or“recommender systems”)and“blockchain”、(“推薦”or“推薦系統(tǒng)”)and“區(qū)塊鏈”為檢索詞,在Web of Science、EI Engineering Village 2、Google Scholar、中國知網(wǎng)、萬方數(shù)據(jù)等數(shù)據(jù)庫中進行搜索;通過閱讀所選擇的文獻摘要,剔除研究重點不是區(qū)塊鏈在推薦系統(tǒng)上的應(yīng)用的文章,并在文獻閱讀過程中根據(jù)參考文獻不斷擴展文獻范圍。最后發(fā)現(xiàn)相關(guān)文獻40篇。

        3.2 文獻分類統(tǒng)計

        3.2.1 時間分布

        如圖1所示,從時間分布上看,最早的與區(qū)塊鏈推薦系統(tǒng)相關(guān)的文獻出現(xiàn)在2016年,區(qū)塊鏈在推薦系統(tǒng)上的應(yīng)用近幾年才開始發(fā)展,是一個比較新的領(lǐng)域。近年來,文獻數(shù)量逐年增加,這也從側(cè)面反映了隨著區(qū)塊鏈技術(shù)的快速發(fā)展,區(qū)塊鏈推薦系統(tǒng)這一研究領(lǐng)域越來越受到學(xué)者們的關(guān)注。

        圖1 文獻的時間分布

        3.2.2 文獻類型

        如圖2(a)所示,從文獻類型分布上看,大部分文獻類型都是期刊論文(60%),會議論文、專利和圖書分別占20%、18%和2%。從論文發(fā)表的期刊來看,主要是信息系統(tǒng)和電子信息技術(shù)等技術(shù)領(lǐng)域的期刊。從期刊的級別來看,有不少論文發(fā)表在重要國際期刊和中文核心期刊上,如IEEE Transactions on Engineering Management、IEEE Transactions on Network Science and Engineering和《西安電子科技大學(xué)學(xué)報》等,這也從側(cè)面反映出區(qū)塊鏈與推薦系統(tǒng)的結(jié)合已成為推薦系統(tǒng)領(lǐng)域的研究前沿和熱點。圖2(b)是從目前國內(nèi)外文獻分布的視角對篩選的結(jié)果進行分類。從圖2(b)可知,國內(nèi)外文獻的占比分別為44%和56%,說明目前國外對該領(lǐng)域的研究熱度高于國內(nèi)。圖2(c)根據(jù)研究方法對篩選結(jié)果進行分類。從圖2(c)可知,定性研究數(shù)量相對較少,大多數(shù)研究是針對研究場景和所需解決的問題設(shè)計一個系統(tǒng)框架,并用實際的數(shù)據(jù)進行實驗分析,通過定量方法驗證系統(tǒng)的有效性。因此,相比于定性的純理論論證和推導(dǎo),基于實驗和實證的定量研究更適合此研究方向。

        圖2 文獻類型

        3.3 主要研究問題

        從研究問題上看,區(qū)塊鏈在推薦系統(tǒng)上的應(yīng)用主要是為了解決4個問題,分別是推薦系統(tǒng)中的數(shù)據(jù)安全和隱私保護問題、數(shù)據(jù)共享問題、數(shù)據(jù)可信問題和推薦透明度問題?;趨^(qū)塊鏈的推薦系統(tǒng)研究總覽見表1。關(guān)于研究解決數(shù)據(jù)安全和隱私保護問題的文章占比最大,這說明保護用戶隱私和數(shù)據(jù)安全被認為是區(qū)塊鏈應(yīng)用于推薦系統(tǒng)所帶來的最顯著優(yōu)勢。

        表1 基于區(qū)塊鏈的推薦系統(tǒng)研究總覽

        3.3.1 數(shù)據(jù)安全和隱私保護

        在傳統(tǒng)的中心化推薦系統(tǒng)應(yīng)用平臺中,平臺需要收集大量的用戶敏感數(shù)據(jù),這種集中式的數(shù)據(jù)存儲方法容易受到惡意攻擊,并且可在未經(jīng)用戶授權(quán)的情況下,轉(zhuǎn)賣或利用用戶數(shù)據(jù)進行分析,存在泄露用戶信息的風(fēng)險。區(qū)塊鏈對用戶隱私和數(shù)據(jù)安全的保護主要體現(xiàn)在3個方面:一是區(qū)塊鏈的去中心化數(shù)據(jù)存儲可以避免惡意攻擊,消除第三方的控制;二是在公有鏈中,每個用戶擁有自己的賬戶地址,很難把賬戶地址與真實世界中的人的身份對應(yīng)起來;三是通過各種加密技術(shù)對鏈上的數(shù)據(jù)進行加密,僅授權(quán)方可以解密。

        區(qū)塊鏈作為一個去中心化的數(shù)據(jù)庫,可以有效避免集中式數(shù)據(jù)中心存在的分布式拒絕服務(wù)(distributed denial of service,DDoS)攻擊和單點故障等安全風(fēng)險,并且消除了第三方的控制,將數(shù)據(jù)控制權(quán)歸還給用戶,降低了中央數(shù)據(jù)存儲導(dǎo)致的隱私泄露的風(fēng)險。例如Lin L J等人[33]提出一種基于區(qū)塊鏈技術(shù)的隱私保護推薦機制,利用區(qū)塊鏈固有的去中心化特性,用戶能夠?qū)⒃紨?shù)據(jù)保存在本地,降低了中心數(shù)據(jù)存儲導(dǎo)致的隱私泄露風(fēng)險。該機制還結(jié)合了星際文件系統(tǒng)和差分隱私機制,降低了計算和通信成本,可為推薦過程提供隱私保護。

        在上述文獻中,部分研究采用公有鏈搭建推薦系統(tǒng)框架,利用賬戶地址的匿名性保護用戶的隱私安全。例如楊立等人[29]提出了一個基于區(qū)塊鏈的保險產(chǎn)品推薦模型,所有參與者都通過模型中的賬號參與計算,并且每次交易都使用一個新的賬號。Lisi A等人[48]提出一個基于公有鏈的推薦系統(tǒng)框架,用戶可以選擇一個不透露任何真實信息的虛擬賬號進行注冊。在去中心化的應(yīng)用場景下,任何人都很難將虛擬賬號與用戶真實身份之間的匹配關(guān)系對應(yīng)起來,這在一定程度上保證了用戶隱私安全。然而,完全匿名系統(tǒng)雖然可以保護用戶隱私,但這意味著允許未經(jīng)身份驗證的用戶創(chuàng)建虛假賬號和信息,為欺詐行為留下了可能性。

        區(qū)塊鏈與加密技術(shù)的結(jié)合,使用戶對自己的數(shù)據(jù)有一定的控制權(quán),可選擇性地展現(xiàn)個人數(shù)據(jù)給指定的參與方。例如楊立等人[29]采用非對稱加密的方式,將用戶的個人信息(家庭住址、健康狀況)和保險公司的退保理賠信息等敏感數(shù)據(jù)加密上鏈,從而保證僅被授權(quán)的平臺可以獲取相關(guān)信息并進行推薦計算,而其他平臺或用戶無法看到。趙子軍等人[28]利用分布式雙門陷公鑰加密系統(tǒng)(distributed two-trapdoor public-key cryptosystem,DT-PKC),對車輛的敏感數(shù)據(jù)(如目的地等)進行加密上鏈,并通過設(shè)計一系列安全協(xié)議進行推薦計算,以保護用戶的隱私安全。Frey R等人[10]提出將客戶的個人資料和公司獲得的購物歷史、信用卡記錄數(shù)據(jù)進行加密上鏈,當用戶給予訪問權(quán)限時,公司才有權(quán)執(zhí)行推薦任務(wù)。區(qū)塊鏈能夠?qū)⒂脩粜畔⑦M行有效加密,并做到精細化的數(shù)據(jù)授權(quán),任何不相關(guān)的用戶都無法從加密數(shù)據(jù)中讀取到有用信息,這為用戶隱私提供了更深層次的保護。

        此外,通過區(qū)塊鏈與安全多方計算的結(jié)合,可在保護隱私的情況下完成相應(yīng)的推薦計算任務(wù)。例如Frey R等人[10]利用基于區(qū)塊鏈的安全多方計算的優(yōu)勢,提出了一個保護隱私的推薦系統(tǒng)。但實際上在區(qū)塊鏈上完成整個推薦計算過程是不可行的,因為通過區(qū)塊鏈上的智能合約來完成推薦計算任務(wù)需要消耗很大的算力,并且通常不能進行實時推薦。

        因此,利用區(qū)塊鏈技術(shù)固有的去中心化、加密和匿名性等特點,可以有效解決推薦系統(tǒng)的隱私和安全問題。當然,這需要對權(quán)限設(shè)置、推薦算法和系統(tǒng)框架等進行進一步的優(yōu)化,在充分發(fā)揮區(qū)塊鏈的優(yōu)點的同時,保證系統(tǒng)的可行性和合理性。

        3.3.2 數(shù)據(jù)共享

        推薦系統(tǒng)的數(shù)據(jù)共享問題主要包括兩個方面:一是平臺間進行數(shù)據(jù)共享時存在的信任和隱私問題;二是由于缺乏有效激勵,用戶不愿主動分享更多高質(zhì)量的數(shù)據(jù)。這些問題影響了推薦系統(tǒng)數(shù)據(jù)源的豐富度和真實性,降低了推薦精度。

        針對推薦系統(tǒng)中不同平臺間的數(shù)據(jù)共享問題,已有研究對基于區(qū)塊鏈技術(shù)的解決方案進行了探討。例如Yan B W等人[37]提出通過在不同云平臺之間建立聯(lián)盟鏈,實現(xiàn)云平臺之間數(shù)據(jù)的高效安全共享。通過采用非對稱加密算法對共享數(shù)據(jù)進行加密,聯(lián)盟鏈上的節(jié)點可以驗證共享數(shù)據(jù)的完整性和可靠性,但沒有密鑰就無法獲得任何信息;聯(lián)盟鏈中的所有節(jié)點都不能隨意篡改共享數(shù)據(jù),這是因為一旦篡改就會被檢測出來。陳亞輝等人[36]提出一個以區(qū)塊鏈技術(shù)為基礎(chǔ)的金融大數(shù)據(jù)共享與流通的大體框架,打破跨界機構(gòu)之間的數(shù)據(jù)孤島,以實現(xiàn)面向金融用戶的精準可信推薦。區(qū)塊鏈的去中心化使得數(shù)據(jù)交易不需要第三方機構(gòu),利用區(qū)塊鏈上的加密技術(shù)和智能合約,可以對交易細節(jié)進行加密,從而確保共享數(shù)據(jù)的隱私安全,保證交易和支付的高效完成。此外,平臺間數(shù)據(jù)共享的交易一旦經(jīng)過驗證并添加至區(qū)塊鏈上,就很難被修改或抹除,任何一筆交易都有完整的記錄,這可有效解決不同平臺間數(shù)據(jù)共享的信任問題,進一步促進平臺間的數(shù)據(jù)共享。

        此外,針對單個用戶的數(shù)據(jù)分享問題,Li X L等人[30]提出數(shù)據(jù)請求者在部署某項推薦服務(wù)的智能合約時,可在區(qū)塊鏈中存入交易費用,通過區(qū)塊鏈的交易記錄和智能合約的規(guī)則設(shè)定,對數(shù)據(jù)提供者和礦工進行激勵,以鼓勵用戶分享更多的數(shù)據(jù)。Lisi A等人[38]提出一種基于區(qū)塊鏈技術(shù)的去中心化評分框架,通過對用戶評分進行獎勵來激勵用戶提供評分數(shù)據(jù),以支持推薦系統(tǒng)。由此可見,區(qū)塊鏈可對推薦過程中用戶反饋數(shù)據(jù)的使用全過程進行客觀、透明和難以篡改的跟蹤和記錄,這為實施精細化激勵機制創(chuàng)造了條件。借助智能合約,可對數(shù)據(jù)的實際價值進行準確、公平的量化,從而對用戶進行精準激勵,促進高質(zhì)量數(shù)據(jù)的供給。區(qū)塊鏈為數(shù)據(jù)價值的準確量化和精細化激勵機制的順利實施提供了必要條件。然而,目前針對這方面的研究仍相對缺乏。

        3.3.3 數(shù)據(jù)可信

        在傳統(tǒng)的中心化推薦系統(tǒng)中,用戶數(shù)據(jù)由平臺進行收集和維護,出于追求商業(yè)利益的目的,平臺可能對用于推薦的數(shù)據(jù)進行操縱和篡改。另外,由于缺少有效的激勵機制和對隱私保護的不足,用戶也可能提供虛假的信息。針對推薦系統(tǒng)的數(shù)據(jù)可信問題,Li X L等人[30]基于區(qū)塊鏈設(shè)計了一個聯(lián)合矩陣分解模型,采用基于實用拜占庭容錯(practical Byzantine fault tolerance,PBFT)的共識機制對用戶提供的數(shù)據(jù)進行驗證,并根據(jù)用戶數(shù)據(jù)貢獻水平進行合理的獎勵分配,以鼓勵用戶提供真實數(shù)據(jù)。Wang S等人[44]通過區(qū)塊鏈驅(qū)動的智能合約來實現(xiàn)眾包的業(yè)務(wù)邏輯,構(gòu)建用于推薦的知識圖譜,圖譜中的每個節(jié)點和邊都不能被輕易操縱和篡改,保證了用于推薦的數(shù)據(jù)的透明度和可審核性。

        基于共識的數(shù)據(jù)更新機制,區(qū)塊鏈上的每筆交易由若干節(jié)點共同進行驗證,在一定程度上保證了上鏈數(shù)據(jù)的真實可信;同時,激勵機制的引入也可以鼓勵用戶提供更多真實有用的數(shù)據(jù)。另外,每個用戶生成的交易由礦工驗證,整個過程被記錄在區(qū)塊鏈上,具有難以篡改和可追溯的特性,任何人都無法隨意篡改用戶的反饋數(shù)據(jù),這也降低了用于推薦計算的數(shù)據(jù)被惡意操縱的風(fēng)險。然而,現(xiàn)有的研究主要還是聚焦在鼓勵用戶提供有效反饋數(shù)據(jù)上,在如何利用區(qū)塊鏈的分布式共識打擊虛假評論等方面仍缺少相應(yīng)的討論。

        3.3.4 推薦透明度

        提高推薦透明度是提高用戶對推薦結(jié)果信任度的重要途徑,然而現(xiàn)有的中心化推薦系統(tǒng)均為黑箱,推薦透明度遠遠不足。在推薦透明度的問題上,Lisi A等人[48]提出一個基于區(qū)塊鏈的推薦系統(tǒng)構(gòu)建方法,為用戶提供透明的評分收集和物品分數(shù)計算過程。該方法將用戶、物品、用戶評分等都存儲在區(qū)塊鏈上,將計算物品分數(shù)的算法存儲在智能合約中,用戶可選擇特定算法來計算物品分數(shù)。由于評分數(shù)據(jù)、計算函數(shù)都存儲在區(qū)塊鏈上,難以篡改且公開透明,用戶可以查看用于推薦計算的數(shù)據(jù)和方法,驗證物品分數(shù)的計算過程,從而提高推薦的透明度。然而,由于智能合約的計算能力有限,該方法中僅使用了簡單的計算函數(shù),這可能會導(dǎo)致較低的推薦精度。

        隨著推薦系統(tǒng)在日常生活和關(guān)鍵業(yè)務(wù)中的重要性不斷提高,提高用戶對數(shù)據(jù)、模型、訓(xùn)練過程和結(jié)果的信任度越來越重要。對于推薦系統(tǒng)的透明度問題,區(qū)塊鏈能夠幫助研究人員在不同粒度級別上對推薦過程進行跟蹤和記錄。這種清晰的追蹤過程不僅可以提高推薦數(shù)據(jù)的可信度,還可以讓所有參與的用戶了解推薦系統(tǒng)做出決定的過程,提高對推薦系統(tǒng)模型、訓(xùn)練過程和結(jié)果的信任度。然而,將區(qū)塊鏈與推薦系統(tǒng)結(jié)合時,需要對推薦算法和推薦流程進行進一步的設(shè)計和優(yōu)化,在提高推薦透明度的同時,滿足系統(tǒng)的精度和效率要求。此外,即使提高了推薦的透明度,對于非專業(yè)用戶來說,理解推薦邏輯還是有一定難度的,因此,除了使用區(qū)塊鏈底層保證推薦流程的透明性,仍需在界面設(shè)計上保證與用戶的良好溝通,降低用戶的使用門檻。

        3.4 評估指標

        文獻采用的評估指標見表2。從評估指標上看,采用實驗方法的文獻中,大多對區(qū)塊鏈推薦系統(tǒng)的準確度進行分析。其中主要通過與現(xiàn)有方法的比較,來證明提出的推薦系統(tǒng)可以取得相似或更高的準確度;也有文獻通過問卷調(diào)查和案例研究來分析推薦結(jié)果的合理性。如Wang S等人[44]通過一個給企業(yè)員工分配任務(wù)的案例實驗,分別從自我驗證(與被推薦員工的歷史工作是否相關(guān))和外部驗證(推薦結(jié)果被采納的比例)兩個方面分析推薦的有效性,并通過問卷調(diào)查的方式來收集企業(yè)領(lǐng)導(dǎo)對系統(tǒng)有效性的反饋。

        此外,引入?yún)^(qū)塊鏈作為底層技術(shù),一方面旨在提高推薦系統(tǒng)的安全性能,另一方面也給推薦系統(tǒng)的可行性和穩(wěn)定性帶來了新的挑戰(zhàn)。因此,為了確保系統(tǒng)的有效性,除了對推薦系統(tǒng)的準確度進行評估,還必須對區(qū)塊鏈系統(tǒng)進行測試。表2中大部分文獻對區(qū)塊鏈系統(tǒng)的性能進行了分析,包括安全性能和效率性能。安全性能主要是在區(qū)塊鏈框架下,通過定性方法對推薦系統(tǒng)的隱私性、透明性和可驗證性等進行分析。效率性能指系統(tǒng)的運行效率和可擴展性,對效率性能的分析主要通過定量分析的方法對系統(tǒng)運行時的燃料消耗、計算開銷、通信開銷、存儲可擴展性和吞吐量等進行分析。這說明了在區(qū)塊鏈推薦系統(tǒng)中,推薦系統(tǒng)的推薦性能、區(qū)塊鏈框架的安全和效率性能受到廣泛關(guān)注,對相關(guān)指標的分析是證明系統(tǒng)有效性的關(guān)鍵。因此,在提出區(qū)塊鏈推薦系統(tǒng)框架后,對二者的分析是非常有必要的。

        表2 文獻采用的評估指標

        4 總結(jié)與未來研究建議

        本文通過結(jié)構(gòu)化的文獻回顧,對近年來推薦系統(tǒng)存在的主要問題和區(qū)塊鏈技術(shù)帶來的機遇進行歸納總結(jié),并采用文獻分析方法,從時間分布、文獻類型、研究問題和評估指標4個層面,對推薦系統(tǒng)中區(qū)塊鏈技術(shù)的應(yīng)用研究進行分析和總結(jié)。分析結(jié)果表明,區(qū)塊鏈推薦系統(tǒng)的研究熱度逐年增加,區(qū)塊鏈技術(shù)對于解決推薦系統(tǒng)的用戶隱私和數(shù)據(jù)安全、數(shù)據(jù)共享、數(shù)據(jù)可信和推薦透明度問題有重要意義。然而,已有文獻主要集中于解決推薦系統(tǒng)中的用戶隱私和數(shù)據(jù)安全問題,在其他方面的研究相對缺乏。

        通過對已有文獻的梳理和總結(jié),筆者發(fā)現(xiàn)了一些重要的問題有待未來進一步深入地研究。在此,本文針對性地提出以下幾個觀點和建議。

        第一,重視跨平臺數(shù)據(jù)共享的研究。目前研究中針對跨平臺數(shù)據(jù)共享問題的研究相對較少,制約跨平臺數(shù)據(jù)共享的主要原因來源于平臺間缺少信任:一方面,數(shù)據(jù)分享存在信息泄露、損害平臺用戶隱私的風(fēng)險;另一方面,數(shù)據(jù)價值存在不確定性,難以確保數(shù)據(jù)交換的公平性。借助區(qū)塊鏈技術(shù)解決不同平臺間的信任問題,需要對推薦模型的多方協(xié)同改進模式進行合理的設(shè)計。同時,通過設(shè)計合理的激勵機制來保證各平臺參與模型協(xié)同改進的公平性,提高各平臺參與的積極性。

        第二,結(jié)合區(qū)塊鏈提出精細化的數(shù)據(jù)激勵機制。推薦系統(tǒng)的數(shù)據(jù)稀疏問題是該研究領(lǐng)域的一個經(jīng)典難題。其中,缺少有效的激勵機制是導(dǎo)致用戶分享數(shù)據(jù)的積極性不高的重要原因。但在傳統(tǒng)的中心化推薦系統(tǒng)中,由于缺少可信的執(zhí)行環(huán)境,精細化的激勵機制難以實施。區(qū)塊鏈技術(shù)可對用戶所反饋數(shù)據(jù)的使用全過程進行客觀的跟蹤和記錄,使得透明性和公平性得到保證,為實施精細化激勵機制創(chuàng)造了條件。依據(jù)平臺上部署的智能合約,用戶獲得的收益將由其提供的反饋數(shù)據(jù)的實際價值和長期使用效果直接決定,從而解決了用戶與平臺間的信任問題。結(jié)合區(qū)塊鏈上的加密貨幣,對用戶反饋數(shù)據(jù)的精細化激勵可以有效刺激交易市場,在解決數(shù)據(jù)稀疏問題的同時,實現(xiàn)各參與方的共贏。

        第三,重視區(qū)塊鏈框架的可擴展性研究。目前大多數(shù)研究是在簡化的網(wǎng)絡(luò)環(huán)境下進行少量實驗,對區(qū)塊鏈框架的可擴展性研究不足。現(xiàn)有的區(qū)塊鏈框架只能處理少量的鏈上交易,適用于小規(guī)模的、對吞吐量要求較低的應(yīng)用場景。然而,推薦系統(tǒng)被廣泛應(yīng)用于各大領(lǐng)域,特別是電商平臺。這些應(yīng)用場景可能需要大規(guī)模地處理交易數(shù)據(jù),對系統(tǒng)的延遲和吞吐量有一定要求。此外,許多業(yè)務(wù)應(yīng)用場景對系統(tǒng)性能有動態(tài)需求,例如可能在某個時間請求大量資源。解決可擴展性是區(qū)塊鏈被廣泛采用的重要前提。已有研究針對區(qū)塊鏈框架的可擴展性提出了一些解決方案,如分片技術(shù)、側(cè)鏈技術(shù)等。在推薦系統(tǒng)與區(qū)塊鏈的結(jié)合中,也應(yīng)重視區(qū)塊鏈框架的可擴展性研究。

        第四,推薦算法與智能合約的相互融合??紤]到智能合約的可編程特性,可將推薦算法嵌入智能合約中。推薦系統(tǒng)領(lǐng)域的算法研究已較為成熟,如協(xié)同過濾推薦等算法已被成功應(yīng)用于眾多電商平臺,但這些算法都只能在中心化架構(gòu)中運行。智能合約是運行于區(qū)塊鏈之上的圖靈完備編程語言,需要對傳統(tǒng)推薦算法進行智能合約化改造,才能使其適用于區(qū)塊鏈運行環(huán)境,并使推薦邏輯和數(shù)據(jù)使用過程透明化,以滿足對數(shù)據(jù)使用過程跟蹤溯源的前提。

        第五,推薦算法與邊緣計算技術(shù)的結(jié)合。推薦系統(tǒng)屬于計算密集型應(yīng)用,推薦模型的訓(xùn)練和推薦結(jié)果的生成需要基于用戶提供的反饋數(shù)據(jù)進行大量的運算,與區(qū)塊鏈融合之后會造成計算和存儲成本上升,增加平臺負擔。邊緣計算是近年來興起的一種計算模型,利用具有計算資源的終端設(shè)備在本地處理海量數(shù)據(jù)和大規(guī)模運算,旨在解決集中式的云計算實時性不高、網(wǎng)絡(luò)帶寬不足、計算能耗大和數(shù)據(jù)安全保護不足等問題[51]。因此,應(yīng)基于區(qū)塊鏈去中心化的結(jié)構(gòu)特點,探索將推薦算法與邊緣計算技術(shù)結(jié)合,使計算負荷被合理分配給區(qū)塊鏈中的節(jié)點,提高基于區(qū)塊鏈的推薦系統(tǒng)效率。

        區(qū)塊鏈的興起為推薦系統(tǒng)帶來了根本性的變革。從推薦系統(tǒng)和區(qū)塊鏈技術(shù)實踐的發(fā)展來看,區(qū)塊鏈與推薦系統(tǒng)的結(jié)合必將成為重要的發(fā)展趨勢。因此,通過對區(qū)塊鏈推薦系統(tǒng)領(lǐng)域進行系統(tǒng)的文獻回顧,有助于區(qū)塊鏈推薦系統(tǒng)研究的發(fā)展,并更好地指導(dǎo)和服務(wù)實踐。

        猜你喜歡
        區(qū)塊文獻算法
        Hostile takeovers in China and Japan
        速讀·下旬(2021年11期)2021-10-12 01:10:43
        區(qū)塊鏈:一個改變未來的幽靈
        科學(xué)(2020年5期)2020-11-26 08:19:12
        區(qū)塊鏈:主要角色和衍生應(yīng)用
        科學(xué)(2020年6期)2020-02-06 08:59:56
        基于MapReduce的改進Eclat算法
        Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
        大東方(2019年12期)2019-10-20 13:12:49
        Travellng thg World Full—time for Rree
        進位加法的兩種算法
        區(qū)塊鏈+媒體業(yè)的N種可能
        傳媒評論(2018年4期)2018-06-27 08:20:12
        讀懂區(qū)塊鏈
        The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
        少妇高潮惨叫正在播放对白| 日本加勒比精品一区二区视频| 国产成人久久精品一区二区三区| 国产又爽又黄又刺激的视频| 日本精品一区二区三区在线视频 | 国产传媒在线视频| 99亚洲女人私处高清视频| 第一次处破女18分钟高清| 四虎影视永久地址www成人| 国产免费av片在线观看播放| 久久蜜臀av一区三区| 手机看片自拍偷拍福利| 一本一道波多野结衣av中文| 久久精品国产91久久性色tv| 男女视频网站免费精品播放| 香蕉视频在线观看亚洲| 国产xxxx99真实实拍| 国产日韩欧美911在线观看| 97女厕偷拍一区二区三区| 国产乡下妇女做爰| 久久久久久成人毛片免费看| 久久精品综合国产二区| 精品人妻久久一日二个| 成人国产精品一区二区视频 | 插插射啊爱视频日a级| 无码国产精品一区二区高潮| 成人在线免费视频亚洲| 日本韩国三级在线观看| 亚洲欧美牲交| 亚洲AV永久无码制服河南实里 | 中文字幕在线码一区| 男女搞黄在线观看视频| 久久亚洲精品中文字幕| 精产国品一二三产区m553麻豆 | 中文字幕精品久久久久人妻红杏1| 高跟丝袜一区二区三区| 日韩精品一区二区三区乱码| 国产麻传媒精品国产av| 国产福利片无码区在线观看 | 77777亚洲午夜久久多喷| 中文国产日韩欧美二视频|