亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進隨機分塊模型的電商網絡鏈路預測算法

        2024-05-24 08:35:51史玉林錢曉東
        計算機應用研究 2024年3期

        史玉林 錢曉東

        摘 要:通過改進的隨機分塊模型(SBM)鏈路預測算法,研究電子商務網絡的演化過程與社團結構。針對原始SBM模型塊之間的度分布為二項式分布,引入度衰減參數使得隨機分塊模型中塊之間的度分布遵循冪律分布。針對原始SBM模型中節(jié)點之間的連接僅僅取決于節(jié)點所屬塊的假設,引入度控制參數使其更接近真實網絡的度數分布?;诖颂岢鰞?yōu)化后的隨機分塊模型,并利用阿里巴巴淘寶數據集驗證該算法,結果顯示該算法精確度高于隨機分塊模型(SBM)、度修正的隨機分塊模型(DCSBM)以及層次結構模型(HBM)。說明改進后的算法能較好地刻畫電商網絡中的社團結構,準確地發(fā)現網絡中的缺失鏈接。

        關鍵詞:隨機分塊模型; 電商網絡; 鏈路預測; 推薦

        中圖分類號:TP630.40?? 文獻標志碼:A

        文章編號:1001-3695(2024)03-026-0824-07

        doi:10.19734/j.issn.1001-3695.2023.07.0329

        E-commerce network link prediction algorithm based on

        improved stochastic block model

        Shi Yulin, Qian Xiaodong

        (School of Economics & Management, Lanzhou Jiaotong University, Lanzhou 730070, China)

        Abstract:To study the evolution process and community structure of e-commerce networks, this paper used an improved stochastic block model(SBM) link prediction algorithm. Since the degree distribution among blocks in the original SBM model was binomial, to make the degree distribution among blocks follow the power law distribution in the stochastic block model, this paper introduced the degree attenuation parameter. Aiming at the assumption that the connection between nodes depended only on the block to which nodes belong in the original SBM model, to make the degree distribution closer to the real network, the paper introduced the degree control parameter. Based on this, the paper proposed an optimized random block model, and used the Alibaba Taobao data set to verify the proposed algorithm. The results show that the accuracy of the proposed algorithm is higher than the SBM, the degree-corrected stochastic block model(DCSBM) and the hierarchical structure model(HBM). It shows that the improved algorithm can describe the community structure of the e-commerce network well and find the missing link in the network accurately.

        Key words:stochastic block model(SBM); e-commerce network; link prediction; recommendation

        移動電子商務網絡的迅猛發(fā)展,逐漸改變了人們傳統的購物方式。通過使用移動設備,擺脫了傳統電子商務的束縛,使得購物在時間、地點上更加靈活。消費者可以隨時隨地利用碎片時間進行網頁瀏覽和消費,大大提高了交易的效率。近幾年,各品牌、中間商和商家紛紛走進電商平臺,想趕上電商平臺帶來的紅利,這使得各大電商平臺中商品的數量與品類呈指數增加。與此同時,用戶在購買前后的瀏覽、購買、收藏、評論等行為也使得電子商務網絡中的數據呈指數上升。那么,如何在海量的商品中根據消費者的以往消費行為為其提供個性化推薦,是目前研究的一個熱點。通過將整個電商網絡的數據進行分塊處理,然后對不同社區(qū)的消費者進行推薦,會大大提高推薦的準確度,增加商品銷量。

        鏈路預測是推薦系統中的一個重要研究方向,其可用于提取信息、識別虛假的交互、評估網絡演化機制等[1]。除了幫助分析具有缺失數據的網絡之外,鏈接預測算法還可以用于預測未來可能出現在不斷發(fā)展網絡中的鏈接。例如,在電子商務網絡中,非常可能但尚未存在的鏈接可以被推薦為有希望的被購買的產品,這可以幫助用戶找到有潛在需求的商品,從而提高他們對網站的忠誠度。然而鏈路預測算法在電子商務網絡中的研究尚屬于起步階段,如何利用鏈路預測算法遏制失真信息,預測節(jié)點間連接的概率,提高推薦的精確性,還有待商榷。因此,本文基于傳統的隨機分塊模型,結合電商網絡中的消費者購買特性,對該模型進行優(yōu)化改進,使得實驗結果更加符合實際情況,為電子商務網絡個性化推薦研究提供參考。

        1 相關研究綜述

        鏈路預測是社交網絡研究的一個重要分支。社交網絡中的鏈路預測能夠給社交網絡中的用戶提供個性化的推薦,給可能交互的用戶提供接觸的橋梁[2]。21世紀初,文獻[3]首先提出鏈路預測,并將其應用在社交網絡中。隨后鏈路預測在不同的網絡領域中采用,例如信息檢索、生物信息學、電子商務和信息計量學[4]。現有鏈路預測領域的研究方法有基于相似性的鏈路預測算法、概率模型、最大似然模型等[5]。

        1)基于相似性的鏈路預測算法 在該方法中,基本假設是將兩個節(jié)點之間的相似性得分視為它們之間形成鏈接概率的重要因素[6],對于所有未觀察到的鏈接,計算相似性分數,并且較高的分數意味著將來節(jié)點之間形成鏈接的概率較高[7]。如果兩個節(jié)點具有共同的特征,那么可以直接測量節(jié)點相似性;否則,必須使用涉及鏈接屬性的結構相似性來測量節(jié)點相似性[8]。目前研究中,具有代表性的算法指標有局部社團范式系列增強指標(local-community-paradigm,LCP)[9]、資源分配指標(resource allocation,RA)[10]、共同鄰居指標(common neighbor,CN)[3]。大部分基于相似性的鏈路預測算法都在二階路徑框架下設計,但也有少量但重要的算法更關注節(jié)點間的局部連接范式,如LCP系列指標[6]。

        2)基于概率模型的鏈路預測算法 該算法是通過對網絡中已有節(jié)點之間的連接進行概率建模,來預測未來節(jié)點之間的連接。其中主流概率模型包括貝葉斯網絡、馬爾可夫隨機場、隨機關系模型和考慮了實體之間依賴關系的圖模型[11]等。文獻[3]最先將機器學習方法應用在鏈路預測中,并且獲得了較高的準確度。Asil等人[12]采用了一種基于模糊規(guī)則的監(jiān)督學習算法,并通過實驗證明在監(jiān)督算法中,決策樹算法和隨機森林算法比基于模糊規(guī)則的算法具有更好的性能。Gupta等人[13]通過樸素貝葉斯方法將鏈路預測視為一個二元分類問題來識別網絡中缺失的連接。但在這些模型中,需要輸入節(jié)點信息以及網絡拓撲結構,因此無法高效地應用在僅具有連邊關系的網絡數據中。

        3)基于最大似然模型的鏈路預測算法 最大似然模型的基本思路是首先對數據去除噪聲、填充缺失值、標準化等,通過統計學方法對節(jié)點之間的聯系進行建模,并利用已知的社交網絡數據進行模型訓練,通過交叉驗證等方法優(yōu)化模型參數,最后利用訓練好的模型對未知節(jié)點之間的鏈接進行預測。Clauset等人[14]提出一種簡單的層次結構模型(hierarchical structure model,HSM),該模型的精確度雖然較高,但計算復雜度卻很大。文獻[15]在傳統的隨機分塊模型基礎上,提出一種適用于動態(tài)網絡的混合結構獎勵預測算法來預測網絡中丟失的鏈接。Pan等人[16]提出一種算法框架,用預先定義的結構哈密頓量計算網絡概率,并通過大量的數值模擬表明該算法在預測缺失的鏈接和識別虛假的鏈接方面比最先進的方法具有更高的精度。

        以上三種鏈路預測算法中,基于相似性的鏈路預測方法通過判斷節(jié)點之間的相似性確定節(jié)點之間出現新的連邊的可能性,然而這種方法并不能充分考慮網絡結構的復雜性和動態(tài)性,所以其預測準確度有限?;诟怕誓P偷姆椒ǔ浞挚紤]了網絡節(jié)點間的關系,預測準確度相對于基于相似性的方法有所提高,但是其計算復雜度較高,且對數據的依賴程度較高。最大似然方法中,雖然同樣面臨著計算復雜度高和依賴數據的問題,但該方法在預測準確度上相比其他方法具有優(yōu)勢。因此,本文選取在預測精度上具有優(yōu)勢的最大似然鏈路預測算法,并且選取了在時間復雜度和準確性、效率性上有很大優(yōu)勢的隨機分塊模型。

        2 隨機分塊模型與改進

        2.1 隨機分塊模型

        1983 年,文獻[17]將隨機模型與塊模型結合,從而提出隨機塊模型(stochastic block model,SBM)。該模型是建立在一定的先驗知識的基礎上的,它的主要思想是將網絡中的節(jié)點分成若干個群,兩個節(jié)點是否連接的概率只取決于節(jié)點所在的群[18]。即該模型認為處于同一組中所有節(jié)點的地位是相同的,它主要由兩部分信息決定,一是網絡被分成若干群的方案,二是分屬于兩個群的兩點之間產生連邊的概率矩陣[18]。

        綜上,本文選擇了在建模靈活性、挖掘精度和應用上都有著巨大優(yōu)勢的模型——隨機塊模型(SBM)[13]。但傳統的隨機塊模型(SBM)在刻畫電商網絡中存以下局限。a)模型中假設塊之間的度分布為二項式分布[19],在實際電子商務網絡中,商品之間的關系復雜且密集,其結構通常由少數幾個超級節(jié)點主導,這些節(jié)點有著極高的度數和影響力。在此情況下,如果僅用二項式分布假設各商品之間的連接概率,得到的推薦結果可能與用戶實際需求不相符。因此傳統的隨機分塊模型假設塊之間的度為二項式分布,并不能反映電子商務網絡中消費者與商品之間的關系。b)在傳統隨機分塊模型中,假設節(jié)點之間的連接僅僅取決于節(jié)點所屬的塊[20],并沒有考慮節(jié)點的度數對推薦結果的影響,這會導致一些節(jié)點被過度推薦或者被低估,從而影響鏈路預測的精確度。因此本文對SBM模型作出以下優(yōu)化:a)通過引入度衰減參數,使得隨機分塊模型中的塊之間的度分布遵循冪律分布;b)通過引入節(jié)點的度控制參數,從而調整網絡中邊的生成概率,合理限制節(jié)點的度數,使模擬出的網絡更接近真實網絡的度數分布,并且利用真實的消費者數據對優(yōu)化后的模型進行實證模擬,以期提高推薦準確度。

        2.2 改進隨機分塊模型

        2.2.1 基于度衰減參數的SBM模型塊間的度分布優(yōu)化

        1)傳統SBM模型塊間度分布的不足

        由于傳統的隨機分塊模型(SBM)在塊之間的節(jié)點連接時用相同的參數處理塊中的所有節(jié)點,即該模型假設塊之間的度分布是二項式分布。但是在真實的電子商務網絡中,每個個體的購買力大小不同,所以隨機分塊模型(SBM)在研究電子商務網絡的演化過程中存在不足。

        一般來說,當個體擁有更強購買力時就更有可能購買新的產品,從而與新的個體產生連接。因為他們已經有了更大的交際圈,所以更有可能通過現有的關系結交到新的朋友,擁有更多朋友可以創(chuàng)造更多交新朋友的機會。實際上,當一個個體已經擁有很多朋友時,這表明他們可能有某種能力或者親和力來交更多的新朋友,這種能力會吸引其他人產生新的關系,就像流行網站上鏈接到其他網站和博客上的鏈接一樣,已經建立的城市會招來新的鐵路和航線規(guī)劃。這種特征符合無標度網絡結構中“偏好依附”這一原則。偏好依附是一個大者愈大的網絡增長規(guī)則:一個有著更多連接的節(jié)點相比于連接更少的節(jié)點會有更大可能性獲得新的連接。因此傳統的隨機分塊模型(SBM)不能對普遍存在于現實電商網絡中的這種冪律分布特征進行建模。在電商網絡中,一些節(jié)點可能具有很高的度數,比如熱門商品或者廣告;而一些節(jié)點可能具有很低的度數,比如稀有商品或者少有人關注的店鋪。加入度衰減參數可以更好地處理這些不同類型的節(jié)點。具體來說,度衰減參數可以降低節(jié)點度數與其他節(jié)點之間的連接概率,這樣能夠更好地反映網絡中度數大的節(jié)點對網絡結構的影響,并避免一些不合理的連接,從而更好地擬合電商網絡結構。

        2)改進SBM模型塊間度分布的優(yōu)化

        基于上述分析,本文提出一種適應現實世界電商網絡中冪律分布特征的方法,從而提高商品推薦的精確性。將網絡中的每個節(jié)點i與另一個潛在變量αi≥0相關聯,并用它來調整節(jié)點度的分布,即

        p(αi|λ)=λe-λαi(1)

        其中:αi為度衰減變量,且該變量與節(jié)點之間的概率呈負相關。令αi服從指數先驗exp(λ),從而得到不同的取值范圍。αi取值越大代表節(jié)點的度衰減得越快,取值越小,則表示節(jié)點的度衰減得越慢。因此,節(jié)點度的變化規(guī)律應滿足:a)當αi=0,即所有節(jié)點的度不發(fā)生變化時,節(jié)點度數對社區(qū)結構沒有影響,所有節(jié)點被等概率地分配到各個社區(qū)中,模型退化至傳統的隨機分塊SBM;b)當αi=1,即所有節(jié)點的度不斷變化時,節(jié)點度數對社區(qū)結構的影響最大,節(jié)點度數越大,被分配到同一社區(qū)的概率越大,節(jié)點的度分布最終演化為冪律分布。

        在電商網絡中,同一個社區(qū)中節(jié)點之間的連接是構成該社區(qū)的主要因素,而該社區(qū)與其他社區(qū)的連接則相對較少。在這一假設的基礎上,本文考慮集群內或等效的單集群情況來證明優(yōu)化后的隨機分塊模型的建模能力。

        3)改進SBM模型塊間度分布優(yōu)化分析

        假設一個社團內有m0個節(jié)點,每個節(jié)點都與潛在度衰減變量αi~exp(λ)相關聯,兩個社區(qū)之間的邊緣概率為p0?;趶姶蟮拇髷刀?(SLLN),隨著m0的增加,可以證明,優(yōu)化后的隨機分塊模型節(jié)點i的歸一化度將收斂到僅取決于 αi的隨機變量di[21],即

        將式(3)看作優(yōu)化后的隨機分塊模型的冪律度特征,當 λ 較小時,式(3)中形狀參數γ=1+λ/ln p0的值接近1。雖然這小于實際網絡的典型值(介于2~4)。但是較小的形狀參數使優(yōu)化后的模型能夠更加符合電商網絡度分布的重尾特征。

        4)模擬實驗

        通過仿真實驗驗證引入度衰減參數后的SBM模型有較好的性能,兩個模型的初始網絡均有200個節(jié)點,網絡的平均度數k=10,社區(qū)間的連邊概率p0=0.25,網絡中的社區(qū)數c=5,引入度衰減參數的模型將參數αi設置為0.52,將傳統的隨機分塊模型和引入度衰減參數的隨機分塊模型生成的網絡(圖1)進行比較,生成網絡的度分布的變化如圖2所示。

        圖1(a)為傳統隨機分塊模型生成的復雜網絡,圖1(b)為引入度衰減參數生成的復雜網絡;圖2(a)為傳統隨機分塊模型生成網絡的度分布直方圖,圖2(b)為引入度衰減參數生成網絡的度分布直方圖。從實驗結果來看,傳統隨機分塊模型生成網絡(圖1(a))的度數相關性為-0.007,引入度衰減參數的SBM模型生成網絡(圖1(b))的度數相關性為-0.226,表明優(yōu)化后的模型節(jié)點傾向于連接到度數比本身小的節(jié)點,得到的節(jié)點的度分布更分散;另外,圖1(a)的冪律指數為13.995,圖1(b)的冪律指數 為4.73,表明加入度衰減參數后的模型得到的網絡呈現出冪律分布的特征,這一特點在圖2中同樣得到驗證,圖1(b)的節(jié)點度分布圖擁有明顯的長尾特征。因此,引入度衰減參數的隨機分塊模型有利于模擬更加真實的電商網絡。

        2.2.2 基于度控制參數的節(jié)點之間連接概率的優(yōu)化

        1)傳統SBM模型節(jié)點之間連接概率的不足

        傳統隨機分塊模型(SBM)中任意節(jié)點vi和vj之間是否有鏈接取決于兩者所屬的塊及塊和塊之間的鏈接概率。但在真實的電子商務網絡中,擁有相似購買喜好的消費者在未來的消費行為中,購買同樣或類似產品的概率也不盡相同。因此傳統的隨機分塊模型應用在實際的電商網絡中存在不足之處。

        在小世界網絡節(jié)點之間連接的研究中,研究較多的是通過在原有的連邊基礎上隨機化加邊或者隨機化重連來形成具有冪律分布特性的網絡,這些方法可以從不同方面刻畫出特定的網絡,也都有其自身的優(yōu)點和不足?,F實世界中的網絡千變萬化,在將具有相同特征的節(jié)點劃分到同一區(qū)塊后,還需對同一區(qū)塊中的節(jié)點再作出區(qū)分。

        2)改進SBM模型節(jié)點連接概率的優(yōu)化

        基于上述分析,本文提出一種新的決定節(jié)點之間連接概率的方法。在該方法中,節(jié)點依然會劃分到各個不同的區(qū)塊,不同的是任意兩個節(jié)點之間的連接概率是由節(jié)點所屬的區(qū)塊與節(jié)點的期望度參數共同決定的,將新引入的節(jié)點度控制參數與已有的塊參數相乘,可以合并成為新的期望鏈接數。具體的計算方法如下:

        a)構建網絡。將一個無向網絡記為G(V,E),該網絡包含自邊和多邊的無向網絡,其鄰接矩陣記為A,并按如下方式進行定義:

        4.3 實驗結果分析

        4.3.1 改進后的SBM模型對真實網絡的影響分析

        Clauset等人[23]的研究表明,度衰減參數可以在0.1~1.0取值,當衰減參數取值較小(0.1左右)時,生成的網絡具有更巨大的社區(qū)結構,而當衰減參數取值較大(0.9左右)時,生成的網絡更為分散。Monroy等人[24]通過實驗表明,當度控制參數的值在(0.5,1]時,節(jié)點度數分布呈現冪律分布特性。因此,本文選取度衰減參數為0.3、0.9,度控制參數為0.6、0.9排列組合而成的四組數據進行仿真模擬。

        運用仿真軟件得出度衰減參數αi和度控制參數βi為(0.3,0.6)(0.9,0.6)(0.3,0.9)和(0.9,0.9)的網絡拓撲結構圖,如圖3(a)~(d)所示。圖3(a)有197個節(jié)點和834條邊,(b)有197個節(jié)點和1 278條邊,(c)有197個節(jié)點和1 481條邊,(d)有197個節(jié)點和1 947條邊,并且表1列出了上述四個網絡的基本拓撲性質。其中,從網絡的平均集聚系數來看,該網絡具有很強的集聚性,說明任意兩個節(jié)點之間都存在很多共同的鄰居節(jié)點;四個網絡的同配系數均為負數,說明度數不同的節(jié)點相互連接的概率更高,即所有網絡都是異配的。通過計算得到四個網絡冪律指數分別為1.9、2.4、2.7、2.8,均符合電商網絡的冪律指數為(1.5,3)[25],因此該網絡可用于進行電商網絡預測的研究。

        從圖3可以得出:若度衰減參數αi不變,度控制參數βi在一定范圍內設置越小,網絡就越稀疏;若度控制參數βi不變,度衰減參數αi在一定范圍內設置越小,網絡就越密集。在一定范圍內度衰減參數越小,度控制參數越大,網絡就越密集。本文分析這是由于度衰減參數αi越大時,節(jié)點對相似度的影響就越小, 節(jié)點之間成為鄰居的可能性就越小,形成的網絡便越稀疏;度控制參數βi越大時,節(jié)點的鄰居數量會越多,節(jié)點之間的連接就更加密集,網絡也就更加密集。因此,度衰減參數在一定范圍內應設置得較小,度控制參數在一定范圍內應設置得較大。

        4.3.2 實驗對比分析

        由于現實網絡中隨機發(fā)生、不確定因素的存在,常常造成網絡中的許多缺失、不準確的信息。例如在建構社會網絡時,一些涉及到被調查者隱私的信息,往往會被隱瞞不愿告知,或者由于暫時被遺忘而導致搜集到的信息不完整。其次在人工處理信息時,也會因為一些失誤造成最終構造的網絡不準確。以上各種因素在網絡連接過程中均會導致邊的隨機缺失現象。

        為驗證本文算法具備較高的預測準確率,使用阿里巴巴消費者數據構建的實際網絡,按照缺失邊比例f=|EL|/|ET|,f∈[0.05,0.95]生成若干“缺失邊”,然后檢驗改進后的算法識別這些邊的能力。針對傳統的SBM、Degree-corrected stochastic block model(DCSBM)、優(yōu)化后的SBM(Optimized-SBM)和基于最大似然方法的層次結構模型(hierarchical structure model,HSM)四種鏈路預測的算法,將其分別與同一個缺失比例的真實網絡所獲得的預測結果進行對比,計算相應的AUC指標,每個取值均為四種算法在真實網絡數據集運行100次取平均值所得,結果如圖4所示。

        實驗過程中,Optimized-SBM算法在度衰減參數和度控制參數變化時得到的網絡節(jié)點和邊的數量與其他三種算法保持一致。橫坐標f表示缺失邊的設置比例,計算公式為f=|EL|/|ET|,變化為0.05~0.95;縱坐標為AUC值,圖4中的每條曲線都表示對應算法在f變化時AUC的變化。

        由圖4可以看出,在度衰減參數不變的前提下,隨著度控制參數的減小,四種算法的精確度都有明顯提高,僅在度衰減參數較小時,隨著度控制參數的變大,HSM算法的精確度降低。本文分析出現該現象的原因是在密集網絡中,節(jié)點的度數相對較高,導致許多節(jié)點之間具有相同的共同鄰居數,從而降低HSM算法的預測精度;在度控制參數不變的前提下,隨著度衰減參數的變小,即網絡越密集的情況下,四種算法的預測精確度基本都有不同程度的提高。

        另外,Optimized-SBM算法不論在稀疏網絡還是密集網絡的精確度都比HSM算法要好很多,僅在度衰減參數為0.3的網絡中Optimized-SBM算法在缺失邊比例較小時表現不如DCSBM和SBM算法,當缺失邊比例超過65%時該算法才能給出更好的預測精確度,而在其他網絡中,該算法的精確度都比DCSBM和SBM算法要高。本文分析出現該現象的原因是:

        a)加入度控制參數的隨機分塊算法依賴節(jié)點度數和所在塊的度數之和,這種方法在處理度衰減參數較小的網絡時容易受到塊大小的影響,即塊大小相近的情況下,節(jié)點在不同塊中的度數和并不會有很大的差別。因此,節(jié)點的分配可能不夠精確,導致算法性能下降。

        b)傳統隨機分塊算法和度修正的隨機分塊算法不依賴節(jié)點度數和所在塊的度數之和,而是基于節(jié)點之間的連接關系進行劃分,這種方法在處理度衰減參數較小的網絡時仍然能夠保持較好的精確度。

        4.3.3 實驗結果

        從圖4可以看出,隨著度衰減參數αi和度控制參數βi的變小,四種算法在預測缺失邊時精確度都有提高,以Optimized-SBM算法為例,度衰減參數αi和度控制參數βi為0.9時(圖4(a)),當f=0.05時,該算法的AUC值接近0.725;而當度衰減參數αi為0.9,度控制參數βi為0.3時,同樣f=0.05的情況下,該算法的AUC值達到了0.87,即使在缺失邊比例達到0.95時,預測的精確度也達到了0.625以上。充分證明了考慮到節(jié)點度分布和節(jié)點之間的連接概率的SBM算法能夠更加準確地預測電商網絡邊的連接。

        表2展示了所有算法在不同比例的缺失邊數據下的預測效果。從結果數據中可以得出:不同的算法對于不同大小的網絡和不同缺失邊比例的情況有不同的預測效果。在節(jié)點大小較?。é?=0.9,β1=0.6)和缺失邊比例較低(如10%)的情況下,四種算法的預測效果都相對較好,MCC得分普遍在0.8以上。而在節(jié)點大小較大(α2=0.3,β2=0.9)和缺失邊比例較高(如80%)的情況下,四種算法的預測效果都有所下降,MCC得分普遍在0.5左右。在同一網絡中,本文Optimized-SBM算法的預測效果相對較好。無論節(jié)點大小和缺失邊比例如何變化,Optimized-SBM算法的AUC和MCC得分都保持在較高水平,且recall、precision和F1得分也相對平衡。說明Optimized-SBM算法可以較好地捕捉到網絡中的社區(qū)結構。

        HSM算法在大部分情況下的預測效果較差。無論是在節(jié)點大小較小還是缺失邊比例較低的情況下,HSM算法的MCC得分都明顯低于其他三種算法,且recall、precision和F1得分也較低。這可能是因為HSM算法更適用于節(jié)點之間存在較多有效路徑的情況,而在缺失邊較多的網絡中,有效路徑減少導致了預測效果的下降。

        DCSBM和SBM算法在大部分情況下的預測效果介于Optimized-SBM和HSM之間。雖然它們的預測效果沒有Optimized-SBM算法那么好,但仍然相對穩(wěn)定,并且在某些情況下能夠取得比HSM算法更好的結果。

        綜上所述,本文Optimized-SBM算法在大多數情況下表現較好,而HSM算法在缺失邊較多的情況下表現較差。DCSBM和SBM算法在某些情況下能夠取得較好的預測效果。

        4.4 建議

        針對以上實驗結果,本文針對賣家與消費者分別給予以下建議:

        對于賣家而言,可以通過提高自己的度,即增加其他店鋪和消費者與其連接,來提高自己在電商網絡中的影響力和曝光率。同時,店鋪可以選擇與度控制參數較大的其他店鋪合作,共同推廣產品,通過合作來增加自己在電商網絡中的度,以提高自己的銷售量和收益。

        對于消費者而言,應該通過參與電商網絡中的社交活動、評論和評分等方式,增加自己與其他店鋪和消費者之間的連接,提高自己在電商網絡中的度和影響力。此外,消費者可以選擇購買與其他店鋪和消費者聯系較多的店鋪產品,以獲取更多的優(yōu)惠和折扣。

        5 結束語

        本文提出一種基于改進的SBM模型的鏈路預測算法??紤]到真實電商網絡的特點,從節(jié)點的度分布和節(jié)點連接概率兩個方面改進SBM模型。

        針對原始SBM模型假設模型中塊之間的度分布為二項式分布的問題,提出基于度衰減參數來調整節(jié)點度數的優(yōu)化機制,即減少熱門商品對分塊結果的影響,使得商品分布更加均勻,提高分塊結果準確性;針對SBM模型中節(jié)點之間是否連接僅取決于塊之間的連接概率,提出將度控制參數用來調整節(jié)點所在的塊的度之和,從而影響塊的大小分布。通過兩方面的改進,SBM 模型可以更好地刻畫電子商務網絡中的演化規(guī)律,更準確地預測電子商務網絡中的節(jié)點潛在連接。選取真實的淘寶商品數據集,研究電子商務網絡的社團結構,將本文算法在不同度衰減參數和度控制參數下得到的網絡與SBM和DCSBM、HSM三種算法預測缺失邊的能力進行比較。實驗結果表明,本文算法的預測準確率優(yōu)于其他三種算法,能夠較為準確地預測出電子商務網絡中原有的連邊,同時也更加符合電子商務網絡的真實結構,有助于從微觀層面了解電子商務網絡的演化機制。

        參考文獻:

        [1]Lyu Linyuan, Zhou Tao. Link prediction in complex networks: a survey[J]. Physica A: Statistical Mechanics and Its Applications, 2011,390(6): 1150-1170.

        [2]Zhang Yinuo, Shen Subin, Wu Zhenyu. Improve link prediction accuracy with node attribute similarities[J]. IEEE Trans on Know-ledge and Data Engineering, 2020,32(11): 2159-2172.

        [3]Liben N, Kleinberg J. The link-prediction problem for social networks[J]. Journal of the American Society for Information Science and Technology, 2007,58(7): 1019-1031.

        [4]Shahriary S R, Shahriari M, MD Noor R. A community-based approach for link prediction in signed social networks[J]. Scientific Programming, 2015, 2015: article ID 602690.

        [5]李艷麗, 周濤. 鏈路預測中的局部相似性指標[J]. 電子科技大學學報, 2021,50(3): 422-427 (Li Yanli, Zhou Tao. Local similarity indices in link prediction[J]. Journal of University of Electronic Science and Technology of China, 2021,50(3): 422-427.)

        [6]Lin Dekang. An information-theoretic definition of similarity[C]//Proc of the 15th International Conference on Machine Learning. [S.l.]: Morgan Kaufmann Publishers Inc., 1998: 296-304.

        [7]Biswas A, Biswas B. Community-based link prediction[J]. Multimedia Tools and Applications, 2017,76: 18619-18639.

        [8]Sun Duo, Zhou Tao, Liu Jianguo, et al. Information filtering based on transferring similarity[J]. Physical Review E, 2009,80(1): 17101.

        [9]Muscoloni A, Abdelhamid I, Cannistraci C V. Local-community network automata modelling based on length-three-paths for prediction of complex network structure sin protein interactomes, food webs and more[EB/OL]. (2018-06-14). https://doi.org/10.1101/346916.

        [10]Zhou Tao, Lyu Linyuan, Zhang Yicheng. Predicting missing links via local information[J]. The European Physical Journal B, 2009,71(4): 623-630.

        [11]Neville J, Jensen D. Relational dependency networks[J]. Journal of Machine Learning Research, 2007,8(3): 653-692.

        [12]Asil A, Gürgen F. Supervised and fuzzy rule based link prediction in weighted co-authorship networks[C]//Proc of International Confe-rence on Computer Science and Engineering. Piscataway, NJ: IEEE Press, 2017: 407-411.

        [13]Gupta A K, Sardana N. Naive Bayes approach for predicting missing links in ego networks[C]//Proc of IEEE International Symposium on Nanoelectronic and Information Systems. Piscataway, NJ: IEEE Press, 2016: 161-165.

        [14]Clauset A, Moore C, Newman M E J. Hierarchical structure and the prediction of missing links in networks[J]. Nature, 2008,453(7191): 98-101.

        [15]Liu Jia, Wang Tong, He Xingsheng, et al. Link prediction in dyna-mic networks based on reward mode[J]. Journal of Network and Computer Applications, 2017, 86: 28-36.

        [16]Pan Liming, Zhou Tao, Lyu Linyuan, et al. Predicting missing links and identifying spurious links via likelihood analysis[J]. Scientific Reports, 2016, 6(1): 1-10.

        [17]劉厚忠, 張勝, 鐘玲玲, 等. 基于邊界節(jié)點的局部擴展社區(qū)發(fā)現算法[J]. 南昌航空大學學報: 自然科學版, 2022,36(2): 44-50,57. (Liu Houzhong, Zhang Sheng, Zhong Lingling, et al. Local extended community discovery algorithm based on boundary nodes[J]. Journal of Nanchang Hangkong University: Natural Science Edition, 2022,36(2): 44-50, 57.)

        [18]呂琳媛, 周濤. 鏈路預測[M]. 北京: 高等教育出版社, 2013: 85-88. (Lyu Linyuan, Zhou Tao. Link prediction[M]. Beijing: Higher Education Press, 2013: 85-88.)

        [19]Li Yang, Chen Hechang, Yang Bo. Reparameterized stochastic block model adaptive to heterogeneous degree and block distributions[J]. IEEE Access, 2018,6: 37615-37626.

        [20]Newman M E. The probability of link formation in network dynamics[J]. Physical Review E, 2001, 64(2): 025102.

        [21]Qiao Maoying, Yu Jun, Bian Wei, et al. Adapting stochastic block models to power-law degree distributions[J]. IEEE Trans on Cybernetics, 2019,49(2): 626-637.

        [22]Chen Kehui, Lei Jing. Network cross-validation for determining the number of communities in network data[J]. Journal of the American Statistical Association, 2018,113(521): 241-251.

        [23]Clauset A, Newman M E J, Moore C. Finding community structure in very large networks[J]. Physical Review E, 2004,70(6): 066111.

        [24]Monroy D L, Naumis G G. Description of mesoscale pattern formation in shallow convective cloud fields by using time-dependent Ginzburg-Landau and Swift-Hohenberg stochastic equations[J]. Physical Review E, 2021,103(3): 032312.

        [25]Ko?a C, Dogerlioglu D K. The 1 in 1,000,000: context effects of how numbers cue different kinds of incidental environmental anchoring in marketing communications[J]. Journal of Business Research, 2020,109: 536-544.

        [26]Newman M E, Leicht E A. Mixture models and exploratory analysis in networks[J]. Proceedings of the National Academy of Scie-nces, 2007,104(23): 9564-9569.

        av素人中文字幕在线观看| 久久久久国产精品片区无码| 白色月光在线观看免费高清| 亚洲激情综合中文字幕| av在线播放亚洲天堂| 风骚人妻一区二区三区| 国产做爰又粗又大又爽动漫| 天堂在线www中文| 日本a在线看| 成年奭片免费观看视频天天看| 精品专区一区二区三区| 日本国产一区二区在线观看| 亚洲中文字幕日韩综合| 亚洲av日韩aⅴ无码色老头| 日韩激情无码免费毛片 | 国产人妖乱国产精品人妖| 久久夜色精品国产| 欧美午夜精品久久久久久浪潮| 国产免费一级高清淫日本片| 久久夜色精品国产噜噜噜亚洲av | 无码人妻丰满熟妇啪啪网站 | 亚洲人成影院在线高清| 国内精品毛片av在线播放| 国产大片黄在线观看| 久久久久国产一区二区| 91精品国产91久久久无码95| 精品蜜桃在线观看一区二区三区| 国产成人一区二区三区影院| 亚洲欧美牲交| 极品尤物高潮潮喷在线视频| 国产美女高潮流白浆免费观看| 亚洲精品大全中文字幕| 成熟丰满熟妇av无码区| 欧美丰满熟妇bbbbbb百度 | 日韩精品国产精品亚洲毛片| 国产成人av乱码在线观看| 亚洲 欧美 国产 日韩 精品| 国产三级黄色在线观看| 日韩一级137片内射视频播放| 无码人妻精品一区二区三| 93精91精品国产综合久久香蕉|