李隴豫
(中國民航大學 中歐航空工程師學院,天津 300300)
現(xiàn)有的影響力度量方法主要有基于網絡拓撲結構[1-2]、基于用戶行為[3-4]和基于用戶交互行為[5]的影響力度量方法。本文根據(jù)民航旅客訂座數(shù)據(jù)(Passenger Name Record,簡稱為“PNR”),基于民航旅客社會網絡拓撲結構和旅客共同出行行為,提出一種民航旅客影響力的度量方法。
PageRank算法是一種基于鏈接結構的網頁排名算法,該算法通過網頁之間的鏈接關系對網頁的重要性作出評判。PageRank算法的數(shù)學公式如下:
式(1)中:PR(vi)為網頁vi的PageRank值;PR(vj)為鏈接到網頁vi的網頁vj的PageRank值;L(vj)為網頁vj包含的鏈接數(shù)量;q為對網絡中所有頁面公平引入的阻尼系數(shù)。
由于民航旅客社會網絡是一個有向加權的社會網絡,PageRank算法中對初始權重平均分配并不合理,因此我們利用改進后的PageRank算法來計算網絡中節(jié)點的影響力大小。改進后節(jié)點PR值的計算公式如下:
式(2)中:W(vj,vi)表示節(jié)點vj對節(jié)點vi的影響強度;Sout(vj)表示節(jié)點vj的出強度,其計算公式為:
由此,我們得到了網絡中所有節(jié)點基于網絡拓撲結構的影響力大小。
每名旅客與其他旅客的共同出行行為對該旅客自身的影響力也有一定程度的影響,若一名旅客與其他旅客共同乘機的次數(shù)越多、頻率越高,則該旅客越容易對其他旅客產生影響,則其自身的影響力也就越大。因此,度量旅客影響力時需要考慮該旅客與其他旅客的共同出行行為。本文使用旅客共同出行的次數(shù)和共同出行的頻次來量化旅客vi,vj之間的共同出行行為,具體計算方法如式(4):
式(4)中:Tvi,vj和Fvi,vj分別表示旅客vi,vj在一段時間內的共同出行次數(shù)和旅客vi,vj最近一次出行日期與統(tǒng)計日期的間隔天數(shù);和分別表示網絡中所有旅客間的共同出行次數(shù)和出行頻次的平均值;β為旅客共同出行次數(shù)和頻次的調節(jié)因子。因此,我們得到旅客vi的平均共同出行量為:
式(5)中:ivM表示旅客vi的鄰居節(jié)點集合;Ni為旅客的
2.1.1 政府要大力發(fā)展農村經濟。政府要立足于社會的發(fā)展,發(fā)展農村經濟,農村經濟有了政府政策的傾斜,可以反哺農村空巢老人生活環(huán)境的改善,使其為空巢老人在內所有老人的晚年生活提供經濟保障。這樣不僅可以緩解城市的就業(yè)壓力,而且可以吸引外出工作的子女返鄉(xiāng),讓空巢老人真正實現(xiàn)“老有所依”。
鄰居節(jié)點個數(shù),
綜合民航旅客社會網絡的網絡拓撲結構和旅客的出行行為,我們得到民航旅客影響力計算模型CAPI-Rank如式(6)所示:
式(6)中:α為基于網絡拓撲的旅客影響力和基于旅客出行行為的影響力的平衡因子,0≤α≤1.
本文采用節(jié)點數(shù)為2 034、邊數(shù)為13 328的民航旅客社會網絡進行實驗驗證。實驗的硬件環(huán)境為Inter(R)Core(TM)i5-2400 CPU@3.10 GHz×4,4 GB內存。
本文通過IC模型模擬旅客影響力的傳播,將每個旅客最終激活的節(jié)點數(shù)作為他們真實的影響力值。由于民航旅客社會網絡模型的間邊權重表示旅客之間的影響強度,因此這里我們用網絡中的邊權重作為IC模型中的激活概率p.
將本文提出的CAPI-Rank影響力度量方法與度中心性DC、接近中心性CC、介數(shù)中心性BC和PageRank算法4種常用的影響力度量方法進行對比,采用斯皮爾曼相關系數(shù)ρ來衡量不同度量方法得出的旅客排名與真實旅客影響力排名的相關性。
CAPI-Rank模型中共有α,β兩個參數(shù),α用來調節(jié)網絡拓撲結構和旅客出行行為對影響力的影響,β用來調節(jié)旅客出行行為中出行次數(shù)和出行頻次的比例。下面通過實驗討論兩個參數(shù)的取值問題。
圖1展示了CAPI-Rank模型在不同α,β下的變化情況。從圖中可以看出,CAPI-Rank模型在α=0.765、β=0.824時取得最大值。
圖1 不同參數(shù)取值CAPI-Rank模型ρ值變化情況
在得到CAPI-Rank中的最優(yōu)參數(shù)α,β后,我們通過實驗比較了CAPI-Rank和度中心性DC、接近中心性CC、介數(shù)中心性BC、PageRank算法的表現(xiàn)。
圖2為5種度量方法在民航旅客社會網絡下的ρ值。從圖中我們可以看出,CAPI-Rank相比于其他度量方法能取得最大的ρ值,說明CAPI-Rank在該網絡中能夠取得最好的度量效果。由于網絡中節(jié)點連接不緊密,并且節(jié)點之間的影響強度很小,節(jié)點的影響力很難在網絡中傳播開來,大多數(shù)節(jié)點只能影響網絡中與它相近的小部分節(jié)點。正因為如此,DC的效果相對較好,因為DC僅按照網絡中節(jié)點的度數(shù)排序,能夠找到不同區(qū)域內影響力相對較大的節(jié)點;而CC考慮網絡中節(jié)點與其他節(jié)點之間的路徑長短,但事實上,處于網絡中心的節(jié)點由于影響強度的限制很難將其影響力擴散開,因此CC的效果并不理想。而CAPI-Rank模型由于考慮可網絡拓撲和旅客出行行為兩方面的因素,在最終結果上要優(yōu)于僅考慮網絡拓撲結構的度量方法。
圖2 不同度量方法在民航旅客社會網絡下的ρ值
本文根據(jù)民航旅客訂座數(shù)據(jù)的特點,基于網絡拓撲結構和旅客共同出行行為,提出了一種旅客影響力的計算模型。實驗表明,本文提出的CAPI-Rank模型在民航旅客影響力度量準確性方面要優(yōu)于傳統(tǒng)的影響力度量方法。
[1]Page L,Brin S,Motwani R,et al.The PageRank citation ranking:Bringing order to the web[J].Food Microstructure,1999(01):1-17.
[2]金迪,馬衍民.PageRank算法的分析及實現(xiàn)[J].經濟技術協(xié)作信息,2009(18):118.
[3]Rabiger S,Spiliopoulou M.A framework for validating the merit of properties that predict the influence of a twitter user[J].Expert Systems with Applications,2015,42(5):2824-2834.
[4]毛佳昕,劉奕群,張敏,等.基于用戶行為的微博用戶社會影響力分析[J].計算機學報,2014,37(4):791-800.
[5]史艷翠,楊巨成,陳亞瑞,等.基于移動數(shù)據(jù)的用戶間影響力計算方法[J].華中科技大學學報,2017,45(7):110-114.
[6]張琨,李配配,朱保平,等.基于PageRank的有向加權復雜網絡節(jié)點重要性評估方法[J].南京航空航天大學學報,2013(03):429-434.