亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        開(kāi)放互聯(lián)網(wǎng)環(huán)境基于信息熵的信息傳播影響力計(jì)算方法

        2022-05-06 08:56:50李攀攀謝正霞王贈(zèng)凱靳銳
        電信科學(xué) 2022年4期
        關(guān)鍵詞:信息熵輿情影響力

        李攀攀,謝正霞,王贈(zèng)凱,靳銳

        (1. 嘉興學(xué)院信息科學(xué)與工程學(xué)院,浙江 嘉興 314001;2. 嘉興學(xué)院建筑工程學(xué)院,浙江 嘉興 314001;3. 哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,黑龍江 哈爾濱 150001)

        0 引言

        信息技術(shù)的更新迭代一直是社會(huì)發(fā)展的核心推動(dòng)力之一,科學(xué)技術(shù)的關(guān)鍵創(chuàng)新推動(dòng)了信息傳播方式的重大變化,信息傳播一直朝著速度更快、受眾面更廣、傳播成本更低的方向發(fā)展[1]。當(dāng)今,在泛互聯(lián)網(wǎng)空間環(huán)境下,信息傳播的門(mén)檻被極大地降低,信息傳播速度及傳播模式的變革深深影響了人類社會(huì)的發(fā)展[2-3]。作為衡量信息傳播能量的重要指標(biāo),信息影響力的度量在研究信息傳播過(guò)程中扮演著重要的角色,因此,研究信息在開(kāi)放互聯(lián)網(wǎng)環(huán)境中的傳播影響力、對(duì)受眾的影響程度以及探究信息演化的趨勢(shì)具有重要的現(xiàn)實(shí)意義。

        互聯(lián)網(wǎng)的出現(xiàn)改變了信息的傳播模式,一方面,信息傳播的廣度顯著增加,所傳播范圍的不確定性日益突出,相比傳統(tǒng)環(huán)境,信息共享與傳播的邊界不斷擴(kuò)大,人們能更便捷地享受信息高效傳播帶來(lái)的便利;另一方面,共享開(kāi)放的網(wǎng)絡(luò)空間給信息影響力的傳播帶來(lái)了深刻的變革,信息傳播的跨時(shí)空性給量化信息的傳播影響力帶來(lái)更為嚴(yán)峻的挑戰(zhàn)[4-5]。

        傳統(tǒng)的信息傳播影響力計(jì)算方法有如下研究。在信息影響力關(guān)鍵要素抽取方面,文獻(xiàn)[6]使用信息熵建立了中文公眾事件的抽取方法,未對(duì)傳播影響力進(jìn)一步研究;在傳播影響力分析方面,文獻(xiàn)[7]和InfoIBP(influence propagation Indian Buffet process)模型[8]側(cè)重于信息主體與信息內(nèi)容之間相互影響力的分析,忽視了信息之間的傳播影響力,而基于粒子群的LAPSO-IM(a learning automata based discrete particle swarm optimization influence maximization)方法[9]或基于蟻群優(yōu)化的ACO-IM(ant colony optimization influence maximization)方法[10]通常依賴大規(guī)模特定領(lǐng)域的數(shù)據(jù)集作為初始訓(xùn)練集,應(yīng)用范圍受限;在關(guān)鍵傳播節(jié)點(diǎn)或關(guān)鍵事件影響力分析方面,文獻(xiàn)[11]和文獻(xiàn)[12]分別使用貝葉斯方法和實(shí)測(cè)方法進(jìn)行了研究,該類方法通常忽略了信息的跨領(lǐng)域傳播。

        針對(duì)上述問(wèn)題,本文研究了開(kāi)放互聯(lián)網(wǎng)環(huán)境下多維信息因素的建模,充分考慮了互聯(lián)網(wǎng)環(huán)境的開(kāi)放性、多維性等特點(diǎn),研究了基于最大熵理論的信息傳播影響力計(jì)算方法?;ヂ?lián)網(wǎng)中海量的信息并非互相獨(dú)立,隨著互聯(lián)網(wǎng)信息共享能力的提升,大多數(shù)傳統(tǒng)的信息“孤島”和數(shù)據(jù)“壁壘”已被打破,用戶通過(guò)互聯(lián)網(wǎng)接收傳播信息的同時(shí),其認(rèn)知也同樣經(jīng)歷著影響與被影響的過(guò)程?;ヂ?lián)網(wǎng)信息傳播的影響力涉及信息對(duì)信息、信息對(duì)用戶、用戶對(duì)用戶等多個(gè)方面[13-15]。理論上講,傳播影響力是衡量信息重要程度的內(nèi)在特征屬性,如何量化這種影響力的傳播過(guò)程,探究信息傳播的影響力是研究信息傳播及其演化模型的基礎(chǔ)。

        在傳播速度更快、環(huán)境復(fù)雜性更高的公共互聯(lián)網(wǎng)環(huán)境中,評(píng)價(jià)與量化信息傳播影響力主要面臨的挑戰(zhàn)有以下方面。

        · 互聯(lián)網(wǎng)信息影響力涉及因素眾多,如信息主體、傳播路徑、客體影響等,在開(kāi)放的公共互聯(lián)網(wǎng)中難以獲得完備的信息傳播影響力要素集。

        · 互聯(lián)網(wǎng)信息類型多樣,如文本、圖片、音/視頻等,信息影響力各因素極其復(fù)雜,尤其是各因素相互疊加影響,難以統(tǒng)一量化。

        · 信息傳播渠道多樣化,如社交網(wǎng)絡(luò)轉(zhuǎn)發(fā)引用、新聞評(píng)論、學(xué)術(shù)論文引用與評(píng)述等,不同渠道難以用統(tǒng)一的量綱描述信息的影響力。

        鑒于此,本文提出了一種在公共互聯(lián)網(wǎng)環(huán)境基于信息熵的信息傳播影響力計(jì)算方法,通過(guò)“奧卡姆剃刀原理”選取關(guān)鍵特征。針對(duì)多維變量權(quán)重的相互影響,難以用傳統(tǒng)的統(tǒng)計(jì)學(xué)函數(shù)分布描述問(wèn)題展開(kāi)研究,本文采用最大熵理論探究并量化信息在公共互聯(lián)網(wǎng)中傳播的影響力,為信息傳播影響力的可度量、可計(jì)算方面的研究提供了理論基礎(chǔ)和實(shí)踐指導(dǎo)。

        1 互聯(lián)網(wǎng)信息傳播動(dòng)力學(xué)模型

        1.1 信息傳播影響力模型

        經(jīng)典的影響力傳播模型主要有兩種:線性閾值模型(linear threshold model,LT)和獨(dú)立級(jí)聯(lián)模型(independent cascade model,IC)。這兩種基于概率的傳播影響力模型[16]在計(jì)算過(guò)程中,通過(guò)引入隨機(jī)性參數(shù)在一定程度上體現(xiàn)了信息傳播的特點(diǎn),LT在信息傳播前為節(jié)點(diǎn)隨機(jī)地選擇概率的閾值,IC中一個(gè)節(jié)點(diǎn)通常以概率p激活鄰居節(jié)點(diǎn)。信息實(shí)體A,B,···,H基于LT的信息影響力傳播過(guò)程如圖1所示。

        圖1 信息實(shí)體A,B,···,H基于LT的信息影響力傳播過(guò)程

        從圖1可以看出,LT通過(guò)隨機(jī)地選擇閾值作為計(jì)算信息傳播影響力的基礎(chǔ),顯然這種隨機(jī)性難以準(zhǔn)確反映信息傳播的具體環(huán)境特點(diǎn),尤其在開(kāi)放的互聯(lián)網(wǎng)環(huán)境。從理論上看,信息傳播影響力最大化求解過(guò)程可抽象力在一個(gè)子集上面向特定目標(biāo)的查找組合優(yōu)化問(wèn)題,因此,基于LT和IC的影響力最大化問(wèn)題屬于非確定性多項(xiàng)式(non-deterministic polynomial,NP)難問(wèn)題[7],難以適用于開(kāi)放互聯(lián)網(wǎng)中信息傳播影響力的計(jì)算,主要原因有以下兩點(diǎn)。

        · 這兩種模型的相對(duì)隨機(jī)性難以適用于互聯(lián)網(wǎng)信息影響力的計(jì)算,主要因?yàn)殚_(kāi)放互聯(lián)網(wǎng)中信息影響力涉及因素多且這些因素?zé)o統(tǒng)一可計(jì)算的量綱。

        · LT概率閾值及IC激活概率的隨機(jī)性使得采用這些模型計(jì)算的傳播影響力通用性不高。

        信息傳播影響力涉及內(nèi)、外部因素諸多,難以量化這些因素與傳播影響力之間的關(guān)系,如瀏覽、引用、點(diǎn)擊量等。因此,需要使用多維可計(jì)算性衡量信息傳播影響力,以使影響力具有通用性。信息傳播影響力具備以下3個(gè)主要特征。

        · 可度量性:對(duì)信息傳播影響力的指標(biāo)進(jìn)行綜合分析并量化而成的特性,是信息傳播影響力可計(jì)算的基礎(chǔ)。

        · 可計(jì)算性:不同類型信息傳播影響力具備可計(jì)算能力,實(shí)現(xiàn)信息傳播過(guò)程中影響力的計(jì)算。

        · 多維性:信息傳播影響力不僅包含較多的因素,而且不同領(lǐng)域的信息影響力具有各自的特性,信息傳播力衡量的特征要具備容納多維特征的能力。

        根據(jù)文獻(xiàn)[18],信息傳播影響力關(guān)系可抽象成有向圖G(V,E,W),其中,V是節(jié)點(diǎn)(信息實(shí)體)的集合,E是有向邊的集合(信息個(gè)體之間的影響關(guān)系),W是信息傳播影響力的集合,節(jié)點(diǎn)v∈V表示一個(gè)信息實(shí)體,邊(u,v)?E表示節(jié)點(diǎn)u到節(jié)點(diǎn)v的影響關(guān)系[19]?;ヂ?lián)網(wǎng)信息傳播過(guò)程可從以下兩個(gè)角度描述。

        · 傳播廣度:信息在互聯(lián)網(wǎng)被引用、轉(zhuǎn)載、評(píng)述等的次數(shù),是對(duì)信息直接影響力的度量。

        · 傳播深度:信息被引用、轉(zhuǎn)載、評(píng)述后,還能被后續(xù)信息引用、轉(zhuǎn)載、評(píng)述的次數(shù),是對(duì)信息間接影響力的度量。

        信息的傳播過(guò)程由信息及信息之間的引用、轉(zhuǎn)載、引述、評(píng)論等關(guān)系組成一個(gè)復(fù)雜網(wǎng)絡(luò),這種復(fù)雜的信息傳播拓?fù)浣Y(jié)構(gòu)對(duì)信息影響力的傳播和擴(kuò)散起著至關(guān)重要的作用。

        1.2 影響力傳播形式化表示方法

        本書(shū)詳細(xì)討論特征參數(shù)的選取規(guī)則。設(shè)信息為全集U,由n個(gè)子集構(gòu)成:U1,U2,…,Ui,…,Un。假設(shè)n=10,U1表示信息主題集合,U2表示信息類型集合,U3表示所有者集合,U4表示出版源集合,U5表示時(shí)間集合,U6表示被引用或被轉(zhuǎn)載次數(shù),U7表示所屬領(lǐng)域集合,U8表示關(guān)鍵詞集合,U9表示摘要信息集合,U10表示其他信息(未抽取信息)集合。顯然,U=U1∪U2∪…Ui∪…∪Un。上述形式化描述是一種對(duì)互聯(lián)網(wǎng)信息的簡(jiǎn)化表述方式,最大限度地包含了涉及信息傳播影響力的要素。

        信息傳播是信息主體與被影響主體之間強(qiáng)度的表示方式,由信息影響力元數(shù)據(jù)(如信息主體、信息傳播路徑等)指標(biāo)綜合而成,公共互聯(lián)網(wǎng)信息傳播影響力關(guān)聯(lián)要素示意圖如圖2所示,信息的影響力傳播建?;A(chǔ)工作是從影響信息傳播的眾多因素中選取對(duì)傳播影響力有較大貢獻(xiàn)的特征變量,即將信息傳播影響力量化為求解影響力邊際增益或收益最大的問(wèn)題。

        圖2 公共互聯(lián)網(wǎng)信息傳播影響力關(guān)聯(lián)要素示意圖

        在評(píng)估信息傳播影響力時(shí)涉及信息的引用、轉(zhuǎn)發(fā)、評(píng)論等多個(gè)參數(shù),這些參數(shù)難以分別具體量化,參數(shù)之間的相互影響程度難以評(píng)估,因此,本文采用最大熵理論作為信息影響力傳播的重要理論依據(jù),即從信息熵的原理出發(fā),在評(píng)估信息的傳播影響力時(shí),選擇在滿足全部已知條件的情況下,對(duì)未知的情況不做任何主觀假設(shè)[7-8,19]。

        1.3 面向傳播影響力的多維特征選擇

        合理的特征選擇是量化信息傳播影響力的基礎(chǔ),根據(jù)“奧卡姆剃刀原理”進(jìn)行特征工程選取,即在特定的環(huán)境下,選用信息傳播影響力最大的特征作為其數(shù)學(xué)模型的參數(shù),基于信息熵和“奧卡姆剃刀原理”信息傳播影響力特征選擇流程如圖3所示。

        圖3 基于信息熵和“奧卡姆剃刀原理”信息傳播影響力特征選擇流程

        在圖3中,信息影響力可表示為IDINIA→INIB,顯然,影響力是具有方向性的矢量,因此,信息客體受信息主體的影響力如式(1)所示。

        其中,f:IDA→IDB表示信息A對(duì)信息B的影響力,需要指出的是f:IDA→IDB≠f: IDB→IDA。

        需要進(jìn)一步指出的是,在參數(shù)規(guī)則建模過(guò)程中,沒(méi)有選取信息類型,是因?yàn)橥ㄟ^(guò)信息摘要能確定信息的所屬領(lǐng)域。根據(jù)上述分析,對(duì)于有n個(gè)隨機(jī)變量組成的信息實(shí)體,其傳播影響力可以表示為(X1,X2,...,Xn),信息的影響力組成一個(gè)隨機(jī)信息系統(tǒng)X。因此,X等價(jià)于(X1,X2, ...,Xn),其聯(lián)合概率分布為(p1,p2, ...,pi, ...,pn)。

        2 基于信息熵的信息傳播影響力計(jì)算方法

        作為一種系統(tǒng)中信息含量的分析方法,信息熵理論已被廣泛運(yùn)用于物理學(xué)、信息技術(shù)、統(tǒng)計(jì)學(xué)等領(lǐng)域[3,20]。在互聯(lián)網(wǎng)信息傳播領(lǐng)域,信息傳播影響力實(shí)質(zhì)是信息傳播力的熵值隨著信息的傳播和擴(kuò)散階段不斷減小的過(guò)程,消除了信息傳播影響力的不確定性和無(wú)序性,從而形成信息傳播影響力不斷提升的過(guò)程,因此,信息熵理論非常適合在信息傳播影響力場(chǎng)景中展開(kāi)研究[21-22]。

        2.1 互聯(lián)網(wǎng)信息影響力的信息熵計(jì)算方法

        在開(kāi)放互聯(lián)網(wǎng)環(huán)境下,信息的影響力涉及較多的因素,如信息的發(fā)布者、信息的轉(zhuǎn)發(fā)者、信息的評(píng)論次數(shù)、引用者身份、發(fā)布渠道等,這就造成了在衡量信息傳播影響力時(shí),難以量化各指標(biāo)的權(quán)重及其相互之間影響程度的權(quán)重,因此,本文使用最大熵模型解決此問(wèn)題,用最大熵模型描述并量化信息傳播的影響力。

        針對(duì)不同的信息構(gòu)建完備合理的語(yǔ)料庫(kù)是提取信息特征的基礎(chǔ),本文通過(guò)不同方面的領(lǐng)域?qū)<覙?gòu)建語(yǔ)料庫(kù),并針對(duì)不同的應(yīng)用環(huán)境使用不同的語(yǔ)料庫(kù)。信息的特征選擇主要包括以下3個(gè)步驟。

        步驟1使用領(lǐng)域知識(shí)對(duì)信息進(jìn)行文本分詞以及詞頻權(quán)重統(tǒng)計(jì),分詞ti詞頻權(quán)重統(tǒng)計(jì)wf(ti)方法如式(2)所示。

        其中,N為總的信息數(shù),ni為包含ti信息的總數(shù),mi為特征詞在該類中出現(xiàn)的次數(shù),Mi為該類信息的總數(shù)。

        步驟2計(jì)算分詞之間的逐點(diǎn)互信息(pointwise mutual information,PMI),PMI用于衡量信息變量間相互依賴的程度,因此ni和nj使用聯(lián)合概率分布的計(jì)算過(guò)程如式(3)所示。

        其中,若ni和nj無(wú)關(guān),則有p(ni,nj) =p(ni)p(nj),此時(shí)PMI(ni,nj) = 0;若ni和nj的相關(guān)性越大,那么p(ni,nj)/(p(ni)p(nj))越大,隨之PMI(ni,nj)越大。

        步驟3根據(jù)“奧卡姆剃刀原理”篩選關(guān)鍵特征,構(gòu)成信息的特征集。

        經(jīng)過(guò)上述步驟,信息的特征是離散的隨機(jī)變量,用X表示影響信息傳播影響力的離散特征值集合,設(shè)離散變量X的概率分布是P(X),根據(jù)香農(nóng)信息熵理論,離散隨機(jī)變量X的熵H(X)如式(4)所示。

        隨機(jī)變量X的熵H(X)是p(x)概率分布函數(shù),用于衡量信息的傳播強(qiáng)度。當(dāng)p(x)=0時(shí),定義0lg(0)=0。從式(4)可以看出,H(X)僅依賴于X的分布,而與X的具體取值無(wú)關(guān)。還可以看出,熵滿足其中,是X取值的個(gè)數(shù),當(dāng)且僅當(dāng)X均勻分布時(shí)右邊的等號(hào)成立。

        采用拉格朗日乘子法求解在一定約束條件下X的分布情況,將最大信息熵問(wèn)題轉(zhuǎn)化為無(wú)約束極值問(wèn)題進(jìn)行求解,記拉格朗日函數(shù)L(p(xi)) =H(X),文獻(xiàn)[6]采用拉格朗日乘子法求解該問(wèn)題,得到熵函數(shù)H(x)如式(5)所示。

        從式(5)可以看出,對(duì)于取值有限的離散型隨機(jī)變量X來(lái)說(shuō),當(dāng)每個(gè)變量的取值相等時(shí),其信息熵最大,即當(dāng)X服從均勻分布時(shí)熵最大。信息的影響深度可以表示該信息對(duì)后續(xù)信息的影響強(qiáng)度,如學(xué)術(shù)領(lǐng)域的高被引論文通常被認(rèn)為具有較高的影響力,新聞信息被轉(zhuǎn)載或評(píng)論的次數(shù)愈多其影響力也就愈大。因此,若使信息的傳播影響力最大,則式(5)滿足

        通過(guò)上述推理證明,可得出以下兩個(gè)結(jié)論。

        結(jié)論1X均勻分布時(shí),H(X)=lgn,根據(jù)定義,此時(shí)信息傳播影響力達(dá)到最大。

        因此,H(x)極值點(diǎn)在時(shí),此時(shí)有H(X)=lgn。

        結(jié)論2推導(dǎo)出因此,信息熵H(X)是關(guān)于x的嚴(yán)格單調(diào)函數(shù)。

        其中,結(jié)論1和結(jié)論2保證了信息傳播影響力計(jì)算結(jié)果的嚴(yán)格單調(diào)性,是本文方法可用性的基礎(chǔ)。

        舉例說(shuō)明,在n=2時(shí),H(P)的表達(dá)式可寫(xiě)成:

        最大熵理論認(rèn)為所采用的概率模型首先必須滿足既存事實(shí),即約束條件,同時(shí)不對(duì)未知的情況做任何主觀假設(shè),即在所有可能的概率模型(分布)中。因此,使用最大熵模型評(píng)估信息影響力在理論上是可行的。此外,從信息論相關(guān)理論上看,信息傳播的最大熵模型中往往包含更多的關(guān)聯(lián)信息影響力特征,用最大熵計(jì)算的影響力也相應(yīng)最大。包含更大信息量的信息容易造成較大的影響力,根據(jù)前文,在(0~1)分布的函數(shù)、概率r=0.5時(shí),熵值H(X)最大,這也很好地解釋了互聯(lián)網(wǎng)熱點(diǎn)事件或有重大影響力屬性的事件有較高傳播影響力的原因,與文獻(xiàn)[6]的研究結(jié)論吻合。

        2.2 基于最大熵理論的信息影響力定量計(jì)算流程

        基于最大熵理論的信息影響力定量分析方法需要經(jīng)過(guò)一定的預(yù)處理流程,以便于將信息分解為離散、可被計(jì)算的參數(shù)[23],開(kāi)放互聯(lián)網(wǎng)環(huán)境基于信息熵的影響力計(jì)算示意圖如圖4所示。

        圖4 開(kāi)放互聯(lián)網(wǎng)環(huán)境下基于信息熵的影響力計(jì)算示意圖

        從圖4可以看出,首先,結(jié)合社會(huì)學(xué)理論以及領(lǐng)域知識(shí),利用搜索引擎、網(wǎng)絡(luò)爬蟲(chóng)等工具在互聯(lián)網(wǎng)中提取海量領(lǐng)域信息建立合理且完備的語(yǔ)料庫(kù);其次,使用語(yǔ)料庫(kù)對(duì)待處理的信息進(jìn)行分詞處理,并由領(lǐng)域?qū)<矣?jì)算逐點(diǎn)互信息;再次,由領(lǐng)域?qū)<沂褂没凇皧W卡姆剃刀原理”的關(guān)鍵特征篩選方法進(jìn)行預(yù)處理,經(jīng)過(guò)上述預(yù)處理后,待處理信息被量化為可計(jì)算的離散變量;最后,將這些離散變量進(jìn)行去重和共指消解以提升后續(xù)影響力計(jì)算的準(zhǔn)確性[6]。

        具體來(lái)說(shuō),互聯(lián)網(wǎng)信息影響力的信息熵計(jì)算方法如算法1所示。

        算法1互聯(lián)網(wǎng)信息影響力的信息熵計(jì)算方法

        輸入信息ti(i∈|G|)及其傳播拓?fù)鋱DG、語(yǔ)料庫(kù)D

        輸出信息ti的影響力pi

        使用語(yǔ)料庫(kù)D對(duì)信息ti進(jìn)行分詞

        詞頻及權(quán)重統(tǒng)計(jì)

        計(jì)算逐點(diǎn)互信息PMI

        提取ti特征集

        }

        對(duì)信息G采用廣度優(yōu)先遍歷分析信息之間的影響與被影響的關(guān)系

        執(zhí)行去重流程

        執(zhí)行共指消解流程

        根據(jù)拉格朗日乘子法計(jì)算ti的影響力信息熵pi

        returnpi

        }

        綜上分析,本文所提方法支持了信息傳播過(guò)程中影響力的可度量、可計(jì)算并支持多維性因素,并通過(guò)領(lǐng)域?qū)<抑С至诵畔⒌目珙I(lǐng)域傳播過(guò)程中影響力的計(jì)算。

        3 信息傳播力影響力熵定量分析

        3.1 信息傳播影響力建模

        使用隨機(jī)變量X表示信息傳播影響力,假設(shè)n=10,那么X等價(jià)于(X1,X2,…,X10),其中,X1,X2,…,X10是信息傳播影響力指標(biāo)的參數(shù)化表示。X1,X2,…,X10作為影響自變量與熵值H的關(guān)系無(wú)法確定,難以通過(guò)具體的函數(shù)模型或量化指標(biāo)描述X1,X2,…,X10與熵值H的關(guān)系,因此,本問(wèn)題適用文獻(xiàn)[6]所提的最大熵模型加以解決,這使最大熵表示信息影響力的熵值更接近信息在公開(kāi)互聯(lián)網(wǎng)傳播的實(shí)際情況。

        3.2 基于信息熵的傳播力計(jì)算方法

        信息傳播影響力要素由(X1,X2,…,X10)構(gòu)成,為了計(jì)算傳播影響力信息熵,需要分別確定各分變量的取值范圍,則傳播影響力由各分要素組合構(gòu)成一個(gè)多維向量空間。使用ci表示隨機(jī)變量Xi的取值次數(shù),當(dāng)Xi的取值次數(shù)為0時(shí),ci為空,對(duì)計(jì)算結(jié)果無(wú)影響。因此,根據(jù)文獻(xiàn)[6],信息傳播影響力涉及的多維變量取值見(jiàn)表1。的約束。

        表1 信息傳播影響力涉及的多維隨機(jī)變量取值

        在計(jì)算信息傳播影響力的最大熵時(shí),受

        根據(jù)最大熵理論,為了獲得信息的最大傳播影響力,各影響力要素的概率均勻分布,有p(c1)=p(c2)=…=p(c10),根據(jù)約束條件,則有p(c1,c2, …,c10) = 1/n,因此,熵函數(shù)如式(6)所示。

        式(6)是由互聯(lián)網(wǎng)信息影響力各特征要素構(gòu)成的傳播影響力計(jì)算方法。

        4 實(shí)驗(yàn)分析

        為了衡量本文方法的有效性,本節(jié)使用不同領(lǐng)域的數(shù)據(jù)集對(duì)本文方法進(jìn)行量化評(píng)估。

        4.1 實(shí)驗(yàn)數(shù)據(jù)及實(shí)驗(yàn)環(huán)境

        隨著互聯(lián)網(wǎng)的發(fā)展和廣泛應(yīng)用,學(xué)術(shù)論文的傳播以互聯(lián)網(wǎng)為主要載體,學(xué)術(shù)論文的傳播路徑單一,通常以引用、評(píng)述為主要傳播路徑,因此,研究學(xué)術(shù)論文影響力可作為評(píng)估本文方法的手段之一。不失一般性,隨著Web3.0、移動(dòng)互聯(lián)網(wǎng)、短視頻等媒體技術(shù)的普及,互聯(lián)網(wǎng)輿情事件傳播途徑多樣化。因此,選用學(xué)術(shù)論文、熱點(diǎn)事件為互聯(lián)網(wǎng)的內(nèi)容實(shí)體評(píng)估本文方法,數(shù)據(jù)集有以下兩個(gè)。

        · 針對(duì)學(xué)術(shù)論文信息,數(shù)據(jù)集來(lái)自DBLP(DataBase systems and Logic Programming)學(xué)術(shù)社交網(wǎng)絡(luò),收集了1997年至今公開(kāi)發(fā)表的計(jì)算機(jī)類學(xué)術(shù)論文元數(shù)據(jù)及引文記錄[24]。物理學(xué)論文數(shù)據(jù)集選取美國(guó)物理協(xié)會(huì)(American Physical Society,APS)公布的物理學(xué)領(lǐng)域自1893年以來(lái)論文元數(shù)據(jù)及其引文記錄[25]。本文選取長(zhǎng)期活躍的研究者為研究對(duì)象,為了體現(xiàn)橫向?qū)Ρ刃?,本文以自然年為時(shí)間單位評(píng)價(jià)和衡量影響力。

        · 針對(duì)熱點(diǎn)輿情事件,數(shù)據(jù)集選用近3年來(lái)有影響力的輿情事件作為研究對(duì)象,評(píng)估本文方法的有效性。

        在實(shí)驗(yàn)環(huán)境方面,本文使用MATLAB仿真本文的算法,并與LAPSO-IM方法[9]和ACO-IM方法[10]對(duì)比分析,其中,LAPSO-IM方法和ACO-IM方法分別是基于粒子群算法和蟻群算法的影響力最大化分析方法。

        4.2 基于信息熵的學(xué)術(shù)論文的傳播影響力分析

        在開(kāi)放互聯(lián)網(wǎng)中,信息傳播影響力與時(shí)間緊密相關(guān),首先分析信息影響力隨時(shí)間變化的趨勢(shì),針對(duì)此在DBLP引文數(shù)據(jù)庫(kù)中,隨機(jī)選取2000—2005年每年各100篇會(huì)議論文和期刊論文,DBLP中不同論文影響力隨時(shí)間變化趨勢(shì)如圖4所示。

        圖4 DBLP中不同論文影響力隨時(shí)間變化趨勢(shì)

        從圖4可以看出,會(huì)議論文的影響力在刊發(fā)1~2年后影響力持續(xù)爆發(fā),期刊論文的影響力約在2年后持續(xù)爆發(fā),這主要是由于會(huì)議論文的評(píng)審和刊出時(shí)間相比于期刊論文較短,最新的研究成果能更快地在學(xué)術(shù)會(huì)議論文集上刊發(fā),使得其影響力較大,而期刊論文的評(píng)審和刊發(fā)周期則相對(duì)較長(zhǎng),其影響力的爆發(fā)時(shí)間滯后。與LAPSO-IM方法和ACO-IM方法對(duì)比來(lái)看,本文方法計(jì)算的影響力對(duì)其隨時(shí)間的變化更為敏感,而另外兩種方法基于粒子群和蟻群隨時(shí)間變化的速度慢,驗(yàn)證了本文方法的高效性。

        為了更合理地橫向?qū)Ρ雀髡撐牡挠绊懥?,本文引入了?guī)格化的影響力,將各學(xué)術(shù)論文的影響力放在統(tǒng)一的量綱對(duì)比分析,選取相同主題的論文,按“IPv6”(105篇)、“人工智能”(178篇)兩個(gè)主題范圍進(jìn)行影響力量化分析,DBLP不同研究方向論文影響力隨時(shí)間變化趨勢(shì)如圖5所示。

        圖5 DBLP不同研究方向論文影響力隨時(shí)間變化趨勢(shì)

        從圖5可以看出,“IPv6”向?qū)W術(shù)論文的影響力約在2010年度達(dá)到頂峰,“人工智能”領(lǐng)域的學(xué)術(shù)論文在2016年左右萌芽,影響力至今仍呈現(xiàn)上升的趨勢(shì),這與技術(shù)的整體發(fā)展趨勢(shì)相吻合[6,18],實(shí)驗(yàn)結(jié)果與LAPSO-IM方法和ACO-IM方法保持一致,驗(yàn)證了本文方法的有效性。

        下面進(jìn)一步地衡量物理學(xué)領(lǐng)域相關(guān)論文,從物理學(xué)引文數(shù)據(jù)庫(kù)中隨機(jī)選取相關(guān)論文,物理學(xué)領(lǐng)域論文影響力隨時(shí)間變化趨勢(shì)如圖6所示。

        圖6 物理學(xué)領(lǐng)域論文影響力隨時(shí)間變化趨勢(shì)

        選取相似領(lǐng)域的多篇文獻(xiàn),以年度為單位進(jìn)行影響力計(jì)算,通過(guò)綜合對(duì)比圖4與圖6,進(jìn)一步看出,物理學(xué)論文影響力的上升速度較為明顯,這主要體現(xiàn)了物理學(xué)學(xué)術(shù)論文的累積效應(yīng),而計(jì)算機(jī)領(lǐng)域的論文的累積效應(yīng)較弱,這與兩個(gè)學(xué)科的特點(diǎn)有關(guān),物理學(xué)學(xué)術(shù)論文的既往成果對(duì)后繼成果有較大的影響力,而計(jì)算機(jī)領(lǐng)域的論文發(fā)展迅速,新興成果的影響力相對(duì)較大,本文方法的結(jié)果與LAPSO-IM方法和ACO-IM方法計(jì)算的結(jié)果保持一致。需要指出的是,隨著成果應(yīng)用領(lǐng)域的不斷拓展,如傳統(tǒng)的計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)向物聯(lián)網(wǎng)、網(wǎng)絡(luò)空間安全、社會(huì)計(jì)算等領(lǐng)域橫向擴(kuò)展的范圍不斷加大,導(dǎo)致了既往成果對(duì)后續(xù)關(guān)聯(lián)成果的影響力逐漸降低,而新興重要成果的影響力較高。

        4.3 基于信息熵的網(wǎng)絡(luò)事件傳播影響力分析

        學(xué)術(shù)論文的影響力傳播在相對(duì)封閉學(xué)術(shù)團(tuán)體的范圍內(nèi),無(wú)法綜合評(píng)估本文方法的有效性。不失一般性,進(jìn)一步分析開(kāi)放互聯(lián)網(wǎng)中網(wǎng)絡(luò)輿情事件的傳播影響力。分別選取2019—2021年熱點(diǎn)網(wǎng)絡(luò)輿情的事件以確保實(shí)驗(yàn)樣本的豐富性,分別包括文化、科技、民生等領(lǐng)域,范圍來(lái)自社交網(wǎng)絡(luò)、大眾媒體等,近3年網(wǎng)絡(luò)輿情事件實(shí)驗(yàn)數(shù)據(jù)集見(jiàn)表2,對(duì)輿情事件影響力的量化以發(fā)布主題、瀏覽次數(shù)、評(píng)論次數(shù)和轉(zhuǎn)載次數(shù)等指標(biāo)為特征變量。

        表2 近3年網(wǎng)絡(luò)輿情事件實(shí)驗(yàn)數(shù)據(jù)集

        通常網(wǎng)絡(luò)輿情的發(fā)展主要有4個(gè)階段:潛伏期、擴(kuò)散期、爆發(fā)期和消散期[6]。針對(duì)上述網(wǎng)絡(luò)輿論事件,選取評(píng)論或轉(zhuǎn)載作為受影響的客體衡量其影響力,為了便于橫向?qū)Ρ确治?,本?shí)驗(yàn)使用加權(quán)的影響力計(jì)算方法,網(wǎng)絡(luò)輿情事件隨時(shí)間影響力變化趨勢(shì)如圖7所示。

        由圖7可知,網(wǎng)絡(luò)輿情事件的影響力隨時(shí)間呈上升的趨勢(shì),但是,影響力增速呈整體下降的趨勢(shì),這與直觀感受和PageRank算法吻合。另外,通過(guò)對(duì)比事件1、事件3、事件5與事件2、事件4、事件6,可以進(jìn)一步發(fā)現(xiàn),事件4、事件6的輿情影響力升上趨勢(shì)較為強(qiáng)勁,究其原因,這3件輿情事件來(lái)自有影響力的官方媒體,而另外3件的輿情事件影響力發(fā)展趨勢(shì)較為緩和,這3件輿情事件主題均來(lái)自民間團(tuán)體,其影響力稍遜于官方媒體,這導(dǎo)致了事件影響力的發(fā)展出現(xiàn)差距。與圖4的研究結(jié)果保持一致,對(duì)比圖7(a)、圖7(b)和圖7(c)可以看出,本文方法較LAPSO-IM方法和ACO-IM方法所計(jì)算的影響力對(duì)時(shí)間更為敏感,即對(duì)事件影響力的響應(yīng)表現(xiàn)更為積極,這也與粒子群和蟻群算法的收斂速度不高有關(guān)。

        圖7 網(wǎng)絡(luò)輿情事件隨時(shí)間影響力變化趨勢(shì)

        進(jìn)一步地,事件4和事件6官方媒體的輿情事件的擴(kuò)散期、爆發(fā)期影響力上升較為強(qiáng)勢(shì),這與官方媒體的權(quán)威性有密切聯(lián)系;而民間力量的潛伏期較長(zhǎng),這與輿情的前期在廣大民眾中的逐步醞釀的過(guò)程有關(guān),互聯(lián)網(wǎng)中的意見(jiàn)領(lǐng)袖等對(duì)事件的評(píng)論轉(zhuǎn)述在輿情初期及發(fā)展期均能引發(fā)更持續(xù)的傳播影響力。此外,輿情事件的潛伏期與影響力的大小有關(guān),這也驗(yàn)證了本文方法的有效性。還可以得知,隨著時(shí)間的變化,不同網(wǎng)絡(luò)輿情事件的影響力發(fā)生一定的變化,影響力不是積累的過(guò)程,而是由萌芽期、發(fā)生期、爆發(fā)期以及平緩期等階段組成的。

        5 結(jié)束語(yǔ)

        人類社會(huì)互聯(lián)網(wǎng)顛覆了信息傳播的方式并深刻影響著社會(huì)的發(fā)展,研究面向公共互聯(lián)網(wǎng)的信息傳播影響力具有較強(qiáng)的現(xiàn)實(shí)意義。本文提出了一種基于香農(nóng)信息熵的公共互聯(lián)網(wǎng)信息傳播影響力計(jì)算模型和方法,首先,根據(jù)“奧卡姆剃刀原理”選取信息事件的多維變量,形成信息可計(jì)算的形式化表述;接著,使用香農(nóng)信息熵理論和最大熵理論研究了公共互聯(lián)網(wǎng)最大影響力建模;最后,提出了基于最大熵的信息傳播影響力計(jì)算方法,并通過(guò)實(shí)驗(yàn)驗(yàn)證了方法的有效性和可用性。

        猜你喜歡
        信息熵輿情影響力
        基于信息熵可信度的測(cè)試點(diǎn)選擇方法研究
        天才影響力
        NBA特刊(2018年14期)2018-08-13 08:51:40
        基于信息熵的實(shí)驗(yàn)教學(xué)量化研究
        黃艷:最深遠(yuǎn)的影響力
        一種基于信息熵的雷達(dá)動(dòng)態(tài)自適應(yīng)選擇跟蹤方法
        輿情
        輿情
        輿情
        基于信息熵的IITFN多屬性決策方法
        3.15消協(xié)三十年十大影響力事件
        狠狠亚洲婷婷综合久久久| 欧美丰满熟妇xxxx性| 久久男人av资源网站无码| 在线a亚洲视频播放在线观看| 大香蕉久久精品一区二区字幕| 男女做羞羞事的视频网站| 人成午夜免费视频无码| 男女18禁啪啪无遮挡| 欧美日韩一区二区三区视频在线观看| 午夜视频在线观看日本| 小雪好紧好滑好湿好爽视频| 国产成人无码区免费内射一片色欲 | 丝袜美女污污免费观看的网站| 国产精品av网站在线| 人妻少妇哀求别拔出来| 成人免费看片又大又黄| 免费无码中文字幕A级毛片| 99国语激情对白在线观看| 少妇无码太爽了在线播放| 性久久久久久久| 国产成人久久精品77777综合| 日本一区二区三区高清视 | 亚洲精品中字在线观看| 国产免费爽爽视频在线观看| 久久99精品久久久久久久清纯| 亚洲精品尤物av在线网站| 亚洲一区二区三区蜜桃| 国产高清一区二区三区视频| 无码一区久久久久久久绯色AV| 视频一区中文字幕日韩| 欧美做受又硬又粗又大视频| 国产免费午夜a无码v视频| 强d漂亮少妇高潮在线观看 | 偷看农村妇女牲交| 五月天精品视频在线观看| 精品中文字幕手机在线| 国产精品一区二区三区专区| 在线亚洲欧美日韩精品专区| 伊人狠狠色j香婷婷综合| 日韩人妻久久中文字幕 | 加勒比东京热中文字幕|