亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于主題互感耦合的微博主題影響力研究

        2022-08-10 15:30:54盧國強(qiáng)楊佩霖
        現(xiàn)代情報(bào) 2022年8期
        關(guān)鍵詞:爭議性互感主題詞

        盧國強(qiáng) 黃 微 楊佩霖 孫 悅

        (吉林大學(xué)商學(xué)與管理學(xué)院,吉林 長春 130022)

        隨著社交媒體的快速發(fā)展,各種社交平臺已經(jīng)成為公眾獲取和發(fā)布各種輿情相關(guān)信息與觀點(diǎn)的重要渠道。以微博為首的社交媒體已成為當(dāng)前輿論傳播的重要陣地。微博主題是指微博用戶在發(fā)表的微博中關(guān)注的內(nèi)容以及所表達(dá)出對應(yīng)的觀點(diǎn)和態(tài)度。微博用戶對不同主題的表達(dá)和關(guān)注也會直接影響網(wǎng)絡(luò)輿情的傳播速度和規(guī)模以及輿情事件的走向。已有研究中對用戶關(guān)注主題的分析常常基于用戶間排斥性交互[1]、偏見吸收[2]、信息積聚[3]、社會加強(qiáng)機(jī)制[4-6]作用在單一主題的結(jié)果。但是在現(xiàn)實(shí)中,用戶關(guān)注或討論的主題不是孤立的,這些主題或者是來源于一個或幾個主題,或者是這些主題本身就相互重疊。這種主題在父代、子代之間的傳遞或主題之間的重疊均是主題耦合的表現(xiàn)。主題互感耦合是主題強(qiáng)度變化的直接因素,對用戶觀點(diǎn)態(tài)度的形成也具有重要作用。因此,在理論上基于主題互感耦合對微博主題影響力進(jìn)行分析,可以描述輿情主題之間的交互關(guān)系及相互影響的程度,揭示網(wǎng)絡(luò)輿情事件的發(fā)展態(tài)勢,繼而深入理解微博用戶的行為模式,有助于相關(guān)部門在輿情發(fā)展過程中針對微博主題演化情況開展處置工作,為加強(qiáng)應(yīng)急管理部門的輿情應(yīng)對能力提供理論支撐。

        微博主題影響力是以微博用戶關(guān)注的內(nèi)容和話題為基點(diǎn),結(jié)合自然語言處理、統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)等方法,對微博用戶針對某一話題關(guān)注程度的變化進(jìn)行測算,從而揭示某一話題內(nèi)容在輿情中的影響范圍以及影響程度。安璐等通過Word2vec和k-means聚類技術(shù)進(jìn)行微博主題提取,以微博轉(zhuǎn)發(fā)、評論和點(diǎn)贊數(shù)為測算指標(biāo),使用H指數(shù)計(jì)算微博主題影響力[7],也有基于微博內(nèi)容、內(nèi)容質(zhì)量和微博內(nèi)容時效性因素的微博主題影響力模型[8]。在相關(guān)應(yīng)用研究中,出現(xiàn)了社交網(wǎng)絡(luò)影響力最大化以及影響力阻斷最大化的研究[9]。已有研究將微博條目外在特征,如轉(zhuǎn)發(fā)、評論數(shù)量等作為微博主題影響力的關(guān)鍵因素。但一方面與具體問題相關(guān)的微博主題內(nèi)容對于微博條目的影響力具有重要作用;另一方面,微博主題即微博用戶關(guān)注的內(nèi)容本身相互之間也存在相互抑制或相互增強(qiáng)的作用力。微博話題內(nèi)容以及話題之間的相互作用力也是微博主題影響力分析不可忽視的關(guān)鍵因素,同時也有助于理解微博輿情發(fā)展的內(nèi)在邏輯。

        目前關(guān)于輿情的耦合研究包括輿情跨平臺耦合、內(nèi)、外源動力耦合、輿情主題耦合3個方面。①輿情跨平臺耦合是指輿情信息在線下以及線上多個社交平臺中交互傳播的模式。網(wǎng)絡(luò)輿情跨平臺耦合表現(xiàn)在多個網(wǎng)絡(luò)社交平臺[10]、多層耦合網(wǎng)絡(luò)[11],如微博與微信的耦合網(wǎng)絡(luò)[12]、線上線下雙層耦合網(wǎng)絡(luò)[13]等;②對網(wǎng)絡(luò)輿情內(nèi)外源動力耦合的研究主要從系統(tǒng)觀的角度出發(fā),將致使突發(fā)性公共危機(jī)事件網(wǎng)絡(luò)輿情發(fā)生演化的作用力分為內(nèi)源動力與外源動力,并明確內(nèi)源動力與外源動力對輿情態(tài)勢演化產(chǎn)生作用的方式[14-15];③在對網(wǎng)絡(luò)輿情主題耦合的相關(guān)研究中,還有多事件超網(wǎng)絡(luò)的超邊耦合算法[16]、網(wǎng)絡(luò)輿情的原主題層和衍生主題層的耦合網(wǎng)絡(luò)[17]、主題交疊網(wǎng)絡(luò)[18]等。德國洪堡大學(xué)科學(xué)家費(fèi)邊·鮑曼等人近期在物理學(xué)國際權(quán)威期刊發(fā)表論文,對網(wǎng)絡(luò)輿情中用戶觀點(diǎn)在多維主題空間中的3種極化態(tài)勢進(jìn)行研究[19]。費(fèi)邊·鮑曼的研究目標(biāo)是基于觀點(diǎn)動力學(xué)對觀點(diǎn)極化的規(guī)律進(jìn)行分析,并且其研究成果與美國科學(xué)院院士詹姆斯·德魯克曼在2012年提出的輿情在宏觀上的穩(wěn)態(tài)和微觀上的非穩(wěn)態(tài)的脫節(jié)的論斷[20]具有很強(qiáng)的對應(yīng)性,可以認(rèn)為輿情的宏觀穩(wěn)態(tài)和微觀非穩(wěn)態(tài)在觀點(diǎn)動力學(xué)維度上得到了更精確的論證。

        已有研究較多集中在輿情傳播方式以及傳播要素之間的耦合,關(guān)于主題耦合的研究較少。但主題耦合可以用來解釋輿情傳播中宏觀穩(wěn)態(tài)與微觀非穩(wěn)態(tài)的脫節(jié)、用戶交互嗜同性與觀點(diǎn)極化的脫節(jié)等現(xiàn)象,是觀點(diǎn)動力學(xué)和傳播動力學(xué)的重要基礎(chǔ)。下文也將對主題耦合如何解釋用戶交互嗜同性與觀點(diǎn)極化脫節(jié)現(xiàn)象進(jìn)行闡述。本文擬解決以下3個問題:

        1)闡述主題互感耦合的內(nèi)涵、理論意義及現(xiàn)實(shí)意義。

        2)基于主題互感耦合提出主題影響力的概念,并設(shè)計(jì)主題影響力的計(jì)算模型。

        3)通過實(shí)證研究證實(shí)基于主題互感耦合的主題影響力計(jì)算模型的科學(xué)性和有效性。

        1 主題互感耦合的內(nèi)涵與意義

        1.1 主題互感耦合的理論來源與內(nèi)涵

        系統(tǒng)耦合始源于物理學(xué),在物理學(xué)上耦合是指兩個實(shí)體相互依賴于對方的一個量度。耦合表示兩個子系統(tǒng)之間的關(guān)聯(lián)程度。耦合不僅存在于電路和軟件工程領(lǐng)域,而且存在于以復(fù)雜系統(tǒng)呈現(xiàn)的各類社會系統(tǒng)之中。

        已有研究對網(wǎng)絡(luò)輿情主題的耦合采用“交疊”“overlap”等表達(dá)方式。主題耦合與電感耦合的性質(zhì)極其相似。電感元件也稱為自感元件,如果兩個或兩個以上的線圈中每個線圈所產(chǎn)生的磁通都與另一個線圈相交鏈,則稱這些線圈具有互感(Mutual Induction)。若假定這些線圈是靜止的,并且忽略了線圈中的電阻和匝間的分布電容,具有磁耦合的諸線圈就可表示為理想化的耦合電感元件(Coupled Inductor),簡稱電感耦合。當(dāng)某一輿情事件或一系列輿情事件發(fā)生之后,網(wǎng)民在關(guān)注輿情事件本身的同時,經(jīng)常會存在不同用戶具有不同關(guān)注點(diǎn)的現(xiàn)象。這些主題一方面由于自身的爭議性和敏感性,具有不同的吸引用戶參與討論的性質(zhì);另一方面,主題之間存在的內(nèi)容“重疊”,使得主題之間也存在相互影響的性質(zhì)。主題自身的爭議性、敏感性以及主題之間的相互影響的性質(zhì),則對應(yīng)于電感耦合中電感原件的自感和電感之間的互感。主題耦合與電感耦合的相似不僅可以通過各自的本征特征得以表達(dá),通過已有研究也可見一斑。在費(fèi)邊·鮑曼的研究中,雖然沒有明確指出,但用戶觀點(diǎn)對時間的導(dǎo)數(shù)公式與耦合模理論中電感耦合公式高度相似。

        1.2 主題互感耦合的意義

        在用戶交互嗜同性的作用下,用戶對輿情事件的討論會形成關(guān)注內(nèi)容不同或觀點(diǎn)態(tài)度不同的相對獨(dú)立的用戶群體[21-22]。經(jīng)典觀點(diǎn)動力學(xué)理論認(rèn)為,在充分的用戶交互的條件下,用戶觀點(diǎn)最終會形成單極形態(tài)的觀點(diǎn)極化[23-25],而后期研究證實(shí)觀點(diǎn)極化的最終形態(tài)包含多種形式[26-28]。然而,不論觀點(diǎn)極化的最終形態(tài)如何,在理論上從多用戶群體到最終的觀點(diǎn)極化表象上具有脫節(jié),連接兩種形態(tài)的正是作為驅(qū)動力的用戶交互以及作為必要條件的主題互感耦合。僅以用戶交互為驅(qū)動力無法完全解釋從獨(dú)立多用戶群體到觀點(diǎn)極化的過程,而主題互感耦合則可以揭示兩種現(xiàn)象轉(zhuǎn)化的內(nèi)在原因。正如費(fèi)邊·鮑曼的研究中所述,以主題組成的坐標(biāo)系不是正交坐標(biāo)系,而是傾斜坐標(biāo)系。用戶的交互行為等傳播要素都是在此傾斜坐標(biāo)系中進(jìn)行。在主題正交坐標(biāo)系中,用戶的交互行為只能形成多個獨(dú)立的群體,無法達(dá)到用戶群體融合以及觀點(diǎn)極化。而在主題傾斜坐標(biāo)系中,由相對隔離的用戶群體到用戶群體的融合便具有了可能性。主題互感耦合是主題組成傾斜坐標(biāo)系的根本原因。因此,主題互感耦合的研究在理論上具有必要性和重要意義。

        另外,主題互感耦合對主題影響力的研究也具有重要意義。主題影響力的表現(xiàn)形式是吸引用戶參與討論的數(shù)量,并由此產(chǎn)生的推動事件發(fā)展的作用力。本文在充分考慮主題互感耦合基礎(chǔ)上,結(jié)合已有關(guān)于用戶影響力研究成果,將微博主題影響力定義為在微博主題本征特質(zhì)及互感耦合的作用下,以用戶數(shù)量、用戶類型為輸入指標(biāo)的用戶影響力在各主題上分布的態(tài)勢,并由此定義構(gòu)建微博主題影響力計(jì)算模型。

        2 微博主題影響力計(jì)算模型

        安璐為了表達(dá)微博主題傳播影響力,將微博主題影響力分為“主題出度”“主題差異度”以及相應(yīng)的“情感出度”“情感轉(zhuǎn)移度”?!爸黝}出度”是指在用戶交互網(wǎng)絡(luò)中,與用戶Useri直接相連且共享相同主題的用戶數(shù)量與直接連接于用戶Useri的總用戶數(shù)量的比值?!爸黝}差異度”是指在用戶交互網(wǎng)絡(luò)中,與用戶Useri直接相連且關(guān)注不同主題的用戶數(shù)量與直接連接于用戶Useri的總用戶數(shù)量的比值?!爸黝}出度”與“主題差異度”值的和應(yīng)為1[29]。因此,可以知道“主題差異度”是參與運(yùn)算的指標(biāo)數(shù)值,而“主題出度”則代表了用戶Useri在用戶網(wǎng)絡(luò)中對于某一主題的傳播影響力。結(jié)合費(fèi)邊·鮑曼與安璐的研究,本文將微博主題影響力定義為:微博主題影響力是以微博用戶關(guān)注的內(nèi)容和話題即微博主題的本征特質(zhì)為基點(diǎn),結(jié)合自然語言處理、統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)等方法,對微博用戶針對某一話題關(guān)注程度的變化進(jìn)行測算,從而揭示某一話題內(nèi)容在輿情場中的影響范圍以及影響程度。基于本文對微博主題影響力的定義,構(gòu)建微博主題影響力計(jì)算模型,如圖1所示。

        在微博主題影響力計(jì)算模型中,首先使用自然語言處理技術(shù)(本文選擇LDA主題模型)對各時序節(jié)點(diǎn)的微博主題進(jìn)行識別,并使用Word2vec算法區(qū)分出表達(dá)輿情客體的主題與表達(dá)輿情本體的主題,從而過濾出表達(dá)輿情本體的主題進(jìn)行微博主題影響力的計(jì)算。微博主題影響力的計(jì)算考慮主題本征特質(zhì)、主題互感耦合以及參與討論的用戶3方面,分別由對應(yīng)的3個模塊實(shí)現(xiàn)定量化測算。①其中主題本征特質(zhì)通過計(jì)算語義層面離散度、主題事件類型和是否違反公序良俗來表達(dá)內(nèi)容多樣性、主題爭議性和主題敏感性,最終得出主題自感系數(shù)參與微博主題影響力的計(jì)算。語義層面離散度計(jì)算使用Word2vec算法實(shí)現(xiàn);②主題互感耦合通過構(gòu)建主題對稱矩陣并使用Word2vec算法得出主題互感系數(shù);③參與討論用戶數(shù)量是微博主題影響力的重要參數(shù),其值是結(jié)構(gòu)化數(shù)據(jù),通過LDA主題模型中的主題—文檔概率分布得出。在具體計(jì)算過程中需考慮分布在同一主題上的不同類型用戶對微博主題影響不同而對不同類型用戶進(jìn)行權(quán)值賦值。

        圖1 微博主題影響力計(jì)算模型

        2.1 區(qū)分表達(dá)輿情客體的微博主題和表達(dá)輿情本體的微博主題

        王平等在2013年提出,網(wǎng)絡(luò)輿情形成的要素包括主體、對象、本體和媒體[30]。黃微等探討了大數(shù)據(jù)環(huán)境下多媒體網(wǎng)絡(luò)輿情傳播的主體、客體、媒體、本體、空間5個要素。網(wǎng)絡(luò)輿情客體是引發(fā)網(wǎng)絡(luò)輿情的刺激物、網(wǎng)絡(luò)輿情的指向物,直接導(dǎo)致網(wǎng)絡(luò)輿情的發(fā)生和傳播,短時間內(nèi)能夠吸引大量的媒體報(bào)道和網(wǎng)民關(guān)注,對現(xiàn)實(shí)產(chǎn)生影響,持續(xù)一定時間。網(wǎng)絡(luò)輿情本體就是網(wǎng)絡(luò)輿情信息,是網(wǎng)絡(luò)輿情主體針對某些議題、現(xiàn)象或事件,在網(wǎng)絡(luò)空間表達(dá)的認(rèn)知、情緒、態(tài)度和意見等具體內(nèi)容。傳播媒介,又稱傳播的媒體、渠道、信道或手段,是信息從傳播者到接受者之間各種傳播形式的總稱[31]。

        將表達(dá)輿情客體的微博主題與表達(dá)輿情本體的微博主題做出區(qū)分的原因在于理論上會有更多的用戶集中分布在表達(dá)輿情客體的主題上,表現(xiàn)為對輿情事件本身的關(guān)注。關(guān)注輿情客體微博主題的用戶數(shù)量,主要由輿情事件影響范圍決定,且其僅是輿情風(fēng)險(xiǎn)產(chǎn)生的環(huán)境,并非是輿情風(fēng)險(xiǎn)的主要來源。而表達(dá)輿情本體的主題則是用戶針對輿情客體延伸出的主題內(nèi)容,并在用戶交互的作用下,這些主題對用戶觀點(diǎn)極化等輿情風(fēng)險(xiǎn)具有顯著作用。例如在重大突發(fā)事件背景下,關(guān)注事件本身的用戶數(shù)量會比較多,但此部分用戶對事件本身的關(guān)注不會導(dǎo)致輿情風(fēng)險(xiǎn)。但如果出現(xiàn)救援不力、信息發(fā)布不及時等事件,那么用戶對這些微博主題的關(guān)注則極易產(chǎn)生觀點(diǎn)極化并增加輿情風(fēng)險(xiǎn)的可能性。因此,針對表達(dá)輿情本體的微博主題影響力進(jìn)行研究將更有意義。

        本文將對各個時序節(jié)點(diǎn)進(jìn)行主題提取,因此如上文所述,在每個時序節(jié)點(diǎn)上提取的主題中,應(yīng)包含一個表達(dá)輿情客體的微博主題,并且這些主題在語義上最相近。區(qū)分表達(dá)輿情客體的微博主題與表達(dá)輿情本體的微博主題的方法如圖2所示,計(jì)算公式如式(1)所示。

        圖2 區(qū)分表達(dá)輿情客體的微博主題與表達(dá)輿情本體的微博主題計(jì)算流程

        區(qū)分表達(dá)輿情客體的微博主題與表達(dá)輿情本體首先使用LDA主題模型對各時序節(jié)點(diǎn)所有微博條目進(jìn)行主題識別,之后使用Word2vec算法將主題詞進(jìn)行向量化表達(dá),將相鄰時序節(jié)點(diǎn)的主題詞向量構(gòu)建對稱矩陣。通過循環(huán)計(jì)算所有相鄰時序節(jié)點(diǎn)主題詞相似度,可以得出各時序節(jié)點(diǎn)相似度最高的主題,此一系列主題即為表達(dá)輿情客體的主題。觀察此一系列相似度最高的相似度值,如果其值變化較大,則說明輿情客體發(fā)生變化,反之則未發(fā)生變化。

        (1)

        式(1)中j表示在i時刻抽取j個微博主題,k表示在i+1時刻抽取k個微博主題。

        2.2 微博主題自感系數(shù)

        不同事件類型的微博主題,其主題影響力也將有很大不同。本文將微博主題自感系數(shù)定義為由微博主題本征特質(zhì)而產(chǎn)生的對主題影響力作用的數(shù)值。微博主題自感系數(shù)來源于微博主題本征特征,主要包括主題爭議性、主題敏感性和主題詞語義離散性。

        主題爭議性與主題事件相關(guān),不同事件的主題爭議性具有很大不同。例如關(guān)于涉及公序良俗的事件,在共同的社會價值觀的影響下,全體網(wǎng)民的觀點(diǎn)態(tài)度高度一致,主題的爭議性也非常小。而事實(shí)證明關(guān)于公共決策[32-33]、民主大選[34]、群體性事件[35]中,尤其是在倫理性話題[36]和氣候變化[37]方面,其主題更容易吸引更多用戶參與討論,觀點(diǎn)多方向極化更容易形成,主題爭議性也將更強(qiáng)。費(fèi)邊·鮑曼為了研究的簡潔性,將爭議性較大主題的數(shù)值自定義為α=3,爭議性較小主題的數(shù)值自定義為α=(0.1~0.3),并模擬仿真過程中調(diào)整α值,對結(jié)果進(jìn)行分析討論。但在此研究之前,存在大量研究對主題的爭議性進(jìn)行定性或定量的研究。這些研究大部分是關(guān)于公共決策[38-39]主題爭議性研究。也有針對Twitter上出現(xiàn)的主題的爭議性進(jìn)行計(jì)算[40]。Garimella K等以爭議性主題包含不同方面且有相反觀點(diǎn)以及用戶交互過程中的嗜同性理論為基礎(chǔ),將用戶關(guān)注的主題及用戶之間的交互構(gòu)建成會話圖,使用隨機(jī)游走的算法基于會畫圖對主題的爭議性進(jìn)行定量計(jì)算[41]。

        主題的語義離散度是指一個主題中各主題詞之間在語義上的歐式距離。雖然一個主題揭示了用戶對輿情事件的一個關(guān)注點(diǎn),但一個主題中的主題詞并不是完全相同的詞或相同語義的不同表達(dá),各主題詞之間在語義上存在一定距離。主題詞在語義上越接近,主題在語義上涵蓋的內(nèi)容越集中。相反,如果各主題詞在語義上距離較大,意味著主題能夠表達(dá)或涵蓋的內(nèi)容較多,那么吸引用戶參與討論的概率也就越大。因此,主題在語義上的離散度越大,主題的影響力越大。語義相似度計(jì)算方法包括余弦相似度、歐式距離、曼哈頓距離、Jaccard相似系數(shù)等。由于余弦相似度計(jì)算簡潔,常用于詞向量之間的語義相似度計(jì)算。本文使用Word2vec對語料庫進(jìn)行預(yù)訓(xùn)練并將主題詞向量化,選取余弦相似度用于量化計(jì)算主題詞之間的相似度。余弦相似度是通過計(jì)算兩個向量的夾角余弦值來評估他們的相似度。余弦相似度將詞向量根據(jù)坐標(biāo)值繪制到高維向量空間中。詞向量余弦相似度計(jì)算如式(2)所示。

        (2)

        式(2)表示將主題中所有主題詞兩兩計(jì)算余弦相似度,各相似度之和即可表達(dá)相反比例的主題語義離散度。由于微博主題爭議性與主題離散度并無關(guān)聯(lián)關(guān)系且對微博主題影響力貢獻(xiàn)無差別,所以將兩者做線性相加并且權(quán)值相同均為1,因此得到微博主題自感系數(shù)計(jì)算公式為P=α+1/sim。

        2.3 微博主題互感系數(shù)

        微博主題互感系數(shù)來源于各個主題之間在內(nèi)容上的“重疊”。主題中主題詞的“重疊”由主題抽取時設(shè)定的主題數(shù)量及每個主題的主題詞數(shù)量決定。在對網(wǎng)絡(luò)輿情進(jìn)行主題抽取時,主題數(shù)越多,對主題的聚類具有越高的細(xì)粒度;主題詞越多,表達(dá)主題內(nèi)容越全面。但無論使用何種方法進(jìn)行主題抽取,如果主題數(shù)和主題詞數(shù)過多,都會增加對應(yīng)的冗余度,反而使概括主題內(nèi)容的能力下降。使用LDA或Word2vec結(jié)合K-means等方法中,都有比較具體的確定最優(yōu)主題數(shù)的算法,LDA通過困惑度值確定,Word2vec結(jié)合K-means通過檢驗(yàn)新增加的主題與已有主題重復(fù)度確定。但最優(yōu)的主題抽取方法也無法保證主題之間在語義上絕對無交叉。

        微博主題之間在內(nèi)容上的“重疊”,其性質(zhì)特征與電路中電感原件之間的互感耦合非常相似,受電路中電感原件互感耦合的啟發(fā),本文將微博主題之間在內(nèi)容上的“重疊”稱為微博主題的互感耦合。根據(jù)觀點(diǎn)動力學(xué)理論,在嗜同性作用下,關(guān)注相同主題或持相同觀點(diǎn)態(tài)度的用戶傾向于進(jìn)行交互活動。然而由于主題互感耦合的存在,使得關(guān)注不同主題的用戶增加了在同一空間進(jìn)行交互的概率。微博主題互感耦合及演化如圖3所示。

        圖3 微博主題互感耦合及演化

        微博主題A和微博主題B存在互感耦合部分C,在互感耦合C部分的用戶交互行為使得主題A和主題B存在3種可能的演化形態(tài):主題A和主題B逐漸融合,用戶關(guān)注的內(nèi)容逐漸趨同,觀點(diǎn)態(tài)度逐漸趨于一致;主題A和主題B逐漸向兩極演化,主題A和主題B在語義上越來越不相關(guān),觀點(diǎn)態(tài)度的極化也更加明顯;互感耦合C部分的用戶交互不足,或互感耦合的部分是輿情客體內(nèi)容,主題A和主題B以及用戶對相應(yīng)主題的觀點(diǎn)態(tài)度未發(fā)生變化。以上3種情況與輿情事件和參與討論的用戶相關(guān)且具有隨機(jī)性。由于微博主題的互感耦合來自于主題之間內(nèi)容上的“重疊”,因此微博主題互感耦合系數(shù)即為計(jì)算兩主題在語義上的歐式距離,方法與2.3節(jié)計(jì)算微博主題自感系數(shù)類似。首先使用Word2vec對主題詞向量化,然后與自感系數(shù)計(jì)算一個主題內(nèi)主題詞之間相似度之和不同,主題互感系數(shù)是將兩個主題的主題詞循環(huán)計(jì)算相似度,并將相似度加和。另外,自感系數(shù)在數(shù)值上與所得相似度之和成反比,互感系數(shù)與相似度之和成正比。

        2.4 微博主題影響力計(jì)算

        前文所述微博主題影響力的定義中,強(qiáng)調(diào)以用戶數(shù)量、用戶觀點(diǎn)態(tài)度在各個主題上分布的態(tài)勢表達(dá)微博主題的影響力,說明微博主題內(nèi)容特征是主題影響力的內(nèi)在因素,而用戶對主題的討論既是主題影響力的外在因素,也是主題影響力作用的結(jié)果。微博主題影響力的性質(zhì)特征與電路中磁通量的性質(zhì)特征極其相似,可以借鑒磁通量的特征和計(jì)算方法推導(dǎo)出微博主題影響力的計(jì)算。磁通量是指通過電感元件的磁感應(yīng)強(qiáng)度。磁感應(yīng)強(qiáng)度包括元件自身通電電流結(jié)合自感系數(shù)產(chǎn)生的能量,也包括與其他元件由互感耦合產(chǎn)生的能量。電路中電感元件不同的連接方式會產(chǎn)生不同的磁感線方向,互感耦合產(chǎn)生的詞感線方向與電感元件本身磁感線方向一致,則會使電感元件的磁感應(yīng)強(qiáng)度增加。反之,則會使電感元件的磁感應(yīng)強(qiáng)度減小。

        在微博主題影響力中,主題Ui吸引用戶群體參與討論,對主題Ui影響力產(chǎn)生了正向影響,參與討論的用戶越多,主題影響力越大。同時主題Uj與主題Ui互感耦合,吸引了一部分關(guān)注主題Uj的用戶也參與到主題Ui的討論中去。由圖3可知,互感耦合部分用戶的交互行為使得主題演變具有隨機(jī)性。對主題Ui來說,互感耦合部分用戶觀點(diǎn)態(tài)度如果與其他用戶一致,則主題影響力則會增加,反之,則會減小。基于以上討論,本文定義微博主題影響力計(jì)算公式如式(3)所示。

        (3)

        式中ψ表示主題1的影響力,ψ11表示由主題自身產(chǎn)生的影響力,ψ12表示由主題2與主題1互感耦合產(chǎn)生的影響力,f(u)表示不同類型用戶參與主題討論的用戶影響力與相應(yīng)用戶數(shù)量的乘積,是關(guān)于用戶類型與用戶數(shù)量的線性函數(shù),P1表示主題1的自感系數(shù),M12表示主題1與主題2的互感系數(shù),M12=M21。

        3 實(shí)證研究

        本文選擇新浪微博熱點(diǎn)話題“重慶公交車墜江事件”作為信息源采集數(shù)據(jù)并建立主題空間,一方面,因?yàn)榇耸录鳛樵缙诘挠伞败圁[”引發(fā)的公共交通安全事故,造成重大人員傷亡,事發(fā)當(dāng)時引起了廣泛的輿論關(guān)注與討論;另一方面,該事件發(fā)展過程復(fù)雜,從輿情爆發(fā)期到衰退期隨著事故原因的查明,用戶關(guān)注內(nèi)容涵蓋打撈救援、公民素質(zhì)、安全意識、法制建設(shè)、媒體報(bào)道失實(shí)等多維度主題分布,并且關(guān)注程度以及不同主題所引發(fā)的社會影響均差異較大。根據(jù)百度咨詢指數(shù)顯示,“重慶公交車墜江事件”發(fā)生在2018年10月28日,11月14日相關(guān)輿情進(jìn)入消亡期。在實(shí)際輿情管理與分析中,以小時為單位進(jìn)行時間序列分割將具有更準(zhǔn)確的結(jié)果。本文為計(jì)算簡潔,選擇以每天作為時序分割單位,使用集搜客網(wǎng)絡(luò)爬蟲軟件以相同方法和數(shù)據(jù)結(jié)構(gòu)分別采集2018年10月28日—11月14日的新浪微博相關(guān)數(shù)據(jù),獲取包括用戶ID、用戶名、用戶發(fā)表博文、發(fā)表博文時間、轉(zhuǎn)發(fā)評論文本及時間等信息,經(jīng)過數(shù)據(jù)清洗等預(yù)處理操作后共得到博文及轉(zhuǎn)發(fā)評論文本51 151條。

        3.1 識別表達(dá)輿情客體的微博主題

        在重慶公交車墜江事件中,雖然微博用戶討論的主題發(fā)生多次語義層面上的演化,但理論上會有一個主題即輿情客體在語義層面未發(fā)生變化并且貫穿輿情信息傳播周期。識別出表達(dá)輿情客體的微博主題并選擇除此主題之外的表達(dá)輿情本體的主題進(jìn)行研究,將使微博主題影響力的計(jì)算更為準(zhǔn)確。主題抽取方法選擇LDA模型。選擇LDA模型而未選擇優(yōu)化后的LDA模型或其他方法的原因,一方面是LDA模型提取的主題常出現(xiàn)詞頻較高、對主題內(nèi)容揭示較弱的主題詞,而本文正是通過語義相似度計(jì)算將此部分識別出來并剔除,剩余表達(dá)輿情本體的主題將具有較為合理的主題詞分布。其次是使用LDA模型能夠得出主題—文檔概率分布,用于后文中參與討論用戶數(shù)量的統(tǒng)計(jì)。

        本文選擇使用Word2vec模型訓(xùn)練針對此次事件的語料庫,得出的詞向量庫能夠更加準(zhǔn)確地反映輿情事件文本特征。使用Word2vec模型可以將語料庫中的詞,以獨(dú)熱編碼(Onehot-code)的形式使用一維向量表示。本文的Word2vec模型使用Skip-gram算法,將詞轉(zhuǎn)換為200維向量進(jìn)行余弦相似度計(jì)算。本文使用LDA模型對重慶公交車墜江事件以每天作為時序單元抽取主題,并使用Word2vec計(jì)算各主題間的相似度,發(fā)現(xiàn)表達(dá)輿情客體的微博主題,主題內(nèi)容及相似度如表1所示。

        表1 重慶公交車墜江事件表達(dá)輿情客體的微博主題

        表1(續(xù))

        通過表1發(fā)現(xiàn),各時序節(jié)點(diǎn)的主題高度相似,主題之間的主題詞有很多也是同一含義的不同表達(dá),基本反映了輿情事件本身內(nèi)容。雖然個別主題中出現(xiàn)了除輿情客體用戶關(guān)注的其他內(nèi)容,但通過實(shí)驗(yàn)發(fā)現(xiàn),這部分內(nèi)容在LDA提取的同一時序節(jié)點(diǎn)的其他主題均有揭示。因此,將以上主題作為表達(dá)輿情客體的主題并排除在研究之外,不僅不會影響主題的揭示,還會提高分析主題影響力的準(zhǔn)確度。經(jīng)排除表達(dá)輿情客體主題后,得出微博主題如表2所示。

        表2 各時序節(jié)點(diǎn)微博主題的主題—詞分布

        3.2 “重慶公交車墜江”事件微博主題影響力計(jì)算

        在2.2、2.3、2.4節(jié)闡述了微博主題影響力計(jì)算方法,現(xiàn)對主題自感系數(shù)、互感系數(shù)及參與討論用戶數(shù)量的統(tǒng)計(jì)分別予以說明。

        3.2.1 “重慶公交車墜江事件”主題自感系數(shù)計(jì)算

        計(jì)算主題自感系數(shù)時,首先需要確定主題的爭議性數(shù)值。為研究簡潔,本文不采用定量化方法對主題爭議性進(jìn)行推導(dǎo),而是選擇與文獻(xiàn)[16]相似的方法,根據(jù)已有研究演繹推定“重慶公交車墜江”事件的爭議性數(shù)值?!爸貞c公交車墜江”事件中,由于政府救援及時、方法科學(xué)合理、救援人員盡職奉獻(xiàn),獲得網(wǎng)民的一致好評。只有在確定事故原因方面,由事故產(chǎn)生前期網(wǎng)民誤認(rèn)為是紅色轎車逆行導(dǎo)致,到交通監(jiān)控視頻公布,確認(rèn)事故原因不是紅色轎車逆行導(dǎo)致,再到最后公交車黑匣子內(nèi)容公布,找出事故真正原因,期間網(wǎng)民關(guān)注內(nèi)容多次發(fā)生變化,但主題爭議性一直較小。因此,本文將主題爭議性均賦值為0.1,即α=0.1。

        主題語義離散度的計(jì)算需要使用主題詞對稱矩陣,對角線值為1,并將矩陣對角線一側(cè)除對角線外其他所有元素的值加和,得出主題語義離散度的倒數(shù)?!爸貞c公交車墜江”事件主題自感系數(shù)如表3所示。

        表3 “重慶公交車墜江”事件主題自感系數(shù)

        3.2.2 “重慶公交車墜江事件”主題互感系數(shù)計(jì)算

        對每個時序節(jié)點(diǎn)(即每天)進(jìn)行主題抽取,并去除表達(dá)輿情客體的主題后,其余即為每個時序節(jié)點(diǎn)上表達(dá)輿情本體的主題。如表3所示,28日剩余1個表達(dá)輿情本體的主題,不計(jì)算互感系數(shù);29日剩余T2、T3兩個表達(dá)輿情本體的主題,即計(jì)算29日T2與T3的互感系數(shù);1日剩余T2、T3、T4 3個表達(dá)輿情本體的主題,即計(jì)算1日T2、T3、T4彼此之間的互感系數(shù);以此類推。主題互感系數(shù)與主題自感系數(shù)計(jì)算類似,在主題離散度計(jì)算中,用主題詞之間相似度的倒數(shù)表達(dá)主題離散度,而在主題互感系數(shù)計(jì)算中,則將兩個主題的所有主題詞組合成一個整體,形成對角線為1的對稱矩陣,并計(jì)算對角線一側(cè)除對角線元素外其他元素?cái)?shù)值和。由于加和后的數(shù)值較大,因此將數(shù)值使用極值歸一化進(jìn)行標(biāo)準(zhǔn)化?;ジ邢禂?shù)如表4所示。

        表4 “重慶公交車墜江”事件主題互感系數(shù)

        3.2.3 “重慶公交車墜江事件”主題影響力計(jì)算

        得出微博主題自感系數(shù)、互感系數(shù)后,結(jié)合參與討論用戶數(shù)量,根據(jù)式(3)可以計(jì)算微博主題影響力。參與主題討論的用戶數(shù)量可由LDA主題提取時得出的主題—文檔分布進(jìn)行統(tǒng)計(jì)。通過主題—文檔分布,可得出所有文檔在每個主題上的概率分布,概率值最大的主題即為該文檔在內(nèi)容上屬于此主題,同時對應(yīng)文檔的發(fā)布者即為參與此主題的討論。普通用戶發(fā)布多個屬于某主題的文檔,僅表示該用戶持續(xù)關(guān)注此主題,對主題影響力大小變化的作用效果微?。欢绻W(wǎng)絡(luò)意見領(lǐng)袖用戶持續(xù)關(guān)注同一主題,則會對主題影響力的增大產(chǎn)生重要作用。不同影響力的用戶對主題的影響也不同,因此在式(3)中f(u)應(yīng)為關(guān)于用戶類型的線性函數(shù),函數(shù)表示如式(4)所示。

        f(u)=u1(β1a)+u2(β2b)+u3(β3c)

        (4)

        u1、u2、u3……表示不同用戶類型,β1、β2、β3……表示不同類型用戶參與某一主題討論的數(shù)量,a、b、c……表示對應(yīng)用戶類型的權(quán)值,u1(β1a)表示第一類用戶關(guān)注某一主題的影響力是關(guān)于參與用戶數(shù)量β1與用戶類型權(quán)值的積函數(shù)。

        關(guān)于微博用戶影響力的研究較多,應(yīng)用指標(biāo)體系計(jì)算或應(yīng)用復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)計(jì)算的研究均取得一定成果。安璐等對突發(fā)事件情境下高影響力用戶進(jìn)行分析,構(gòu)建了高影響力識別指標(biāo)體系,使用標(biāo)準(zhǔn)離差法確定指標(biāo)權(quán)重[42],指標(biāo)及相應(yīng)權(quán)重值如表5所示。

        表5 用戶影響力識別特征指標(biāo)權(quán)重

        在“重慶公交車墜江”事件中,經(jīng)過對新浪微博條目觀察發(fā)現(xiàn),并不存在權(quán)威人士或個體意見領(lǐng)袖對事件本身的解讀或討論,輿情傳播過程以官方媒體發(fā)布信息以及普通微博用戶參與討論為主,因此本文將用戶分為官方媒體,即藍(lán)V認(rèn)證用戶,其他均為普通用戶。結(jié)合文獻(xiàn)[42]研究結(jié)果,計(jì)算得出官方媒體的平均影響力指數(shù)為0.5852,普通用戶的平均影響力指數(shù)為0.1269。由于輿情事件不存在爭議性主題,未發(fā)現(xiàn)用戶觀點(diǎn)態(tài)度明顯相反的現(xiàn)象,并通過百度AI開放平臺情感傾向分析證實(shí)用戶對各主題不存在明顯相反情況。因此,在式(3)中第二部分均選擇相加處理。

        綜合以上研究,計(jì)算“重慶公交車墜江”事件各時序節(jié)點(diǎn)上各主題(除表達(dá)輿情客體的主題)的影響力如表6所示。

        4 結(jié)果討論

        以主題在語義上的自感特性及互感特性為起點(diǎn),結(jié)合參與主題討論的用戶影響力得出主題影響

        表6 “重慶公交車墜江”事件微博主題影響力

        力,擴(kuò)展了以復(fù)雜網(wǎng)絡(luò)為理論基礎(chǔ)進(jìn)行主題影響力分析的研究邊界。本文首先實(shí)現(xiàn)對主題在語義上離散度的定量計(jì)算。主題離散度是主題本征特質(zhì)的重要方面,離散度越高,吸引更多用戶參與討論、刺激用戶延伸出更多討論內(nèi)容的概率越大;第二,對同一輿情事件或同一系列輿情事件中的不同主題在內(nèi)容上的“重疊”部分,即主題互感耦合進(jìn)行定量計(jì)算;第三,以主題以及主題之間在語義上的本征特征和用戶在某一主題上的影響力來表達(dá)微博主題的影響力。

        4.1 實(shí)證結(jié)果分析

        本文的實(shí)踐意義在于當(dāng)輿情事件出現(xiàn)以后,用戶會由此輿情事件本身延伸出多個討論的主題,其中甚至可能會出現(xiàn)謠言、高度負(fù)面情感等情況。了解各主題的影響力狀況有助于促進(jìn)對輿情發(fā)展態(tài)勢的理解,更加有利于準(zhǔn)確掌握輿情潛在風(fēng)險(xiǎn)點(diǎn)。本文以“重慶公交車墜江”事件為例,對微博主題影響力進(jìn)行計(jì)算,得出各時序節(jié)點(diǎn)上各主題的影響力。在實(shí)驗(yàn)計(jì)算中發(fā)現(xiàn),來自主題互感耦合的用戶影響力對主題影響力的貢獻(xiàn)較大。另外,普通用戶對主題影響力的貢獻(xiàn)相對官方媒體更大,主要原因是官方媒體發(fā)布內(nèi)容基本屬于對輿情客體的報(bào)道,而在本文構(gòu)建的微博主題影響力計(jì)算模型中,則不將表達(dá)輿情客體的微博主題列在研究范圍內(nèi)。

        圖4 “重慶公交車墜江”事件微博主題影響力分布圖

        由圖4可以發(fā)現(xiàn),在事件發(fā)生之初主題影響力較高。主要原因是事件嚴(yán)重,傷亡人數(shù)多,因此引起大量用戶關(guān)注并參與討論。結(jié)合表3可知,28日事件發(fā)生,紅色轎車被誤認(rèn)為逆行并且是導(dǎo)致事故發(fā)生的原因。29日至30日,隨著交通視頻公布,證實(shí)紅色轎車沒有逆行并且也不是事故原因。網(wǎng)民用戶提出前一日及29日稍早誤會女司機(jī)的媒體和個人應(yīng)該做出道歉。隨著事件的發(fā)展,用戶的關(guān)注點(diǎn)又快速轉(zhuǎn)移到打撈救援工作上。其間出現(xiàn)影響力較高但持續(xù)時間較短的主題,即一名救援隊(duì)員的父親是遇難者之一,引起了用戶的關(guān)注,但影響力持續(xù)時間較短暫。在隨著公交車黑匣子被打撈并且公布黑匣子內(nèi)容,網(wǎng)民用戶對女乘客的行為進(jìn)行強(qiáng)烈的抨擊,同時也對公交車司機(jī)的應(yīng)對失當(dāng)持一定反對態(tài)度,具體內(nèi)容集中體現(xiàn)在4日T2主題中。隨著事故原因的披露,用戶在對事故當(dāng)事人表達(dá)譴責(zé)之后,整體主題影響力出現(xiàn)下降趨勢。說明此時有一部分用戶在知道事故原因之后選擇不再關(guān)注此事件。而選擇繼續(xù)參與討論此事件的用戶在關(guān)注內(nèi)容上則向更多方向發(fā)展,如相關(guān)法制建設(shè)、公交車圍欄、國民素質(zhì)等方面。其中有關(guān)國民素質(zhì)、素質(zhì)教育等主題的討論在10日左右影響力較高。

        圖4顯示“重慶公交車墜江”事件微博主題影響力分布趨勢符合信息傳播生命周期的規(guī)律,即起始期、爆發(fā)期、衰退期和平息期。30日、31日是突發(fā)事件網(wǎng)絡(luò)輿情的爆發(fā)期,結(jié)合表3可知,網(wǎng)絡(luò)用戶主要關(guān)注要求新聞媒體對紅色轎車女司機(jī)道歉以及救援工作開展,尤其關(guān)于救援工作的主題影響力最高。由此可判斷,此時盡快開展救援工作是應(yīng)急管理的重點(diǎn)工作,也是防止網(wǎng)絡(luò)輿情衍生風(fēng)險(xiǎn)、次生風(fēng)險(xiǎn)的關(guān)鍵途徑。事實(shí)上,當(dāng)?shù)卣皶r開展了科學(xué)有效的救援工作,并在救援工作出現(xiàn)了感人事跡,從而將網(wǎng)絡(luò)用戶從要求新聞媒體道歉的關(guān)注點(diǎn)轉(zhuǎn)移。最終引導(dǎo)整體突發(fā)事件網(wǎng)絡(luò)輿情平穩(wěn)進(jìn)入衰退期和平息期,在信息傳播生命周期中未出現(xiàn)網(wǎng)絡(luò)輿情衍生風(fēng)險(xiǎn)、次生風(fēng)險(xiǎn),增強(qiáng)了突發(fā)事件的社會恢復(fù)力。

        4.2 研究局限和未來研究方向

        本文基于主題在語義上的自感特性和互感特性,提出主題影響力的定義,構(gòu)建了主題影響力的計(jì)算模型。主題影響力計(jì)算模型能夠反映微博主題吸引用戶參與討論的能力。但是為了研究簡潔性,本文構(gòu)建的計(jì)算模型中有個別指標(biāo)未選擇詳細(xì)計(jì)算,而是結(jié)合已有研究成果及先驗(yàn)認(rèn)知直接定義其數(shù)值。主要是主題爭議性取值以及用戶類型細(xì)分粒度。第一,本文對主題爭議性選擇直接賦值,但實(shí)際各主題爭議性必然不同。第二,在計(jì)算用戶影響力時,只將用戶分為官方媒體和普通用戶,分類粒度的不足使得對不同用戶真實(shí)影響力的揭示不充分。第三,用戶類型權(quán)值計(jì)算以及用戶觀點(diǎn)態(tài)度方向均采取抽樣計(jì)算。以上3點(diǎn)對主題影響力的計(jì)算會產(chǎn)生一定影響。在未來研究中,注重將所有指標(biāo)的得出均建立在科學(xué)合理的計(jì)算中,減小數(shù)值取值的模糊性,增加主題影響力計(jì)算準(zhǔn)確度。

        5 結(jié) 語

        本文基于主題在內(nèi)容上的本征特質(zhì)和主題之間的互感特性,結(jié)合用戶參與主題討論行為,定義了主題影響力的概念。本文創(chuàng)新性提出對表達(dá)輿情本體的主題與表達(dá)輿情客體的主題進(jìn)行區(qū)分,并通過Word2vec算法設(shè)計(jì)了具體區(qū)分方法。同時基于輿情客體與輿情本體的理論論證了針對輿情本體進(jìn)行微博主題影響力計(jì)算的合理性。在受電路互感耦合的啟發(fā)下提出主題間互感耦合并設(shè)計(jì)計(jì)算方法,利用主題在語義上的歐式距離表達(dá)主題互感程度。最后以主題本征特質(zhì)、主題互感耦合以及在主題上分布的微博用戶數(shù)量3個模塊為基礎(chǔ),提出主題影響力計(jì)算模型,并通過“重慶公交車墜江”事件進(jìn)行實(shí)證分析?;谥黝}互感耦合對微博主題影響力進(jìn)行分析,可以描述輿情主題之間的交互關(guān)系及相互影響的程度,揭示網(wǎng)絡(luò)輿情事件的發(fā)展態(tài)勢,繼而深入理解微博用戶的行為模式,為加強(qiáng)應(yīng)急管理部門的輿情應(yīng)對能力提供理論支撐。

        猜你喜歡
        爭議性互感主題詞
        休閑運(yùn)動的爭議性反思:從時間到生活方式
        基于TensorFlow神經(jīng)網(wǎng)絡(luò)的MCR-WPT系統(tǒng)負(fù)載與互感識別方法
        大型接地系統(tǒng)接地阻抗測量的引線互感分析
        湖南電力(2021年2期)2021-05-08 06:31:18
        爭議性的產(chǎn)生
        考試周刊(2018年7期)2018-01-22 10:01:11
        例談《互感和自感》的教學(xué)設(shè)計(jì)
        道格?里曼的“個性化”電影
        爭議性材料在歷史課堂中的使用——以抗日戰(zhàn)爭的教學(xué)為例
        我校學(xué)報(bào)第32卷第5期(2014年10月)平均每篇有3.04個21世紀(jì)的Ei主題詞
        我校學(xué)報(bào)第32卷第6期(2014年12月)平均每篇有3.00個21世紀(jì)的Ei主題詞
        2014年第16卷第1~4期主題詞索引
        初尝黑人巨砲波多野结衣| 高清日韩av在线免费观看| 黑人大群体交免费视频| 99久久伊人精品综合观看| 精品十八禁免费观看| 情色视频在线观看一区二区三区 | 亚洲国产精品婷婷久久| 亚洲av永久中文无码精品综合| 一个人在线观看免费视频www| 亚洲成人av一区二区三区| 日本精品少妇一区二区| 精品亚洲国产成人蜜臀av| 洗澡被公强奷30分钟视频| 精品国产品欧美日产在线| 亚洲国产高清一区av| 国产三级a三级三级| 无码人妻黑人中文字幕| 中文乱码字幕高清在线观看| 免费观看国产激情视频在线观看| 四虎成人精品在永久免费| 欧美日韩国产一区二区三区不卡 | 久久99免费精品国产| 老熟女富婆激情刺激对白| 欧洲极品少妇| 久久婷婷是五月综合色狠狠| 久久九九精品国产不卡一区| 国产夫妇肉麻对白| 亚洲av成人精品日韩一区| 蜜桃av多人一区二区三区| 亚洲av成熟国产一区二区| 精品亚洲成a人片在线观看| 久久青草免费视频| 亚洲女同性恋在线播放专区| 精品无码一区二区三区的天堂| 亚洲中文字幕无码久久| 最新在线观看精品国产福利片 | 精品人妻av区乱码| 国产自产二区三区精品| 免费人成网ww555kkk在线| 国产精品高清视亚洲乱码有限公司| 99国语激情对白在线观看|