亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于DCA算法的微博虛假信息檢測(cè)

        2019-03-19 01:02:28,,
        關(guān)鍵詞:抗原定義特征

        ,,

        (1.湖北大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,武漢 430062;2.湖北省教育信息化工程技術(shù)研究中心,武漢 430062;3.武漢科技大學(xué) 智能信息處理與實(shí)時(shí)工業(yè)系統(tǒng)湖北省重點(diǎn)實(shí)驗(yàn)室,武漢 430065)

        0 引言

        微博,又稱“微博客”(Microblog),是一種基于用戶關(guān)系的信息分享、傳播以及獲取平臺(tái)[1]。近幾年微博迅速發(fā)展,已經(jīng)滲透到人們生活的各個(gè)方面,成為人們獲取信息的重要渠道之一。截至2017年6月,微博用戶規(guī)模達(dá)29017萬(wàn),手機(jī)微博用戶規(guī)模24086萬(wàn),用戶使用率35.7%,人均單日訪問(wèn)次數(shù)持續(xù)快速增長(zhǎng),其中新浪微博人均單日訪問(wèn)次數(shù)達(dá)到2.8次[2]。由于微博用戶數(shù)的爆炸性增長(zhǎng)、信息傳播的門檻低、缺乏有效的監(jiān)督管理平臺(tái),使得微博中虛假信息盛行。例如:2018年6月中旬,一篇微博稱12306網(wǎng)站密碼可能泄露,引起了大量用戶對(duì)12306關(guān)于信息安全方面的質(zhì)疑,后經(jīng)過(guò)核查,發(fā)現(xiàn)該網(wǎng)站并未發(fā)生用戶信息泄露事件。惡意的虛假信息可能嚴(yán)重侵犯當(dāng)事人合法權(quán)利,造成社會(huì)恐慌,煽動(dòng)群體性事件,甚至引發(fā)信任危機(jī),這對(duì)國(guó)家的發(fā)展尤為不利[3]。因此,進(jìn)行虛假信息檢測(cè)的研究工作迫在眉睫。

        基于對(duì)微博虛假信息的分析,當(dāng)前的研究可主要分為三類。

        (1)基于內(nèi)容特征和用戶特征:內(nèi)容特征包括博文的符號(hào)特征、鏈接特征、關(guān)鍵詞分布特征和傳播特性等特征,用戶特征包括發(fā)布者的粉絲數(shù)量、朋友數(shù)量、是否為認(rèn)證用戶等特征。如Dayani等人[4]選取提取用戶特征和內(nèi)容特征,采用K最近鄰(K-Nearest Neighbors,KNN) 分類器以及NB 分類器檢測(cè)Twitter中的謠言。Gupta等人[5]選取用戶特征和一些內(nèi)容特征,基于決策樹分類來(lái)檢測(cè)Twitter上的虛假圖片。但是這些方法只是簡(jiǎn)單的分析了文本的表面特征,并沒(méi)有對(duì)文本的語(yǔ)義進(jìn)行深入分析,并且隨著網(wǎng)絡(luò)的復(fù)雜化,虛假信息不再具有顯著的可識(shí)別的特征。因此,簡(jiǎn)單的基于內(nèi)容特征和用戶特征已不能有效的識(shí)別虛假信息。

        (2)基于信息傳播過(guò)程:通過(guò)微博信息在傳播過(guò)程中轉(zhuǎn)發(fā)和評(píng)論者的把關(guān)行為來(lái)實(shí)時(shí)的更新微博信息的可信度來(lái)進(jìn)行虛假信息的檢測(cè),如謝柏林等人[6]利用模型狀態(tài)持續(xù)時(shí)間概率為Gamma分布的隱半馬爾可夫模型來(lái)刻畫信息轉(zhuǎn)發(fā)者和評(píng)論者對(duì)流行的真實(shí)信息的把關(guān)行為,基于此進(jìn)行虛假信息的在線檢測(cè)。Liu等人[7]在Twitter上進(jìn)行實(shí)時(shí)的謠言檢測(cè),選取了兩個(gè)實(shí)時(shí)謠言跟蹤網(wǎng)站(snopes.com和emergent.info),結(jié)果顯示該方法能將檢測(cè)延遲減少25%和50%。但該方法需要大量時(shí)間對(duì)虛假信息進(jìn)行跟蹤,處理效率較低。

        (3)基于評(píng)論特征:包括對(duì)文本情感分析[8]、傾向性分析[9]以及內(nèi)容相關(guān)性分析。如段大高等人[10]從評(píng)論的角度出發(fā),選取微博評(píng)論對(duì)博文內(nèi)容的置信度、支持性以及評(píng)論與博文之間的內(nèi)容相關(guān)性作為特征對(duì)評(píng)論進(jìn)行SVM分類,通過(guò)統(tǒng)計(jì)微博下的異常評(píng)論的比例,判定其是否為微博虛假信息。該方法能較好的識(shí)別微博網(wǎng)絡(luò)環(huán)境下的虛假信息,但其只對(duì)微博評(píng)論進(jìn)行了深入的分析,沒(méi)有考慮用戶特征和虛假信息的傳播特性方面的特征。

        微博客中的信息往往具有一定的時(shí)效性和隨意性,所以現(xiàn)有的虛假信息檢測(cè)方法難以通過(guò)檢測(cè)微博內(nèi)容本身來(lái)判定是否虛假,大多是通過(guò)選取虛假信息的發(fā)布者特征和評(píng)論特征,訓(xùn)練分類器,然后用訓(xùn)練好的分類器進(jìn)行微博虛假信息的檢測(cè)。但是這些研究往往選取局部的、單一方面的特征進(jìn)行檢測(cè),并沒(méi)有全面的分析和挖掘影響微博虛假信息的各方面的特征。同時(shí)社交網(wǎng)絡(luò)中的虛假信息檢測(cè)問(wèn)題與人體免疫系統(tǒng)中所遇到的問(wèn)題有很大的相似性,如利用人工免疫危險(xiǎn)理論中的樹突狀細(xì)胞算法(Dendritic Cell Algorithm, DCA)進(jìn)行垃圾郵件群發(fā)檢測(cè)[11]和服務(wù)器異常檢測(cè)[12]等。

        受此啟發(fā),本文通過(guò)對(duì)微博虛假信息的分析,選取了微博發(fā)布者的用戶屬性,微博評(píng)論兩個(gè)方面的特征,將人工免疫系統(tǒng)中危險(xiǎn)理論的原理和信號(hào)機(jī)制應(yīng)用在社交網(wǎng)絡(luò)中虛假信息的分析檢測(cè)中,使用危險(xiǎn)理論中的DCA算法實(shí)現(xiàn)微博虛假信息的檢測(cè)。

        1 樹突狀細(xì)胞(DCA)算法概述

        1994年,Polly Matzinger提出了危險(xiǎn)理論的思想,認(rèn)為“危險(xiǎn)”才是引發(fā)免疫響應(yīng)的關(guān)鍵[13]。2002年英國(guó)諾丁漢大學(xué)的 Uwe 研究小組,在文獻(xiàn)[14]中首次提出可以考慮將機(jī)體免疫系統(tǒng)中的危險(xiǎn)理論引入計(jì)算機(jī)安全領(lǐng)域。2007年,Greensmith J等人[15]設(shè)計(jì)并提出了基于危險(xiǎn)理論的樹突狀細(xì)胞算法(Dendritic Cell Algorithm, DCA)。隨后的研究中,DCA算法普遍被應(yīng)用于入侵檢測(cè)[16-17]領(lǐng)域中。

        在生物免疫系統(tǒng)中,樹突狀細(xì)胞(dendritic cells,DC)是來(lái)自于骨髓內(nèi)的髓樣前體細(xì)胞,構(gòu)成了人體對(duì)抗入侵者的第一道防線的一部分[18]。DC細(xì)胞收集組織中的抗原并進(jìn)行提呈。未成熟的DC細(xì)胞(immature DC)暴露在有抗原存在的環(huán)境下的安全信號(hào)(Safe Signals信號(hào),以下簡(jiǎn)稱SS信號(hào))和危險(xiǎn)信號(hào)(包括Danger Signals信號(hào)、PAMPS信號(hào)和Inflammatory CKS信號(hào),以下分別簡(jiǎn)稱DS信號(hào)、PAMP信號(hào)和IS信號(hào))下,根據(jù)兩種信號(hào)的占比分化成為成熟DC細(xì)胞(mature DC)和半成熟DC細(xì)胞(semi-mature DC)兩種,最終由成熟抗原占總抗原的比重來(lái)決定是否產(chǎn)生了危險(xiǎn)[19]。如圖1所示,未成熟DC細(xì)胞暴露在安全信號(hào)下會(huì)成為半成熟DC,暴露在危險(xiǎn)信號(hào)下會(huì)成為成熟DC。

        圖1 DC成熟和分化所需信號(hào)的抽象視圖

        DCA算法主要是模擬作為抗原呈遞細(xì)胞的樹突細(xì)胞的功能所提出的[20],其輸入信號(hào)包括4種:(1)PAMP信號(hào)(病原體相關(guān)分子模式);(2)DS信號(hào)(危險(xiǎn)信號(hào));(3)SS信號(hào)(安全信號(hào)):細(xì)胞正常死亡產(chǎn)生的信號(hào),代表系統(tǒng)中的正常行為;(4)IS信號(hào)(致炎信號(hào))。對(duì)輸入信號(hào)通過(guò)相關(guān)函數(shù)及權(quán)值矩陣進(jìn)行融合處理后,輸出以下3種信號(hào):(1)CSM(costimulatory molecules)協(xié)同刺激分子:該值用來(lái)判斷未成熟DC細(xì)胞何時(shí)開始分化,當(dāng)CSM>遷移閾值時(shí),未成熟DC開始分化為半成熟DC或成熟DC;(2)半成熟DC細(xì)胞(semi-mature):表示當(dāng)前細(xì)胞環(huán)境的安全程度,同時(shí)該DC攝取到的所有抗原提呈為安全抗原;(3)成熟DC細(xì)胞(mature)表示當(dāng)前細(xì)胞環(huán)境的危險(xiǎn)程度,同時(shí)該DC攝取到的所有抗原提呈為危險(xiǎn)抗原。當(dāng)抗原達(dá)到判別次數(shù)時(shí),計(jì)算出代表該抗原異常程度的成熟環(huán)境抗原值MCAV(MCAV=抗原標(biāo)記為危險(xiǎn)抗原的次數(shù)/抗原被標(biāo)記的總次數(shù))。如果MCAV值大于異常閾值,則表明該抗原為異常抗原,反之則為正常抗原。

        DCA算法具有自適應(yīng)性強(qiáng),效率高等優(yōu)點(diǎn)。基于以上內(nèi)容,本文將微博網(wǎng)絡(luò)環(huán)境抽象為生物機(jī)體,針對(duì)社交網(wǎng)絡(luò)中微博發(fā)布者的用戶屬性,微博評(píng)論特征、信息傳播等特征進(jìn)行分析定義,將其映射為危險(xiǎn)信號(hào),與DCA算法模型進(jìn)行匹配,并使用DCA算法設(shè)計(jì)一種新的微博虛假信息檢測(cè)方法。本文涉及到的生物免疫系統(tǒng)中的七種信號(hào)及其抽象定義詳見文獻(xiàn)[21]。

        2 基于DCA算法的微博虛假信息檢測(cè)

        2.1 微博虛假信息特征選取

        微博上虛假信息的發(fā)布者個(gè)人信息和其評(píng)論內(nèi)容有較為顯著的特征,本文以目前國(guó)內(nèi)用戶規(guī)模最大的新浪微博平臺(tái)作為研究對(duì)象,通過(guò)對(duì)近幾年虛假信息特征變化的主流研究,結(jié)合相關(guān)文獻(xiàn)的觀點(diǎn),得出如下分析結(jié)論。(1)從微博發(fā)布者的角度:①微博上虛假消息的發(fā)布者通常缺乏完善的用戶簡(jiǎn)介、是否認(rèn)證、所在地等個(gè)人信息。②虛假信息的發(fā)布者所發(fā)布的信息通常都帶有一定的目的性,而其有價(jià)值的微博數(shù)少且影響力弱,造成其關(guān)注數(shù)遠(yuǎn)高于粉絲數(shù)[22]。(2)從虛假信息的評(píng)論內(nèi)容:虛假信息下面的評(píng)論普遍支持性較弱,負(fù)面詞匯多,語(yǔ)氣的不確定性較強(qiáng),且評(píng)論內(nèi)容與原微博的內(nèi)容相關(guān)性也較弱[23]。(3)從微博的傳播角度:影響力大的用戶對(duì)源消息的轉(zhuǎn)發(fā)及評(píng)論會(huì)促進(jìn)虛假信息的傳播。

        基于以上分析,本文從這三個(gè)角度總共選取了12個(gè)特征:(1)基于用戶的特征:微博發(fā)布者的粉絲數(shù)、關(guān)注數(shù)、互相關(guān)注數(shù)、是否認(rèn)證、有無(wú)簡(jiǎn)介、地址信息是否詳細(xì)等6種特征;(2)基于文本內(nèi)容的特征:用戶的評(píng)論內(nèi)容對(duì)微博的內(nèi)容相關(guān)性、支持性以及置信度等3種特征;(3)基于傳播特性的指標(biāo):選取評(píng)論用戶所發(fā)微博的收藏?cái)?shù)、轉(zhuǎn)發(fā)數(shù)、點(diǎn)贊數(shù)等3種特征。選取并將其融合成6種能夠區(qū)分虛假信息和真實(shí)信息的重要屬性,具體的融合方法見2.2節(jié)中的定義1~6。

        2.2 抗原信號(hào)選取

        基于上述微博虛假信息的特點(diǎn),分析一定時(shí)間段內(nèi)的微博虛假信息情況,采取以下指標(biāo)作為抗原信號(hào),并通過(guò)多次對(duì)比實(shí)驗(yàn)和經(jīng)驗(yàn)總結(jié),確定定義公式中各項(xiàng)指標(biāo)的權(quán)重系數(shù)。

        定義1:用戶身份評(píng)價(jià)(IE)。涉及多個(gè)屬性變量,分別為有無(wú)簡(jiǎn)介(I)、是否認(rèn)證(C)和地址信息詳細(xì)程度(G),給各個(gè)屬性的權(quán)重分別為0.3、0.4、0.3,計(jì)算方式如公式(1)所示。

        IE=0.3I+0.4C+0.3G

        (1)

        定義2:用戶的粉絲關(guān)注比(FF)。即每個(gè)用戶的粉絲數(shù)(Fans)與關(guān)注數(shù)(Followers)的比值,比值越小,則用戶異常的可能性越大。計(jì)算方法如公式(2)所示。

        FF=Fans/Followers

        (2)

        定義3:評(píng)論內(nèi)容相關(guān)性 (CR)。即評(píng)論內(nèi)容與源微博信息之間的內(nèi)容相關(guān)程度,本文通過(guò)對(duì)微博內(nèi)容(U)和評(píng)論內(nèi)容(C)進(jìn)行詞法分析[24],統(tǒng)計(jì)文本的基本詞得出構(gòu)成微博及其評(píng)論的關(guān)鍵詞集合,評(píng)論中出現(xiàn)的源微博的關(guān)鍵詞越多,則評(píng)論內(nèi)容與源微博信息之間越相關(guān),即評(píng)論內(nèi)容相關(guān)性越大。評(píng)論內(nèi)容相關(guān)性的計(jì)算方法如公式(3)所示。

        (3)

        其中:CRi表示當(dāng)前微博下第i個(gè)評(píng)論與微博的內(nèi)容相關(guān)性,U表示當(dāng)前微博的關(guān)鍵詞集合,Ci表示當(dāng)前微博下的第i個(gè)評(píng)論的關(guān)鍵詞集合,|U|和|Ci|分別表示微博和評(píng)論的關(guān)鍵詞數(shù)量。

        定義4:評(píng)論內(nèi)容置信度(FP)。置信度是評(píng)論內(nèi)容本身語(yǔ)氣不確定性程度的刻畫,置信度越大,則評(píng)論內(nèi)容的不確定性越小。本文通過(guò)調(diào)用神箭手的自然語(yǔ)言處理API中的接口,得出每個(gè)評(píng)論內(nèi)容的置信度FP。

        定義5:評(píng)論內(nèi)容支持性(SUP)。支持性即評(píng)論用戶的觀點(diǎn)對(duì)微博內(nèi)容的支持程度,若評(píng)論中含有大量的負(fù)面詞匯(假的,懷疑,造謠…)則評(píng)論內(nèi)容對(duì)微博的支持程度低。本文通過(guò)對(duì)評(píng)論內(nèi)容進(jìn)行情感分析[25],得出每個(gè)評(píng)論內(nèi)容的情感正向比重(SUPPOS)和情感負(fù)向比重(SUPNEG)。每個(gè)評(píng)論的內(nèi)容支持性的計(jì)算方法如公式(4)所示。

        SUP=SUPPOS-SUPNEG

        (4)

        定義6:評(píng)論用戶影響力(CI)。涉及多個(gè)屬性變量,涉及多個(gè)屬性變量,分別為評(píng)論數(shù)(J),轉(zhuǎn)發(fā)數(shù)(R)和收藏?cái)?shù)(C),即評(píng)論用戶所發(fā)微博的被評(píng)論數(shù)、被轉(zhuǎn)發(fā)數(shù)和被收藏?cái)?shù),各個(gè)屬性的權(quán)重分別為0.3、0.2、0.5,計(jì)算方式如公式(5)所示。

        CI=0.3J+0.2R+0.5C

        (5)

        2.3 微博虛假信息檢測(cè)算法實(shí)現(xiàn)

        2.3.1 信號(hào)映射

        針對(duì)前文提到的微博虛假信息各項(xiàng)指標(biāo)數(shù)據(jù)進(jìn)行預(yù)處理,統(tǒng)一將其進(jìn)行規(guī)格化處理。定義規(guī)格化函數(shù)f(x)如公式(6)所示。

        (6)

        其中:x是原始信號(hào)值,當(dāng)x∈[m,n]時(shí),對(duì)信號(hào)值進(jìn)行規(guī)格化處理,當(dāng)時(shí)x∈[n,∞),信號(hào)最大值為10。

        現(xiàn)將檢測(cè)新浪微博虛假信息的相關(guān)屬性進(jìn)行如下映射。

        (1)病原體相關(guān)分子模式PAMP:表明微博信息異常,存在虛假信息的特征,定義PAMP={}

        (2)危險(xiǎn)信號(hào)DS:表明微博信息異常的可能性較高,也可能是真實(shí)的信息,但存在虛假信息的可能,定義DS={};

        (3)安全信號(hào)SS:表示微博信息真實(shí)的可能性較高,并處于正常狀態(tài),定義SS={};

        (4)致炎因子IS:表明微博信息總體上存在虛假的可能,起到放大PAMP、DS、SS信號(hào)的作用,定義IS={}。

        2.3.2 權(quán)值矩陣

        如前文所述,DC收集組織中的抗原和信號(hào),對(duì)輸入信號(hào)(PAMP、DS、SS、IS)進(jìn)行計(jì)算處理,輸出三個(gè)信號(hào):協(xié)同刺激信號(hào)(CSM)、半成熟信號(hào)(SEMI)與成熟信號(hào)(MAT)。DCA算法中輸入信號(hào)對(duì)輸出信號(hào)的影響如圖2所示。

        圖2 DC信號(hào)處理抽象圖

        其中PAMP和DS對(duì)CSM信號(hào)及MAT信號(hào)有正影響,起促進(jìn)作用,且DS信號(hào)的影響要比PAMP信號(hào)弱。SS對(duì)CSM信號(hào)和SEMI信號(hào)值的具有正影響,對(duì)MAT信號(hào)則具有負(fù)影響。由輸入信號(hào)值到輸出信號(hào)值的轉(zhuǎn)換權(quán)值矩陣如表1所列。

        表1 DCA信號(hào)轉(zhuǎn)換權(quán)值矩陣

        表1中的權(quán)值矩陣中權(quán)值大小根據(jù)實(shí)驗(yàn)結(jié)果進(jìn)行調(diào)整并確定最后的數(shù)值,表示輸入信號(hào)對(duì)輸出信號(hào)的影響程度,權(quán)值越大表明其對(duì)相應(yīng)信號(hào)的輸出的影響程度越大,權(quán)值為負(fù)值即代表其對(duì)相應(yīng)信號(hào)的輸出為負(fù)影響。輸入信號(hào)值轉(zhuǎn)換為輸出信號(hào)值的計(jì)算如公式(7)所示。其中(1+IS)為放大信號(hào),Wp、WD、Ws是根據(jù)表1中得出的計(jì)算輸出信號(hào)是PAMP信號(hào)、DS信號(hào)和SS信號(hào)所占的權(quán)重,如計(jì)算時(shí),Wp=8,WD=3,Ws=3。

        C[CSM,SEMI,MAT]=

        (7)

        如前文所述,當(dāng)CSM信號(hào)達(dá)到遷移閾值時(shí),比較當(dāng)前DC細(xì)胞中SEMI和MAT的大小。若SEMI>=MAT時(shí),DC遷移為半成熟DC細(xì)胞,同時(shí)標(biāo)記當(dāng)前抗原為正??乖淮危环粗?,DC遷移為成熟DC細(xì)胞,同時(shí)標(biāo)記當(dāng)前抗原為異??乖淮?。當(dāng)抗原的判別次數(shù)達(dá)到抗原判別閾值,計(jì)算出當(dāng)前抗原的MCAV值。通過(guò)MCAV值與抗原異常閾值之間大小的判斷,標(biāo)記該抗原為異?;蛘!?/p>

        2.3.3 算法流程描述

        根據(jù)文獻(xiàn)[15]的描述,本文應(yīng)用到微博虛假信息檢測(cè)中的DCA算法流程如圖1所示。

        圖3 DCA算法流程

        圖4 算法偽代碼

        3 實(shí)驗(yàn)

        3.1 數(shù)據(jù)獲取

        本文實(shí)驗(yàn)數(shù)據(jù)集選自文獻(xiàn)[10],其數(shù)據(jù)采集來(lái)自新浪微博社區(qū)管理中心和新浪微博 API 接口獲取的熱門微博,包含100個(gè)謠言和100個(gè)非謠言,謠言微博以微博官方辟謠為依據(jù),經(jīng)過(guò)篩選與數(shù)據(jù)處理得到的數(shù)據(jù)集統(tǒng)計(jì)信息如表2所示。

        表2 數(shù)據(jù)集統(tǒng)計(jì)信息

        3.2 評(píng)價(jià)指標(biāo)

        算法結(jié)果評(píng)估包括查準(zhǔn)率(P)、查全率(R)以及F1值等評(píng)價(jià)指標(biāo)。其中查準(zhǔn)率和查全率用來(lái)評(píng)價(jià)實(shí)驗(yàn)準(zhǔn)確性,F(xiàn)1值對(duì)實(shí)驗(yàn)綜合表現(xiàn)的評(píng)價(jià)指標(biāo)。各指標(biāo)的詳細(xì)定義如下。

        (1)查準(zhǔn)率PR的定義如公式(8)所示。

        (8)

        式中,class+=TP/(TP+FP) ,class-=TN/(TN+FN),分別表示分類器對(duì)虛假信息和真實(shí)信息的分類準(zhǔn)確率,其中:TP是被正確識(shí)別為虛假信息的微博數(shù),F(xiàn)P是被錯(cuò)誤識(shí)別為虛假信息的微博數(shù),TN是被正確識(shí)別為真實(shí)信息的微博數(shù),F(xiàn)N是被錯(cuò)誤判別為真實(shí)信息的微博數(shù)。PR表示分類器平均準(zhǔn)確率。平均準(zhǔn)確率PR的高低由class+、class-兩者值的高低共同決定。

        (2)查全率R的定義如公式(9)所示。

        R=TP/(TP+FN)

        (9)

        (3)F1值的定義如公式(10)所示。

        F1=(2P*R)/(P+R)

        (11)

        3.3 實(shí)驗(yàn)結(jié)果與分析

        為了驗(yàn)證基于人工免疫危險(xiǎn)理論的虛假信息檢測(cè)算法的有效性,本文通過(guò)對(duì)微博虛假信息的特征分析,與前文所提及的文獻(xiàn)[10]提出的基于SVM的分類方法進(jìn)行了對(duì)比實(shí)驗(yàn),其中基于SVM的分類方法按8:2的比例隨機(jī)劃分?jǐn)?shù)據(jù)集,即數(shù)據(jù)集的80%作為訓(xùn)練集,余下的20%作為預(yù)測(cè)集。在實(shí)驗(yàn)結(jié)果中比較了查準(zhǔn)率、查全率及F1值等3個(gè)指標(biāo)。實(shí)驗(yàn)抽取上述數(shù)據(jù)集中的數(shù)據(jù)作為樣本,使用兩種識(shí)別方法分別進(jìn)行實(shí)驗(yàn),對(duì)比結(jié)果如圖5所示。實(shí)驗(yàn)結(jié)果表明,基于DCA算法微博虛假信息檢測(cè)對(duì)比SVM分類方法有較好的適用性和較高的準(zhǔn)確率。

        圖5 實(shí)驗(yàn)結(jié)果對(duì)比

        4 結(jié)束語(yǔ)

        本文借鑒生物免疫系統(tǒng)的思想,采用DCA算法進(jìn)行微博虛假信息的檢測(cè)。通過(guò)分析新浪微博中虛假信息的特征,根據(jù)微博真實(shí)信息與虛假信息在發(fā)布者用戶屬性,評(píng)論特征和信息傳播等特征表現(xiàn)上的差異,判斷微博信息是否虛假。實(shí)驗(yàn)結(jié)果表明,該方法的檢測(cè)準(zhǔn)確率較高,是檢測(cè)微博虛假信息的一種有效方法。但是本文微博虛假信息檢測(cè)方法依賴于微博評(píng)論的數(shù)量,當(dāng)微博評(píng)論增多時(shí),說(shuō)明虛假信息的危害已經(jīng)產(chǎn)生,未來(lái)應(yīng)該將重點(diǎn)放在虛假信息的預(yù)測(cè)上,擬采用更復(fù)雜的特征,通過(guò)實(shí)現(xiàn)微博虛假信息提前檢測(cè)以減少其造成的危害和不良影響。

        猜你喜歡
        抗原定義特征
        如何表達(dá)“特征”
        不忠誠(chéng)的四個(gè)特征
        抓住特征巧觀察
        成功的定義
        山東青年(2016年1期)2016-02-28 14:25:25
        梅毒螺旋體TpN17抗原的表達(dá)及純化
        結(jié)核分枝桿菌抗原Lppx和MT0322人T細(xì)胞抗原表位的多態(tài)性研究
        APOBEC-3F和APOBEC-3G與乙肝核心抗原的相互作用研究
        鹽酸克倫特羅人工抗原的制備與鑒定
        線性代數(shù)的應(yīng)用特征
        河南科技(2014年23期)2014-02-27 14:19:15
        修辭學(xué)的重大定義
        新婚少妇无套内谢国语播放| 亚洲国产麻豆综合一区| JIZZJIZZ国产| 亚洲区一区二区中文字幕| 亚洲永久免费中文字幕| 东北女人一级内射黄片| 国产国产人免费人成免费视频 | 老色鬼永久精品网站| 亚洲人妖女同在线播放| 亚洲av综合日韩精品久久久| 人妻丝袜中文字幕久久| 亚洲综合久久中文字幕专区一区| 日韩中文字幕有码午夜美女| 亚洲综合精品中文字幕| 日韩人妻一区二区三区蜜桃视频| 欧美性性性性性色大片免费的| 成人日韩av不卡在线观看| 无码AV午夜福利一区| 亚洲一区二区三区天堂av| 国产午夜精品综合久久久| 久久九九精品国产不卡一区| 红桃av一区二区三区在线无码av| 天堂新版在线资源| 亚洲熟女少妇一区二区| 亚洲成人免费无码| 男女干逼视频免费网站| 加勒比东京热一区二区| 色婷婷久久亚洲综合看片| 一区二区三区内射美女毛片 | 国产福利酱国产一区二区| 日本精品国产1区2区3区| 国产激情视频高清在线免费观看| 中文字幕女同系列在线看一| 成年女人色毛片| 精品国产18禁久久久久久久| 日韩精品成人一区二区三区久久久| 一区二区三区日本伦理| 成人午夜特黄aaaaa片男男| 欧美黑人乱大交| 精品蜜桃视频在线观看| 激情在线一区二区三区视频|