亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向論壇的突發(fā)性熱點(diǎn)話題快速發(fā)現(xiàn)與跟蹤

        2014-04-01 00:58:02徐會(huì)杰蔡皖東陳桂茸

        徐會(huì)杰,蔡皖東,陳桂茸

        (西北工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,陜西 西安,710129)

        網(wǎng)絡(luò)論壇突發(fā)性熱點(diǎn)話題是指網(wǎng)絡(luò)論壇中由突發(fā)性公共事件引起的、在出現(xiàn)之前難以預(yù)知并且傳播周期較短、對(duì)社會(huì)輿論影響較大的話題。當(dāng)網(wǎng)絡(luò)論壇中一些指向性強(qiáng)、易引起網(wǎng)民共鳴的突發(fā)性熱點(diǎn)話題出現(xiàn)時(shí),往往會(huì)引發(fā)重大輿情危機(jī)。如何準(zhǔn)確、高效地發(fā)現(xiàn)與跟蹤突發(fā)性熱點(diǎn)話題,對(duì)網(wǎng)絡(luò)輿情的識(shí)別與監(jiān)控具有重要的現(xiàn)實(shí)意義。關(guān)于突發(fā)性熱點(diǎn)話題的發(fā)現(xiàn),目前國(guó)內(nèi)外研究者主要采用語(yǔ)義分析[1-5]和復(fù)雜網(wǎng)絡(luò)分析[6-10]2 種技術(shù)途徑,后來(lái)的很多方法都是這2 種方法的進(jìn)一步擴(kuò)展。基于語(yǔ)義分析和復(fù)雜網(wǎng)絡(luò)分析的方法雖然在一定程度上可以發(fā)現(xiàn)某一時(shí)間周期內(nèi)的熱點(diǎn)話題,但采用上述方法存在以下問(wèn)題:(1) 基于語(yǔ)義分析的熱點(diǎn)話題發(fā)現(xiàn)主要采用文本聚類、分類的方法,面對(duì)網(wǎng)絡(luò)論壇的海量數(shù)據(jù),數(shù)據(jù)處理量大、效率低。同時(shí)由于網(wǎng)絡(luò)論壇內(nèi)容與常規(guī)的語(yǔ)料相比更加口語(yǔ)化和非正規(guī)化,一般的語(yǔ)義分析技術(shù)難以滿足識(shí)別精度的要求;(2) 基于復(fù)雜網(wǎng)絡(luò)的熱點(diǎn)話題發(fā)現(xiàn)以簡(jiǎn)單有效的帖子關(guān)系構(gòu)建網(wǎng)絡(luò),通過(guò)分析其網(wǎng)絡(luò)特性提取熱點(diǎn)話題。但以往該方面的研究往往以網(wǎng)絡(luò)特性參數(shù)數(shù)量上的累積作為判斷依據(jù),而忽略了網(wǎng)絡(luò)的時(shí)變特性。例如,具有高入度值的帖子因不具備時(shí)間上的突發(fā)性則難以成為突發(fā)性熱點(diǎn)話題。針對(duì)以上問(wèn)題與不足,本文提出一種基于噪音過(guò)濾和話題聚類的熱點(diǎn)話題快速發(fā)現(xiàn)方法。該方法充分考慮了網(wǎng)絡(luò)論壇結(jié)構(gòu)、話題特征以及突發(fā)性熱點(diǎn)話題所具備的高關(guān)注度、時(shí)間突發(fā)特性,采用逐步求精的策略,通過(guò)噪音過(guò)濾、分詞、聚類實(shí)現(xiàn)突發(fā)性熱點(diǎn)話題的發(fā)現(xiàn)。

        1 網(wǎng)絡(luò)論壇結(jié)構(gòu)和話題特征

        網(wǎng)絡(luò)論壇作為網(wǎng)絡(luò)輿情傳播的重要途徑,是一種為廣大用戶提供張貼特定或一般內(nèi)容以及進(jìn)行討論的Web 應(yīng)用。論壇由很多的版塊(board)構(gòu)成,組織形式是主題(thread)。論壇中用戶間的討論首先是以第一個(gè)作者發(fā)出一個(gè)主貼(entry post),該主貼有一個(gè)唯一的標(biāo)題(title)和入口(entry),然后由其他用戶(可以是第一個(gè)作者)圍繞這個(gè)主貼通過(guò)發(fā)1 個(gè)或多個(gè)包含相應(yīng)內(nèi)容的回復(fù)帖(post)展開(kāi)的。如圖1 所示為網(wǎng)絡(luò)論壇主題構(gòu)成圖。網(wǎng)絡(luò)論壇的話題(topic)是由1 個(gè)或多個(gè)討論類似內(nèi)容的主題集合,如圖2 所示為話題的層次視圖[11]。

        圖1 網(wǎng)絡(luò)論壇主題構(gòu)成圖Fig.1 Thread structure in web forum

        圖2 網(wǎng)絡(luò)論壇中話題的層次視圖Fig.2 Topic level view

        2 突發(fā)性熱點(diǎn)話題發(fā)現(xiàn)

        網(wǎng)絡(luò)論壇突發(fā)性熱點(diǎn)話題快速發(fā)現(xiàn)與跟蹤包括建立候選話題集、論壇數(shù)據(jù)噪音過(guò)濾、突發(fā)性熱點(diǎn)話題發(fā)現(xiàn)、突發(fā)性熱點(diǎn)話題跟蹤4 個(gè)步驟。建立候選話題集是將采集到的論壇數(shù)據(jù)建立以主貼標(biāo)題為索引的話題集;噪音過(guò)濾是對(duì)獲取到的候選話題集進(jìn)行去噪處理,移除掉熱度較低的主貼和不具有時(shí)間突發(fā)性的主貼,通過(guò)噪音過(guò)濾,可以過(guò)濾掉論壇中大部分不會(huì)演變成熱點(diǎn)話題的帖子。對(duì)剩余的帖子,通過(guò)分詞工具提取主帖標(biāo)題中包含的主題詞并采用聚類算法對(duì)主貼進(jìn)行合并,進(jìn)而抽取出突發(fā)性熱點(diǎn)話題;針對(duì)發(fā)現(xiàn)的突發(fā)性熱點(diǎn)話題的時(shí)間序列,繪制其對(duì)應(yīng)的回帖加速度變化曲線進(jìn)行跟蹤。如圖3 所示為突發(fā)性熱點(diǎn)話題快速發(fā)現(xiàn)與跟蹤的整個(gè)流程。

        2.1 建立候選話題集

        研究發(fā)現(xiàn),網(wǎng)絡(luò)論壇中主貼的標(biāo)題一般直接代表了用戶討論的主題[12-13]。 根據(jù)2011 年中國(guó)互聯(lián)網(wǎng)輿情分析報(bào)告中列出的前10 大網(wǎng)絡(luò)熱點(diǎn)事件[14],本文以最具影響力的全球華人論壇天涯社區(qū)為例,檢索出社區(qū)中對(duì)應(yīng)10 大網(wǎng)絡(luò)熱點(diǎn)事件的回復(fù)數(shù)最大的主貼,統(tǒng)計(jì)發(fā)現(xiàn)其主貼標(biāo)題即能概括事件主題的占總統(tǒng)計(jì)量的80%以上。本文的突發(fā)性熱點(diǎn)話題發(fā)現(xiàn)方法很好地利用了這一特征,在數(shù)據(jù)采集之初僅采集論壇中各主貼的標(biāo)題并建立以主帖標(biāo)題為索引的話題集。

        圖3 突發(fā)性熱點(diǎn)話題快速發(fā)現(xiàn)與跟蹤流程Fig.3 Flow diagram of detection and tracking for bursty topics

        2.2 噪音過(guò)濾

        網(wǎng)絡(luò)論壇熱點(diǎn)話題的形成分內(nèi)容驅(qū)動(dòng)和形式驅(qū)動(dòng)2 種不同的方式[15]。內(nèi)容驅(qū)動(dòng)是通過(guò)發(fā)表經(jīng)特別制作的內(nèi)容豐富的帖子,吸引網(wǎng)民大量瀏覽和回復(fù)該帖子,形成熱貼;形式驅(qū)動(dòng)是網(wǎng)絡(luò)推動(dòng)者通過(guò)調(diào)動(dòng)大量“僵尸機(jī)器”及招募大量的網(wǎng)絡(luò)評(píng)論員發(fā)表大量有關(guān)事件的帖子,將該事件強(qiáng)行推入公眾視野,捧成熱點(diǎn),進(jìn)而吸引網(wǎng)民大量瀏覽和回復(fù)該帖子而形成熱點(diǎn)話題。這2 種驅(qū)動(dòng)形式啟示我們,可以從帖子的瀏覽數(shù)、回復(fù)數(shù)進(jìn)行熱點(diǎn)話題的發(fā)現(xiàn)。帖子熱度評(píng)分公式如下[16]:

        式中:α,β,γ 為加權(quán)值;r(xi)為主貼xi的回復(fù)數(shù);b(xi)為主貼xi的點(diǎn)擊數(shù);avgr(X)為所有帖子X(jué) 的平均回復(fù)數(shù);avgb(X)為所有帖子X(jué) 的平均點(diǎn)擊數(shù);max(X)為所有帖子X(jué) 中最大回復(fù)數(shù)與點(diǎn)擊數(shù)之比。

        一般而言,論壇用戶要點(diǎn)擊某個(gè)帖子才可以對(duì)它進(jìn)行回復(fù),所以,帖子點(diǎn)擊數(shù)一般要大于回復(fù)數(shù)。以r(xi)/b(xi)來(lái)描述用戶圍繞主貼xi討論的激烈程度,比值越大,表明該帖子相對(duì)應(yīng)的話題受關(guān)注度越高。在確定式(1)中3 個(gè)指標(biāo)相對(duì)于彼此的重要程度之前,加權(quán)值α,β 和γ 是未知的。本文采用AHP 法求解,根據(jù)Saaty“l(fā)-9”標(biāo)度法,構(gòu)造判斷矩陣為:

        分別計(jì)算3 行元素的幾何平均值后作歸一化處理,并計(jì)算最后權(quán)重,計(jì)算公式為:

        式中:Wi為權(quán)重;Wi′為判斷矩陣中每行元素的幾何平均值。則α,β 和γ 的計(jì)算結(jié)果為:α=0.194 7;β=0.088 1;γ=0.717 2。

        式(1)雖然可以快速發(fā)現(xiàn)熱度排名靠前的帖子,但它反映的是帖子回復(fù)數(shù)和點(diǎn)擊數(shù)在數(shù)量上的累積,不能體現(xiàn)貼子熱度隨時(shí)間的變化特性。根據(jù)演化理論,帖子的生命周期也經(jīng)歷突發(fā)、成長(zhǎng)、衰退、消亡4 個(gè)階段[17]。處于衰退階段的帖子即使其熱度很高,已不可能演變成具有時(shí)間突發(fā)性的熱點(diǎn)話題。為避免這種評(píng)價(jià)指標(biāo)的不足,受文獻(xiàn)[18]通過(guò)度加速度來(lái)描述在線社交網(wǎng)絡(luò)中某一突發(fā)過(guò)程鏈接創(chuàng)建率的啟發(fā),本文引入回復(fù)加速度的概念來(lái)識(shí)別和量化帖子熱度隨時(shí)間的變化特性:

        式中:a(xi)t為主貼xi的回復(fù)加速度;r(xi)t為主貼xi在時(shí)間t的回復(fù)數(shù);Δt為介于r(xi)t之間的時(shí)間粒度。同時(shí),為了有效標(biāo)示帖子生命周期的不同階段,定義狀態(tài)函數(shù)S(xi)t:R→{acc,growth,dec,death}進(jìn)行描述:

        式中:acc 和dec 對(duì)應(yīng)于帖子生命周期的突發(fā)和衰退階段,在這2 個(gè)階段,帖子的回復(fù)量急劇攀升(a(xi)>>0)或強(qiáng)烈衰減(a(xi)<<0);growth 對(duì)應(yīng)于帖子生命周期的成長(zhǎng)階段,在該階段帖子每天的回復(fù)數(shù)幾乎是恒定的(或在某一非零常量周圍振蕩);death 對(duì)應(yīng)于帖子生命周期的消亡階段,在該階段帖子回復(fù)數(shù)為0;θ1和θ2為預(yù)先設(shè)定的閾值;c(xi)t為常量0。

        通過(guò)對(duì)帖子的熱度度量和熱度隨時(shí)間變化特性的識(shí)別,不僅可以有效地過(guò)濾掉熱度較低或已處于衰退和消亡階段的帖子,保留處于加速或成長(zhǎng)階段的貼子,還可以對(duì)回復(fù)加速度急劇增加的帖子給予足夠的關(guān)注,而這些帖子往往容易發(fā)展成為突發(fā)性熱點(diǎn)話題。由去噪后保留下來(lái)的帖子建立主題集合ST={h1,h2,…,hm}。

        2.3 分詞

        如圖2 所示,論壇中若干個(gè)主題討論的可能是現(xiàn)實(shí)生活中的同一話題。在對(duì)主題進(jìn)行有效聚類之前,需要對(duì)主題進(jìn)行分詞,以抽取其中反映熱點(diǎn)話題主體特征的主題詞。與英文標(biāo)題不同,中文標(biāo)題是連續(xù)的,需要采用專業(yè)的中文分詞工具進(jìn)行處理。本文采用中科院ICTCIAS(Institute of Computing Technology,Chinese Lexical Analysis System)分詞系統(tǒng)進(jìn)行分詞,如“朝鮮今日宣布正計(jì)劃進(jìn)行第三次核試驗(yàn)”這一標(biāo)題,通過(guò)分詞可以得到如下分詞結(jié)果:朝鮮/n 今日/t宣布/v 正/d 計(jì)劃/v 進(jìn)行/v 第三/m 次/q 核試驗(yàn)/n,抽取其中的名詞和動(dòng)詞,并刪除重用詞,可以得到集合{朝鮮,宣布,計(jì)劃,進(jìn)行,核試驗(yàn)}。

        實(shí)際操作中,對(duì)集合ST中的每一元素hi分別進(jìn)行分詞處理,并建立集合hi={termj|1≤j≤n}。同時(shí),考慮到許多主題討論的話題是現(xiàn)實(shí)中的新事件,勢(shì)必其中會(huì)包含許多ICTCIAS詞庫(kù)沒(méi)有的新詞匯,如“房妹”,“房姐”等,在分詞之前需要手動(dòng)添加到ICTCIAS 詞庫(kù)中。

        2.4 突發(fā)性熱點(diǎn)話題發(fā)現(xiàn)

        由于論壇中的多個(gè)主題討論的可能是同一個(gè)熱點(diǎn)話題,所以,關(guān)于同一話題的集合中會(huì)包含有相同的主題詞。例如集合 h1,h2,h3,分詞以后為h1={term1,term2,term3,term4},h2={term2,term3},h1={term1,term2,term3}。定義2 個(gè)集合間的Jaccard系數(shù)作為它們的相似度:

        式中:hi,hj∈ ST。合并多個(gè)hi的算法如下:

        輸入:ST={h1,h2,…,hm}和預(yù)設(shè)閾值η。

        輸出:熱點(diǎn)話題集合H={H(hi)}。

        Step 1:初始化主題集合ST,分為m 個(gè)主題h1,h2,…,hm。

        Step 2:對(duì)于h1,h2,…,hm,選取max|hi|并且有sim(max|hi|,hj)≥η,加入到熱點(diǎn)話題集合H(hi)={hi,hj}中,否則轉(zhuǎn)入Step 3。

        Step 3:ST=ST-H(hi),迭代計(jì)算轉(zhuǎn)入Step 2,從ST中再次選擇最大max|hi|,直到集合ST為空。

        3 實(shí)驗(yàn)結(jié)果分析

        3.1 實(shí)驗(yàn)數(shù)據(jù)

        為了分析所提出的突發(fā)性熱點(diǎn)話題發(fā)現(xiàn)與跟蹤方法的效果,本文采用文獻(xiàn)[19]的Web 信息采集系統(tǒng)抓取的網(wǎng)易新聞?wù)搲?http://bbs.news.163.com)2011-03-01— 2011-05-01 間的數(shù)據(jù)集。數(shù)據(jù)的詳細(xì)描述如表1所示。

        我們事先對(duì)該數(shù)據(jù)集中的4 248 個(gè)帖子進(jìn)行人工標(biāo)注,這些帖子共包含2 716 個(gè)話題,并且有超過(guò)2 000個(gè)帖子是孤立的,而突發(fā)性熱點(diǎn)話題往往包含多個(gè)帖子。這說(shuō)明在網(wǎng)絡(luò)論壇中需要對(duì)突發(fā)話題進(jìn)行歸納與總結(jié),以方便用戶及時(shí)全面了解發(fā)生的突發(fā)事件以及與這些事件相關(guān)的事件,從而幫助用戶節(jié)約大量的瀏覽時(shí)間,同時(shí)提高瀏覽質(zhì)量。

        表1 實(shí)驗(yàn)數(shù)據(jù)集描述Table 1 Description of experimental data set

        3.2 實(shí)驗(yàn)結(jié)果分析

        根據(jù)表1 中的統(tǒng)計(jì)結(jié)果和式(1),對(duì)數(shù)據(jù)集中的4248 個(gè)主貼進(jìn)行熱度評(píng)分,得到如圖4 所示的主貼熱度時(shí)間分布圖,對(duì)應(yīng)圖中右上方區(qū)域即是所需要的熱帖,但這只是一個(gè)感性的認(rèn)識(shí),為了快速發(fā)現(xiàn)熱帖,需要通過(guò)量化手段對(duì)該圖進(jìn)行有效區(qū)域劃分。

        圖4 主貼熱度的時(shí)間分布圖Fig.4 Distribution of entry posts in time

        主貼要最終演變成突發(fā)性熱點(diǎn)話題,其對(duì)應(yīng)的回帖數(shù)的線性增長(zhǎng)是不夠的,一定要有“指數(shù)”級(jí)別的增長(zhǎng),即回帖數(shù)與突發(fā)性熱點(diǎn)話題的關(guān)系是指數(shù)關(guān)系而非線性關(guān)系。所以,取主貼回復(fù)數(shù)與主貼平均回復(fù)數(shù)比值的對(duì)數(shù)即lg(r(xi)/avgr(X))作為橫坐標(biāo),得到如圖5所示的主貼熱度分布圖。

        圖5 主貼熱度在lg(r(xi)/avgr(X))上的分布Fig.5 Distribution of entry posts in lg(r(xi)/avgr(X))

        利用閾值Vhotness>0.431 8(主貼平均熱度值),lg(r (xi)/avgr(X))>1來(lái)發(fā)現(xiàn)熱帖,結(jié)果如圖5 所示。其中在2 條虛線構(gòu)成的4 個(gè)區(qū)間中,右上角的區(qū)間即是需要的熱帖。通過(guò)閾值選擇的熱帖數(shù)目有406 個(gè)。

        在熱帖突發(fā)性特征的判斷上,為了確定式(5)的臨界閾值,以這一時(shí)間區(qū)間發(fā)生的“藥家鑫”事件為例,從上述406 個(gè)熱帖中提取出與此主題相關(guān)的具有突發(fā)性特征的主貼共計(jì)6 個(gè)。由于“藥家鑫”事件本身是該時(shí)間區(qū)間的熱點(diǎn)事件,所以,以此作為訓(xùn)練樣本具有較高的可信度。實(shí)驗(yàn)中,令Δt=1 并隨機(jī)向樣本中添加7 個(gè)與此主題無(wú)關(guān)的突發(fā)性熱帖,根據(jù)不同的閾值進(jìn)行7 組實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如圖6 所示。

        圖6 不同閾值下的突發(fā)性熱帖發(fā)現(xiàn)效果Fig.6 Detection for bursty hot posts under different thresholds

        從圖6 可以看出:當(dāng)θ1=30 時(shí),召回率、精確率以及F1均較高。所以在計(jì)算回復(fù)加速度時(shí),取閾值θ1=30。依據(jù)式(4)和(5)統(tǒng)計(jì)上述406 個(gè)熱帖在各時(shí)間節(jié)點(diǎn)上的回復(fù)加速度,并移除不在預(yù)定閾值范圍內(nèi)的熱帖。通過(guò)主貼回復(fù)加速度閾值的選擇,確定具有突發(fā)性特征的主貼有11 個(gè)。這表明通過(guò)對(duì)候選話題集進(jìn)行噪音過(guò)濾以后,原本需要處理的4 248 個(gè)帖子,現(xiàn)在只需要處理11 個(gè)帖子。這種過(guò)濾方法不僅減小了發(fā)現(xiàn)算法的復(fù)雜度,同時(shí)也提高了發(fā)現(xiàn)算法的準(zhǔn)確率。對(duì)應(yīng)的11 個(gè)主貼的回復(fù)加速度變化情況如圖7 所示。

        對(duì)上述11 個(gè)主貼標(biāo)題進(jìn)行分詞并采用2.3 節(jié)的聚類算法進(jìn)行標(biāo)題合并,得到的結(jié)果如表2 所示。

        在突發(fā)性熱點(diǎn)話題跟蹤方面,以“藥家鑫”突發(fā)性熱點(diǎn)話題為例,統(tǒng)計(jì)6 個(gè)對(duì)應(yīng)主貼在各個(gè)時(shí)間點(diǎn)上的回復(fù)加速度,計(jì)算其平均值,繪制如圖8 所示的平均回復(fù)加速度變化曲線。通過(guò)與實(shí)際事件的發(fā)展進(jìn)程進(jìn)行比對(duì),表明其跟蹤效果與實(shí)際事件發(fā)展基本吻合。

        圖7 突發(fā)性熱帖加速度時(shí)間變化圖Fig.7 Reply acceleration of hot posts changing over time

        表2 突發(fā)性熱點(diǎn)話題Table 2 Bursty topics

        圖8 “藥家鑫”事件突發(fā)性熱點(diǎn)話題發(fā)現(xiàn)與跟蹤Fig.8 Detection and tracking for “YAO Jiaxin” event

        4 結(jié)論

        (1) 在網(wǎng)絡(luò)論壇突發(fā)性熱點(diǎn)話題研究中,提出了一種能快速發(fā)現(xiàn)并跟蹤突發(fā)性熱點(diǎn)話題的方法。該方法主要有以下特點(diǎn):與以往的突發(fā)性熱點(diǎn)話題發(fā)現(xiàn)與跟蹤方法相比,該方法基于逐步求精的策略,在運(yùn)行具體的發(fā)現(xiàn)與跟蹤算法之前,首先對(duì)論壇數(shù)據(jù)進(jìn)行過(guò)濾以移除大量與主題無(wú)關(guān)的數(shù)據(jù);為了提高發(fā)現(xiàn)精度并描述帖子的時(shí)變特性,將演化理論引入發(fā)現(xiàn)方法中;引入帖子回復(fù)加速度的概念來(lái)識(shí)別和量化帖子熱度隨時(shí)間的變化特性。

        (2) 該方法在不進(jìn)行語(yǔ)義分析和復(fù)雜網(wǎng)絡(luò)構(gòu)建的條件下,可以對(duì)網(wǎng)絡(luò)論壇中的突發(fā)性熱點(diǎn)話題進(jìn)行快速識(shí)別和有效跟蹤。

        [1] 陳友, 程學(xué)旗, 楊森. 面向網(wǎng)絡(luò)論壇的高質(zhì)量主題發(fā)現(xiàn)[J]. 軟件學(xué)報(bào), 2011, 22(8): 1785-1804.CHEN You, CHENG Xueqi, YANG Sen. Finding high quality threads in web forums[J]. Journal of Software, 2011, 22(8):1785-1804.

        [2] 席耀一, 林琛, 李弼程, 等. 基于語(yǔ)義相似度的論壇話題追蹤方法[J]. 計(jì)算機(jī)應(yīng)用, 2011, 31(1): 93-97.XI Yaoyi, LIN Chen, LI Bicheng, et al. Method for BBS topic tracking based on semantic similarity[J]. Journal of Computer Applications, 2011, 31(1): 93-97.

        [3] 薛峰, 周亞?wèn)|, 高峰, 等. 一種突發(fā)性熱點(diǎn)話題在線發(fā)現(xiàn)與跟蹤方法[J]. 西安交通大學(xué)學(xué)報(bào), 2011, 45(12): 64-69.XUE Feng, ZHOU Yadong, GAO Feng, et al. An online detection and tracking method for bursty topics[J]. Journal of Xi’an Jiaotong University, 2011, 45(12): 64-69.

        [4] MA Huifang. Hot topic extraction using time window[C]//IEEE International conference on machine learning and cybernetics(ICMLC). Guilin, China, 2011: 56-60.

        [5] 邱云飛, 程亮. 微博突發(fā)話題檢測(cè)方法研究[J]. 計(jì)算機(jī)工程,2012, 38(9): 288-290.QIU Yunfei, CHENG Liang. Research on sudden topic detection method for microblog[J]. Computer Engineering, 2012, 38(9):288-290.

        [6] 吳渝, 楊濤, 肖開(kāi)洲. BBS 突發(fā)輿情分析及基于小世界網(wǎng)絡(luò)的預(yù)測(cè)模型[J]. 重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版), 2010, 22(3):350-354.WU Yu, YANG Tao, XIAO Kaizhou. Analysis of emergent BBS sentimentandits prediction model based on small world network[J]. Journal 0f Chongqing University of Posts and Telecommunications (Natural Science Edition), 2010, 22(3):350-354.

        [7] LIU Zheng, Yu J X. Discovering burst areas in fast evolving graphs[C]//The 15th International Conference on Database Systems for Advanced Applications (DASFAA). Tsukuba, Japan,2010: 171-185.

        [8] 王林, 戴冠中. 基于復(fù)雜網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)的論壇熱點(diǎn)主題發(fā)現(xiàn)[J]. 計(jì)算機(jī)工程, 2008, 34(11): 214-216, 224.WANG Lin, DAI Guanzhong. Forum Hot topic detection based on community structure of complex networks[J]. Computer Engineering, 2008, 34(11): 214-216, 224.

        [9] 莊經(jīng)緯. 基于社會(huì)網(wǎng)絡(luò)分析方法和數(shù)據(jù)挖掘方法的網(wǎng)絡(luò)論壇定量分析[D]. 重慶: 重慶大學(xué)經(jīng)濟(jì)與工商管理學(xué)院, 2010:36-41.ZHUANG Jingwei. The quantitative analysis of BBS based on social network analysis and data mining[D]. Chongqing:Chongqing University. College of Economics and Business Administration, 2010: 36-41.

        [10] Saito K, Ohara K, Kimura M, et al. Burst detection in a sequence of tweets based on information diffusion model[C]//The 15th International Conference on Discovery Science. Lyon, France,2012: 239-253.

        [11] ZHU Mingliang, HU Weiming, WU Ou. Topic detection and tracking for threaded discussion communities[C]//2008 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology. Sydney, Australia, 2008:77-83.

        [12] 姚曉娜. BBS 熱點(diǎn)話題挖掘與觀點(diǎn)分析[D]. 大連: 大連海事大學(xué)信息科學(xué)技術(shù)學(xué)院, 2008: 36.YAO Xiaona. Hot topic mining and opinion analysis on BBS[D].Dalian: Dalian Maritime University. Information Science and Technology College, 2008: 36.

        [13] 劉驊, 朱慶華. 基于標(biāo)題的BBS 熱點(diǎn)話題挖掘—以南京大學(xué)小百合BBS 為例[J]. 現(xiàn)代情報(bào), 2013, 33(1): 162-166.LIU Hua, Zhu Qinghua. Hot topic mining based on titles in BBS-Taking lily BBS in Nanjing University as an example[J].Journal of Modern Information, 2013, 33(1): 162-166.

        [14] 祝華新, 單學(xué)剛, 胡江春. 2011 年中國(guó)互聯(lián)網(wǎng)輿情分析報(bào)告[EB/OL]. http://yuqing.people.com.cn/n/2012/0727/c209170-18615551.html, 2012-07-07.ZHU Huaxin, SHAN Xuegang, HU Jiangchun. Report of 2011 China Internet public opinion analysis[EB/OL]. http://yuqing.people.com.cn/n/2012/0727/c209170-18615551.html, 2012-07-07.

        [15] 焦超. 網(wǎng)絡(luò)突發(fā)事件推手檢測(cè)與熱點(diǎn)預(yù)測(cè)研究[D]. 上海:上海交通大學(xué)信息安全工程學(xué)院, 2012: 14.JIAO Chao. Research on drive force detect and heat forecast of network emergency[D]. Shanghai Jiao Tong University. School of Information Security Engineering, 2012: 14.

        [16] 盧珺珈, 張宏莉, 張玥. 基于BBS 的熱點(diǎn)話題發(fā)現(xiàn)與態(tài)勢(shì)預(yù)測(cè)技術(shù)的研究[J]. 智能計(jì)算機(jī)與應(yīng)用, 2012, 2(2): 1-5.LU Junjia, ZHANG Hongli, ZHANG Yue. Research on the technology of hot topics foundation and trend forecast in BBS[J].Intelligent Computer and Applications, 2012, 2(2): 1-5.

        [17] Chen C C, Chen Y T, Sun Y, et al. Life cycle modeling of news events using aging theory[C]//The 14th European Conference on Machine Learning(ECML). Cavtat-Dubrovnik, Croatia, 2003:47-59.

        [18] Gaito S, Zignani M, Rossi G P, et al. On the bursty evolution of online social networks[C]//ACM International Workshop on Hot Topics on Interdisciplinary Social Networks Research (Hot Social). New York, USA, 2012: 1-8.

        [19] 彭冬, 蔡皖東. 面向Web 論壇的網(wǎng)絡(luò)信息獲取技術(shù)及系統(tǒng)實(shí)現(xiàn)[J]. 計(jì)算機(jī)工程與科學(xué), 2011, 33(1): 157-160.PENG Dong, CAI Wandong. The web forum crawling technology and system implementation[J]. Computer Engineering and Science, 2011, 33(1): 157-160.

        亚洲精品黑牛一区二区三区| 亚洲av永久无码精品成人| 久久精品国产亚洲5555| 污污污国产免费网站| 久久国产精品精品国产色| 最近更新中文字幕一区二区| 精品国产乱码久久久久久郑州公司| 狠狠色婷婷久久一区二区三区| 军人粗大的内捧猛烈进出视频| 亚洲狠狠婷婷综合久久| 男女一级毛片免费视频看| 久久伊人中文字幕有码久久国产 | 欧美亚洲尤物久久综合精品| 91乱码亚洲精品中文字幕| 久久精品国产99久久无毒不卡| 国产美女精品一区二区三区| 97成人碰碰久久人人超级碰oo| 中文字幕久久久久人妻无码| 美腿丝袜一区在线观看| 亚洲综合极品美女av| 亚洲精品无码av人在线观看| 强行无套内谢大学生初次| 无码国产精品一区二区vr老人 | 天堂国精产品2023年| 久久久久久久无码高潮| 欧美成人网视频| 91精品国产91综合久久蜜臀| 最近2019年好看中文字幕视频 | 果冻国产一区二区三区 | 欧美成人国产精品高潮| 最新国产av无码专区亚洲| 在线人妻无码一区二区| 成人在线视频亚洲国产| 欧美性白人极品1819hd| 69一区二三区好的精华| 夜夜爽一区二区三区精品| 精品久久久久久99人妻| 日本久久久免费观看视频| 午夜福利院电影| 亚洲精品成人av观看| 国产自拍av在线观看|