亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        網(wǎng)絡(luò)熱點(diǎn)事件跟蹤技術(shù)研究

        2016-03-12 06:36:59
        關(guān)鍵詞:增量熱點(diǎn)輿情

        陳 楠

        (安徽大學(xué)藝術(shù)與傳媒學(xué)院,安徽 合肥 230000)

        網(wǎng)絡(luò)熱點(diǎn)事件跟蹤技術(shù)研究

        陳 楠

        (安徽大學(xué)藝術(shù)與傳媒學(xué)院,安徽 合肥 230000)

        對(duì)于網(wǎng)絡(luò)上發(fā)生的事件,我們可以選取一些樣本,既定的公式進(jìn)行主題追蹤,以此來(lái)進(jìn)行文本的計(jì)算與學(xué)習(xí),利用增量聚類算法,從而發(fā)現(xiàn)并確定網(wǎng)絡(luò)熱點(diǎn)問(wèn)題,并對(duì)其進(jìn)行跟蹤與處理。

        熱點(diǎn)事件;增量聚類算法;跟蹤技術(shù)

        “熱點(diǎn)發(fā)現(xiàn)”主要針對(duì)的是以前未知的熱點(diǎn),實(shí)際上,熱點(diǎn)發(fā)現(xiàn)的過(guò)程是聚類過(guò)程,而聚類的過(guò)程與方法是多種多樣的?!霸掝}追蹤”主要針對(duì)的是已知話題,對(duì)與其相關(guān)的事件進(jìn)行全面追蹤,而這一過(guò)程實(shí)際上是分類過(guò)程。在網(wǎng)絡(luò)輿情分析中,熱點(diǎn)發(fā)現(xiàn)與事件跟蹤是最核心的兩個(gè)功能,因此,本文對(duì)其進(jìn)行重點(diǎn)研究。

        1 熱點(diǎn)發(fā)現(xiàn)技術(shù)

        熱點(diǎn)事件的發(fā)現(xiàn)實(shí)際上就是將輿情事件放入到網(wǎng)絡(luò)中,通過(guò)對(duì)網(wǎng)站內(nèi)信息進(jìn)行主題檢測(cè)而完成自動(dòng)抓取[1]。通常情況下,用于事件檢測(cè)的網(wǎng)站主要有以下三種:其一,以人民網(wǎng)為代表的主流新聞網(wǎng)站;其二,以新浪網(wǎng)為代表的大型商業(yè)網(wǎng)站;其三,以BBS為代表的網(wǎng)絡(luò)社區(qū)。

        1.1 輿情事件的類型

        輿情事件可以大致分為以下四種類型:第一,新事件;第二,突發(fā)事件;第三和第四分別為熱點(diǎn)事件與焦點(diǎn)事件,兩者之間有一定的共同之處,因此放在一起論述。

        1.2 增量聚類算法

        一般而言,輿情分析系統(tǒng)獲取信息的方式通常是定期更新,在數(shù)據(jù)更新完成以后,以原情況為基礎(chǔ)的相關(guān)狀態(tài)也需要進(jìn)行更新。普遍運(yùn)用以下兩種方法來(lái)解決:其一,在更新以后的數(shù)據(jù)集上再次運(yùn)用聚類算法;其二,針對(duì)更新完成以后的新增數(shù)據(jù),可以運(yùn)用增量式算法進(jìn)行挖掘與更新[2]。在話題檢測(cè)與跟蹤測(cè)評(píng)過(guò)程中,一般運(yùn)用Single-pass增量聚類法來(lái)實(shí)現(xiàn)檢測(cè)功能。

        2 事件跟蹤技術(shù)

        2.1 事件跟蹤技術(shù)的數(shù)學(xué)表達(dá)

        進(jìn)行事件跟蹤的主要目標(biāo)是日益變化的信息流,對(duì)一個(gè)既定的主題事件進(jìn)行追蹤,從而發(fā)現(xiàn)與該主題時(shí)間相關(guān)的全部信息。從定義上描述,時(shí)間跟蹤便是在依托于既定的追蹤體系,從文本內(nèi)容出發(fā),將與其相關(guān)的所有內(nèi)容全部自動(dòng)確定下來(lái)。從數(shù)學(xué)層面上看,事件追蹤實(shí)際上是一個(gè)映射過(guò)程,時(shí)間追蹤以既定主題為標(biāo)準(zhǔn),將未注明主題的文檔對(duì)既定主題進(jìn)行映射,這種映射過(guò)程可以是一對(duì)一的,也可以是一對(duì)多的,其原因在于一個(gè)未標(biāo)明主題的文檔可以同時(shí)關(guān)聯(lián)多個(gè)主題。用數(shù)學(xué)公式進(jìn)行表示為:f:A→B,該式中,A所表示的是將要對(duì)其進(jìn)行追蹤的文本;B所表示的是追蹤體系中既定的主題。

        進(jìn)行主題追蹤需要遵循一定的映射規(guī)則,系統(tǒng)以主題所提供的典型樣本為追蹤信息,對(duì)追蹤的規(guī)律性進(jìn)行總結(jié),從而構(gòu)建起與之相對(duì)應(yīng)的判別規(guī)則以及公式,當(dāng)遇到一個(gè)為表明主題的文本時(shí),就可以依照已經(jīng)構(gòu)建起來(lái)的判別規(guī)則,對(duì)文本進(jìn)行相關(guān)主題的確定。

        2.2 事件跟蹤技術(shù)的分類算法

        與傳統(tǒng)分類算法相比,事件跟蹤技術(shù)的分類算法更有優(yōu)勢(shì),可以將其看成是一種文本分類技術(shù),需要遵循以下三方面約束條件:第一,進(jìn)行訓(xùn)練的樣本必須是與既定主題有聯(lián)系的報(bào)道;第二,針對(duì)既定主題,如果產(chǎn)生了新的新聞文本,跟蹤系統(tǒng)會(huì)針對(duì)這一文本給出一個(gè)肯定/否定的追蹤判定;第三,在訓(xùn)練一個(gè)既定主題學(xué)習(xí)的過(guò)程中,系統(tǒng)會(huì)對(duì)其他無(wú)關(guān)的事件主題默認(rèn)未知。

        事件跟蹤的核心理念是:由人工選取一些報(bào)道當(dāng)做訓(xùn)練樣本,運(yùn)用既定的公式進(jìn)行主題追蹤,以此來(lái)進(jìn)行文本的計(jì)算與學(xué)習(xí)。如果出現(xiàn)新的數(shù)據(jù),需要以計(jì)算公式為基礎(chǔ)對(duì)新數(shù)據(jù)的分?jǐn)?shù)進(jìn)行計(jì)算,以事先設(shè)定好的閾值為依托,如果計(jì)算出來(lái)的分?jǐn)?shù)比閾值大,便可以將該報(bào)道判定為與主題相關(guān),也就是肯定判定;如果計(jì)算出來(lái)的分?jǐn)?shù)比閾值小,便可以將該報(bào)道判定為與主題不相關(guān),也就是否定判定。

        2.3 1-NN增量分類算法

        1-NN增量分類算法是一種比較常用的時(shí)間跟蹤算法,具體的思想有以下四個(gè)方面:

        第一,選擇初始樣本。當(dāng)前的主題追蹤系統(tǒng)在訓(xùn)練樣本方面普遍是由用戶提供的,一般一到四篇不等,因?yàn)榇嬖谌藶楦深A(yù),樣本也會(huì)出現(xiàn)質(zhì)量的不同,這會(huì)對(duì)跟蹤效果產(chǎn)生很大影響。如果系統(tǒng)中存在事件發(fā)現(xiàn)這一功能,無(wú)論既定主題還是訓(xùn)練樣本便可以通過(guò)系統(tǒng)直接給出,但這樣一來(lái)樣本中的主題就有可能會(huì)轉(zhuǎn)移,出現(xiàn)多個(gè)跟蹤中心。

        第二,初次訓(xùn)練。傳統(tǒng)的計(jì)算方法一般運(yùn)用的是余弦相似度方法,對(duì)任意一對(duì)樣本進(jìn)行相似度計(jì)算,通過(guò)計(jì)算所有樣本的相似度平均值而獲取該樣本的分?jǐn)?shù)。因?yàn)殡S機(jī)樣本具有很大的不確定性,有可能會(huì)出現(xiàn)一些樣本之間相似度較高的情況,因此需要將一些重復(fù)樣本淘汰,保留與主題核心內(nèi)容相關(guān)的樣本,這樣可以在提升樣本質(zhì)量的基礎(chǔ)上,使分類準(zhǔn)確率得到一定程度的提升,還減少了相似度比對(duì)的次數(shù)。

        3 輿情態(tài)勢(shì)與預(yù)警技術(shù)

        3.1 影響輿情的因素

        現(xiàn)階段,分析輿情態(tài)勢(shì)的主要技術(shù)都是通過(guò)對(duì)話題熱度的簡(jiǎn)單統(tǒng)計(jì),再運(yùn)用概率理論進(jìn)行復(fù)雜性分析,這種方法沒(méi)有針對(duì)輿情本身進(jìn)行深入研究。主題檢測(cè)與跟蹤技術(shù)雖然可以通過(guò)自動(dòng)聚類對(duì)社會(huì)熱點(diǎn)與焦點(diǎn)內(nèi)容進(jìn)行追蹤,但分析模式還只局限于熱點(diǎn)與焦點(diǎn),很難進(jìn)行深化。

        大體上看,可以從微觀角度與宏觀角度對(duì)輿情態(tài)勢(shì)進(jìn)行分析。從微觀角度看,對(duì)輿情態(tài)勢(shì)造成影響的主要因數(shù)有:文章數(shù)量、參與人數(shù)、發(fā)言頻次、點(diǎn)擊率、回帖率、時(shí)間因子、話題內(nèi)聚度等;從宏觀角度看,輿情重要程度主要運(yùn)用熱點(diǎn)與焦點(diǎn)進(jìn)行判斷,從深度分析的層面上看,影響輿情的主要因素還包括敏點(diǎn)、疑點(diǎn)、重點(diǎn)、難點(diǎn)、拐點(diǎn)等。根本上講,輿情態(tài)勢(shì)的宏觀方面是以若干個(gè)微觀方面為基礎(chǔ)產(chǎn)生的。因此,在輿情態(tài)勢(shì)的未來(lái)研究方向中,將會(huì)與多點(diǎn)關(guān)聯(lián)分析技術(shù)為主。

        3.2 預(yù)警技術(shù)模型

        突發(fā)事件最受重視的時(shí)期便是出現(xiàn)初期,這一時(shí)期對(duì)事件的關(guān)注人數(shù)與參與人數(shù)都會(huì)呈幾何方式倍增,網(wǎng)民的意見(jiàn)也最為活躍,但與此同時(shí),這一時(shí)期也是網(wǎng)民情緒變化與積累比較頻繁的時(shí)期,需要特別關(guān)注與引導(dǎo)。所以,調(diào)查熱點(diǎn)信息討論時(shí)間是非常有必要的,對(duì)主要的活躍事件進(jìn)行實(shí)時(shí)的趨勢(shì)分析,還需要制定出有針對(duì)性的預(yù)警機(jī)制。

        4 結(jié)論

        本文主要對(duì)熱點(diǎn)發(fā)現(xiàn)技術(shù)、事件跟蹤技術(shù)以及輿情態(tài)勢(shì)與預(yù)警技術(shù)進(jìn)行了分析。在熱點(diǎn)發(fā)現(xiàn)技術(shù)中運(yùn)用了增量聚類算法,提升了聚類結(jié)果的準(zhǔn)確率;事件法跟蹤技術(shù)中運(yùn)用可1-NN增量分類算法,解決了主題轉(zhuǎn)移問(wèn)題;預(yù)警技術(shù)中運(yùn)用了 ARMA為基礎(chǔ)的單因素預(yù)測(cè)與多元線性回歸相結(jié)合的預(yù)警模型,提升了預(yù)警效果。

        [1]余品銳,劉天楨.基于GARCH模型的網(wǎng)絡(luò)新聞與輿情的波動(dòng)性分析[J].計(jì)算機(jī)與現(xiàn)代化.2010.06(11):176-178.

        [2]邱立坤,龍志祎,程葳等.層次化話題發(fā)現(xiàn)與跟蹤方法及系統(tǒng)實(shí)現(xiàn)[J].廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版).2014.14(07):125-126.

        Research on tracking technology of network hot spots

        CHEN Nan
        (Anhui university of art and media institute,Hefei Anhui 230000)

        For events on the Internet,we can choose some samples,topic tracking,for given formula to calculate and study of the text,using the incremental clustering algorithm,to find and identify network hot spots,and carries on the track.

        Hot issues; Incremental clustering algorithm; Tracking technology

        :A

        10.3969/j.issn.1672-7304.2016.01.062

        1672–7304(2016)01–0133–02

        課題《大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)輿情監(jiān)測(cè)與預(yù)測(cè)研究》2015年安徽省高校人文社科研究一般項(xiàng)目。

        (責(zé)任編輯:吳 芳)

        陳楠(1981-)女,安徽蕪湖人,講師,研究方向:傳媒科技。

        猜你喜歡
        增量熱點(diǎn)輿情
        熱點(diǎn)
        提質(zhì)和增量之間的“辯證”
        “價(jià)增量減”型應(yīng)用題點(diǎn)撥
        熱點(diǎn)
        車迷(2019年10期)2019-06-24 05:43:28
        結(jié)合熱點(diǎn)做演講
        輿情
        基于均衡增量近鄰查詢的位置隱私保護(hù)方法
        輿情
        輿情
        德州儀器(TI)發(fā)布了一對(duì)32位增量-累加模數(shù)轉(zhuǎn)換器(ADC):ADS1262和ADS126
        日本免费视频| 国产日产久久福利精品一区| 91热久久免费频精品99| 久草青青91在线播放| 少妇人妻陈艳和黑人教练| 在线成人福利| av免费一区在线播放| 中文字幕av高清人妻| 午夜无码伦费影视在线观看| 国产一区a| 一区二区三区少妇熟女高潮| 人妻少妇进入猛烈时中文字幕| 国产精品亚洲欧美大片在线看| 日子2020一区二区免费视频| 国产精品成人黄色大片| 免费人成视频网站网址| 久久无码专区国产精品s| 欧美国产亚洲精品成人a v| 久久国产精品免费久久久| 80s国产成年女人毛片| 亚洲精品综合一区二区| 欧美日韩a级a| 久久一区二区av毛片国产| 欧美69久成人做爰视频| 无码中文字幕色专区| 性感人妻中文字幕在线| 色吧噜噜一区二区三区| 精品国模一区二区三区| 亚洲中文字幕巨乳人妻| 激情亚洲不卡一区二区| 日本午夜精品一区二区三区电影| 正在播放一区| 区三区久久精品水蜜桃av| 久久天天躁夜夜躁狠狠85麻豆| 1区2区3区高清视频| 久久丁香花综合狼人| 国产精品国产自产自拍高清av| 亚洲码国产精品高潮在线| 激情人妻在线视频| 女主播啪啪大秀免费观看| 情人伊人久久综合亚洲|