亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向網(wǎng)絡(luò)輿情監(jiān)控的熱點(diǎn)話題發(fā)現(xiàn)技術(shù)研究

        2020-12-10 06:46:15崇陽(yáng)
        公關(guān)世界 2020年22期

        崇陽(yáng)

        摘要:隨著我國(guó)科學(xué)技術(shù)的不斷發(fā)展,互聯(lián)網(wǎng)信息技術(shù)也得到了飛速的發(fā)展和進(jìn)步,我國(guó)的網(wǎng)民的數(shù)量直線上升,互聯(lián)網(wǎng)的相關(guān)資源,如新聞、視頻、論壇、課程等正在呈現(xiàn)飛速的增長(zhǎng),網(wǎng)絡(luò)在人們的正常生活中展現(xiàn)著很多的優(yōu)勢(shì),例如傳達(dá)社情民意,已經(jīng)成為傳統(tǒng)的主流媒體形式之后的主要地位,承載著反應(yīng)社會(huì)輿情的主要責(zé)任,在反應(yīng)社會(huì)輿情方面正在發(fā)揮著極其重要的作用。本文就互聯(lián)網(wǎng)入手,簡(jiǎn)單談?wù)劸W(wǎng)絡(luò)輿情與監(jiān)控的相關(guān)概述和意義,并提出幾種熱點(diǎn)話題發(fā)現(xiàn)的技術(shù),以期為能夠更好的管理互聯(lián)網(wǎng)的秩序和安全提供一定的幫助。

        關(guān)鍵詞:網(wǎng)絡(luò)輿情監(jiān)控 熱點(diǎn)話題 發(fā)現(xiàn)技術(shù)研究

        引言

        隨著我國(guó)社會(huì)經(jīng)濟(jì)與科學(xué)技術(shù)的不斷發(fā)展,互聯(lián)網(wǎng)的發(fā)展也十分迅速,國(guó)民對(duì)于網(wǎng)絡(luò)也越來越依賴,網(wǎng)絡(luò)已經(jīng)逐漸形成了自己的特有文化,也產(chǎn)生了一定的網(wǎng)絡(luò)輿論,輿論演化的形式也從純粹的的人類社會(huì)網(wǎng)絡(luò)演化成為向以人為主、人類與機(jī)器結(jié)合,形成了一個(gè)十分雜亂的網(wǎng)絡(luò)系統(tǒng)。但是在實(shí)際的網(wǎng)絡(luò)運(yùn)行過程中,網(wǎng)絡(luò)的引入也會(huì)加速網(wǎng)絡(luò)輿情在人們之間的傳播,并且正在突破原有儀器和技術(shù)的限制,傳播的范圍更加廣泛,速度更加快。因此,如果相關(guān)的部門和工作人員不能對(duì)這些輿情進(jìn)行有效的管理和監(jiān)控,不利的網(wǎng)絡(luò)話題和輿情會(huì)對(duì)正常的社會(huì)秩序出現(xiàn)一定的影響。

        1.網(wǎng)絡(luò)輿情的相關(guān)概述

        網(wǎng)絡(luò)輿情,即針對(duì)網(wǎng)絡(luò)中出現(xiàn)的反應(yīng)現(xiàn)實(shí)生活中的具有偏向性和針對(duì)性的觀點(diǎn)和相關(guān)的言論,國(guó)民對(duì)其進(jìn)行關(guān)注和討論并且已經(jīng)成為熱點(diǎn)話題的相關(guān)言論。網(wǎng)絡(luò)輿情涉及到的范圍比較廣泛,但是對(duì)社會(huì)熱點(diǎn)問題的關(guān)注還是十分集中的,這種關(guān)注度比較集中的實(shí)踐就稱為話題。在網(wǎng)絡(luò)飛速發(fā)展的情況下,網(wǎng)絡(luò)輿情涉及到的熱點(diǎn)話題在很短時(shí)間內(nèi)發(fā)生,也會(huì)快速地隨著時(shí)間的發(fā)展被新的話題壓下來,就發(fā)生在某特定的時(shí)間、地點(diǎn),可能是一場(chǎng)活動(dòng)、一場(chǎng)比賽等由一個(gè)核心事件或活動(dòng)和與之相關(guān)的事件和活動(dòng)。

        2.網(wǎng)絡(luò)輿情監(jiān)控的必要性

        網(wǎng)絡(luò)環(huán)境具有一定的復(fù)雜性,主要表現(xiàn)在兩個(gè)方面,首先第一個(gè)方面,隨著我國(guó)互聯(lián)網(wǎng)的不斷發(fā)展,國(guó)民對(duì)于互聯(lián)網(wǎng)越來越依賴,在網(wǎng)絡(luò)上對(duì)于網(wǎng)民發(fā)表和討論的社會(huì)中的某些事件中,會(huì)有大量的言論和看法的表達(dá),甚至?xí)苿?dòng)著網(wǎng)絡(luò)輿情的風(fēng)向發(fā)展,也在很大程度上影響著社會(huì)輿論的演化和發(fā)展;在另一方面,互聯(lián)網(wǎng)的發(fā)展十分迅速,已經(jīng)深入國(guó)民的正常的生活和工作中,但是互聯(lián)網(wǎng)在發(fā)展過程中不可避免的會(huì)出現(xiàn)雜亂無章,虛擬性很強(qiáng),很多違法的東西隱蔽在其中,難以完全進(jìn)行監(jiān)管,使得很多時(shí)候網(wǎng)絡(luò)上一直不可避免的摻雜著正面和負(fù)面的言論,一些負(fù)面的話題甚至?xí)?yán)重影響到我國(guó)的正常的社會(huì)安全。很多犯罪分子往往會(huì)利用網(wǎng)絡(luò)針對(duì)國(guó)民傳播虛假的信息,誤導(dǎo)輿論走向,更有甚者為了分裂我國(guó),擴(kuò)散一些反動(dòng)的評(píng)論或話題。因此,針對(duì)網(wǎng)絡(luò)輿情進(jìn)行監(jiān)控和管理是十分必要的。

        另外,傳統(tǒng)的輿情監(jiān)控系統(tǒng)在處理網(wǎng)絡(luò)輿情的時(shí)候,如果在管理過程中發(fā)現(xiàn)違規(guī)的內(nèi)容或者敏感問題或者言論的話,直接采取對(duì)言論刪除,對(duì)用戶進(jìn)行強(qiáng)行注銷,甚至拉入黑名單,避免這些言論對(duì)社會(huì)和公共事業(yè)造成嚴(yán)重的影響。但是上述已經(jīng)談到,互聯(lián)網(wǎng)是具有很強(qiáng)的隱蔽性和復(fù)雜性的,采用傳統(tǒng)的輿情監(jiān)控技術(shù)在工作效率方面還是有很多的不足的。首先,網(wǎng)絡(luò)上的東西很復(fù)雜,紛亂無章,即使網(wǎng)站中的大量網(wǎng)頁(yè)經(jīng)過輿情系統(tǒng)處理之后,話題出現(xiàn)的速度還是很快,敏感問題等很難進(jìn)行逐一的排查和監(jiān)控,網(wǎng)絡(luò)用戶還是經(jīng)常會(huì)被這些大量的信息給迷惑,分散了精力和注意力;另外,很多時(shí)候,關(guān)于同一事件會(huì)同時(shí)又很多網(wǎng)站的若干網(wǎng)頁(yè)進(jìn)行同時(shí)講述,報(bào)道不斷的更新,很容易造成紛亂的現(xiàn)象,這樣的話就會(huì)穿插著雜亂無序的和不相關(guān)的報(bào)道,不利于相關(guān)部門對(duì)事件進(jìn)行集中處理和考量;最后,在輿情事件大量的擺在用戶面前,系統(tǒng)中不能及時(shí)對(duì)輿情事件的重要程度進(jìn)行度量化,對(duì)于十分緊急的輿情信息不能與一般重要程度的信息有明顯的的區(qū)分,顯得信息輕重不明,對(duì)于重要程度高的,影響力強(qiáng)的事件不能及時(shí)分散相關(guān)的精力和時(shí)間,不能很好的控制輿情態(tài)勢(shì)。

        3.熱點(diǎn)話題發(fā)現(xiàn)的相關(guān)技術(shù)研究

        3.1 經(jīng)典 single-pass 算法

        熱點(diǎn)話題發(fā)現(xiàn)與話題追蹤的技術(shù)研究簡(jiǎn)稱為TDT評(píng)測(cè),是最原始公開和通用的話題發(fā)現(xiàn)與追蹤的技術(shù)之一,具有良好的作用。在使用過程中根據(jù)發(fā)生的事件對(duì)文本信息進(jìn)行相關(guān)的語(yǔ)言組織和分析,然后檢驗(yàn)各種聚類和分類算法的功能和性能。Single-Pass算法就是TDT評(píng)測(cè)中使用最多的算法。該算法計(jì)算方式簡(jiǎn)單,運(yùn)算速度相對(duì)比較快,根據(jù)這樣的優(yōu)勢(shì),該算法比較適用于大數(shù)據(jù)量的應(yīng)用或者動(dòng)態(tài)的數(shù)據(jù)源,并且在計(jì)算過程中可以保證具有良好的聚類精度;對(duì)于以向量空間模型的高維度文本來說,該計(jì)算方法也能夠處理一些高維的數(shù)據(jù),另外,對(duì)于網(wǎng)絡(luò)新聞報(bào)道的大數(shù)量的及時(shí)性新聞對(duì)于算法提出的相關(guān)的要求該算法也是具有優(yōu)勢(shì)的。但是特殊的一點(diǎn)就是當(dāng)算法對(duì)相關(guān)語(yǔ)料輸入的順序比較敏感的時(shí)候,語(yǔ)料的輸入順序?qū)τ诰垲愃惴ǖ慕Y(jié)果就會(huì)有很大的不同,這是該算法的一個(gè)小的缺點(diǎn),但是該缺點(diǎn)對(duì)于整體的情況的影響并不會(huì)太大,因?yàn)閷?duì)于互聯(lián)網(wǎng)新聞報(bào)道的話題發(fā)現(xiàn)在實(shí)際應(yīng)用中對(duì)于輸入的順序是確定的,因?yàn)槭录l(fā)生是有事件順序的。Single-pass算法在計(jì)算的時(shí)候首先是將網(wǎng)絡(luò)上的文本或者語(yǔ)料進(jìn)行累計(jì),然后將累計(jì)的結(jié)果使用動(dòng)態(tài)聚類方法進(jìn)行聚合處理,第一次可以用發(fā)表的第一篇語(yǔ)料作為對(duì)之后文本處理的話題模型,然后設(shè)定一個(gè)相似度的閾值,之后輸入的文本和語(yǔ)料和之前的模型進(jìn)行相似度比較,根據(jù)之前設(shè)定的閾值對(duì)不同的話題或者文本加以區(qū)分。

        3.2 基于層次的聚類算法

        基于層次的聚類算法被認(rèn)為是隨著類簇層次的變化,使得類簇中的相關(guān)對(duì)象也相應(yīng)發(fā)生變化的一種算法。典型的層次聚類算法主要包括BIRCH算法和CURE 算法這兩種,BIRCH算法在使用過程中,將簇認(rèn)為是樹,并且將對(duì)象的劃分按照平常見到的大樹的樣子,然后結(jié)合其他的聚類的算法對(duì)聚類形式進(jìn)行優(yōu)化;而CURE算法則是將相應(yīng)的聚用一定數(shù)目的對(duì)象進(jìn)行表現(xiàn),然后對(duì)各聚類向之前設(shè)定好的聚類中心進(jìn)行匯聚。層次聚類法有很多的優(yōu)點(diǎn),譬如,層次聚類法相比于其他的計(jì)算方法來說,聚類的粒度比較靈活,在話題發(fā)現(xiàn)和輿情的監(jiān)督方面有廣泛的適用性,對(duì)于各種形狀的對(duì)象形成的簇,不同的相似度和不同的對(duì)象的距離的代表形式等的適用性都很廣泛。除此之外也有一些不足之處,在很多情況下需要發(fā)現(xiàn)和監(jiān)控的語(yǔ)料、話題等數(shù)據(jù)的規(guī)模都比較大,而且根據(jù)新聞話題的時(shí)效性來說,數(shù)據(jù)更新速度比較快,在數(shù)據(jù)處理的時(shí)候應(yīng)該使用動(dòng)態(tài)聚集的方式。對(duì)于層次聚類法來說,雖然使用范圍很廣,但是對(duì)于以上說到的大規(guī)?;蛘邉?dòng)態(tài)的數(shù)據(jù)情況還是有一定的不足的。類簇是有一定層次的,隨著類簇層次的變化,類簇中的相關(guān)對(duì)象也會(huì)發(fā)生相應(yīng)的變化,在計(jì)算過程中可以將層次聚類法的計(jì)算結(jié)果變成一個(gè)類簇樹,將每個(gè)類結(jié)點(diǎn)都包含若干子結(jié)點(diǎn),在不同的粒度上對(duì)相應(yīng)數(shù)據(jù)進(jìn)行類簇劃分。

        3.3 基于密度的聚類算法

        基于密度的聚類算法是一種需要考慮多邊形分段區(qū)域和數(shù)據(jù)的空間密度、與外界的連通性和邊界的算法,減少了搜索的復(fù)雜度,而且,在基于密度的聚類方法適用于發(fā)現(xiàn)的各種形狀的簇,在噪聲數(shù)據(jù)的處理過程中有很好的作用和效果,對(duì)噪聲數(shù)據(jù)有天然的抵制和限制作用,這是基于密度的聚類方法的優(yōu)勢(shì)。但是還有一定的不足,在使用該算法的時(shí)候,很多用戶并不十分理解相關(guān)參數(shù)的含義和表達(dá)意義。

        3.4 基于網(wǎng)格的聚類算法

        在基于網(wǎng)格的聚類算法中,為了減少搜索的復(fù)雜度,是利用劃分空間的方法進(jìn)行聚類的,一個(gè)區(qū)域就是在空間中劃分出的一個(gè)個(gè)小的超立方體。在基于網(wǎng)絡(luò)的聚類算法中,對(duì)網(wǎng)絡(luò)語(yǔ)料或者文本數(shù)據(jù)的處理首先是將數(shù)據(jù)進(jìn)行分割,但是網(wǎng)絡(luò)聚類就是將分割方式由二維分割轉(zhuǎn)變?yōu)槿S分割,也就是在輸入數(shù)據(jù)或者語(yǔ)料并進(jìn)行累計(jì)的過程中的空間小立方體中進(jìn)行的,而數(shù)據(jù)的分割就是在基于數(shù)據(jù)點(diǎn)之間的關(guān)系導(dǎo)致空間的分割,所以本質(zhì)上在基于網(wǎng)絡(luò)的聚類算法就是不直接對(duì)輸入的數(shù)據(jù)進(jìn)行處理,而是相應(yīng)的轉(zhuǎn)換和變化,然后進(jìn)行切割,這樣也會(huì)有一定的優(yōu)勢(shì),可以增加網(wǎng)格的數(shù)量,提高數(shù)據(jù)的承受空間,提升對(duì)話題的發(fā)現(xiàn)速度。在基于網(wǎng)格的聚類算法中,根據(jù)算法的不同也有很多的種類區(qū)別,其中最具代表性的算法有STING算法、Wave Cluster,其中STING 算法是一種使用小波轉(zhuǎn)換的方法對(duì)聚類進(jìn)行數(shù)據(jù)處理的多分辨聚類技術(shù);Wave Cluster算法是一種在高維數(shù)據(jù)空間中基于網(wǎng)格和密度的多分辨聚類方法。

        結(jié)語(yǔ)

        在網(wǎng)絡(luò)世界如此發(fā)達(dá)的現(xiàn)在,網(wǎng)絡(luò)上的信息紛繁不清,多種多樣,一些話題的出現(xiàn)甚至?xí)⑸鐣?huì)輿論和網(wǎng)絡(luò)輿論進(jìn)行錯(cuò)誤的引導(dǎo),對(duì)國(guó)家和社會(huì)的安定以及國(guó)民的生活質(zhì)量產(chǎn)生十分惡劣的威脅和影響。因此,國(guó)家和政府有必要采取一定的研究技術(shù),將話題發(fā)現(xiàn)研究投入到輿情監(jiān)控的實(shí)際應(yīng)用中,對(duì)網(wǎng)絡(luò)上的熱點(diǎn)話題和及時(shí)新聞話題進(jìn)行嚴(yán)格的監(jiān)管和控制,合理的控制輿論的導(dǎo)向,促進(jìn)國(guó)家公共事業(yè)的發(fā)展和進(jìn)步,對(duì)構(gòu)建和諧的具有中國(guó)特色的社會(huì)主義社會(huì)有十分重要的作用,同時(shí)也是現(xiàn)階段創(chuàng)建健康安全的互聯(lián)網(wǎng)輿情工作中面臨的一個(gè)很重要的課題。

        參考文獻(xiàn):

        [1]中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告.http://www.Cnnic.net.cn/index/0E/00/l1/. 2010.07.

        [2]駱衛(wèi)華,劉群,程學(xué)旗.話題檢測(cè)與跟蹤技術(shù)的發(fā)展與研究[A].全國(guó)計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(J SCL 2003)論文集[C].北京:清華大學(xué)出版社,2013,560-566.

        [3]李保利,俞士汶.話題識(shí)別與跟蹤研究[J].計(jì)算機(jī)工程與應(yīng)用,2015,39 (17):6-10.

        国产av在线观看91| 亚洲欧洲巨乳清纯| 亚洲成人免费观看| 国产目拍亚洲精品区一区| 91网站在线看| 亚洲国产精品一区亚洲国产| 亚洲国产中文字幕在线视频综合| 国产精品成人va在线观看| 无限看片在线版免费视频大全 | 美女人妻中出日本人妻| 一本久道综合在线无码人妻| 日韩国产精品一区二区Hd| 蜜臀av中文人妻系列| 日本在线一区二区三区视频观看| 麻豆tv入口在线看| 亚洲国产AV无码男人的天堂| 亚洲av五月天天堂网| 24小时免费在线观看av| 国产麻传媒精品国产av| 夜夜春精品视频| 91精品国产综合久久久蜜臀九色| 天堂网站一区二区三区| 天天躁日日躁狠狠躁av| 99精品久久久中文字幕 | 国产精品专区第一页天堂2019| 欧美日韩国产码高清综合人成| 国产农村妇女毛片精品久久久| 一区两区三区视频在线观看| 免费a级毛片无码免费视频首页| 9lporm自拍视频区| 久久久久久久尹人综合网亚洲| 亚洲成av人片极品少妇| 东京道一本热中文字幕| 特黄aa级毛片免费视频播放| 东京热东京道日韩av| 亚洲av成人无码久久精品老人| 国产无套护士在线观看| 亚洲国产不卡av一区二区三区| 日本一区二区在线高清观看| 夜先锋av资源网站| 国产精品白浆视频免费观看|