亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng)關(guān)鍵技術(shù)進(jìn)展

        2022-06-21 01:14:24王輝,劉蕾,沈黃金,田鑫宇,朱大洲
        計(jì)算機(jī)時(shí)代 2022年6期

        王輝,劉蕾,沈黃金,田鑫宇,朱大洲

        摘? 要: 在網(wǎng)絡(luò)輿情監(jiān)測(cè)中,面對(duì)大量的網(wǎng)絡(luò)信息,須借助先進(jìn)的信息技術(shù)來(lái)實(shí)現(xiàn)網(wǎng)絡(luò)輿情監(jiān)測(cè)的自動(dòng)化和智能化。對(duì)輿情監(jiān)測(cè)系統(tǒng)中的主題爬蟲(chóng)技術(shù)、話題跟蹤與檢測(cè)技術(shù)、情感分類(lèi)技術(shù)等關(guān)鍵技術(shù)的應(yīng)用現(xiàn)狀進(jìn)行了梳理,可為輿情監(jiān)測(cè)系統(tǒng)開(kāi)發(fā)應(yīng)用提供參考。

        關(guān)鍵詞: 輿情監(jiān)測(cè); 主題爬蟲(chóng); 話題跟蹤與檢測(cè); 情感分類(lèi)

        中圖分類(lèi)號(hào):TP181? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ?文章編號(hào):1006-8228(2022)06-49-05

        Progress in key technologies of network public opinion monitoring system

        Wang Hui1, Liu Lei1, Shen Huangjin1, Tian Xinyu1, Zhu Dazhou1,2

        (1. Heilongjiang Bayi Agricultural University, Daqing, Heilongjiang 163316, China;

        2. Institute of Food and Nutrition Development, Ministry of Agriculture and Rural Affairs)

        Abstract: In the monitoring of network public opinion, facing a large amount of network information, it is necessary to use advanced information technology to realize the automation and intelligence of network public opinion monitoring. The application status of key technologies such as topic crawler technology, topic tracking and detection technology, and sentiment classification technology in the public opinion monitoring system is sorted out, which can provide a reference for the development and application of the public opinion monitoring system.

        Key words: public opinion monitoring; topic crawler; topic tracking and detection; sentiment classification

        0 引言

        隨著互聯(lián)網(wǎng)技術(shù)高速發(fā)展和廣泛應(yīng)用,網(wǎng)絡(luò)媒體成為重要的信息傳播、交流平臺(tái),網(wǎng)絡(luò)媒體逐漸成為反映民意、民情和情感交流的主要窗口,同時(shí)也是現(xiàn)代網(wǎng)絡(luò)輿情傳播的重要載體。網(wǎng)絡(luò)輿情通常由突發(fā)的社會(huì)公共事件所觸發(fā),反映人們對(duì)公共事件的認(rèn)知、態(tài)度、情感和傾向性,其主要通過(guò)網(wǎng)絡(luò)新聞、微博、論壇、貼吧和博客博文等網(wǎng)絡(luò)媒體傳播。

        對(duì)于這種網(wǎng)絡(luò)輿情,需要使用專(zhuān)業(yè)先進(jìn)輿情信息收集方法,采用目前先進(jìn)的互聯(lián)網(wǎng)搜索技術(shù),對(duì)新聞媒體、網(wǎng)站、博客、微博、微信公眾號(hào)和論壇等平臺(tái)持續(xù)監(jiān)測(cè),第一時(shí)間發(fā)現(xiàn)并抓取輿情信息,并對(duì)其進(jìn)行數(shù)據(jù)分析、判斷趨勢(shì),發(fā)出預(yù)警,撰寫(xiě)輿情分析報(bào)告,配合有關(guān)單位及時(shí)做出反應(yīng),實(shí)現(xiàn)對(duì)大眾的正確引導(dǎo)和科學(xué)處置[1]。

        網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng)早期為輿情分析軟件,其功能十分有限,如今各種智能識(shí)別技術(shù)以及數(shù)據(jù)分析挖掘技術(shù)迅速發(fā)展,輿情監(jiān)測(cè)系統(tǒng)也早已告別了人工檢測(cè),篩選,分析與預(yù)測(cè)的階段,已經(jīng)發(fā)展成了具備完整功能以及先進(jìn)算法的網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng),其主要涉及網(wǎng)絡(luò)信息采集技術(shù)、話題檢測(cè)與跟蹤技術(shù)、文本情感分析技術(shù)等技術(shù)[2]。而網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng)監(jiān)測(cè)分析效果的好壞,與上述關(guān)鍵技術(shù)的研究與應(yīng)用有著很大的關(guān)系,這些技術(shù)種類(lèi)繁多,本文重點(diǎn)介紹網(wǎng)絡(luò)信息采集技術(shù)中的主題爬蟲(chóng)、話題檢測(cè),以及跟蹤技術(shù)中的文本聚類(lèi)和文本分類(lèi)算法、情感分析技術(shù)中的情感分類(lèi)。希望本文的綜述此舉對(duì)于網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng)的研究與實(shí)現(xiàn)有著參考意義。

        1 主題爬蟲(chóng)

        主題爬蟲(chóng)主要由三個(gè)關(guān)鍵模塊組成:網(wǎng)頁(yè)分析模塊、鏈接分析模塊、爬行模塊。與通用爬蟲(chóng)不同的是,主題爬蟲(chóng)在爬行開(kāi)始前需要就某個(gè)主題對(duì)樣本網(wǎng)頁(yè)信息進(jìn)行學(xué)習(xí)和訓(xùn)練,建立相應(yīng)主題相似度模型。在啟動(dòng)爬行后,首先從起始URL開(kāi)始爬行,按照設(shè)定的搜索策略來(lái)搜索網(wǎng)頁(yè),對(duì)于所獲取的網(wǎng)頁(yè),首先進(jìn)行網(wǎng)頁(yè)相關(guān)性分析,去除與主題不相關(guān)的網(wǎng)頁(yè);然后對(duì)所提取的 URL進(jìn)行鏈接相關(guān)性分析,設(shè)置該URL的優(yōu)先級(jí)并存入U(xiǎn)RL隊(duì)列。當(dāng)滿足停止條件時(shí),爬行過(guò)程結(jié)束??梢?jiàn),存入網(wǎng)頁(yè)文本庫(kù)中的網(wǎng)頁(yè)都是與主題相關(guān)的網(wǎng)頁(yè)[3]。

        在輿情監(jiān)測(cè)系統(tǒng)中,使用主題爬蟲(chóng)可以爬取某一專(zhuān)業(yè)領(lǐng)域的輿情信息,此方面的研究與應(yīng)用較為廣泛。楊國(guó)俊[4](2009)提出了一種改進(jìn)的、用于BBS的精確主題爬蟲(chóng)設(shè)計(jì)方法,該方法是針對(duì)BBS的主題特性,而且不需要對(duì)連接內(nèi)容進(jìn)行分析評(píng)估;陳旭[5](2010)在研究基于社會(huì)網(wǎng)絡(luò)的Web輿情系統(tǒng)的過(guò)程中,引入基于多網(wǎng)關(guān)出口的分布式主題輿情爬蟲(chóng),此舉能有效解決數(shù)據(jù)的來(lái)源問(wèn)題;張長(zhǎng)利[6](2011)提出基于綜合價(jià)值具有增量特性的主題爬蟲(chóng),提高了爬全率、爬準(zhǔn)率及爬行效率;黃煒[7]等(2012)通過(guò)研究網(wǎng)絡(luò)輿情的特征和演化機(jī)制,在主題選擇時(shí)引入了時(shí)間維和空間維,成功實(shí)現(xiàn)了獲取網(wǎng)絡(luò)輿情信息的主題爬蟲(chóng);任海果[8](2012)在設(shè)計(jì)基于主題事件的輿情分析系統(tǒng)時(shí),提出基于站內(nèi)搜索的分布式主題爬蟲(chóng)設(shè)計(jì)方案,并設(shè)計(jì)了高效、簡(jiǎn)易的主題爬蟲(chóng)系統(tǒng);朱丹[9](2015)提出自適應(yīng)更改抓取時(shí)間的抓取控制方法,定制和優(yōu)化爬蟲(chóng)URL處理鏈,并且提出了按照新聞標(biāo)題計(jì)算主題相關(guān)度的方法;吳強(qiáng)強(qiáng)[10](2016)在進(jìn)行基于主題爬蟲(chóng)的食品安全網(wǎng)絡(luò)輿情分析方法研究與監(jiān)測(cè)系統(tǒng)開(kāi)發(fā)中,建立了一種基于HTML代碼解析和文字密度相結(jié)合的正文抽取方法和一種降維VSM的多參考因素的相似度計(jì)算方法;丁晟春[11](2016)針對(duì)南海問(wèn)題,構(gòu)建了多語(yǔ)種有關(guān)于南海的輿情監(jiān)測(cè)基本本體,并且在這些本體的基礎(chǔ)上實(shí)現(xiàn)了主題爬蟲(chóng)對(duì)輿情信息的采集;王杰[12](2017)針對(duì)含有對(duì)民航構(gòu)成安全隱患的恐怖威脅信息,采用主題網(wǎng)絡(luò)爬蟲(chóng)技術(shù)獲取相關(guān)信息,并應(yīng)用到民航安保微博輿情監(jiān)測(cè)系統(tǒng)的設(shè)計(jì)中;為了密切關(guān)注“三農(nóng)”網(wǎng)絡(luò)輿情,郭志杰[13](2018)等人采用主題爬蟲(chóng)技術(shù)實(shí)現(xiàn)了輿情數(shù)據(jù)采集功能,在搜索中只對(duì)與三農(nóng)相關(guān)的頁(yè)面進(jìn)行選擇和訪問(wèn);翁俊河[14]等(2019)提出構(gòu)建基于大數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情智能分析系統(tǒng),系統(tǒng)通過(guò)使用主題爬蟲(chóng)技術(shù)進(jìn)行輿情數(shù)據(jù)采集,并采用文本過(guò)濾把相似的數(shù)據(jù)來(lái)進(jìn)行合并;以建設(shè)一套廣電輿情監(jiān)測(cè)系統(tǒng),許揚(yáng)[15]等(2019)利用主題爬蟲(chóng)來(lái)獲取信息,從而強(qiáng)化網(wǎng)絡(luò)綠色生態(tài)環(huán)境治理;曾德偉[1](2020)研發(fā)出基于主題爬蟲(chóng)的網(wǎng)絡(luò)輿情系統(tǒng),此系統(tǒng)能采集到有關(guān)政府關(guān)注的網(wǎng)絡(luò)輿情,降低了非輿情信息的干擾,從而讓政府更好的進(jìn)行網(wǎng)絡(luò)輿情管理。

        2 話題檢測(cè)與跟蹤技術(shù)

        話題檢測(cè)與跟蹤(TDT)的研究最初由美國(guó)國(guó)防高級(jí)研究計(jì)劃署(DARPA)發(fā)起,TDT 技術(shù)的最初應(yīng)用主要是新聞出版領(lǐng)域,用于新聞流的話題檢測(cè)和事件跟蹤[16]。后來(lái)被擴(kuò)展到互聯(lián)網(wǎng)上,用于檢測(cè)和跟蹤把話題詞作為中心的互聯(lián)網(wǎng)新聞熱點(diǎn)話題以及流行詞,因此成為網(wǎng)絡(luò)輿情分析中的重要技術(shù)。對(duì)于話題檢測(cè)與話題跟蹤來(lái)說(shuō),涉及到的算法分別是文本聚類(lèi)算法和文本分類(lèi)算法。

        2.1 文本聚類(lèi)算法

        文本聚類(lèi)是將無(wú)類(lèi)別標(biāo)記的文本信息根據(jù)不同的特征,將有著各自特征的文本進(jìn)行分類(lèi),使用相似度計(jì)算將具有相同屬性或者相似屬性的文本聚類(lèi)在一起,而且文本聚類(lèi)技術(shù)越來(lái)越多的應(yīng)用于文本話題發(fā)現(xiàn)中,文本數(shù)據(jù)信息通過(guò)聚類(lèi)分析,使得話題發(fā)現(xiàn)的精度和效率有了很大的提高。

        近年來(lái),文本聚類(lèi)算法在輿情監(jiān)測(cè)方面的應(yīng)用頗為廣泛。李若鵬[17]等提出全新的 DK 聚類(lèi)算法并且基于DK算法構(gòu)建中文文本聚類(lèi)模型,對(duì)互聯(lián)網(wǎng)媒體發(fā)布信息進(jìn)行熱點(diǎn)發(fā)現(xiàn)研究;高洪杰[18]等改進(jìn)了k-means聚類(lèi)算法,對(duì)第n+1輪聚類(lèi)中心的計(jì)算只考慮第n輪中與中心比較接近的若干點(diǎn),提高了聚類(lèi)結(jié)果的穩(wěn)定性和準(zhǔn)確性;黃美璇[19]提出了一種K-means改進(jìn)算法,對(duì)K-means算法中聚類(lèi)初始值的選擇和孤立點(diǎn)的剔除進(jìn)行了改進(jìn),用于開(kāi)發(fā)網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)中主題發(fā)現(xiàn)子模塊;吳利華[20]提出了一種基于可信關(guān)聯(lián)規(guī)則的話題發(fā)現(xiàn)算法與跟蹤模型,并將其成功應(yīng)用到實(shí)際的輿情項(xiàng)目中;張奇[21]介紹了粒子群算法及一些成熟的改進(jìn)方法,并將其應(yīng)用到了KHM聚類(lèi)的前期優(yōu)化上,并用此算法進(jìn)行聚類(lèi),實(shí)現(xiàn)微博輿情預(yù)警系統(tǒng)中的熱點(diǎn)話題功能;張蕾[22]設(shè)計(jì)出一種基于雙閾值的Single-Pass算法,此算法是偏移建立中間狀態(tài)的規(guī)范簇類(lèi)中心向量來(lái)減少對(duì)輸入順序的依賴(lài)性,并將此應(yīng)用到基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)輿情采集系統(tǒng);王旭仁[23]等在基于改進(jìn)聚類(lèi)算法的網(wǎng)絡(luò)輿情分析系統(tǒng)研究中,提出了一種對(duì)向量空間模型VSM改進(jìn)后的文本聚類(lèi)算法STCC,此算法靈活性好,實(shí)用性高,適用于大規(guī)模文本聚類(lèi);趙陽(yáng)陽(yáng)[24]在深入研究聚類(lèi)算法的基礎(chǔ)上,提出改進(jìn)的Birch聚類(lèi)算法,并將此算法與MapReduce結(jié)合,實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)輿情的并行化聚類(lèi);涂慧明[25]通過(guò)借用VSM向量空間模型和LDA文檔主題生成模型優(yōu)化了K-means聚類(lèi)的性能,優(yōu)化了初始中心的確立方法和文本相似度的計(jì)算公式,由此提升了聚類(lèi)的準(zhǔn)確率;李保國(guó)[26]提出K-均值聚類(lèi)改進(jìn)算法,用隱藏長(zhǎng)評(píng)論-最大距離法選初始點(diǎn),解決了初始點(diǎn)多為離群點(diǎn)的問(wèn)題,用方差拐點(diǎn)確定K值,解決了預(yù)先設(shè)定聚類(lèi)個(gè)數(shù)的問(wèn)題;戴龍龍[27]在研究基于Storm分布式食品安全網(wǎng)絡(luò)輿情監(jiān)測(cè)方法中,基于自編碼神經(jīng)網(wǎng)絡(luò)對(duì)Single-Pass進(jìn)行改進(jìn),使得聚類(lèi)精度得到提高;馮靖[28]在進(jìn)行基于Hadoop的微博輿情分析時(shí),提出LKC算法,填補(bǔ)了K-means算法相對(duì)于選取初始聚類(lèi)中心點(diǎn)的敏感性;陳艷紅[29]等在進(jìn)行網(wǎng)絡(luò)輿情相似度分析方法研究中,提出一種基于信息熵和密度改進(jìn)的K-Means聚類(lèi)算法,能夠進(jìn)行網(wǎng)絡(luò)熱點(diǎn)和危機(jī)事件的聚類(lèi)和識(shí)別;葉瑾玫[30]把密度峰值算法(CFSFDP)與K-means算法相融合,完成了微博文本聚類(lèi),應(yīng)用此算法能更好地挖掘微博輿情熱點(diǎn)話題;李豐男[31]在進(jìn)行基于Spark的網(wǎng)絡(luò)輿情分析方法研究與應(yīng)用過(guò)程中,提出了Single-Pass-SOM組合聚類(lèi)模型,結(jié)合了Single-Pass聚類(lèi)算法和SOM神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),提高了話題聚類(lèi)的準(zhǔn)確率和召回率。

        2.2 文本分類(lèi)算法

        文本分類(lèi)技術(shù)是指在事先定義好的某些主題下,根據(jù)文本的屬性、含義或內(nèi)容對(duì)其進(jìn)行主題抽取,將大量的文本數(shù)據(jù)歸類(lèi)到相應(yīng)的主題中[32]。在機(jī)器學(xué)習(xí)這一領(lǐng)域,分類(lèi)是在有標(biāo)注的預(yù)定義類(lèi)別體系下進(jìn)行,屬于有監(jiān)督的學(xué)習(xí)問(wèn)題[33]。

        文本分類(lèi)在國(guó)際上的研究歷史由來(lái)已久,最早開(kāi)始于20世紀(jì)中葉。進(jìn)入到20世紀(jì)末,隨著互聯(lián)網(wǎng)的興起,文本分類(lèi)的需求也隨之增加,尤其近年在輿情監(jiān)測(cè)中的應(yīng)用非常廣泛。侯松[34]在面向網(wǎng)絡(luò)輿情態(tài)勢(shì)分析的文本分類(lèi)研究中,考慮非平衡數(shù)據(jù)集下類(lèi)樣本分布情況,提出了特征詞自動(dòng)抽樣算法AVGSampling;劉繼勇[35]在研究網(wǎng)絡(luò)輿情預(yù)警輔助決策支持系統(tǒng)模型中,有效地改進(jìn)了KNN分類(lèi)方法并將此用于話題追蹤過(guò)程中并加入了時(shí)間窗策略;吳娛[36]通過(guò)對(duì)基于樸素貝葉斯的網(wǎng)頁(yè)文本分類(lèi)技術(shù)進(jìn)行研究,提出了一種基于粗糙集改進(jìn)的樸素貝葉斯分類(lèi)方法,并將該方法運(yùn)用到輿情分析系統(tǒng)的輿情分類(lèi)中;張長(zhǎng)利[6]在研究面向特定領(lǐng)域的互聯(lián)網(wǎng)輿情分析技術(shù)時(shí),提出了基于無(wú)監(jiān)督聚類(lèi)的PU文本分類(lèi)方法,并對(duì)已有的PU文本分類(lèi)算法進(jìn)行了改進(jìn),提高了PU文本分類(lèi)的準(zhǔn)確率;萬(wàn)源[37]通過(guò)基于語(yǔ)義統(tǒng)計(jì)分析的網(wǎng)絡(luò)輿情挖掘技術(shù)研究,提出了基于類(lèi)別相關(guān)度的局部潛在語(yǔ)義分析的算法LR-LSA并應(yīng)用于文本分類(lèi);姜祖新[38]在研究應(yīng)用于Web的糧食輿情分析關(guān)鍵技術(shù)時(shí),深入研究支持向量機(jī)模型參數(shù)的選擇問(wèn)題,把蟻群算法和支持向量機(jī)算法結(jié)合起來(lái),得到了ACO-SVM算法;翟琳琳[39]將改進(jìn)的簡(jiǎn)單向量距離算法(Rocchio)和改進(jìn)的K最近鄰居分類(lèi)算法(KNN)相結(jié)合形成新算法,利用該算法對(duì)短文本實(shí)現(xiàn)分類(lèi)并應(yīng)用到輿情監(jiān)測(cè)系統(tǒng)中;李艾林[40]在針對(duì)Web輿情分析中藏文的文本分類(lèi)算法研究中,結(jié)合了藏文的詞性特點(diǎn),把樸素貝葉斯算法與支持向量機(jī)算法融合起來(lái),形成集成學(xué)習(xí)分類(lèi)算法;李慧[41]提出Miniter-means算法,用已聚類(lèi)的簇生成新聚類(lèi)簇質(zhì)心的新方法進(jìn)行計(jì)算并在面向商業(yè)輿情的網(wǎng)絡(luò)智能分析系統(tǒng)上應(yīng)用;張紅軍[42]針對(duì)互聯(lián)網(wǎng)輿情分析的迫切需求,提出了一種新的文本分類(lèi)模型——Featured Possibility(FP)分類(lèi)模型;冷冰[43]應(yīng)用Markov邏輯網(wǎng),提出了把馬爾科夫邏輯網(wǎng)作為基礎(chǔ)從多源域遷移共性知識(shí)達(dá)到輔助目標(biāo)域本文分類(lèi)的方法;杜昌順[44]在研究細(xì)分領(lǐng)域中輿情情感分析關(guān)鍵技術(shù)時(shí),把循環(huán)神經(jīng)網(wǎng)絡(luò)作為基礎(chǔ),然后引入注意力機(jī)制,能夠?qū)⒎诸?lèi)器達(dá)到較好的分類(lèi)效果;張潘頔[45]采用基于CLSTM模型的文本分類(lèi)方法,將卷積神經(jīng)網(wǎng)絡(luò)與長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)結(jié)合起來(lái),克服了先前文本分類(lèi)方法中存在無(wú)法判斷輿情文本主題標(biāo)簽相關(guān)性的缺點(diǎn),解決了文本多義問(wèn)題。

        3 文本情感分類(lèi)

        文本情感分類(lèi)是依照文本的內(nèi)容所體現(xiàn)出用戶意見(jiàn)的情感極性,把含有相同特定情感傾向的文本歸結(jié)成為同類(lèi)[46]。在輿情監(jiān)測(cè)系統(tǒng)中,情感分類(lèi)必不可少,通過(guò)情感的分類(lèi)判斷輿情的褒貶,能夠掌握輿情發(fā)展的態(tài)勢(shì)。

        巨慧慧[47]對(duì)網(wǎng)絡(luò)輿情中的文本傾向性分析技術(shù)做了深入研究,根據(jù)網(wǎng)絡(luò)輿情語(yǔ)料特性,選取了文本情感傾向性機(jī)器學(xué)習(xí)中的三種模型方法,經(jīng)過(guò)實(shí)驗(yàn)數(shù)據(jù)對(duì)比分析,得到針對(duì)網(wǎng)絡(luò)輿情最優(yōu)的分析方法-支持向量機(jī)方法;張長(zhǎng)利[6]對(duì)中文文本進(jìn)行褒、貶情感傾向性分析,提出了三種情感傾向性分析算法:基于規(guī)則及情感詞提取評(píng)價(jià)四元組的評(píng)價(jià)挖掘算法和基于unigram+評(píng)價(jià)短語(yǔ)特征的機(jī)器學(xué)習(xí)評(píng)價(jià)挖掘算法,基于字符串核函數(shù)的評(píng)價(jià)挖掘算法,基于規(guī)則及聚合模型的句子級(jí)到篇章級(jí)的中文評(píng)價(jià)挖掘算法;王鐵套[48]提出把語(yǔ)義模式與計(jì)算詞匯情感傾向性結(jié)合起來(lái),由此推斷出文本的情感傾向性,此法既考慮詞匯情感傾向性,又權(quán)衡了語(yǔ)義模式對(duì)評(píng)論的情感傾向值的影響,可以較為全面分析突發(fā)網(wǎng)絡(luò)輿情的趨勢(shì);萬(wàn)源[37]在研究基于語(yǔ)義統(tǒng)計(jì)分析的網(wǎng)絡(luò)輿情挖掘技術(shù)時(shí),提出把情感模式和機(jī)器學(xué)習(xí)結(jié)合的方法PMML,并將此方法應(yīng)用在Web評(píng)論文本的情感傾向性分類(lèi)上;高雄[49]在實(shí)現(xiàn)基于論壇的輿情分析系統(tǒng)過(guò)程中,提出了基于HowNet和依存句法分析的情感傾向處理技術(shù);楊志國(guó)[50]在進(jìn)行基于WEB挖掘和文本分析的動(dòng)態(tài)網(wǎng)絡(luò)輿情預(yù)警研究中,提出把模式匹配與基于屬性權(quán)重的樸素貝葉斯分類(lèi)器相結(jié)合的情感傾向性分析方法,此法對(duì)情感分類(lèi)的效率有著顯著提高;張俊勇[51]完善了計(jì)算情感傾向性定量的方法,而不僅僅是定性的分析,可以讓情感傾向分析更加準(zhǔn)確,此舉對(duì)于輿情分析方面有著重大意義;王煒[52]在研究針對(duì)網(wǎng)絡(luò)輿情信息的文本語(yǔ)義傾向性分類(lèi)算法時(shí),應(yīng)用了基于隱含馬爾科夫模型的輿情傾向性分析算法;王林[53]在研究輿情監(jiān)控方面的情感分析算法時(shí),提出了一種優(yōu)化Hownet判別方法,搭建閾值確定的新框架,并借助義源信息量衍生義項(xiàng)這一方法來(lái)動(dòng)態(tài)更新情感詞庫(kù);李天柱[54]在實(shí)現(xiàn)高校網(wǎng)絡(luò)輿情分析系統(tǒng)時(shí),在傳統(tǒng)的規(guī)則和字典方法上,使用Word2vce來(lái)擴(kuò)建情感詞典,彌補(bǔ)了情感基礎(chǔ)詞典在處理新詞上困難的缺陷,使得情感分析精度更加提升;李堅(jiān)[55]進(jìn)行核輿情情感分析及預(yù)警方法研究時(shí),通過(guò)RAE模型傳遞文本特征特性,然后再與Dropout相結(jié)合來(lái)提高模型泛化性的優(yōu)勢(shì),提出由此改進(jìn)后的算法,能提高情感分析模型的泛化能力;李亞軍[56]在進(jìn)行基于深度學(xué)習(xí)的食品安全網(wǎng)絡(luò)輿情分析時(shí),綜合利用LSTM和CNN深度學(xué)習(xí)技術(shù),提出了網(wǎng)絡(luò)輿情情感傾向性分類(lèi)算法 C-LSTM;劉純嘉[57]在面向高校輿情的中文文本情感傾向性分析時(shí),提出融合漢字形態(tài)學(xué)特征和HowNet的文本情感分類(lèi)方法和種基于注意力膠囊網(wǎng)絡(luò)的文本情感分析方法;岳亞南[58]在研究面向輿情文本的情感傾向性分類(lèi)時(shí),針對(duì)現(xiàn)有深度學(xué)習(xí)方法詞性信息利用不充分問(wèn)題,提出了一種融合詞性和自注意力機(jī)制的情感傾向性分類(lèi)模型。

        4 結(jié)束語(yǔ)

        綜上所述,隨著現(xiàn)代網(wǎng)絡(luò)科技的飛速發(fā)展,爬蟲(chóng)、話題跟蹤與檢測(cè)、情感分析等技術(shù)從各個(gè)方面得到了迅猛發(fā)展,其中包含的各種算法也克服以前的不足,逐漸完善,性能顯著提升。在現(xiàn)有的輿情監(jiān)測(cè)系統(tǒng)中,網(wǎng)絡(luò)信息爬取技術(shù)、話題追蹤/檢測(cè)技術(shù)、情感分類(lèi)技術(shù)的應(yīng)用與研究相對(duì)較為廣泛且深入,但預(yù)測(cè)和預(yù)警功能研究以及相關(guān)應(yīng)用偏少。在下一階段需要對(duì)此進(jìn)行逐步深入的研究,應(yīng)用到網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng)中,從而提升網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng)的性能。

        參考文獻(xiàn)(References):

        [1] 曾德偉.基于主題爬蟲(chóng)的網(wǎng)絡(luò)輿情系統(tǒng)研究和實(shí)現(xiàn)[D].重慶理工大學(xué),2020

        [2] 張軍玲.我國(guó)網(wǎng)絡(luò)輿情信息挖掘研究綜述[J].情報(bào)科學(xué),2016,34(11):167-72

        [3] 王桂梅.主題網(wǎng)絡(luò)爬蟲(chóng)關(guān)鍵技術(shù)研究[D],哈爾濱工業(yè)大學(xué),2009

        [4] 楊國(guó)俊.基于BBS的輿情預(yù)測(cè)算法及應(yīng)用研究 [D].合肥工業(yè)大學(xué),2010

        [5] 陳旭.基于社會(huì)網(wǎng)絡(luò)的Web輿情系統(tǒng)的研究與實(shí)現(xiàn)[D].電子科技大學(xué),2010

        [6] 張長(zhǎng)利.面向特定領(lǐng)域的互聯(lián)網(wǎng)輿情分析技術(shù)研究[D].吉林大學(xué),2011

        [7] 黃煒,金雅博,胡昌龍.網(wǎng)絡(luò)輿情主題信息采集研究[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2012(11):65-71

        [8] 任海果.基于主題事件的輿情分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].北京郵電大學(xué),2012

        [9] 朱丹.面向食品安全新聞?shì)浨榈闹黝}爬蟲(chóng)的設(shè)計(jì)與實(shí)現(xiàn)[D].中山大學(xué),2015

        [10] 吳強(qiáng)強(qiáng).基于主題爬蟲(chóng)的食品安全網(wǎng)絡(luò)輿情分析方法研究與監(jiān)測(cè)系統(tǒng)開(kāi)發(fā) [D]; 北京化工大學(xué), 2016.

        [11] 丁晟春,龔思蘭,周文杰,等.基于知識(shí)庫(kù)和主題爬蟲(chóng)的南海輿情實(shí)時(shí)監(jiān)測(cè)研究[J].情報(bào)雜志,2016,35(5):32-7

        [12] 王杰.基于微博大數(shù)據(jù)的輿情監(jiān)測(cè)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].中國(guó)民航大學(xué),2017

        [13] 郭志杰,周世平,顧驚璞,等.基于主題爬蟲(chóng)技術(shù)的三農(nóng)輿情監(jiān)測(cè)管理平臺(tái)開(kāi)發(fā)與應(yīng)用[J].農(nóng)業(yè)工程技術(shù),2018,38(15):29-34

        [14] 翁俊河,李湘麗,林燕斌,等.基于大數(shù)據(jù)挖掘的網(wǎng)絡(luò)輿情智能分析系統(tǒng)關(guān)鍵技術(shù)研究[J].通訊世界,2019,26(9):116-8

        [15] 許揚(yáng),田志廣,李帥.涉廣電輿情監(jiān)測(cè)系統(tǒng)方案設(shè)計(jì)[C].proceedings of the第18屆全國(guó)互聯(lián)網(wǎng)與音視頻廣播發(fā)展研討會(huì)暨第27屆中國(guó)數(shù)字廣播電視與網(wǎng)絡(luò)發(fā)展年會(huì),中國(guó)浙江嘉興,2019

        [16] 陸前.英、漢跨語(yǔ)言話題檢測(cè)與跟蹤技術(shù)研究 [D].中央民族大學(xué),2013

        [17] 李若鵬,李翔,林祥,等.基于DK算法的互聯(lián)網(wǎng)熱點(diǎn)主動(dòng)發(fā)現(xiàn)研究與實(shí)現(xiàn)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2008(9):1-4

        [18] 高洪杰.互聯(lián)網(wǎng)輿情監(jiān)測(cè)分析系統(tǒng)實(shí)現(xiàn)[D].復(fù)旦大學(xué),2009

        [19] 黃美璇.基于聚類(lèi)分析的網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)的設(shè)計(jì)[J].寶雞文理學(xué)院學(xué)報(bào)(自然科學(xué)版),2011,31(4): 40-4

        [20] 吳利華.基于論壇的話題發(fā)現(xiàn)與跟蹤算法研究 [D].北京郵電大學(xué),2013

        [21] 張奇.基于PSO-KHM聚類(lèi)的微博輿情預(yù)警系統(tǒng)的研究與實(shí)現(xiàn)[D].南京郵電大學(xué),2013

        [22] 張蕾.基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)輿情采集技術(shù)研究與設(shè)計(jì)[D].電子科技大學(xué),2014

        [23] 王旭仁,李娜,何發(fā)鎂,等.基于改進(jìn)聚類(lèi)算法的網(wǎng)絡(luò)輿情分析系統(tǒng)研究[J].情報(bào)學(xué)報(bào),2014,33(5):530-7

        [24] 趙陽(yáng)陽(yáng).基于MapReduce的分布式網(wǎng)絡(luò)輿情聚類(lèi)方法的研究[D].北京交通大學(xué),2015

        [25] 涂慧明.互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng)的關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D].東華理工大學(xué),2016

        [26] 李保國(guó).基于聚類(lèi)與LDA的新聞評(píng)論主題挖掘研究[D].武漢紡織大學(xué),2016

        [27] 戴龍龍.基于Storm分布式食品安全網(wǎng)絡(luò)輿情監(jiān)測(cè)方法研究[D].北京化工大學(xué),2017

        [28] 馮靖.基于Hadoop的微博輿情分析[D].天津理工大學(xué),2018

        [29] 陳艷紅,向軍,劉嵩.高校網(wǎng)絡(luò)輿情分析的K-Means算法優(yōu)化研究[J].湖北民族學(xué)院學(xué)報(bào)(自然科學(xué)版),2018,36(4):442-7

        [30] 葉瑾玫.基于密度峰值融合K-means聚類(lèi)算法的微博輿情分析[D].江蘇科技大學(xué),2020

        [31] 李豐男.基于Spark的網(wǎng)絡(luò)輿情分析方法的研究與應(yīng)用[D].中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院沈陽(yáng)計(jì)算技術(shù)研究所),2020

        [32] 馮志偉.自然語(yǔ)言處理簡(jiǎn)明教程[M].上海外語(yǔ)教育出版社,2012

        [33] 金佳佳.基于深度學(xué)習(xí)的短文本分類(lèi)算法研究及應(yīng)用[D].浙江工業(yè)大學(xué),2020

        [34] 侯松.面向網(wǎng)絡(luò)輿情態(tài)勢(shì)分析的文本分類(lèi)研究 [D].國(guó)防科學(xué)技術(shù)大學(xué),2009

        [35] 劉繼勇.網(wǎng)絡(luò)輿情預(yù)警輔助決策支持系統(tǒng)模型及關(guān)鍵技術(shù)研究[D].石家莊經(jīng)濟(jì)學(xué)院,2010

        [36] 吳娛.網(wǎng)絡(luò)輿情分析關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D.電子科技大學(xué),2011

        [37] 萬(wàn)源.基于語(yǔ)義統(tǒng)計(jì)分析的網(wǎng)絡(luò)輿情挖掘技術(shù)研究[D].武漢理工大學(xué),2012

        [38] 姜祖新.基于Web的糧食輿情分析關(guān)鍵技術(shù)研究[D].河南工業(yè)大學(xué),2012

        [39] 翟琳琳.網(wǎng)絡(luò)輿情分析中文本分類(lèi)和聚類(lèi)的研究[D].中原工學(xué)院,2013

        [40] 李艾林.面向Web輿情分析的藏文文本分類(lèi)算法研究[D].西北民族大學(xué),2014

        [41] 李慧.面向商業(yè)輿情的網(wǎng)絡(luò)智能分析系統(tǒng)研究與實(shí)現(xiàn)[D].電子科技大學(xué),2016

        [42] 張紅軍.面向網(wǎng)絡(luò)輿情的文本分類(lèi)系統(tǒng)研究與實(shí)現(xiàn)[D].電子科技大學(xué),2017

        [43] 冷冰.基于Markov邏輯網(wǎng)的網(wǎng)絡(luò)輿情文本分類(lèi)技術(shù)研究與實(shí)現(xiàn)[D].南京郵電大學(xué),2017

        [44] 杜昌順.面向細(xì)分領(lǐng)域的輿情情感分析關(guān)鍵技術(shù)研究[D].北京交通大學(xué),2019

        [45] 張潘頔.基于內(nèi)容分析的網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng)[D].西安電子科技大學(xué),2020

        [46] YU N. Exploring Co-Training Strategies for Opinion Detection[J].Journal of the Association for Information Science And Technology,2014,65(10):2098-110

        [47] 巨慧慧.針對(duì)網(wǎng)絡(luò)輿情的情感傾向性研究[D].哈爾濱工業(yè)大學(xué),2010

        [48] 王鐵套,王國(guó)營(yíng),陳越,等.基于語(yǔ)義模式與詞匯情感傾向的輿情態(tài)勢(shì)研究[J].計(jì)算機(jī)工程與設(shè)計(jì),? 2012,33(1):74-7

        [49] 高雄.基于論壇的輿情分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn) [D].哈爾濱工業(yè)大學(xué),2012

        [50] 楊志國(guó).基于Web挖掘和文本分析的動(dòng)態(tài)網(wǎng)絡(luò)輿情預(yù)警研究[D].武漢理工大學(xué),2014

        [51] 張俊勇.基于本體的網(wǎng)絡(luò)輿情挖掘研究[D].重慶大學(xué),2014

        [52] 王煒.面向網(wǎng)絡(luò)輿情的文本語(yǔ)義傾向性分類(lèi)算法研究[D].河北工程大學(xué),2016

        [53] 王林,李昀澤.情感傾向分析在輿情監(jiān)控方面的研究[J].微型機(jī)與應(yīng)用,2017,36(5):11-3,7

        [54] 李天柱.高校網(wǎng)絡(luò)輿情分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn) [D].重慶大學(xué),2018

        [55] 李堅(jiān).核輿情情感分析及預(yù)警方法研究[D].南華大學(xué),2018

        [56] 李亞軍.基于深度學(xué)習(xí)的食品安全網(wǎng)絡(luò)輿情分析[D].天津科技大學(xué),2018

        [57] 劉純嘉.面向高校輿情的中文文本情感傾向性分析[D].江西師范大學(xué),2020

        [58] 岳亞南.面向輿情文本的情感傾向性分類(lèi)研究 [D].重慶郵電大學(xué),2020

        久久精品国产亚洲av调教| 成人艳情一二三区| 妺妺窝人体色777777| 五月天国产成人av免费观看| 曰本人做爰又黄又粗视频| 国产真实夫妇交换视频| 久久久精品波多野结衣| 精品久久杨幂国产杨幂| 国产男女做爰猛烈视频网站| 日韩av中文字幕少妇精品| 亚洲一区二区国产激情| 国产av无码专区亚洲精品| 亚洲av成人无码网站…| 久久频精品99香蕉国产| 久久久调教亚洲| 69精品国产乱码久久久| 精品无码国产一区二区三区麻豆| 乱色精品无码一区二区国产盗| 破了亲妺妺的处免费视频国产 | 一级毛片不卡在线播放免费| 尤物yw午夜国产精品视频| 免费在线观看视频专区| 亚洲国产国语对白在线观看| 蜜桃传媒一区二区亚洲av婷婷| 国模冰莲自慰肥美胞极品人体图 | 丰满少妇三级全黄| 国产无套护士在线观看| 亚洲成AⅤ人在线观看无码| 亚洲中文字幕无线乱码va| 免费国产不卡在线观看| 日日噜噜夜夜狠狠va视频v| 欧美国产日本高清不卡| 天堂网av在线| 久久精品国产亚洲av四区| 亚洲一区二区二区视频| 人人爽人人爱| 亚洲欧美日韩在线中文一| 色综合久久五十路人妻| 我要看免费久久99片黄色 | 老少交欧美另类| 亚洲av综合色区在线观看|