亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        高校網(wǎng)絡(luò)輿情分析系統(tǒng)的探究

        2016-05-23 06:09:05耿曉龍天津理工大學(xué)計算機與通信工程學(xué)院天津300384
        電子測試 2016年7期
        關(guān)鍵詞:輿情準(zhǔn)確率詞語

        耿曉龍(天津理工大學(xué)計算機與通信工程學(xué)院,天津,300384)

        ?

        高校網(wǎng)絡(luò)輿情分析系統(tǒng)的探究

        耿曉龍
        (天津理工大學(xué)計算機與通信工程學(xué)院,天津,300384)

        摘要:隨著網(wǎng)絡(luò)技術(shù)在高校的迅速普及和發(fā)展,大學(xué)生的學(xué)習(xí)生活越來越依賴于互聯(lián)網(wǎng),由于大學(xué)生常常對網(wǎng)絡(luò)虛擬社區(qū)中的 “焦點”、“熱點”問題發(fā)表一些具有明顯負(fù)面性的意見或者言論,導(dǎo)致負(fù)面的信息在互聯(lián)網(wǎng)上迅速傳播,而這些負(fù)面的高校網(wǎng)絡(luò)輿情如果不加以適當(dāng)控制可能會對學(xué)校甚至社會帶來消極的影響。本文致力于高校網(wǎng)絡(luò)輿情分析系統(tǒng)的研究,力求尋找有效途經(jīng),探索新方法,開拓新思路,為加強高校網(wǎng)絡(luò)輿情監(jiān)管體制的實效性提供有益的幫助。

        關(guān)鍵詞:大學(xué)生;熱點;高校;網(wǎng)絡(luò)輿情 在輸入框中鍵入任意關(guān)鍵字,例如“天津理工大學(xué)”,便可持續(xù)監(jiān)控微博、微信、校園BBS、論壇貼吧中此關(guān)鍵詞的輿情狀況。同時,可以立即得到該“天津理工大學(xué)”關(guān)鍵詞的相關(guān)信息,并會及時反饋詳細(xì)分析結(jié)果以及每天宏觀環(huán)形圖(如下圖)。

        0 引言

        隨著網(wǎng)絡(luò)媒體、手機媒體、微博、微信等的興起,新媒體的發(fā)展正在改變著媒體生態(tài),輿論引導(dǎo)實踐與研究日趨重要。中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)的《第37 次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》指出,截至2015年12月底,中國網(wǎng)民規(guī)模達(dá)6.88億,互聯(lián)網(wǎng)普及率達(dá)到50.3%,半數(shù)中國人已接入互聯(lián)網(wǎng)。手機網(wǎng)民規(guī)模達(dá)到4.82億,學(xué)生群體的互聯(lián)網(wǎng)普及率已經(jīng)達(dá)到25.53%,遠(yuǎn)高于其他群體。

        隨著微博、微信等新型網(wǎng)絡(luò)社區(qū)的興起,高校學(xué)生網(wǎng)絡(luò)輿情呈現(xiàn)出許多新特點。不少網(wǎng)絡(luò)謠言、虛假新聞借助新媒體得到快速擴散,勢必會影響高校學(xué)生的價值觀、思想及其行為,從而造成學(xué)生思想上的迷茫、心理上的沖突甚至行動上的魯莽。因此輿情分析在思政管理中發(fā)揮著極其重要的作用,越來越多的高校已經(jīng)意識到輿情分析的重要性。但中文語法錯綜復(fù)雜,歧義、斷句、一詞多義等問題都是輿情分析過程中面臨的難點,這導(dǎo)致了輿情分析發(fā)展困難。

        由此,基于語法分析的輿情分析系統(tǒng)應(yīng)運而出。與機器學(xué)習(xí)不同,語法分析是將漢語從語法角度進(jìn)行解析,語法分析主要是從語義的角度將句子“讀懂”,而機器學(xué)習(xí)僅是通過計算向量,找到歸屬于自己那一類的“訓(xùn)練模型”。語法分析可以真正意義上讀懂漢語,讀懂多義詞,分析同義詞,甚至是有歧義的句子。

        1 輿情分析方法的對比

        近幾年來,最大熵模型在自然語言處理領(lǐng)域中,被譽為最好的機器學(xué)習(xí)算法之一。從理解什么是“熵”開始來理解“最大熵模型”?!办亍弊畛跤晌锢韺W(xué)家克勞修斯提出,在熱力學(xué)中,體系的熱力總是自發(fā)的趨于溫度均勻分布,這個過程是不可逆的;墨水滴入水中,也會自發(fā)趨于自由擴散,這個過程也是不可逆的,這些過程可以看作微觀世界中的無數(shù)大量微觀粒子,“熵”便是描述這些微觀粒子的位置、速度、狀態(tài)的函數(shù),當(dāng)溫度均勻分布、墨水均勻擴散后,熵值趨于最大。因此熵值越高表明無序性越強。

        “最大熵模型”,也就是熵增原理,推崇在無外物作用下,熵值總是趨向于增大,即事物總是朝著混亂狀態(tài)發(fā)展。因此熵值最大便是事物最真實的狀態(tài),對信息的研究來說,熵值最大的情況下,對信息的判斷最為準(zhǔn)確,因此用“最大熵”對一個信息做評價。

        使用最大熵分析語義,需要預(yù)先準(zhǔn)備一套訓(xùn)練集,程序經(jīng)過N次迭代后,就可以根據(jù)之前通過迭代學(xué)習(xí)的語法關(guān)系,判斷新輸入的語句了,但是由于訓(xùn)練集是一個封閉的測試集,所以要是放在開放的網(wǎng)絡(luò)中進(jìn)行測試,效果就會差很多。

        本文通過此方法進(jìn)行了一系列測試,準(zhǔn)確率只有60%~70%,可能原因如下:

        (1)選取特征太注重詞語,語料庫無法覆蓋所有詞語的搭配情況;

        (2)依存關(guān)系過多,導(dǎo)致識別難度過大;

        (3)最大熵模型不是在線學(xué)習(xí)模型,無法根據(jù)語法關(guān)系確定其他詞的詞性。

        國內(nèi)許多處理自然語言的機構(gòu)都采用最大熵的方式,如果擁有大數(shù)據(jù)入口,每天使用海量數(shù)據(jù)作為訓(xùn)練模型,是可以達(dá)到高效分析的,但大數(shù)據(jù)入口掌握在少數(shù)互聯(lián)網(wǎng)龍頭公司,研究機構(gòu)想要獲取信息只有通過網(wǎng)絡(luò)爬蟲進(jìn)行抓取,獲取的消息質(zhì)量與數(shù)量都得不到保證。

        此外,K最近鄰域也是一種重要自然語言處理手段,該方法主要是將信息源向量化,把樣本劃分到k個聚類中,相似的度量方法有歐氏距離、夾角余弦或者考斯基距離等。在實際應(yīng)用中,k值選擇變得尤其重要,由于當(dāng)k選取過小的時候,近鄰數(shù)量太少,失去了分類的精度;當(dāng)k選取過大的時候,近鄰數(shù)量太多,很多與信息并不相關(guān)的文本也被包含進(jìn)來,使得分類結(jié)果并不準(zhǔn)確。

        K最近鄰域也有著其劣勢的一面。

        (1)實時性效果不好,當(dāng)訓(xùn)練文檔集很大時,計算開銷很大,而且隨著訓(xùn)練集的增加,分類過程會越發(fā)緩慢,常用辦法是減少訓(xùn)練集規(guī)模,但這樣又會導(dǎo)致分類結(jié)果不準(zhǔn)確。還有一種辦法是改進(jìn)算法,減少相似計算的復(fù)雜度,這種方法雖然可以提高效率,降低k最近鄰域搜索計算的開銷,但無法保證結(jié)果是全局最優(yōu),當(dāng)樣本集非常大的時候,很容易出現(xiàn)以偏概全的現(xiàn)象。

        (2)有一種快速文本分類方法,可以借助數(shù)據(jù)庫檢索引擎的多維索引快速返回結(jié)果,但這樣會增加訓(xùn)練過程,提高了訓(xùn)練復(fù)雜度,但也不失為一種解決辦法。

        2 高校網(wǎng)絡(luò)輿情分析系統(tǒng)的研究

        本文研究的網(wǎng)絡(luò)輿情分析系統(tǒng),主要特點是監(jiān)控功能。用戶可以對任意關(guān)鍵字進(jìn)行監(jiān)控,如下圖所示。

        實現(xiàn)過程使用百度提供的rss(簡易信息聚合)抓取api(應(yīng)用程序編程接口)實現(xiàn),該rss會提供相關(guān)關(guān)鍵詞在整個互聯(lián)網(wǎng)中的最新信息。由于百度提供的rss采用gb2312編碼,程序采用gogb2312包分析,并采用rss2.0協(xié)議抓取rss信息入庫,使用本文中介紹的語法分析技術(shù)對提取的數(shù)據(jù)進(jìn)行分析,并繪制成表格。

        從2016.1.5至2016.1.12,每天抓取1000條輿情數(shù)據(jù)分析,對輿情判斷與監(jiān)控結(jié)果進(jìn)行人工審核,得出語法分析準(zhǔn)確度折線圖,如下圖所示。

        從圖中可以看出,7天內(nèi)最高準(zhǔn)確率達(dá)90%,最低準(zhǔn)確率達(dá)65%,平均準(zhǔn)確率為78%。由于分析詞庫的準(zhǔn)確率影響著語法分析效果,而目前分析詞庫還在完善中,對部分詞語的理解還不準(zhǔn)確,因此語法分析還有很大的提升空間。

        同時,還需關(guān)注新詞匯的出現(xiàn),特別是網(wǎng)絡(luò)流行詞、流行句。從最近的流行詞,例如“點贊”、“活久見”、“壁咚”等詞的出現(xiàn)頻率來看,一星期最多出現(xiàn)1至2個流行的網(wǎng)絡(luò)詞匯,所以并不會給語法分析詞庫的完善帶來太大的負(fù)擔(dān)。

        本系統(tǒng)根據(jù)語境分析詞語在句中的詞性,來確定詞語的極性,從而統(tǒng)計出整個句子的極性,特別是在語法復(fù)雜的語句中,有著比機器學(xué)習(xí)更好的表現(xiàn)。由此可見本文開發(fā)的語法分析算法,是一種非常良好的語義分析解決方案,尤其在解決微博、微信等新聞消息時準(zhǔn)確率比機器學(xué)習(xí)高很多。

        3 結(jié)束語

        本文通過對高校網(wǎng)絡(luò)輿情監(jiān)控重要性的分析及輿情分析方法的對比,自主設(shè)計了一款監(jiān)控軟件,此軟件使用語法分析的自然語言處理技術(shù)。通過解析漢語語法,根據(jù)預(yù)訂確定詞語的詞性,從而提高對詞語詞性分析的準(zhǔn)度。通過此系統(tǒng)可以有效的監(jiān)控高校網(wǎng)絡(luò)輿情事件,從而阻止一些可能對高校聲譽、品牌造成嚴(yán)重的負(fù)面效應(yīng)的輿情擴散,最終實現(xiàn)把高校網(wǎng)絡(luò)輿情風(fēng)險降至最低。

        參考文獻(xiàn)

        [1]劉燕,劉穎.高校網(wǎng)絡(luò)輿情的特點及管理對策[J].思想教育研究,2009,(4):46-48

        [2]王蘭成, 徐震. 基于本體的主題網(wǎng)絡(luò)輿情知識模型構(gòu)建研究[J].信息工程大學(xué)學(xué)報, 2012, 13(2):229-234. DOI:10.3969/j.issn.1671-0673.2012.02.019.

        [3]蘭月新,曾潤喜.突發(fā)事件網(wǎng)絡(luò)輿情傳播規(guī)律與預(yù)警階段研究[J].情報雜志, 2013, 32(5):16-19. DOI:10.3969/ j.issn.1002-1965.2013.05.004.

        耿曉龍(1984-),男,河北衡水人,天津理工大學(xué)計算機與通信工程學(xué)院,講師,研究方向:思政管理。

        The research of university network public opinion analysis system

        Geng Xiaolong
        (Tianjin University of Technology School of computer and communication engineering,Tianjin,300384)

        Abstract:Along with the network technology in the rapid popularization and development of,and of the students' learning life increasingly dependent on to the Internet,because students often on network virtual community in the "focus", "hot spots" problem:some has obvious negative opinions or comments,resulting in negative information on the Internet quickly spread,and the negative of the network public opinion if not properly control may bring negative influence to the school and social.This paper is devoted to the study of network public opinion analysis system in Colleges and universities,in order to find effective ways to explore new methods,to explore new ideas,to enhance the effectiveness of network public opinion supervision system in Colleges and universities to provide useful help.

        Keywords:college students;hot spots;colleges and universities;network public opinion

        作者簡介

        猜你喜歡
        輿情準(zhǔn)確率詞語
        容易混淆的詞語
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
        2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
        找詞語
        高速公路車牌識別標(biāo)識站準(zhǔn)確率驗證法
        詞語欣賞
        輿情
        中國民政(2016年16期)2016-09-19 02:16:48
        輿情
        中國民政(2016年10期)2016-06-05 09:04:16
        輿情
        中國民政(2016年24期)2016-02-11 03:34:38
        内谢少妇xxxxx8老少交| 男女啪啪在线视频网站| 亚洲一区毛片在线观看| 日韩精品一区二区三区中文 | 色窝窝在线无码中文| 亚洲精品国产精品av| 日本亚洲中文字幕一区| 人人爽人人爽人人片av| 亚洲精品成人网久久久久久| 熟妇与小伙子露脸对白| 青青草成人免费在线视频| 被三个男人绑着躁我好爽视频| 亚洲白白色无码在线观看| 亚洲美女av一区二区| 婷婷久久精品国产色蜜蜜麻豆| 性无码免费一区二区三区在线| 国产精品刺激好大好爽视频| av中文字幕在线资源网| 日本一区二区三区视频国产| 日韩亚洲欧美中文在线| 中文人妻无码一区二区三区信息| 久久熟女精品—区二区蜜臀| 麻豆精品导航| 在线亚洲人成电影网站色www| 小13箩利洗澡无码免费视频| 久久99人妖视频国产| 亚洲日韩精品一区二区三区| 男人扒开女人双腿猛进女人机机里| 久久高潮少妇视频免费| 日韩一区在线精品视频| 黑人巨大无码中文字幕无码| 一本大道久久a久久综合| 国产精品后入内射日本在线观看 | 最新国产一区二区三区 | 中文字幕乱码人妻在线| 潮喷失禁大喷水aⅴ无码| 亚洲日本va中文字幕久久| 女同国产日韩精品在线| 国产激情久久久久影院小草| 使劲快高潮了国语对白在线| 精品无码人妻久久久一区二区三区|