于衛(wèi)紅
〔摘要〕[目的意義]為校園輿情信息管理員、校園輿情監(jiān)管辦公室、相關領導等提供輿情信息服務及決策參考。[方法過程]在Jade平臺下分析、設計了基于多Agent的高校網絡輿情監(jiān)測與分析系統。詳細闡述了信息采集Agent、信息預處理Agent、輿情分析Agent、輿情簡報生成Agent的工作機制。構建了由物理層、語法層和語義層組成的多Agent間的通信模型。為了提高Agent的輿情分析能力與分析結果的可視化展示能力,通過Rserve接口對Jade平臺與R語言進行集成,使得Jade Agent可以靈活調用R語言豐富的算法包。[結果結論]文中給出了“高校百度貼吧熱點分析”的系統運行實例。運行結果表明基于多Agent的高校網絡輿情監(jiān)測與分析系統充分利用了Agent的自主性、智能性和交互性,使得系統更加具有靈活性和實時性;同時系統以大數據思維為指導,并集成了大數據分析利器R語言,使得輿情分析更加全面、客觀。
〔關鍵詞〕高校網絡輿情;輿情監(jiān)測與分析;多Agent;Jade平臺;R語言
DOI:10.3969j.issn.1008-0821.2017.10.009
〔中圖分類號〕G2062〔文獻標識碼〕A〔文章編號〕1008-0821(2017)10-0053-05
〔Abstract〕[PurposeSignificance]To provide public opinion information service and decision-making reference for campus public opinion information administrators,campus public opinion supervision office and related leaders.[MethodProcess]Under Jade platform,a network public opinion monitoring and analysis system based on multi Agent was analyzed and designed.The work mechanism of information collection Agent,information pre-processing Agent,public opinion analysis Agent and public opinion report Agent were elaborated in detail.A multi Agent communication model consisting of physical layer,syntax layer and semantic layer was constructed.In order to improve Agents public opinion analysis ability and the ability of analysis result visualization display,Jade platform was integrated with R language through Rserve interface,so that Jade Agent could flexibly call rich algorithms of R language.[ResultConclusion]As a system running instance,“hot spot analysis of university Baidu Post Bar”was given.The running results showed that University Network Public Opinion Monitoring and Analysis System Based on Multi-Agent takes full advantage of Agent good properties such as autonomy,intelligence and interactivity,so that the system became more flexible and real-time.Meanwhile,taking big data thinking as a guide and integrating R language made public opinion analysis more comprehensive and objective.
〔Key words〕university network public opinion;public opinion monitoring and analysis;Multi-Agent;Jade platform;R language
新媒體時代,網絡輿情傳播更加具有多元性、復雜性、集中性、持續(xù)性等特點。大學生群體知識層次高、思維活躍、參與意識強但尚未完全成熟,特別是部分大學生主流意識模糊、思想認識偏差、價值觀念異化,更容易在校園安全管理、決策部署、師生權益等敏感話題上引發(fā)校園網絡輿情,并造成輿情傳播的“蝴蝶效應”,使學校卷入安全或聲譽的危機之中。因此,各高校應充分重視校園網絡輿情的監(jiān)測、分析與引導,完善組織機構,健全校園輿情管理制度。
傳統的網絡輿情監(jiān)測主要依靠搜索引擎人工監(jiān)測,即安排固定人手,定期瀏覽目標站點并搜索目標關鍵詞。很顯然,人工監(jiān)測在實時性、全面性和準確性等方面存在很大的局限性。傳統的輿情分析也主要采用專家研判的人工方式,盡管專家在輿情研判方面具有豐富的經驗,但人工研判依賴的數據往往是樣本數據,數據所反映的層次相對簡單和淺薄,而且人工研判容易帶有人為設計的主觀隨意性,使得輿情研判在深度、信度、效度、客觀性等方面大打折扣。endprint
因此,大數據時代,輿情監(jiān)管工作應該充分引入大數據思維以及大數據的分析與處理技術,使得輿情研判與引導更加科學。比如,在輿情采集環(huán)節(jié),可以考慮分布式采集系統,高效、準確、實時地對覆蓋主流的社交平臺進行全方位信息采集;在輿情分析方面,應分析全數據而非隨機采樣,應重視數據的復雜性、弱化精確性,應更加關注數據的關聯性而非因果關系,同時要綜合運用分類、聚類、時序分析等多種數據分析技術。
鑒于此,本文提出了基于多Agent的高校網絡輿情監(jiān)測與分析系統,力求在輿情采集、輿情分析等方面減少人工干預,使輿情采集更加自動化、全方位,輿情分析更加客觀、科學。Agent是指駐留在某一環(huán)境下,能持續(xù)自主地發(fā)揮作用,具備反應性、社會性、主動性等特征的計算實體[1]。多Agent系統是由多個自主Agent所組成的一種分布式系統,其主要任務是要創(chuàng)建一群自主的Agent,并協調它們的智能行為[2]。
目前已有很多學者將多Agent思想應用到輿情研究中,研究的側重點主要集中在輿情傳播機制的仿真建模,如孫雷霆等使用Multi-Agent建模技術,建立虛假輿情傳播的巴斯擴散仿真模型[3];吳鵬等基于“信念–愿望–意圖”模型建立起網絡輿情演變過程中各類主體的多Agent交互模型,對網民的心智狀態(tài)的轉換過程建模仿真,從而揭示網絡輿情演變的內在動因,支持應急響應策略的科學制定[4];余樂安等基于多Agent技術構建了危險化學品泄漏所造成的水污染事件中網絡輿情擴散機制的仿真模型[5]。上述成果大都使用Anylogic、NetLogo等仿真平臺揭示輿情信息的傳播機理,為我們提供了很好的借鑒。但是,文獻研究發(fā)現,利用多Agent技術構建網絡輿情監(jiān)測與分析系統的成果很少,目前流行的網絡輿情系統大都采用較傳統的面向對象的開發(fā)方法,沒有很好地利用Agent的智能性、通信能力、協商性等優(yōu)勢;在輿情分析方面也忽視了多種分析工具和技術的整合應用。
本文以大數據思維為指導,在Jade平臺下分析、設計了基于多Agent的高校網絡輿情監(jiān)測與分析系統。Jade是基于Java語言的多Agent系統開發(fā)框架[6],Jade Agent具有自主性、智能性、適應性以及很強的通信協作能力。為了提升系統中相關Agent的數據分析與可視化展示能力,本文提出了將Jade平臺與R語言無縫集成,以便各Agent能夠靈活調用R語言豐富的算法包。
1系統結構及功能分析
為了進一步加強網絡輿情監(jiān)測及預警防范,營造良好的輿論環(huán)境,確保校園網絡信息服務健康有序,各高校應根據實際情況設定校園輿情信息管理員,成立校園輿情監(jiān)管辦公室?;诙郃gent的高校網絡輿情監(jiān)測與分析系統主要為校園輿情信息管理員、校園輿情監(jiān)管辦公室、相關領導等提供輿情信息服務及決策參考。
網絡輿情監(jiān)測與分析是一項復雜的系統工程,基于任務分解的思想,將這項工作分解為輿情信息采集、輿情信息預處理、輿情分析、輿情簡報生成四部分,每一部分都由相應的Agent類來完成,系統中各Agent在邏輯上或物理上呈分布狀態(tài),每個Agent擁有解決指定問題的不完全的信息或能力,Agent間通過協作或協商共同完成校園網絡輿情監(jiān)測與分析工作。此外,在需要的時候輿情分析Agent、輿情簡報生成Agent等還可以通過Rserve接口實現與R語言的跨平臺通信,遠程調用R語言強大的數據分析功能。
本系統的功能結構如圖1所示。
2基于多Agent的高校網絡輿情監(jiān)測與分析系統的工作機制
系統中的Agent可以看作是慎思Agent,其內部狀態(tài)及主要行為使用六元組形式化表示如下:Agent=〈D,K,I,B,C,T〉,其中,D表示Agent的數據庫,K表示Agent的知識庫,I表示Agent的意圖集,B表示Agent的行為能力,C表示Agent的協調控制、解決沖突能力,T表示Agent的通信能力。Agent工作時感知外部環(huán)境,根據意圖集決定其行為,行為執(zhí)行過程中通常需要調用數據庫和知識庫。
21信息采集Agent
信息采集Agent相當于校園輿情主題爬蟲。主題爬蟲是指選擇性地爬取那些與預先定義好的主題相關頁面的網絡爬蟲,和通用網絡爬蟲相比,主題爬蟲針對性強,信息采集速度快,極大地節(jié)省了網絡資源,并能夠很好地滿足特定人群對特定信息的需求。
對于高校網絡輿情來說,關注度比較高的主題主要包括:教學、科研、考研、招生、師德師風、師生關系、職稱評定、學科評估、專業(yè)評估、實習就業(yè)等,信息采集Agent將這些主題詞設為特征關鍵詞,從百度貼吧、校園BBS、微博、QQ空間、QQ群、微信平臺等信息源爬取輿情信息。信息采集Agent的工作機制如圖2所示。從圖2可以看出,信息采集Agent完成主題建模(設定主題詞及其權重)、網頁相關度計算、網頁優(yōu)先權設置及信息爬取等工作。輿情信息采集時,可運行多個信息采集Agent類的實例,進行分布式采集。
22信息預處理Agent
信息預處理Agent主要負責數據清洗和數據轉換工作,數據清洗指的是清除無用數據、處理缺失值、刪除重復記錄等工作;數據轉換一般包括特征選擇、格式轉換等操作。文本分詞、去停用詞、文檔特征提取工作也由信息預處理Agent完成。
23輿情分析Agent
輿情分析Agent主要完成信息的相關性分析、傳播影響力指數計算、輿情基本屬性分析、情感分析、輿情態(tài)勢預測等。輿情分析Agent要用到大量的數據分析算法,目前,R語言是統計分析領域非常強大的工具,Jade Agent以Java為開發(fā)語言,為了提升Agent的輿情分析能力及可視化展示能力,本文采用基于Rserve的跨平臺通信方式將Java與R語言有機集成,實現了Jade Agent對R語言的遠程功能調用。Rserve可以看作是基于TCPIP協議和CS結構的R語言后臺服務器,它提供了遠程連接、認證、文件傳輸等功能,處理來自C、C++、Java、PHP等客戶端語言提出的統計建模、數據分析、可視化等任務請求。輿情分析Agent調用R語言服務的主要步驟包括:①在R環(huán)境或命令提示符下啟動Rserve服務;②在Agent程序中建立與R語言的遠程連接RConnection;③在Agent程序中使用eval()函數調用R語句;④Rserve執(zhí)行R語句并將執(zhí)行結果返回給Agent。endprint
24輿情簡報生成Agent
輿情簡報生成Agent提供若干種簡報模板,根據用戶自定義的輿情關鍵詞、時間、布局方式等參數,自動生成輿情簡報。所生成的簡報主要包括:①分類信息簡報;②最新信息報道與跟蹤;③熱點信息跟蹤;④專題信息專報。輿情簡報生成Agent要用到大量的可視化圖表,為了簡化操作,輿情簡報生成Agent也可以按需調用R語言的繪圖功能。
25Agent間的交互與通信
在多Agent系統中,為了實現自身的目標,Agent應該在遵循某種會話規(guī)則的基礎上彼此協作并通過交換信息來對外界產生感知。為此,本研究構建了如圖3所示的多Agent通信模型。
在圖3所示的通信模型中,Agent通信模塊由物理層、語法層和語義層構成,其中,物理層基于TCPIP、RMI、SOAP等通信協議負責Agent間信息的發(fā)送和接收;語法層根據Agent通信語言(KQML或ACL)的語法規(guī)則對消息內容、發(fā)送者、接收者等進行解析;任何消息只有將其置于一定的語義環(huán)境下才有意義,語義可以理解為數據在某個領域上的解釋和邏輯表示,目前,主要使用本體對特定領域中的概念及其相互關系進行形式化表達,而本體常以XML作為知識表達語言。因此,在語義層主要使用本體及XML技術保證Agent對信息的正確理解。
3系統運行實例——高校百度貼吧熱點分析
本實例以大連海事大學百度貼吧為信息源,首先運行信息采集Agent(運行時命名為CollectAgent),爬取2017年6月間大連海事大學百度貼吧的主題帖,作為待處理數據保存到本地文件中。信息采集Agent將待處理的數據集的地址以及預處理請求作為消息內容發(fā)送給信息預處理Agent(運行時命名為PreProcessAgent)。信息預處理Agent收到消息后對數據集進行清洗,保留了1 500條有效數據,部分數據內容如圖4所示。
然后,信息預處理Agent選取數據集的title和content字段進行分詞和去停用詞處理,處理完畢,向信息分析Agent(運行時命名為AnalysisAgent)提出“輿情熱點分析”的建議,并將預處理后的結果發(fā)送給信息分析Agent。信息分析Agent通過Rserve調用R語言的數據處理功能,以詞頻分析為例,其核心語句如下:
RConnection c=new?RConnection(); 建立與R的遠程連接
c.eval("library(wordcloud)"); 在R語言中加載用于繪制詞云的wordcloud包
c.eval("txt.aslist<-unlist(txt)"); 將分詞后的詞語列表轉換為向量
c.eval("txt.freq<-table(txt.aslist)"); 詞頻統計
c.eval("txt.result<-txt.freq[order(txt.freq)]"); 頻數排序
c.eval("wordcloud(names(txt.result),txt.result,random.order=FALSE)");畫詞云圖
信息分析Agent提取出2017年6月間大連海事大學百度貼吧的熱點詞如圖5所示。從圖5可以看出,2017年6月期間,大連海事大學百度貼吧中備受關注的問題主要包括:高考提前錄取;選專業(yè);考研;畢業(yè)。被討論較多的專業(yè)包括:輪機、航海、電氣工程、船舶工程。很多人通過百度貼吧咨詢高考錄取等問題,咨詢者主要來自:遼寧、河南、河北、山東等省份。信息分析Agent將分析結果發(fā)送給輿情簡報生成Agent(運行時命名為ReportAgent),輿情簡報生成Agent對原始數據、分析結果進行整理后按照用戶指定的模板生成輿情報告,由于篇幅有限,輿情報告的具體內容略。
系統運行過程中,Agent間相互協作、共同完成對校園網絡輿情監(jiān)測與分析問題的求解。在Jade環(huán)境下,系統運行某一時刻各Agent間的交互如圖6所示。
4結語
大數據時代的高校網絡輿情監(jiān)管面臨前所未有的機遇和挑戰(zhàn),挑戰(zhàn)來自于輿情數據量激增、輿情信息源復雜、輿情態(tài)勢瞬息萬變等方面,而機遇則體現在大數據的思維理念日益成熟,輿情信息的采集方式、分析技術日臻完善,以大數據思維為指導、整合多種先進技術必將使校園輿情監(jiān)管工作更加科學化、智能化,為推進和諧校園建設,維
圖6系統運行時Agent間的交互圖
護正常的教學、科研秩序做出貢獻。本文所提出的基于多Agent的高校網絡輿情監(jiān)測與分析系統充分利用了多Agent系統分布式問題求解的優(yōu)勢,同時整合了R語言強大的數據分析與結果可視化能力,為輿情監(jiān)測與分析系統的分析、設計、實現提供了新的思路。
參考文獻
[1]唐明圣.基于Agent的人工社會應急管理政策分析方法[D].長沙:國防科學技術大學,2015.
[2]程世清.基于多Agent的動態(tài)協同作戰(zhàn)軟件設計與實現[D].西安:西安電子科技大學,2015.
[3]孫雷霆,李春發(fā),陶建強.基于Multi-Agent的虛假輿情傳播仿真[J].情報雜志,2017,(4):162-169.
[4]吳鵬,金貝貝,強韶華.基于BDI-Agent模型的突發(fā)事件網絡輿情應急響應建模研究[J].現代圖書情報技術,2016,(Z1):32-41.
[5]余樂安,李玲,戴偉,等.?;匪廴臼录姓C信息公布策略與網絡輿情擴散研究:基于多主體模型[J].管理評論,2016,(8):175-185.
[6]胡曉玉.基于JADE的集裝箱港口堆場作業(yè)多Agent仿真系統開發(fā)[D].大連:大連理工大學,2015.
[7]邢文雪.自媒體時代高校網絡輿情應對研究[D].長沙:湖南大學,2014.
[8]趙揚.高校網絡輿情引導研究[D].長春:東北師范大學,2016.
[9]徐萍.大數據在高校網絡輿情應急處置中的應用探討[J].圖書館工作與研究,2016,(5):55-58.
[10]孫莉玲.大數據時代高校網絡輿情研判與治理[J].江海學刊,2016,(3):204-209,239.
(本文責任編輯:孫國雷)endprint