徐羨文 ,葉 揚(yáng),鄭廈君
(1.福建生物工程職業(yè)技術(shù)學(xué)院,福建 福州 350007;2.福建工業(yè)學(xué)校,福建 福州 350002;3.福建省教育管理信息中心,福建 福州350003)
教育是老百姓最關(guān)心的話題之一,關(guān)心決定了涉教育問題的高關(guān)注度,于是圍繞教育不斷有各種熱點(diǎn)話題產(chǎn)生,特別是在“好事不出門,壞事傳千里”的傳播規(guī)律下,各種與教育相關(guān)的負(fù)面信息、熱點(diǎn)事件、突發(fā)事件、謠言、人物行為等極易在輿論中發(fā)酵,最終演變成輿情風(fēng)暴,席卷網(wǎng)絡(luò)。如2014年發(fā)生的“高考改革方案”、“湖北潛江校園劫持人質(zhì)”、“初中英語教材現(xiàn)大量廣告”、“黑龍江自考舞弊”、“商丘學(xué)院大學(xué)生表白被開除”、“江西應(yīng)用科技學(xué)院學(xué)生被老師群毆”等事件,都曾掀起過一股股輿情風(fēng)暴。面對社會上不斷涌現(xiàn)的教育相關(guān)熱點(diǎn)話題,省級教育管理者需要全面掌握教育網(wǎng)絡(luò)輿論動態(tài),做出正確輿論引導(dǎo),營造有利于教育改革發(fā)展的輿情環(huán)境。
教育輿情網(wǎng)絡(luò)監(jiān)測平臺的總體架構(gòu)以教育系統(tǒng)全局為視角,基于特定地域與專業(yè)領(lǐng)域,結(jié)合社會實踐積累的經(jīng)驗和信息調(diào)查結(jié)果,設(shè)定主題與關(guān)鍵詞,運(yùn)用互聯(lián)網(wǎng)信息采集技術(shù)對各大新聞門戶網(wǎng)站、微博、知名論壇、帖吧、博客、搜索引擎等相關(guān)信息進(jìn)行采集和抽取,使用大數(shù)據(jù)技術(shù)對采集到的輿情信息進(jìn)行分析,生成教育輿情報告,為管理者全面掌握教育輿情動態(tài)、做出正確輿論引導(dǎo)提供依據(jù)。
教育輿情網(wǎng)絡(luò)監(jiān)測平臺是一個不斷發(fā)展中的應(yīng)用系統(tǒng),主要由數(shù)據(jù)采集、數(shù)據(jù)處理、輿情分析與報告三大部分構(gòu)成。(見圖1)
圖1 教育輿情網(wǎng)絡(luò)監(jiān)測平臺工作流程
在數(shù)據(jù)采集環(huán)節(jié),平臺實時獲取報紙、雜志、網(wǎng)站、論壇、博客、微博、微信等各類型互聯(lián)網(wǎng)信息載體發(fā)布的教育信息。針對需要監(jiān)控的目標(biāo)信息載體,自動根據(jù)預(yù)先設(shè)定的關(guān)鍵詞進(jìn)行信息搜索采集并存入數(shù)據(jù)庫。專題監(jiān)測采集則是根據(jù)用戶需求精確采集指定信息載體的頁面信息,然后用正則表達(dá)式解析出網(wǎng)頁上的各個數(shù)據(jù)項,為下一步人工干預(yù)提供決策指導(dǎo)的數(shù)據(jù)依據(jù)。通過全網(wǎng)監(jiān)測或定向監(jiān)測,系統(tǒng)根據(jù)信息的來源、瀏覽和評論的密集程度,識別出一定時間內(nèi)的熱點(diǎn)輿情,使用者可以在第一時間就將目光聚焦到熱點(diǎn)輿情的主題,分析研判輿情的發(fā)展,預(yù)測輿情將可能引發(fā)的次生影響。
在數(shù)據(jù)處理環(huán)節(jié)中,系統(tǒng)根據(jù)預(yù)先設(shè)置的主題和關(guān)鍵詞對采集到的數(shù)據(jù)進(jìn)行識別處理?;ヂ?lián)網(wǎng)信息載體發(fā)布的信息除了正文以外還有大量其他信息,如圖片、HTML格式標(biāo)記和廣告鏈接等,這些內(nèi)容數(shù)據(jù)和格式信息摻雜在一起,因此數(shù)據(jù)處理是先提取需要的正文內(nèi)容,提取的內(nèi)容一般包括來源、標(biāo)題、正文、時間、訪問數(shù)、IP等重要數(shù)據(jù);然后根據(jù)現(xiàn)有的詞庫進(jìn)行文本分詞,對詞性進(jìn)行標(biāo)注,對新詞進(jìn)行識別,最后利用關(guān)鍵詞詞庫對獲得的內(nèi)容進(jìn)行分類歸檔。系統(tǒng)將處理過的內(nèi)容信息存入到數(shù)據(jù)庫并建立索引,對于一些重要信息則以網(wǎng)頁快照的方式進(jìn)行存儲,以防未來該網(wǎng)頁被刪除。
最后系統(tǒng)對初步處理過的內(nèi)容信息進(jìn)一步分析和統(tǒng)計。系統(tǒng)根據(jù)信息闡述的主旨和觀點(diǎn)進(jìn)行傾向性分析,從而明確傳播者的傾向和意圖,最后定義某信息是正面信息還是負(fù)面信息、是否屬于敏感信息等。如果需要,系統(tǒng)應(yīng)能自動預(yù)警。在第一時間發(fā)現(xiàn)預(yù)警信息,以Email、電話、傳真、手機(jī)短信等多種方式通知管理員。在易用性上,系統(tǒng)提供報表服務(wù),針對指定信息生成曲線形式的趨勢瀏覽圖。可按指定時間段繪制出信息趨勢瀏覽圖的更新情況,并可生成相關(guān)信息的統(tǒng)計數(shù)據(jù)、信息的柱狀圖、餅狀圖以及各類對比圖表。另外還可通過內(nèi)容需求進(jìn)行報表模版定制,進(jìn)行簡報導(dǎo)出,包括日報、周報、月報、年報等等,以滿足使用者的不同需求。
文本信息的主題提取與輿情信息的發(fā)現(xiàn)是系統(tǒng)的核心功能,直接影響到最終的質(zhì)量。教育輿情網(wǎng)絡(luò)監(jiān)測平臺根據(jù)《綜合電子政務(wù)主題詞表》構(gòu)建主題詞基本表,在構(gòu)建主題詞表時還擴(kuò)展增加地方政府相關(guān)的信息,如行政區(qū)劃、地方領(lǐng)導(dǎo)姓名、地方機(jī)構(gòu)等術(shù)語信息。由于主題詞總表的信息量大、覆蓋面廣,其中必然存在大量的事實和復(fù)雜關(guān)系,也可能存在邏輯的錯誤,需要對構(gòu)建的主題詞總表進(jìn)行知識的一致性檢查。隨著時間的推移,很多主題詞和地方政府相關(guān)信息也會隨著需求而變化,因此還需要定時對教育輿情網(wǎng)絡(luò)監(jiān)測平臺的主題詞進(jìn)行維護(hù)和擴(kuò)展。
教育輿情網(wǎng)絡(luò)監(jiān)測系統(tǒng)的首要任務(wù)是及時發(fā)現(xiàn)教育部門所關(guān)注的教育輿情信息,為了有效解決教育網(wǎng)絡(luò)輿情信息中的“一詞多義”、“一義多詞”等問題,全面掌握互聯(lián)網(wǎng)上省域內(nèi)的教育網(wǎng)絡(luò)輿情信息。監(jiān)測系統(tǒng)在發(fā)現(xiàn)教育輿情信息時采用了語義匹配的方式,抓取與教育輿情相關(guān)的信息。
熱點(diǎn)教育信息在一定程度上反映在網(wǎng)頁信息的主題詞中,某個主題詞在特定時間段出現(xiàn)的網(wǎng)頁數(shù)量越多,表明該主題就是一個熱點(diǎn)。由于已對采集的網(wǎng)頁信息進(jìn)行了語義標(biāo)引,因此在統(tǒng)計時只需要統(tǒng)計主題出現(xiàn)的網(wǎng)頁數(shù)量即可發(fā)現(xiàn)熱點(diǎn)信息。
教育輿情網(wǎng)絡(luò)監(jiān)測系統(tǒng)采集的信息數(shù)據(jù)巨大、內(nèi)容繁雜,教育輿情網(wǎng)絡(luò)監(jiān)測分析可以從人物、事件、時間三個維度展開,從而更好地展現(xiàn)教育網(wǎng)絡(luò)輿情事件的發(fā)展?fàn)顩r。教育網(wǎng)絡(luò)輿情的分析范圍一般由時間和空間兩個維度決定,不論是熱點(diǎn)人物還是事件,在時間維度上都是動態(tài)變化的。教育網(wǎng)絡(luò)輿情的爆發(fā)絕對不是沒有先兆的,只要將監(jiān)測分析的教育輿情要素放置在三維空間中,通過前后的時序關(guān)系就可以找到輿情事件背后的因果關(guān)系,發(fā)現(xiàn)教育輿情信息的內(nèi)在規(guī)律。通過人物、事件、時間的三維屬性特征的監(jiān)測分析,可以更好地全面掌握教育網(wǎng)絡(luò)輿論動態(tài),做出正確輿論引導(dǎo)。
回顧去年教育行業(yè)輿情,經(jīng)對該年影響較大的教育網(wǎng)絡(luò)輿情事件進(jìn)行篩選,并從時間、空間、事件類型、情感特征和事件周期等進(jìn)行分析對比,總結(jié)出教育網(wǎng)絡(luò)輿情的傳播特點(diǎn)和規(guī)律。
教育網(wǎng)絡(luò)輿情的數(shù)量分布(見圖2)充分體現(xiàn)了輿情發(fā)生時間上的規(guī)律性,伴隨一月份研究生入學(xué)考試、學(xué)校期末考試和寒假的到來,教育網(wǎng)絡(luò)輿情會出現(xiàn)一個小高峰,二月底到三月份開學(xué)期間,教育網(wǎng)絡(luò)輿情數(shù)量會開始上升,四五月份相對比較平穩(wěn),六月份隨著一年一度高考的來臨,高考及其衍生話題如“高考作文”、“廣場舞拒絕讓步高考”、“少年明星參加高考”等,均成為網(wǎng)民關(guān)注的焦點(diǎn),教育網(wǎng)絡(luò)輿情的數(shù)量也達(dá)到頂峰,七月份處于各地市中學(xué)畢業(yè)考試和招生階段,教育網(wǎng)絡(luò)輿情又出現(xiàn)小高峰,八九月份伴隨著新學(xué)期開學(xué),教育網(wǎng)絡(luò)輿情數(shù)量呈現(xiàn)上升趨勢,而后兩三個月趨于穩(wěn)定,起伏不大。
圖2 教育網(wǎng)絡(luò)輿情事件數(shù)量分布示意圖
從地域分布上看,教育輿情事件分布呈現(xiàn)出整體分散、局部集中的特點(diǎn),省域間教育發(fā)展差異性比較大,群眾對教育的關(guān)注點(diǎn)存在區(qū)域差異。如在經(jīng)濟(jì)比較發(fā)達(dá)的地市里,擇校問題、重點(diǎn)班和教師有償家教等主題成為焦點(diǎn),而在偏遠(yuǎn)山區(qū)等農(nóng)村區(qū)域,群眾更多關(guān)注的是優(yōu)秀教師流失和減緩撤辦村小等問題。這啟示我們在今后的教育網(wǎng)絡(luò)輿情監(jiān)控工作中,必須要有跨區(qū)域意識,把教育輿情的來源地與輿情分析、解讀對應(yīng)起來,建立區(qū)域性的教育網(wǎng)絡(luò)輿情分析機(jī)制,有針對性地開展監(jiān)測和引導(dǎo)。
圖3 教育網(wǎng)絡(luò)輿情事件類型比例
從教育網(wǎng)絡(luò)輿情的總體上看,學(xué)校管理是較多重大輿情的引爆點(diǎn),教育管理不到位,形成的學(xué)生道德和法制教育的弱化與缺失,導(dǎo)致青少年犯罪等問題是網(wǎng)民較為關(guān)心的。另外,師德師風(fēng)、教育改革和考試招生也是輿情熱點(diǎn)。
情感特征分析依據(jù)正負(fù)面情感詞庫和特殊句法去分析句子,從而判斷數(shù)據(jù)源中每句話的情感傾向性,最后綜合所有句子的情感值將輿情分為正面、負(fù)面、中性。從事件的情感特征來看,將近一半的教育網(wǎng)絡(luò)輿情是中性消息,而負(fù)面信息更多是“多米諾骨牌”效應(yīng),教育網(wǎng)絡(luò)輿情往往具有舉一反三的能力,一個具體的點(diǎn)式問題可能彌散成整體性教育事件,如教師有償家教的討論,可能變成對教師隊伍師德師風(fēng)的質(zhì)疑,從而引發(fā)對教育管理的失望、對整個教育的不滿。
圖4 教育網(wǎng)絡(luò)輿情情感特征比例
教育關(guān)系著千家萬戶,一直以來都是社會關(guān)注的焦點(diǎn),正確處理好政府、學(xué)校、社會之間的關(guān)系,提高政府在教育領(lǐng)域的危機(jī)管理水平,離不開準(zhǔn)確的教育輿情監(jiān)測?;ヂ?lián)網(wǎng)時代,網(wǎng)絡(luò)成為信息交互和教育輿情迸發(fā)的主要戰(zhàn)場,構(gòu)建覆蓋教育各領(lǐng)域的教育輿情網(wǎng)絡(luò)監(jiān)測平臺,借助大數(shù)據(jù)支撐技術(shù),通過對各類媒介平臺、博客、帖吧、微博、微信、論壇、新聞等網(wǎng)絡(luò)載體的監(jiān)測,及時發(fā)現(xiàn)教育輿論熱點(diǎn)、突發(fā)事件和重大公共事件信息,并通過郵件、短信等形式做出預(yù)警,啟動應(yīng)急處置,全面提升教育網(wǎng)絡(luò)輿情監(jiān)管、應(yīng)對能力。