亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        易班環(huán)境下高校網(wǎng)絡(luò)輿情知識庫平臺建設(shè)研究

        2016-04-12 07:21:03虞晨潔
        關(guān)鍵詞:易班熱詞知識庫

        虞晨潔

        (東華大學(xué) 計算機科學(xué)與技術(shù)學(xué)院, 上海 201620)

        易班環(huán)境下高校網(wǎng)絡(luò)輿情知識庫平臺建設(shè)研究

        虞晨潔

        (東華大學(xué) 計算機科學(xué)與技術(shù)學(xué)院, 上海 201620)

        易班作為Web 2.0時代的產(chǎn)物,因其具有政府部門主導(dǎo)、用戶實名注冊、對象主體集中、專注教育服務(wù)等獨特優(yōu)勢,已成為當(dāng)前高校網(wǎng)絡(luò)輿情的重要組成部分。然而,隨著易班的快速發(fā)展,基于易班的各類高校網(wǎng)絡(luò)輿情信息呈海量增長,相關(guān)輿情監(jiān)測和引導(dǎo)過程中逐步凸顯各類問題,傳統(tǒng)的人工監(jiān)控方法已經(jīng)難以應(yīng)對,監(jiān)測和研判高校網(wǎng)絡(luò)輿情需要強有力的信息搜索技術(shù)?;诖?,本文提出易班環(huán)境下的高校網(wǎng)絡(luò)輿情知識庫平臺建設(shè)研究,在考慮信息采集的深度和廣度的同時, 進一步提高精度與準(zhǔn)度,并結(jié)合“東華大學(xué)計算機科學(xué)與技術(shù)學(xué)院易班網(wǎng)絡(luò)輿情知識庫系統(tǒng)”的開發(fā)工作,將理論研究和實踐應(yīng)用有機結(jié)合,取得初步成效。

        易班;高校網(wǎng)絡(luò)輿情;監(jiān)測;知識庫

        一、 易班環(huán)境下高校網(wǎng)絡(luò)輿情的內(nèi)涵和特征

        (一) 易班環(huán)境下高校網(wǎng)絡(luò)輿情的內(nèi)涵

        高校網(wǎng)絡(luò)輿情主要是指師生對相關(guān)國際重大問題、社會焦點問題、時政問題以及有關(guān)校園事務(wù)、學(xué)校管理等與自己利益相關(guān)的問題的情緒、看法、意見和態(tài)度[1]。易班作為Web2.0時代的產(chǎn)物,已成為滬上各高校師生活躍度最高的社交平臺之一,為我們深入研究師生需求、把握并研判高校網(wǎng)絡(luò)輿情提供了一個友好的網(wǎng)絡(luò)平臺,已成為當(dāng)前高校網(wǎng)絡(luò)輿情的重要組成部分。易班環(huán)境下的高校網(wǎng)絡(luò)輿情主要研究基于易班平臺的硬空間中高校師生對于各類事件的情緒、看法、意見和態(tài)度。

        (二) 易班環(huán)境下高校網(wǎng)絡(luò)輿情的特征

        易班環(huán)境下的高校網(wǎng)絡(luò)輿情除了具有一般網(wǎng)絡(luò)輿情的特征外,還因其用戶的特殊和高校環(huán)境的開放包容,從而具有自身的一些特征。

        主體一元,實名認(rèn)證,網(wǎng)絡(luò)真實性得到保證。易班環(huán)境下高校網(wǎng)絡(luò)輿情的主體為高校師生,以在校的青年學(xué)生為主。由于他們在知識儲備、成長歷程、心理訴求等方面具有不少交集,因而易班用戶在彼此關(guān)注的輿情事件上易形成高校師生的代表性觀點。同時,易班目前采取的注冊方式為實名認(rèn)證,使輿情處置針對性更強,反應(yīng)速度更快。

        政府主導(dǎo),專注教育服務(wù),信息源純凈。易班是市教委在全市高校中重點推進的網(wǎng)絡(luò)文化建設(shè)項目,具有其官方性。上海市易班發(fā)展中心對于易班平臺監(jiān)控有力,為師生營造了一個相對純凈的網(wǎng)絡(luò)環(huán)境。易班從設(shè)立開始就以服務(wù)教育為目的,有較為明確的服務(wù)對象和目標(biāo),不摻雜企業(yè)利益等社會影響因素,不易受到外界干擾。

        內(nèi)容豐富,多向交織互動,輿情形成迅速。易班環(huán)境下的高校網(wǎng)絡(luò)輿情涉及社會問題、校園問題等囊括社會各個方面的信息,表達和傳播方式多種多樣。以東華大學(xué)易班社區(qū)為例,下屬33個學(xué)院或部門,已有成員41502人,學(xué)校與學(xué)生、老師與學(xué)生、學(xué)生與學(xué)生之間的溝通形態(tài)呈現(xiàn)扁平化,減少了以往信息傳遞過程中的內(nèi)容失真和時間耗散。因而,輿情易在極短的時間內(nèi)傳播、交織、膨脹。

        突出班級概念,分解輿論壓力。易班突出班級,在班級中問題的探討更容易以緩和的方式展開,現(xiàn)實生活中的親密關(guān)系有助于對同一問題達成共識,因此在班級的小輿論圈中就可以化解一些問題,為整個易班的大輿論場減輕了壓力[2]。

        二、 基于易班的高校網(wǎng)絡(luò)輿情監(jiān)測和引導(dǎo)的現(xiàn)狀

        隨著易班建設(shè)不斷推進,網(wǎng)站在思想教育、教務(wù)教學(xué)、生活服務(wù)、文化娛樂等方面吸引和積累的資源也愈加豐富和多樣化,由此產(chǎn)生的線上行為、信息文本、線下行動等方面的海量數(shù)據(jù)是高校網(wǎng)絡(luò)輿情監(jiān)測和引導(dǎo)的重要來源,如何收集、管理和分析數(shù)據(jù)是網(wǎng)絡(luò)輿情研究工作中首當(dāng)其沖的問題。當(dāng)前,基于易班的高校網(wǎng)絡(luò)輿情監(jiān)測和引導(dǎo)工作已經(jīng)開始推進,但在其操作過程中也存在著一些問題。主要問題如下:

        (一) 數(shù)據(jù)源的“質(zhì)量”價值尚未得到充分重視

        在易班環(huán)境下,高校網(wǎng)絡(luò)輿情工作的重要內(nèi)容之一就是掌握有“量”、有“質(zhì)”的數(shù)據(jù)源,并在此基礎(chǔ)上為易班監(jiān)管者提供定量、定性分析結(jié)果。目前,這項工作并未得到足夠重視。

        從2007年至今,易班網(wǎng)的建設(shè)已歷經(jīng)八年,目前該網(wǎng)站已經(jīng)覆蓋上海地區(qū)所有高校。截至2015年6月,已有注冊用戶180萬人,日均訪問量1000萬次,總計學(xué)習(xí)資料2000萬個,總發(fā)帖量2570萬個。無論是從時間維度,還是從地理維度上來看,易班將占據(jù)全國高校師生網(wǎng)絡(luò)行為數(shù)據(jù)的制高點,成為教育領(lǐng)域網(wǎng)絡(luò)輿情的重要數(shù)據(jù)來源和分析平臺。易班數(shù)據(jù)體量龐大,它的不斷激增,也意味著網(wǎng)站管理者對高校師生網(wǎng)絡(luò)行為的記錄范圍、測量范圍和分析范圍在不斷擴大,但從現(xiàn)狀而言,這部分?jǐn)?shù)據(jù)并未得到充分利用。

        需要指出的是,做好網(wǎng)絡(luò)輿情工作,除了重視數(shù)據(jù)的“量”之外,還要重視數(shù)據(jù)的“質(zhì)”。所謂數(shù)據(jù)的“質(zhì)”就是樣本的全面性[3]。所謂全面性,不僅僅指數(shù)量層面的多寡,更是要求指數(shù)據(jù)的采集面能夠覆蓋網(wǎng)站上所有信息。易班的數(shù)據(jù)源分為顯性數(shù)據(jù)和隱性數(shù)據(jù)兩個部分。顯性部分即是易班網(wǎng)上公開發(fā)布的各類信息,隱性部分是易班網(wǎng)上被屏蔽或者刪除的各類信息。由于易班本身的特殊定位,決定了其顯性部分?jǐn)?shù)據(jù)往往具有正面性,在一定程度上反映高校校園積極向上的一面。相對而言,隱性部分?jǐn)?shù)據(jù)中就有可能存在危害校園安全、社會安全的相關(guān)信息。將顯性數(shù)據(jù)和隱性數(shù)據(jù)綜合起來,才能立體多維地呈現(xiàn)易班環(huán)境中高校網(wǎng)絡(luò)輿情的真實面貌。

        (二) 現(xiàn)有高校網(wǎng)絡(luò)輿情工作體系難以適應(yīng)快速多變網(wǎng)絡(luò)輿情監(jiān)測的需要

        隨著新媒體技術(shù)的不斷演進,易班除了擁有網(wǎng)站平臺之外,還擁有移動客戶端、微信公眾號等多個平臺。這些平臺既結(jié)合了時下各種主流網(wǎng)絡(luò)應(yīng)用,又較好地擴大了易班的社會知名度和影響力。其必然結(jié)果是:易班信息資源傳播速度不斷加快、易班的社會關(guān)注度得到不斷提高。因此,易班與其他社會網(wǎng)站一樣,也具有隨時爆發(fā)網(wǎng)絡(luò)輿情的可能性。在管理模式方面,絕大多數(shù)高校現(xiàn)有網(wǎng)絡(luò)輿情工作體系采用傳統(tǒng)的自上而下的垂直管理模式。該模式在處理非緊急事件時能收到一定效果,但是在突發(fā)性網(wǎng)絡(luò)輿情事件中難以實現(xiàn)快速有效地響應(yīng)。在軟硬件建設(shè)方面,高校在網(wǎng)絡(luò)輿情監(jiān)測工作中對軟硬件的建設(shè)投入較少,這也直接影響到監(jiān)測實效[4]。網(wǎng)絡(luò)輿情監(jiān)控分析系統(tǒng)因購置成本較高、技術(shù)難度較大,故而國內(nèi)僅有小部分高校采取了有害信息過濾系統(tǒng)、網(wǎng)絡(luò)監(jiān)控系統(tǒng)等輿情安全技術(shù)措施。大多數(shù)高校的輿情信息仍然來源于人工檢測、抓取數(shù)據(jù)的傳統(tǒng)方式,該方式難以適應(yīng)快速多變網(wǎng)絡(luò)輿情監(jiān)測的需要。

        (三) 易班“虛”“實”交互成效顯著,但在網(wǎng)絡(luò)輿情引導(dǎo)介入方面有待加強

        易班與其他網(wǎng)絡(luò)應(yīng)用一樣,具有虛實二重性。易班的“虛”主要表現(xiàn)為信息內(nèi)容的虛擬化。作為一個全方位育人平臺,易班通過主動對接學(xué)校教育教學(xué)資源,為學(xué)生提供一站式服務(wù),實現(xiàn)網(wǎng)絡(luò)平臺、教育資源、學(xué)習(xí)空間的共享。例如:東華大學(xué)推出“教學(xué)資源建設(shè)工程”,將教材、課件、視頻、科研成果等內(nèi)容供師生分享,提升教學(xué)資源的利用率和附加值;開設(shè)“課程答疑互助分享”專欄,增強師生的互動性。

        易班的“實”主要表現(xiàn)為建設(shè)隊伍的實體化和線下活動的實際化。在建設(shè)隊伍實體化方面,易班在市級層面啟動易班體制機制改革,摸索新的建設(shè)模式,進一步加強易班核心團隊建設(shè),培養(yǎng)了一支年輕且富有戰(zhàn)斗力的核心隊伍。同時,在學(xué)校層面,分別成立了校易班發(fā)展中心和易班學(xué)生工作站,通過培訓(xùn)、交流,不斷提升隊伍的工作能力和水平,為易班的全面推進奠定了扎實基礎(chǔ)。

        易班在“虛”和“實”兩方面均取得了一定成效,且交互成效顯著,但在這個過程中,有關(guān)網(wǎng)絡(luò)輿情引導(dǎo)相關(guān)工作卻未充分介入,仍大多停留在表面的項目推進、活動開展等方面,基于背后的數(shù)據(jù)呈現(xiàn)、網(wǎng)絡(luò)輿情動態(tài)等關(guān)注不夠。易班作為一個重要的社交平臺,數(shù)據(jù)的激增隱藏著重要的各類網(wǎng)絡(luò)輿情信息,網(wǎng)絡(luò)輿情的引導(dǎo)工作至關(guān)重要,需要在人員隊伍、引導(dǎo)策略等方面對于網(wǎng)絡(luò)空間進行治理。就現(xiàn)狀而言,易班工作中網(wǎng)絡(luò)輿情引導(dǎo)介入需要增強。

        三、 易班環(huán)境下建立高校網(wǎng)絡(luò)輿情知識庫平臺的必要性

        易班發(fā)展迅速,已逐漸由上海向全國推廣,其所涉及到的學(xué)生用戶群體數(shù)呈指數(shù)級增加,基于易班的高校網(wǎng)絡(luò)輿情信息量海量增長,傳統(tǒng)的人工監(jiān)控方法已經(jīng)難以應(yīng)對,監(jiān)測和研判高校網(wǎng)絡(luò)輿情需要強有力的信息搜索技術(shù)。當(dāng)前,網(wǎng)絡(luò)輿情監(jiān)控研究的主要方法是通過獲取輿情話題的主題內(nèi)容,利用統(tǒng)計方法來實現(xiàn)熱點問題發(fā)現(xiàn)和話題態(tài)勢分析,缺少基于知識的推理,也沒有專門針對輿情知識庫的相關(guān)研究。國內(nèi)具有代表性的輿情監(jiān)控系統(tǒng),如方正智思輿情預(yù)警輔助決策系統(tǒng)、TRS網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)等,雖提供了較強的數(shù)據(jù)采集和統(tǒng)計分析功能,但在輿情分析與預(yù)警的精準(zhǔn)度方面仍存在不足,缺少對不同輿情事件間相互關(guān)系的挖掘等。導(dǎo)致這些問題的原因在于系統(tǒng)缺乏完善的底層知識庫平臺的支持,缺少知識對輿情監(jiān)控過程的有效引導(dǎo),導(dǎo)致系統(tǒng)難以準(zhǔn)確獲取輿情關(guān)鍵信息,從而無法有效實現(xiàn)突發(fā)事件網(wǎng)絡(luò)輿情預(yù)警。

        易班融合了微博、論壇、博客等多種網(wǎng)絡(luò)應(yīng)用,在成為滬上各高校師生活躍度最高的社交平臺之一的同時,因其具有政府部門主導(dǎo)、用戶實名注冊、對象主體集中、專注教育服務(wù)等獨特優(yōu)勢,為我們深入研究高校學(xué)生需求、把握并研判高校網(wǎng)絡(luò)輿情提供了一個友好的網(wǎng)絡(luò)平臺。因此,易班環(huán)境下的高校網(wǎng)絡(luò)輿情監(jiān)測應(yīng)更加關(guān)注技術(shù)革新,大力加強基于易班的高校網(wǎng)絡(luò)輿情知識庫系統(tǒng)平臺的建立,在考慮信息采集的深度和廣度的同時, 進一步提高系統(tǒng)的精度與準(zhǔn)度,從而及時應(yīng)對各類網(wǎng)絡(luò)輿情狀況的出現(xiàn)。易班環(huán)境下高校網(wǎng)絡(luò)輿情知識庫平臺建設(shè)是順應(yīng)數(shù)字時代的客觀要求,其勢在必行。

        四、 基于易班的高校網(wǎng)絡(luò)輿情知識庫平臺建設(shè)與實踐

        (一) 網(wǎng)絡(luò)輿情知識庫的定義

        網(wǎng)絡(luò)輿情知識庫包含在輿情數(shù)據(jù)采集、輿情數(shù)據(jù)抽取、輿情監(jiān)測追蹤、輿情態(tài)勢分析等過程中的基礎(chǔ)知識和數(shù)據(jù)。它是關(guān)于輿情源、發(fā)布輿情的主體、輿情針對的客體、輿情話題主體、輿情分析指標(biāo)等的描述。通過建立易班環(huán)境下的高校網(wǎng)絡(luò)輿情知識庫可以形成易班熱點人物指數(shù)、熱詞指數(shù)和熱點貼文指數(shù)等,以便主管部門準(zhǔn)確獲取網(wǎng)絡(luò)輿情關(guān)鍵信息,對輿情監(jiān)控過程進行有效引導(dǎo)。

        (二) 基于易班的高校網(wǎng)絡(luò)輿情的組成

        基于易班的高校網(wǎng)絡(luò)輿情的形成有兩個主要的要素:輿情具體指向的事件和輿情參與主體。因此,易班輿情監(jiān)測和研判的重點應(yīng)包括易班網(wǎng)絡(luò)特殊事件、易班網(wǎng)絡(luò)特殊主體[5]。易班網(wǎng)絡(luò)特殊事件是指在現(xiàn)實校園或易班網(wǎng)絡(luò)社區(qū)中容易形成巨大影響的重要事件,其關(guān)注度高、傳播迅速、社會影響范圍廣,如評獎評優(yōu)、報送研究生、發(fā)展黨員等,社會熱點事件也是大學(xué)生們最為關(guān)注的焦點。在易班網(wǎng)絡(luò)社區(qū)中,那些活躍的成員將逐漸成為易班網(wǎng)絡(luò)空間里的強勢聲音,而其他易班用戶由于從眾心理而跟從這些聲音,從而使得易班網(wǎng)絡(luò)輿情易被這些少數(shù)主體所主導(dǎo)。同時,由于高校各項事務(wù)的運行有一定的時間規(guī)律,易班網(wǎng)絡(luò)輿情監(jiān)測和研判需要重點關(guān)注特殊時段,如網(wǎng)上選課期間、推優(yōu)入黨期間、畢業(yè)離校期間等。因此,基于易班的高校網(wǎng)絡(luò)輿情知識庫的基本體系架構(gòu)是由易班網(wǎng)絡(luò)特殊事件、易班網(wǎng)絡(luò)特殊主體、易班網(wǎng)絡(luò)特殊時段三個子庫組成。知識庫系統(tǒng)自動實時抓取相關(guān)信息,并定期提供相關(guān)易班網(wǎng)絡(luò)輿情分析報告,為高校網(wǎng)絡(luò)輿情工作提供保障。

        (三) 基于易班的高校網(wǎng)絡(luò)輿情知識庫系統(tǒng)平臺建設(shè)實踐——以東華大學(xué)計算機科學(xué)與技術(shù)學(xué)院為例

        東華大學(xué)計算機科學(xué)與技術(shù)學(xué)院作為上海市首批推進易班的試點單位,經(jīng)過8年多的發(fā)展,易班工作成效顯著,并積攢了相應(yīng)的高校網(wǎng)絡(luò)輿情工作經(jīng)驗。2014年9月,學(xué)院結(jié)合學(xué)科優(yōu)勢,成立易班技術(shù)開發(fā)工作室,致力于以項目化的運作模式開發(fā)和實現(xiàn)各類有東華特色的應(yīng)用系統(tǒng),并進行基于平臺建設(shè)的各類大數(shù)據(jù)分析統(tǒng)計。該工作室成立后承接的第一項系統(tǒng)開發(fā)任務(wù)便是配合2014年度上海學(xué)校德育實踐研究課題“基于易班的高校網(wǎng)絡(luò)輿情知識庫建設(shè)”同步推進的實體系統(tǒng)開發(fā),經(jīng)過一年的開發(fā)與測試,第一期系統(tǒng)基本完成。

        1. 系統(tǒng)平臺架構(gòu)

        在第一期開發(fā)實踐中,著重完成易班熱點人物知識庫、易班熱詞知識庫和易班熱點貼文知識庫三個子庫的建立。

        (1) 易班熱點人物知識庫:易班用戶是易班環(huán)境下網(wǎng)絡(luò)輿情產(chǎn)生的主體,其特征是影響易班網(wǎng)絡(luò)輿情形成的直接因素。本庫是關(guān)于易班熱點人物的知識庫。易班熱點人物是指活躍度高、影響力大的易班用戶。易班熱點人物的選取標(biāo)準(zhǔn)是易班用戶的影響力和活躍度,選取指標(biāo)是用戶發(fā)帖量和貼文評論數(shù)。易班用戶發(fā)帖的次數(shù)越多、貼文的評論數(shù)越多,其在信息傳播過程中產(chǎn)生的影響越大,輿情研究價值就越高。對于易班用戶,我們主要對用戶名、所屬群體和貼文數(shù)等屬性進行編碼,在此基礎(chǔ)上以貼文數(shù)量為參考指標(biāo)對易班用戶進行排序,形成易班熱點人物指數(shù)。易班熱點人物知識庫的結(jié)構(gòu)設(shè)計為:人物編號、發(fā)帖人、開始時間、結(jié)束時間、所屬群體、發(fā)帖數(shù)、貼文主題。

        (2) 易班熱詞知識庫:熱詞作為一種詞匯現(xiàn)象,反映了一個國家、一個地區(qū)的人們在某一個時期普遍關(guān)注的問題和事物,具有時代特征,反映一個時期的熱點話題及民生問題。本庫是關(guān)于易班熱詞的知識庫。易班熱詞包括兩類,一是在某一時間段內(nèi)易班用戶提及次數(shù)達到一定量的人名;二是在某一時間段內(nèi)易班用戶互動數(shù)達到一定量的事件名。易班熱詞的選取標(biāo)準(zhǔn)是易班環(huán)境中出現(xiàn)頻率較高的詞,選取指標(biāo)是詞出現(xiàn)的頻率。建立熱詞知識庫的意義在于希望通過對易班熱詞的采集、跟蹤、整理、分析,探索易班熱詞與易班用戶關(guān)注熱點及易班用戶用網(wǎng)習(xí)慣之間的聯(lián)系,剖析詞匯關(guān)注群體的情感脈絡(luò)以及對事件和生活的態(tài)度。對于易班熱詞,我們主要對詞、詞所在貼文、發(fā)帖者等屬性進行編碼。在此基礎(chǔ)上以熱詞出現(xiàn)頻率為唯一參考指標(biāo),進行排序,形成易班熱詞指數(shù)。易班熱詞知識庫的結(jié)構(gòu)設(shè)計為:熱詞編號、熱詞、熱詞頻率、開始時間、結(jié)束時間、所屬貼文主題、發(fā)帖人。

        (3) 易班熱點貼文知識庫:本知識庫用于歸納和掌握易班輿情熱點動向,對可能演化為網(wǎng)絡(luò)風(fēng)險事件的熱點事件實時監(jiān)控,對網(wǎng)絡(luò)熱點特征和發(fā)展規(guī)律進行深入研究。易班熱點貼文是指在某一時間段內(nèi)易班用戶互動數(shù)達到一定量的貼文。易班熱點貼文的選取標(biāo)準(zhǔn)是易班網(wǎng)上貼文的互動情況,具體指標(biāo)是貼文的評論數(shù)、轉(zhuǎn)載數(shù)和點擊數(shù)。對于易班熱點貼文,我們主要對貼文主題、發(fā)帖人、所屬群體、瀏覽數(shù)、回復(fù)數(shù)等屬性進行編碼。易班熱點貼文知識庫的結(jié)構(gòu)設(shè)計為:貼文編號、貼文主題、發(fā)帖人、學(xué)校、學(xué)院、班級、開始時間、結(jié)束時間、瀏覽量、回復(fù)數(shù)。

        圖1 易班輿情知識庫系統(tǒng)平臺架構(gòu)

        2. 系統(tǒng)流程分析

        易班的主要數(shù)據(jù)來自于易班的帖文,建設(shè)基于易班的高校網(wǎng)絡(luò)輿情知識庫系統(tǒng)主要圍繞易班的帖文進行系統(tǒng)建設(shè)和分析。由于易班尚未開放數(shù)據(jù)查詢的公共接口,因此目前對易班的帖文數(shù)據(jù)主要依靠網(wǎng)絡(luò)爬蟲獲取。本系統(tǒng)能夠自動獲取限定時間段內(nèi)易班平臺的發(fā)帖信息,將網(wǎng)絡(luò)爬蟲所得的易班帖文數(shù)據(jù)經(jīng)過篩選和清洗之后放入數(shù)據(jù)庫系統(tǒng)中,依靠數(shù)據(jù)庫系統(tǒng)的信息整合能力對易班數(shù)據(jù)進行分析、數(shù)據(jù)挖掘,最后根據(jù)需要將獲得的結(jié)果集以圖標(biāo)或表格的形式展示給用戶,使用戶能夠直觀地獲取易班的數(shù)據(jù)信息。

        圖2 易班輿情知識庫系統(tǒng)流程分析

        3. 系統(tǒng)主要模塊設(shè)計

        網(wǎng)絡(luò)爬蟲模塊:本模塊是數(shù)據(jù)獲取模塊,管理員啟動該模塊,該模塊根據(jù)設(shè)定的時間,起始網(wǎng)頁地址自動從易班網(wǎng)站上獲取相關(guān)貼文的原網(wǎng)頁,并下載原網(wǎng)頁存儲于數(shù)據(jù)庫中。爬蟲采用廣度優(yōu)先搜索,搜索與初始URL一定距離內(nèi)的網(wǎng)頁,保證對淺層網(wǎng)頁的優(yōu)先處理。

        圖3 易班輿情知識庫系統(tǒng)主要模塊設(shè)計

        數(shù)據(jù)清洗模塊:由網(wǎng)絡(luò)爬蟲模塊獲取并存儲于數(shù)據(jù)庫中的原網(wǎng)頁包含網(wǎng)頁中的所有信息,而這些信息并不都是我們所需要的,我們需要從原網(wǎng)頁中獲取我們所需要的貼文信息以及發(fā)帖人信息。我們利用JAVA程序從數(shù)據(jù)庫中獲取原網(wǎng)頁,利用HTML解析工具獲取需要的信息塊,并結(jié)合正則表達式工具提取貼文、發(fā)帖人、瀏覽量、回復(fù)量等信息,并將這些信息分別存入數(shù)據(jù)庫中的貼文表、用戶表等不同表中。

        數(shù)據(jù)分析模塊:對存儲于數(shù)據(jù)庫中的各種數(shù)據(jù)表我們還需要作進一步的中文分詞分析,獲取更多的信息。利用JAVA程序通過設(shè)計好的SQL語句生成各類數(shù)據(jù)報表的視圖,并對貼文進行進一步的分詞分析。利用分詞工具IKAnalyzer將貼文主題進行劃分,通過添加用戶詞庫和刪除無關(guān)詞語和虛詞等手段確保分詞產(chǎn)生的結(jié)果的準(zhǔn)確性,并通過數(shù)據(jù)分析將“熱詞”進行提煉并再次存入數(shù)據(jù)庫。

        數(shù)據(jù)展示模塊:最后數(shù)據(jù)以圖表的形式展現(xiàn)給用戶,利用PHP連接數(shù)據(jù)庫,從數(shù)據(jù)庫中獲取分析后的數(shù)據(jù),前臺通過ichartjs和HTML5將數(shù)據(jù)繪制成圖像和表格。

        本系統(tǒng)基本按照原定計劃,根據(jù)當(dāng)前高校網(wǎng)絡(luò)輿情搜集、研判的基本規(guī)律,初步完成“基于易班的高校網(wǎng)絡(luò)輿情知識庫系統(tǒng)建設(shè)”第一期相關(guān)任務(wù),研究成果兼具理論性和應(yīng)用性,有較好的參考價值。第二期開發(fā)階段,我們將從以下幾個方面進行推進:一是子知識庫建立不斷完善,在前期易班熱點人物知識庫、易班熱詞知識庫、易班熱點貼文知識庫的基礎(chǔ)上,拓展功能,完成易班網(wǎng)絡(luò)特殊時段等子庫的開發(fā)工作。二是知識庫的數(shù)據(jù)需要增大容量,囿于硬件基礎(chǔ),目前知識庫系統(tǒng)的數(shù)據(jù)僅能以東華大學(xué)易班平臺所有貼文為樣本,并不能建立起易班全網(wǎng)的輿情知識庫系統(tǒng)。在后續(xù)研究中,應(yīng)不斷擴充樣本容量,從而實現(xiàn)更全面的輿情監(jiān)控。三是知識庫的成果需進一步推廣。從研究成果來看,熱點事件、熱點人物和熱詞的查詢已經(jīng)實現(xiàn)。這對于當(dāng)前易班教師用戶來說,是提升易班用戶友好感的一項重要服務(wù)。因此,希望能夠?qū)⒈狙芯砍晒盎谝装嗟母咝>W(wǎng)絡(luò)輿情知識庫系統(tǒng)”軟件推廣至易班教師用戶,為教師提供更多樣化的服務(wù)。

        易班作為滬上各高校師生活躍度最高的社交平臺之一,為我們深入研究高校學(xué)生需求、把握并研判高校網(wǎng)絡(luò)輿情提供了一個友好的網(wǎng)絡(luò)平臺。然而,隨著易班的快速發(fā)展,基于易班的各類高校網(wǎng)絡(luò)輿情信息呈海量增長,監(jiān)測和研判高校網(wǎng)絡(luò)輿情需要強有力的信息搜索技術(shù)?;诖?,本文提出易班環(huán)境下的高校網(wǎng)絡(luò)輿情知識庫平臺建設(shè)研究,在考慮信息采集的深度和廣度的同時, 進一步提高精度與準(zhǔn)度,并結(jié)合“東華大學(xué)計算機科學(xué)與技術(shù)學(xué)院易班網(wǎng)絡(luò)輿情知識庫系統(tǒng)”的開發(fā)工作,將理論研究和實踐應(yīng)用有機結(jié)合。高校網(wǎng)絡(luò)輿情知識庫平臺建設(shè)順應(yīng)數(shù)字時代的客觀要求,其勢在必行。期望易班環(huán)境下的高校網(wǎng)絡(luò)輿情知識庫平臺建設(shè)為大數(shù)據(jù)時代下的網(wǎng)絡(luò)輿情管理體系建設(shè)提供有效借鑒和參考。

        [1] 陶宇煒,熊長江,王娟琳.高校網(wǎng)絡(luò)輿情信息監(jiān)測管理體系的構(gòu)建研究[J].現(xiàn)代教育技術(shù),2013,(12):111-113.

        [2] 陳然,吳桂山.新媒體事件對大學(xué)生價值觀教育影響的初步研究——易班網(wǎng)絡(luò)輿情研究系列[J].中國科教創(chuàng)新導(dǎo)刊,2013,(10):88-89.

        [3] 曾潤喜.網(wǎng)絡(luò)輿情管控工作機制研究,圖書情報工作,2009,(18):79-82.

        [4] 張建利,李羽佳.基于易班平臺的高校網(wǎng)絡(luò)輿情事件化解與引導(dǎo)機制研究[J].思想理論教育,2014,(9):81-84.

        [5] 曾陽素,劉水強,伍雁鵬,等.對高校網(wǎng)絡(luò)輿情系統(tǒng)建設(shè)的幾點思考[J].邵陽學(xué)院學(xué)報:自然科學(xué)版,2012,(4):25-28.

        2015-12-21

        2014年度上海學(xué)校德育實踐研究課題“基于易班的高校網(wǎng)絡(luò)輿情知識庫建設(shè)”(項目編號:2014-D-116)的研究成果。

        虞晨潔(1981—),女,上海人,講師,碩士,研究方向為思想政治教育。E-mail:yuchenjie@dhu.edu.cn

        G641

        A

        1009-9034(2016)02-0069-06

        猜你喜歡
        易班熱詞知識庫
        熱詞
        時代郵刊(2021年8期)2021-11-26 12:48:48
        “三全育人”視域下高校完善“易班”建設(shè)探析
        熱詞
        熱詞
        淺議易班在高校共青團改革中的作用
        活力(2019年15期)2019-09-25 07:23:08
        基于TRIZ與知識庫的創(chuàng)新模型構(gòu)建及在注塑機設(shè)計中的應(yīng)用
        十九大熱詞 我踐行
        少先隊活動(2018年8期)2018-12-29 12:15:54
        高等學(xué)校易班平臺推廣建設(shè)探析
        輔導(dǎo)員應(yīng)用“易班”開展工作的思考與建議
        高速公路信息系統(tǒng)維護知識庫的建立和應(yīng)用
        成年在线观看免费视频| 亚洲午夜无码久久久久软件| 人妻少妇精品视频中文字幕国语| 各类熟女熟妇激情自拍| 久久性爱视频| 18无码粉嫩小泬无套在线观看| 女同中的p是什么意思| 白色白色视频在线观看| 国产成人无码av一区二区在线观看| 看全色黄大色大片免费久久| 久久精品免费无码区| 国产一区二区av在线观看| 日韩无码专区| 无码精品人妻一区二区三区人妻斩 | 1000部拍拍拍18勿入免费视频下载| 久久久久久AV无码成人| 蜜臀av在线一区二区尤物| 门卫又粗又大又长好爽| 亚洲成色在线综合网站| 久天啪天天久久99久孕妇| 夜夜高潮夜夜爽免费观看| 国产69精品久久久久777| 国产一区免费观看| 国模一区二区三区白浆| 五月激情综合婷婷六月久久| 一性一交一口添一摸视频| 国产精品玖玖玖在线资源| 人妻系列影片无码专区| 国产在线精品观看一区二区三区| 国产精品久久久久9999无码| 免费无码肉片在线观看| 国产免费激情小视频在线观看| 国产精品国产三级国产av18 | 久久人人妻人人做人人爽| 欧美1区二区三区公司| 一区二区三区四区亚洲免费| 三年片免费观看大全有| 久久精品无码一区二区乱片子| 日日麻批视频免费播放器| 亚洲国产av无码精品| 日日干夜夜操高清视频|