劉嘉欣 陳戲墨 柯家海
(廣州醫(yī)科大學(xué)信息與現(xiàn)代教育技術(shù)中心 廣東省廣州市 511483)
大數(shù)據(jù)時(shí)代,數(shù)據(jù)挖掘、人工智能等技術(shù)的快速發(fā)展,對(duì)社會(huì)各領(lǐng)域產(chǎn)生深刻影響。高校統(tǒng)戰(zhàn)工作順應(yīng)技術(shù)發(fā)展的形式逐漸實(shí)現(xiàn)信息化已經(jīng)是大勢(shì)所趨。高校統(tǒng)戰(zhàn)工作是全黨統(tǒng)一戰(zhàn)線工作的重要組成部分,也是高校黨建工作的重要內(nèi)容。新時(shí)代下,高校統(tǒng)戰(zhàn)工作面臨著新使命、新機(jī)遇和新挑戰(zhàn)。大數(shù)據(jù)技術(shù)以其數(shù)據(jù)總量巨大、數(shù)據(jù)種類繁多、數(shù)據(jù)處理速度快等特點(diǎn),其多樣性、關(guān)聯(lián)性、包容性等方面的優(yōu)勢(shì),為高校統(tǒng)戰(zhàn)工作信息化建設(shè)提供了廣闊的平臺(tái)。鑒于此,本研究立足于高校統(tǒng)戰(zhàn)工作,探索基于大數(shù)據(jù)技術(shù)的高校統(tǒng)戰(zhàn)工作信息化平臺(tái)的建設(shè),對(duì)擴(kuò)展高校統(tǒng)戰(zhàn)工作范圍、提升高校統(tǒng)戰(zhàn)工作影響力與成效,具有重要的理論意義與指導(dǎo)實(shí)踐的價(jià)值。
統(tǒng)一戰(zhàn)線工作是黨的事業(yè)取得勝利的重要法寶。高校統(tǒng)戰(zhàn)工作是黨的統(tǒng)戰(zhàn)工作的重中之重,也是高校黨建工作的重要內(nèi)容。高校統(tǒng)戰(zhàn)工作的第一要?jiǎng)?wù)是做好黨外知識(shí)分子的團(tuán)結(jié)工作[1]。新形勢(shì)下高校統(tǒng)戰(zhàn)工作范圍和對(duì)象主要是高校黨外知識(shí)分子,包括民主黨派成員,無(wú)黨派人士,出國(guó)和歸國(guó)留學(xué)人員,少數(shù)民族師生,在高校工作和學(xué)習(xí)的港澳同胞、臺(tái)灣同胞和華僑、歸僑及僑眷等[2]。高校統(tǒng)戰(zhàn)工作范圍廣、任務(wù)重、工作性質(zhì)綜合性強(qiáng),承擔(dān)著民主黨派和無(wú)黨派人士工作、黨外知識(shí)分子工作、民族工作、港澳臺(tái)僑海外統(tǒng)一戰(zhàn)線工作、黨外代表人士隊(duì)伍建設(shè)等方面的任務(wù),在黨的統(tǒng)一戰(zhàn)線事業(yè)中具有特殊的地位和作用[3]。
進(jìn)入新時(shí)代,高校統(tǒng)戰(zhàn)工作呈現(xiàn)出統(tǒng)戰(zhàn)對(duì)象多元化、統(tǒng)戰(zhàn)手段與方式多樣化、統(tǒng)戰(zhàn)環(huán)境復(fù)雜化等新特點(diǎn)[3]。為適應(yīng)新時(shí)代日益增長(zhǎng)的高校統(tǒng)戰(zhàn)工作需求,目前已有較多學(xué)者對(duì)新時(shí)代高校統(tǒng)戰(zhàn)工作方式進(jìn)行相關(guān)研究。新時(shí)代高校統(tǒng)戰(zhàn)工作的主要方式包括:信息宣傳;主題教育培訓(xùn)以及意識(shí)形態(tài)教育;支持建言獻(xiàn)策,參政議政,提供在線訪談、意見征集等形式的交流活動(dòng);建立資料動(dòng)態(tài)管理檔案;樹立“大統(tǒng)戰(zhàn)”思維,共享平臺(tái)資源等。
當(dāng)前高校統(tǒng)戰(zhàn)工作信息化建設(shè)的研究主要涉及兩個(gè)方面:一是探討新技術(shù)在高校統(tǒng)戰(zhàn)工作中的意義與應(yīng)用。張澤天[4]認(rèn)為互聯(lián)網(wǎng)與高校統(tǒng)戰(zhàn)工作進(jìn)行深度融合,是高校統(tǒng)戰(zhàn)工作創(chuàng)新的內(nèi)在需要。孫鵬等人[5]探討了大數(shù)據(jù)時(shí)代高校統(tǒng)戰(zhàn)工作的有效路徑,認(rèn)為大數(shù)據(jù)技術(shù)為高校統(tǒng)戰(zhàn)工作搭建便捷的網(wǎng)絡(luò)平臺(tái)。陶儀聲等人[6]認(rèn)為人工智能等技術(shù)可促進(jìn)統(tǒng)戰(zhàn)工作的數(shù)據(jù)整理工作,并可通過(guò)對(duì)人物畫像等手段預(yù)測(cè)統(tǒng)戰(zhàn)對(duì)象的行為動(dòng)態(tài),提升統(tǒng)戰(zhàn)工作的針對(duì)性。二是探討現(xiàn)階段高校統(tǒng)戰(zhàn)工作信息系統(tǒng)建設(shè)存在的問(wèn)題。劉娟等人[7]提出高校統(tǒng)戰(zhàn)工作信息化存在的問(wèn)題主要是忽視對(duì)統(tǒng)戰(zhàn)網(wǎng)站的管理;缺乏信息服務(wù)意識(shí);無(wú)法實(shí)現(xiàn)信息資源共享。李江濱等人[8]對(duì)42所一流大學(xué)建設(shè)高校的統(tǒng)戰(zhàn)宣傳網(wǎng)站進(jìn)行調(diào)研,發(fā)現(xiàn)普遍存在宣傳方式單一、內(nèi)容單薄、缺乏趣味性等問(wèn)題。大部分高校的統(tǒng)戰(zhàn)宣傳缺乏交流,只是單向的信息傳輸,缺乏互動(dòng)和反饋。
綜上所述,目前很少有學(xué)者根據(jù)高校統(tǒng)戰(zhàn)工作的業(yè)務(wù)特點(diǎn)和工作需求,探討高校統(tǒng)戰(zhàn)工作信息化平臺(tái)的建設(shè)。而且當(dāng)前的建設(shè)普遍存在交互性差、功能少、使用率低等問(wèn)題,已經(jīng)無(wú)法滿足新時(shí)代下高校統(tǒng)戰(zhàn)工作的需求。
鑒于此,本研究順應(yīng)時(shí)代與技術(shù)的潮流,根據(jù)新時(shí)代高校統(tǒng)戰(zhàn)工作的業(yè)務(wù)內(nèi)容與特點(diǎn),探索高校統(tǒng)戰(zhàn)工作平臺(tái)的信息化建設(shè),試圖基于大數(shù)據(jù)技術(shù)對(duì)高校統(tǒng)戰(zhàn)工作平臺(tái)進(jìn)行設(shè)計(jì),以滿足新時(shí)代高校統(tǒng)戰(zhàn)工作需求。
關(guān)于大數(shù)據(jù)目前尚無(wú)統(tǒng)一的定義。維基百科對(duì)大數(shù)據(jù)的定義是:利用常用軟件工具捕獲、管理和處理數(shù)據(jù)所耗時(shí)間超過(guò)可容忍時(shí)間的數(shù)據(jù)集[9]。相較于傳統(tǒng)數(shù)據(jù),業(yè)界普遍認(rèn)為大數(shù)據(jù)具有5V 特征:海量性(Volume)、多樣性(Variety)、高速性(Velocity)、價(jià)值性(Value)、真實(shí)性(Veracity)。[10]海量性是指數(shù)據(jù)量巨大,規(guī)模達(dá)到TB 級(jí)及PB 級(jí)。多樣性是指數(shù)據(jù)格式與類型繁多。高速性是指數(shù)據(jù)創(chuàng)建、處理和分析的速度快。價(jià)值性指大數(shù)據(jù)的價(jià)值密度低。真實(shí)性是數(shù)據(jù)的準(zhǔn)確性和可信賴度,即數(shù)據(jù)的質(zhì)量。
大數(shù)據(jù)技術(shù)是指從海量不同類型的數(shù)據(jù)中,快速獲得有價(jià)值信息的能力。大數(shù)據(jù)處理的基本流程包括數(shù)據(jù)抽取與集成、數(shù)據(jù)分析以及數(shù)據(jù)解釋。[9]首先,對(duì)數(shù)據(jù)源的數(shù)據(jù)進(jìn)行采集、抽取、清洗,從中提取出關(guān)系和實(shí)體、經(jīng)過(guò)關(guān)聯(lián)與聚合等算法計(jì)算后采用統(tǒng)一定義的結(jié)構(gòu)來(lái)存儲(chǔ)這些數(shù)據(jù)。[9]接著,實(shí)現(xiàn)對(duì)數(shù)據(jù)的深加工。根據(jù)業(yè)務(wù)需要,建立適用于業(yè)務(wù)的數(shù)據(jù)統(tǒng)計(jì)分析模型,建立大數(shù)據(jù)運(yùn)行處理平臺(tái),運(yùn)用數(shù)據(jù)挖掘、深度學(xué)習(xí)等算法從生產(chǎn)數(shù)據(jù)集中挖掘出數(shù)據(jù)內(nèi)在的價(jià)值,為業(yè)務(wù)系統(tǒng)提供數(shù)據(jù)和決策支持。
大數(shù)據(jù)是對(duì)巨量的數(shù)據(jù)進(jìn)行分布式的數(shù)據(jù)挖據(jù),需要依托云計(jì)算的分布式處理、分布式數(shù)據(jù)庫(kù)和云存儲(chǔ)、虛擬化技術(shù)等,以有效并快速地處理大量的容忍經(jīng)過(guò)時(shí)間內(nèi)的數(shù)據(jù)。大數(shù)據(jù)的核心技術(shù),一般包含了數(shù)據(jù)庫(kù)采集工具,基于MPP 架構(gòu)的大規(guī)模并行處理數(shù)據(jù)庫(kù)、互聯(lián)網(wǎng)與云計(jì)算平臺(tái)、分布式文件系統(tǒng)等。Hadoop 憑其開源性、高容錯(cuò)性、高拓展性、以及高擴(kuò)展性的優(yōu)點(diǎn),成為了目前最為流行的大數(shù)據(jù)處理平臺(tái)。[9]Hadoop 為大數(shù)據(jù)的處理提供了并行計(jì)算的框架,包括提供存儲(chǔ)的分布式文件系統(tǒng)HDFS 并行計(jì)算模型以提供計(jì)算框架的MapReduce 編程模型。[10]Hadoop 是一個(gè)開源的大數(shù)據(jù)分析軟件,目前被廣泛認(rèn)可適合應(yīng)用于大數(shù)據(jù)存儲(chǔ)和大數(shù)據(jù)分析。
圖1:基于大數(shù)據(jù)的高校統(tǒng)戰(zhàn)工作平臺(tái)系統(tǒng)架構(gòu)
圖2:高校統(tǒng)戰(zhàn)工作平臺(tái)大數(shù)據(jù)處理流程
大數(shù)據(jù)技術(shù)通過(guò)對(duì)高校統(tǒng)戰(zhàn)對(duì)象在線行為的數(shù)據(jù)采集與挖據(jù),從海量數(shù)據(jù)中提取出政策制定者、管理人員、研究員認(rèn)為有價(jià)值與有需求的數(shù)據(jù)流,瞬間實(shí)現(xiàn)統(tǒng)計(jì)分析、輿情預(yù)警、決策支持等功能,用于高校統(tǒng)戰(zhàn)工作的管理與服務(wù)、發(fā)展與創(chuàng)新。大數(shù)據(jù)技術(shù)對(duì)高校統(tǒng)戰(zhàn)工作的支持具體體現(xiàn)在以下三個(gè)方面:
3.2.1 大數(shù)據(jù)技術(shù)支持科學(xué)的決策管理
大數(shù)據(jù)技術(shù)對(duì)大規(guī)模數(shù)據(jù)進(jìn)行采集、挖掘、清洗,經(jīng)過(guò)各種算法與模型的計(jì)算分析,最后以可視化的方式將科學(xué)且有效的數(shù)據(jù)呈現(xiàn)出來(lái)。統(tǒng)戰(zhàn)部門在制定政策和規(guī)范時(shí),依靠大數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,可以減少因缺少數(shù)據(jù)支撐而帶來(lái)的偏差,提高決策的科學(xué)性。
3.2.2 大數(shù)據(jù)技術(shù)支持精準(zhǔn)的輿情預(yù)警
大數(shù)據(jù)技術(shù)能把數(shù)學(xué)算法運(yùn)用到海量的數(shù)據(jù)上來(lái)發(fā)現(xiàn)以往難以察覺(jué)的事物運(yùn)行規(guī)律,并據(jù)此預(yù)測(cè)可能發(fā)生的事情。統(tǒng)戰(zhàn)部門可以追蹤到統(tǒng)戰(zhàn)對(duì)象的基本狀況、思想動(dòng)態(tài)、關(guān)注焦點(diǎn)以及意見建議,對(duì)其思想狀況、立場(chǎng)傾向等進(jìn)行分析,針對(duì)異?,F(xiàn)象構(gòu)建輿情預(yù)警及應(yīng)急處理機(jī)制。
3.2.3 大數(shù)據(jù)技術(shù)支持個(gè)性化的資源推薦
大數(shù)據(jù)技術(shù)對(duì)在線行為進(jìn)行數(shù)據(jù)挖掘、分析,構(gòu)建人物特征模型,采用人物特征和資源庫(kù)特征相互匹配的方法實(shí)現(xiàn)信息資源的個(gè)性化推送。統(tǒng)戰(zhàn)部門可以給統(tǒng)戰(zhàn)對(duì)象推送個(gè)性化的宣傳信息與教育資源,有針對(duì)性地開展思想政治工作。
基于上述大數(shù)據(jù)技術(shù),結(jié)合高校統(tǒng)戰(zhàn)工作的業(yè)務(wù)內(nèi)容與特點(diǎn),本研究設(shè)計(jì)了基于大數(shù)據(jù)的高校統(tǒng)戰(zhàn)工作平臺(tái)架構(gòu)。該架構(gòu)設(shè)計(jì)采用經(jīng)典三層架構(gòu):表現(xiàn)層、業(yè)務(wù)邏輯層和數(shù)據(jù)訪問(wèn)層,目的是提高各模塊的內(nèi)聚程度,減少各模塊單元之間的耦合性,增強(qiáng)平臺(tái)系統(tǒng)的可維護(hù)性和擴(kuò)展性,如圖1所示。
4.1.1 表現(xiàn)層
其主要是展示平臺(tái)系統(tǒng)界面,實(shí)現(xiàn)用戶界面功能,將用戶的需求傳達(dá)和反饋。該平臺(tái)系統(tǒng)界面展示支持多語(yǔ)種界面切換的需求,呈現(xiàn)了平臺(tái)的主要功能,包括門戶網(wǎng)站、互動(dòng)論壇、在線講堂等功能。
4.1.2 業(yè)務(wù)邏輯層
其主要功能是對(duì)具體問(wèn)題進(jìn)行邏輯判斷與執(zhí)行操作,完成所有業(yè)務(wù)邏輯的處理。根據(jù)技術(shù)范疇的不同,各項(xiàng)業(yè)務(wù)邏輯可分為兩大類:基礎(chǔ)業(yè)務(wù)服務(wù),提供諸如用戶管理、文件管理、數(shù)據(jù)統(tǒng)計(jì)等功能;大數(shù)據(jù)服務(wù),為平臺(tái)提供大數(shù)據(jù)分析能力,提供如大數(shù)據(jù)分析、預(yù)警提示、個(gè)性化資源推薦等功能。
4.1.3 數(shù)據(jù)訪問(wèn)層
其主要功能是負(fù)責(zé)數(shù)據(jù)庫(kù)的訪問(wèn),對(duì)數(shù)據(jù)庫(kù)完成增加、刪除、修改、查詢操作。該層主要包括用戶庫(kù)、業(yè)務(wù)庫(kù)、文件庫(kù)、互聯(lián)網(wǎng)數(shù)據(jù)、統(tǒng)戰(zhàn)對(duì)象模型庫(kù)等。其中,模型參數(shù)庫(kù)中存儲(chǔ)了所有統(tǒng)戰(zhàn)對(duì)象的模型,用于個(gè)性化資源推薦。
為了滿足新時(shí)代高校統(tǒng)戰(zhàn)工作的業(yè)務(wù)需求,本研究基于大數(shù)據(jù)技術(shù),從宣傳、社交、學(xué)習(xí)、服務(wù)、綜合管理五大方面對(duì)高校統(tǒng)戰(zhàn)工作平臺(tái)的功能模塊進(jìn)行設(shè)計(jì)。主要功能包括了門戶網(wǎng)站,個(gè)人中心,互動(dòng)論壇,在線課堂,在線意見箱,資源個(gè)性化推薦、統(tǒng)計(jì)分析,預(yù)警提示。
門戶網(wǎng)站是提供信息宣傳與綜合服務(wù)的界面,集成了平臺(tái)的主要功能,主要用于發(fā)布高校統(tǒng)戰(zhàn)工作的宣傳內(nèi)容,包括政策、理論研究、信息動(dòng)態(tài)、工作通知、統(tǒng)戰(zhàn)新聞等黨務(wù)政務(wù)信息。
個(gè)人中心是統(tǒng)戰(zhàn)對(duì)象個(gè)人檔案管理中心,可修改、存儲(chǔ)個(gè)人信息資料,記錄個(gè)人使用平臺(tái)的動(dòng)態(tài),提供平臺(tái)相關(guān)應(yīng)用的快捷入口。
互動(dòng)論壇要是為統(tǒng)戰(zhàn)工作者與統(tǒng)戰(zhàn)對(duì)象搭建一個(gè)溝通交流的平臺(tái),統(tǒng)戰(zhàn)工作者可以在論壇組織線上聯(lián)誼活動(dòng),發(fā)布在線訪談、網(wǎng)絡(luò)調(diào)查等。統(tǒng)戰(zhàn)對(duì)象也在可以在論壇發(fā)布主題討論。
在線講堂主要用于開展教育培訓(xùn)工作,對(duì)統(tǒng)戰(zhàn)對(duì)象進(jìn)行主題教育培訓(xùn)以及意識(shí)形態(tài)教育。統(tǒng)戰(zhàn)工作者可以在該模塊建立在線課程,發(fā)布微視頻供統(tǒng)戰(zhàn)對(duì)象在線學(xué)習(xí)。
在線意見箱是供統(tǒng)戰(zhàn)對(duì)象建言獻(xiàn)策、參政議政的渠道。統(tǒng)戰(zhàn)對(duì)象可以提交建議和意見,參與政治活動(dòng)。這有利于提高統(tǒng)戰(zhàn)對(duì)象的政治參與度。
資源個(gè)性化推薦是通過(guò)大數(shù)據(jù)、人物畫像等技術(shù),向統(tǒng)戰(zhàn)對(duì)象提供高效的、富有針對(duì)性的個(gè)性化資源。資源的形式是多樣化的,包括文檔、視頻等。個(gè)性化的資源推送服務(wù)不僅可以提高資源的利用率,也可以提高統(tǒng)戰(zhàn)工作的成效。
統(tǒng)計(jì)分析與預(yù)警提示是對(duì)統(tǒng)戰(zhàn)對(duì)象在線行為進(jìn)行統(tǒng)計(jì),通過(guò)運(yùn)用相關(guān)模型算法計(jì)算,對(duì)數(shù)據(jù)進(jìn)行分析,結(jié)果用可視化的方式呈現(xiàn)出來(lái)。同時(shí),通過(guò)設(shè)置預(yù)警參數(shù),當(dāng)數(shù)據(jù)出現(xiàn)異常便給管理員相關(guān)的提示。
鑒于上述大數(shù)據(jù)的關(guān)鍵技術(shù),本研究對(duì)高校統(tǒng)戰(zhàn)工作平臺(tái)的大數(shù)據(jù)處理流程進(jìn)行了設(shè)計(jì)。該處理流程共四個(gè)環(huán)節(jié),包括了數(shù)據(jù)源、數(shù)據(jù)處理與存儲(chǔ)、數(shù)據(jù)建模與挖掘、數(shù)據(jù)應(yīng)用,如圖2所示。
高校統(tǒng)戰(zhàn)工作平臺(tái)的數(shù)據(jù)源于兩方面,一方面是內(nèi)部數(shù)據(jù),即來(lái)源于高校統(tǒng)戰(zhàn)工作平臺(tái)產(chǎn)生的數(shù)據(jù),一方面是外部互聯(lián)網(wǎng)的數(shù)據(jù),即通過(guò)網(wǎng)絡(luò)爬蟲引擎抓取數(shù)據(jù),再通過(guò)關(guān)鍵詞過(guò)濾等操作進(jìn)行篩選和分析,從而實(shí)現(xiàn)從互聯(lián)網(wǎng)上獲取數(shù)據(jù)。在數(shù)據(jù)處理與存儲(chǔ)環(huán)節(jié),對(duì)采集到的原始數(shù)據(jù)進(jìn)行數(shù)據(jù)清晰、數(shù)據(jù)關(guān)聯(lián)、數(shù)據(jù)加工與數(shù)據(jù)轉(zhuǎn)換等操作,形成了可用于生產(chǎn)系統(tǒng)的數(shù)據(jù),比如元數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)庫(kù)等,以Hadoop 分布式存儲(chǔ)的方式存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)里。在數(shù)據(jù)建模與挖掘環(huán)節(jié)里,通過(guò)計(jì)算引擎與存儲(chǔ)引擎進(jìn)行數(shù)據(jù)挖掘、算法分析。根據(jù)高校統(tǒng)戰(zhàn)工作平臺(tái)的需求確定建模方式,通過(guò)不斷測(cè)試來(lái)調(diào)整、優(yōu)化模型,確定最優(yōu)的算法模型庫(kù)。在數(shù)據(jù)應(yīng)用環(huán)節(jié),結(jié)合高校統(tǒng)戰(zhàn)工作的需求,提供可視化統(tǒng)計(jì)報(bào)表、智能預(yù)警方案、資源個(gè)性化推送等數(shù)據(jù)服務(wù)。
本研究設(shè)計(jì)的基于大數(shù)據(jù)的高校統(tǒng)戰(zhàn)工作平臺(tái)有助于推動(dòng)高校創(chuàng)新統(tǒng)戰(zhàn)工作方式,提高高校統(tǒng)戰(zhàn)工作的科學(xué)性與實(shí)效性。同時(shí),大數(shù)據(jù)技術(shù)也為高校工作帶來(lái)了挑戰(zhàn)?;诖髷?shù)據(jù)的高校統(tǒng)戰(zhàn)工作平臺(tái)存儲(chǔ)了大量個(gè)人信息數(shù)據(jù),涉及個(gè)人信息隱私,未來(lái),要加強(qiáng)對(duì)平臺(tái)的安全維護(hù)工作,探索系統(tǒng)的安全保護(hù)措施;也要避免成為數(shù)據(jù)孤島,探索多端口對(duì)接技術(shù),以實(shí)現(xiàn)與校內(nèi)其他系統(tǒng)的數(shù)據(jù)互聯(lián)互通,與其他高校統(tǒng)戰(zhàn)工作平臺(tái)的資源共享。