陳 雄,杜義華,王閏強(qiáng)
(中國(guó)科學(xué)院 計(jì)算機(jī)網(wǎng)絡(luò)信息中心,北京 100190)
隨著Web 3.0 時(shí)代到來(lái),基于移動(dòng)互聯(lián)網(wǎng)的微博、微信已大規(guī)模應(yīng)用,政府機(jī)構(gòu)紛紛開通官方微博和微信,同時(shí)抖音、快手等短視頻應(yīng)用也迅猛發(fā)展,部分官方機(jī)構(gòu)已陸續(xù)入駐開通賬號(hào).新時(shí)代政務(wù)信息門戶發(fā)布已不局限于傳統(tǒng)網(wǎng)站,還包括微博、微信及短視頻等各類第三方自媒體渠道.
2017年,《政府網(wǎng)站發(fā)展指引》[1]發(fā)布,國(guó)家對(duì)于政務(wù)網(wǎng)站集約化要求更加清晰.按照統(tǒng)一標(biāo)準(zhǔn)體系、統(tǒng)一技術(shù)平臺(tái)、統(tǒng)一安全防護(hù)、統(tǒng)一運(yùn)維監(jiān)管原則,集中管理信息數(shù)據(jù),集中提供內(nèi)容服務(wù),實(shí)現(xiàn)政府網(wǎng)站資源優(yōu)化融合、平臺(tái)整合安全、數(shù)據(jù)互認(rèn)共享、管理統(tǒng)籌規(guī)范、服務(wù)便捷高效,以此實(shí)現(xiàn)集約化是解決政府網(wǎng)站“信息孤島”等問(wèn)題的有效途徑.
對(duì)于包含多級(jí)組織機(jī)構(gòu)、需運(yùn)行多個(gè)網(wǎng)站和新媒體賬號(hào)的政務(wù)機(jī)構(gòu),按照集約化原則建設(shè)信息傳播平臺(tái),既是機(jī)遇也是挑戰(zhàn):一方面,可以優(yōu)化重組各類信息系統(tǒng),進(jìn)一步梳理優(yōu)化政務(wù)信息傳播環(huán)境;另一方面,面臨信息數(shù)據(jù)規(guī)模增大、多組織信息快速共享及網(wǎng)絡(luò)安全防護(hù)等壓力.
按照集約化建設(shè)原則,部分機(jī)構(gòu)已建設(shè)新媒體集成發(fā)布平臺(tái)[2],實(shí)現(xiàn)系統(tǒng)的統(tǒng)一認(rèn)證及各媒體間內(nèi)容關(guān)聯(lián)和分享,初步解決多渠道信息發(fā)布和統(tǒng)一集成管理的問(wèn)題.對(duì)于存在多層級(jí)隸屬關(guān)系的組織機(jī)構(gòu)體系,各機(jī)構(gòu)按要求建設(shè)網(wǎng)站,結(jié)合自身需求已開設(shè)中英文網(wǎng)站、移動(dòng)APP、微博、微信公眾號(hào)、手機(jī)報(bào)、電子雜志等.但隨著組織機(jī)構(gòu)發(fā)展,網(wǎng)站及新媒體各類賬號(hào)規(guī)模不斷增大,各業(yè)務(wù)系統(tǒng)間接口調(diào)用頻繁、耦合度高,在實(shí)際應(yīng)用中存在各種問(wèn)題.
(1)業(yè)務(wù)系統(tǒng)間接口耦合
各業(yè)務(wù)系統(tǒng)間數(shù)據(jù)推送等交互功能為系統(tǒng)間接口直接調(diào)用,不能控制系統(tǒng)間接口調(diào)用權(quán)限,監(jiān)測(cè)各系統(tǒng)接口狀態(tài).當(dāng)業(yè)務(wù)系統(tǒng)調(diào)整接口參數(shù)或進(jìn)行業(yè)務(wù)升級(jí)時(shí),其他相關(guān)業(yè)務(wù)系統(tǒng)需要相應(yīng)調(diào)整調(diào)用方式,系統(tǒng)間耦合度高,需提供相對(duì)獨(dú)立的接口網(wǎng)關(guān)服務(wù),統(tǒng)一管理接口調(diào)用、狀態(tài)及權(quán)限等.
(2)各業(yè)務(wù)系統(tǒng)中組織機(jī)構(gòu)關(guān)系體現(xiàn)
由于網(wǎng)站、微博、微信公眾號(hào)等內(nèi)容管理系統(tǒng)相對(duì)獨(dú)立運(yùn)行,機(jī)構(gòu)在同時(shí)開設(shè)中英文網(wǎng)站、新浪微博官方賬號(hào)、微信訂閱號(hào)的情況下,各業(yè)務(wù)系統(tǒng)間對(duì)同一機(jī)構(gòu)網(wǎng)站或新媒體無(wú)法關(guān)聯(lián)體現(xiàn)屬于同一組織機(jī)構(gòu),無(wú)法方便快捷統(tǒng)計(jì)機(jī)構(gòu)下站點(diǎn)、新媒體賬號(hào)等運(yùn)行情況;多級(jí)組織機(jī)構(gòu)下各機(jī)構(gòu)網(wǎng)站或新媒體,在業(yè)務(wù)系統(tǒng)中無(wú)法體現(xiàn)隸屬層級(jí)關(guān)系.因此,需在平臺(tái)中提供統(tǒng)一的組織機(jī)構(gòu)管理和開放接口,供各業(yè)務(wù)系統(tǒng)關(guān)聯(lián)調(diào)用.
(3)發(fā)布信息多渠道流轉(zhuǎn)查詢
信息經(jīng)過(guò)二次編輯以不同形式在各渠道發(fā)布后,在各業(yè)務(wù)系統(tǒng)中只能查看信息最終處理結(jié)果,無(wú)法查看信息在各業(yè)務(wù)系統(tǒng)的具體流轉(zhuǎn)情況,包括信息的相關(guān)操作用戶、所屬業(yè)務(wù)系統(tǒng)以及相關(guān)處理過(guò)程等.因此,需在各業(yè)務(wù)系統(tǒng)中提供稿件統(tǒng)一跟蹤查詢功能,查詢展示稿件在平臺(tái)中詳細(xì)流轉(zhuǎn)過(guò)程.
(4)多渠道傳播效果綜合統(tǒng)計(jì)
傳播效果統(tǒng)計(jì)包括信息瀏覽量、訪客數(shù)、點(diǎn)贊數(shù)、評(píng)論數(shù)等常用數(shù)據(jù),以及機(jī)構(gòu)信息更新量和機(jī)構(gòu)間信息推送相關(guān)統(tǒng)計(jì)數(shù)據(jù).各渠道傳播數(shù)據(jù)經(jīng)過(guò)匯總后只能分開獨(dú)立查看,不能查詢信息在各渠道傳播效果的綜合結(jié)果,也不能基于機(jī)構(gòu)整合所有渠道的傳播效果進(jìn)行綜合排名.因此,需在系統(tǒng)中提供按信息、機(jī)構(gòu)等維度統(tǒng)計(jì)的各個(gè)渠道綜合傳播效果統(tǒng)計(jì)功能.
(5)傳播信息類別統(tǒng)一標(biāo)識(shí)
數(shù)據(jù)在各業(yè)務(wù)系統(tǒng)中有不同信息類別標(biāo)識(shí),每個(gè)業(yè)務(wù)系統(tǒng)根據(jù)自身功能需求有不同分類標(biāo)準(zhǔn),網(wǎng)站通過(guò)欄目類別標(biāo)識(shí),微信、微博等數(shù)據(jù)通過(guò)信息分類標(biāo)識(shí),通過(guò)信息資源池匯聚后,不能對(duì)匯總數(shù)據(jù)按照統(tǒng)一標(biāo)準(zhǔn)進(jìn)行類別標(biāo)識(shí),不利于進(jìn)一步數(shù)據(jù)分類統(tǒng)計(jì)和分析.因此,需在系統(tǒng)中提供統(tǒng)一規(guī)范的資源標(biāo)識(shí)功能,供各業(yè)務(wù)系統(tǒng)按標(biāo)準(zhǔn)對(duì)信息資源標(biāo)記分類.
針對(duì)現(xiàn)有平臺(tái)運(yùn)行中的各類問(wèn)題,需基于現(xiàn)有平臺(tái)調(diào)整平臺(tái)運(yùn)行業(yè)務(wù)流程,以統(tǒng)一組織機(jī)構(gòu)、共享稿件、資源標(biāo)識(shí)、系統(tǒng)接口為平臺(tái)公共基礎(chǔ)服務(wù),以數(shù)據(jù)資源全集為平臺(tái)公共數(shù)據(jù)服務(wù),實(shí)現(xiàn)信息從生產(chǎn)到傳播、發(fā)布再到分析的全流程管理,形成一體化的政務(wù)信息傳播管理平臺(tái).
平臺(tái)建設(shè)中引入松耦合的微服務(wù)架構(gòu),構(gòu)建平臺(tái)公共基礎(chǔ)服務(wù),建設(shè)統(tǒng)一組織機(jī)構(gòu)庫(kù),實(shí)現(xiàn)平臺(tái)組織機(jī)構(gòu)信息統(tǒng)一管理和接口開放;建設(shè)共享稿件庫(kù),為業(yè)務(wù)系統(tǒng)間數(shù)據(jù)推送提供統(tǒng)一消息隊(duì)列服務(wù);建設(shè)資源標(biāo)識(shí)庫(kù),為業(yè)務(wù)系統(tǒng)提供一致數(shù)據(jù)分類標(biāo)準(zhǔn);建設(shè)平臺(tái)公共接口網(wǎng)關(guān),作為業(yè)務(wù)系統(tǒng)接口調(diào)用的統(tǒng)一入口和分發(fā)路由,實(shí)現(xiàn)接口統(tǒng)一監(jiān)控、權(quán)限校驗(yàn)和審計(jì);建設(shè)數(shù)據(jù)資源全集,匯聚包括文檔、圖片、視頻、文件、站點(diǎn)、欄目、用戶、新媒體賬號(hào)、日志等各類業(yè)務(wù)數(shù)據(jù),實(shí)現(xiàn)海量數(shù)據(jù)統(tǒng)一查詢分析.在不改變業(yè)務(wù)系統(tǒng)已有功能前提下,進(jìn)行系統(tǒng)功能接口改造,統(tǒng)一與接口網(wǎng)關(guān)進(jìn)行對(duì)接,實(shí)現(xiàn)系統(tǒng)間的松耦合和高可用.
在業(yè)務(wù)系統(tǒng)上層構(gòu)建接口網(wǎng)關(guān),統(tǒng)一提供接口調(diào)用的路由服務(wù)、訪問(wèn)控制服務(wù)和狀態(tài)監(jiān)控服務(wù),各業(yè)務(wù)系統(tǒng)接口調(diào)用統(tǒng)一由接口網(wǎng)關(guān)進(jìn)行封裝整合、解析調(diào)度和路由分發(fā),確??蓪?shí)時(shí)監(jiān)控各接口運(yùn)行狀態(tài);組織機(jī)構(gòu)庫(kù)、共享稿件庫(kù)、資源標(biāo)識(shí)庫(kù)作為平臺(tái)公共基礎(chǔ)服務(wù),為各項(xiàng)業(yè)務(wù)系統(tǒng)開放接口,提供包括機(jī)構(gòu)查詢檢索、稿件推送和跟蹤、資源標(biāo)識(shí)查詢等遠(yuǎn)程調(diào)用服務(wù);數(shù)據(jù)資源全集作為平臺(tái)公共數(shù)據(jù)服務(wù),定時(shí)抽取各業(yè)務(wù)系統(tǒng)及公共基礎(chǔ)服務(wù)的運(yùn)行數(shù)據(jù).
如圖1,用戶統(tǒng)一認(rèn)證、各類業(yè)務(wù)系統(tǒng)和公共基礎(chǔ)服務(wù),由原來(lái)系統(tǒng)間相互直接調(diào)用方式,調(diào)整為通過(guò)公共接口網(wǎng)關(guān)進(jìn)行相互調(diào)用.對(duì)于接口調(diào)用方來(lái)說(shuō),公共接口網(wǎng)關(guān)隱藏各個(gè)接口具體細(xì)節(jié),聚合成粗粒度業(yè)務(wù)接口;對(duì)于接口被調(diào)用方來(lái)說(shuō),公共接口網(wǎng)關(guān)集成接口調(diào)用的負(fù)載均衡、權(quán)限驗(yàn)證、參數(shù)過(guò)濾及安全防護(hù)等通用功能,使接口實(shí)現(xiàn)專注于業(yè)務(wù)本身,并為業(yè)務(wù)功能升級(jí)或接口改造時(shí)不停止服務(wù)提供可能.通過(guò)引入公共接口網(wǎng)關(guān),對(duì)于系統(tǒng)間的相互調(diào)用,形成了統(tǒng)一調(diào)度方式、統(tǒng)一安全策略、統(tǒng)一監(jiān)控和日志記錄,進(jìn)一步降低系統(tǒng)間耦合度.
圖1 系統(tǒng)架構(gòu)圖
通過(guò)新建公共接口網(wǎng)關(guān)、組織機(jī)構(gòu)庫(kù)、共享稿件庫(kù)、資源標(biāo)識(shí)庫(kù)、數(shù)據(jù)資源全集等公共服務(wù)系統(tǒng),并對(duì)已有業(yè)務(wù)系統(tǒng)進(jìn)行局部功能調(diào)整,建設(shè)實(shí)現(xiàn)一體化政務(wù)信息傳播平臺(tái).
系統(tǒng)采用Spring Cloud[3]開源項(xiàng)目實(shí)現(xiàn)公共接口網(wǎng)關(guān)對(duì)接口的統(tǒng)一管理調(diào)用,各系統(tǒng)間功能調(diào)用均通過(guò)接口網(wǎng)關(guān)進(jìn)行調(diào)度.主要包括請(qǐng)求聚合、權(quán)限校驗(yàn)、智能路由、接口監(jiān)控、日志記錄等功能.
請(qǐng)求聚合指在各業(yè)務(wù)系統(tǒng)接口服務(wù)基礎(chǔ)上,按照各項(xiàng)業(yè)務(wù)功能對(duì)業(yè)務(wù)系統(tǒng)最細(xì)顆粒度接口進(jìn)行功能聚合,確保一次接口調(diào)用完成一次業(yè)務(wù)功能,提升網(wǎng)關(guān)的響應(yīng)能力和速度;權(quán)限校驗(yàn)指在通過(guò)網(wǎng)關(guān)調(diào)用接口時(shí),會(huì)統(tǒng)一過(guò)濾驗(yàn)證調(diào)用方的權(quán)限和參數(shù)合法性,并在向被調(diào)用方驗(yàn)證通過(guò)后放行;智能路由指在調(diào)用各業(yè)務(wù)接口時(shí),隱藏接口詳細(xì)信息,統(tǒng)一由網(wǎng)關(guān)將接收到的請(qǐng)求按照注冊(cè)中心配置進(jìn)行轉(zhuǎn)發(fā);接口監(jiān)控指網(wǎng)關(guān)會(huì)對(duì)所有接口進(jìn)行實(shí)時(shí)監(jiān)控,包括接口的狀態(tài)、實(shí)時(shí)流量、調(diào)用情況等,對(duì)于惡意調(diào)用可及時(shí)進(jìn)行接口限流或臨時(shí)熔斷;日志記錄會(huì)詳細(xì)記錄每次接口調(diào)用詳細(xì)情況,包括調(diào)用方的詳細(xì)請(qǐng)求信息、調(diào)用結(jié)果等,用于異常監(jiān)控和優(yōu)化分析.
結(jié)合新媒體集成發(fā)布平臺(tái)運(yùn)行情況,以不改變業(yè)務(wù)系統(tǒng)功能架構(gòu)為前提,僅對(duì)各業(yè)務(wù)系統(tǒng)開放接口部分進(jìn)行功能改造,如圖2所示,將各業(yè)務(wù)系統(tǒng)開放接口作為獨(dú)立微服務(wù),所有接口注冊(cè)后統(tǒng)一由接口網(wǎng)關(guān)進(jìn)行代理和路由,既提升了平臺(tái)擴(kuò)展性和穩(wěn)定性,也減少了運(yùn)維過(guò)程中的復(fù)雜度和工作量.
組織機(jī)構(gòu)庫(kù)是平臺(tái)中統(tǒng)一管理機(jī)構(gòu)下所有組織信息的公共基礎(chǔ)系統(tǒng),提供對(duì)組織機(jī)構(gòu)的管理維護(hù)、查詢檢索、查詢接口等功能,平臺(tái)中網(wǎng)站、微博賬號(hào)、微信公眾號(hào)、手機(jī)報(bào)等業(yè)務(wù)系統(tǒng)均以組織機(jī)構(gòu)為單位進(jìn)行關(guān)聯(lián)管理,是平臺(tái)的核心功能系統(tǒng).
組織機(jī)構(gòu)庫(kù)管理維護(hù)機(jī)構(gòu)信息主要包括機(jī)構(gòu)ID、機(jī)構(gòu)名稱、機(jī)構(gòu)全稱、機(jī)構(gòu)代碼、機(jī)構(gòu)類別、狀態(tài)、父機(jī)構(gòu)代碼、機(jī)構(gòu)圖標(biāo)、所屬區(qū)域、機(jī)構(gòu)地址、聯(lián)系人相關(guān)信息、備注說(shuō)明等字段;系統(tǒng)本身提供組織機(jī)構(gòu)樹形結(jié)構(gòu)的相關(guān)管理功能,包括數(shù)據(jù)增刪改查、圖片上傳、順序調(diào)整等常用功能;系統(tǒng)同時(shí)提供對(duì)組織機(jī)構(gòu)查詢的開放接口,接受組織機(jī)構(gòu)ID、關(guān)鍵字、區(qū)域等參數(shù)進(jìn)行遠(yuǎn)程調(diào)用查詢,所有業(yè)務(wù)系統(tǒng)都和組織機(jī)構(gòu)庫(kù)的組織機(jī)構(gòu)進(jìn)行關(guān)聯(lián),每個(gè)網(wǎng)站、新浪微博、微信公眾號(hào)、手機(jī)報(bào)及其它業(yè)務(wù)均以組織機(jī)構(gòu)為基本管理單元.
圖2 微服務(wù)架構(gòu)示意圖
共享稿件庫(kù)是業(yè)務(wù)系統(tǒng)間進(jìn)行數(shù)據(jù)推送的消息隊(duì)列系統(tǒng),采用點(diǎn)對(duì)點(diǎn)通信模式實(shí)現(xiàn),主要為各業(yè)務(wù)系統(tǒng)提供數(shù)據(jù)相互推送的中轉(zhuǎn)、權(quán)限控制和共享稿件查詢等服務(wù),包括稿件推送、推送權(quán)限配置、稿件跟蹤、推送稿件查詢、開放接口管理等功能.
稿件推送指業(yè)務(wù)系統(tǒng)間數(shù)據(jù)共享,實(shí)現(xiàn)各系統(tǒng)間雙向信息推送.例如信息在內(nèi)容管理系統(tǒng)中發(fā)布到網(wǎng)站后,可將信息推送到本機(jī)構(gòu)或上級(jí)機(jī)構(gòu)的微信管理系統(tǒng)中,微信可對(duì)稿件進(jìn)行二次編輯后進(jìn)行發(fā)布.推送權(quán)限配置指不同層級(jí)機(jī)構(gòu)間的推送關(guān)系配置,平臺(tái)中數(shù)據(jù)缺省可在同一機(jī)構(gòu)下不同業(yè)務(wù)系統(tǒng)間相互推送,對(duì)于不同機(jī)構(gòu)間數(shù)據(jù)推送,需要配置機(jī)構(gòu)到機(jī)構(gòu)的推送權(quán)限;稿件跟蹤指對(duì)于已推送稿件可通過(guò)共享稿件庫(kù)查詢稿件的詳細(xì)流轉(zhuǎn)情況,包括來(lái)源系統(tǒng)、推送用戶及時(shí)間、目的系統(tǒng)、稿件處理情況等;推送稿件查詢指共享稿件庫(kù)本身提供按機(jī)構(gòu)查詢展示所有推送稿件,并提供基本的統(tǒng)計(jì)分析;共享稿件庫(kù)提供稿件推送、附件上傳、稿件跟蹤、稿件查詢等開放接口.
如圖3所示,網(wǎng)站、新浪微博、微信公眾號(hào)都以組織機(jī)構(gòu)為基本管理單元.共享稿件庫(kù)中各組織機(jī)構(gòu)下的稿件庫(kù)邏輯上相互獨(dú)立,通過(guò)共享稿件庫(kù)進(jìn)行機(jī)構(gòu)到機(jī)構(gòu)的推送權(quán)限配置,推送稿件前先進(jìn)行權(quán)限過(guò)濾驗(yàn)證,通過(guò)后將稿件推送到對(duì)應(yīng)的消息推送隊(duì)列,業(yè)務(wù)系統(tǒng)中的接收機(jī)構(gòu)從消息推送隊(duì)列中獲取稿件信息,并在共享稿件庫(kù)中存儲(chǔ)稿件進(jìn)行記錄和查詢.
圖3 推送邏輯示意圖
資源標(biāo)識(shí)庫(kù)是對(duì)平臺(tái)所有業(yè)務(wù)信息進(jìn)行統(tǒng)一標(biāo)識(shí)分類的公共基礎(chǔ)服務(wù),主要提供資源標(biāo)識(shí)分類管理和開放接口功能.平臺(tái)中包含各種結(jié)構(gòu)的業(yè)務(wù)信息,通過(guò)統(tǒng)一數(shù)據(jù)分類標(biāo)準(zhǔn)進(jìn)行規(guī)范,便于數(shù)據(jù)匯總后綜合查詢分析.
資源標(biāo)識(shí)管理指可對(duì)平臺(tái)各類資源目錄進(jìn)行標(biāo)識(shí)管理,制定統(tǒng)一標(biāo)準(zhǔn)的資源目錄,包括站點(diǎn)、欄目、文檔、圖片、視頻等各類信息,均制定平臺(tái)公共資源分類,實(shí)現(xiàn)常用的增刪改查等管理功能;同時(shí)提供標(biāo)識(shí)查詢開放接口,接受標(biāo)識(shí)ID、關(guān)鍵字等參數(shù)進(jìn)行遠(yuǎn)程調(diào)用查詢.
數(shù)據(jù)資源全集是對(duì)平臺(tái)各類業(yè)務(wù)信息進(jìn)行統(tǒng)一過(guò)濾匯聚的全文檢索系統(tǒng),匯聚分散在各業(yè)務(wù)系統(tǒng)的站點(diǎn)、欄目、域名、公眾號(hào)、微博號(hào)、用戶、日志、發(fā)布文檔及URL 等各類數(shù)據(jù),主要功能包括各類數(shù)據(jù)查詢、數(shù)據(jù)流轉(zhuǎn)分析、傳播效果統(tǒng)計(jì)等功能.數(shù)據(jù)資源全集采用開源ETL 工具Kettle[4]實(shí)現(xiàn)數(shù)據(jù)的抽取和匯聚,采用開源搜索分析引擎Elasticsearch[5]建設(shè)分布式的數(shù)據(jù)資源存儲(chǔ)和索引.
各類數(shù)據(jù)查詢指按組織機(jī)構(gòu)對(duì)站點(diǎn)、欄目、文檔、用戶、圖片、視頻、日志等各類結(jié)構(gòu)化數(shù)據(jù)的綜合查詢,包括各類數(shù)據(jù)的詳細(xì)信息;數(shù)據(jù)流轉(zhuǎn)分析指可對(duì)文檔信息在平臺(tái)中的所有流轉(zhuǎn)情況進(jìn)行關(guān)聯(lián)查詢分析,通過(guò)匯聚平臺(tái)所有文檔信息,可查看文檔在各個(gè)渠道的發(fā)布情況、編輯版本、推送采納情況等,對(duì)后續(xù)的內(nèi)容運(yùn)維具有指導(dǎo)作用;傳播效果統(tǒng)計(jì)指按照組織機(jī)構(gòu)對(duì)各個(gè)發(fā)布渠道提供包括文檔瀏覽量、訪問(wèn)數(shù)、點(diǎn)贊數(shù)、評(píng)論數(shù)、更新量、收錄量等各類傳播效果的綜合統(tǒng)計(jì)分析,為各機(jī)構(gòu)的信息傳播績(jī)效統(tǒng)計(jì)提供切實(shí)有效的數(shù)據(jù)參考.
如圖4,通過(guò)Kettle 將各業(yè)務(wù)系統(tǒng)已發(fā)布數(shù)據(jù)經(jīng)過(guò)清洗過(guò)濾后存儲(chǔ)至ES 集群中,其中圖片、視頻只抽取文件相關(guān)說(shuō)明信息,不抽取文件內(nèi)容,由于數(shù)據(jù)資源全集對(duì)數(shù)據(jù)實(shí)時(shí)性要求不高,針對(duì)各類數(shù)據(jù)在kettle 上設(shè)置定時(shí)同步任務(wù),每天凌晨增量更新.
圖4 數(shù)據(jù)抽取邏輯示意圖
該平臺(tái)已在中國(guó)科學(xué)院新媒體環(huán)境下的科學(xué)傳播平臺(tái)建設(shè)課題中實(shí)際應(yīng)用,初步形成以“中科院之聲”品牌為核心的科學(xué)傳播矩陣,為中科院百余個(gè)科研機(jī)構(gòu)網(wǎng)絡(luò)宣傳工作提供技術(shù)支撐.
中科院前期已建成以網(wǎng)站群為核心的集約化新媒體發(fā)布集成環(huán)境,在此基礎(chǔ)上進(jìn)行系統(tǒng)改造,實(shí)現(xiàn)網(wǎng)站、新媒體等多渠道融合傳播管理,主要改造工作包括:(1)改造業(yè)務(wù)系統(tǒng)功能接口,與公共接口網(wǎng)關(guān)進(jìn)行對(duì)接,系統(tǒng)調(diào)用接口在接口網(wǎng)關(guān)進(jìn)行注冊(cè)和調(diào)用,實(shí)現(xiàn)各功能接口的統(tǒng)一管理和監(jiān)控;(2)針對(duì)組織機(jī)構(gòu)庫(kù)和資源標(biāo)識(shí)庫(kù),業(yè)務(wù)系統(tǒng)需要修改與組織機(jī)構(gòu)和資源標(biāo)識(shí)關(guān)聯(lián)的業(yè)務(wù)表,相應(yīng)添加機(jī)構(gòu)代碼和標(biāo)識(shí)編碼字段,用于系統(tǒng)間的數(shù)據(jù)展示;(3)針對(duì)數(shù)據(jù)資源全集,各系統(tǒng)需要相應(yīng)開放數(shù)據(jù)抽取的數(shù)據(jù)庫(kù)查詢權(quán)限,提供結(jié)合自身業(yè)務(wù)實(shí)現(xiàn)的各類業(yè)務(wù)視圖,供Kettle 批量抽取數(shù)據(jù)并存放到ES中.
在系統(tǒng)實(shí)際改造中,還需注意:(1)組織機(jī)構(gòu)庫(kù)需根據(jù)機(jī)構(gòu)調(diào)整及時(shí)維護(hù)完善機(jī)構(gòu)信息和層級(jí)關(guān)系,平臺(tái)所有業(yè)務(wù)系統(tǒng)均基于組織機(jī)構(gòu)為管理單元,組織機(jī)構(gòu)信息的準(zhǔn)確性直接影響各類信息的傳播監(jiān)控和數(shù)據(jù)綜合統(tǒng)計(jì);(2)共享稿件庫(kù)實(shí)現(xiàn)了信息發(fā)布至各個(gè)渠道不同版本的跟蹤查詢,實(shí)際運(yùn)行過(guò)程中需結(jié)合機(jī)構(gòu)自身情況考慮稿件的反復(fù)修改和多版本對(duì)照需求,可增加稿件處理備注功能和同一稿件多版本比較功能,方便用戶實(shí)際操作;(3)數(shù)據(jù)資源全集匯聚了平臺(tái)包括文檔在內(nèi)的各類信息,對(duì)于已同步至資源全集又有修改或臨時(shí)撤銷的信息,這類數(shù)據(jù)需及時(shí)從資源全集中同步修改或刪除,具體實(shí)現(xiàn)采用數(shù)據(jù)庫(kù)增加觸發(fā)器和建臨時(shí)表存放撤銷、修改數(shù)據(jù),再通過(guò)Kettle 定時(shí)同步更新資源全集,也可結(jié)合業(yè)務(wù)實(shí)際考慮其他實(shí)現(xiàn)方式.
平臺(tái)為中科院主站、院機(jī)關(guān)、研究單位及下級(jí)機(jī)構(gòu)的門戶網(wǎng)站及新媒體運(yùn)營(yíng)等提供了運(yùn)行支持.公共接口網(wǎng)關(guān)日均調(diào)用近萬(wàn)次,組織機(jī)構(gòu)庫(kù)已有數(shù)據(jù)1300 余條,共享稿件庫(kù)日均接收稿件500 余篇,數(shù)據(jù)資源全集已匯總用戶信息近3000 條,站點(diǎn)信息1000 余條,欄目信息20 余萬(wàn)條,文檔信息500 多萬(wàn)條,微信號(hào)600 余個(gè),微博號(hào)70 余個(gè).
平臺(tái)還將結(jié)合需求繼續(xù)改進(jìn)完善:(1)平臺(tái)安全防護(hù)還需提升,包括接口調(diào)用數(shù)據(jù)加密、身份信息動(dòng)態(tài)標(biāo)識(shí)驗(yàn)證、惡意訪問(wèn)監(jiān)控預(yù)警等;(2)微博、微信等第三方平臺(tái)接口持續(xù)變化的處理,第三方接口變化會(huì)直接影響平臺(tái)業(yè)務(wù)功能,需制定合理可行的技術(shù)處理流程及時(shí)調(diào)整;(3)共享稿件庫(kù)稿件版本管理,稿件實(shí)際發(fā)布到微信等渠道后通常會(huì)進(jìn)行二次編輯,需考慮增加稿件版本對(duì)照功能方便用戶實(shí)際使用.
該平臺(tái)在實(shí)際應(yīng)用中進(jìn)一步提升了中科院網(wǎng)絡(luò)宣傳工作的效率和質(zhì)量,平臺(tái)建設(shè)思路對(duì)其他機(jī)構(gòu)政務(wù)信息傳播工作有一定借鑒作用.下一步將基于數(shù)據(jù)資源全集進(jìn)行大數(shù)據(jù)分析,并在此基礎(chǔ)上探索科學(xué)傳播工作的態(tài)勢(shì)分析和智能化應(yīng)用.