李光恒,萬錦輝,何挺,黃群,蒙立東,董喆
(廣西產(chǎn)研院 人工智能與大數(shù)據(jù)應(yīng)用研究所有限公司,廣西 南寧 530000)
黨的十九大以來,我國政府持續(xù)推進“互聯(lián)網(wǎng) + 政務(wù)服務(wù)”建設(shè),依靠新一代信息技術(shù)推動政務(wù)治理模式創(chuàng)新,在推動“互聯(lián)網(wǎng)+政務(wù)”的實踐過程中,采取了“重組”的策略進行智慧政務(wù)服務(wù)的業(yè)務(wù)再造,但由于管理過程中出現(xiàn)大量的層級協(xié)調(diào)工作,實質(zhì)上存在著數(shù)字技術(shù)工具化,底層仍由科層制驅(qū)動的問題[1]。電子政務(wù)對政府職能管理體系提出了重構(gòu)性的訴求和整體性改革的需求,政府職能管理應(yīng)與電子政務(wù)建設(shè)銜接起來協(xié)調(diào)推進[2]。以科技管理部門為例,目前國內(nèi)科技管理部門多用不同的管理系統(tǒng)實現(xiàn)對各種科技政務(wù)和業(yè)務(wù)的管理,造成政務(wù)資源和數(shù)據(jù)相互阻隔,難以實現(xiàn)政務(wù)數(shù)據(jù)資源有效管理與高效應(yīng)用。部分科技管理部門建設(shè)統(tǒng)一政務(wù)數(shù)據(jù)平臺,只適配已有的科技政務(wù)管理,對不斷發(fā)展的科技政務(wù)數(shù)據(jù)資源和科技業(yè)務(wù)管理無法很好地適應(yīng)和納入統(tǒng)一管理,只能大幅修改已有系統(tǒng)或推翻重建。從技術(shù)層面看,主要有以下關(guān)鍵問題需要解決。
現(xiàn)有科技政務(wù)系統(tǒng)平臺在系統(tǒng)構(gòu)架擴展性、定制性(彈性)方面存在缺陷,使得系統(tǒng)難以修改和擴展,難以快速響應(yīng)用戶/業(yè)務(wù)部門對功能的修改和功能擴展需求,缺少敏捷應(yīng)對政務(wù)業(yè)務(wù)變化的技術(shù)框架模型。
現(xiàn)有科技信息管理系統(tǒng)存在各部門數(shù)據(jù)共享及業(yè)務(wù)互通性差的問題,一是系統(tǒng)開發(fā)者對科技業(yè)務(wù)不熟悉,缺乏對各部門業(yè)務(wù)和數(shù)據(jù)的統(tǒng)一梳理。二是各系統(tǒng)在數(shù)據(jù)格式和標準上的不一致,導致互通和共享有困難。三是現(xiàn)有系統(tǒng)在技術(shù)構(gòu)架上沒有一套能適應(yīng)各種來源數(shù)據(jù)共享和互通方面的機制,對新的子系統(tǒng)的增加不能很好地融合。
隨著信息技術(shù)的發(fā)展和人民生活水平的提高,“互聯(lián)網(wǎng)+政務(wù)服務(wù)”要求科技管理政管理由粗放式向精細化轉(zhuǎn)換,推進數(shù)據(jù)共享,打通信息孤島成為數(shù)據(jù)建設(shè)的指導思想理念,這對科技政務(wù)數(shù)據(jù)治理的實時性和協(xié)同性提出了更高要求。而由于歷史原因,現(xiàn)有的科技政務(wù)系統(tǒng)在數(shù)據(jù)治理、工作協(xié)同等方面困難重重,效率低下,久而久之造成數(shù)據(jù)不準確、不完整、可用性低等問題。由于數(shù)據(jù)治理欠佳,影響了大數(shù)據(jù)分析的準確性,從而無法為科技管理改革、政策制定、社會服務(wù)提供有力的支撐[3]。
本文提出基于柔性治理和知識圖譜的技術(shù)手段,利用柔性治理的理念和先進技術(shù),構(gòu)架一個既能夠兼容已有政務(wù)數(shù)據(jù)資源和業(yè)務(wù)管理的體系,又能基于柔性治理容納未來新增的科技政務(wù)數(shù)據(jù)資源和科技業(yè)務(wù),同時深入研究知識圖譜模型和大數(shù)據(jù)分析模型在科技政務(wù)數(shù)據(jù)資源中的應(yīng)用,真正使科技政務(wù)數(shù)據(jù)為科技管理決策服務(wù)。
柔性治理中的“柔性”是對“剛性”而言的,傳統(tǒng)意義上的柔性多用于定義生產(chǎn)制造型企業(yè)的生產(chǎn)方式,是以“制造系統(tǒng)響應(yīng)內(nèi)外環(huán)境變化的能力”建設(shè)為核心的生產(chǎn)方式與方法論。隨著市場競爭的日益激烈,生產(chǎn)型企業(yè)需要依托低成本快速反應(yīng)的制造方法滿足市場需求的多樣化和不確定性,柔性的含義主要包含3個層面:能力的柔性、容量的柔性和系統(tǒng)適應(yīng)內(nèi)部變化的柔性。
柔性治理的理念從生產(chǎn)制造術(shù)語移植到政策話語表達最早出現(xiàn)在2019年的政府工作報告中的“新型城鎮(zhèn)化要處處體現(xiàn)以人為核心,提高柔性化治理、精細化服務(wù)水平,讓城市更加宜居,更具包容和人文關(guān)懷”??梢?,新時代的柔性治理在保留了原始理念的情況下更多地面向公共服務(wù)的應(yīng)用,圍繞復雜的政府職能體系,從外部環(huán)境、公眾需求,內(nèi)部治理需要、政治要求等角度,開展多元參與、協(xié)同共治、快捷反應(yīng)的機制優(yōu)化,借助新一代信息技術(shù),進而實現(xiàn)職能之間的協(xié)同化和政府治理的整體性。
為了敏捷應(yīng)對政務(wù)業(yè)務(wù)變化,本文提出采用柔性治理技術(shù)框架,采用微服務(wù)和松耦合技術(shù),提高系統(tǒng)的定制能力、可擴展性和運行性能,遷移柔性生產(chǎn)的3個層面柔性流程管理、柔性數(shù)據(jù)管理、柔性功能定制的理念,從科技政務(wù)系統(tǒng)的定制化流程、定制化模塊和數(shù)據(jù)治理3個方面進行柔性治理改造。
一是柔性能力,指生產(chǎn)水平的快速調(diào)節(jié)能力,或迅速轉(zhuǎn)移產(chǎn)品生產(chǎn)到另一種產(chǎn)品上的能力。在政務(wù)管理中,體現(xiàn)為柔性流程管理,基于知識抽取后的流程模板,對流程管理功能進行快速定制和開發(fā),迅速調(diào)整生成各類流程模塊。二是柔性容量,指按需調(diào)節(jié)生產(chǎn)的產(chǎn)量的能力。在政務(wù)管理中,體現(xiàn)為柔性數(shù)據(jù)管理,通過建立適應(yīng)各種業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)存儲形態(tài)和數(shù)據(jù)交換標準及接口,實現(xiàn)數(shù)據(jù)交換和共享的問題,可以按需分配數(shù)據(jù)資源和使用權(quán)限。三是系統(tǒng)適應(yīng)內(nèi)部變化的柔性,指系統(tǒng)在遇到擾動的情況下能夠快速恢復運行的能力,在政務(wù)管理中,體現(xiàn)為柔性功能定制,基于參數(shù)配置與腳本自定義框架,在需要對系統(tǒng)模塊進行調(diào)整時,快速實現(xiàn)功能的修改和自定義配置。
實現(xiàn)柔性治理三大內(nèi)容的核心在于對現(xiàn)有業(yè)務(wù)流程進行優(yōu)化與改造,本文設(shè)計了一種基于柔性治理的可拓展流程模型(如圖1),該模型以業(yè)務(wù)流程引擎為中心,主要邏輯包括以下層面:第一,通過對現(xiàn)有的科技政務(wù)應(yīng)用系統(tǒng)進行分析,將流程應(yīng)用數(shù)據(jù)接入業(yè)務(wù)流程引擎,從業(yè)務(wù)流程引擎中抽象出流程資源模型、流程應(yīng)用數(shù)據(jù)和功能配置參數(shù),形成知識積累型的技術(shù)引擎,可基于參數(shù)配置和腳本自定義框架,快捷配置業(yè)務(wù)流程的相關(guān)業(yè)務(wù)模板、應(yīng)用程序及系統(tǒng)環(huán)境數(shù)據(jù)。第二,從業(yè)務(wù)流程引擎中抽象出組織/角色模型和過程/功能模板,負責管理與配置組織、角色、用戶的權(quán)限,滿足流程模塊化定制需求。第三,在數(shù)據(jù)管理層面,為了提升數(shù)據(jù)的柔性程度,對業(yè)務(wù)數(shù)據(jù)進行解耦分離,形成過程數(shù)據(jù)和知識數(shù)據(jù)分離的數(shù)據(jù)存儲和管理構(gòu)架,將數(shù)據(jù)接入知識圖譜引擎中。第四,知識圖譜引擎的工作流由信息抽取、實體關(guān)系消歧、知識融合、知識加工等步驟組成,在知識圖譜引擎中,將建設(shè)知識倉庫、知識管理及規(guī)則管理3個部分。第五,為了解決數(shù)據(jù)流的問題,在對公用數(shù)據(jù)和專用數(shù)據(jù)進行分類的基礎(chǔ)上,建立各種業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)存儲形態(tài)和數(shù)據(jù)交換標準及接口,解決數(shù)據(jù)交換和共享問題[4]。
圖1 基于柔性治理的可拓展流程模型
由于科技政策文本數(shù)量日趨龐大,語義關(guān)系日漸繁雜,將知識圖譜技術(shù)用于科技政策領(lǐng)域,以實現(xiàn)政策主體、政策屬性與關(guān)系的結(jié)構(gòu)化和顯性化越來越重要[5]。本文提出的知識圖譜是適用于科技政務(wù)管理領(lǐng)域的政務(wù)知識圖譜,其核心是為業(yè)務(wù)流程的柔性需求提供快捷的知識響應(yīng)服務(wù),解決數(shù)據(jù)共享及業(yè)務(wù)互通性差的問題。本文基于知識圖譜構(gòu)建了一個面向業(yè)務(wù)流程的知識管理系統(tǒng)模型,主要由數(shù)據(jù)資源層、代理層和業(yè)務(wù)層組成(如圖2)。
圖2 基于知識圖譜的科技政務(wù)知識管理系統(tǒng)模型
數(shù)據(jù)資源層主要擔任知識存儲倉庫的角色,在數(shù)據(jù)資源層包含了數(shù)據(jù)解耦模塊,進入數(shù)據(jù)倉庫的數(shù)據(jù)在數(shù)據(jù)資源層已經(jīng)完成了業(yè)務(wù)流程數(shù)據(jù)的一次解耦分離,為知識圖譜的構(gòu)建提供原始數(shù)據(jù)來源。
代理層是系統(tǒng)的核心部分,也是系統(tǒng)的功能服務(wù)層,代理層通過信息抽取、關(guān)系消歧、知識融合與知識加工等步驟,完成了科技知識圖譜的創(chuàng)建。在知識圖譜構(gòu)建完成后,代理層還承擔了知識管理的任務(wù),為了更好地服務(wù)業(yè)務(wù)流程定義,本模型將知識需求獲取功能單獨提取出來,作為銜接代理層和業(yè)務(wù)流程層,對接業(yè)務(wù)流程和知識圖譜的一個接口而存在[6]。
業(yè)務(wù)流程層是主要用于實現(xiàn)業(yè)務(wù)流程的柔性開發(fā)。為保證知識可以滿足業(yè)務(wù)流程的需要,系統(tǒng)首先必須能夠識別在業(yè)務(wù)流程的某一環(huán)節(jié)需要什么樣的知識,在本模型中,主要包括知識數(shù)據(jù)、配置參數(shù)、知識模型3類知識,分別對應(yīng)柔性數(shù)據(jù)管理、柔性功能定制、柔性模塊構(gòu)建的開發(fā),代理層為業(yè)務(wù)流程層的知識應(yīng)用提供了柔性化開發(fā)、自動化生成的服務(wù)。
至此,本模型主要由5個模塊組成:在數(shù)據(jù)資源層,包括數(shù)據(jù)解耦模塊;在代理層,包括知識圖譜構(gòu)建模塊和知識管理模塊;在業(yè)務(wù)流程層,包括知識需求獲取模塊,業(yè)務(wù)流程定義模塊。該模型各模塊之間存在豐富的自主交互,能夠基于知識圖譜,對外界的任務(wù)輸入做出一定的判斷和推理,降低了數(shù)據(jù)協(xié)同、系統(tǒng)迭代的難度。
科技大數(shù)據(jù)分析為科技部門評價與決策提供量化支撐。與傳統(tǒng)的基于專家系統(tǒng)的評價與決策帶有主觀經(jīng)驗不同,科技大數(shù)據(jù)分析通過基于數(shù)據(jù)驅(qū)動的機器學習方法來量化評價與決策。如果數(shù)據(jù)足夠多且質(zhì)量好,則這種基于數(shù)據(jù)驅(qū)動的機器學習方法量化評價與決策比較客觀。但是,如果數(shù)據(jù)沒有那么完美,如何結(jié)合專家系統(tǒng)與基于數(shù)據(jù)驅(qū)動的機器學習方法是關(guān)鍵技術(shù)問題。
在知識圖譜構(gòu)建過程中,信息抽取是最關(guān)鍵步驟,信息抽取需要利用大規(guī)模數(shù)據(jù)集對模型進行訓練,而大規(guī)模數(shù)據(jù)集的人工標注成本昂貴,為了解決此問題,可以使用無監(jiān)督、半監(jiān)督的抽取方法代替有監(jiān)督的方法,通過先聚類后標注的方法,降低標注難度,或者構(gòu)建生成式的模型,構(gòu)造先驗條件后再訓練模型,減少數(shù)據(jù)標注成本、降低信息抽取對標注的依賴。
在機器學習算法層面,采用基于機器學習的自然語言處理(NLP)遺忘算法可以實現(xiàn)數(shù)據(jù)的精準鑒別。遺忘算法是以牛頓冷卻公式模擬遺忘為基礎(chǔ)、用于自然語言處理(NLP)的機器無監(jiān)督學習算法體系,與主流算法相比,具有占有資源少、性能快的優(yōu)勢。遺忘算法不僅可廣泛應(yīng)用于批量文本智能分析領(lǐng)域,而且可以應(yīng)用于圖片分類識別、圖像識別等領(lǐng)域,遺忘算法的語言無關(guān)特性,使得其應(yīng)用語境理論上無限制,可以支持各種語言,其核心技術(shù)主要包括以下幾點:①基于大規(guī)模文本的詞庫自動生成技術(shù);②文本結(jié)構(gòu)化處理技術(shù);③分詞權(quán)重計算技術(shù);④實時熱詞發(fā)現(xiàn)技術(shù)?;趶姶蟮淖匀徽Z義分析處理核心技術(shù),突破 NLP 分析瓶頸的遺忘算法,結(jié)合多源非結(jié)構(gòu)化數(shù)據(jù)對算法進行訓練,然后對科技項目進行精準對比分析,能夠快速地命中并識別出檢測文件與比對源中的相似內(nèi)容,也不會造成過度檢測,從而在從監(jiān)測技術(shù)的運用和精準度以及多語言支持上都實現(xiàn)了對質(zhì)量不佳的科技數(shù)據(jù)的優(yōu)化。
上文基于可拓展流程和知識管理系統(tǒng)兩個技術(shù)模型之間的業(yè)務(wù)邏輯交互組成了科技政務(wù)云數(shù)據(jù)平臺的平臺服務(wù)層,基于機器學習的自然語言處理(NLP)遺忘算法對科技政務(wù)數(shù)據(jù)進行了質(zhì)量優(yōu)化,最終要實現(xiàn)的目標是建設(shè)高水平科技政務(wù)數(shù)據(jù)治理和應(yīng)用系統(tǒng),其技術(shù)框架如下。
Iaas層提供充足的計算、存儲和網(wǎng)絡(luò)能力。同時依托電子政務(wù)內(nèi)網(wǎng)、外網(wǎng)、互聯(lián)網(wǎng)和教育網(wǎng)等已有的資源共享平臺,實現(xiàn)跨區(qū)域、跨行業(yè)、跨部門、跨層級的數(shù)據(jù)采集和交換。
Paas 層構(gòu)建以Hadoop作為基礎(chǔ)支撐的大數(shù)據(jù)基礎(chǔ)服務(wù)(Daas)。集成應(yīng)用可變流程、知識圖譜、數(shù)據(jù)融合、機器學習等技術(shù),實現(xiàn)一站式數(shù)據(jù)資源的采集、存儲、管理、計算、分析、服務(wù)等功能,為上層各類業(yè)務(wù)系統(tǒng)和大數(shù)據(jù)分析提供高可用性、高體驗度、高安全性的數(shù)據(jù)服務(wù)能力。
Saas 層通過業(yè)務(wù)融合和互聯(lián)互通相結(jié)合,對科技系統(tǒng)內(nèi)部分散、割裂、標準不一的新舊系統(tǒng)和歷史數(shù)據(jù)庫進行大規(guī)模整合、推倒和統(tǒng)一重建,為開展科技數(shù)據(jù)共享和大數(shù)據(jù)應(yīng)用掃清障礙打下牢固基礎(chǔ)。
基于建設(shè)高水平科技政務(wù)數(shù)據(jù)治理和應(yīng)用系統(tǒng)的目標,本文研究科技政務(wù)數(shù)據(jù)治理的關(guān)鍵技術(shù),包括柔性治理技術(shù)框架、知識圖譜模型及科技數(shù)據(jù)治理優(yōu)化方法,在此基礎(chǔ)上設(shè)計了基于柔性治理與知識圖譜的科技政務(wù)數(shù)據(jù)治理云平臺,能夠有效整合各個科技業(yè)務(wù)系統(tǒng)和科技數(shù)據(jù),利用柔性治理技術(shù),實現(xiàn)科技業(yè)務(wù)融合,解決了有一個新業(yè)務(wù)就要新建一個系統(tǒng),造成新的數(shù)據(jù)孤島的根本性問題,同時知識圖譜模型和大數(shù)據(jù)分析模型在科技領(lǐng)域的應(yīng)用,能夠利用云平臺聚集的大量科技政務(wù)數(shù)據(jù)資源,完成科技數(shù)據(jù)可視化和多維科技數(shù)據(jù)分析,為科技決策提供輔助參考,創(chuàng)造了一個利于協(xié)同、方便共享、積極分享、無界交流的科技政務(wù)發(fā)展環(huán)境。