亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        檢察數(shù)據(jù)中臺(tái)的思考和構(gòu)建

        2024-05-07 00:27:23尚珂全李俊羅昊煒
        中國(guó)新通信 2024年3期
        關(guān)鍵詞:數(shù)據(jù)治理數(shù)據(jù)倉(cāng)庫(kù)

        尚珂全?李俊?羅昊煒

        摘要:數(shù)字化轉(zhuǎn)型凸顯了數(shù)據(jù)中臺(tái)的價(jià)值。為服務(wù)數(shù)字檢察,從數(shù)據(jù)中發(fā)現(xiàn)檢察監(jiān)督線(xiàn)索,有效支撐“個(gè)案辦理-類(lèi)案監(jiān)督-系統(tǒng)治理”,擬建設(shè)數(shù)據(jù)中臺(tái)以支撐檢察業(yè)務(wù)相關(guān)數(shù)據(jù)的匯聚、治理和應(yīng)用。本文探討了檢察特色數(shù)據(jù)中臺(tái)構(gòu)建路線(xiàn)及其架構(gòu)設(shè)計(jì),并結(jié)合“先傷后?!北kU(xiǎn)詐騙這一典型案例,詳細(xì)闡述了數(shù)據(jù)中臺(tái)支撐的檢察業(yè)務(wù)的服務(wù)流程。

        關(guān)鍵詞:數(shù)字檢察;數(shù)據(jù)中臺(tái);數(shù)據(jù)治理;數(shù)據(jù)倉(cāng)庫(kù)

        一、引言

        在大數(shù)據(jù)時(shí)代,無(wú)論是線(xiàn)上虛擬社區(qū),還是線(xiàn)下支付場(chǎng)景,數(shù)據(jù)分布無(wú)處不在,隨著物聯(lián)網(wǎng)的推廣和普及,信息會(huì)以難以想象的速率在更快速地膨脹。

        最早發(fā)現(xiàn)數(shù)據(jù)使用價(jià)值的是廣告領(lǐng)域。在美國(guó),沃爾瑪精明的專(zhuān)業(yè)銷(xiāo)售人員利用計(jì)算機(jī)采集、分析用戶(hù)的注冊(cè)信息、購(gòu)買(mǎi)行為、購(gòu)買(mǎi)地點(diǎn)、購(gòu)買(mǎi)頻率等數(shù)據(jù),為用戶(hù)進(jìn)行消費(fèi)行為畫(huà)像,從而將用戶(hù)喜好的商品廣告精準(zhǔn)地送到用戶(hù)最容易觸達(dá)的地方。后來(lái),隨著IBM、甲骨文等計(jì)算機(jī)公司的崛起,存儲(chǔ)成本的降低和數(shù)據(jù)工具的多樣化,使得數(shù)據(jù)的商業(yè)化價(jià)值被大中型企業(yè)所觸及、挖掘,并用于流水線(xiàn)自動(dòng)化、企業(yè)決策等多方面[1]。

        當(dāng)前,數(shù)據(jù)已成為政府、企業(yè)的核心資產(chǎn),并被視為一種基礎(chǔ)能力,數(shù)據(jù)的質(zhì)量和規(guī)模一定程度決定了政府的執(zhí)政能力、企業(yè)的管理能力甚至是盈利能力[2]。在今年年初的政府機(jī)構(gòu)改革中,國(guó)家數(shù)據(jù)局正式成立,這表明國(guó)家對(duì)實(shí)施數(shù)據(jù)發(fā)展戰(zhàn)略的決心,并進(jìn)一步證明了國(guó)家對(duì)數(shù)據(jù)作為新的生產(chǎn)要素和資源屬性的深刻認(rèn)識(shí)。

        相應(yīng)的,隨著大數(shù)據(jù)時(shí)代不斷深入,數(shù)據(jù)中臺(tái)已成為政府部門(mén)、大中型企業(yè)建設(shè)的重要方向。即使對(duì)數(shù)據(jù)中臺(tái)有較大的需求,但在面對(duì)具體應(yīng)用場(chǎng)景時(shí),則又面臨不知道如何建設(shè),不知道哪些功能可用、哪些不可用等一系列問(wèn)題。

        根據(jù)最高人民檢察院“數(shù)字檢察”工作的部署,各地要根據(jù)實(shí)際情況建設(shè)數(shù)據(jù)中臺(tái),用以支撐“數(shù)字檢察”對(duì)數(shù)據(jù)服務(wù)的高要求。數(shù)據(jù)中臺(tái)的建設(shè)應(yīng)依托檢察業(yè)務(wù),遵循“業(yè)務(wù)主導(dǎo)、數(shù)據(jù)整合、技術(shù)支撐、重在應(yīng)用”的原則。檢察系統(tǒng)的數(shù)據(jù)中臺(tái)應(yīng)以提供具有檢察特色的數(shù)據(jù)服務(wù)為目標(biāo),為檢察大數(shù)據(jù)法律監(jiān)督和業(yè)務(wù)辦案全流程提供支持。

        二、背景

        (一)數(shù)據(jù)中臺(tái)發(fā)展歷程

        1991年,Bill Inmon提出數(shù)據(jù)倉(cāng)庫(kù)的概念,這一概念被視為大數(shù)據(jù)的雛形階段。Bill Inmon在其著作《建立數(shù)據(jù)倉(cāng)庫(kù)》一書(shū)中定義了數(shù)據(jù)倉(cāng)庫(kù)的概念,隨后又給出了更為精確的定義:數(shù)據(jù)倉(cāng)庫(kù)是在企業(yè)管理和決策中面向主題的、集成的、與時(shí)間相關(guān)的、不可修改的數(shù)據(jù)集合。面向主題、集成、時(shí)間相關(guān)、不可修改成了數(shù)據(jù)倉(cāng)庫(kù)的四要素。

        數(shù)據(jù)倉(cāng)庫(kù)的下一階段是數(shù)據(jù)湖(Data Lake),這一概念最早是在2011年由CITO Research的CTO和作家Dan Woods共同提出的。數(shù)據(jù)湖被定義為以原始格式存儲(chǔ)數(shù)據(jù)的存儲(chǔ)庫(kù)或系統(tǒng),它按照原樣存儲(chǔ)數(shù)據(jù),而無(wú)需事先對(duì)數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理。一個(gè)數(shù)據(jù)湖可以存儲(chǔ)結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和二進(jìn)制數(shù)據(jù)。

        隨著大數(shù)據(jù)技術(shù)的不斷完善,成熟的數(shù)據(jù)湖體系已經(jīng)非常接近于數(shù)據(jù)中臺(tái)的概念,它同樣具備了大數(shù)據(jù)存儲(chǔ)、處理、分析和機(jī)器學(xué)習(xí)等能力。亞馬遜是最早建設(shè)數(shù)據(jù)湖體系的公司,也是國(guó)外建設(shè)最完善數(shù)據(jù)湖體系的公司。

        大數(shù)據(jù)的成熟階段就是數(shù)據(jù)中臺(tái)階段。嚴(yán)格地說(shuō),數(shù)據(jù)中臺(tái)是一個(gè)相對(duì)“中國(guó)特色”的概念,屬于對(duì)完備大數(shù)據(jù)湖體系的本地化和擴(kuò)充。數(shù)據(jù)中臺(tái)的發(fā)展歷程如圖1所示。

        (二)數(shù)據(jù)中臺(tái)概念

        數(shù)據(jù)中臺(tái)的概念最早由阿里巴巴提出:“數(shù)據(jù)中臺(tái)是數(shù)據(jù)+技術(shù)+產(chǎn)品+組織”,是企業(yè)開(kāi)展新型運(yùn)營(yíng)的一個(gè)中樞系統(tǒng)。具象地說(shuō),它是一套解決方案,而從抽象的角度看,它是一種新型的運(yùn)營(yíng)理念??梢钥闯?,數(shù)據(jù)中臺(tái)在數(shù)據(jù)湖的基礎(chǔ)上擴(kuò)展了組織和管理層面的體系,將大數(shù)據(jù)從由產(chǎn)品堆疊的解決方案上升到“業(yè)務(wù)+數(shù)據(jù)”全過(guò)程管理的機(jī)制。

        通俗意義上的數(shù)據(jù)中臺(tái)是指通過(guò)數(shù)據(jù)技術(shù),對(duì)海量數(shù)據(jù)進(jìn)行采集、計(jì)算、存儲(chǔ)和加工,輸出標(biāo)準(zhǔn)數(shù)據(jù)后進(jìn)行存儲(chǔ),形成大數(shù)據(jù)資產(chǎn)層,結(jié)合數(shù)據(jù)模型、算法服務(wù)、數(shù)據(jù)產(chǎn)品、數(shù)據(jù)管理,為需求應(yīng)用提供數(shù)據(jù)服務(wù)的一套體系[3]。

        數(shù)據(jù)中臺(tái)旨在提升數(shù)據(jù)的使用效率,其核心在于基于海量數(shù)據(jù)提升整體運(yùn)行效率,促進(jìn)政企單位更好地利用數(shù)據(jù),更快地讓數(shù)據(jù)產(chǎn)生價(jià)值[4]。

        數(shù)據(jù)中臺(tái)整體技術(shù)架構(gòu)上采用云計(jì)算架構(gòu)模式,將數(shù)據(jù)資源、計(jì)算資源、存儲(chǔ)資源充分云化,并通過(guò)資源打包整合,再通過(guò)接口進(jìn)行開(kāi)放,提供“一站式”數(shù)據(jù)服務(wù)。按照功能模塊劃分,數(shù)據(jù)中臺(tái)通常包括兩個(gè)部分:數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)應(yīng)用。

        1.數(shù)據(jù)倉(cāng)庫(kù)

        數(shù)據(jù)倉(cāng)庫(kù)有一套標(biāo)準(zhǔn)的數(shù)據(jù)資源體系,分為三層:貼源層、基礎(chǔ)層和主題層。貼源層主要負(fù)責(zé)從各個(gè)信息系統(tǒng)匯集數(shù)據(jù);基礎(chǔ)層負(fù)責(zé)對(duì)匯集的數(shù)據(jù)進(jìn)行清洗和加工,形成符合業(yè)務(wù)形態(tài)的數(shù)據(jù)資源模型;主題層根據(jù)業(yè)務(wù)需求導(dǎo)向,將數(shù)據(jù)組織為具體業(yè)務(wù)場(chǎng)景所需要的數(shù)據(jù)結(jié)構(gòu),深化數(shù)據(jù)服務(wù)價(jià)值,全面實(shí)現(xiàn)純數(shù)據(jù)到業(yè)務(wù)服務(wù)的轉(zhuǎn)換,實(shí)現(xiàn)數(shù)據(jù)融通。

        2.數(shù)據(jù)應(yīng)用

        根據(jù)所面向的實(shí)體業(yè)務(wù)的特點(diǎn),數(shù)據(jù)應(yīng)用提供諸如數(shù)據(jù)建模、數(shù)據(jù)統(tǒng)計(jì)分析、數(shù)據(jù)地圖、定制化數(shù)據(jù)產(chǎn)品等服務(wù),這一部分的主要目標(biāo)是幫助業(yè)務(wù)解決具體問(wèn)題,通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方式提升業(yè)務(wù)產(chǎn)品的質(zhì)量和效果。

        (三)檢察特色數(shù)據(jù)中臺(tái)

        檢察大數(shù)據(jù)法律監(jiān)督,是檢察機(jī)關(guān)利用大數(shù)據(jù)分析和挖掘技術(shù)構(gòu)建監(jiān)督模型,實(shí)現(xiàn)從單個(gè)案件到類(lèi)案辦理,實(shí)現(xiàn)辦理一案、治理一片,進(jìn)而促進(jìn)社會(huì)矛盾的溯源治理,是檢察機(jī)關(guān)的一種履職創(chuàng)新方式。顯然,數(shù)據(jù)應(yīng)用是大數(shù)據(jù)法律監(jiān)督的核心,而這需要依賴(lài)于檢察特色數(shù)據(jù)中臺(tái)的構(gòu)建。

        縱覽數(shù)據(jù)中臺(tái)的概念及其發(fā)展歷史,可以得出一個(gè)結(jié)論:數(shù)據(jù)中臺(tái)沒(méi)有建造的通用公式,要在抽象業(yè)務(wù)特點(diǎn)的基礎(chǔ)上進(jìn)行深度結(jié)合,才能發(fā)揮好數(shù)據(jù)中臺(tái)的核心價(jià)值。

        圍繞“數(shù)據(jù)”價(jià)值,數(shù)據(jù)中臺(tái)的重點(diǎn)在于夯實(shí)數(shù)據(jù)基座,沉淀內(nèi)外部數(shù)據(jù)資源,探索數(shù)據(jù)在檢察辦案尤其是類(lèi)案辦理方面的應(yīng)用,從而深入挖掘數(shù)據(jù)價(jià)值,為溯源治理提供服務(wù)。全面支撐檢察業(yè)務(wù)應(yīng)用,需要在實(shí)現(xiàn)路徑上滿(mǎn)足以下需求[5]:

        1.數(shù)據(jù)匯聚需求

        基于檢察機(jī)關(guān)核心辦案業(yè)務(wù)系統(tǒng)“檢察業(yè)務(wù)應(yīng)用系統(tǒng)”,匯聚檢察機(jī)關(guān)內(nèi)部數(shù)據(jù)(存量數(shù)據(jù)和增量數(shù)據(jù))。引入業(yè)務(wù)應(yīng)用(例如當(dāng)前比較迫切的“大數(shù)據(jù)法律監(jiān)督模型”業(yè)務(wù)應(yīng)用)必需的外部數(shù)據(jù),包括但不限于政法協(xié)同數(shù)據(jù)、城市大數(shù)據(jù)中心共享的委辦局政務(wù)數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)等,形成數(shù)字檢察數(shù)據(jù)湖。

        2.數(shù)據(jù)治理需求

        數(shù)據(jù)治理針對(duì)匯聚之后的數(shù)據(jù)開(kāi)展清洗、融合、服務(wù)、共享等數(shù)據(jù)治理全生命周期管理,保障沉淀的檢務(wù)數(shù)據(jù)的完整性、準(zhǔn)確性以及唯一性。通過(guò)數(shù)據(jù)資源編目、數(shù)據(jù)標(biāo)準(zhǔn)管理、元數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量管理和數(shù)據(jù)治理工具等能力以及過(guò)程中建立起來(lái)的數(shù)據(jù)地圖和數(shù)據(jù)血緣關(guān)系結(jié)構(gòu),完成以四大檢察十大業(yè)務(wù)為核心的檢察大數(shù)據(jù)倉(cāng)庫(kù)建設(shè),從“人、案、物、組織”等維度為業(yè)務(wù)系統(tǒng)提供數(shù)據(jù)應(yīng)用支持。數(shù)據(jù)治理,建立完備的數(shù)據(jù)處理能力服務(wù)支撐是核心。

        能力支撐服務(wù):數(shù)據(jù)能力服務(wù)主要提供數(shù)據(jù)智能分析的能力服務(wù),例如:自然語(yǔ)言處理(NLP)能力、語(yǔ)音識(shí)別能力(OCR)文書(shū)要素提取能力、案件知識(shí)圖譜構(gòu)建能力等。

        數(shù)據(jù)治理服務(wù):圍繞全流程在線(xiàn)辦理體系的建設(shè)需求,依托數(shù)據(jù)匯聚和治理基礎(chǔ)平臺(tái)提供的基礎(chǔ)工具和能力,提供數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)加工、數(shù)據(jù)資產(chǎn)編目、數(shù)據(jù)智能分析和數(shù)據(jù)標(biāo)簽等數(shù)據(jù)治理實(shí)施服務(wù)。

        數(shù)據(jù)標(biāo)簽化服務(wù):數(shù)據(jù)治理需求中,比較重要的基礎(chǔ)需求包括數(shù)據(jù)業(yè)務(wù)標(biāo)簽化。數(shù)據(jù)業(yè)務(wù)標(biāo)簽化是指將數(shù)據(jù)面向檢察辦案業(yè)務(wù)進(jìn)行標(biāo)簽化,圍繞“人、物、案、組織、知識(shí)”等主題建立通用標(biāo)簽和圍繞“四大檢察”全量業(yè)務(wù)建立數(shù)據(jù)標(biāo)簽,通過(guò)標(biāo)簽,多角度、多層次地以檢察辦案業(yè)務(wù)的視角管理海量的數(shù)據(jù)并梳理數(shù)據(jù)之間的關(guān)系。

        數(shù)據(jù)治理過(guò)程的產(chǎn)出是形成貼近業(yè)務(wù)的數(shù)據(jù)主題層。在數(shù)據(jù)主題層上,根據(jù)服務(wù)業(yè)務(wù)場(chǎng)景和統(tǒng)計(jì)分析場(chǎng)景的不同再拆分為主題庫(kù)和專(zhuān)題庫(kù)。

        3.數(shù)據(jù)應(yīng)用需求

        隨著數(shù)據(jù)資源的不斷積累,以及檢察業(yè)務(wù)人員對(duì)利用大數(shù)據(jù)辦案的認(rèn)識(shí)逐漸提高,當(dāng)前全國(guó)檢察機(jī)關(guān)的重要數(shù)據(jù)應(yīng)用需求之一就是“大數(shù)據(jù)法律監(jiān)督”。在最高檢的統(tǒng)一規(guī)劃下,全國(guó)各地正大力推進(jìn)大數(shù)據(jù)法律監(jiān)督工作,并提升相應(yīng)的技術(shù)支撐手段。大數(shù)據(jù)法律監(jiān)督顧名思義,就是利用大數(shù)據(jù)技術(shù)輔助檢察機(jī)關(guān)履行法律監(jiān)督職責(zé),大數(shù)據(jù)技術(shù)是基礎(chǔ)手段,法律監(jiān)督是業(yè)務(wù)目的。在大數(shù)據(jù)法律監(jiān)督需求中,需要建立一個(gè)“業(yè)務(wù)建模平臺(tái)”,該平臺(tái)主要面向不懂技術(shù)的一線(xiàn)辦案檢察官,通過(guò)圖形化的操作方式,可以降低使用建模工具的專(zhuān)業(yè)要求和使用難度,使檢察官經(jīng)過(guò)簡(jiǎn)單培訓(xùn)后即可上手操作[6]。

        三、檢察數(shù)據(jù)中臺(tái)架構(gòu)

        (一)外部資源

        放眼外部環(huán)境,數(shù)字中國(guó)的建設(shè)規(guī)劃在2019被納入十四五規(guī)劃,數(shù)字檢察需要融合并借力這個(gè)大背景的優(yōu)勢(shì)。城市大數(shù)據(jù)中心集中優(yōu)勢(shì)資源,按照“集約高效、共享開(kāi)放、安全可靠、按需服務(wù)”的原則,建立了覆蓋全市的電子政務(wù)云,實(shí)現(xiàn)了市委辦局基礎(chǔ)設(shè)施共建共用、信息系統(tǒng)整體部署、數(shù)據(jù)資源匯聚共享、業(yè)務(wù)應(yīng)用有效協(xié)同。

        數(shù)據(jù)中臺(tái)的建設(shè)應(yīng)盡可能依托城市大數(shù)據(jù)中心的云上環(huán)境、設(shè)備資源和工具服務(wù):在降低建設(shè)成本的同時(shí),實(shí)現(xiàn)與其他單位的數(shù)據(jù)資源共享,并將數(shù)字檢察的建設(shè)納入數(shù)字城市整體規(guī)劃中,為后續(xù)全市數(shù)據(jù)上鏈共享等打下牢固的基礎(chǔ)。

        (二)網(wǎng)絡(luò)環(huán)境

        依托地方的網(wǎng)絡(luò)資源和部分本地的設(shè)備資源,檢察機(jī)關(guān)已經(jīng)構(gòu)建了四網(wǎng)同步運(yùn)轉(zhuǎn)的信創(chuàng)網(wǎng)絡(luò)環(huán)境,包括檢察業(yè)務(wù)網(wǎng)、工作網(wǎng)、政務(wù)外網(wǎng)和互聯(lián)網(wǎng)。檢察業(yè)務(wù)網(wǎng)用于涉密系統(tǒng)的部署運(yùn)營(yíng),與其他三個(gè)網(wǎng)絡(luò)保持物理隔離;檢察工作網(wǎng)是當(dāng)前信息化項(xiàng)目的主要部署網(wǎng)絡(luò),也是內(nèi)部數(shù)據(jù)產(chǎn)生和匯聚的地方;政務(wù)外網(wǎng)主要用于對(duì)接外部委辦局等單位;互聯(lián)網(wǎng)則主要面向于公眾服務(wù)的信息發(fā)布、電子文書(shū)送達(dá)等。依托城市電子政務(wù)云的安全交換設(shè)備和跨網(wǎng)交換能力,實(shí)現(xiàn)了除業(yè)務(wù)網(wǎng)之外的邏輯互通、數(shù)據(jù)融通和安全暢通。這進(jìn)一步優(yōu)化了各類(lèi)系統(tǒng)、會(huì)議和遠(yuǎn)程視頻應(yīng)用的性能。

        盡管網(wǎng)絡(luò)拓?fù)渎?lián)通,但是根據(jù)數(shù)據(jù)分級(jí)分類(lèi)原則,內(nèi)部數(shù)據(jù)屬于重要數(shù)據(jù),涉案信息不能在政務(wù)外網(wǎng)上流轉(zhuǎn),更不能流入互聯(lián)網(wǎng)環(huán)境。因此,數(shù)據(jù)中臺(tái)需要采用分布式結(jié)構(gòu),以確保數(shù)據(jù)的安全性和隱私性。

        (三)工具箱環(huán)境

        在市委辦公廳的統(tǒng)一規(guī)劃下,城市大數(shù)據(jù)中心為市級(jí)機(jī)關(guān)免費(fèi)提供了政務(wù)外網(wǎng)PAAS上的工具箱產(chǎn)品,其中包含了數(shù)據(jù)治理工具。這些工具不僅可以提供存儲(chǔ)服務(wù),也可以完成數(shù)據(jù)匯聚、清洗、加工、歸檔等一系列數(shù)據(jù)治理開(kāi)發(fā)工作。

        (四)架構(gòu)設(shè)計(jì)

        基于以上資源和環(huán)境,綜合考慮需求滿(mǎn)足度、可擴(kuò)展性和經(jīng)費(fèi)等因素,本次全流程全息在線(xiàn)辦案系統(tǒng)的數(shù)據(jù)中臺(tái)采用了“兩張網(wǎng)絡(luò),兩個(gè)子平臺(tái)”的組織架構(gòu),整體架構(gòu)如圖2所示。

        1.政務(wù)外網(wǎng)

        在政務(wù)外網(wǎng),建設(shè)數(shù)據(jù)子平臺(tái),面向外部數(shù)據(jù)的匯聚、清洗、加工和編目存儲(chǔ)。技術(shù)路線(xiàn)采用城市大數(shù)據(jù)中心提供的存儲(chǔ)產(chǎn)品(MaxCompute)建設(shè)數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù),并利用數(shù)據(jù)匯聚和治理工具(DataWorks)構(gòu)建數(shù)據(jù)治理的整套流程,最終經(jīng)過(guò)治理好的外部數(shù)據(jù)通過(guò)交換平臺(tái)傳輸?shù)綑z察工作網(wǎng)。

        2.檢察工作網(wǎng)

        在檢察工作網(wǎng),建設(shè)數(shù)據(jù)子平臺(tái),面向內(nèi)部數(shù)據(jù)的匯聚、清洗、加工、編目存儲(chǔ),進(jìn)而與已經(jīng)治理、編目完備的外部數(shù)據(jù)共同構(gòu)成大數(shù)據(jù)基座。技術(shù)路線(xiàn)使用RDS數(shù)據(jù)庫(kù)建設(shè)底層數(shù)據(jù)倉(cāng)庫(kù),自研數(shù)據(jù)治理工具用于構(gòu)建數(shù)據(jù)治理、標(biāo)簽化、數(shù)據(jù)全息檔案以及檢務(wù)檢索分析等能力。同時(shí),還將使用事件感知引擎搭建業(yè)務(wù)建模平臺(tái)。

        3.微服務(wù)體系

        整體架構(gòu)采用微服務(wù)體系搭建,并在此基礎(chǔ)上建設(shè)統(tǒng)一、開(kāi)放、安全的API開(kāi)發(fā)和管理平臺(tái)。每個(gè)服務(wù)運(yùn)行進(jìn)程獨(dú)立,服務(wù)之間采用輕量級(jí)的通信機(jī)制,實(shí)現(xiàn)檢察機(jī)關(guān)內(nèi)各應(yīng)用及與其他外部單位應(yīng)用之間的接口服務(wù)調(diào)用。同時(shí),實(shí)現(xiàn)服務(wù)調(diào)用鏈分析,自動(dòng)分析服務(wù)依賴(lài)的壓力點(diǎn)、易故障點(diǎn)和瓶頸點(diǎn),以實(shí)現(xiàn)業(yè)務(wù)的隔離解耦、敏捷運(yùn)維。平臺(tái)提供統(tǒng)一的訪(fǎng)問(wèn)入口,具備限流、熔斷、降級(jí)、認(rèn)證和授權(quán)、負(fù)載均衡等能力,具有對(duì)整個(gè)服務(wù)調(diào)用鏈的全鏈條監(jiān)控和日志分析能力,支持跨部署點(diǎn)接口服務(wù)和路由管理。

        4.數(shù)據(jù)匯聚

        堅(jiān)實(shí)的數(shù)據(jù)基座需要源源不斷的高質(zhì)量數(shù)據(jù)流入。其中,內(nèi)部數(shù)據(jù)是檢察業(yè)務(wù)大數(shù)據(jù)應(yīng)用的基本數(shù)據(jù);外部數(shù)據(jù)是大數(shù)據(jù)法律監(jiān)督成案不可或缺的必要因素。數(shù)據(jù)匯聚的主要目標(biāo)是建立豐富且高質(zhì)量的檢察數(shù)據(jù)倉(cāng)庫(kù)[7],通常稱(chēng)為“檢察數(shù)據(jù)湖”,如圖3所示。

        “檢察數(shù)據(jù)湖”的建設(shè)重點(diǎn)在于數(shù)據(jù)采集的過(guò)程。數(shù)據(jù)采集主要是將不同來(lái)源的異構(gòu)數(shù)據(jù)通過(guò)ETL等方式統(tǒng)一采集、處理、存儲(chǔ)。數(shù)據(jù)采集中主要考慮數(shù)據(jù)來(lái)源、數(shù)據(jù)采集方法、數(shù)據(jù)存儲(chǔ)方式等[8]。

        (1)數(shù)據(jù)來(lái)源:數(shù)據(jù)的來(lái)源豐富多樣,可以根據(jù)提供數(shù)據(jù)組織單位的不同進(jìn)行分類(lèi),包括內(nèi)部數(shù)據(jù)與外部數(shù)據(jù)。外部數(shù)據(jù)可進(jìn)一步細(xì)分為大數(shù)據(jù)中心數(shù)據(jù)、其他委辦局?jǐn)?shù)據(jù)以及其他途徑數(shù)據(jù)。

        (2)數(shù)據(jù)采集方法:提供關(guān)系型數(shù)據(jù)庫(kù)數(shù)據(jù)接入,支持類(lèi)型包括MySql、SqlServer、Oracle、PostgreSQL、DB2、達(dá)夢(mèng)、瀚高、人大金倉(cāng)、神舟通用;也支持流式數(shù)據(jù)的直接對(duì)接。提供半結(jié)構(gòu)化數(shù)據(jù)接入,支持類(lèi)型包括XML、JSON;提供非結(jié)構(gòu)化數(shù)據(jù)接入,類(lèi)型包括目錄文件;提供API數(shù)據(jù)接入,支持第三方接口數(shù)據(jù)代理發(fā)布、大數(shù)據(jù)庫(kù)表代理發(fā)布成API接口。

        (3)數(shù)據(jù)存儲(chǔ)方式:整個(gè)檢察業(yè)務(wù)累積下來(lái)的數(shù)據(jù)(不包括視頻文件),整體信息量已經(jīng)累積了近2PB,包括視頻文件的話(huà)可能會(huì)快速增長(zhǎng)到10PB甚至更大。數(shù)據(jù)存取業(yè)務(wù)存在頻率和實(shí)時(shí)性要求不同的場(chǎng)景,僅僅使用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)已經(jīng)無(wú)法滿(mǎn)足建設(shè)要求,因此需要使用混合、分布式大數(shù)據(jù)存儲(chǔ)體系來(lái)滿(mǎn)足數(shù)據(jù)倉(cāng)庫(kù)的要求。

        對(duì)于非結(jié)構(gòu)化數(shù)據(jù),利用OSS對(duì)象存儲(chǔ)進(jìn)行保存;對(duì)于數(shù)據(jù)量大的結(jié)構(gòu)化數(shù)據(jù),使用大數(shù)據(jù)套件如Hadoop2.0等進(jìn)行降維存儲(chǔ);若數(shù)據(jù)量較小,則使用傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)存儲(chǔ);對(duì)于數(shù)據(jù)并發(fā)量較大的場(chǎng)景,使用Redis等作為中間Cache;此外,使用Kafka作為數(shù)據(jù)存取調(diào)度的任務(wù)管理框架。

        5.能力支撐平臺(tái)

        數(shù)據(jù)中臺(tái)在工作網(wǎng)建設(shè)通用共享能力平臺(tái),用以支撐數(shù)據(jù)治理過(guò)程和上層的業(yè)務(wù)應(yīng)用的各類(lèi)流程,共計(jì)十種,如圖4所示。

        OCR語(yǔ)音識(shí)別、NLP自然語(yǔ)言處理等的AI算法應(yīng)用能力的統(tǒng)一接入、發(fā)布,處理結(jié)構(gòu)化的數(shù)據(jù),語(yǔ)音、圖像、視頻等,將輔助全流程辦案等多個(gè)檢察業(yè)務(wù)系統(tǒng),提高業(yè)務(wù)應(yīng)用效率。實(shí)現(xiàn)共性通用應(yīng)用能力的統(tǒng)一管理、統(tǒng)一賦能,形成標(biāo)準(zhǔn)化的通用能力輸出模式,節(jié)約計(jì)算資源,提升檢察的智能化水平。

        能力平臺(tái)結(jié)構(gòu)如圖4所示。能力平臺(tái)的模型中心可對(duì)各類(lèi)上架的能力模型進(jìn)行有效的分類(lèi),并提供統(tǒng)一管理、統(tǒng)一部署、統(tǒng)一調(diào)度,實(shí)現(xiàn)從模型到應(yīng)用的統(tǒng)一化發(fā)布、運(yùn)行、共享和管理。同時(shí),對(duì)能力模型提供一致的標(biāo)準(zhǔn)化鏡像、監(jiān)控、API,保證業(yè)務(wù)的一致性。對(duì)于導(dǎo)入的源能力模型,模型中心可提供基于能力模型底層的加速、遷移、發(fā)布等能力,提升能力模型到應(yīng)用場(chǎng)景的性能,提升使用的效率。

        能力平臺(tái)可以統(tǒng)一管理和調(diào)度能力模型應(yīng)用所需的物理資源,實(shí)現(xiàn)資源的最優(yōu)化利用。平臺(tái)將各個(gè)業(yè)務(wù)系統(tǒng)所需的通用原子能力統(tǒng)一管理、統(tǒng)一部署和資源統(tǒng)一調(diào)度,提供豐富的通用能力產(chǎn)品服務(wù),市區(qū)兩級(jí)檢察院各應(yīng)用系統(tǒng)可以根據(jù)實(shí)際需求按需調(diào)用。平臺(tái)基于實(shí)際業(yè)務(wù)需求,讓通用能力在云一邊-端自由流動(dòng)。

        6.建模工具平臺(tái)

        數(shù)據(jù)建模是數(shù)據(jù)應(yīng)用的必備甚至是核心功能之一,其架構(gòu)如圖5所示。數(shù)據(jù)建模是數(shù)據(jù)中臺(tái)使用者通過(guò)直觀手段使用數(shù)據(jù),挖掘數(shù)據(jù)價(jià)值的重要模塊。提供統(tǒng)一的數(shù)據(jù)建模能力,就要在平臺(tái)內(nèi)置可自動(dòng)適配不同計(jì)算引擎的SQL算子,同時(shí)支持各類(lèi)大數(shù)據(jù)計(jì)算引擎自定義的特性,如MapReduce、UDF等,覆蓋絕大部分?jǐn)?shù)據(jù)處理需求。平臺(tái)應(yīng)具備多模型并發(fā)能力,能夠支持全市范圍內(nèi)檢察模型的同時(shí)運(yùn)行。

        該平臺(tái)具備離線(xiàn)模型智能優(yōu)化能力,可以自動(dòng)適配Odps、Hive、Spark、Trino多個(gè)計(jì)算引擎的SQL算子,運(yùn)行時(shí)可復(fù)用歷史緩存結(jié)果,剔除不必要節(jié)點(diǎn),并自動(dòng)識(shí)別可合并節(jié)點(diǎn),從而節(jié)約計(jì)算資源,提升整體性能。在實(shí)時(shí)計(jì)算領(lǐng)域,平臺(tái)采用低資源流式計(jì)算將實(shí)時(shí)計(jì)算常用的業(yè)務(wù)場(chǎng)景進(jìn)行封裝,提供豐富的系統(tǒng)算子,包括分組聚合、維表關(guān)聯(lián)、空間計(jì)算等,支持動(dòng)態(tài)語(yǔ)言編程的自定義算子,能夠快速地構(gòu)建實(shí)時(shí)業(yè)務(wù)鏈路。

        7.其他支撐工具

        除了以上核心模塊,還需要一些底層工具來(lái)支撐和管理整套體系。

        (1)日志收集工具

        采用ElasticSearch+Logstash+Kibana分布式收集日志技術(shù),收集各個(gè)應(yīng)用系統(tǒng)的日志,實(shí)現(xiàn)對(duì)應(yīng)用系統(tǒng)的操作分析和狀態(tài)監(jiān)控的統(tǒng)一處理。

        (2)數(shù)據(jù)遷移工具

        采用ETL工具,該工具是覆蓋數(shù)據(jù)集成邏輯的設(shè)計(jì)、開(kāi)發(fā)、調(diào)試、部署、運(yùn)行、管理、監(jiān)控各個(gè)生命周期不同階段的集成開(kāi)發(fā)工具,可實(shí)現(xiàn)對(duì)數(shù)據(jù)集成流程的開(kāi)發(fā)和部署,也可對(duì)數(shù)據(jù)集成的運(yùn)行過(guò)程進(jìn)行實(shí)時(shí)監(jiān)視,以及對(duì)集成流程歷史數(shù)據(jù)進(jìn)行分析。

        (3)消息中間件

        采用RabbitMQ作為消息中間件,實(shí)現(xiàn)跨綜合平臺(tái)和各部署子系統(tǒng)之間可靠、即時(shí)的消息(信令)傳輸,支持異步、同步消息通知方式,并提供緩沖限流、高峰分流、海量消息堆積處理能力。

        (4)服務(wù)控制組件

        采用Sentinel工具,提供輕量級(jí)的開(kāi)源控制臺(tái),它提供機(jī)器發(fā)現(xiàn)、健康情況管理和監(jiān)控、規(guī)則管理和推送的功能。通過(guò)收集Sentinel客戶(hù)端發(fā)送的心跳包,判斷機(jī)器是否在線(xiàn);通過(guò)Sentinel客戶(hù)端暴露的監(jiān)控API,定期拉取并且聚合應(yīng)用監(jiān)控信息,最終可以實(shí)現(xiàn)秒級(jí)的實(shí)時(shí)監(jiān)控。

        (5)負(fù)載均衡組件

        采用Spring Cloud Ribbon,提供一系列完善的配置,如超時(shí),重試等。通過(guò)Load Balancer獲取服務(wù)提供的所有機(jī)器實(shí)例,Ribbon會(huì)自動(dòng)基于某種規(guī)則(如輪詢(xún),隨機(jī))調(diào)用這些服務(wù)。

        四、應(yīng)用案例

        以“先傷后?!北kU(xiǎn)詐騙模型為例,詳細(xì)闡述使用本技術(shù)路線(xiàn)搭建的數(shù)據(jù)中臺(tái)是如何打通數(shù)據(jù)鏈條,深挖數(shù)據(jù)價(jià)值,賦能檢察業(yè)務(wù),支撐“個(gè)案辦理-類(lèi)案監(jiān)督-系統(tǒng)治理”的。

        (一)模型背景

        在保險(xiǎn)范疇內(nèi),只有先參保繳費(fèi),后發(fā)生事故才能獲得理賠。但上海執(zhí)行著一項(xiàng)“先傷后?!钡幕菝裾撸河萌藛挝粦?yīng)當(dāng)自用工之日起30日內(nèi)為職工辦理社會(huì)保險(xiǎn)登記,如果職工剛?cè)肼毦桶l(fā)生工傷事故,企業(yè)只要是在其入職30日內(nèi)參保并繳費(fèi)的,依然可以申請(qǐng)工傷理賠。

        然而在實(shí)踐中,“先傷后保”這項(xiàng)惠民安企的好政策卻被不法分子所利用,甚至滋生出“工傷黃?!钡叵庐a(chǎn)業(yè)鏈。通過(guò)走訪(fǎng)調(diào)查,發(fā)現(xiàn)該現(xiàn)象絕非個(gè)案,在工傷保險(xiǎn)領(lǐng)域可能存在其他騙保案件,遂以此構(gòu)建業(yè)務(wù)模型作為全市大數(shù)據(jù)賦能法律監(jiān)督的重點(diǎn)項(xiàng)目。

        (二)模型簡(jiǎn)介

        匯聚社保中心所有工傷理賠案件的參保繳費(fèi)時(shí)間、受傷時(shí)間和入職時(shí)間等數(shù)據(jù),篩選出參保繳費(fèi)時(shí)間在入職時(shí)間30天內(nèi)且參保繳費(fèi)時(shí)間比受傷時(shí)間晚的案件,即為“先傷后保”類(lèi)型的案件。然后,以這些案件為索引分析相關(guān)的單位名稱(chēng)、工商注冊(cè)地、受傷從業(yè)人員姓名、身份證號(hào)、參保時(shí)間、繳費(fèi)情況、受傷時(shí)間、事故發(fā)生地和理賠金額,當(dāng)超過(guò)預(yù)警值的時(shí)候即將其視為“先傷后?!北kU(xiǎn)詐騙的潛在線(xiàn)索。接著,通過(guò)調(diào)取涉案企業(yè)的前科劣跡和當(dāng)事人的銀行流水信息進(jìn)一步縮小線(xiàn)索核查范圍,從而產(chǎn)出最終線(xiàn)索集。

        (三)數(shù)據(jù)中臺(tái)支撐

        本案例是一個(gè)典型的利用數(shù)據(jù)中臺(tái)將內(nèi)外部數(shù)據(jù)結(jié)合,產(chǎn)生有效監(jiān)督線(xiàn)索(挖掘數(shù)據(jù)關(guān)聯(lián)價(jià)值,產(chǎn)生數(shù)據(jù)服務(wù))的案例:

        在政務(wù)外網(wǎng)上,社保中心的數(shù)據(jù)中臺(tái)通過(guò)數(shù)據(jù)匯聚工具被存儲(chǔ)到政務(wù)外網(wǎng)建設(shè)的數(shù)據(jù)倉(cāng)庫(kù)中,經(jīng)過(guò)初步清洗加工,去除臟數(shù)據(jù)后,轉(zhuǎn)移到工作網(wǎng)環(huán)境。

        在工作網(wǎng)內(nèi),數(shù)據(jù)進(jìn)入檢察數(shù)據(jù)湖,并與內(nèi)部相關(guān)的前科數(shù)據(jù)以及調(diào)取到的銀行流水?dāng)?shù)據(jù)一同上傳到建模中心。在建模中心,檢察官根據(jù)數(shù)據(jù)碰撞規(guī)則搭建相應(yīng)的模型,輸出最終的線(xiàn)索,并且記錄模型,實(shí)現(xiàn)類(lèi)似案件的監(jiān)督功能。

        以上就是本數(shù)據(jù)中臺(tái)支撐起大數(shù)據(jù)法律監(jiān)督的一個(gè)完整鏈條。

        五、結(jié)束語(yǔ)

        綜上,本數(shù)據(jù)中臺(tái)的技術(shù)路線(xiàn)選型及架構(gòu)設(shè)計(jì)基本滿(mǎn)足了“數(shù)字檢察”的現(xiàn)實(shí)需要,有效支撐了“個(gè)案辦理-類(lèi)案監(jiān)督-系統(tǒng)治理”,為數(shù)據(jù)的匯聚、加工和利用構(gòu)建了可行的路徑。同時(shí),在安全性方面,依托城市大數(shù)據(jù)中心對(duì)政務(wù)云資源提供的專(zhuān)業(yè)化運(yùn)維管理機(jī)制,在產(chǎn)品上盡可能地使用了大數(shù)據(jù)中心的授權(quán)工具,降低了建設(shè)成本,也可以從系統(tǒng)和管理兩個(gè)方面均做到安全可靠。

        參考文獻(xiàn)

        李廣乾.什么是數(shù)據(jù)中臺(tái)[J].中國(guó)信息界,2019(12):72-75.

        張洪丹,趙艷強(qiáng).數(shù)據(jù)中臺(tái)在政務(wù)APP中的搭建與應(yīng)用[J].互聯(lián)網(wǎng)周刊,2021(10):50-52

        劉俊良.新時(shí)代數(shù)據(jù)中臺(tái)研究與設(shè)計(jì)[J].電子世界,2020(4):119-119.

        [4]王曉波.基于數(shù)據(jù)中臺(tái)的產(chǎn)業(yè)數(shù)據(jù)治理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].電腦知識(shí)與技術(shù),2022(18):22-28.

        [5]穆義龍.淺議數(shù)據(jù)中臺(tái)在公安大數(shù)據(jù)建設(shè)中的應(yīng)用[J].法制與經(jīng)濟(jì),2020(10):27-28.

        [6]湖州市人民檢察院課題組.大數(shù)據(jù)法律監(jiān)督平臺(tái)與技術(shù)應(yīng)用相關(guān)問(wèn)題[J].中國(guó)檢察官,2022(23):7-10.

        [7]劉三平.數(shù)據(jù)中臺(tái)建設(shè)對(duì)企業(yè)數(shù)據(jù)貫通的技術(shù)研究[J].電子技術(shù)與軟件工程,2021(2):189-190

        [8]朱曾珍.大數(shù)據(jù)驅(qū)動(dòng)的檢察系統(tǒng)流程再造研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2019:37-40.

        猜你喜歡
        數(shù)據(jù)治理數(shù)據(jù)倉(cāng)庫(kù)
        基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)傾斜解決方案研究
        基于數(shù)據(jù)倉(cāng)庫(kù)的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
        頁(yè)巖氣工程大數(shù)據(jù)倉(cāng)庫(kù)建設(shè)與管理系統(tǒng)開(kāi)發(fā)
        錄井工程(2017年3期)2018-01-22 08:39:50
        基于本體的企業(yè)運(yùn)營(yíng)數(shù)據(jù)治理
        云端數(shù)據(jù)治理初探
        分布式存儲(chǔ)系統(tǒng)在液晶面板制造數(shù)據(jù)倉(cāng)庫(kù)中的設(shè)計(jì)
        電子制作(2016年15期)2017-01-15 13:39:15
        探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的應(yīng)用
        運(yùn)用流程化手段提升資產(chǎn)管理水平
        大數(shù)據(jù)治理模型與治理成熟度評(píng)估研究
        大數(shù)據(jù)時(shí)代城市治理:數(shù)據(jù)異化與數(shù)據(jù)治理
        无码人妻丰满熟妇区五十路百度 | 在线观看亚洲第一黄片| 国产午夜福利在线观看红一片| 色窝窝免费播放视频在线| 国产激情无码Av毛片久久| 中文字幕亚洲精品综合| 麻豆亚洲一区| 激情综合一区二区三区| 纯肉无遮挡H肉动漫在线观看国产| 亚洲一区二区三区国产精品| 草逼短视频免费看m3u8| 护士人妻hd中文字幕| 国产成人77亚洲精品www| 亚洲视频在线中文字幕乱码| 色综合久久中文综合网亚洲| 中文字幕在线亚洲日韩6页| 日韩av在线毛片| 少妇一区二区三区精选| 国产99久久久国产精品~~牛| 成人无码免费一区二区三区| 麻豆密入视频在线观看| 免费观看一区二区三区视频| 人妻激情偷乱视频一区二区三区| 欧美人妻精品一区二区三区| 亚洲欧美另类日本久久影院| 日本人妻97中文字幕| 色视频综合无码一区二区三区| 亚洲肥老熟妇四十五十路在线| 在线播放中文字幕一区二区三区| 丁香婷婷在线成人播放视频| 中文无码久久精品| 国产清品夜色一区二区三区不卡 | 国产AV无码专区亚洲AV桃花庵| 日本女优禁断视频中文字幕| 草色噜噜噜av在线观看香蕉| 蜜桃臀无码内射一区二区三区 | 日本真人边吃奶边做爽动态图| 色一乱一伦一图一区二区精品| 国产熟女av一区二区三区四季| 精品国产亚洲av高清大片| 女人被狂躁到高潮视频免费网站|