李 萍,吳善鵬
(江蘇省大數(shù)據(jù)管理中心,江蘇南京 210036)
隨著大數(shù)據(jù)時(shí)代的來(lái)臨,運(yùn)用大數(shù)據(jù)技術(shù)和理念推動(dòng)信用數(shù)據(jù)的共享和開(kāi)放,創(chuàng)新信用數(shù)據(jù)加工處理方式,提高數(shù)據(jù)挖掘分析和融合應(yīng)用水平,建立全面統(tǒng)一的信用信息數(shù)據(jù)大平臺(tái),已成為當(dāng)前社會(huì)信用體系的建設(shè)趨勢(shì)和研究熱點(diǎn)[1]。順應(yīng)上述趨勢(shì)和熱點(diǎn),本文以省級(jí)信用大數(shù)據(jù)應(yīng)用建設(shè)為研究對(duì)象,在深入分析信用大數(shù)據(jù)的采集、治理和應(yīng)用需求的基礎(chǔ)上,結(jié)合大數(shù)據(jù)技術(shù)特點(diǎn),探索構(gòu)建數(shù)據(jù)處理高效、挖掘充分、安全可靠的省級(jí)信用大數(shù)據(jù)應(yīng)用平臺(tái),為更好地滿足新時(shí)期社會(huì)信用體系建設(shè)的技術(shù)要求。
自我國(guó)正式啟動(dòng)社會(huì)信用體系建設(shè)以來(lái),歷經(jīng)十余年,大部分省市信用信息應(yīng)用平臺(tái)建設(shè)取得積極成效。以江蘇、浙江、廣東等地為例,已建起省級(jí)信用門(mén)戶網(wǎng)、社會(huì)法人信用基礎(chǔ)數(shù)據(jù)庫(kù)、自然人信用基礎(chǔ)數(shù)據(jù)庫(kù)和省公共信用信息服務(wù)平臺(tái),依法開(kāi)展社會(huì)法人和自然人公共信用信息的歸集[2],面向政府部門(mén)和社會(huì)公眾提供各類信用產(chǎn)品應(yīng)用服務(wù)。
當(dāng)前,省級(jí)信用信息應(yīng)用平臺(tái)還存在一些尚待解決的問(wèn)題,主要表現(xiàn)在以下方面。
(1)數(shù)據(jù)質(zhì)量不高。因?yàn)閿?shù)據(jù)標(biāo)準(zhǔn)不夠完善,導(dǎo)致數(shù)據(jù)歸集沒(méi)有有效解決源數(shù)據(jù)多源異構(gòu)的問(wèn)題,數(shù)據(jù)的全面性、連續(xù)性不足,從而導(dǎo)致數(shù)據(jù)質(zhì)量較低,很難形成數(shù)據(jù)分析應(yīng)用的各項(xiàng)主題庫(kù)和專題庫(kù),支撐應(yīng)用的效果不夠好。
(2)數(shù)據(jù)歸集不全。所歸集的信用數(shù)據(jù)覆蓋范圍不夠全,無(wú)法形成完整的信用畫(huà)像和圖譜,難以實(shí)現(xiàn)信用關(guān)聯(lián)關(guān)系網(wǎng)絡(luò)分析。
(3)應(yīng)用時(shí)效低。由于目前數(shù)據(jù)處理的手段和方法,尤其是系統(tǒng)性科學(xué)性的數(shù)據(jù)分析尚未實(shí)現(xiàn)自動(dòng)化、智能化,信用的應(yīng)用還多數(shù)停留在靜態(tài)應(yīng)用當(dāng)中,還不能滿足應(yīng)用的高時(shí)效性需求。
(4)應(yīng)用不夠豐富。目前,部分行業(yè)尚未建立信用信息系統(tǒng)或者應(yīng)用的程度還不夠深,導(dǎo)致信用在服務(wù)“放管服”改革中的作用未能充分發(fā)揮,信用數(shù)據(jù)融合應(yīng)用水平較低。
1.3.1 總體需求
借助大數(shù)據(jù)技術(shù),全方位、多渠道歸集信用數(shù)據(jù),以信用強(qiáng)管理,以信用促發(fā)展,以信用優(yōu)服務(wù),以信用推創(chuàng)新,促進(jìn)社會(huì)運(yùn)用信用成果,發(fā)揮信用大數(shù)據(jù)的價(jià)值,推動(dòng)經(jīng)濟(jì)發(fā)展、完善社會(huì)治理、提升政府服務(wù)和監(jiān)管能力,滿足領(lǐng)導(dǎo)決策、政府業(yè)務(wù)部門(mén)監(jiān)管、社會(huì)信用應(yīng)用服務(wù)等業(yè)務(wù)需求。
1.3.2 功能需求
(1)數(shù)據(jù)建設(shè)需求。在數(shù)據(jù)歸集上,需要滿足數(shù)據(jù)及時(shí)性、準(zhǔn)確性的要求;在數(shù)據(jù)范圍上,需要外部數(shù)據(jù)及第三方數(shù)據(jù)提供輔助支撐;在數(shù)據(jù)治理上,需要滿足對(duì)數(shù)據(jù)處理高效率、數(shù)據(jù)質(zhì)量校核、數(shù)據(jù)治理體系化等方面的要求。
(2)分析模型體系構(gòu)建需求。數(shù)據(jù)分析模型是開(kāi)展各類業(yè)務(wù)應(yīng)用的基礎(chǔ),需要構(gòu)建信用評(píng)價(jià)模型體系,對(duì)重點(diǎn)領(lǐng)域、重點(diǎn)區(qū)域、重點(diǎn)群體加強(qiáng)監(jiān)管,防范系統(tǒng)性風(fēng)險(xiǎn)。
(3)平臺(tái)功能建設(shè)需求。以提供信用數(shù)據(jù)產(chǎn)品和服務(wù)為目標(biāo),夯實(shí)信用大數(shù)據(jù)基礎(chǔ)應(yīng)用平臺(tái)、信用大數(shù)據(jù)分析決策支撐平臺(tái)、信用大數(shù)據(jù)監(jiān)管預(yù)警平臺(tái)、信用大數(shù)據(jù)接口服務(wù)平臺(tái)等建設(shè)工作,提升信用大數(shù)據(jù)資產(chǎn)管理軟實(shí)力。
(4)可視化需求。需提供豐富的可視化手段,滿足不同用戶、不同場(chǎng)景的展示需求。
(5)系統(tǒng)安全體系保障需求。從平臺(tái)實(shí)際使用需求出發(fā),規(guī)劃好應(yīng)用系統(tǒng)安全防護(hù)的架構(gòu),確保系統(tǒng)安全可靠性和業(yè)務(wù)連續(xù)性。
為易于規(guī)劃和管理,采用分層設(shè)計(jì)理念,結(jié)合用戶分析、需求分析,結(jié)合政府的職能定位,將省級(jí)信用大數(shù)據(jù)應(yīng)用平臺(tái)整體分為“六橫兩縱”,總體框架體系設(shè)計(jì)如圖1所示。
(1)基礎(chǔ)設(shè)施體系由網(wǎng)絡(luò)、計(jì)算設(shè)備、存儲(chǔ)設(shè)備、安全防護(hù)設(shè)備和大數(shù)據(jù)基礎(chǔ)支撐套件等基礎(chǔ)設(shè)施組成。
(2)數(shù)據(jù)資源中心主要是匯聚融合信用基礎(chǔ)數(shù)據(jù)和主題數(shù)據(jù),進(jìn)行集中式數(shù)據(jù)治理,構(gòu)建形成信用全景畫(huà)像融合主題數(shù)據(jù)庫(kù)和信用應(yīng)用主題數(shù)據(jù)庫(kù)。數(shù)據(jù)資源中心組成如圖2所示。
(3)支撐體系主要提供信用大數(shù)據(jù)應(yīng)用所需的平臺(tái)系統(tǒng)支撐功能,用于構(gòu)建各類應(yīng)用和服務(wù)的分析模型、畫(huà)像標(biāo)簽管理、數(shù)據(jù)治理平臺(tái)、信息共享平臺(tái)、資源管控平臺(tái)等支持服務(wù),支撐體系架構(gòu)如圖3所示。
(4)信用應(yīng)用體系主要面向各類用戶提供具體信用業(yè)務(wù)應(yīng)用,由信用大數(shù)據(jù)業(yè)務(wù)應(yīng)用系統(tǒng)、信用大數(shù)據(jù)分析決策支撐系統(tǒng)、信用大數(shù)據(jù)監(jiān)管預(yù)警系統(tǒng)、信用大數(shù)據(jù)服務(wù)系統(tǒng)、信用大數(shù)據(jù)基礎(chǔ)應(yīng)用系統(tǒng)、信用大數(shù)據(jù)服務(wù)總線和配置管理系統(tǒng)組成。
(5)信用服務(wù)體系主要面向各類用戶提供線上線下的各類服務(wù),包括信用數(shù)據(jù)服務(wù)(接口)、信用產(chǎn)品服務(wù)、線下信用分析服務(wù)等。
(6)信用訪問(wèn)入口包括信用門(mén)戶網(wǎng)站、APP、公眾號(hào)、可視化大屏等。
(7)標(biāo)準(zhǔn)規(guī)范體系和安全保障體系是指在國(guó)家、省已有的標(biāo)準(zhǔn)規(guī)范及安全管理體系下,引入大數(shù)據(jù)有關(guān)內(nèi)容,構(gòu)建符合大數(shù)據(jù)場(chǎng)景下的信用應(yīng)用相關(guān)標(biāo)準(zhǔn)規(guī)范和安全保障體系。
圖1 總體架構(gòu)
圖2 數(shù)據(jù)資源中心框架
圖3 支撐體系框架
圖4 大數(shù)據(jù)套件組成
如圖4所示,為更好支撐信用大數(shù)據(jù)的處理、挖掘和分析,平臺(tái)采用主流大數(shù)據(jù)技術(shù)、工具和套件,包括Hadoop、圖數(shù)據(jù)庫(kù)、分布式數(shù)據(jù)庫(kù)、圖計(jì)算、機(jī)器學(xué)習(xí)、深度分析等。
按照大數(shù)據(jù)環(huán)境下的一般數(shù)據(jù)治理流程[3],平臺(tái)的數(shù)據(jù)架構(gòu)主要由原始庫(kù)、資源庫(kù)和主題應(yīng)用庫(kù)組成,架構(gòu)如圖5所示。
原始庫(kù)用來(lái)存放從各個(gè)渠道直接采集的有關(guān)數(shù)據(jù),不做任何改動(dòng)和處理。資源庫(kù)對(duì)采集的原始庫(kù)數(shù)據(jù)按照一定的治理規(guī)則進(jìn)行數(shù)據(jù)清洗、比對(duì)、整合,一部分?jǐn)?shù)據(jù)成為可以使用的有效數(shù)據(jù),一部分成為無(wú)法使用的無(wú)效數(shù)據(jù)。主題應(yīng)用庫(kù)是面向各類主題的應(yīng)用數(shù)據(jù)集,用來(lái)為各應(yīng)用系統(tǒng)提供數(shù)據(jù)支持。
圖5 數(shù)據(jù)架構(gòu)
本文分析了省級(jí)信用信息平臺(tái)建設(shè)狀況和主要需求,按照大數(shù)據(jù)的架構(gòu)理念,設(shè)計(jì)了建設(shè)信用大數(shù)據(jù)應(yīng)用平臺(tái)的方案,本方案緊貼需求,目標(biāo)明確,具有實(shí)踐指導(dǎo)意義。