近年來,浙江省全力推動一體化智能化公共數(shù)據(jù)平臺建設(shè),形成省市縣三級貫通,并與國家平臺實(shí)現(xiàn)互聯(lián)的數(shù)據(jù)平臺體系。通過統(tǒng)一的數(shù)據(jù)平臺實(shí)現(xiàn)了數(shù)據(jù)生產(chǎn)、存儲、加工、治理、共享、開放的一體化,促進(jìn)公共數(shù)據(jù)資源“用起來”“動起來”“活起來”
近年來,浙江省全力推動一體化智能化公共數(shù)據(jù)平臺建設(shè),形成省市縣三級貫通,并與國家平臺實(shí)現(xiàn)互聯(lián)的數(shù)據(jù)平臺體系。通過統(tǒng)一的數(shù)據(jù)平臺實(shí)現(xiàn)了數(shù)據(jù)生產(chǎn)、存儲、加工、治理、共享、開放的一體化。
強(qiáng)大的數(shù)據(jù)平臺是數(shù)據(jù)“用起來”的支撐。目前,數(shù)據(jù)平臺有40 萬—50萬臺PC 機(jī)用戶,它們既是數(shù)據(jù)來源,也是數(shù)據(jù)用戶。后臺有接近萬臺物理服務(wù)器,整個(gè)服務(wù)體系服務(wù)超過1 億用戶,包括205 萬名浙江省有關(guān)工作人員,包括黨委、人大、政府、政協(xié)、公共服務(wù)單位人員等。平臺歸集了全省的公共數(shù)據(jù),成為數(shù)據(jù)要素“用起來”“動起來”“活起來”的基礎(chǔ)。數(shù)據(jù)服務(wù),更多是數(shù)據(jù)流服務(wù),是動態(tài)服務(wù),也有靜態(tài)的數(shù)據(jù)產(chǎn)品。但動態(tài)化的數(shù)據(jù)流服務(wù)是數(shù)據(jù)服務(wù)的主流。研究分析數(shù)據(jù)產(chǎn)品和數(shù)據(jù)服務(wù)時(shí),要摒棄傳統(tǒng)靜態(tài)化思維,要有數(shù)字化、網(wǎng)絡(luò)化的線上思維。
統(tǒng)一的目錄管理體系是數(shù)據(jù)“用起來”的保障。構(gòu)建全省統(tǒng)一的公共數(shù)據(jù)目錄,將黨委、人大、政府、政協(xié)、兩院、公共事業(yè)等所有單位的數(shù)據(jù)進(jìn)行歸集,形成“一套目錄、兩級建設(shè)、三級運(yùn)營”數(shù)據(jù)資源管理系統(tǒng),已累計(jì)編制目錄數(shù)據(jù)項(xiàng)287.3 萬項(xiàng),其中省級28.4 萬項(xiàng)、市縣級258.9 萬項(xiàng),基本實(shí)現(xiàn)應(yīng)編目盡編目,實(shí)現(xiàn)全省公共數(shù)據(jù)資產(chǎn)“一本賬”管理。
批量歸集和“數(shù)據(jù)高鐵”是數(shù)據(jù)“動起來”的兩大路徑。一是通過批量共享,按時(shí)間、分批量將每個(gè)單位的數(shù)據(jù)都?xì)w集到一個(gè)數(shù)據(jù)倉庫里,目前集中共享數(shù)據(jù)占數(shù)據(jù)使用場景的一大半。二是建設(shè)“數(shù)據(jù)高鐵”,即數(shù)據(jù)實(shí)時(shí)交換系統(tǒng),任何一個(gè)系統(tǒng)出現(xiàn)數(shù)據(jù)變化(包括新增和變化)時(shí),都通過“數(shù)據(jù)高鐵”實(shí)現(xiàn)同步更新,有效促進(jìn)數(shù)據(jù)“動起來”。需要強(qiáng)調(diào)的是,數(shù)據(jù)的集中并不一定意味著安全風(fēng)險(xiǎn)的上升,分散的數(shù)據(jù)更容易產(chǎn)生風(fēng)險(xiǎn)。
分級分類是數(shù)據(jù)“用起來”的基礎(chǔ)。數(shù)據(jù)產(chǎn)品與一般產(chǎn)品不同,歸集后不能直接使用,需要針對不同數(shù)據(jù)產(chǎn)品進(jìn)行分級分類管理。按照全國信安標(biāo)委《網(wǎng)絡(luò)安全標(biāo)準(zhǔn)實(shí)踐指南——網(wǎng)絡(luò)數(shù)據(jù)分類分級指引》,浙江制定了《數(shù)字化改革 公共數(shù)據(jù)分類分級指南》地方標(biāo)準(zhǔn),將所有字段按照L1、L2、L3、L4 分成四類。比如人口戶籍?dāng)?shù)據(jù)表(如圖1),身份證號碼、姓名等字段列為敏感(L4),泄露之后可能對人的名譽(yù)造成傷害的字段列為較敏感(L3)。
圖1 人口戶籍?dāng)?shù)據(jù)表
數(shù)據(jù)共享與開放是數(shù)據(jù)“用起來”的核心。數(shù)據(jù)共享主要包括批量共享、接口共享等兩種方式,其中批量共享是定時(shí)把更新的數(shù)據(jù)批量共享數(shù)據(jù)需求方,接口共享可以實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)調(diào)用。截至目前,浙江省平臺開發(fā)接口5007 個(gè),2022 年1 月至今被調(diào)用801.1 億次。數(shù)據(jù)開放主要是依托一體化智能化公共數(shù)據(jù)平臺建設(shè)全省統(tǒng)一數(shù)據(jù)開放網(wǎng)站,11 個(gè)地市建立數(shù)據(jù)開放分站點(diǎn),包括注冊實(shí)名后即可申請直接下載或接口服務(wù)的無條件開放,以及需要申請審核的有條件開放兩種方式。
授權(quán)運(yùn)營是公共數(shù)據(jù)發(fā)揮價(jià)值的重要方式。制度層面,浙江省大數(shù)據(jù)局正在積極推動《浙江省公共數(shù)據(jù)授權(quán)運(yùn)營管理暫行辦法》制定工作,將著力解決“誰來授權(quán)、授權(quán)給誰、怎么授權(quán)、授權(quán)什么、授權(quán)數(shù)據(jù)怎么用、如何安全監(jiān)管和激勵(lì)評價(jià)”等六方面問題。技術(shù)層面,在線使用是數(shù)據(jù)要素與其他商品的重要區(qū)別,目前浙江正在一體化平臺架構(gòu)體系里開發(fā)建設(shè)授權(quán)運(yùn)營域系統(tǒng),包括省、市兩級授權(quán)運(yùn)營域。數(shù)據(jù)交易場所可以在授權(quán)運(yùn)營域中建設(shè)節(jié)點(diǎn),從而實(shí)現(xiàn)交易所、用戶與公共數(shù)據(jù)平臺之間的數(shù)據(jù)流通。
數(shù)據(jù)安全是數(shù)據(jù)“用起來”的底線思維。整個(gè)數(shù)據(jù)價(jià)值利用中最重要的是底線思維,即確保數(shù)據(jù)安全。目前,浙江省大數(shù)據(jù)局正在圍繞“進(jìn)不來、拿不走、看不懂、改不了、賴不掉”等“五個(gè)不”,進(jìn)行技術(shù)能力、管理體系和運(yùn)營體系的建設(shè)。聚焦“五個(gè)不”,通過重點(diǎn)數(shù)據(jù)表設(shè)置分類分級、權(quán)限管控、數(shù)據(jù)加密、數(shù)據(jù)脫敏、數(shù)據(jù)水印等七大能力,推進(jìn)重點(diǎn)數(shù)據(jù)表全鏈路防護(hù)。
公共數(shù)據(jù)平臺在確保公共數(shù)據(jù)安全前提下,實(shí)現(xiàn)高質(zhì)量數(shù)據(jù)供給,促進(jìn)數(shù)據(jù)受控高效流通使用,推動可信數(shù)據(jù)賦能,激活數(shù)據(jù)要素價(jià)值。公共數(shù)據(jù)平臺通過數(shù)據(jù)知識化管理,為政務(wù)大模型提供海量高質(zhì)量數(shù)據(jù)支撐。政務(wù)大模型通過提供智能化、多樣化服務(wù),提升公共數(shù)據(jù)平臺智能化水平。
現(xiàn)在大模型火爆發(fā)展,但真正用起來需要解決兩大問題,一是價(jià)值觀的對齊,使用不同數(shù)據(jù)訓(xùn)練出來的模型可能會具有完全不同的價(jià)值觀。二是確保數(shù)據(jù)安全,需要進(jìn)行私有化部署,這其中既涉及新開發(fā)大模型的產(chǎn)權(quán)歸屬問題,還涉及公共數(shù)據(jù)運(yùn)營需要破解的問題。當(dāng)前的大模型基本都是語言模型,需要經(jīng)過一定時(shí)間訓(xùn)練應(yīng)用才能真正發(fā)揮作用。直接依據(jù)互聯(lián)網(wǎng)數(shù)據(jù)新開發(fā)的大模型,沒有精準(zhǔn)優(yōu)質(zhì)數(shù)據(jù)的支撐,是無法直接支撐嚴(yán)肅的業(yè)務(wù)活動的。
下一步,圍繞激活數(shù)據(jù)要素價(jià)值,浙江省大數(shù)據(jù)發(fā)展管理局將主要開展兩方面工作。一是以“一機(jī)制、四清單”為抓手,完善需求征集分析機(jī)制,做好回流數(shù)據(jù)質(zhì)量治理清單、數(shù)據(jù)產(chǎn)品開發(fā)清單、重點(diǎn)開放數(shù)據(jù)需求清單、數(shù)源單位數(shù)據(jù)治理及業(yè)務(wù)數(shù)字化建議清單等“四清單”管理;二是建立健全公共數(shù)據(jù)全鏈路防護(hù)體系,依托浙江省公共數(shù)據(jù)平臺建設(shè)自然語言處理、知識圖譜兩大能力中心,探索建設(shè)政務(wù)大模型,提升平臺智能化水平。