專欄導(dǎo)語:生成式人工智能驅(qū)動(dòng)政務(wù)服務(wù)既非簡(jiǎn)單工具,亦非終極答案,它是一場(chǎng)需要持續(xù)審視、不斷調(diào)適的社會(huì)技術(shù)實(shí)驗(yàn),最終目的是讓治理更智慧地服務(wù)于“人”的尊嚴(yán)與價(jià)值。以大語言模型為代表的新一代生成式人工智能,正以前所未有的深度和廣度嵌入數(shù)字政務(wù)服務(wù)體系,為構(gòu)建服務(wù)型政府、提升治理現(xiàn)代化水平注入全新動(dòng)能。生成式人工智能驅(qū)動(dòng)的遠(yuǎn)不止效率的提升,更是一場(chǎng)靜默的治理范式革命。然而,生成式人工智能驅(qū)動(dòng)的積極意義之下,其不僅是工具升級(jí),而是深刻觸及治理本質(zhì)的再定義,亟待重新思考公共權(quán)力的邊界與責(zé)任以及規(guī)則重構(gòu)。本欄兩篇文章的共性在于以“生成式人工智能”作為政務(wù)服務(wù)的切入點(diǎn)展開系統(tǒng)性研究,將研究視角投向驅(qū)動(dòng)過程中涌現(xiàn)的深層結(jié)構(gòu)性問題和制度性挑戰(zhàn),為理解數(shù)字政務(wù)服務(wù)的當(dāng)下圖景與未來走向提供理論范式和深層追問。
張會(huì)平 、高文浩聚焦最前沿的大語言模型技術(shù),解析大語言模型引發(fā)政務(wù)數(shù)據(jù)共享底層邏輯的深刻嬉變,勾勒大語言模型如何重塑政務(wù)數(shù)據(jù)共享的格局與目標(biāo),揭示政務(wù)大模型的核心能力與數(shù)據(jù)需求,透視大語言模型嵌入政務(wù)數(shù)據(jù)共享的新要求和新思路。在此基礎(chǔ)上,提出制度完善的系統(tǒng)性進(jìn)路,這些制度性策略為構(gòu)建適應(yīng)大模型時(shí)代的政務(wù)數(shù)據(jù)治理新范式撥開迷霧,推動(dòng)該議題中全新的知識(shí)生產(chǎn)與學(xué)術(shù)傳播。吳磊、劉子瑞敏銳地捕捉到一個(gè)核心但常被簡(jiǎn)化處理的關(guān)鍵議題,即生成式人工智能驅(qū)動(dòng)政務(wù)服務(wù)的“界面風(fēng)險(xiǎn)”,創(chuàng)造性地構(gòu)建\"技術(shù)一制度一關(guān)系”三維分析框架,揭示生成式人工智驅(qū)動(dòng)能政務(wù)服務(wù)的界面生成邏輯,引出“界面\"帶來的拓展性議題,構(gòu)建一個(gè)理解風(fēng)險(xiǎn)生成與傳導(dǎo)機(jī)制的整合框架,并基于三重界面風(fēng)險(xiǎn),提出三維協(xié)同應(yīng)對(duì)策略,為系統(tǒng)性防范和化解智能政務(wù)服務(wù)中的“暗礁\"提供重要的理論工具和實(shí)踐路徑。
[關(guān)鍵詞]政務(wù)數(shù)據(jù)共享;大語言模型;政務(wù)大模型;公共數(shù)據(jù)治理中圖分類號(hào):D63 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1008-410X(2025)04-0033-13
一、問題提出
大模型技術(shù)的突飛猛進(jìn)與應(yīng)用落地正在加速政務(wù)智能化轉(zhuǎn)型,各類政務(wù)大模型應(yīng)勢(shì)而生。政務(wù)大模型并非簡(jiǎn)單的技術(shù)工具移植,而是數(shù)字政府建設(shè)邁向智能高效階段的必然產(chǎn)物,其核心在于利用強(qiáng)大的數(shù)據(jù)分析、語義理解和內(nèi)容生成等能力,提升政府治理效能[1]。目前,許多行業(yè)和地方積極深掘政務(wù)大模型應(yīng)用,以政務(wù)數(shù)智化驅(qū)動(dòng)中國式現(xiàn)代化,不斷提升政府治理效能、公共決策水平和公共服務(wù)質(zhì)量。數(shù)據(jù)資源是政務(wù)大模型的基礎(chǔ)性支撐,有效運(yùn)用政務(wù)大模型,需要安全、有序推進(jìn)更大范圍、更深層次的政務(wù)數(shù)據(jù)共享。
政務(wù)數(shù)據(jù)共享是數(shù)字政府建設(shè)的基石,在提升政府履職能力、推進(jìn)國家治理體系和治理能力現(xiàn)代化中具有重要支撐作用[2]。作為我國首部專門規(guī)范政務(wù)數(shù)據(jù)共享的行政法規(guī),《政務(wù)數(shù)據(jù)共享?xiàng)l例》的出臺(tái)標(biāo)志著政務(wù)數(shù)據(jù)共享工作進(jìn)入法治化、規(guī)范化的新階段,體現(xiàn)國家加快推進(jìn)數(shù)字政府建設(shè)、釋放數(shù)據(jù)價(jià)值的鮮明導(dǎo)向[3]。現(xiàn)有條例所倡導(dǎo)的共享模式主要圍繞結(jié)構(gòu)化、標(biāo)準(zhǔn)化的數(shù)據(jù)類型展開,并未充分回應(yīng)大語言模型背景下對(duì)非結(jié)構(gòu)化、多模態(tài)等數(shù)據(jù)的共享訴求。制度與技術(shù)之間的錯(cuò)位,是政務(wù)數(shù)據(jù)共享面臨的新型張力。
關(guān)于政務(wù)數(shù)據(jù)共享的研究可分為價(jià)值驅(qū)動(dòng)、阻礙因素和實(shí)施路徑三個(gè)方面。在價(jià)值驅(qū)動(dòng)方面,數(shù)字技術(shù)的迭代使海量政務(wù)數(shù)據(jù)匯集成為可能,催生了對(duì)數(shù)據(jù)潛力的挖掘,如由于具備去中心化、可追溯、不可篡改等特性,區(qū)塊鏈技術(shù)應(yīng)用于政務(wù)數(shù)據(jù)共享,能夠在確保數(shù)據(jù)安全的前提下打破部門數(shù)據(jù)壁壘[4][5],釋放數(shù)據(jù)資源的公共價(jià)值;政務(wù)數(shù)據(jù)的融會(huì)貫通能夠助推政府提供公共服務(wù)的能力與水平,打造群眾滿意的“一網(wǎng)通辦\"\"跨省通辦\"[6],即提升政府治理能力和公共服務(wù)水平是政務(wù)數(shù)據(jù)共享的內(nèi)在需求;政務(wù)數(shù)據(jù)作為質(zhì)量好、范圍廣、高價(jià)值的數(shù)據(jù)資源[7],安全、全面共享特性滿足了數(shù)字經(jīng)濟(jì)發(fā)展對(duì)數(shù)據(jù)要素提出的新要求。在阻礙因素方面,數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一、接口不兼容、數(shù)據(jù)質(zhì)量不高、缺乏統(tǒng)一的數(shù)據(jù)共享平臺(tái)等是技術(shù)與數(shù)據(jù)層面的阻礙[8];部門壁壘、權(quán)責(zé)不清、缺乏統(tǒng)一協(xié)調(diào)機(jī)制、缺乏專業(yè)人才、行政管理人員思想滯后、數(shù)據(jù)提供部門責(zé)任意識(shí)不強(qiáng)等是管理體制機(jī)制層面的障礙[9];共享成本高昂、投人產(chǎn)出不明確、數(shù)據(jù)共享激勵(lì)機(jī)制不完備、數(shù)據(jù)收益和成本估算機(jī)制缺乏等是經(jīng)濟(jì)成本層面的障礙。在實(shí)施路徑方面,中央層面頒布有關(guān)政務(wù)數(shù)據(jù)共享的準(zhǔn)備、使用、維護(hù)、監(jiān)管政策,統(tǒng)籌推進(jìn)數(shù)據(jù)資源共享[10],地方分部門分模塊層層落實(shí)[11],搭建政務(wù)數(shù)據(jù)共享的條塊網(wǎng)絡(luò);此外,應(yīng)建立數(shù)據(jù)采集、數(shù)據(jù)共享、數(shù)據(jù)匯集程序、數(shù)據(jù)共享權(quán)責(zé)的全生命周期合法體制[12],在尊重?cái)?shù)據(jù)風(fēng)險(xiǎn)邏輯的基礎(chǔ)上,理性對(duì)待數(shù)據(jù)法治[13]。
政務(wù)大模型的出現(xiàn)與深度嵌入對(duì)政務(wù)數(shù)據(jù)共享提出新要求?,F(xiàn)有研究鮮有將大模型這一顛覆性技術(shù)作為核心變量,深人探究大模型對(duì)政務(wù)數(shù)據(jù)共享所引發(fā)的新型嬗變與深層要求。大模型對(duì)數(shù)據(jù)的跨模態(tài)、實(shí)時(shí)性、知識(shí)化、場(chǎng)景化及可執(zhí)行性等高階需求,超過了傳統(tǒng)政務(wù)數(shù)據(jù)共享模式所能承載的范圍。本文聚焦于政務(wù)大模型背景下的政務(wù)數(shù)據(jù)共享新圖景,遵循“現(xiàn)狀審視—技術(shù)需求—邏輯重塑—制度完善\"的邏輯線條,回答如下問題:政務(wù)大模型具有哪些核心能力?這些核心能力對(duì)數(shù)據(jù)提出了哪些新需求?這些新需求給政務(wù)數(shù)據(jù)共享帶來了什么變化和沖擊?該如何完善現(xiàn)有制度以更好支撐政務(wù)大模型的發(fā)展與應(yīng)用?
二、按需響應(yīng):政務(wù)數(shù)據(jù)共享的運(yùn)行邏輯
作為數(shù)字政府建設(shè)的重要基礎(chǔ)支撐,政務(wù)數(shù)據(jù)共享制度的完備程度關(guān)系到數(shù)據(jù)價(jià)值實(shí)現(xiàn)的效率及政府治理效能的提升。從宏觀層面而言,國務(wù)院頒布的《政務(wù)數(shù)據(jù)共享?xiàng)l例》已勾勒出政務(wù)數(shù)據(jù)共享的基本法律框架與頂層設(shè)計(jì),核心目的在于通過制度設(shè)計(jì)“推進(jìn)政務(wù)數(shù)據(jù)安全有序共享利用,提升政府?dāng)?shù)字化治理能力和政務(wù)服務(wù)效能”[14]。地方政府根據(jù)本地?cái)?shù)字化轉(zhuǎn)型的實(shí)際狀況,制定了更加貼近需要的地方性法規(guī)或管理細(xì)則,旨在構(gòu)建運(yùn)行高效的政務(wù)數(shù)據(jù)治理體系,推動(dòng)形成一體化政務(wù)數(shù)據(jù)資源體系。
(一)統(tǒng)籌協(xié)調(diào)與分級(jí)負(fù)責(zé):構(gòu)建政務(wù)數(shù)據(jù)共享的治理框架
政務(wù)數(shù)據(jù)共享治理搭建“統(tǒng)籌協(xié)調(diào) + 分級(jí)負(fù)責(zé)”的架構(gòu)體系,目的是厘清各級(jí)政府及職能機(jī)構(gòu)的權(quán)責(zé)關(guān)系,解決由于數(shù)據(jù)分散造成的整合困難。在國家層面,《政務(wù)數(shù)據(jù)共享?xiàng)l例》等法律法規(guī)、政策文件的頒布確立了頂層設(shè)計(jì)與協(xié)同運(yùn)作機(jī)制。例如,依靠國務(wù)院數(shù)字政府建設(shè)領(lǐng)導(dǎo)小組推進(jìn)跨部門協(xié)作與標(biāo)準(zhǔn)化進(jìn)程,從宏觀角度系統(tǒng)指導(dǎo)數(shù)據(jù)共享工作展開與深人發(fā)展。在這個(gè)框架下,地方政府承擔(dān)分級(jí)管理的職責(zé),而且要根據(jù)區(qū)域稟賦優(yōu)勢(shì)探索本地化的制度與實(shí)踐模式。例如,上海市指定市大數(shù)據(jù)中心作為全市公共數(shù)據(jù)管理的統(tǒng)籌機(jī)構(gòu),負(fù)責(zé)目錄編制、平臺(tái)建設(shè)和共享應(yīng)用推進(jìn),建立跨部門協(xié)同的機(jī)制;杭州市以“城市大腦\"為依托,將數(shù)據(jù)管理部門從技術(shù)支撐角色提升為數(shù)據(jù)資源的管理主體,促使業(yè)務(wù)流程整合和改良;廣東省把省、市、縣三級(jí)的權(quán)責(zé)劃分清楚,加大全域統(tǒng)籌管控的能力,避免地方重復(fù)建設(shè)和數(shù)據(jù)分散。這些實(shí)踐體現(xiàn)了統(tǒng)一框架下的差異化探索,增強(qiáng)了制度適配性。于具體部門而言,各個(gè)職能部門要指定專人來統(tǒng)籌協(xié)調(diào)和監(jiān)管政務(wù)數(shù)據(jù)共享工作,強(qiáng)化自身在數(shù)據(jù)共享中的主體責(zé)任。各部門建立標(biāo)準(zhǔn)化的協(xié)作機(jī)制,推動(dòng)不同部門之間開展信息交流并實(shí)現(xiàn)資源共享,改善政務(wù)服務(wù)流程,體現(xiàn)自上而下協(xié)調(diào)體系在基層治理方面的實(shí)際效果。
(二)標(biāo)準(zhǔn)統(tǒng)一與目錄管理:奠定政務(wù)數(shù)據(jù)共享的數(shù)據(jù)基礎(chǔ)
政務(wù)數(shù)據(jù)共享的推進(jìn)既依賴跨部門協(xié)作機(jī)制的完善,又受限于數(shù)據(jù)標(biāo)準(zhǔn)化程度與互操作水平。數(shù)據(jù)的非統(tǒng)一性造成部門間共享數(shù)據(jù)時(shí)無法直接對(duì)接,需要耗費(fèi)大量人力物力進(jìn)行清洗、轉(zhuǎn)換和匹配,不僅效率低下,且極易導(dǎo)致數(shù)據(jù)失真和業(yè)務(wù)協(xié)同障礙。政務(wù)數(shù)據(jù)共享要從根源出發(fā),創(chuàng)建統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)體系:一是制訂數(shù)據(jù)元標(biāo)準(zhǔn),即對(duì)數(shù)據(jù)最小邏輯單元進(jìn)行統(tǒng)一定義,保證各個(gè)系統(tǒng)里同名數(shù)據(jù)項(xiàng)的語義一致;二是形成數(shù)據(jù)分類編碼規(guī)則,對(duì)政務(wù)數(shù)據(jù)進(jìn)行科學(xué)分類并賦予統(tǒng)一編碼,做到數(shù)據(jù)結(jié)構(gòu)化處理,改善檢索速度和管理效果;三是確立接口與交互規(guī)范,清楚數(shù)據(jù)交換過程中的接口規(guī)劃、格式界定、傳輸方法等關(guān)鍵部分,保證不同系統(tǒng)之間的兼容性和互操作性[15]。這些標(biāo)準(zhǔn)化舉措成為達(dá)成數(shù)據(jù)“可用、可讀、可信”目的的重要支撐。標(biāo)準(zhǔn)統(tǒng)一在制度上依托目錄管理機(jī)制的搭建,國家政策及地方實(shí)踐要求各部門編制并更新本部門數(shù)據(jù)目錄,明確數(shù)據(jù)名稱、提供主體、共享方式等信息,使分散在各部門的數(shù)據(jù)資源能夠被集中“清點(diǎn)”和“登記”。目錄體系如同數(shù)據(jù)地圖,解決了“不知道有什么數(shù)據(jù)\"與“不知道數(shù)據(jù)在哪兒\"的問題。例如,浙江通過“浙里辦\"等平臺(tái)構(gòu)建統(tǒng)一目錄,各部門能夠快捷查找數(shù)據(jù),實(shí)現(xiàn)了跨部門數(shù)據(jù)的歸集與應(yīng)用[16]。
(三)供需對(duì)接與依法共享:規(guī)范政務(wù)數(shù)據(jù)共享的使用行為
供需對(duì)接與依法共享側(cè)重于數(shù)據(jù)流轉(zhuǎn)過程中的行為規(guī)范和責(zé)任約束,旨在確保數(shù)據(jù)在不同主體間有效流通與合規(guī)使用。數(shù)據(jù)供給方常常會(huì)由于擔(dān)心工作負(fù)擔(dān)加重、自身承擔(dān)不可控的法律與輿論風(fēng)險(xiǎn)或喪失數(shù)據(jù)權(quán)力籌碼而不愿開放數(shù)據(jù)[8],數(shù)據(jù)需求方則經(jīng)常遇到數(shù)據(jù)獲取途徑少、申請(qǐng)流程繁雜、審批周期長(zhǎng)及使用權(quán)限受限制等困境,導(dǎo)致實(shí)際數(shù)據(jù)共享低效、數(shù)據(jù)共享難以落地。現(xiàn)有制度構(gòu)建了以需求為導(dǎo)向的供需對(duì)接機(jī)制。對(duì)需求方來說,需求方有權(quán)提出數(shù)據(jù)申請(qǐng),并且供給方要在指定的時(shí)間內(nèi)予以答復(fù),確保需求部門能夠通過明確的法定渠道表達(dá)數(shù)據(jù)需求,而非依賴非正式的“人情溝通\"或?qū)訉訉徟?。需求方必須踐行依法共享原則,對(duì)數(shù)據(jù)的使用必須限定在申請(qǐng)的用途之內(nèi),不能超出范圍使用或透露給第三方,以保證數(shù)據(jù)應(yīng)用符合法規(guī)且有效防范風(fēng)險(xiǎn)。對(duì)供給方來說,現(xiàn)有制度明確數(shù)據(jù)提供的權(quán)責(zé)邊界,解決“不敢共享\"“不愿共享\"的問題;確立了“應(yīng)共享、盡共享\"的剛性義務(wù),使數(shù)據(jù)提供從過去的“可選項(xiàng)\"變?yōu)椤氨剡x項(xiàng)”;對(duì)共享申請(qǐng)進(jìn)行合法性、必要性審查,在法定時(shí)限內(nèi)答復(fù)并提供數(shù)據(jù),提升了數(shù)據(jù)共享效率?,F(xiàn)有制度按照“誰管理誰負(fù)責(zé)、誰使用誰負(fù)責(zé)\"的原則,加強(qiáng)供需雙方責(zé)任約束,使數(shù)據(jù)提供者在依法履職時(shí)不會(huì)被額外追責(zé)。供需對(duì)接與依法共享機(jī)制的構(gòu)建,改變了以往政務(wù)數(shù)據(jù)共享中供需雙方信息不對(duì)稱、權(quán)責(zé)不明確、行為無序的被動(dòng)局面。
(四)安全可控與全流程監(jiān)管:筑牢政務(wù)數(shù)據(jù)共享的安全底線
安全可控與全流程監(jiān)管指向數(shù)據(jù)共享的生命線,即如何確保數(shù)據(jù)在全生命周期內(nèi)的安全性和可靠性。現(xiàn)有制度設(shè)計(jì)將“安全可控\"理念貫穿政務(wù)數(shù)據(jù)共享的各個(gè)環(huán)節(jié)。在共享前,借助數(shù)據(jù)分類分級(jí)和脫敏處理削減潛在風(fēng)險(xiǎn)[17],如上海市對(duì)不同敏感程度的數(shù)據(jù)設(shè)定不同的共享?xiàng)l件和安全等級(jí),確保敏感數(shù)據(jù)在共享前經(jīng)過嚴(yán)格的脫敏、加密處理。在共享中,推動(dòng)建設(shè)安全可信的數(shù)據(jù)共享交換平臺(tái),采用加密傳輸、身份認(rèn)證、訪問控制等技術(shù)手段,確保數(shù)據(jù)在傳輸過程中的完整性和保密性,很多地方推行專用網(wǎng)絡(luò)隔離和邏輯加密結(jié)合的技術(shù)方案,構(gòu)建物理隔離與邏輯隔離相結(jié)合的安全環(huán)境。在共享后,實(shí)施用途限定、日志審計(jì)、周期核查機(jī)制,如廣東省建立安全日志留存與溯源制度,要求在數(shù)據(jù)使用期結(jié)束后及時(shí)銷毀或歸還。在安全可控理念下輔以全流程監(jiān)管機(jī)制筑牢了數(shù)據(jù)共享生命線。全流程監(jiān)管是指數(shù)據(jù)主管部門對(duì)政務(wù)數(shù)據(jù)從采集、存儲(chǔ)、共享、使用到銷毀的全生命周期進(jìn)行持續(xù)性、系統(tǒng)性的監(jiān)督檢查。例如,杭州市大數(shù)據(jù)管理局通過技術(shù)手段,實(shí)時(shí)監(jiān)控平臺(tái)上的數(shù)據(jù)訪問行為、下載記錄和異常操作,一旦發(fā)現(xiàn)違規(guī)行為立即預(yù)警并啟動(dòng)追溯機(jī)制,避免安全責(zé)任出現(xiàn)“真空地帶”。全流程監(jiān)管有效解決了政務(wù)數(shù)據(jù)共享的安全顧慮,使各部門能夠更加放心地參與數(shù)據(jù)共享。
(五)平臺(tái)支撐與技術(shù)賦能:構(gòu)建政務(wù)數(shù)據(jù)共享的基礎(chǔ)設(shè)施
政務(wù)數(shù)據(jù)形態(tài)已經(jīng)從傳統(tǒng)紙質(zhì)文本轉(zhuǎn)向電子化、結(jié)構(gòu)化數(shù)據(jù)。這一轉(zhuǎn)變不僅是數(shù)據(jù)載體的更新,更是對(duì)數(shù)據(jù)管理、流通和應(yīng)用模式的根本性重塑。隨著數(shù)據(jù)量激增和共享需求的復(fù)雜化,亟須以平臺(tái)建設(shè)為支撐,構(gòu)建穩(wěn)定、安全、高效的共享基礎(chǔ)設(shè)施。政務(wù)數(shù)據(jù)共享平臺(tái)具備物理架構(gòu)和邏輯功能的雙重屬性,主要功能包含數(shù)據(jù)匯集、目錄管理、資源分配及安全保障等諸多方面。這些平臺(tái)并非簡(jiǎn)單的信息系統(tǒng),而是集計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、數(shù)據(jù)服務(wù)于一體的綜合性技術(shù)底座。國家要求建設(shè)一體化政務(wù)服務(wù)平臺(tái)作為數(shù)據(jù)共享的總樞紐,嚴(yán)格控制各部門業(yè)務(wù)系統(tǒng)的數(shù)量,將各地區(qū)、各部門政務(wù)數(shù)據(jù)平臺(tái)接人全國政務(wù)大數(shù)據(jù)平臺(tái)[18]。統(tǒng)一建設(shè)打破了“數(shù)據(jù)煙囪\"的格局,為數(shù)據(jù)標(biāo)準(zhǔn)化、安全監(jiān)管提供了統(tǒng)一的技術(shù)路徑。在省級(jí)層面,通過建設(shè)省級(jí)政務(wù)云和大數(shù)據(jù)平臺(tái)實(shí)現(xiàn)了全省政務(wù)數(shù)據(jù)集中匯集、統(tǒng)一管理和高效共享,,特點(diǎn)在于承上啟下,既對(duì)接國家平臺(tái)又向下延伸至市縣級(jí),支撐全省域的數(shù)據(jù)共享與業(yè)務(wù)協(xié)同。在市縣層面,側(cè)重于建設(shè)面向具體業(yè)務(wù)場(chǎng)景的共享平臺(tái)或應(yīng)用支撐平臺(tái),特點(diǎn)是更貼近基層業(yè)務(wù)需求,與上級(jí)平臺(tái)進(jìn)行數(shù)據(jù)對(duì)接,實(shí)現(xiàn)上下聯(lián)動(dòng)。不同層級(jí)平臺(tái)間的互聯(lián)互通,通過統(tǒng)一的接口規(guī)范、數(shù)據(jù)交換協(xié)議和安全認(rèn)證機(jī)制來實(shí)現(xiàn),共同構(gòu)筑立體化的政務(wù)數(shù)據(jù)共享網(wǎng)絡(luò)。
三、因能而變:政務(wù)大模型的核心能力與數(shù)據(jù)需求
以 DeepSeek 為代表的大模型融人政府治理,為數(shù)字政府建設(shè)提供了強(qiáng)大的技術(shù)支撐[19]?;跀?shù)字政務(wù)人“小浦”“如如\"文旅大模型、“京策\(yùn)"政策大模型、社工AI助手“小鯨\"四個(gè)典型案例研究發(fā)現(xiàn),政務(wù)大模型效能的實(shí)現(xiàn)需要高質(zhì)量數(shù)據(jù)整合[20]。政務(wù)大模型的能力依賴高質(zhì)量數(shù)據(jù)的供給,需要基于政務(wù)大模型的核心能力,全面梳理其數(shù)據(jù)需求。
(一)政務(wù)大模型的核心能力
1.自然語言理解與生成能力。自然語言處理技術(shù)主要包括兩大核心部分:一是自然語言理解;二是自然語言生成[21]。前者依靠大規(guī)模預(yù)訓(xùn)練模型,對(duì)文本的深層語義展開精確分析;后者則致力于根據(jù)輸人的數(shù)據(jù)或指令,自動(dòng)生產(chǎn)符合語法規(guī)則,契合語境且邏輯連貫的人類可讀文本。這兩項(xiàng)關(guān)鍵技術(shù)共同形成政務(wù)大模型展開高效人機(jī)交互的關(guān)鍵支撐。在政務(wù)應(yīng)用環(huán)境下,大模型可以準(zhǔn)確解讀民眾及企業(yè)復(fù)雜的政策咨詢或業(yè)務(wù)需求,從龐大的法律法規(guī)中提煉關(guān)鍵要素,給出簡(jiǎn)潔明了的回答;撰寫各類官方文件,如報(bào)告,公告等;對(duì)現(xiàn)有的文檔進(jìn)行校驗(yàn)改良,改進(jìn)文檔的質(zhì)量;仔細(xì)分析輿情數(shù)據(jù),從中提取關(guān)鍵信息,形成一個(gè)主題集中化的總結(jié)報(bào)告,為決策者把握社會(huì)動(dòng)態(tài)和民眾關(guān)注提供重要的參照依據(jù)。
2.多模態(tài)數(shù)據(jù)融合生成能力。多模態(tài)數(shù)據(jù)融合生成能力是指模型能夠處理和理解文本、圖像、音頻、視頻等多種不同模態(tài)的數(shù)據(jù)信息,并在此基礎(chǔ)上進(jìn)行跨模態(tài)的智能生成。這種能力打破了傳統(tǒng)只用單一數(shù)據(jù)源處理的局限,讓大模型有了類似“多感官\"系統(tǒng)的交互特點(diǎn)。多模態(tài)數(shù)據(jù)融合能力使大模型在政務(wù)領(lǐng)域中能夠?qū)?fù)雜的異構(gòu)環(huán)境進(jìn)行全面感知和深刻理解。與傳統(tǒng)政務(wù)信息系統(tǒng)不同的是,政務(wù)大模型憑借多模態(tài)數(shù)據(jù)協(xié)同分析能力可以做到統(tǒng)一而深入的語義解析,按照特定需求從一種模態(tài)生成另外一種模態(tài)并將內(nèi)容輸出。例如,在城市應(yīng)急管理方面,大模型可以將視頻流、遙感影像、傳感器數(shù)據(jù)及文本報(bào)告等各類信息匯總,對(duì)城市基礎(chǔ)設(shè)施運(yùn)行情況、交通流量分布狀況及環(huán)境質(zhì)量等核心指標(biāo)進(jìn)行精確評(píng)價(jià)[22]。政務(wù)大模型的主要優(yōu)點(diǎn)在于能夠自動(dòng)產(chǎn)出圖文并茂的分析報(bào)告,憑借語音交互技術(shù)遠(yuǎn)程控制應(yīng)急設(shè)備,進(jìn)而優(yōu)化城市治理的精細(xì)程度和突發(fā)事件應(yīng)對(duì)效果。
3.時(shí)空數(shù)據(jù)分析與預(yù)測(cè)能力。大模型的時(shí)空數(shù)據(jù)分析與預(yù)測(cè)能力契合現(xiàn)代政府對(duì)治理精細(xì)化和前瞻性的迫切需求。時(shí)空數(shù)據(jù)分析與預(yù)測(cè)是指模型能夠理解、處理和預(yù)測(cè)地理位置和時(shí)間維度不斷變化的信息。這個(gè)功能主要依靠循環(huán)神經(jīng)網(wǎng)絡(luò)、Transformer等先進(jìn)模型來達(dá)成。這些模型的互構(gòu)使大模型能夠深入探究文本數(shù)據(jù)里的時(shí)間序列特性及長(zhǎng)程依賴關(guān)系,從而有效地找出時(shí)間序列里隱藏的信息和動(dòng)態(tài)走向,為預(yù)測(cè)分析和異常檢測(cè)賦予可靠的支撐。例如,百度利用時(shí)空Transformer 技術(shù)開發(fā)出文心交通大模型,將時(shí)間序列上的交通變化和空間上的道路拓?fù)浣Y(jié)合起來,實(shí)現(xiàn)了對(duì)交通模式的精確分析與預(yù)測(cè)[23]。時(shí)空數(shù)據(jù)挖掘與預(yù)測(cè)技術(shù)能夠讓政府做到前瞻性規(guī)劃,提前察覺到潛藏的風(fēng)險(xiǎn)并采取主動(dòng)干涉的舉措,從而優(yōu)化治理效能。
4.知識(shí)圖譜構(gòu)建與推理能力。知識(shí)圖譜不僅僅是詞條的積累與堆砌,而且是將政府管理和服務(wù)中的各種“實(shí)體\"作為知識(shí)圖譜的節(jié)點(diǎn),將它們之間的“關(guān)系\"作為知識(shí)圖譜的邊[24]。政務(wù)大模型中的知識(shí)圖譜可以根據(jù)覆蓋的范圍和專業(yè)性分為兩類:一是通用政務(wù)知識(shí)圖譜,包含政府運(yùn)作的大致框架、法律法規(guī)及標(biāo)準(zhǔn)流程等內(nèi)容,它們?yōu)檎?wù)大模型提供常識(shí)性支撐;二是針對(duì)具體領(lǐng)域的垂直政務(wù)知識(shí)圖譜,包括醫(yī)療保障、市場(chǎng)監(jiān)管、城市規(guī)劃等領(lǐng)域,蘊(yùn)含很多專業(yè)知識(shí)體系和領(lǐng)域業(yè)務(wù)規(guī)范。這兩類知識(shí)圖譜結(jié)合起來形成的網(wǎng)絡(luò)架構(gòu)能夠使大模型像人類一樣理解政務(wù)信息的深層含義和信息之間的關(guān)系,并且在理解的基礎(chǔ)上進(jìn)行邏輯推理發(fā)現(xiàn)新的知識(shí)或解決復(fù)雜問題。傳統(tǒng)知識(shí)圖譜構(gòu)建大多依靠人工標(biāo)注和規(guī)則設(shè)定,既耗時(shí)又費(fèi)力[25],而且很難應(yīng)對(duì)政務(wù)數(shù)據(jù)的動(dòng)態(tài)更新和規(guī)模增長(zhǎng)。大模型能夠?qū)崿F(xiàn)知識(shí)圖譜的半自動(dòng)化甚至自動(dòng)化構(gòu)建,進(jìn)而有效地從非結(jié)構(gòu)化的政務(wù)文本中提取實(shí)體、關(guān)系、事件這些關(guān)鍵要素。
5.任務(wù)自動(dòng)化與流程再造能力。任務(wù)自動(dòng)化主要指將原本依賴人工處理的政務(wù)服務(wù)環(huán)節(jié)通過智能化手段實(shí)現(xiàn)即問即答、自動(dòng)生成、一次告知。傳統(tǒng)人工智能技術(shù)實(shí)現(xiàn)的任務(wù)自動(dòng)化通常依賴規(guī)則或特定算法,僅適用于固定流程,缺乏靈活性與擴(kuò)展性。大模型所表現(xiàn)出來的任務(wù)自動(dòng)化擁有更強(qiáng)的通用性、語言理解能力和跨任務(wù)遷移能力,通過預(yù)訓(xùn)練和微調(diào)達(dá)成對(duì)自然語言指令的準(zhǔn)確分析且快速匹配到眾多任務(wù)應(yīng)用場(chǎng)景。政務(wù)大模型的任務(wù)自動(dòng)化不再是局部環(huán)節(jié)的替代,而是嵌人完整的政務(wù)流程,對(duì)整個(gè)服務(wù)路徑進(jìn)行重構(gòu)。以自動(dòng)化審批為例,大模型不僅可以根據(jù)流程節(jié)點(diǎn)自動(dòng)生成審批意見,還可以聯(lián)動(dòng)調(diào)用相關(guān)部門材料、歷史案例和政策依據(jù),實(shí)現(xiàn)在“流程觸發(fā)—模型生成—結(jié)果反饋”閉環(huán)中的即時(shí)響應(yīng),大幅減少人為干預(yù)與等待成本。在此基礎(chǔ)上,審批系統(tǒng)可以根據(jù)大模型生成的初審結(jié)果自動(dòng)進(jìn)入下一流程節(jié)點(diǎn),實(shí)現(xiàn)跨部門的智能流轉(zhuǎn)。政務(wù)大模型的任務(wù)自動(dòng)化與流程再造能力,保障政務(wù)服務(wù)從“可辦\"到“高效辦理\"再到“優(yōu)質(zhì)服務(wù)\"的轉(zhuǎn)型[26]。
6.人機(jī)協(xié)同與智能化決策能力。政務(wù)大模型不僅具備任務(wù)執(zhí)行與信息生成能力,更展現(xiàn)出對(duì)復(fù)雜治理問題的認(rèn)知加工與判斷輔助能力,為政府決策模式帶來根本性變革。政務(wù)大模型能夠輔助政策方案的生成、比較與預(yù)測(cè),助力實(shí)現(xiàn)人機(jī)協(xié)同的智能化決策。政務(wù)大模型還可以根據(jù)歷史數(shù)據(jù)、治理經(jīng)驗(yàn)和實(shí)施反饋提出多套可行方案,并模擬不同方案下的社會(huì)反應(yīng)、資源投入和風(fēng)險(xiǎn)預(yù)估;對(duì)政策執(zhí)行可能引發(fā)的連鎖反應(yīng)進(jìn)行預(yù)測(cè),識(shí)別潛在矛盾與不可預(yù)期風(fēng)險(xiǎn),輔助領(lǐng)導(dǎo)“預(yù)見性決策”[27];通過歸納民眾反饋與輿情數(shù)據(jù),為方案調(diào)整與后續(xù)監(jiān)督提供依據(jù),實(shí)現(xiàn)從“經(jīng)驗(yàn)驅(qū)動(dòng)\"向“數(shù)據(jù)決策\(yùn)"的躍遷。人機(jī)協(xié)同與智能化決策的核心在于發(fā)揮模型高效處理與洞察能力的同時(shí),保留人類對(duì)價(jià)值判斷、倫理邊界和政治意圖的主導(dǎo)性。
(二)政務(wù)大模型的數(shù)據(jù)需求
1.文檔類數(shù)據(jù)。文檔類數(shù)據(jù)是政務(wù)大模型的血液和養(yǎng)料,維系著其理解力、生成力及決策輔助能力的生命線。大模型只有通過對(duì)海量文本的無監(jiān)督預(yù)訓(xùn)練,才能習(xí)得語言的內(nèi)在邏輯、知識(shí)結(jié)構(gòu)與邏輯關(guān)系[28]。政務(wù)文檔中蘊(yùn)含的政策精神、行政邏輯、業(yè)務(wù)規(guī)范等專業(yè)知識(shí)能夠滿足大模型構(gòu)建政務(wù)認(rèn)知的需求。政務(wù)領(lǐng)域內(nèi)的文檔類數(shù)據(jù),涵蓋政府在日常運(yùn)行、管理和服務(wù)過程中產(chǎn)生、收集和積累的各種以文字為主的非結(jié)構(gòu)化信息資源。一是政策法規(guī)類文本,包含法律法規(guī)、地方性條例及政策文件等不同形式,是政務(wù)大模型中規(guī)范政務(wù)語言表達(dá)并形成制度框架的重要基礎(chǔ)。二是政務(wù)公文與報(bào)告類文本,如政府工作報(bào)告、行政公告等,重點(diǎn)體現(xiàn)的是政府運(yùn)作過程中的業(yè)務(wù)流程、專業(yè)用語、行政思維模式等特征。三是辦事指南與服務(wù)手冊(cè)類文本,這類數(shù)據(jù)直接面向民眾和企業(yè),旨在提供具體的辦事指引。四是輿情與民意反饋類文本,這部分?jǐn)?shù)據(jù)反映了民眾對(duì)政府工作的評(píng)價(jià)、意見、建議和訴求。五是專業(yè)領(lǐng)域知識(shí)文本,是指政府在特定管理或服務(wù)領(lǐng)域積累的專業(yè)知識(shí)。六是政府公開信息與數(shù)據(jù)字典類文本,包括政府官方網(wǎng)站發(fā)布的各類新聞稿、統(tǒng)計(jì)數(shù)據(jù)解讀、政府信息公開目錄,以及描述政務(wù)數(shù)據(jù)結(jié)構(gòu)的元數(shù)據(jù)、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)目錄等。
2.多模態(tài)數(shù)據(jù)。通過持續(xù)學(xué)習(xí)治理實(shí)踐的多模態(tài)數(shù)據(jù),大語言模型能夠透過紛繁表象把握事物本質(zhì)[29]。多模態(tài)數(shù)據(jù)是超越傳統(tǒng)文本范疇的、能夠以數(shù)字形式存儲(chǔ)和處理的、承載政務(wù)信息的異構(gòu)數(shù)據(jù)集合,可分為圖像數(shù)據(jù)、視頻數(shù)據(jù)、音頻數(shù)據(jù)、傳感器數(shù)據(jù)及其他結(jié)構(gòu)化與半結(jié)構(gòu)化數(shù)據(jù)。在政務(wù)領(lǐng)域中,圖像數(shù)據(jù)大多涉及與政府事務(wù)有關(guān)的靜態(tài)影像資料,如城市管理過程中的違法證據(jù)照片、現(xiàn)場(chǎng)勘查圖示、歷史檔案文獻(xiàn)掃描件等。視頻數(shù)據(jù)包含城市交通監(jiān)控錄像、公共區(qū)域動(dòng)態(tài)視頻流、應(yīng)急指揮平臺(tái)實(shí)時(shí)畫面、執(zhí)法人員記錄設(shè)備采集的視頻、政府會(huì)議錄制等。音頻數(shù)據(jù)則包含政務(wù)服務(wù)熱線通話記錄、民眾訴求電話錄音、高層領(lǐng)導(dǎo)公開講話音頻、行政會(huì)議紀(jì)要錄音、突發(fā)事件預(yù)警語音通知、智能語音交互平臺(tái)對(duì)話記錄等多種聲學(xué)信息載體。傳感器數(shù)據(jù)是物聯(lián)網(wǎng)在政務(wù)領(lǐng)域的應(yīng)用產(chǎn)物,包括環(huán)境監(jiān)測(cè)傳感器數(shù)據(jù)、交通流量傳感器數(shù)據(jù)等。其他結(jié)構(gòu)化與半結(jié)構(gòu)化數(shù)據(jù)如各類電子表格、數(shù)據(jù)庫記錄、結(jié)構(gòu)化表單等,它們往往與非結(jié)構(gòu)化文本、圖像等形成關(guān)聯(lián)。
3.優(yōu)質(zhì)時(shí)空數(shù)據(jù)。政務(wù)大模型的時(shí)空數(shù)據(jù)分析與預(yù)測(cè)能力并非簡(jiǎn)單地記錄時(shí)間地點(diǎn),而是通過對(duì)海量、異構(gòu)且?guī)в芯珳?zhǔn)時(shí)空標(biāo)記的政務(wù)數(shù)據(jù)進(jìn)行整合、挖掘與推演,構(gòu)建一個(gè)能夠模擬和預(yù)測(cè)現(xiàn)實(shí)世界動(dòng)態(tài)變化的“數(shù)字孿生\"體系。優(yōu)質(zhì)時(shí)空數(shù)據(jù)的核心特性主要體現(xiàn)在即時(shí)性與地理精細(xì)性兩個(gè)方面。即時(shí)性數(shù)據(jù)不僅要涵蓋事件發(fā)生的時(shí)間點(diǎn),而且要具備高頻次更新的能力,能夠隨著事態(tài)的演變而持續(xù)流入。這種即時(shí)性強(qiáng)調(diào)的是數(shù)據(jù)所承載信息的時(shí)效價(jià)值,而非僅僅是數(shù)據(jù)傳輸?shù)乃俣?。地理精?xì)性數(shù)據(jù)能夠精準(zhǔn)刻畫政務(wù)實(shí)體和事件在地理空間中的具體位置、形態(tài)及其相互間的空間關(guān)系,此類數(shù)據(jù)包含精確的地理坐標(biāo)、具體的地址信息、行政邊界的劃分或地理實(shí)體的編碼等關(guān)鍵要素。地理精細(xì)性既存在于結(jié)構(gòu)化的地理信息中,又表現(xiàn)在非結(jié)構(gòu)化的文字描述里,如某個(gè)區(qū)域事件的文字記載,還有結(jié)合衛(wèi)星遙感影像、無人機(jī)航拍圖像等多種模態(tài)數(shù)據(jù)所蘊(yùn)含的空間語義聯(lián)系。地理精細(xì)性賦予大模型“空間透視\"的能力,能夠理解政務(wù)活動(dòng)的地域特征和空間關(guān)聯(lián),從而實(shí)現(xiàn)精準(zhǔn)施策和差異化
治理。
4.領(lǐng)域知識(shí)圖譜。知識(shí)圖譜結(jié)合政策知識(shí)要素形成富語義的網(wǎng)狀知識(shí)體系,通過補(bǔ)全知識(shí)要素來提升政策大模型知識(shí)問答服務(wù)的穩(wěn)定性、可解釋性[30]。大模型既要擁有準(zhǔn)確識(shí)別實(shí)體及其關(guān)聯(lián)關(guān)系的能力,又要依靠已有的知識(shí)來開展類似人的邏輯推演過程,需要具有高度專業(yè)性與可聯(lián)系性的數(shù)據(jù)。一是專業(yè)性數(shù)據(jù)是高度聚焦于特定政務(wù)領(lǐng)域的,包含該領(lǐng)域特有的術(shù)語、概念、規(guī)則、案例、實(shí)體和事件,如在醫(yī)保領(lǐng)域內(nèi),包括各種疾病、藥品、治療方法、醫(yī)保政策、報(bào)銷流程等。通用大模型在垂直領(lǐng)域表現(xiàn)不理想,正是因?yàn)槿鄙龠@種專業(yè)化領(lǐng)域知識(shí)支撐[31]。二是可聯(lián)系性是領(lǐng)域知識(shí)圖譜數(shù)據(jù)的核心所在,這類數(shù)據(jù)能夠清晰地展現(xiàn)政務(wù)實(shí)體之間的復(fù)雜關(guān)系,要求數(shù)據(jù)中蘊(yùn)含或能夠被抽取出的不僅是孤立的事實(shí),更是這些事實(shí)之間的因果、時(shí)間、從屬、條件等多種邏輯關(guān)系。
5.流程協(xié)同數(shù)據(jù)。政務(wù)服務(wù)本質(zhì)上是一個(gè)由多層級(jí)政府機(jī)構(gòu)、跨部門系統(tǒng)及多元主體共同構(gòu)成的協(xié)同運(yùn)行體系。大模型技術(shù)的嵌入不僅重構(gòu)了傳統(tǒng)政務(wù)服務(wù)的運(yùn)行邏輯,更通過任務(wù)自動(dòng)化與流程再造實(shí)現(xiàn)了服務(wù)效能的躍升,而這一轉(zhuǎn)型過程高度依賴流程協(xié)同數(shù)據(jù)的有效整合與運(yùn)用。該類數(shù)據(jù)不僅記錄政務(wù)事項(xiàng)在多個(gè)部門、系統(tǒng)、層級(jí)間流轉(zhuǎn)過程中的運(yùn)行軌跡,更實(shí)現(xiàn)了對(duì)每個(gè)流程節(jié)點(diǎn)的結(jié)構(gòu)化描述與責(zé)任標(biāo)注。它包含完整業(yè)務(wù)流程的環(huán)節(jié)設(shè)置、審批鏈條的層級(jí)關(guān)系、每個(gè)環(huán)節(jié)所需材料清單、審批依據(jù)與權(quán)責(zé)歸屬、實(shí)際操作人員、處理時(shí)限、狀態(tài)變更日志、異常中斷記錄等關(guān)鍵要素。流程協(xié)同數(shù)據(jù)最大價(jià)值在于賦能大模型對(duì)政務(wù)流程的全景理解與關(guān)鍵節(jié)點(diǎn)控制,能夠發(fā)現(xiàn)流程斷點(diǎn)、識(shí)別環(huán)節(jié)冗余、分析資源瓶頸,從而實(shí)現(xiàn)任務(wù)調(diào)度優(yōu)化。
6.決策支持?jǐn)?shù)據(jù)。決策支持?jǐn)?shù)據(jù)是大模型從單一任務(wù)執(zhí)行工具向綜合智能決策支撐平臺(tái)轉(zhuǎn)變的關(guān)鍵變量,“如果沒有數(shù)據(jù),公共決策就會(huì)被直覺與膚淺的花言巧語所主宰\"[32](P210)。相較于前述各類數(shù)據(jù)側(cè)重于操作與過程,決策支持?jǐn)?shù)據(jù)強(qiáng)調(diào)“以未來為導(dǎo)向\"的行動(dòng)參考,不僅能夠描述治理現(xiàn)狀,而且支撐可選方案推演和治理結(jié)果預(yù)測(cè)。從內(nèi)容構(gòu)成看,決策支持?jǐn)?shù)據(jù)既包括流程協(xié)同、輿情反饋、治理成效、資源分布等顯性結(jié)構(gòu)化數(shù)據(jù),也必須融合政策文本、知識(shí)圖譜中蘊(yùn)含的制度邏輯與治理語境。與此同時(shí),真實(shí)的公共決策場(chǎng)景往往還需要調(diào)動(dòng)領(lǐng)域?qū)<业碾[性知識(shí)——包括經(jīng)驗(yàn)判斷、風(fēng)險(xiǎn)認(rèn)知、專業(yè)直覺等難以量化但至關(guān)重要的知識(shí)資源。政務(wù)大模型若要實(shí)現(xiàn)人機(jī)協(xié)同決策,就必須具備對(duì)這類知識(shí)的表達(dá)、調(diào)用與組合能力。這種數(shù)據(jù)與知識(shí)的協(xié)同構(gòu)成政務(wù)大模型決策支持能力的底層邏輯。政務(wù)大模型不僅要在技術(shù)層面整合多源數(shù)據(jù),更要構(gòu)建“面向決策\(yùn)"的知識(shí)組織機(jī)制,使顯性數(shù)據(jù)與隱性知識(shí)有機(jī)融合,從而推動(dòng)政府從被動(dòng)響應(yīng)走向科學(xué)、主動(dòng)、可解釋的現(xiàn)代化決策模式。
四、動(dòng)態(tài)多元:大語言模型嵌入下政務(wù)數(shù)據(jù)共享新要求
隨著政務(wù)大模型嵌入政府業(yè)務(wù),現(xiàn)有的政務(wù)數(shù)據(jù)共享運(yùn)行邏輯發(fā)生了改變。數(shù)據(jù)共享內(nèi)容從傳統(tǒng)的結(jié)構(gòu)化文本擴(kuò)展到圖像、視頻、音頻等多模態(tài)數(shù)據(jù);共享依據(jù)也從法規(guī)剛性下的“需求驅(qū)動(dòng)\"轉(zhuǎn)向“主動(dòng)共享\",尤其是部門與個(gè)人的意愿成為關(guān)鍵因素[33]?,F(xiàn)有數(shù)據(jù)共享平臺(tái)在技術(shù)上面臨升級(jí)挑戰(zhàn),需要政務(wù)大模型在核心能力基礎(chǔ)上考慮政務(wù)數(shù)據(jù)智能的轉(zhuǎn)變。安全保障和權(quán)責(zé)關(guān)系的重構(gòu)成為新問題,如何確保數(shù)據(jù)的一致性、避免偏見并明確責(zé)任,是大模型驅(qū)動(dòng)下政務(wù)數(shù)據(jù)共享的新要求。
(一)共享內(nèi)容增添:納入文檔類、多模態(tài)數(shù)據(jù)
一直以來,政務(wù)數(shù)據(jù)共享實(shí)踐關(guān)注結(jié)構(gòu)化文本數(shù)據(jù),相關(guān)制度設(shè)計(jì)主要圍繞表格型或字段型數(shù)據(jù)的標(biāo)準(zhǔn)化展開。政務(wù)大模型對(duì)非結(jié)構(gòu)化數(shù)據(jù)的需求愈發(fā)凸顯,與以結(jié)構(gòu)化數(shù)據(jù)為主的共享模式存在張力。在政務(wù)大模型應(yīng)用場(chǎng)景中需同時(shí)接入圖像、語音、視頻等多模態(tài)數(shù)據(jù)與規(guī)章制度、會(huì)議紀(jì)要、講話稿等文檔類資料,以實(shí)現(xiàn)對(duì)場(chǎng)景的全面感知與語義理解。在這種需求牽引下,政務(wù)數(shù)據(jù)共享的內(nèi)容邏輯向著多源異構(gòu)數(shù)據(jù)共建方向演進(jìn)。一是多模態(tài)數(shù)據(jù)在城市管理、交通監(jiān)測(cè)、應(yīng)急響應(yīng)等領(lǐng)域具備高度應(yīng)用價(jià)值,傳統(tǒng)制度對(duì)此缺乏處理機(jī)制,無法滿足統(tǒng)一編碼、語義解析等現(xiàn)有規(guī)則的要求。二是文檔類政務(wù)數(shù)據(jù)作為大模型訓(xùn)練和推理的關(guān)鍵語料,也因歸集標(biāo)準(zhǔn)缺失而難以被納入共享目錄體系。這類嬗變實(shí)質(zhì)是數(shù)據(jù)內(nèi)容邊界的重塑。為支撐政務(wù)大模型對(duì)感知力、理解力和生成力的全方位擴(kuò)展,政務(wù)數(shù)據(jù)共享逐步納入更多文檔型、非結(jié)構(gòu)化和多模態(tài)數(shù)據(jù)內(nèi)容,實(shí)現(xiàn)由“信息接人\"到“語義嵌入\"的躍遷。這不僅是數(shù)據(jù)類型的延伸,更是治理邏輯從數(shù)據(jù)交換轉(zhuǎn)向認(rèn)知協(xié)同。
(二)共享依據(jù)擴(kuò)充:從法規(guī)剛性到意愿驅(qū)動(dòng)
在現(xiàn)有政務(wù)數(shù)據(jù)共享制度中,數(shù)據(jù)共享主要建立在法律授權(quán)與目錄編制基礎(chǔ)之上,強(qiáng)調(diào)依法共享與供需對(duì)接的剛性模式。以地方層面為例,上海市出臺(tái)的《上海市公共數(shù)據(jù)共享實(shí)施辦法(試行)》[34]、廣東省出臺(tái)的《廣東省政務(wù)數(shù)據(jù)資源共享管理辦法(試行)》[35]等文件均明確提出,政務(wù)數(shù)據(jù)共享應(yīng)以職責(zé)相關(guān)性為原則,在統(tǒng)一目錄下根據(jù)部門申請(qǐng)進(jìn)行調(diào)取與響應(yīng)。這種以法規(guī)規(guī)定與申請(qǐng)驅(qū)動(dòng)為核心的共享邏輯,在一定程度上保障了數(shù)據(jù)共享的安全性與規(guī)范性,但也帶來共享內(nèi)容狹窄、流程響應(yīng)緩慢、跨部門聯(lián)動(dòng)受限等現(xiàn)實(shí)問題。大模型在生成政策文本中,往往需要獲取尚未正式登記入共享目錄的部門內(nèi)部材料、非標(biāo)準(zhǔn)化記錄及大量隱性知識(shí),如工作備忘、會(huì)議紀(jì)要、機(jī)關(guān)講稿、初步意見稿等。這些數(shù)據(jù)未必具備明確的法規(guī)共享依據(jù),卻在政務(wù)知識(shí)建構(gòu)與場(chǎng)景適配中具有高密度的信息價(jià)值。若依賴傳統(tǒng)的法規(guī)授權(quán)模式,大模型將長(zhǎng)期面臨“有用但不可得\"的數(shù)據(jù)供需錯(cuò)配。政務(wù)數(shù)據(jù)共享的依據(jù)需要從依據(jù)法規(guī)即可共享的剛性模式,逐步向尊重意愿、兼顧治理效能的柔性機(jī)制轉(zhuǎn)變。在實(shí)際操作中,有些地方政府探索了基于授權(quán)的白名單共享機(jī)制,推動(dòng)有條件的數(shù)據(jù)在安全可控的范圍內(nèi)提供給大模型訓(xùn)練,以及成為大模型任務(wù)系統(tǒng)調(diào)度生成的養(yǎng)料。另外,隨著越來越多公務(wù)員、政策研究機(jī)構(gòu)參與到大型模型建設(shè)的過程中,部分單位內(nèi)逐漸形成“主動(dòng)貢獻(xiàn)數(shù)據(jù)\"即“貢獻(xiàn)治理能力\"的認(rèn)知轉(zhuǎn)變。一些地方建立數(shù)據(jù)共享激勵(lì)機(jī)制,將部門或個(gè)人在大模型建設(shè)中的數(shù)據(jù)貢獻(xiàn)納人績(jī)效評(píng)估或數(shù)據(jù)資產(chǎn)評(píng)估指標(biāo)[36],從制度上引導(dǎo)\"共享意愿\"向“共享責(zé)任\"轉(zhuǎn)化。
(三)共享方式擴(kuò)展:從被動(dòng)響應(yīng)到主動(dòng)共享
政務(wù)數(shù)據(jù)共享機(jī)制大多采取“需求推動(dòng),被動(dòng)回應(yīng)\"的運(yùn)作形式。數(shù)據(jù)調(diào)用周期長(zhǎng)、鏈路復(fù)雜,難以滿足跨部門場(chǎng)景下多源數(shù)據(jù)快速集成的實(shí)際需求。在政務(wù)大模型形成過程中牽涉智能任務(wù)調(diào)度、知識(shí)融合建模等復(fù)雜情形,如果按照傳統(tǒng)的逐項(xiàng)申請(qǐng)并予以核準(zhǔn)的方式行事,會(huì)極大地限制其技術(shù)效能的充分發(fā)揮。大模型背景下政務(wù)數(shù)據(jù)共享方式需要從按需分發(fā)向常態(tài)推送、自動(dòng)更新轉(zhuǎn)變?!吨腥A人民共和國政府信息公開條例》明確要求“應(yīng)主動(dòng)公開的政府信息\"須在法定時(shí)限內(nèi)發(fā)布,尤其是涉及公共政策、辦事指南、財(cái)政收支、應(yīng)急預(yù)警等信息[37]。若以此為起點(diǎn),結(jié)合政務(wù)大模型對(duì)知識(shí)語料持續(xù)更新的需求,可推動(dòng)將“主動(dòng)公開\"邏輯拓展至“主動(dòng)共享\"范疇,不僅共享于政務(wù)數(shù)據(jù)需求部門,也可開放給具備授權(quán)權(quán)限的智能系統(tǒng)或跨部門任務(wù)協(xié)同平臺(tái)使用。與此相配合的還有數(shù)據(jù)按類自動(dòng)歸集、接口按需實(shí)時(shí)調(diào)用、共享日志智能監(jiān)管等輔助機(jī)制,從根本上打破數(shù)據(jù)流動(dòng)的人工門檻。從被動(dòng)響應(yīng)到主動(dòng)推送既是共享方式的突破,也是推動(dòng)數(shù)據(jù)共享從行政協(xié)調(diào)走向系統(tǒng)協(xié)作。
(四)共享平臺(tái)升級(jí):從數(shù)據(jù)倉庫到數(shù)據(jù)智能
政務(wù)數(shù)據(jù)共享機(jī)制依托的核心平臺(tái)主要擔(dān)負(fù)著數(shù)據(jù)整合、目錄構(gòu)建、權(quán)限管理和分發(fā)服務(wù)的基本功能,平臺(tái)的技術(shù)架構(gòu)大多采用的是數(shù)據(jù)倉庫經(jīng)典范例。這一平臺(tái)邏輯與政務(wù)數(shù)據(jù)共享的制度目標(biāo)相匹配時(shí),表現(xiàn)為保障數(shù)據(jù)安全、推動(dòng)部門間的基礎(chǔ)性數(shù)據(jù)貫通。隨著大語言模型在政務(wù)場(chǎng)景中的嵌入式運(yùn)行需求日益增強(qiáng),現(xiàn)有數(shù)據(jù)共享平臺(tái)作為數(shù)據(jù)倉庫的技術(shù)形態(tài)遭遇適配性瓶頸。政務(wù)大模型需要共享平臺(tái)從數(shù)據(jù)倉庫轉(zhuǎn)向數(shù)據(jù)智能,平臺(tái)不再是被動(dòng)的管道,而是轉(zhuǎn)變?yōu)榫邆溆?jì)算能力、語義處理能力和協(xié)同調(diào)度能力的數(shù)據(jù)智能平臺(tái)。數(shù)據(jù)智能平臺(tái)既應(yīng)具備數(shù)據(jù)整合、共享等基礎(chǔ)性功能,又要實(shí)現(xiàn)數(shù)據(jù)向智能的躍遷[38]
(五)共享安全再定義:從訪問控制到語義一致
政務(wù)數(shù)據(jù)共享安全保障體系的主要架構(gòu)包括權(quán)限控制、數(shù)據(jù)分類及職能界定。這三個(gè)要素在現(xiàn)有制度中普遍遵循“誰提供誰負(fù)責(zé)、誰使用誰負(fù)責(zé)\"的原則,強(qiáng)調(diào)數(shù)據(jù)安全審查、個(gè)人信息保護(hù)與網(wǎng)絡(luò)安全合規(guī)性。隨著大語言模型在政務(wù)領(lǐng)域的深度應(yīng)用,政務(wù)數(shù)據(jù)共享平臺(tái)不再只是被動(dòng)接收數(shù)據(jù)的工具,它通過訓(xùn)練、推理和生成參與到數(shù)據(jù)的理解、重構(gòu)與再表達(dá)中。這一過程所涉及的風(fēng)險(xiǎn)類型不再局限于外部非法訪問或權(quán)限濫用,而是轉(zhuǎn)向更復(fù)雜的模型偏誤、數(shù)據(jù)幻覺、語義扭曲與輸出不一致性等問題[39]。原有以數(shù)據(jù)能否訪問為核心的問題,逐漸讓位于模型使用的數(shù)據(jù)內(nèi)容是否真實(shí)、一致、可溯的更深層次治理命題。這要求安全治理技術(shù)向更高層次演進(jìn),包括數(shù)據(jù)可信機(jī)制、模型合規(guī)責(zé)任、倫理評(píng)估工具等。
(六)權(quán)責(zé)關(guān)系調(diào)整:從歸口管理到協(xié)同共治
政務(wù)數(shù)據(jù)共享機(jī)制大多圍繞數(shù)據(jù)共享各個(gè)利益相關(guān)者的權(quán)力與責(zé)任[40],數(shù)據(jù)供給部門承擔(dān)數(shù)據(jù)安全責(zé)任,數(shù)據(jù)需求部門則履行合規(guī)使用、風(fēng)險(xiǎn)防范的職責(zé)。隨著大模型嵌入政務(wù)數(shù)據(jù)共享流程,傳統(tǒng)的歸口管理與分級(jí)負(fù)責(zé)方式的弊端凸顯。一方面,大模型數(shù)據(jù)的使用往往牽涉多部門數(shù)據(jù)的調(diào)配,調(diào)配路徑動(dòng)態(tài)且復(fù)雜,很難準(zhǔn)確追蹤到數(shù)據(jù)的來源、由誰觸發(fā)、誰該擔(dān)責(zé);另一方面,大模型在調(diào)用數(shù)據(jù)時(shí)結(jié)合自動(dòng)化推理、算法改良、用戶反饋等多種因素,參與方涉及算法開發(fā)方、系統(tǒng)運(yùn)維方、業(yè)務(wù)使用方乃至終端民眾,權(quán)責(zé)關(guān)系呈現(xiàn)高度交叉且非線性擴(kuò)展的趨勢(shì)。傳統(tǒng)“單一部門監(jiān)管 + 個(gè)體行為擔(dān)責(zé)\"模式,顯然難以滿足復(fù)雜協(xié)同條件下的數(shù)據(jù)共享責(zé)任治理需求。另外,政務(wù)數(shù)據(jù)資源被認(rèn)為是一種部門資產(chǎn)和資源,但大模型背景下政務(wù)數(shù)據(jù)已超越傳統(tǒng)部門資產(chǎn)范圍,成為治理生態(tài)系統(tǒng)中的流動(dòng)要素,需要嵌入跨部門流程與平臺(tái)邏輯中加以協(xié)調(diào)使用[41]。相應(yīng)地,權(quán)責(zé)關(guān)系也應(yīng)從“提供者—使用者\(yùn)"的單向鏈條,逐漸變?yōu)橐浴皵?shù)據(jù)全生命周期治理\"為中心的共治模式[42]。這個(gè)模式包括權(quán)責(zé)共擔(dān)、風(fēng)險(xiǎn)共識(shí)、反饋共建等機(jī)制的引入,使數(shù)據(jù)在流轉(zhuǎn)過程中每一個(gè)環(huán)節(jié)都能明確權(quán)屬、記錄責(zé)任、共享監(jiān)管信息。
五、制度完善:構(gòu)建面向大語言模型的政務(wù)數(shù)據(jù)共享新規(guī)則
現(xiàn)有政務(wù)數(shù)據(jù)共享制度體系能夠適應(yīng)“一網(wǎng)統(tǒng)管\"“一網(wǎng)通辦\"等需求,但釋放政務(wù)大模型的潛力需要推動(dòng)政務(wù)數(shù)據(jù)從可共享邁向可應(yīng)用的轉(zhuǎn)變,在制度層面作出系統(tǒng)性回應(yīng)與前瞻性設(shè)計(jì),從而為政務(wù)智能化轉(zhuǎn)型奠立堅(jiān)實(shí)基礎(chǔ)[8]。
(一)鼓勵(lì)有條件的地方先行先試
當(dāng)前的制度設(shè)計(jì)強(qiáng)調(diào)統(tǒng)一性和安全底線,難以適應(yīng)大模型對(duì)數(shù)據(jù)的多樣化需求,應(yīng)在制度允許范圍內(nèi)鼓勵(lì)有條件的地方探索先行先試。一是地方以現(xiàn)有的高集成平臺(tái)為基礎(chǔ),推動(dòng)政務(wù)數(shù)據(jù)倉庫、共享接口與大語言模型能力深度融合,探索數(shù)據(jù)集成賦能智能治理的一體化政務(wù)平臺(tái)體系,如浙江省依托“浙里辦\"等平臺(tái)再搭配DeepSeek大模型,初步形成涵蓋多部門協(xié)同、跨層級(jí)響應(yīng)、智能決策的數(shù)據(jù)共享技術(shù)體系,可作為平臺(tái)型先行的試點(diǎn)樣本。二是根據(jù)地方差異化數(shù)據(jù)稟賦特點(diǎn),聚焦特定數(shù)據(jù)類型,打造貼合本地需求的優(yōu)勢(shì)數(shù)據(jù)共享樣板,如在交通發(fā)達(dá)的地方著重推動(dòng)融合視頻監(jiān)控和物聯(lián)網(wǎng)技術(shù)等多模態(tài)數(shù)據(jù)的模型接人機(jī)制;在產(chǎn)業(yè)多元化的城市則把重點(diǎn)放在解決市場(chǎng)監(jiān)管、企業(yè)服務(wù)等領(lǐng)域的數(shù)據(jù)壁壘,建立服務(wù)型數(shù)據(jù)模型系統(tǒng)。三是圍繞具體場(chǎng)景融合開展智能共享與政策精準(zhǔn)匹配試驗(yàn),聚焦“政策找人\"“精準(zhǔn)救助\"等民眾感知度高的服務(wù)場(chǎng)景,通過共享身份、收人、住房、健康等跨部門基礎(chǔ)數(shù)據(jù),支撐大模型對(duì)服務(wù)對(duì)象的精準(zhǔn)識(shí)別與政策推薦[43],如有條件的地區(qū)可探索智能化的社會(huì)保障匹配機(jī)制,在共享規(guī)則與數(shù)據(jù)安全可控前提下實(shí)現(xiàn)公共政策的個(gè)性化觸達(dá)。通過賦權(quán)地方,支持地方結(jié)合自身治理基礎(chǔ)、數(shù)據(jù)能力和社會(huì)需求展開機(jī)制創(chuàng)新,既能探尋契合多種場(chǎng)景的應(yīng)用方案,又能憑借局部改良檢驗(yàn)普適性規(guī)律,從而為政務(wù)數(shù)據(jù)共享制度在大模型語境下的系統(tǒng)轉(zhuǎn)型積累堅(jiān)實(shí)的實(shí)踐基礎(chǔ)。
(二)探索數(shù)據(jù)分類分級(jí)新思路
現(xiàn)有政務(wù)數(shù)據(jù)分類分級(jí)制度多按照“部門一業(yè)務(wù)\"邏輯,側(cè)重于數(shù)據(jù)的涉密等級(jí)、來源路徑和職能歸屬。這一模式能夠滿足以結(jié)構(gòu)化數(shù)據(jù)為主的共享需求,但在大模型深度嵌入政府治理后其局限性凸顯,有必要構(gòu)建以用途屬性為導(dǎo)向、兼顧模型特征與場(chǎng)景敏感性的多維度數(shù)據(jù)分類分級(jí)體系。在數(shù)據(jù)分類上,將“部門—業(yè)務(wù)\"邏輯轉(zhuǎn)變?yōu)椤坝猛練w屬”邏輯??紤]將數(shù)據(jù)劃分為四類:一是基礎(chǔ)支撐類,如人口、地理、法人等基礎(chǔ)信息,為模型提供統(tǒng)一識(shí)別背景;二是語義表達(dá)類,包括政策文本、有關(guān)政務(wù)靜態(tài)影像、會(huì)議錄頻等能夠支撐內(nèi)容生成與政策理解的數(shù)據(jù);三是行為軌跡類,涵蓋用戶訪問日志、服務(wù)路徑、交互記錄,支撐模型對(duì)使用意圖和流程規(guī)律的學(xué)習(xí);四是智能訓(xùn)練類,如人工標(biāo)注數(shù)據(jù)、用戶反饋樣本等,為模型微調(diào)與精度優(yōu)化提供語料基礎(chǔ)。各類數(shù)據(jù)應(yīng)同時(shí)疊加模態(tài)(文本、圖像、視頻等)、結(jié)構(gòu)化程度、使用頻次、來源方式等標(biāo)簽,以實(shí)現(xiàn)細(xì)粒度管理,如某城市的交通執(zhí)法視頻可以打上視頻(模態(tài))、非結(jié)構(gòu)化(結(jié)構(gòu)化程度)、中等(使用頻次)、現(xiàn)場(chǎng)采集(來源方式)等標(biāo)簽。在數(shù)據(jù)分級(jí)上可以采用四個(gè)等級(jí):第一級(jí)完全共享,數(shù)據(jù)可廣泛用于模型調(diào)用與訓(xùn)練,具備高公共性和低風(fēng)險(xiǎn)性;第二級(jí)有條件共享,數(shù)據(jù)需在限定場(chǎng)景下調(diào)用并記錄日志;第三級(jí)限域使用,數(shù)據(jù)需經(jīng)過審批流程,限定任務(wù)角色與使用頻率;第四級(jí)嚴(yán)禁外用,數(shù)據(jù)為敏感信息或涉密資料,不得直接暴露于模型接口。通過構(gòu)建多維、動(dòng)態(tài)、嵌套的數(shù)據(jù)分級(jí)體系,既可以提高共享精度,控制安全風(fēng)險(xiǎn),也有助于實(shí)現(xiàn)差異共享、精細(xì)管理的治理目標(biāo),為大模型在政務(wù)系統(tǒng)中的可持續(xù)運(yùn)行提供穩(wěn)固的數(shù)據(jù)基礎(chǔ)。
(三)完善政務(wù)數(shù)據(jù)目錄的編制
現(xiàn)有目錄體系的搭建工作大多側(cè)重于結(jié)構(gòu)化字段的規(guī)范化登記,對(duì)文檔類、非結(jié)構(gòu)化、多模態(tài)數(shù)據(jù)覆蓋不足,導(dǎo)致大量語義信息密集型數(shù)據(jù)資源游離于目錄之外,缺乏可供大模型識(shí)別的入口。目錄更新的流程仍舊依靠人工申請(qǐng)和審批機(jī)制,存在效率低,反應(yīng)慢等問題,不能滿足大模型對(duì)數(shù)據(jù)即時(shí)性和地理精細(xì)性的高標(biāo)準(zhǔn)需求。為提升目錄體系對(duì)大模型場(chǎng)景的適配性,有必要推動(dòng)目錄編制從被動(dòng)登記、靜態(tài)歸檔向主動(dòng)發(fā)現(xiàn)、語義驅(qū)動(dòng)轉(zhuǎn)變。積極探索“模型導(dǎo)向型目錄機(jī)制”,提升目錄對(duì)大模型任務(wù)的適配能力。一是擴(kuò)大目錄收錄范圍,尤其將公文材料、政策文檔、語音轉(zhuǎn)錄、圖像資料等具備高語義密度的文檔類和多模態(tài)數(shù)據(jù)納入目錄體系;二是推動(dòng)語義標(biāo)簽體系建設(shè),基于數(shù)據(jù)類型、用途場(chǎng)景、敏感級(jí)別等維度,建立支持模型調(diào)用的多維標(biāo)簽結(jié)構(gòu),使目錄不僅可檢索,更可理解;三是引入任務(wù)驅(qū)動(dòng)式目錄編制機(jī)制,支持模型在執(zhí)行特定任務(wù)時(shí)按需反向登記、自動(dòng)補(bǔ)錄。
(四)提升共享平臺(tái)的支撐能力
大模型的技術(shù)特性對(duì)數(shù)據(jù)共享平臺(tái)提出更高要求,大規(guī)模的參數(shù)驅(qū)動(dòng)和上下文建構(gòu)依賴平臺(tái)對(duì)異構(gòu)數(shù)據(jù)的快速匯聚與深度融合,要求平臺(tái)具備強(qiáng)大的數(shù)據(jù)解析與語義對(duì)齊能力;同時(shí),模型的動(dòng)態(tài)推理能力依賴任務(wù)型、場(chǎng)景化的數(shù)據(jù)輸入路徑,要求平臺(tái)不僅能找得到數(shù)據(jù),更要識(shí)別任務(wù)所需的數(shù)據(jù),具備一定的推送、推薦與智能適配能力。在安全合規(guī)方面,大模型的數(shù)據(jù)調(diào)用過程需實(shí)現(xiàn)全過程留痕、風(fēng)險(xiǎn)識(shí)別與策略干預(yù)。提升共享平臺(tái)支撐能力的關(guān)鍵,在于推動(dòng)共享平臺(tái)從數(shù)據(jù)交換平臺(tái)向智能數(shù)據(jù)中臺(tái)轉(zhuǎn)型。一是加強(qiáng)平臺(tái)的語義解析功能,做到對(duì)多種類型數(shù)據(jù)的自動(dòng)識(shí)別、格式轉(zhuǎn)變及語義標(biāo)注,促使結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)得以有效整合;二是增強(qiáng)平臺(tái)的場(chǎng)景響應(yīng)能力,面向政務(wù)大模型的典型任務(wù),如智能問答、決策輔助、流程生成等,配置任務(wù)標(biāo)簽與數(shù)據(jù)推薦機(jī)制,實(shí)現(xiàn)數(shù)據(jù)調(diào)用的前置匹配與自動(dòng)派單;三是形成“技術(shù) + 制度\"雙重保障體系,把數(shù)據(jù)脫敏、接口限流、用途監(jiān)測(cè)等各類功能模塊整合起來;四是建立跨平臺(tái)的數(shù)據(jù)資源接口標(biāo)準(zhǔn)與任務(wù)適配協(xié)議,提升不同級(jí)別、不同領(lǐng)域政務(wù)平臺(tái)之間的互聯(lián)互通與數(shù)據(jù)協(xié)同能力,構(gòu)建政務(wù)大模型運(yùn)行所需的彈性、智能、可信的底層數(shù)據(jù)服
務(wù)環(huán)境。
(五)加強(qiáng)數(shù)據(jù)質(zhì)量和安全管控
在數(shù)據(jù)質(zhì)量方面,大模型不僅需要海量的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,而且對(duì)數(shù)據(jù)質(zhì)量的需求隨著模型的更新迭代越來越高。有必要構(gòu)建面向模型使用場(chǎng)景的數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)體系,將語義準(zhǔn)確性、內(nèi)容時(shí)效性、跨模態(tài)一致性等指標(biāo)納入評(píng)價(jià)體系,建立涵蓋數(shù)據(jù)生產(chǎn)、流轉(zhuǎn)、共享與使用各環(huán)節(jié)的全過程質(zhì)量評(píng)估機(jī)制。推動(dòng)數(shù)據(jù)責(zé)任標(biāo)記制度,明確數(shù)據(jù)源頭、加工路徑與修改痕跡,為模型追責(zé)與結(jié)果可解釋性提供基礎(chǔ)支撐。在安全管控方面,大模型的數(shù)據(jù)使用具有過程不透明、用途不可預(yù)設(shè)、生成難以追溯等特性,現(xiàn)有以權(quán)限邊界為核心的數(shù)據(jù)安全體系在模型場(chǎng)景下顯得力不從心。一方面,從事前管控向全過程動(dòng)態(tài)監(jiān)管延伸,構(gòu)建數(shù)據(jù)使用日志、調(diào)用監(jiān)測(cè)、模型行為反饋等機(jī)制,確保數(shù)據(jù)在調(diào)用、加工、輸出全過程處于可記錄、可審計(jì)狀態(tài);另一方面,將差分隱私、聯(lián)邦學(xué)習(xí)、模型脫敏訓(xùn)練等前沿技術(shù)納入政務(wù)數(shù)據(jù)共享的技術(shù)規(guī)范中,探索以技術(shù)嵌入實(shí)現(xiàn)安全共享與價(jià)值釋放的平衡。
(六)優(yōu)化數(shù)據(jù)共享的管理體制
大模型技術(shù)帶來的意愿驅(qū)動(dòng)共享邏輯,要求管理體制具備更強(qiáng)的橫向協(xié)同能力。一是推動(dòng)數(shù)據(jù)共享管理由部門中心化向以任務(wù)和應(yīng)用場(chǎng)景為中心轉(zhuǎn)變,設(shè)立跨部門的數(shù)據(jù)協(xié)調(diào)機(jī)制或指定專門的任務(wù)場(chǎng)景負(fù)責(zé)人,對(duì)特定智能任務(wù)的數(shù)據(jù)需求進(jìn)行統(tǒng)籌調(diào)度,提升組織彈性與管理響應(yīng)速度。二是大模型技術(shù)的持續(xù)迭代特性要求數(shù)據(jù)共享管理機(jī)制具備更強(qiáng)的適應(yīng)性與閉環(huán)能力,創(chuàng)建包含“數(shù)據(jù)采集與使用、性能評(píng)價(jià)、責(zé)任追溯、規(guī)范更新\"四個(gè)關(guān)鍵環(huán)節(jié)的動(dòng)態(tài)管理鏈條,做到從數(shù)據(jù)接人到模型輸出的全流程細(xì)致把控。三是在制度設(shè)計(jì)上推動(dòng)構(gòu)建統(tǒng)一領(lǐng)導(dǎo)、分層協(xié)同、平臺(tái)支撐、動(dòng)態(tài)調(diào)整的數(shù)據(jù)共享治理結(jié)構(gòu)。強(qiáng)化數(shù)據(jù)管理部門的統(tǒng)籌作用,形成融合技術(shù)控制,業(yè)務(wù)規(guī)劃和安全監(jiān)督的綜合體系;明確大模型在數(shù)據(jù)應(yīng)用方面的法律界限和責(zé)任歸屬,細(xì)化模型輸出環(huán)節(jié)各個(gè)主體的權(quán)利義務(wù)劃分規(guī)則,避免因技術(shù)復(fù)雜性掩蓋責(zé)任不清的治理風(fēng)險(xiǎn)。優(yōu)化政務(wù)數(shù)據(jù)共享的管理體制,不是對(duì)原有架構(gòu)的完全否定,而是對(duì)現(xiàn)有制度進(jìn)行完善,實(shí)現(xiàn)從部門分治到系統(tǒng)協(xié)同的深層轉(zhuǎn)型。在大模型推動(dòng)下,數(shù)據(jù)不僅是管理對(duì)象,更是治理的資源。只有構(gòu)建具備彈性邊界、動(dòng)態(tài)規(guī)則和多元協(xié)同能力的管理體制,才能為大語言模型下的政務(wù)數(shù)據(jù)共享提供堅(jiān)實(shí)的制度保障。
六、結(jié)語
以DeepSeek為代表的國產(chǎn)大語言模型技術(shù)突破,讓大語言模型能力釋放跨越了效率和安全障礙,有力促進(jìn)了生成式人工智能在政府治理中的應(yīng)用,深化了智能治理的形態(tài)躍遷。政務(wù)數(shù)據(jù)共享在大語言模型能力輸出背景下,不再是簡(jiǎn)單的部門對(duì)接邏輯,而是以數(shù)據(jù)和智能為中心驅(qū)動(dòng)治理知識(shí)創(chuàng)新、人機(jī)協(xié)同決策,并進(jìn)一步帶動(dòng)治理結(jié)構(gòu)調(diào)整和制度工具革新。原有的“交換目錄一部門責(zé)任一安全審查\"運(yùn)行邏輯面臨適配性問題,需要重新定義數(shù)據(jù)的價(jià)值邊界,不斷優(yōu)化治理方式,在大語言模型助力下持續(xù)釋放政務(wù)數(shù)據(jù)在各類治理場(chǎng)景中的價(jià)值。構(gòu)建和應(yīng)用政務(wù)大模型的關(guān)鍵在充分發(fā)揮大語言模型的自然語言理解與生成、多模態(tài)數(shù)據(jù)融合生成、時(shí)空數(shù)據(jù)分析與預(yù)測(cè)、知識(shí)圖譜構(gòu)建與推理、任務(wù)自動(dòng)化與流程再造、人機(jī)協(xié)同與智能化決策等能力。高質(zhì)量數(shù)據(jù)供給是政務(wù)大模型構(gòu)建和應(yīng)用的基礎(chǔ)保障,也是推動(dòng)數(shù)字政府建設(shè)水平躍升的重要支撐;缺乏高質(zhì)量數(shù)據(jù)供給,政務(wù)大模型的能力會(huì)大大削弱,甚至無法提供應(yīng)有的強(qiáng)大能力。從政務(wù)大模型的實(shí)際需要而言,需要在不同政府部門之間、不同層級(jí)政府之間、不同政務(wù)系統(tǒng)之間共享文檔類數(shù)據(jù)、多模態(tài)數(shù)據(jù)、優(yōu)質(zhì)時(shí)空數(shù)據(jù)、領(lǐng)域知識(shí)圖譜數(shù)據(jù)、流程協(xié)同數(shù)據(jù)和決策支持?jǐn)?shù)據(jù)。當(dāng)前的政務(wù)數(shù)據(jù)共享制度難以滿足這些數(shù)據(jù)共享需求,需要將有關(guān)數(shù)據(jù)有序添入政務(wù)數(shù)據(jù)共享的范圍,注重從意愿出發(fā)推動(dòng)各類數(shù)據(jù)的共享,推動(dòng)實(shí)現(xiàn)更多主動(dòng)式的政務(wù)數(shù)據(jù)共享,將政務(wù)數(shù)據(jù)共享平臺(tái)升級(jí)為具備計(jì)算分析、語義處理、協(xié)調(diào)調(diào)度等智能化功能的數(shù)據(jù)智能平臺(tái),在安全防控上要確保語義一致性??傊?wù)數(shù)據(jù)共享需要從“按需響應(yīng)”“按標(biāo)準(zhǔn)調(diào)取\"轉(zhuǎn)向“按語義建?!薄鞍匆鈭D聚合”,適應(yīng)大語言模型應(yīng)用對(duì)政務(wù)數(shù)據(jù)的動(dòng)態(tài)、多元需要。在政務(wù)數(shù)據(jù)共享已有行政法規(guī)背景下,制度完善應(yīng)從地方探索開始,在數(shù)據(jù)分類分級(jí)、數(shù)據(jù)目錄編制、共享平臺(tái)升級(jí)、數(shù)據(jù)質(zhì)量管控、數(shù)據(jù)管理體制優(yōu)化等方面尋找突破、積累經(jīng)驗(yàn)。由于大語言模型自身具有的不確定性、模態(tài)耦合性與算法黑箱性,對(duì)于政務(wù)數(shù)據(jù)共享制度完善而言,依然面臨諸多挑戰(zhàn)。如何建立“可協(xié)商一可解釋一可審計(jì)\"的政務(wù)數(shù)據(jù)共享新機(jī)制,如何促進(jìn)數(shù)源部門積極共享更多類型數(shù)據(jù),如何基于政務(wù)數(shù)據(jù)共享因地制宜地打造數(shù)據(jù)智能平臺(tái),應(yīng)是后續(xù)研究關(guān)注的重要議題。
參考文獻(xiàn):
[1]張夏恒.類ChatGPT人工智能技術(shù)嵌入數(shù)字政府治理:價(jià)值、風(fēng)險(xiǎn)及其防控[J].電子政務(wù),2023,(4).
[2]國務(wù)院關(guān)于加強(qiáng)數(shù)字政府建設(shè)的指導(dǎo)意見(國發(fā)[202214號(hào))[EB/OL].[2025-06-13].https://www.gov.cn/zhengce/zhengceku/2022-06/23/content_5697299.htm.
[3]張會(huì)平.數(shù)據(jù)要素協(xié)同治理:行動(dòng)目標(biāo)、主體作用和機(jī)制完善[J].行政論壇,2024,(5).
[4]石亞軍,程廣鑫.區(qū)塊鏈?zhǔn)?wù)服務(wù):以數(shù)據(jù)共享優(yōu)化政務(wù)服務(wù)的技術(shù)賦能[J].北京行政學(xué)院學(xué)報(bào),2020,(6).
[5]閆冬冬,李曉方.區(qū)塊鏈何以鏈得起“數(shù)據(jù)孤島”?——基于“技術(shù)一組織”視角的“目錄鏈\"政務(wù)數(shù)據(jù)共享實(shí)踐分析[J].電子政務(wù),2023,(12).
[6]鄭燁,吳昊,何晴科.政府?dāng)?shù)字化轉(zhuǎn)型何以提升城市治理質(zhì)量?——基于國內(nèi)五個(gè)超大城市的多案例考察[J].中共天津市委黨校學(xué)報(bào),2025,(1).
[7]張會(huì)平,顧勤.政府?dāng)?shù)據(jù)流動(dòng):方式、實(shí)踐困境與協(xié)同治理[J].治理研究,2022,(3).
[8]袁剛,溫圣軍,趙晶晶,等.政務(wù)數(shù)據(jù)資源整合共享:需求、困境與關(guān)鍵進(jìn)路[J].電子政務(wù),2020,(10).
[9]李重照,黃璜.中國地方政府?dāng)?shù)據(jù)共享的影響因素研究[J].中國行政管理,2019,(8).
[10]彭.論政務(wù)數(shù)據(jù)共享的推進(jìn)與邊界[J].交大法學(xué),2023,(6).
[11]沈承誠.發(fā)達(dá)縣域政府?dāng)?shù)字治理轉(zhuǎn)型的影響因素分析[J].學(xué)術(shù)界,2025,(1).
[12]董偉瑋,秦音.基于“技術(shù)—制度\"框架的超大城市政務(wù)數(shù)據(jù)共享體系建構(gòu)與優(yōu)化策略[J].現(xiàn)代情報(bào),2025,(6).
[13]鄭崢.政務(wù)數(shù)據(jù)共享的風(fēng)險(xiǎn)邏輯與法律治理[J].河南財(cái)經(jīng)政法大學(xué)學(xué)報(bào),2024,(4).
[14]政務(wù)數(shù)據(jù)共享?xiàng)l例[EB/OL].[2025-06-03].https://www.gov.cn/zhengce/zhengceku/202506/content_7026295.htm.
[15]關(guān)于印發(fā)《國家電子政務(wù)標(biāo)準(zhǔn)體系建設(shè)指南》的通知[EB/OL].[2025-06-13].htps://www.samr.gov.cn/zw/zfxxgk/fdzdgknr/bzjss/art/2023/art_ae4df91e0ld6434abcac6447833fb548.html.
[16]許峰.地方政府?dāng)?shù)字化轉(zhuǎn)型機(jī)理闡釋——基于政務(wù)改革“浙江經(jīng)驗(yàn)”的分析[J].電子政務(wù),2020,(10).
[17]楊博,曹雅楠.公共數(shù)據(jù)開放共享模式分析與安全體系設(shè)計(jì)[J].信息安全研究,2024,(9).
[18]周力虹,陳瓏綺,王迪.政府?dāng)?shù)據(jù)跨部門共享情境下的數(shù)據(jù)粘性影響因素研究[J].圖書與情報(bào),2022,(3).
[19]米加寧,張斌.從DeepSeek應(yīng)用場(chǎng)景看政務(wù)服務(wù)“生成式”轉(zhuǎn)型:任務(wù)、挑戰(zhàn)與路徑[J].北京行政學(xué)院學(xué)報(bào),2025,(3).
[20]吳培熠,申紅梅,梁正.政務(wù)大模型的敏捷治理研究——基于“數(shù)據(jù)一場(chǎng)景”的多案例分析[J/OL].電子政務(wù).[2025-06-13]. http://kns.cnki.net/kcms/detail/11.5181. TP.20250520.1345. 008. html.
[21]耿之雍,賈向桐.大語言模型產(chǎn)生意識(shí)何以可能?[J].科學(xué)技術(shù)哲學(xué)研究,2025,(1).
[22]何妮,姚聰莉.人工智能大模型賦能城市數(shù)字治理:內(nèi)在邏輯、現(xiàn)實(shí)挑戰(zhàn)與實(shí)踐路徑[J].東岳論叢,2025,(5).
[23]肖建力,邱雪,張揚(yáng),等.交通大模型綜述[J].交通運(yùn)輸工程學(xué)報(bào),2025,(1).
[24]車萬翔,竇志成,馮巖松,等.大模型時(shí)代的自然語言處理:挑戰(zhàn)、機(jī)遇與發(fā)展[J].中國科學(xué):信息科學(xué),2023,(9).
[25]黃勃,吳申奧,王文廣,等.圖模互補(bǔ):知識(shí)圖譜與大模型融合綜述[J].武漢大學(xué)學(xué)報(bào)(理學(xué)版),2024,(4).
[26]李哲,翟云,秦?zé)j.“高效辦成一件事”:數(shù)字時(shí)代整體性服務(wù)的模式變革[J].電子政務(wù),2024,(10).
[27]梁宇棟,張宸瑜.大模型時(shí)代公共性算法的應(yīng)用場(chǎng)景、層次嵌套及逐層規(guī)制——以數(shù)字政府建設(shè)為例[J].中共福建省委黨校(福建行政學(xué)院)學(xué)報(bào),2024,(2).
[28]中國信息通信研究院,中國科學(xué)院,大模型治理藍(lán)皮報(bào)告(2023年)——從規(guī)則走向?qū)嵺`[R/OL].[2025-06-13].
http://www.caict.ac.cn/kxyj/qwfb/ztbg/202311/P020231124526622371194.pdf.
[29]米加寧.生成式治理:大模型時(shí)代的治理新范式[J].中國社會(huì)科學(xué),2024,(10).
[30]孫雨生,曾俊皓,陳思好,等.知識(shí)圖譜增強(qiáng)的政策大模型知識(shí)問答系統(tǒng)構(gòu)建研究[J].圖書館學(xué)研究,2025,(5).
[31]張鶴譯,王鑫,韓立帆,等.大語言模型融合知識(shí)圖譜的問答系統(tǒng)研究[J].計(jì)算機(jī)科學(xué)與探索,2023,(10).
[32][英]洛倫佐·費(fèi)爾拉蒙蒂.大數(shù)據(jù)戰(zhàn)爭(zhēng):數(shù)據(jù)在全球市場(chǎng)的使用與濫用[M].北京:中華工商聯(lián)合出版社,2018.
[33]Jing Zhang,Sharon S.Dawes.Expectations and Perceptionsof Benefits,Barriers,and Success in Public SectorKnowledge Networks[J].Public Performance amp; Management Review,2oo6,(4).
[34]《上海市公共數(shù)據(jù)共享實(shí)施辦法(試行)》政策圖解[EB/OL].[2025-06-13].htps://www.shanghai.gov.cn/nwl2344/20230311/18d7ba4ffa69423489889bb7af9d78c5.html.
[35]廣東省政務(wù)數(shù)據(jù)資源共享管理辦法(試行)[EB/OL].[2025-06-13].htp://www.gd.gov.cn/zwgk/gongbao/2018/35/content/post_3366149.html.
[36]華子巖.政府?dāng)?shù)據(jù)共享視域下首席數(shù)據(jù)官制度的確立及其風(fēng)險(xiǎn)防范[J].中國科技論壇,2023,(9).
[37]中華人民共和國政府信息公開條例[EB/OL].[2025-06-13].https://www.gov.cn/zhengce/content/2019-04/15/content_5382991.htm.
[38]張迪,張力偉.數(shù)智信息生態(tài)系統(tǒng):內(nèi)涵、構(gòu)成與機(jī)制[J].現(xiàn)代情報(bào),2024,(4).
[39]黃鏟.人工智能大模型訓(xùn)練數(shù)據(jù)的風(fēng)險(xiǎn)類型與法律規(guī)制[J].政法論叢,2025,(1).
[40]王芳,儲(chǔ)君,張琪敏.跨部門政府?dāng)?shù)據(jù)共享:一個(gè)五力模型的構(gòu)建[J].信息資源管理學(xué)報(bào),2018,(1).
[41]林雪霏.條塊結(jié)構(gòu)中的地方政府“持續(xù)創(chuàng)新”行為——基于P區(qū)政務(wù)數(shù)據(jù)共享改革的案例分析[J].學(xué)海,2021,(3).
[42]馬亮.數(shù)字政府建設(shè)成效評(píng)價(jià):?jiǎn)栴}反思與前景展望[J].中共天津市委黨校學(xué)報(bào),2025,(2).
[43]黃劍鋒,張會(huì)平.數(shù)字化協(xié)同:場(chǎng)景融合何以化解公共服務(wù)數(shù)字化轉(zhuǎn)型的“技術(shù)懸浮”?——基于上海市“互聯(lián)網(wǎng)醫(yī)院十養(yǎng)老院”的案例分析[J].電子政務(wù),2025,(3).
責(zé)任編輯:王篆
The Logical Evolution and Institutional Improvement of Government Data Sharing in the Context of Large Language Models
Zhang Huiping,Gao Wenhao
Abstract: Under the background of embedding large language models in the government affairs field,government data sharing has become an important support for enhancing inteligent governance capabilities,which is related to the transformation of data resources into decision-making elements.The current system framework is based on hierarchical responsibility and overall coordination. Unified standards and directory management solidify the data foundation. Legal sharing and supply-demand matching regulate usage behavior. Safety supervision and technical platforms ensure the operation of sharing. Overall,it focuses on the on-demand response to structured data. The government affairs large model possesses capabilities such as natural language processing, multimodal generation,and knowledge graph reasoning,and puts forward diverse and high-quality demands for government data. Under the new demands, government data sharing is undergoing multi-dimensional changes such as content expansion, diversified bases,proactive methods,transformation of security paradigms,and coordination of rights and responsibilities mechanisms. The improvement of the government data sharing system should be advanced from aspects such as local improvement,classified and graded governance,optimization of data directories,enhancement of platform capabilities,equal emphasis on data quality and security,and coordination of management systems.
Key words: government data sharing, large language model,government affairs large model,public data governance