□ 課題組
數(shù)字化改革是指統(tǒng)籌運用數(shù)字化技術(shù)、數(shù)字化思維、數(shù)字化認(rèn)知,把數(shù)字化、一體化、現(xiàn)代化貫穿到黨的領(lǐng)導(dǎo)和經(jīng)濟(jì)、政治、文化、社會、生態(tài)文明建設(shè)全過程各方面,對省域治理的體制機制、組織架構(gòu)、方式流程、手段工具進(jìn)行全方位、系統(tǒng)性重塑的過程,從整體上推動省域經(jīng)濟(jì)社會發(fā)展和治理能力的質(zhì)量變革、效率變革、動力變革,在根本上實現(xiàn)省域整體智治、高效協(xié)同。
公共數(shù)據(jù)是指國家機關(guān)、法律法規(guī)規(guī)章授權(quán)的具有管理公共事務(wù)職能的組織以及燃?xì)狻⑺畡?wù)、電力、公共交通、民航、鐵路等公共服務(wù)運營單位在依法履行職責(zé)和提供公共服務(wù)過程中獲取、產(chǎn)生的數(shù)據(jù)資源。
公共數(shù)據(jù)統(tǒng)計化是指利用公共數(shù)據(jù)輔助或完全替代政府統(tǒng)計調(diào)查,關(guān)鍵是在統(tǒng)計報表制度設(shè)計階段將行政記錄等公共數(shù)據(jù)確定為統(tǒng)計調(diào)查內(nèi)容,并保持統(tǒng)計調(diào)查指標(biāo)口徑與行政記錄一致。
首先,公共數(shù)據(jù)融入現(xiàn)代統(tǒng)計數(shù)據(jù)生產(chǎn)體系已成為一個重要命題。黨的十八屆五中全會首次提出實施“國家大數(shù)據(jù)戰(zhàn)略”,同年《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》發(fā)布。“十三五”規(guī)劃建議提出“實施國家大數(shù)據(jù)戰(zhàn)略,推進(jìn)數(shù)據(jù)資源開放共享?!薄秶医y(tǒng)計局大數(shù)據(jù)應(yīng)用工作方案(2021年修訂)》提出在核算、工業(yè)、能源、投資等領(lǐng)域廣泛使用部門行政記錄、互聯(lián)網(wǎng)電子化數(shù)據(jù)等大數(shù)據(jù)作為常規(guī)統(tǒng)計調(diào)查數(shù)據(jù)的補充。這就提出了一個重要命題:如何將公共數(shù)據(jù)融入現(xiàn)代統(tǒng)計數(shù)據(jù)生產(chǎn)體系,實現(xiàn)與政府統(tǒng)計產(chǎn)品的高度契合。
其次,數(shù)字化改革為釋放公共數(shù)據(jù)的“統(tǒng)計價值”創(chuàng)造了條件。隨著浙江數(shù)字化改革的縱深推進(jìn),省市縣數(shù)以億計的公共數(shù)據(jù)向公共數(shù)據(jù)平臺匯聚,為直接或間接應(yīng)用于統(tǒng)計調(diào)查提供了可能。截至目前,已建立全省統(tǒng)一的公共數(shù)據(jù)資源目錄,累計編制目錄數(shù)據(jù)項178.3 萬項。省公共數(shù)據(jù)平臺累計歸集數(shù)據(jù)761.7億條,涉及醫(yī)療衛(wèi)生、社保就業(yè)等20 余個領(lǐng)域。統(tǒng)一建設(shè)人口綜合庫、法人綜合庫、電子證照庫、信用信息庫、自然資源和空間地理信息庫等五大基礎(chǔ)庫等。利用一體化智能化公共數(shù)據(jù)平臺大數(shù)據(jù)分析處理能力,以提供數(shù)據(jù)接口和批量共享方式,累計共享調(diào)用數(shù)據(jù)471.98 億次。同時,全省已開放1.88 萬個公共數(shù)據(jù)集、57.4 億條數(shù)據(jù)。
同時,公共數(shù)據(jù)統(tǒng)計化意義重大。主要表現(xiàn)為:有利于豐富數(shù)據(jù)獲取來源,甚至替代傳統(tǒng)統(tǒng)計調(diào)查方式,比如住戶調(diào)查中,可以直接調(diào)取樣本中低保戶的低保補助收入;有利于依托行政記錄驗證基層統(tǒng)計數(shù)據(jù),比如可以利用企業(yè)用電量等指標(biāo)評估制造業(yè)PMI(采購經(jīng)理指數(shù))與相關(guān)經(jīng)濟(jì)指標(biāo)的擬合度,有利于減輕統(tǒng)計調(diào)查負(fù)擔(dān),降低工作成本;如直接將行政記錄用于統(tǒng)計調(diào)查,有利于提高數(shù)據(jù)的時效性;比如直接利用各地公共數(shù)據(jù)平臺時時更新的房地產(chǎn)交易數(shù)據(jù)。
課題組對國家調(diào)查隊系統(tǒng)承擔(dān)的各個統(tǒng)計調(diào)查專業(yè)開展了問卷調(diào)查,經(jīng)匯總和梳理分析,目前在統(tǒng)計調(diào)查各環(huán)節(jié)對公共數(shù)據(jù)均有需求,獲取方式不一。
設(shè)定統(tǒng)計調(diào)查抽樣框需要相關(guān)公共數(shù)據(jù)作為支撐。比如:畜牧業(yè)調(diào)查需要使用“農(nóng)普”數(shù)據(jù)選定抽樣框;住戶調(diào)查和勞動力調(diào)查需要使用鄉(xiāng)、村行政區(qū)劃設(shè)置等數(shù)據(jù)選定抽樣框;企業(yè)調(diào)查樣本框更新和擴(kuò)樣需要使用名錄庫相關(guān)數(shù)據(jù)。此類支撐數(shù)據(jù)獲取方式一般由相關(guān)部門直接提供或向相關(guān)部門索取。
一些公共數(shù)據(jù)可直接成為政府統(tǒng)計產(chǎn)品。比如:房地產(chǎn)價格調(diào)查直接使用住宅銷售網(wǎng)簽備案數(shù)據(jù);政府定價或指導(dǎo)定價的規(guī)格品包括水、電、燃?xì)?、教育服?wù)等價格數(shù)據(jù)是消費價格調(diào)查數(shù)據(jù)來源。目前,此類數(shù)據(jù)的獲取方式一般有兩種,一是由相關(guān)部門直接提供,二是通過調(diào)查員直接采集。
評估校驗統(tǒng)計調(diào)查數(shù)據(jù)需要引進(jìn)相關(guān)公共數(shù)據(jù)作為“因子”。如糧食調(diào)查數(shù)據(jù)評估需要使用耕地面積增減、規(guī)模戶補貼發(fā)放等情況;現(xiàn)有住戶調(diào)查評估辦法引入GDP、“兩項薪酬”等作為評估指標(biāo);工業(yè)生產(chǎn)者價格調(diào)查使用重要生產(chǎn)資料市場價格變動情況等評估價格走勢。此類數(shù)據(jù)獲取方式一般有三種,一是由相關(guān)部門直接提供;二是通過公共數(shù)據(jù)平臺等查詢;三是利用生意社、卓創(chuàng)咨詢等網(wǎng)站收集的數(shù)據(jù),比如大宗商品價格走勢等。
統(tǒng)計分析時使用的公共數(shù)據(jù)種類較多,范圍較廣。比如住戶調(diào)查統(tǒng)計分析常使用農(nóng)村電子商務(wù)、培訓(xùn)崗位人數(shù)等數(shù)據(jù);勞動力調(diào)查常使用城鎮(zhèn)登記失業(yè)率、高校畢業(yè)生及就業(yè)情況等數(shù)據(jù)。此類數(shù)據(jù)既可通過公共數(shù)據(jù)平臺、網(wǎng)站等各種平臺查詢,也可從統(tǒng)計年鑒、部門內(nèi)部資料等獲取。
目前浙江省正全面打造并基本建成省市縣一體化智能化公共數(shù)據(jù)平臺。課題組以麗水市為例,選取部分調(diào)查專業(yè)的數(shù)據(jù)需求,在公共數(shù)據(jù)平臺發(fā)起數(shù)據(jù)需求申請,測試數(shù)據(jù)獲取路徑,場景化探索公共數(shù)據(jù)在統(tǒng)計調(diào)查中的應(yīng)用。
分別選取公積金中心《住房公積金個人繳存信息》、稅務(wù)局《個人所得稅自行納稅申報信息(A表)》、醫(yī)保局《職工醫(yī)保年度賬戶信息》《醫(yī)保待遇報銷信息》共四個數(shù)據(jù)目錄進(jìn)行需求整理,經(jīng)比對《住戶收支與生活狀況調(diào)查方案》(2021年)發(fā)現(xiàn)相關(guān)數(shù)據(jù)可進(jìn)一步利用。公積金個人繳存數(shù)據(jù)目錄中通過“個人繳存比例”和“個人繳存基數(shù)”測算出的“個人月繳存額”,可應(yīng)用于“轉(zhuǎn)移性支出-個人繳納的住房公積金”的數(shù)據(jù)比對;個稅數(shù)據(jù)目錄中應(yīng)納稅額、減免稅額、應(yīng)補(退)稅額等指標(biāo),可應(yīng)用于“轉(zhuǎn)移性支出-繳納所得稅”的數(shù)據(jù)比對;醫(yī)保數(shù)據(jù)目錄中的醫(yī)保支出費用可應(yīng)用于“轉(zhuǎn)移性收入-報銷醫(yī)療費”的數(shù)據(jù)比對,通過與醫(yī)保局工作人員對接,相關(guān)數(shù)據(jù)可按月統(tǒng)計。(表1)
表1 住戶調(diào)查所需的部門數(shù)據(jù)情況
經(jīng)與以上三個數(shù)源部門對接,均表示相關(guān)數(shù)據(jù)目錄有歸集數(shù)據(jù),但由于獲取的是個人賬戶信息,首先需要個人身份授權(quán),后續(xù)還需通過部門內(nèi)部審批流程才能確定是否能提供。常用的方式有兩種,一是提供住戶調(diào)查樣本的身份證件信息,由數(shù)源部門定期將相關(guān)數(shù)據(jù)項進(jìn)行推送;二是讓數(shù)源部門開放相應(yīng)數(shù)據(jù)查詢接口,通過調(diào)用數(shù)據(jù)進(jìn)行匹配查詢。
選取自然資源局、農(nóng)業(yè)農(nóng)村局、氣象局等三個數(shù)源單位進(jìn)行需求對接。
1.自然資源部門每年利用衛(wèi)星遙感、云計算等技術(shù),統(tǒng)籌利用現(xiàn)有資料,開展遙感監(jiān)測,組織實地調(diào)查舉證,更新縣級國土利用數(shù)據(jù)庫,形成年度國土變更調(diào)查成果(《土地利用現(xiàn)狀地類圖斑》),這一主題數(shù)據(jù)可以應(yīng)用到耕地等基礎(chǔ)數(shù)據(jù)核實中。根據(jù)保密要求,使用相關(guān)圖斑信息需要簽訂保密協(xié)議,并按照規(guī)定使用。
2.農(nóng)業(yè)農(nóng)村局的種子目錄如《種業(yè)直報-冬小麥種子生產(chǎn)供需情況調(diào)查信息》《春夏播種子企業(yè)備種情況統(tǒng)計信息》等數(shù)據(jù)可用于糧食產(chǎn)量監(jiān)測調(diào)查關(guān)于糧食生產(chǎn)總體趨勢變化評估等,且相關(guān)數(shù)據(jù)均可獲取并使用。(表2)
表2 糧食產(chǎn)量調(diào)查數(shù)據(jù)評估所需的農(nóng)業(yè)農(nóng)村部門數(shù)據(jù)情況
3.氣象局目前有《氣象災(zāi)害預(yù)警信號信息》主題接口,可應(yīng)用于糧食產(chǎn)量調(diào)查農(nóng)情趨勢評估,為糧食單產(chǎn)增減提供參考。該數(shù)據(jù)目錄無條件開放提供,通過數(shù)據(jù)接口的方式自動推送至需求部門相應(yīng)的業(yè)務(wù)系統(tǒng)。(表3)
表3 糧食產(chǎn)量調(diào)查數(shù)據(jù)評估所需的氣象部門數(shù)據(jù)情況
選取發(fā)展改革委、商務(wù)局相關(guān)數(shù)據(jù)目錄進(jìn)行需求對接。
1.《重點監(jiān)測企業(yè)運行預(yù)期指數(shù)信息》主要為季度數(shù)據(jù),該數(shù)據(jù)目錄通過對重點工業(yè)企業(yè)開展問卷調(diào)查,形成相關(guān)統(tǒng)計數(shù)據(jù)和分析報告。該部門數(shù)據(jù)內(nèi)容可用于采購經(jīng)理調(diào)查趨勢評估,相關(guān)數(shù)據(jù)可提供政府部門內(nèi)部研究使用,但不對外使用。
2.商務(wù)局《商務(wù)經(jīng)濟(jì)情況表》中關(guān)于進(jìn)出口總額指標(biāo)有助于采購經(jīng)理調(diào)查相關(guān)指數(shù)趨勢評估,該數(shù)據(jù)目錄為月度數(shù)據(jù),可直接獲取使用。
雖然《統(tǒng)計法》對獲取部門有關(guān)統(tǒng)計資料有明確規(guī)定,但是在實際操作中,仍存在不少困難。如《個人信息保護(hù)法》第二十三條明確:個人信息處理者向其他個人信息處理者提供其處理的個人信息的,應(yīng)當(dāng)向個人告知接收方的名稱或者姓名、聯(lián)系方式、處理目的、處理方式和個人信息的種類,并取得個人的單獨同意。當(dāng)前,數(shù)據(jù)的價值得到越來越廣泛的重視,人們對個人隱私的重視程度也日益增加,如何界定統(tǒng)計部門可獲取的數(shù)據(jù)范圍,是公共數(shù)據(jù)創(chuàng)新應(yīng)用的關(guān)鍵環(huán)節(jié)和難點所在。
一方面,各個統(tǒng)計部門自成“一派”數(shù)據(jù)采集處理結(jié)構(gòu)方式影響數(shù)據(jù)共享。調(diào)查隊系統(tǒng)除農(nóng)民工監(jiān)測與住戶調(diào)查共用調(diào)查村(社區(qū))網(wǎng)點外,其余專業(yè)均采用獨立的調(diào)查方式以及填報平臺,如同樣是入戶PDA 調(diào)查,月度勞動力、農(nóng)民工等采用不同軟件系統(tǒng)。統(tǒng)計局和調(diào)查隊之間聯(lián)網(wǎng)直報平臺重復(fù)建設(shè)、數(shù)據(jù)未共享的問題更為突出。另一方面,統(tǒng)計部門與其他部門間未形成高效便捷的數(shù)據(jù)共享應(yīng)用機制。如部門數(shù)據(jù)共享主要通過郵件、浙政釘?shù)确绞?,未實現(xiàn)在線集中安全存放。
各部門的統(tǒng)計分類標(biāo)準(zhǔn)、內(nèi)涵、體系不盡相同,導(dǎo)致相關(guān)數(shù)據(jù)要求和統(tǒng)計口徑不完全統(tǒng)一,造成數(shù)據(jù)互不銜接、公共數(shù)據(jù)無法有效利用。一是不同的取數(shù)方式、取數(shù)時間影響公共數(shù)據(jù)的利用率,如“重點監(jiān)測企業(yè)運行預(yù)期指數(shù)”為季度指標(biāo),而PMI 是月度指標(biāo);二是不同調(diào)查方法、報送體系導(dǎo)致相關(guān)公共數(shù)據(jù)難以高效利用,如“種業(yè)直報-相關(guān)種子信息”數(shù)據(jù)來源方式與統(tǒng)計調(diào)查部門的抽樣調(diào)查或取數(shù)方式不同;三是部門間數(shù)據(jù)上報時間不同,在數(shù)據(jù)利用時間上會有較大的滯后性。
《個人信息保護(hù)法》第十三條規(guī)定:“為履行法定職責(zé)或者法定義務(wù)所必需的,個人信息處理者可以處理個人信息?!薄督y(tǒng)計法》第二十二條規(guī)定:“縣級以上人民政府有關(guān)部門應(yīng)當(dāng)及時向本級人民政府統(tǒng)計機構(gòu)提供統(tǒng)計所需的行政記錄資料。”要從貫通這兩個法律相關(guān)條款出發(fā),以修訂《統(tǒng)計法》為契機,賦予統(tǒng)計部門收集行政記錄的資格、權(quán)利和義務(wù),明確相關(guān)部門向統(tǒng)計機構(gòu)提供個人信息等行政記錄的內(nèi)容和要求。
在統(tǒng)計標(biāo)準(zhǔn)方面,需各級各地各部門嚴(yán)格使用《統(tǒng)計分類標(biāo)準(zhǔn)和目錄匯編》,構(gòu)建跨部門、跨專業(yè)的“大標(biāo)準(zhǔn)”體系,將行政記錄等轉(zhuǎn)換為標(biāo)準(zhǔn)化數(shù)據(jù),解決數(shù)據(jù)互通性、銜接性問題。在統(tǒng)計制度方法方面,要立足推動行政記錄、文本、圖像、音頻等數(shù)據(jù)的統(tǒng)計應(yīng)用,修訂統(tǒng)計制度方法。比如,由政府定價或指導(dǎo)價的水電等價格,可修訂制度方法,直接利用數(shù)據(jù)平臺獲取數(shù)據(jù)。
一是探索開展匿蹤私密查詢。在使用個體身份信息從公共數(shù)據(jù)平臺等外部數(shù)據(jù)平臺獲取相關(guān)數(shù)據(jù)時,運用不經(jīng)意傳輸技術(shù)(Oblivious Transfer-OT)進(jìn)行匿蹤私密查詢,實現(xiàn)隱私保護(hù)前提下,滿足數(shù)據(jù)需求。二是強化公共數(shù)據(jù)的加密保護(hù)。如替換使用安全可靠的https 協(xié)議,使用商用密碼對數(shù)據(jù)進(jìn)行加密保護(hù),實現(xiàn)傳輸過程數(shù)據(jù)泄露風(fēng)險最小化。三是廣泛運用多方安全計算、聯(lián)邦學(xué)習(xí)等前沿信息技術(shù),打消數(shù)據(jù)鏈的不同環(huán)節(jié)對數(shù)據(jù)歸屬、數(shù)據(jù)安全和隱私保護(hù)的顧慮。
將國家及地方聯(lián)網(wǎng)直報平臺、省市縣各級公共數(shù)據(jù)平臺等各類數(shù)據(jù)平臺,通過應(yīng)用接口或多方安全計算等數(shù)據(jù)獲取或分析處理方式,整合各級、各部門統(tǒng)計數(shù)據(jù)資源,通過聯(lián)邦機器學(xué)習(xí)、人工智能等技術(shù)監(jiān)控數(shù)據(jù)質(zhì)量問題。實現(xiàn)以平臺為依托統(tǒng)一各類統(tǒng)計數(shù)據(jù)口徑,統(tǒng)一應(yīng)用接口標(biāo)準(zhǔn),一體化完成統(tǒng)計數(shù)據(jù)處理,并實現(xiàn)數(shù)據(jù)處理全鏈路跟蹤,使各個處理環(huán)節(jié)更加標(biāo)準(zhǔn)化、規(guī)范化、制度化,提高統(tǒng)計數(shù)據(jù)的一致性、可靠性、重用性。
公共數(shù)據(jù)是一座“富礦”,統(tǒng)計調(diào)查部門應(yīng)以推進(jìn)數(shù)字化改革為導(dǎo)向,以建設(shè)統(tǒng)計大數(shù)據(jù)應(yīng)用中心為契機,加快部署建設(shè)統(tǒng)計云。至2025年基本建成綜合統(tǒng)計數(shù)據(jù)應(yīng)用平臺并與公共數(shù)據(jù)平臺完成對接,逐步轉(zhuǎn)變單純依靠“我布置、你填報”的傳統(tǒng)數(shù)據(jù)采集方式,部分?jǐn)?shù)字化程度較高的統(tǒng)計調(diào)查專業(yè)優(yōu)先實現(xiàn)完全的公共數(shù)據(jù)統(tǒng)計化;至2035年建成“統(tǒng)計標(biāo)準(zhǔn)全面統(tǒng)一、綜合統(tǒng)計數(shù)據(jù)應(yīng)用平臺與公共數(shù)據(jù)平臺互聯(lián)互通、各部門各專業(yè)數(shù)據(jù)互相融合”的數(shù)字化、實時化、智能化數(shù)據(jù)采集共享系統(tǒng),各統(tǒng)計調(diào)查專業(yè)全面實現(xiàn)公共數(shù)據(jù)統(tǒng)計化,統(tǒng)計工作方式從依靠有目的的調(diào)查采集全面轉(zhuǎn)向?qū)?shù)據(jù)的分析挖掘。