馬郡澤
大數(shù)據(jù)技術(shù)為經(jīng)濟(jì)普查提供了新的手段,也帶來了數(shù)據(jù)量激增、數(shù)據(jù)安全隱患加劇、數(shù)據(jù)管理與分析難度增加等一系列新挑戰(zhàn)。為有效解決這些難題,需要通過與多個(gè)領(lǐng)域的數(shù)據(jù)關(guān)聯(lián)應(yīng)用,發(fā)掘數(shù)據(jù)更大的價(jià)值,服務(wù)于經(jīng)濟(jì)管理的多個(gè)決策層面。
隨著信息技術(shù)的快速發(fā)展,大數(shù)據(jù)技術(shù)的應(yīng)用為各行各業(yè)的數(shù)據(jù)發(fā)掘與分析提供了新的思路。然而大數(shù)據(jù)條件下經(jīng)濟(jì)普查也面臨一定的難點(diǎn)與挑戰(zhàn)。數(shù)據(jù)量與數(shù)據(jù)類型的多樣性使得數(shù)據(jù)的真實(shí)性和有效性難以保證,數(shù)據(jù)的隱私性與安全性也面臨威脅。此外,不同系統(tǒng)異構(gòu)數(shù)據(jù)之間關(guān)聯(lián)度的提高給數(shù)據(jù)分析的廣度與深度帶來挑戰(zhàn)。為此,需要從保證數(shù)據(jù)質(zhì)量、強(qiáng)化數(shù)據(jù)安全以及擴(kuò)大數(shù)據(jù)應(yīng)用等多個(gè)層面入手,綜合應(yīng)對(duì)大數(shù)據(jù)條件下經(jīng)濟(jì)普查中的難點(diǎn),發(fā)揮大數(shù)據(jù)技術(shù)對(duì)經(jīng)濟(jì)研究與決策支持的重要作用。
一、大數(shù)據(jù)背景下經(jīng)濟(jì)普查的難點(diǎn)
(一)數(shù)據(jù)質(zhì)量問題
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的質(zhì)量是影響數(shù)據(jù)分析的關(guān)鍵因素。然而,經(jīng)濟(jì)普查中的數(shù)據(jù)質(zhì)量面臨著嚴(yán)峻的挑戰(zhàn)。首先,由于數(shù)據(jù)來源廣泛,真實(shí)性難免受到影響。例如,一些數(shù)據(jù)可能來自不可靠的渠道,或者存在人為的篡改、偽造、誤報(bào)等現(xiàn)象。這些都會(huì)導(dǎo)致數(shù)據(jù)的真實(shí)性降低,影響數(shù)據(jù)的可信度和有效性。其次,異構(gòu)數(shù)據(jù)之間存在語義不匹配的問題。例如,不同的數(shù)據(jù)源可能采用不同的數(shù)據(jù)格式、編碼、標(biāo)準(zhǔn)、定義等,導(dǎo)致數(shù)據(jù)之間的一致性和互操作性差。
(二)數(shù)據(jù)安全問題
在大數(shù)據(jù)環(huán)境下,經(jīng)濟(jì)普查數(shù)據(jù)規(guī)模巨大,涉及個(gè)人、企業(yè)的隱私數(shù)據(jù)。這些敏感數(shù)據(jù)很容易受到外部的攻擊、盜取或篡改,數(shù)據(jù)安全問題凸顯。一旦出現(xiàn)數(shù)據(jù)泄密,后果嚴(yán)重。例如,個(gè)人的身份信息、收入情況、消費(fèi)行為等,如果被泄露,可能會(huì)導(dǎo)致個(gè)人的財(cái)產(chǎn)損失、信用受損、隱私侵犯等。企業(yè)的經(jīng)營(yíng)狀況、市場(chǎng)占有率、核心技術(shù)等,如果泄露,可能導(dǎo)致企業(yè)的競(jìng)爭(zhēng)力下降、商業(yè)機(jī)密泄露、知識(shí)產(chǎn)權(quán)被侵權(quán)等。
(三)數(shù)據(jù)處理問題
大數(shù)據(jù)時(shí)代數(shù)據(jù)類型復(fù)雜、變化快,給數(shù)據(jù)處理帶來困難。如何快速高效地對(duì)海量經(jīng)濟(jì)普查數(shù)據(jù)進(jìn)行收集、存儲(chǔ)、清理、轉(zhuǎn)換、加載、運(yùn)算分析,是數(shù)據(jù)處理面臨的難題。例如,數(shù)據(jù)收集過程中,需要考慮數(shù)據(jù)的來源、時(shí)效、完整、準(zhǔn)確等因素,并采用合適的數(shù)據(jù)采集方法和工具。數(shù)據(jù)存儲(chǔ)過程中,需要考慮數(shù)據(jù)的規(guī)模、結(jié)構(gòu)、分布、可訪問性等因素,并采用合適的數(shù)據(jù)存儲(chǔ)模式和技術(shù)。數(shù)據(jù)清理過程中,需要考慮數(shù)據(jù)的質(zhì)量、一致性、有效性等因素,并采用合適的數(shù)據(jù)清理方法和工具。這些數(shù)據(jù)處理的各個(gè)環(huán)節(jié)都需要大量的時(shí)間、資源、技術(shù)和人力,并且存在相互依賴和影響的關(guān)系,難度不小。
(四)數(shù)據(jù)應(yīng)用問題
如何擴(kuò)大經(jīng)濟(jì)普查大數(shù)據(jù)的應(yīng)用范圍,讓數(shù)據(jù)發(fā)揮更大的價(jià)值,也是目前面臨的難點(diǎn)。比如開發(fā)符合決策需求的應(yīng)用,實(shí)現(xiàn)與其他領(lǐng)域數(shù)據(jù)的有效融合等,仍有不少工作要做。例如,如何將經(jīng)濟(jì)普查數(shù)據(jù)與社會(huì)、政治、文化、環(huán)境等其他領(lǐng)域的數(shù)據(jù)進(jìn)行有效整合,形成更全面、更深入的數(shù)據(jù)分析,從而為各級(jí)政府和社會(huì)各界提供更有價(jià)值的數(shù)據(jù)支持和服務(wù)。如何將經(jīng)濟(jì)普查數(shù)據(jù)與互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、人工智能等其他技術(shù)進(jìn)行有效結(jié)合,形成更智能、更便捷的數(shù)據(jù)應(yīng)用和服務(wù),從而為個(gè)人、企業(yè)和社會(huì)提供更有用的數(shù)據(jù)產(chǎn)品和解決方案。這些都是經(jīng)濟(jì)普查大數(shù)據(jù)應(yīng)用的方向和目標(biāo),但也存在著技術(shù)、資源、管理、法律等方面的障礙和挑戰(zhàn)。
(五)信息共享問題
在大數(shù)據(jù)背景下,經(jīng)濟(jì)普查數(shù)據(jù)的信息共享是提高數(shù)據(jù)利用效率和價(jià)值的重要途徑。然而,目前經(jīng)濟(jì)普查數(shù)據(jù)的信息共享還存在著一些難點(diǎn)。首先,信息共享的法律法規(guī)不完善,缺乏統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范,導(dǎo)致信息共享的主體、范圍、方式、責(zé)任等不明確,存在法律風(fēng)險(xiǎn)。例如,數(shù)據(jù)的所有權(quán)、使用權(quán)、許可權(quán)等不清晰,導(dǎo)致數(shù)據(jù)的共享受到限制或阻礙。其次,信息共享的技術(shù)平臺(tái)不健全,缺乏統(tǒng)一的數(shù)據(jù)交換和共享機(jī)制,導(dǎo)致信息共享的效率和質(zhì)量低下,存在技術(shù)障礙和困難。例如,數(shù)據(jù)的格式、編碼、標(biāo)準(zhǔn)、定義等不統(tǒng)一,導(dǎo)致數(shù)據(jù)的轉(zhuǎn)換和匹配困難。最后,信息共享的管理制度不健全,缺乏有效的數(shù)據(jù)監(jiān)督和評(píng)估機(jī)制,導(dǎo)致信息共享的秩序和效果不理想,存在管理漏洞和問題。例如,沒有對(duì)數(shù)據(jù)的共享過程和結(jié)果進(jìn)行有效記錄和反饋,導(dǎo)致數(shù)據(jù)的共享缺乏透明度和可追溯性。
二、對(duì)策分析
(一)建立健全數(shù)據(jù)質(zhì)量管理體系
首先,建立全面的數(shù)據(jù)質(zhì)量監(jiān)測(cè)機(jī)制,加強(qiáng)對(duì)數(shù)據(jù)來源的管理,確保入庫數(shù)據(jù)的真實(shí)可靠。例如,可以通過數(shù)據(jù)源的認(rèn)證、數(shù)據(jù)的抽樣檢驗(yàn)、數(shù)據(jù)的交叉驗(yàn)證等方法,對(duì)數(shù)據(jù)的來源進(jìn)行篩選和評(píng)估,排除不可信的數(shù)據(jù)源,提高數(shù)據(jù)的真實(shí)性。同時(shí),要不斷完善數(shù)據(jù)標(biāo)準(zhǔn),強(qiáng)化數(shù)據(jù)之間的關(guān)聯(lián)與匹配,減少異構(gòu)系統(tǒng)數(shù)據(jù)之間的語義偏差。例如,可以通過制定統(tǒng)一的數(shù)據(jù)格式、編碼、標(biāo)準(zhǔn)、定義等,對(duì)數(shù)據(jù)進(jìn)行規(guī)范化和標(biāo)準(zhǔn)化管理,提高數(shù)據(jù)的一致性。還可以通過建立數(shù)據(jù)字典、數(shù)據(jù)目錄、數(shù)據(jù)地圖等,對(duì)數(shù)據(jù)進(jìn)行描述和注釋,提高數(shù)據(jù)的可理解性。
(二)加強(qiáng)數(shù)據(jù)安全保護(hù)措施
首先,建立嚴(yán)密的數(shù)據(jù)安全體系,運(yùn)用加密、脫敏、權(quán)限控制等技術(shù)手段,防范外部攻擊和內(nèi)部泄密,保護(hù)數(shù)據(jù)的完整性和隱私性。例如,可以通過對(duì)數(shù)據(jù)進(jìn)行加密處理,使數(shù)據(jù)在傳輸和存儲(chǔ)過程中不被竊取或破解,保護(hù)數(shù)據(jù)的完整性。還可以通過對(duì)數(shù)據(jù)進(jìn)行脫敏處理,使數(shù)據(jù)在使用和展示過程中不暴露敏感信息,保護(hù)數(shù)據(jù)的隱私性。此外,還要加強(qiáng)安全意識(shí)培訓(xùn),營(yíng)造所有員工共治的數(shù)據(jù)安全氛圍。例如,可以通過定期的安全教育、安全演練、安全考核等方式,增強(qiáng)員工的安全意識(shí)和技能,規(guī)范員工的數(shù)據(jù)使用行為,防止數(shù)據(jù)的濫用或泄露。
(三)利用大數(shù)據(jù)技術(shù)和工具
面對(duì)數(shù)據(jù)類型和數(shù)量的爆炸式增長(zhǎng),需要使用大數(shù)據(jù)處理平臺(tái),選擇高效的分布式存儲(chǔ)系統(tǒng),建立高性能的分析計(jì)算框架,使用流式處理、內(nèi)存計(jì)算等技術(shù)加速數(shù)據(jù)處理,使之能夠適應(yīng)數(shù)據(jù)量大、速度快、類型復(fù)雜的特點(diǎn)。例如,可以使用Hadoop、Spark等大數(shù)據(jù)處理平臺(tái),對(duì)海量經(jīng)濟(jì)普查數(shù)據(jù)進(jìn)行收集、存儲(chǔ)、清理、轉(zhuǎn)換、加載、運(yùn)算分析等操作,提高數(shù)據(jù)處理的效率和質(zhì)量。還可以使用Kafka、Storm、Flink等流式處理技術(shù),對(duì)實(shí)時(shí)經(jīng)濟(jì)普查數(shù)據(jù)進(jìn)行快速的處理和分析,提高數(shù)據(jù)處理的時(shí)效性和實(shí)時(shí)性。
(四)拓展數(shù)據(jù)的應(yīng)用領(lǐng)域
主動(dòng)拓寬經(jīng)濟(jì)普查大數(shù)據(jù)應(yīng)用的范圍,通過和其他領(lǐng)域數(shù)據(jù)的有效融合,服務(wù)于更廣泛的決策需求。比如,支持經(jīng)濟(jì)狀況評(píng)估與預(yù)測(cè)、構(gòu)建知識(shí)圖譜、進(jìn)行數(shù)據(jù)可視化展示等,讓數(shù)據(jù)應(yīng)用惠及更多領(lǐng)域,提升數(shù)據(jù)分析的價(jià)值。例如,可以通過將經(jīng)濟(jì)普查數(shù)據(jù)與社會(huì)、政治、文化、環(huán)境等其他領(lǐng)域的數(shù)據(jù)進(jìn)行有效整合,形成更全面、更深入的數(shù)據(jù)分析和挖掘,從而為各級(jí)政府和社會(huì)各界提供更有價(jià)值的數(shù)據(jù)支持和服務(wù)。還可以通過將經(jīng)濟(jì)普查數(shù)據(jù)與互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、人工智能等其他技術(shù)進(jìn)行有效結(jié)合,形成更智能、更便捷的數(shù)據(jù)應(yīng)用和服務(wù),從而為個(gè)人、企業(yè)和社會(huì)提供更有用的數(shù)據(jù)產(chǎn)品和解決方案。
(五)推進(jìn)數(shù)據(jù)開放和共享
從法律、技術(shù)、管理等方面推進(jìn)數(shù)據(jù)的開放和共享。首先,完善數(shù)據(jù)的法律法規(guī),明確數(shù)據(jù)的權(quán)屬和責(zé)任,制定數(shù)據(jù)的共享標(biāo)準(zhǔn)和規(guī)范,保障數(shù)據(jù)的合法合規(guī)共享。例如,可以通過制定數(shù)據(jù)的分類和分級(jí)制度,確定數(shù)據(jù)的共享主體、范圍、方式、條件等,規(guī)范數(shù)據(jù)的共享行為。還可以通過建立數(shù)據(jù)的保護(hù)和懲罰制度,保護(hù)數(shù)據(jù)的安全和隱私,防止數(shù)據(jù)的濫用和泄露。其次,建立數(shù)據(jù)庫技術(shù)平臺(tái),實(shí)現(xiàn)數(shù)據(jù)的統(tǒng)一交換和共享,提高數(shù)據(jù)的共享效率和質(zhì)量。例如,可以通過建立數(shù)據(jù)的共享中心,提供數(shù)據(jù)的發(fā)布、查詢、申請(qǐng)、下載等服務(wù),方便數(shù)據(jù)的共享使用。還可以通過建立數(shù)據(jù)的共享協(xié)議,實(shí)現(xiàn)數(shù)據(jù)的格式、編碼、標(biāo)準(zhǔn)、定義等的統(tǒng)一。最后,健全數(shù)據(jù)的管理制度,加強(qiáng)數(shù)據(jù)的監(jiān)督和評(píng)估,優(yōu)化數(shù)據(jù)的共享秩序和效果。例如,可以通過建立數(shù)據(jù)的共享日志,記錄數(shù)據(jù)的共享過程和結(jié)果,提高數(shù)據(jù)的共享透明度和可追溯性。還可以通過建立數(shù)據(jù)的共享指標(biāo),評(píng)估數(shù)據(jù)的共享質(zhì)量和價(jià)值,提高數(shù)據(jù)的共享效益和水平。
三、大數(shù)據(jù)背景下經(jīng)濟(jì)普查的優(yōu)化措施
(一)多源異構(gòu)數(shù)據(jù)關(guān)聯(lián)分析,支持經(jīng)濟(jì)狀況評(píng)估與預(yù)測(cè)
在大數(shù)據(jù)環(huán)境下,可以收集更多類型的經(jīng)濟(jì)運(yùn)行數(shù)據(jù),并與普查數(shù)據(jù)實(shí)現(xiàn)有效關(guān)聯(lián),從更多維度解析經(jīng)濟(jì)狀況,進(jìn)而通過模型運(yùn)算,得出經(jīng)濟(jì)形勢(shì)評(píng)估分析以及未來趨勢(shì)預(yù)測(cè)。例如,可以收集社會(huì)、政治、文化、環(huán)境等其他領(lǐng)域的數(shù)據(jù),并與經(jīng)濟(jì)普查數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,從宏觀和微觀的角度,揭示經(jīng)濟(jì)狀況的影響因素、變化規(guī)律、發(fā)展方向等。還可以通過機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等模型,對(duì)經(jīng)濟(jì)普查數(shù)據(jù)進(jìn)行運(yùn)算分析,從歷史和現(xiàn)狀的角度,評(píng)估經(jīng)濟(jì)狀況的優(yōu)劣、問題、風(fēng)險(xiǎn)等。此外,還可以通過時(shí)間序列分析、趨勢(shì)預(yù)測(cè)等模型,對(duì)經(jīng)濟(jì)普查數(shù)據(jù)進(jìn)行運(yùn)算分析,從未來的角度,預(yù)測(cè)經(jīng)濟(jì)狀況的變化、趨勢(shì)、機(jī)遇等。
(二)建立經(jīng)濟(jì)普查知識(shí)圖譜,支持問答、決策等服務(wù)
基于知識(shí)圖譜,可以構(gòu)建智能問答、決策分析等服務(wù),輔助管理決策。例如,可以通過知識(shí)圖譜技術(shù),將經(jīng)濟(jì)普查數(shù)據(jù)中的經(jīng)濟(jì)活動(dòng)主體、經(jīng)濟(jì)狀況、經(jīng)濟(jì)指標(biāo)等,作為實(shí)體,將實(shí)體之間的從屬、關(guān)聯(lián)、影響等關(guān)系,構(gòu)建經(jīng)濟(jì)普查知識(shí)圖譜,形成經(jīng)濟(jì)普查領(lǐng)域的概念體系。還可以通過知識(shí)圖譜技術(shù),將經(jīng)濟(jì)普查數(shù)據(jù)中的新的數(shù)據(jù)、信息、知識(shí)等,不斷融入知識(shí)圖譜,豐富圖譜內(nèi)容。此外,還可以基于知識(shí)圖譜,構(gòu)建智能問答、決策分析等服務(wù),輔助管理決策。例如,可以通過智能問答服務(wù),根據(jù)用戶的自然語言問題,從知識(shí)圖譜中檢索相關(guān)的實(shí)體和關(guān)系,給出精準(zhǔn)的答案。還可以通過決策分析服務(wù),根據(jù)用戶的決策目標(biāo),從知識(shí)圖譜中提取相關(guān)的實(shí)體和關(guān)系,進(jìn)行數(shù)據(jù)分析和模型運(yùn)算,給出優(yōu)化的方案。
(三)數(shù)據(jù)可視化展示分析成果,直觀反映經(jīng)濟(jì)動(dòng)態(tài)
充分利用可視化的展示手段,將抽象的數(shù)據(jù)轉(zhuǎn)化為直觀的圖表,通過動(dòng)態(tài)的、交互式的可視化應(yīng)用,將經(jīng)濟(jì)普查數(shù)據(jù)分析的結(jié)果和經(jīng)濟(jì)發(fā)展動(dòng)態(tài)更好地呈現(xiàn)出來,提升分析成果的說服力。例如,可以利用柱狀圖、折線圖、餅圖等常見的圖表,將經(jīng)濟(jì)普查數(shù)據(jù)分析的結(jié)果,如經(jīng)濟(jì)活動(dòng)主體的數(shù)量、結(jié)構(gòu)、分布等,以及經(jīng)濟(jì)狀況的評(píng)估、預(yù)測(cè)等,以簡(jiǎn)潔明了的方式展示出來,突出數(shù)據(jù)的重點(diǎn)和趨勢(shì)。還可以利用地圖、儀表盤、故事板等高級(jí)的圖表,將經(jīng)濟(jì)普查數(shù)據(jù)分析的結(jié)果,如經(jīng)濟(jì)活動(dòng)主體的地理位置、經(jīng)濟(jì)狀況的區(qū)域差異等,以及經(jīng)濟(jì)發(fā)展動(dòng)態(tài)的變化、影響等,以生動(dòng)形象的方式展示出來,增加數(shù)據(jù)的吸引力和感染力。此外,還可以利用動(dòng)態(tài)的、交互式的可視化應(yīng)用,讓用戶可以根據(jù)自己的需求,對(duì)數(shù)據(jù)進(jìn)行篩選、排序、比較、聚合等操作,實(shí)現(xiàn)數(shù)據(jù)的個(gè)性化和定制化展示,提高數(shù)據(jù)的可用性和靈活性。
(四)建立經(jīng)濟(jì)活動(dòng)場(chǎng)景和portrait,支持精準(zhǔn)識(shí)別與畫像
大數(shù)據(jù)技術(shù)可以為經(jīng)濟(jì)普查提供更豐富、更準(zhǔn)確、更及時(shí)的數(shù)據(jù)來源和分析方法。一方面,可以利用定位服務(wù)、交易數(shù)據(jù)等,實(shí)現(xiàn)對(duì)不同經(jīng)濟(jì)活動(dòng)的實(shí)時(shí)監(jiān)測(cè)和動(dòng)態(tài)評(píng)估。例如,可以通過分析用戶的位置軌跡、消費(fèi)行為、社交網(wǎng)絡(luò)等,判斷用戶是否參與了旅游、購物、餐飲等經(jīng)濟(jì)活動(dòng),并對(duì)這些活動(dòng)進(jìn)行分類、統(tǒng)計(jì)和評(píng)價(jià)。這樣,就可以對(duì)經(jīng)濟(jì)活動(dòng)的規(guī)模、分布、特征、影響等進(jìn)行全面了解和分析,為經(jīng)濟(jì)決策提供有力的支持。另一方面,可以依托portrait技術(shù),從數(shù)據(jù)層面深入繪制經(jīng)濟(jì)活動(dòng)主體的畫像,作為經(jīng)濟(jì)普查的重要內(nèi)容。portrait技術(shù)是一種利用數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等方法,對(duì)經(jīng)濟(jì)活動(dòng)主體的屬性、行為、偏好、需求等進(jìn)行綜合描述和預(yù)測(cè)的技術(shù)。通過portrait技術(shù),可以將經(jīng)濟(jì)活動(dòng)主體劃分為不同的群體或個(gè)體,并對(duì)其進(jìn)行詳細(xì)描述和分析。例如,可以根據(jù)用戶的消費(fèi)習(xí)慣、信用評(píng)級(jí)、收入水平等,為其提供合適的金融產(chǎn)品、優(yōu)惠政策、營(yíng)銷策略等。這樣,就可以提高經(jīng)濟(jì)普查的精度、質(zhì)量和效率,促進(jìn)經(jīng)濟(jì)的發(fā)展和創(chuàng)新。
結(jié)語:
大數(shù)據(jù)為經(jīng)濟(jì)普查提供了新的機(jī)遇,也帶來一定的挑戰(zhàn)。要認(rèn)識(shí)到大數(shù)據(jù)條件下的數(shù)據(jù)特性,主動(dòng)應(yīng)對(duì)數(shù)據(jù)質(zhì)量問題、數(shù)據(jù)安全問題、數(shù)據(jù)處理難題以及數(shù)據(jù)應(yīng)用局限等方面的難點(diǎn)。同時(shí),要充分利用大數(shù)據(jù)技術(shù),建立數(shù)據(jù)治理體系,優(yōu)化數(shù)據(jù)分析流程,拓展數(shù)據(jù)應(yīng)用范圍,推動(dòng)經(jīng)濟(jì)普查大數(shù)據(jù)分析向規(guī)范化、系統(tǒng)化、智能化方向發(fā)展,造福社會(huì)經(jīng)濟(jì)。