亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)技術(shù)在鄉(xiāng)村畫像中的應(yīng)用研究

        2020-02-08 07:14:26李望月劉瑾陳娜
        大數(shù)據(jù) 2020年1期

        李望月,劉瑾,陳娜

        1. 北京國研網(wǎng)信息股份有限公司,北京 100010;2. 國務(wù)院發(fā)展研究中心信息網(wǎng),北京 100010

        1 引言

        隨著國家大數(shù)據(jù)戰(zhàn)略的實施推進,大數(shù)據(jù)技術(shù)蓬勃發(fā)展,正加速成為發(fā)現(xiàn)新知識、創(chuàng)造新價值的新一代生產(chǎn)力,其應(yīng)用已滲入經(jīng)濟社會的各個微觀單元,并逐漸成為各行各業(yè)尋求突破、創(chuàng)新發(fā)展的關(guān)鍵力量。其中,大數(shù)據(jù)技術(shù)中的用戶畫像技術(shù)在電子商務(wù)、金融等領(lǐng)域的成功應(yīng)用,為這些行業(yè)帶來了巨大的經(jīng)濟效益。在最早應(yīng)用用戶畫像技術(shù)的電子商務(wù)領(lǐng)域,目前已實現(xiàn)對上億用戶的智能化畫像,為電商企業(yè)快速、便捷、精準地了解用戶消費行為、興趣偏好等特征提供了新的途徑,同時也為營銷策略的精準制定和實施提供了科學(xué)依據(jù)。

        大數(shù)據(jù)技術(shù)同樣已經(jīng)滲入鄉(xiāng)村發(fā)展的某些領(lǐng)域,其中,應(yīng)用比較廣泛的是農(nóng)業(yè)領(lǐng)域。通過對氣候、土壤、農(nóng)作物基因庫、農(nóng)業(yè)傳感器返回的數(shù)據(jù)等農(nóng)業(yè)大數(shù)據(jù)進行挖掘、分析發(fā)現(xiàn),大數(shù)據(jù)技術(shù)在推動精準農(nóng)業(yè)實施建設(shè)方面做出了重要貢獻,在農(nóng)業(yè)產(chǎn)量預(yù)測、農(nóng)業(yè)自然災(zāi)害的監(jiān)測預(yù)警、農(nóng)產(chǎn)品價格預(yù)測、農(nóng)產(chǎn)品營銷等方面的應(yīng)用也取得了良好的效果。但到目前為止,無論是理論層面,還是實踐層面,尚未有文獻對大數(shù)據(jù)技術(shù)在鄉(xiāng)村層面的系統(tǒng)性應(yīng)用進行研究。

        黨的十九大報告確立了“鄉(xiāng)村振興”戰(zhàn)略的重要地位,實施鄉(xiāng)村振興戰(zhàn)略的第一步是立足鄉(xiāng)情,全面、準確地了解當前“鄉(xiāng)村”這一微觀單元的經(jīng)濟社會運行全貌和特征,即首先要開展“鄉(xiāng)村畫像”工作。據(jù)2016年第三次全國農(nóng)業(yè)普查數(shù)據(jù)顯示,截止到2016年底,全國約有4萬個鄉(xiāng)鎮(zhèn)、60萬個行政村,對這些鄉(xiāng)鎮(zhèn)、村的發(fā)展全貌和特征屬性進行系統(tǒng)性分析與挖掘需要耗費大量的人力、物力、財力,如果不借助大數(shù)據(jù)畫像技術(shù),將很難實現(xiàn)。大數(shù)據(jù)鄉(xiāng)村畫像可以實現(xiàn)對數(shù)十萬鄉(xiāng)村的智能化管理,是現(xiàn)代農(nóng)村建設(shè)發(fā)展的智能型管理工具,為快速了解鄉(xiāng)村發(fā)展全貌與現(xiàn)代化建設(shè)趨勢,挖掘鄉(xiāng)村優(yōu)勢特征與不足,制定政策支持方向、科研方向、投資決策方向,提供了有力的理論依據(jù)和數(shù)據(jù)支撐。根據(jù)鄉(xiāng)村畫像的結(jié)果,政府部門可以明確鄉(xiāng)村產(chǎn)業(yè)發(fā)展方向、鄉(xiāng)村治理領(lǐng)域,同時監(jiān)測鄉(xiāng)村振興實施效果、制定鄉(xiāng)村現(xiàn)代化發(fā)展規(guī)劃;科研機構(gòu)可以在鄉(xiāng)村畫像系統(tǒng)的海量數(shù)據(jù)基礎(chǔ)上,使用科學(xué)方法構(gòu)建鄉(xiāng)村發(fā)展模型,為解決我國“三農(nóng)”問題提出建議;商業(yè)機構(gòu)可以使用鄉(xiāng)村畫像系統(tǒng),根據(jù)自身的投資方向,確定最佳投資對象、投資方式和投資期限。

        綜上所述,大數(shù)據(jù)技術(shù)在多個領(lǐng)域的應(yīng)用已較為成熟,但在鄉(xiāng)村領(lǐng)域的應(yīng)用大多聚焦于農(nóng)業(yè)領(lǐng)域,對于其在電商等領(lǐng)域成功應(yīng)用的畫像技術(shù),在鄉(xiāng)村領(lǐng)域尚未進行應(yīng)用與實踐,而鄉(xiāng)村畫像又是一項重要且必要的工作。鑒于此,本文將對大數(shù)據(jù)技術(shù)在鄉(xiāng)村畫像中的應(yīng)用開展前瞻性研究,在借鑒用戶畫像方法的同時,基于鄉(xiāng)村大數(shù)據(jù)情況,建立大數(shù)據(jù)鄉(xiāng)村畫像的概念模型、標簽體系以及實施算法。

        2 大數(shù)據(jù)鄉(xiāng)村畫像的相關(guān)研究現(xiàn)狀

        鑒于當前尚未檢索到以大數(shù)據(jù)鄉(xiāng)村畫像為主題的直接文獻,本文將沿著“以數(shù)據(jù)為基礎(chǔ),以技術(shù)為手段,以助推鄉(xiāng)村振興發(fā)展為目的”的思路,從鄉(xiāng)村大數(shù)據(jù)源、大數(shù)據(jù)畫像技術(shù)和鄉(xiāng)村振興領(lǐng)域研究的熱點、重點和難點問題3個方面出發(fā),分別進行研究。

        2.1 鄉(xiāng)村大數(shù)據(jù)源的研究現(xiàn)狀

        鄉(xiāng)村大數(shù)據(jù)源是大數(shù)據(jù)技術(shù)開展鄉(xiāng)村畫像的基礎(chǔ)。在對現(xiàn)有文獻進行檢索研究時,并未發(fā)現(xiàn)有關(guān)“鄉(xiāng)村大數(shù)據(jù)”“農(nóng)村大數(shù)據(jù)”的研究,但近兩年關(guān)于“農(nóng)業(yè)大數(shù)據(jù)”[1-2]的研究逐漸增加,趙瑞雪等人[1]從數(shù)據(jù)來源上梳理了國內(nèi)外在農(nóng)業(yè)科技活動中長期積累和整編的海量科學(xué)數(shù)據(jù),即農(nóng)業(yè)科學(xué)大數(shù)據(jù),通過對其列出的數(shù)據(jù)源進行梳理發(fā)現(xiàn),數(shù)量上匯集了12個國外數(shù)據(jù)源和30個國內(nèi)數(shù)據(jù)源(包括6個地方政府門戶開放數(shù)據(jù)),內(nèi)容上大致可分為4類:自然條件與資源數(shù)據(jù),如氣象數(shù)據(jù)、地質(zhì)數(shù)據(jù)、再生資源數(shù)據(jù)、空間數(shù)據(jù)等;農(nóng)業(yè)經(jīng)濟數(shù)據(jù),如宏觀農(nóng)業(yè)數(shù)據(jù)、生態(tài)農(nóng)業(yè)、中國飼料數(shù)據(jù)庫等;生命科學(xué)數(shù)據(jù),如生物信息數(shù)據(jù)、細胞數(shù)據(jù)、微生物病毒數(shù)據(jù)、基因數(shù)據(jù)等;農(nóng)業(yè)行政機構(gòu)數(shù)據(jù),主要來自于政府部門開放門戶。姜侯等人[2]從農(nóng)業(yè)大數(shù)據(jù)產(chǎn)生的角度,提出了農(nóng)業(yè)物聯(lián)網(wǎng)數(shù)據(jù)、農(nóng)業(yè)遙感和農(nóng)業(yè)無人機數(shù)據(jù)、農(nóng)業(yè)網(wǎng)絡(luò)數(shù)據(jù)、科研及農(nóng)戶生產(chǎn)經(jīng)驗數(shù)據(jù)4類農(nóng)業(yè)大數(shù)據(jù),設(shè)計了農(nóng)業(yè)大數(shù)據(jù)平臺整體架構(gòu),并對農(nóng)業(yè)大數(shù)據(jù)的應(yīng)用方向進行了論述。除上述微觀層面的農(nóng)業(yè)大數(shù)據(jù)外,中華人民共和國農(nóng)業(yè)農(nóng)村部、國家統(tǒng)計局、中華人民共和國海關(guān)總署等部門擁有的農(nóng)業(yè)統(tǒng)計數(shù)據(jù)同樣是農(nóng)業(yè)大數(shù)據(jù)。省、市級別宏觀匯總數(shù)據(jù)可從《中國統(tǒng)計年鑒》《中國農(nóng)業(yè)年鑒》等公開的年鑒資料中獲取,但微觀數(shù)據(jù)較難獲得。

        農(nóng)業(yè)大數(shù)據(jù)是鄉(xiāng)村大數(shù)據(jù)的一部分,除農(nóng)業(yè)之外的其他鄉(xiāng)村大數(shù)據(jù)主要集中在國家統(tǒng)計局、地方統(tǒng)計局以及其他政府部門。其中,省、市級別的鄉(xiāng)村數(shù)據(jù)可在《中國農(nóng)村統(tǒng)計年鑒》《中國農(nóng)業(yè)機械工業(yè)年鑒》《中國環(huán)境統(tǒng)計年鑒》等公開年鑒中獲取,而微觀數(shù)據(jù)由各部門保存,一般不對外公開,外部組織機構(gòu)也無法通過網(wǎng)絡(luò)爬取獲得。在國家或地方各部門擁有的鄉(xiāng)村數(shù)據(jù)中,以農(nóng)業(yè)普查數(shù)據(jù)中包含的農(nóng)村信息最為全面,普查表中的行政村綜合表和鄉(xiāng)鎮(zhèn)綜合表囊括了鄉(xiāng)村基本信息和特征信息;普查表中的農(nóng)戶基層表包括了村內(nèi)農(nóng)戶生活、生產(chǎn)經(jīng)營活動的方方面面,進一步豐富了鄉(xiāng)村數(shù)據(jù)。農(nóng)業(yè)普查數(shù)據(jù)可提供全面的鄉(xiāng)村數(shù)據(jù)信息,局限性為每十年開展一次,最近一次是2016年開展的第三次全國農(nóng)業(yè)普查。但隨著近兩年地方鄉(xiāng)村振興戰(zhàn)略統(tǒng)計工作的開展,鄉(xiāng)村振興戰(zhàn)略統(tǒng)計的調(diào)查指標與普查指標具有較高的相似度,可對相同的指標進行不同年度的連續(xù)分析。除農(nóng)業(yè)普查數(shù)據(jù)外,鄉(xiāng)村層面還存在著數(shù)量可觀的非傳統(tǒng)數(shù)據(jù),如中國精神文明網(wǎng)網(wǎng)站(中國共產(chǎn)黨中央委員會宣傳部、中央精神文明建設(shè)指導(dǎo)委員辦公室)發(fā)布的5個批次共計4 717個全國文明村鎮(zhèn)的名單數(shù)據(jù),中華人民共和國建設(shè)部、中華人民共和國文化和旅游部、中華人民共和國財政部等7個部門發(fā)布的5個批次共計6 819個中國傳統(tǒng)村落的名單數(shù)據(jù),中華人民共和國農(nóng)業(yè)農(nóng)村部發(fā)布的兩個批次共計300個中國美麗休閑鄉(xiāng)村的名單數(shù)據(jù)。此外,隨著《鄉(xiāng)村振興戰(zhàn)略規(guī)劃(2018—2022年)》和《數(shù)字鄉(xiāng)村發(fā)展戰(zhàn)略綱要》[3]的推進實施,數(shù)字鄉(xiāng)村的建設(shè)速度加快,鄉(xiāng)村大數(shù)據(jù)將會得到快速沉淀。

        2.2 大數(shù)據(jù)畫像技術(shù)的研究現(xiàn)狀

        大數(shù)據(jù)畫像技術(shù)是大數(shù)據(jù)鄉(xiāng)村畫像的核心技術(shù)手段。大數(shù)據(jù)畫像的概念來源于用戶畫像,用戶畫像的英文概念“user persona”最早由艾倫·庫珀提出,其認為 user persona是真實用戶的虛擬代表,根據(jù)用戶行為、動機等將用戶分為不同的類型,從中抽取每類用戶的社會屬性、生活習(xí)慣、消費行為和興趣偏好等信息的共同特征,并設(shè)定名字、照片、場景等要素對其進行描述[4]。用戶畫像又稱為人群畫像,是根據(jù)用戶信息抽象出的一個標簽化的用戶模型,即用高度精練的特征描述一類人,例如年齡、性別、職業(yè)、興趣偏好等。

        大數(shù)據(jù)畫像技術(shù)是用戶畫像在大數(shù)據(jù)環(huán)境下的延伸和發(fā)展,是基于大量傳統(tǒng)數(shù)據(jù)和非傳統(tǒng)數(shù)據(jù)、靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),使用統(tǒng)計分析、機器學(xué)習(xí)和人工智能等算法,構(gòu)建模型、挖掘數(shù)據(jù)、提取特征并進行動態(tài)可視化展示的一門數(shù)據(jù)分析與展示技術(shù)。在中國知網(wǎng)文獻數(shù)據(jù)庫中,以“大數(shù)據(jù)畫像”“鄉(xiāng)村畫像”“畫像”等關(guān)鍵詞進行檢索,對現(xiàn)有文獻從畫像對象、畫像技術(shù)方法兩個方面進行歸納總結(jié)。

        從畫像對象來看,當前文獻庫中可檢索到以“用戶畫像”“產(chǎn)品畫像”“企業(yè)畫像”“城市畫像”為標題的研究,其中,“用戶畫像”作為畫像技術(shù)的初始應(yīng)用領(lǐng)域,研究的文獻最多,應(yīng)用也最為廣泛,尤其是在互聯(lián)網(wǎng)電商、電信、金融等領(lǐng)域[5-7];研究“產(chǎn)品畫像[8]”和“企業(yè)畫像[9]”的文獻數(shù)量較少,研究內(nèi)容和視角基本沿用“用戶畫像”的思路;而“城市畫像”相關(guān)文獻中對畫像的理解和研究差異較大,一些文獻局限于城市傳統(tǒng)數(shù)據(jù)的傳統(tǒng)圖表的畫像,還有一些文獻使用GPS數(shù)據(jù)、互聯(lián)網(wǎng)等新興大數(shù)據(jù)進行可視化分析[10-11]。但以“鄉(xiāng)村畫像”為標題的文獻尚未發(fā)現(xiàn)。

        從畫像技術(shù)方法來看[9-23],特征值(標簽值)的提取是畫像技術(shù)的關(guān)鍵。當前畫像技術(shù)中特征值的提取方法眾多,主要可以分為兩大類:一類是人工抽取特征值的方法,即通過查閱文獻、調(diào)研、訪談并在專家的建議下提取用戶特征,構(gòu)建用戶畫像,此種方法適用于數(shù)據(jù)表達清晰、數(shù)據(jù)量小的場景,主要應(yīng)用于經(jīng)濟社會宏觀和中觀領(lǐng)域;另一類是數(shù)據(jù)挖掘的方法,主要的特征提取大數(shù)據(jù)技術(shù)方法有k均值聚類(k-means)[15]、線性判別分析(linear discriminant analysis,LDA)[16]、樸素貝葉斯(naive bayesian,NB)[17]、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)[18]、決策樹[19-20]等,主要的大數(shù)據(jù)關(guān)聯(lián)規(guī)則方法有APRORI算法[21]、FPGrowth關(guān)聯(lián)規(guī)則算法[22],這些方法主要應(yīng)用于電商、金融等行業(yè)的用戶畫像[23]。雖然當前關(guān)于特征值提取的方法很多,但是特征值挖掘和提取的準確性仍是要持續(xù)攻克的難點。

        2.3 鄉(xiāng)村振興領(lǐng)域研究的熱點、重點及難點問題

        鄉(xiāng)村振興領(lǐng)域的熱點、重點及難點問題是大數(shù)據(jù)鄉(xiāng)村畫像的重要應(yīng)用方向。自2017年黨的十九大報告中提出鄉(xiāng)村振興戰(zhàn)略,到2018年《鄉(xiāng)村振興戰(zhàn)略規(guī)劃(2018—2022年)》正式出臺,再到2019年《數(shù)字鄉(xiāng)村發(fā)展戰(zhàn)略綱要》的提出,學(xué)術(shù)界關(guān)于鄉(xiāng)村振興領(lǐng)域研究的熱點、重點及難點問題的研究大多圍繞著鄉(xiāng)村振興發(fā)展而開展,或是聚焦鄉(xiāng)村振興發(fā)展的產(chǎn)業(yè)興旺、生態(tài)宜居、鄉(xiāng)村文明、治理有效、生活富裕5個維度整體,或是聚焦某一個局部展開研究。通過對鄉(xiāng)村領(lǐng)域相關(guān)文獻進行研究和分析,可以總結(jié)為:鄉(xiāng)村振興領(lǐng)域研究的熱點是鄉(xiāng)村振興實施效果評價[24-26],文獻以鄉(xiāng)村振興評價指標體系構(gòu)建為主,部分文獻選取對象進行實證分析;鄉(xiāng)村振興領(lǐng)域研究的重點是鄉(xiāng)村振興實施路徑[27-29],當前文獻大多對鄉(xiāng)村振興的某一方面進行重點研究,從問題導(dǎo)向給出鄉(xiāng)村振興的實施路徑;鄉(xiāng)村振興領(lǐng)域研究的難點是鄉(xiāng)村振興差異化的前期規(guī)劃[30-33],如黃祖輝提出要從區(qū)域新型城鎮(zhèn)化戰(zhàn)略和鄉(xiāng)村差異化發(fā)展的實際出發(fā),落實鄉(xiāng)村振興戰(zhàn)略。其中,除鄉(xiāng)村振興的實施效果可以進行定量分析外,其他研究大多為定性分析。

        大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)的成果可以為鄉(xiāng)村振興領(lǐng)域熱點、重點及難點問題的研究提供科學(xué)有力的支撐,在實際應(yīng)用過程中,大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)主要有三大作用。第一,充分了解鄉(xiāng)村全貌。傳統(tǒng)的鄉(xiāng)村發(fā)展評價模型一般使用年鑒數(shù)據(jù)和調(diào)查數(shù)據(jù),對互聯(lián)網(wǎng)上大量可用數(shù)據(jù)的利用率不高,維度通常也局限于年鑒數(shù)據(jù)提供的信息,無法全面刻畫鄉(xiāng)村面貌。大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)可以充分利用年鑒數(shù)據(jù)、政府網(wǎng)站公開數(shù)據(jù)等結(jié)構(gòu)化數(shù)據(jù),同時也可以利用地理位置信息、氣候信息、政策文件信息、政策稱號信息等非結(jié)構(gòu)化數(shù)據(jù),多維度、全方位、立體化地對鄉(xiāng)村發(fā)展情況進行描述,幫助政府根據(jù)鄉(xiāng)村存在的現(xiàn)實問題,有針對性地制定政策。第二,尋找差異,為因地制宜發(fā)展鄉(xiāng)村振興提供理論支持。利用大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng),可以對省份層面、地市層面、縣域?qū)用?、鄉(xiāng)鎮(zhèn)層面以及行政村層面等各級行政區(qū)劃的鄉(xiāng)村振興發(fā)展情況進行分析,應(yīng)用范圍廣泛。通過對比,可以發(fā)現(xiàn)研究主體的優(yōu)勢和劣勢,幫助當?shù)卣虻刂埔?,開展“千村千面”個性化、特色化規(guī)劃,解決規(guī)劃的同質(zhì)性和落地難等問題。同時,大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)可智能化匹配生產(chǎn)條件、自然條件或者社會條件相似的標桿性鄉(xiāng)村,幫助落后鄉(xiāng)村找到適合當?shù)氐泥l(xiāng)村振興發(fā)展路徑和實施路徑。第三,監(jiān)測鄉(xiāng)村振興政策實施效果。大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)可以對鄉(xiāng)村振興發(fā)展情況進行連續(xù)時間的監(jiān)測,通過對多年的數(shù)據(jù)和信息進行對比,系統(tǒng)可使用標簽對分析結(jié)果進行展示,例如,某省份人均農(nóng)林牧漁產(chǎn)值連續(xù)5年增加,鄉(xiāng)村畫像標簽可展示為“連續(xù)5年人均農(nóng)林牧漁產(chǎn)值增加”。同時,大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)也可設(shè)置預(yù)警機制,在指標值出現(xiàn)異常波動或者下降趨勢時(針對正向指標),發(fā)出預(yù)警信號,幫助政府部門及時做出應(yīng)對。

        綜上所述,本文結(jié)合已有研究成果,以鄉(xiāng)村大數(shù)據(jù)為基礎(chǔ),以大數(shù)據(jù)畫像技術(shù)為手段,以輔助解決鄉(xiāng)村振興發(fā)展中的熱點、重點和難點問題為導(dǎo)向,開展鄉(xiāng)村畫像概念模型和標簽體系的構(gòu)建工作。

        3 鄉(xiāng)村畫像概念模型構(gòu)建及數(shù)據(jù)支撐

        概念模型來源于數(shù)據(jù)庫設(shè)計,是對現(xiàn)實世界中問題域內(nèi)的事物進行描述的模型,是現(xiàn)實世界到信息世界的第一層抽象,是用戶與數(shù)據(jù)庫設(shè)計人員進行交流的語言,因此,概念模型一般具有較強的語義表達能力,能夠方便、直接地表達應(yīng)用中的各種語義知識,且簡單、清晰、易于用戶理解。鄉(xiāng)村畫像概念模型是對鄉(xiāng)村微觀單元中的經(jīng)濟和社會發(fā)展進行描述的模型,是對真實鄉(xiāng)村的經(jīng)濟社會運行狀態(tài)和行為的刻畫,是大數(shù)據(jù)鄉(xiāng)村畫像的核心內(nèi)容,是影響鄉(xiāng)村畫像結(jié)果的關(guān)鍵。本文將在確立鄉(xiāng)村畫像構(gòu)建原則的基礎(chǔ)上,從基本屬性、狀態(tài)屬性和行為屬性3個方面構(gòu)建鄉(xiāng)村畫像概念模型,并在概念模型的基礎(chǔ)上,系統(tǒng)性梳理所需的鄉(xiāng)村畫像數(shù)據(jù)支撐。

        3.1 鄉(xiāng)村畫像概念模型的構(gòu)建原則

        鄉(xiāng)村畫像概念模型是大數(shù)據(jù)鄉(xiāng)村畫像的基礎(chǔ),構(gòu)建科學(xué)合理的大數(shù)據(jù)鄉(xiāng)村畫像概念模型應(yīng)遵循全面性、系統(tǒng)性、特征性、可行性和智能性的原則。

        (1)全面性原則

        鄉(xiāng)村畫像概念模型在構(gòu)建時應(yīng)遵循全面性原則,即應(yīng)充分考慮各類鄉(xiāng)村的屬性,構(gòu)建的鄉(xiāng)村畫像模型應(yīng)覆蓋全部村的基本屬性,可以實現(xiàn)對任何一個鄉(xiāng)村進行畫像,不應(yīng)存在不能進行鄉(xiāng)村畫像的情況。

        (2)系統(tǒng)性原則

        鄉(xiāng)村畫像的系統(tǒng)性是指在鄉(xiāng)村畫像概念模型的構(gòu)建中,堅持全局意識、整體觀念。概念模型構(gòu)建時應(yīng)系統(tǒng)地考慮各要素的層次性,各要素由外至內(nèi)層層深入,構(gòu)建一個鄉(xiāng)村經(jīng)濟社會內(nèi)各子系統(tǒng)、各要素相互獨立又相互聯(lián)系的有機整體。

        (3)特征性原則

        鄉(xiāng)村畫像概念模型的構(gòu)建要突出特征性,特征屬性是鄉(xiāng)村畫像概念模型的重要組成部分,是彰顯鄉(xiāng)村特色、挖掘鄉(xiāng)村價值、因地制宜地推進鄉(xiāng)村振興的重要工作抓手。

        (4)可行性原則

        鄉(xiāng)村大數(shù)據(jù)是大數(shù)據(jù)鄉(xiāng)村畫像落地實施的前提,鄉(xiāng)村畫像是在鄉(xiāng)村大數(shù)據(jù)分析、計算和研究的基礎(chǔ)上開展的,如果鄉(xiāng)村畫像的數(shù)據(jù)不可獲得,那么鄉(xiāng)村畫像概念模型的構(gòu)建將會停留在理論研究層面,無法走向?qū)嶋H操作層面。

        (5)智能性原則

        概念模型的構(gòu)建應(yīng)清晰、明確,能夠被計算機理解,便于進行程序化實施,進而保障后續(xù)對4萬個鄉(xiāng)鎮(zhèn)、60萬個行政村的大數(shù)據(jù)畫像的自動化、智能化、動態(tài)化實現(xiàn)。

        3.2 鄉(xiāng)村畫像概念模型的建立

        基于鄉(xiāng)村畫像概念模型的構(gòu)建原則,在鄉(xiāng)村畫像概念模型構(gòu)建的過程中,綜合考量鄉(xiāng)村經(jīng)濟社會的基本屬性和特征屬性、靜態(tài)屬性和動態(tài)屬性、微觀屬性和宏觀屬性,最終確定鄉(xiāng)村畫像概念模型從“基本屬性”“狀態(tài)屬性”“行為屬性”3個方面進行構(gòu)建。在構(gòu)建概念模型時,將按照“345”的原則構(gòu)建,即鄉(xiāng)村畫像基本屬性由3個維度構(gòu)成,分別為“地理區(qū)位”“自然條件”“政策稱號”;鄉(xiāng)村畫像狀態(tài)屬性由4個維度構(gòu)成,分別為“規(guī)?!薄八俣取薄敖Y(jié)構(gòu)”“效率”;鄉(xiāng)村畫像行為屬性由5個維度構(gòu)成,分別為“發(fā)展產(chǎn)業(yè)”“保護生態(tài)”“延續(xù)文明”“加強治理”“推動共同富?!?。鄉(xiāng)村畫像概念模型如圖1所示。

        3.3 鄉(xiāng)村畫像概念模型的數(shù)據(jù)支撐

        鄉(xiāng)村畫像概念模型及標簽體系的設(shè)立是基于廣泛的、多維度的鄉(xiāng)村大數(shù)據(jù)源進行的,包括傳統(tǒng)數(shù)據(jù)和非傳統(tǒng)數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)等多種類型。本文使用的主要數(shù)據(jù)來源及相應(yīng)用途見表1。

        4 大數(shù)據(jù)鄉(xiāng)村畫像標簽體系的構(gòu)建

        在鄉(xiāng)村畫像概念模型的框架下,以鄉(xiāng)村大數(shù)據(jù)為基礎(chǔ),以展示鄉(xiāng)村全貌、挖掘鄉(xiāng)村特征、助力鄉(xiāng)村振興發(fā)展為目標,構(gòu)建鄉(xiāng)村畫像標簽體系。相對于概念模型而言,鄉(xiāng)村畫像標簽體系更加具體和形象,在獲取數(shù)據(jù)的基礎(chǔ)上,可直接進行可視化標簽分析。

        4.1 標簽體系的構(gòu)建方法

        與指標體系不同,標簽體系不再受各指標層級必須相同、指標值必須為數(shù)值型數(shù)據(jù)的限制,是一種更為靈活、更適合大數(shù)據(jù)生態(tài)的模型體系。本文將從指標數(shù)據(jù)、知識圖譜、政策規(guī)劃文本3個方面,介紹5類標簽的構(gòu)建方法。其中,從指標數(shù)據(jù)出發(fā),可以構(gòu)建2類原始標簽;從知識圖譜出發(fā),可以通過對原始標簽進行擴展和泛化處理,生成2類新的標簽;從政策規(guī)劃文本出發(fā),提取關(guān)鍵詞,可以生成宏觀屬性的鄉(xiāng)村行為標簽。

        (1)基于指標名稱的原始標簽提取

        從鄉(xiāng)村數(shù)據(jù)指標出發(fā),對數(shù)據(jù)指標名稱進行轉(zhuǎn)換,在保持指標含義不變的條件下,將原始指標轉(zhuǎn)換為以短詞語或短詞組形式為主、指標名稱更為精簡的標簽,并將其標記為原始標簽。如第三次全國農(nóng)業(yè)普查中行政村普查表中的“生活污水是否經(jīng)過集中處理”這一指標,在提取標簽時,可以提取為“生活污水集中處理”。此外,對于指標中存在的“個數(shù)”“人數(shù)”“戶數(shù)”等內(nèi)容,在進行標簽提取時,一般進行刪除處理,如“村集體創(chuàng)辦的互助型養(yǎng)老服務(wù)設(shè)施個數(shù)”指標,在提取標簽時,轉(zhuǎn)化為“村集體創(chuàng)辦互助型養(yǎng)老服務(wù)設(shè)施”。

        (2)基于指標數(shù)據(jù)計算的標簽提取

        表1 鄉(xiāng)村畫像概念模型數(shù)據(jù)源匯總

        從鄉(xiāng)村數(shù)據(jù)出發(fā),借助傳統(tǒng)描述性統(tǒng)計分析,計算某一指標或原始標簽的基本統(tǒng)計量,對單時點數(shù)據(jù)計算最大值、最小值、均值、秩(排序),對連續(xù)時點數(shù)據(jù)計算增長率等,并對計算后的統(tǒng)計量中的突出特征進行提取。以單時點第三次全國農(nóng)業(yè)普查數(shù)據(jù)為例,針對行政村“外來人口”這一指標,在全省樣本層面計算指標排名,針對排名提取最具特征的標簽,如“外來人口省內(nèi)Top3”“外來人口省內(nèi)前10%”等。對于非傳統(tǒng)數(shù)據(jù)的標簽化處理,視數(shù)據(jù)情況而定,其中,政府部門公開評選的鄉(xiāng)村稱號數(shù)據(jù),如“鄉(xiāng)村振興示范村”“生態(tài)村”等文本型數(shù)據(jù),無需轉(zhuǎn)換,可直接作為鄉(xiāng)村畫像標簽。

        (3)基于知識圖譜的原始標簽擴展

        基本知識圖譜的原始標簽擴展是指從原始指標出發(fā),借助相關(guān)知識圖譜,引入外部相關(guān)信息,在原始指標的基礎(chǔ)上,擴展出新的標簽。關(guān)于擴展型標簽的知識圖譜的構(gòu)建,應(yīng)將鄉(xiāng)村的地理區(qū)位等基本屬性與國家政策、本區(qū)域的特征、相鄰區(qū)域的特征建立直接或間接的關(guān)系,借助相關(guān)知識圖譜,可以擴展出是否為“兩省邊界村”、是否“與一線城市相鄰”、是否“與經(jīng)濟大省相鄰”等擴展性標簽。

        (4)基于知識圖譜的原始標簽泛化

        基本知識圖譜的原始標簽泛化是指從原始指標出發(fā),借助知識圖譜技術(shù),挖掘出多個指標的共同屬性,并將其泛化成一個共性標簽。對于泛化型標簽的知識圖譜的構(gòu)建,應(yīng)將鄉(xiāng)村的各項經(jīng)濟和社會活動進行系統(tǒng)化處理,并建立鄉(xiāng)村各項經(jīng)濟和社會活動的層級關(guān)系,進而基于建立的層次關(guān)系,實現(xiàn)原始標簽準確、高效的泛化。如某個鄉(xiāng)村在“設(shè)施農(nóng)業(yè)、循環(huán)農(nóng)業(yè)、工廠化生產(chǎn)”“高標準農(nóng)田”“按測土配方施肥”方面開展了大量工作,則基于相關(guān)的知識圖譜,可以泛化出“開展新型生產(chǎn)模式”這一標簽。

        (5)基于政策規(guī)劃文本的標簽提取

        從國家級政策規(guī)劃文本出發(fā),提取其中的關(guān)鍵詞,對關(guān)鍵詞進行轉(zhuǎn)換,生成新的標簽,一般適用于宏觀屬性一、二級標簽的提取,對于三級以上標簽的提取仍需依賴相關(guān)的知識圖譜。這種標簽提取方法緊跟國家政策形勢,提取的標簽可直接用于政策實施進度、實施效果的監(jiān)測,受到政府相關(guān)部門的高度關(guān)注。如從《鄉(xiāng)村振興戰(zhàn)略規(guī)劃(2018—2022年)》中提取“構(gòu)建現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)體系”一詞,可以將其標簽化為“推行現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)化發(fā)展”。

        4.2 鄉(xiāng)村畫像基本屬性標簽體系

        在鄉(xiāng)村畫像概念模型中,鄉(xiāng)村畫像基本屬性包含“地理區(qū)位”“自然條件”“政策稱號”3個維度。地理區(qū)位從行政區(qū)劃出發(fā),借助基于地理、經(jīng)濟等知識圖譜體系,生成行政區(qū)劃、區(qū)域擴展、臨近區(qū)域等新型標簽;自然條件將地形、氣候、土壤、資源、自然災(zāi)害作為畫像標簽;政策稱號將鄉(xiāng)村、鄉(xiāng)村所屬市縣園區(qū)、鄉(xiāng)村下屬企業(yè)在涉農(nóng)領(lǐng)域獲取的國家部委機構(gòu)公開評選的政策稱號,直接作為鄉(xiāng)村標簽。這3個維度的標簽值在短期內(nèi)相對穩(wěn)定,除行政村區(qū)劃調(diào)整和滾動評審的政策稱號之外,絕大多鄉(xiāng)村的基本屬性在短期內(nèi)不會變動。鄉(xiāng)村畫像基本屬性標簽體系如圖2所示。

        鄉(xiāng)村畫像基本屬性標簽體系構(gòu)建中,地理區(qū)位標簽的初始數(shù)據(jù)一般僅為鄉(xiāng)村所屬的行政區(qū)劃這一個數(shù)據(jù)值的信息,對于其他地理區(qū)位標簽,需借助知識圖譜進行標簽擴展;自然條件的數(shù)據(jù)支撐以農(nóng)業(yè)部信息中心、國家氣象信息中心等政府部門的公開數(shù)據(jù)為主,進行標簽構(gòu)建;政策稱號數(shù)據(jù)以中華人民共和國農(nóng)業(yè)農(nóng)村部、中華人民共和國國家發(fā)展和改革委員會、中華人民共和國科學(xué)技術(shù)部、中華人民共和國財政部、中華人民共和國生態(tài)環(huán)境部、中華人民共和國水利部、中華人民共和國文化和旅游部、中華人民共和國住房和城鄉(xiāng)建設(shè)部、中華人民共和國民政部等政府部門聯(lián)合或單獨公開評審的稱號名單為主,進行標簽構(gòu)建,其中“農(nóng)業(yè)產(chǎn)業(yè)化國家重點龍頭企業(yè)”和“國家自然保護區(qū)”的評審為滾動式評選,當年評審后,之前發(fā)布的名單作廢;國家有機食品生產(chǎn)基地會定期對前面審批的基地進行復(fù)核,公布審核后的名單。最終確立一級標簽3類,二級標簽12類,三級標簽29類,四級標簽35類,五級標簽35類。具體標簽體系見表2。

        表2 鄉(xiāng)村畫像基本屬性標簽體系

        4.3 鄉(xiāng)村畫像狀態(tài)屬性標簽體系

        鄉(xiāng)村畫像狀態(tài)屬性標簽體系,主要用來標識當前鄉(xiāng)村發(fā)展的基礎(chǔ)性、代表性指標的發(fā)展狀態(tài),反映鄉(xiāng)村發(fā)展的基本水平。通過狀態(tài)屬性可以對當前鄉(xiāng)村的發(fā)展水平有一個概括性的了解,一般地,狀態(tài)標簽多為長期以來政府部門關(guān)注的指標。對于狀態(tài)屬性標簽化體系的構(gòu)建,將從“規(guī)模”“速度”“結(jié)構(gòu)”“效率”4個維度開展。在規(guī)模和速度維度下,主要對鄉(xiāng)村產(chǎn)業(yè)、鄉(xiāng)村人口、村集體收支的規(guī)模和速度進行考量;在結(jié)構(gòu)維度下,對鄉(xiāng)村非農(nóng)收入、老齡化人口、農(nóng)民受教育、醫(yī)療資源配置、教育資源配置的結(jié)構(gòu)進行考量;在效率維度下,對人均產(chǎn)值、農(nóng)業(yè)機械化效率進行考量。鄉(xiāng)村畫像狀態(tài)屬性標簽體系如圖3所示。

        (續(xù)表)

        鄉(xiāng)村畫像狀態(tài)屬性標簽體系中的數(shù)據(jù)一般為常見性數(shù)據(jù),對于省、市層面的數(shù)據(jù),可以在《中國農(nóng)業(yè)年鑒》《中國農(nóng)村統(tǒng)計年鑒》等公開年鑒中獲??;對于鄉(xiāng)村層級的狀態(tài)數(shù)據(jù),一般保存在各縣級以上的統(tǒng)計部門,不對外公開。全國鄉(xiāng)村的狀態(tài)標簽數(shù)據(jù)可從農(nóng)業(yè)普查數(shù)據(jù)中獲取,但一般鄉(xiāng)村級別底層微觀數(shù)據(jù)的獲取存在一定困難。對于非政府部門開展的狀態(tài)標簽的畫像,可以考慮借助非傳統(tǒng)數(shù)據(jù),如借助遙感數(shù)據(jù)獲取農(nóng)業(yè)產(chǎn)業(yè)數(shù)據(jù),借助手機信令數(shù)據(jù)獲取鄉(xiāng)村人口流動的信息。最終確立一級標簽4類,二級標簽13類,三級標簽20類,具體狀態(tài)標簽體系見表3。

        表3 鄉(xiāng)村畫像狀態(tài)屬性標簽體系

        4.4 鄉(xiāng)村畫像行為屬性標簽體系

        鄉(xiāng)村畫像行為屬性標簽體系,將從鄉(xiāng)村微觀行為標簽和鄉(xiāng)村宏觀行為標簽兩個方面開展,微觀行為標簽主要反映被刻畫的對象的單一行為,較為具體,而宏觀行為標簽則為多種行為的綜合反映,較為抽象。微觀行為標簽有2類:一是某些單時點原始指標可直接被轉(zhuǎn)換為微觀行為標簽,如集中處理生活垃圾、村集體創(chuàng)辦衛(wèi)生室、施用農(nóng)家肥;二是對連續(xù)時點的狀態(tài)性指標變動進行加工計算,將其轉(zhuǎn)換為微觀行為標簽,如可以通過計算“村集體支出”兩年間的變動,生成“縮減村集體支出”這一標簽。宏觀行為標簽可借助政策文本進行提取,同時也可借助相關(guān)知識圖譜進行擴展和泛化。

        基于《國家鄉(xiāng)村振興發(fā)展戰(zhàn)略規(guī)劃(2018—2022)年》(以下簡稱戰(zhàn)略規(guī)劃)和第三次全國農(nóng)業(yè)普查的數(shù)據(jù)指標,從“發(fā)展產(chǎn)業(yè)”“保護生態(tài)”“延續(xù)文明”“加強治理”“推動共同富?!?個維度,構(gòu)建了鄉(xiāng)村畫像行為屬性標簽體系。其中,從戰(zhàn)略規(guī)劃原文提煉了鄉(xiāng)村畫像宏觀行為標簽,標識為“鄉(xiāng)村畫像一級標簽和部分二級標簽”,同時從第三次全國農(nóng)業(yè)普查指標數(shù)據(jù)中提取了鄉(xiāng)村畫像的微觀行為標簽,最終構(gòu)建鄉(xiāng)村畫像行為屬性標簽體系如圖4所示。

        在鄉(xiāng)村畫像行為屬性標簽體系的構(gòu)建中,一級標簽是基于戰(zhàn)略規(guī)劃原文信息直接提取的,二級和三級標簽以第三次全國農(nóng)業(yè)普查的調(diào)查表指標為基礎(chǔ),以農(nóng)業(yè)普查中的行政村、農(nóng)業(yè)經(jīng)營戶、規(guī)模以上農(nóng)業(yè)經(jīng)營戶3類主體的調(diào)查信息表為依據(jù),構(gòu)建鄉(xiāng)村畫像行為屬性標簽體系。鄉(xiāng)村畫像行為屬性包含正向?qū)傩院拓撓驅(qū)傩?,本文的行為標簽體系多以正向?qū)傩缘男问浇o出,以期引導(dǎo)鄉(xiāng)村振興正向發(fā)展,在應(yīng)用中視鄉(xiāng)村各標簽值的大小,加入相應(yīng)的程度副詞或否定詞進行負向刻畫。最終確定一級標簽5類、二級標簽23類、三級標簽44類、四級標簽31類,具體行為屬性標簽體系見表4。

        表4 鄉(xiāng)村畫像行為屬性標簽體系

        (續(xù)表)

        5 大數(shù)據(jù)鄉(xiāng)村畫像的實施算法及畫像舉例

        5.1 大數(shù)據(jù)鄉(xiāng)村畫像的標簽計算方法

        (1)鄉(xiāng)村畫像基本屬性標簽的計算方法

        一是地理區(qū)位標簽計算。從鄉(xiāng)村所屬行政區(qū)劃出發(fā),借助大數(shù)據(jù)工具,識別鄉(xiāng)村行政區(qū)劃邊界,借助知識圖譜,通過建立區(qū)域特征判別算法、鄰近村特征識別算法、邊界村識別算法,對臨近區(qū)域中的相鄰區(qū)域、邊界村、邊境村進行計算識別。

        二是自然屬性標簽計算。在鄉(xiāng)村數(shù)據(jù)較難獲得的情況下,可借助所屬縣、市自然屬性的數(shù)據(jù),進行標簽化處理。

        三是政策稱號標簽計算。通過大數(shù)據(jù)技術(shù)查找比對政府部門公開評選的各類涉農(nóng)名單,政府公開評選的涉農(nóng)的各種名稱頭銜可直接用于鄉(xiāng)村畫像,直接生成鄉(xiāng)村畫像的特征標簽。此類標簽的生成以收集整理的政府部門公開評審的涉農(nóng)名單為前提,在收集、積累涉農(nóng)數(shù)據(jù)的基礎(chǔ)上,分類建立“村”“鎮(zhèn)”“縣”“產(chǎn)業(yè)園”等名錄。在具體開展鄉(xiāng)村畫像工作時,可對被畫像的鄉(xiāng)村名稱與名錄庫中公開評選的名稱進行查找、比對,若能在名錄庫中查找到鄉(xiāng)村名稱,則記錄此鄉(xiāng)村對應(yīng)的被評選的稱號,可直接將被評的稱號作為標簽;若查找不到,則不生成標簽,不進行處理。對于“有進有出”型的評選,在生成標簽時,不僅對當年入選獲取的稱號生成標簽進行標識,對于曾被評選上但當年未被評選上的對象,同樣可粘貼標簽,如標簽化處理可為“某年被評選為某稱號,但在某年被摘掉稱號”。

        (2)鄉(xiāng)村畫像狀態(tài)標簽的計算方法

        鄉(xiāng)村畫像狀態(tài)屬性標簽的計算,主要對鄉(xiāng)村的“規(guī)?!薄八俣取薄敖Y(jié)構(gòu)”“效率”等數(shù)據(jù)進行加工計算,計算其在“本鄉(xiāng)鎮(zhèn)”“本縣”“本市”“本省”以及“全國”層面中的“位次”,并篩選特征指標,進行標簽化處理,在具體特征標簽計算時,可采用“市內(nèi)Top3”“省內(nèi)Top10”“省內(nèi)前10%”等規(guī)則進行標簽化。

        (3)鄉(xiāng)村畫像行為標簽的計算方法

        從標簽體系出發(fā),將原始數(shù)據(jù)按照標簽體系進行模型化處理,最常見的是指數(shù)合成方法,將初始標簽值加工計算為各級標簽值。根據(jù)計算的各級標簽值的大小,選定相關(guān)的程度副詞或否定詞,生成具體的行為標簽。如經(jīng)指數(shù)合成計算,得出“改善生產(chǎn)條件”這一標簽值為零,那么在具體生成行為屬性標簽時生成為“未改善生產(chǎn)條件”。

        5.2 大數(shù)據(jù)鄉(xiāng)村畫像的可視化方法

        (1)鄉(xiāng)村畫像的地圖可視化方法

        在對鄉(xiāng)村進行畫像時,首先應(yīng)將鄉(xiāng)村的基本情況進行可視化展示,其中包括地理區(qū)位、自然條件、政策稱號等基本屬性標簽和產(chǎn)業(yè)、人口等部分狀態(tài)屬性標簽的內(nèi)容。對于地理區(qū)位標簽,對鄉(xiāng)村行政區(qū)劃的邊界、行政區(qū)劃的面積以及在上級行政區(qū)劃中的位置進行展示,借助地圖對鄉(xiāng)村地理位置進行明確展示。同時在地圖中對鄉(xiāng)村人口、用地、政策稱號等內(nèi)容進行文字說明。此外,對于鄉(xiāng)村發(fā)展重要的、特殊的自然條件,如江河、煤礦、氣候等標簽,也可在地圖上標識展示。

        (2)鄉(xiāng)村畫像之大數(shù)據(jù)詞云圖方法

        “詞云”這一概念由美國西北大學(xué)新聞學(xué)副教授、新媒體專業(yè)主任里奇·戈登提出,是對網(wǎng)絡(luò)文本中出現(xiàn)頻率較高的“關(guān)鍵詞”予以視覺上的突出,形成“關(guān)鍵詞云層”或“關(guān)鍵詞渲染”,從而過濾掉大量的文本信息,使瀏覽網(wǎng)頁者通過詞云就可以領(lǐng)略文本的主旨。當前詞云圖被大量應(yīng)用在對政策要聞等詞頻的統(tǒng)計中。

        在鄉(xiāng)村畫像領(lǐng)域,將引入詞云圖對鄉(xiāng)村的諸多標簽進行詞云可視化展示。與當前詞頻統(tǒng)計畫像不同,鄉(xiāng)村畫像詞云圖以各標簽無量綱化處理后的標簽值進行畫像。在無量綱化處理時,采用“累積分布函數(shù)×100”的方法進行無量綱化處理,即將原始數(shù)據(jù)減去均值后除以標準差后的值,放入正態(tài)分布的累積分布函數(shù)中計算函數(shù)值,并將函數(shù)值乘以100。這種處理方法將原始數(shù)據(jù)映射在區(qū)間(0,100),能較好地保持各鄉(xiāng)村標簽值之間的差距,其中得分接近100代表標簽屬性具有突出性特征,得分接近0代表標簽特征不明顯。經(jīng)過無量綱化處理后的得分數(shù)據(jù),可實現(xiàn)對鄉(xiāng)村上百個標簽的同時展示。

        (3)鄉(xiāng)村畫像之大數(shù)據(jù)綜合圖方法

        鄉(xiāng)村畫像大數(shù)據(jù)綜合圖將鄉(xiāng)村地圖、鄉(xiāng)村畫像詞云圖、數(shù)據(jù)表、統(tǒng)計圖等多種圖表分析的可視化方法進行綜合運用,基于鄉(xiāng)村大數(shù)據(jù)條件,充分發(fā)揮各類統(tǒng)計圖表的優(yōu)勢,科學(xué)設(shè)計綜合圖的可視化展示內(nèi)容、展示形式和展示布局,最終提供大數(shù)據(jù)鄉(xiāng)村畫像的綜合圖。

        5.3 大數(shù)據(jù)鄉(xiāng)村畫像舉例

        借助第三次全國農(nóng)業(yè)普查的普查表和非傳統(tǒng)的鄉(xiāng)村數(shù)據(jù),對鄉(xiāng)村微觀的各項指標數(shù)據(jù)進行模擬,并以此作為大數(shù)據(jù)畫像可視化基礎(chǔ)。在模擬數(shù)據(jù)的基礎(chǔ)上,依據(jù)鄉(xiāng)村基本屬性標簽體系、狀態(tài)屬性標簽體系和行為屬性標簽體系,對數(shù)據(jù)進行加工處理,繪制鄉(xiāng)村地圖、詞云圖以及各項統(tǒng)計圖,最終確定大數(shù)據(jù)鄉(xiāng)村畫像,如圖5所示。

        鄉(xiāng)村地圖的可視化部分布置在大數(shù)據(jù)畫像圖的左上角,采用地圖與實景圖相結(jié)合的方式,在構(gòu)建系統(tǒng)時可通過鼠標點擊實現(xiàn)地圖和實景圖之間的切換,其中,在地圖層面,對鄉(xiāng)村的基本屬性標簽和部分狀態(tài)屬性標簽進行標識。鄉(xiāng)村畫像標簽詞云圖部分布置在大數(shù)據(jù)畫像圖的左下角兩塊區(qū)域:一是大數(shù)據(jù)詞云圖,將對原始數(shù)據(jù)、狀態(tài)標簽、行為標簽中的定量數(shù)據(jù)進行加工處理,生成數(shù)百個鄉(xiāng)村畫像標簽,進行詞云展示;二是將詞云圖中標簽值小、肉眼難以識別的標簽提取出來,單獨列為“鄉(xiāng)村振興有待提升標簽”,以數(shù)據(jù)表格的形式進行展示。狀態(tài)屬性標簽可視化部分布置在大數(shù)據(jù)畫像圖的右上角,分別對鄉(xiāng)村規(guī)模、速度、結(jié)構(gòu)、效率采用“標簽(省內(nèi)Top10等)+傳統(tǒng)統(tǒng)計圖”的方式進行可視化展現(xiàn)。行為標簽可視化部分布置在大數(shù)據(jù)畫像圖的右下角,對于行為標簽各維度的標簽值進行可視化顯示。最后,在右側(cè)中間位置,基于3套標簽體系,合成鄉(xiāng)村振興推進水平指數(shù),從5個維度對本鄉(xiāng)村與全省水平進行可視化比較展示。

        6 結(jié)束語

        大數(shù)據(jù)畫像技術(shù)是一種描述事物全貌、挖掘事物特征、發(fā)現(xiàn)事物發(fā)展規(guī)律的重要技術(shù),在鄉(xiāng)村畫像領(lǐng)域具有廣闊的應(yīng)用前景。本文創(chuàng)新性地構(gòu)建了鄉(xiāng)村畫像概念模型、標簽體系,明確了大數(shù)據(jù)鄉(xiāng)村畫像的實施算法,設(shè)計了鄉(xiāng)村畫像的可視化形式,為大數(shù)據(jù)鄉(xiāng)村畫像奠定了理論與實踐的基礎(chǔ)。大數(shù)據(jù)畫像的結(jié)果可直接用于評價鄉(xiāng)村振興效果為鄉(xiāng)村振興前期發(fā)展規(guī)劃、發(fā)展路徑的制定和實施提供決策參考。但是,大數(shù)據(jù)畫像工作仍然面臨著諸多挑戰(zhàn)。未來,大數(shù)據(jù)鄉(xiāng)村畫像實踐工作的研究,可以從以下幾個方面展開。

        一是系統(tǒng)性梳理鄉(xiāng)村大數(shù)據(jù)源,對數(shù)字鄉(xiāng)村建設(shè)中產(chǎn)生的鄉(xiāng)村大數(shù)據(jù)進行前瞻性設(shè)計。鄉(xiāng)村大數(shù)據(jù)是鄉(xiāng)村畫像的基礎(chǔ)。突破當前以農(nóng)業(yè)科學(xué)大數(shù)據(jù)為核心,以輔助農(nóng)業(yè)科研、生產(chǎn)、加工、銷售為目的建設(shè)農(nóng)業(yè)大數(shù)據(jù)庫的思想,將農(nóng)業(yè)大數(shù)據(jù)的建設(shè)擴展到鄉(xiāng)村大數(shù)據(jù)建設(shè),對農(nóng)業(yè)之外的其他鄉(xiāng)村大數(shù)據(jù)源進行系統(tǒng)性梳理,預(yù)判和規(guī)劃數(shù)字鄉(xiāng)村建設(shè)的數(shù)據(jù)內(nèi)容,深入研究鄉(xiāng)村大數(shù)據(jù)的應(yīng)用方向,推進鄉(xiāng)村大數(shù)據(jù)的應(yīng)用方向從農(nóng)業(yè)精準生產(chǎn)到鄉(xiāng)村振興精準管理與規(guī)劃的跨越式發(fā)展。

        二是構(gòu)建鄉(xiāng)村畫像知識圖譜體系,進一步擴充鄉(xiāng)村畫像的標簽體系。知識圖譜是智能化開展大數(shù)據(jù)鄉(xiāng)村畫像的關(guān)鍵。對于標簽擴展和標簽泛化,均依賴于知識圖譜,而當前鄉(xiāng)村研究領(lǐng)域尚未發(fā)現(xiàn)相關(guān)知識圖譜的構(gòu)建。鄉(xiāng)村畫像知識圖譜的構(gòu)建是一項系統(tǒng)工程,應(yīng)在對鄉(xiāng)村大數(shù)據(jù)、自然資源、鄉(xiāng)村經(jīng)濟和社會活動、國家政策之間的關(guān)系進行系統(tǒng)性梳理的基礎(chǔ)上展開。

        三是建立大數(shù)據(jù)鄉(xiāng)村畫像的標簽篩選機制。標簽篩選機制是鄉(xiāng)村畫像工作順利進行的必要保障,從初始的鄉(xiāng)村大數(shù)據(jù)中可以提取大量的原始標簽,而借助知識圖譜技術(shù)又可以擴展和泛化出新的標簽,標簽數(shù)量可達數(shù)百個,且隨著數(shù)字鄉(xiāng)村工作的開展,鄉(xiāng)村大數(shù)據(jù)數(shù)據(jù)量不斷增加,標簽的數(shù)量也將不斷增加,可達上千個,如不建立標簽篩選機制,直接將全部標簽進行畫像展示,不僅不能通過畫像刻畫鄉(xiāng)村的特征,而且會陷入標簽災(zāi)難,鑒于此,標簽篩選機制在未來也將是一項重要的工作。

        四是探索大數(shù)據(jù)鄉(xiāng)村畫像的監(jiān)測預(yù)警體系。監(jiān)測預(yù)警是鄉(xiāng)村畫像的重要應(yīng)用方向。將電商、金融領(lǐng)域成功運用的用戶畫像預(yù)測分析方法,尤其是把k-means、決策樹、支持向量機等機器學(xué)習(xí)方法引入鄉(xiāng)村畫像體系之中,通過構(gòu)建相應(yīng)的模型算法,實現(xiàn)對鄉(xiāng)村經(jīng)濟社會發(fā)展的監(jiān)測預(yù)警,為政府進行政策調(diào)整提供理論依據(jù)。

        一边捏奶头一边高潮视频| 国产精品一区区三区六区t区| 日本在线观看一区二区三区视频 | 亚洲国产成a人v在线观看| 亚洲av网一区二区三区成人| 欧美牲交a欧美牲交aⅴ免费下载 | 天堂资源中文最新版在线一区| 中国一级毛片在线观看| 精品熟妇av一区二区三区四区| 亚洲视频免费在线观看| 国产草草影院ccyycom| 国产亚洲日韩欧美久久一区二区| 国产一区二区三区高清视频| 国产一区二区av免费观看| 亚洲一区二区三区香蕉| 亚洲色欲在线播放一区| 蜜桃网站在线免费观看视频| 中文字幕中文字幕在线中二区| 亚洲综合av一区二区三区| 免费的毛片视频| 中文字幕国产精品专区| 亚洲国产精品无码一线岛国| 九九99久久精品国产| 日韩在线视精品在亚洲| 三级国产自拍在线观看| 免费看又色又爽又黄的国产软件 | 人妻色综合网站| 国产精品欧美日韩在线一区| 给我播放的视频在线观看| 日韩日韩日韩日韩日韩日韩日韩| 久久精品国产亚洲av大全| 福利网在线| 一区二区在线观看日本视频| 99久久精品午夜一区二区| 一区二区三区日韩亚洲中文视频| 午夜亚洲精品视频网站| 国产亚洲欧洲aⅴ综合一区| 欧美性videos高清精品| 日本一区二区国产高清在线播放| 亚洲va视频一区二区三区| 97人妻碰碰视频免费上线|