余吳浩淼,劉 倫,曾繁如,高雪松,田兆楠,陳 卓
(1.四川農(nóng)業(yè)大學(xué)資源學(xué)院,成都 611130; 2.北京大學(xué)政府管理學(xué)院,北京 100871; 3. 四川水利職業(yè)技術(shù)學(xué)院,成都 611800)
【研究意義】通信基建與電子設(shè)備的普及使得運(yùn)用大數(shù)據(jù)研究“三農(nóng)”問題成為可能。大數(shù)據(jù)作為新的數(shù)據(jù)來源,為“三農(nóng)”問題研究提供了新的研究方式。因此,總結(jié)分析基于大數(shù)據(jù)應(yīng)用的“三農(nóng)”問題研究現(xiàn)狀,對于了解該領(lǐng)域研究重點(diǎn)與未來方向具有重要意義?!厩叭搜芯窟M(jìn)展】隨著信息技術(shù)和物聯(lián)網(wǎng)技術(shù)的發(fā)展與普及,人類社會產(chǎn)生的數(shù)據(jù)量呈現(xiàn)出爆炸性增長的趨勢。這種大容量、多樣性、綜合性的數(shù)據(jù)流改變了人們的生活方式,也成為了科學(xué)研究的關(guān)注熱點(diǎn)[1]。相比于傳統(tǒng)數(shù)據(jù),大數(shù)據(jù)在內(nèi)容上呈現(xiàn)出樣本量大、動態(tài)實(shí)時、詳細(xì)微觀等特點(diǎn),為解決現(xiàn)實(shí)問題提供了新的方向[2]。由于其特征與區(qū)域問題的解決有緊密的關(guān)聯(lián),大數(shù)據(jù)在近十年來被大量引入城市區(qū)域研究領(lǐng)域,國內(nèi)外學(xué)者已經(jīng)在居民時空行為[3]、城市功能分區(qū)[4]、城市空間聯(lián)系[5]及智慧城市建設(shè)[6]等方面取得了進(jìn)展。然而,針對于與城市相對應(yīng)的農(nóng)村區(qū)域,受限于數(shù)據(jù)覆蓋率與數(shù)據(jù)質(zhì)量,研究相對較少。但近年來,電子設(shè)備的日益普及與政府的基礎(chǔ)設(shè)施投資使得在農(nóng)村區(qū)域運(yùn)用大數(shù)據(jù)進(jìn)行研究成為可能。特別是我國政府相當(dāng)重視新時期農(nóng)村建設(shè),發(fā)布了《數(shù)字農(nóng)村發(fā)展戰(zhàn)略綱要》,提出要建設(shè)數(shù)字鄉(xiāng)村,加快農(nóng)村信息發(fā)展,縮小城鄉(xiāng)數(shù)字鴻溝。目前,我國已累計支持13萬個行政村光纖網(wǎng)絡(luò)建設(shè),農(nóng)村及偏遠(yuǎn)地區(qū)3.7萬個4G基站建設(shè),全國行政村通光纖、通4G比例均超過98%。截至2020年3月,我國農(nóng)村地區(qū)互聯(lián)網(wǎng)普及率達(dá)到了46.2%[7]。這樣領(lǐng)先的農(nóng)村網(wǎng)絡(luò)覆蓋為我國農(nóng)村區(qū)域進(jìn)行大數(shù)據(jù)研究提供了可靠的基礎(chǔ)條件。學(xué)者們應(yīng)用大數(shù)據(jù)對我國農(nóng)村區(qū)域存在的農(nóng)業(yè)、農(nóng)村、農(nóng)民的“三農(nóng)”問題展開研究,并取得了一些進(jìn)展[8-10],為傳統(tǒng)“三農(nóng)”問題研究注入了新的研究視角與研究范式?!颈狙芯壳腥朦c(diǎn)】基于大數(shù)據(jù)應(yīng)用的我國“三農(nóng)”問題研究尚處于起步階段,且對該領(lǐng)域研究的綜述總結(jié)還比較有限?!緮M解決的關(guān)鍵問題】本研究分析了“三農(nóng)”問題研究中常用大數(shù)據(jù)數(shù)據(jù)類型與數(shù)據(jù)質(zhì)量,從農(nóng)業(yè)問題研究、農(nóng)村問題研究、農(nóng)民問題研究三個方面等對大數(shù)據(jù)在“三農(nóng)”問題研究中的應(yīng)用進(jìn)行了綜述,并討論了該研究領(lǐng)域未來可能的方向與挑戰(zhàn),旨在為相關(guān)研究提供參考。
雖然近年來大數(shù)據(jù)才逐漸成為研究熱點(diǎn),但早在20世紀(jì)80年代,大數(shù)據(jù)一詞就已經(jīng)出現(xiàn)在美國社會學(xué)家阿爾文·托夫勒的著作中[11]。大數(shù)據(jù),顧名思義,是指規(guī)模較大的數(shù)據(jù)。目前學(xué)界對大數(shù)據(jù)的概念暫無統(tǒng)一定義,許多機(jī)構(gòu)與學(xué)者從不同角度進(jìn)行了定義,如加特納(Gartner)咨詢公司將大數(shù)據(jù)定義為“高容量、高速度、多樣性的信息資產(chǎn),需要高效、創(chuàng)新的信息處理方式,以實(shí)現(xiàn)認(rèn)知與決策的提升以及流程的自動化”,其中高容量(Volume)、多樣性(Variety)、高速度(Velocity)也被廣泛認(rèn)為是大數(shù)據(jù)的“3‘V’特征”[12],在此基礎(chǔ)上也延展出如變化性(Variability)、真實(shí)性(Veracity)、有效性(Validity)等更多的‘V’字特征。隨著應(yīng)用范圍的不斷擴(kuò)展,大數(shù)據(jù)的內(nèi)涵也變得更加豐富。外國學(xué)者研究指出“大數(shù)據(jù)并不在于其數(shù)據(jù)規(guī)模之大,更重要的是其搜索、匯集、交互數(shù)據(jù)的能力”[13],并將量級較小的公共部門管理數(shù)據(jù)納入大數(shù)據(jù)范疇[14]?;谶@些研究,本文認(rèn)為大數(shù)據(jù)是指“既包括公共部門主動采集的、高度結(jié)構(gòu)化的管理數(shù)據(jù),也包括由機(jī)構(gòu)與個人的互聯(lián)網(wǎng)活動被動產(chǎn)生的、持續(xù)、自動出現(xiàn)的結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的大量數(shù)據(jù)”。
關(guān)于大數(shù)據(jù)的類型劃分有多種方式,如按數(shù)據(jù)結(jié)構(gòu)可劃分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。本文選擇采用與研究應(yīng)用關(guān)聯(lián)更為直接的數(shù)據(jù)來源進(jìn)行劃分,將“三農(nóng)”問題研究中常用的大數(shù)據(jù)分為互聯(lián)網(wǎng)使用數(shù)據(jù)、通訊傳感設(shè)備數(shù)據(jù)、地圖空間數(shù)據(jù)以及機(jī)構(gòu)管理運(yùn)行數(shù)據(jù)四類。下文將對四類數(shù)據(jù)的具體來源以及在農(nóng)村地區(qū)的可獲得性與數(shù)據(jù)質(zhì)量進(jìn)行分析(表1)。
表1 常用大數(shù)據(jù)類型在鄉(xiāng)村地區(qū)的質(zhì)量評價
隨著互聯(lián)網(wǎng)的普及,互聯(lián)網(wǎng)使用數(shù)據(jù)量激增。據(jù)統(tǒng)計,百度日均搜索量已達(dá)50億次,微博日均內(nèi)容發(fā)布量超2.5億,這些都屬于互聯(lián)網(wǎng)使用數(shù)據(jù)的范疇?;ヂ?lián)網(wǎng)使用數(shù)據(jù)主要包括社交媒體數(shù)據(jù)、網(wǎng)頁閱覽數(shù)據(jù)、搜索數(shù)據(jù)、用戶上傳的圖片、音頻、視頻數(shù)據(jù)等內(nèi)容。互聯(lián)網(wǎng)使用數(shù)據(jù)在情報學(xué)[15]、經(jīng)濟(jì)學(xué)[16]、規(guī)劃學(xué)[17]等多領(lǐng)域內(nèi)均有廣泛運(yùn)用。一些互聯(lián)網(wǎng)使用數(shù)據(jù)也包含了定位數(shù)據(jù),這有助于研究用戶的活動軌跡[18]。我國農(nóng)村地區(qū)互聯(lián)網(wǎng)覆蓋率較高,信號穩(wěn)定,全國行政村通光纖、通4G比例均超過98%;互聯(lián)網(wǎng)用戶較多,我國農(nóng)村網(wǎng)民規(guī)模為2.55億,農(nóng)村互聯(lián)網(wǎng)普及率達(dá)46.2%;年齡結(jié)構(gòu)方面我國網(wǎng)民主要集中在10~49歲,占網(wǎng)民群體的79.2%,10歲以下與50歲及以上的網(wǎng)民較少,占20.8%;我國農(nóng)村居民的互聯(lián)網(wǎng)使用率雖然不及城市地區(qū),但也具備了較高的數(shù)據(jù)覆蓋程度。由于互聯(lián)網(wǎng)數(shù)據(jù)主要來自于API下載與網(wǎng)頁抓取,因此可獲取性與城市居民的互聯(lián)網(wǎng)使用數(shù)據(jù)差異不大。事實(shí)上,現(xiàn)有的基于互聯(lián)網(wǎng)數(shù)據(jù)的研究往往并不專門區(qū)分城市與農(nóng)村用戶,但尚未見到采用互聯(lián)網(wǎng)數(shù)據(jù)對農(nóng)村問題進(jìn)行的針對性研究。需要注意的是,農(nóng)村居民的互聯(lián)網(wǎng)使用習(xí)慣可能與城市居民有所差異,包括所訪問的網(wǎng)站、所使用的網(wǎng)站功能等。
通訊傳感設(shè)備數(shù)據(jù)類型眾多,常見數(shù)據(jù)包括手機(jī)通訊、定位數(shù)據(jù)、道路交通傳感數(shù)據(jù)、車載GPS定位數(shù)據(jù)、空氣質(zhì)量監(jiān)測數(shù)據(jù)等。通訊設(shè)備數(shù)據(jù)主要來自手機(jī)使用,可提供手機(jī)用戶的活動軌跡與通訊聯(lián)系,對于精細(xì)化捕捉人類活動規(guī)律、識別人類活動模式發(fā)揮了巨大作用;傳感設(shè)備數(shù)據(jù)來源于各類傳感器,如用于感知道路車輛數(shù)量的壓力傳感器、用于感知空氣質(zhì)量的化學(xué)物質(zhì)傳感等。農(nóng)村區(qū)域的傳感器數(shù)據(jù)主要掌握在農(nóng)業(yè)企業(yè)、科研機(jī)構(gòu)及政府部門等機(jī)構(gòu)內(nèi),目前主要應(yīng)用于農(nóng)業(yè)生產(chǎn)監(jiān)測與環(huán)境監(jiān)測方面。
手機(jī)使用數(shù)據(jù)因其高覆蓋率、高精度、高時效性的特點(diǎn)成為了大數(shù)據(jù)研究的重要數(shù)據(jù)來源,是人口、交通、城鄉(xiāng)規(guī)劃等領(lǐng)域的關(guān)注熱點(diǎn)[19],一般獲取自通訊運(yùn)營商或采集手機(jī)GPS信息的APP運(yùn)營管理方,與城市范圍內(nèi)的數(shù)據(jù)獲取方式無本質(zhì)差異,因此影響農(nóng)村研究中手機(jī)通訊數(shù)據(jù)應(yīng)用性的因素主要為手機(jī)用戶的覆蓋率以及手機(jī)定位精度。據(jù)2019年中國統(tǒng)計年鑒顯示我國農(nóng)村居民每百戶擁有257部手機(jī)[20],農(nóng)村地區(qū)手機(jī)擁有量高。全國行政村通4G比例超過98%,手機(jī)信號覆蓋率高。定位精度方面,由于農(nóng)村地區(qū)人口與手機(jī)基站布局相對稀疏,手機(jī)定位精度相較于城市區(qū)域較低,精度大約在1~2 km[21]。
地理空間大數(shù)據(jù)包括開放地圖數(shù)據(jù)、興趣點(diǎn)數(shù)據(jù)、街景圖片數(shù)據(jù)、夜間燈光數(shù)據(jù)等數(shù)據(jù)。這些數(shù)據(jù)已被大量應(yīng)用于城市研究,在城市熱點(diǎn)區(qū)域識別、建成區(qū)邊界識別、城市空間結(jié)構(gòu)分析等方面產(chǎn)生了大量研究成果[22-23]。目前尚未見到此類數(shù)據(jù)應(yīng)用于農(nóng)村研究的文獻(xiàn),很大程度上在于這類數(shù)據(jù)的采集往往涉及現(xiàn)場作業(yè),如開放地圖(Open Street Map)的貢獻(xiàn)者手持GPS進(jìn)行現(xiàn)場記錄,街景采集車在相關(guān)道路進(jìn)行實(shí)際行駛,因此這類數(shù)據(jù)在農(nóng)村地區(qū)的覆蓋率仍明顯低于城市地區(qū)。以四川省人口最多的5個地級市為例,根據(jù)百度地圖提供的街景圖片服務(wù)可以看出,農(nóng)村區(qū)域街景圖片覆蓋率顯著低于城市,覆蓋率約為10%,各市之間農(nóng)村覆蓋率差異不大。我國其他區(qū)域農(nóng)村街景圖片覆蓋情況還有待進(jìn)一步研究。夜間燈光數(shù)據(jù)主要通過遙感衛(wèi)星進(jìn)行收集,在覆蓋率與數(shù)據(jù)質(zhì)量方面好于其他地圖空間數(shù)據(jù)。但目前常用的夜間燈光數(shù)據(jù)的分辨率為1 km×1 km,運(yùn)用在空間尺度相對較小的農(nóng)村區(qū)域效果較差。綜合來講,除夜間燈光數(shù)據(jù)以外,此類數(shù)據(jù)在農(nóng)村區(qū)域的覆蓋率還較低,有待未來在數(shù)據(jù)可獲得性方面的進(jìn)一步發(fā)展。
機(jī)構(gòu)管理運(yùn)行數(shù)據(jù)指政府、企業(yè)等各類機(jī)構(gòu)運(yùn)行中產(chǎn)生的數(shù)據(jù),包含稅收數(shù)據(jù)、行政處罰數(shù)據(jù)、銀行轉(zhuǎn)賬數(shù)據(jù)等。雖然就數(shù)據(jù)規(guī)模而言這類數(shù)據(jù)并非嚴(yán)格意義上的大數(shù)據(jù),但考慮到這類數(shù)據(jù)經(jīng)過長期積累也提供了可觀的信息量,因此在社會科學(xué)研究經(jīng)常也將其納入大數(shù)據(jù)范疇[24]。這類數(shù)據(jù)一方面反映了農(nóng)村中各類組織機(jī)構(gòu)的運(yùn)行管理狀況,另一方面也提供了關(guān)于個體活動與社會經(jīng)濟(jì)系統(tǒng)運(yùn)行的豐富信息。隨著我國數(shù)據(jù)開放進(jìn)程的不斷推進(jìn),我國已有82個地方政府建立了政府?dāng)?shù)據(jù)開放平臺,但關(guān)于農(nóng)業(yè)農(nóng)村的數(shù)據(jù)集數(shù)量較少,僅占所有數(shù)據(jù)集的5.2%[25],也有待未來進(jìn)一步整理與公開。
“三農(nóng)”問題是指我國經(jīng)濟(jì)社會發(fā)展過程中出現(xiàn)的農(nóng)業(yè)、農(nóng)村、農(nóng)民這三個問題[26]。自1996年溫鐵軍教授最早提出“三農(nóng)”問題以來,“三農(nóng)”問題一直備受關(guān)注,數(shù)次登上政府工作報告與中央一號文件,其重要性也逐漸上升至“全黨工作的重中之重”。我國學(xué)術(shù)界針對“三農(nóng)”問題開展了大量研究,取得了一些成果。隨著農(nóng)村基礎(chǔ)設(shè)施的不斷完善,“三農(nóng)”大數(shù)據(jù)成為“三農(nóng)”問題研究新的數(shù)據(jù)來源,為“三農(nóng)”問題研究提供了新的研究范式與研究視角。
隨著信息化與農(nóng)業(yè)現(xiàn)代化的不斷推進(jìn),大數(shù)據(jù)與農(nóng)業(yè)的深度融合在促進(jìn)農(nóng)業(yè)生產(chǎn)、解決我國農(nóng)業(yè)問題方面顯示出了明顯潛力。我國政府先后出臺了《關(guān)于促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》《農(nóng)業(yè)部關(guān)于推進(jìn)農(nóng)業(yè)農(nóng)村大數(shù)據(jù)發(fā)展的實(shí)施意見》《農(nóng)業(yè)農(nóng)村大數(shù)據(jù)試點(diǎn)方案》等文件和政策,積極推動大數(shù)據(jù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用。類似的,英國政府也出臺了《英國農(nóng)業(yè)技術(shù)戰(zhàn)略》,特別提到了大數(shù)據(jù)在推動農(nóng)業(yè)領(lǐng)域創(chuàng)新中的重要作用[27],美國政府將包括農(nóng)業(yè)生產(chǎn)、糧食安全、農(nóng)村發(fā)展、自然資源等在內(nèi)的農(nóng)業(yè)數(shù)據(jù)公開,鼓勵企業(yè)與科研機(jī)構(gòu)進(jìn)行相關(guān)研究。
大數(shù)據(jù)可用于農(nóng)業(yè)生產(chǎn)的全過程中,國內(nèi)外學(xué)者圍繞氣象預(yù)報、水肥管理、作物育種、病蟲害預(yù)報、高效養(yǎng)殖等方面已經(jīng)開展了大量的研究,如Tesfaye等[28]利用地理大數(shù)據(jù)對非洲南部的干旱情況進(jìn)行分析,并對耐旱玉米品種在此環(huán)境下的表現(xiàn)進(jìn)行評估,結(jié)果表明,耐旱品種玉米在干旱環(huán)境下的產(chǎn)量優(yōu)勢可能比一般品種高5%~40%;Bendre等[29]提出通過信息和通信技術(shù)服務(wù)來收集大量數(shù)據(jù),利用程序模型和分布式算法對天氣數(shù)據(jù)處理和預(yù)報應(yīng)用進(jìn)行了討論,以預(yù)警氣象災(zāi)害與病蟲害,提高農(nóng)作物產(chǎn)量,降低農(nóng)戶生產(chǎn)風(fēng)險;Mabalay等[30]基于遙感圖像與作物生長狀況等數(shù)據(jù)開發(fā)了國家水稻系統(tǒng),以預(yù)估糧食產(chǎn)量,保障糧食安全,研究在菲律賓萊特地區(qū)進(jìn)行了系統(tǒng)模擬 ;Wolfert等[31]綜合過往研究,分析了大數(shù)據(jù)在智慧農(nóng)業(yè)中的驅(qū)動力,將農(nóng)業(yè)生產(chǎn)中產(chǎn)生的大數(shù)據(jù)分為過程中介數(shù)據(jù)(PM)、機(jī)器生成數(shù)據(jù)(MG)和人為源數(shù)據(jù)(HS)三類,并討論了大數(shù)據(jù)的應(yīng)用過程。相關(guān)研究也在業(yè)界獲得了實(shí)際應(yīng)用,形成了一些大數(shù)據(jù)現(xiàn)代化農(nóng)業(yè)成果,如美國孟山都公司通過土壤傳感器收集田間數(shù)據(jù),結(jié)合種子數(shù)據(jù)庫、土壤數(shù)據(jù)庫和基因數(shù)據(jù)庫等多源數(shù)據(jù),建設(shè)了一體化農(nóng)田耕作系統(tǒng),通過手機(jī)農(nóng)業(yè)大數(shù)據(jù)軟件為農(nóng)戶提供農(nóng)業(yè)服務(wù)[32];美國Trimble公司開發(fā)了網(wǎng)絡(luò)農(nóng)場系統(tǒng),對精準(zhǔn)農(nóng)業(yè)數(shù)據(jù)進(jìn)行計算分析,可以進(jìn)行農(nóng)業(yè)自動作業(yè)管理,為農(nóng)戶提供了全面的農(nóng)業(yè)解決方案[33]。
我國大數(shù)據(jù)農(nóng)業(yè)現(xiàn)代化研究起步晚于國外,也取得了一定成果。如杜克明[8]基于物聯(lián)網(wǎng),研究了小麥生產(chǎn)過程中的大數(shù)據(jù)獲取,為小麥生產(chǎn)管理與災(zāi)害防控提供了依據(jù);楊波等[34]運(yùn)用氣象大數(shù)據(jù)對山東省二代玉米螟的發(fā)生程度進(jìn)行預(yù)測,建立了玉米螟動態(tài)氣候預(yù)測模型;郭峰[35]利用大蒜產(chǎn)業(yè)大數(shù)據(jù),對大蒜價格波動的主要影響因素進(jìn)行了分析,研究了大蒜價格變化趨勢的預(yù)測辦法,并構(gòu)建了大蒜價格可視化系統(tǒng);王東杰[36]利用多源大數(shù)據(jù)構(gòu)建了大數(shù)據(jù)支撐的糧食安全理性預(yù)期預(yù)警理論,開展了玉米供需預(yù)測模擬分析。在實(shí)踐領(lǐng)域,目前我國已經(jīng)形成了國家農(nóng)業(yè)數(shù)據(jù)中心、國家農(nóng)業(yè)科學(xué)數(shù)據(jù)共享中心、全國農(nóng)技推廣信息平臺等農(nóng)業(yè)大數(shù)據(jù)平臺[37],各省市也開展了相關(guān)實(shí)踐,如貴陽市整合了農(nóng)業(yè)產(chǎn)業(yè)鏈資源,建成了貴陽現(xiàn)代農(nóng)業(yè)大數(shù)據(jù)交易中心[38]。
總體而言,大數(shù)據(jù)已被應(yīng)用于農(nóng)業(yè)生產(chǎn)監(jiān)測與產(chǎn)量提升、農(nóng)產(chǎn)品市場趨勢預(yù)測等農(nóng)業(yè)生產(chǎn)、經(jīng)營的各個環(huán)節(jié),其中農(nóng)業(yè)大數(shù)據(jù)的采集涉及農(nóng)田傳感器等大量新型農(nóng)業(yè)數(shù)字基礎(chǔ)設(shè)施的部署,隨著我們數(shù)字農(nóng)村戰(zhàn)略的推動,未來農(nóng)業(yè)相關(guān)大數(shù)據(jù)的來源類型與覆蓋率有可能不斷提升,也將為農(nóng)業(yè)大數(shù)據(jù)分析應(yīng)用提供更多支撐條件。
因大數(shù)據(jù)中包含大量的定位數(shù)據(jù),現(xiàn)有研究應(yīng)用大數(shù)據(jù)對農(nóng)村空間問題進(jìn)行研究。農(nóng)村空間是生產(chǎn)、生態(tài)和生活空間的統(tǒng)一體,農(nóng)村聚落的空間結(jié)構(gòu)、空間演變特征和空間優(yōu)化等研究內(nèi)容對于支撐農(nóng)村社會經(jīng)濟(jì)發(fā)展以及美麗鄉(xiāng)村建設(shè)有著重要意義。
國外學(xué)者借助手機(jī)信令數(shù)據(jù)等大數(shù)據(jù),結(jié)合復(fù)雜網(wǎng)絡(luò)理論,從不同角度對村鎮(zhèn)空間聯(lián)系進(jìn)行了分析,為鄉(xiāng)村規(guī)劃提供支撐,如Servillo等[39]基于通勤數(shù)據(jù)對意大利皮埃蒙特區(qū)37個微觀區(qū)域中心進(jìn)行研究,分析了不同等級中小村鎮(zhèn)聯(lián)系的網(wǎng)絡(luò)結(jié)構(gòu)。我國學(xué)者鈕心毅等[40]基于杭州桐廬縣和上海奉賢區(qū)的撤制鎮(zhèn)2個研究實(shí)例,分析了移動定位大數(shù)據(jù)在鄉(xiāng)村空間研究中的2個使用場合,提出了移動大數(shù)據(jù)在鄉(xiāng)村空間研究中存在時空分辨率與設(shè)備普及率2個技術(shù)阻礙。趙渺希等[9]以中山三鄉(xiāng)鎮(zhèn)為例,利用手機(jī)信令數(shù)據(jù)測算了村鎮(zhèn)聚落的多層級網(wǎng)絡(luò)聯(lián)系,結(jié)合自容性、群集性、網(wǎng)絡(luò)效率等指標(biāo)對村鎮(zhèn)聚落的網(wǎng)絡(luò)結(jié)構(gòu)特征進(jìn)行分析,結(jié)果表明,三鄉(xiāng)鎮(zhèn)呈現(xiàn)簇群式的空間聯(lián)系結(jié)構(gòu),具有自上而下的垂直聯(lián)系和多層級相互交織的復(fù)雜網(wǎng)絡(luò)特征。圖爾蓀阿依·如孜等[41]基于人口密度數(shù)據(jù)與夜間燈光數(shù)據(jù)對新疆鄉(xiāng)村聚落的空間變化與演變特征進(jìn)行研究,結(jié)果表明新疆南部、東部和北部地區(qū)鄉(xiāng)村聚落在空間分布、擴(kuò)張強(qiáng)度和空間演變程度等方面存在差異。周祥勝[42]將對廣東省四會市農(nóng)村空心化進(jìn)行了研究,利用居民月度用電數(shù)據(jù)在內(nèi)的多源數(shù)據(jù)建立了自然村空心化的分類判別方法,對自然村空心化進(jìn)行了綜合評價。
目前基于大數(shù)據(jù)的農(nóng)村問題研究主要側(cè)重對農(nóng)村發(fā)展的現(xiàn)狀刻畫,特別是對農(nóng)村空間環(huán)境的評估,可以發(fā)現(xiàn)大量實(shí)際社會經(jīng)濟(jì)活動驅(qū)動下的農(nóng)村空間結(jié)構(gòu)與體系。未來研究可進(jìn)一步關(guān)注問題與政策導(dǎo)向,在現(xiàn)狀描述的基礎(chǔ)上對農(nóng)村發(fā)展政策涉及的關(guān)鍵問題展開研究,如農(nóng)村人居環(huán)境質(zhì)量的監(jiān)測等,為相關(guān)政策制定提供更加直接的支撐。
農(nóng)民是農(nóng)業(yè)生產(chǎn)與農(nóng)村生活的主要參與者,“三農(nóng)”問題的核心是農(nóng)民問題[43]。以人為本,尊重農(nóng)民意愿,真正了解農(nóng)民心中所想、所需,對于解決“三農(nóng)”問題有重要意義。隨著信息技術(shù)與物聯(lián)網(wǎng)技術(shù)的發(fā)展,大數(shù)據(jù)分析成為精準(zhǔn)了解農(nóng)民需求的重要方式。
一方面,應(yīng)用大數(shù)據(jù)有助于精準(zhǔn)了解農(nóng)民時空行為。農(nóng)民時空活動是農(nóng)村自然資源系統(tǒng)演變的重要驅(qū)動力,也是農(nóng)村復(fù)雜社會經(jīng)濟(jì)問題的體現(xiàn)。傳統(tǒng)農(nóng)民時空行為研究通常采用傳統(tǒng)調(diào)查方法獲取數(shù)據(jù),這種方式具有成本高、樣本少、存在主觀回憶或敘述偏差等缺陷。大數(shù)據(jù)技術(shù)的快速發(fā)展尤其是手機(jī)定位數(shù)據(jù)為研究農(nóng)民時空行為提供了新的數(shù)據(jù)來源。
大數(shù)據(jù)在市民時空行為領(lǐng)域已獲得了大量應(yīng)用,包括分析市民出行規(guī)律特征、得到其時空行為模式等,但在農(nóng)村地區(qū)的相關(guān)研究還方興未艾。Eagle等[44]根據(jù)手機(jī)定位數(shù)據(jù),將農(nóng)村與城市社會的活動模式進(jìn)行了比較分析,研究發(fā)現(xiàn)農(nóng)村和城市社區(qū)在個人網(wǎng)絡(luò)拓?fù)浜托袨樘卣鞣矫娲嬖陲@著差異;Sanya和Mubangiz[45]運(yùn)用手機(jī)定位數(shù)據(jù)研究了人口在城鄉(xiāng)之間的流動動態(tài),并提出了層次人口流動的概念,認(rèn)為該概念可用于空間人口流動的可視化;Takahiro等[46]將農(nóng)民時空行為引入自然災(zāi)害研究,提出了一種基于手機(jī)定位數(shù)據(jù)與地理信息的農(nóng)村洪澇災(zāi)害探測的方法,通過檢測個體異常行為來實(shí)時推斷洪水位置,并利用日本農(nóng)村兩次嚴(yán)重洪災(zāi)的實(shí)際數(shù)據(jù)對該方法進(jìn)行評估,驗(yàn)證了該方法的可行性與準(zhǔn)確性。
國內(nèi)在市民時空行為領(lǐng)域的相關(guān)研究較少,高雪松等[10]利用手機(jī)信令數(shù)據(jù)研究了成都市農(nóng)村勞動力的職住通勤狀況,實(shí)現(xiàn)了成都農(nóng)村勞動力的職住聯(lián)系的可視化。結(jié)果表明,有接近7%的農(nóng)村勞動力每個工作日通勤到市區(qū)。該研究首次精細(xì)化地展現(xiàn)了我國快速城市化時期農(nóng)村居民的就業(yè)格局與職住聯(lián)系。在此基礎(chǔ)上,高雪松等[47]進(jìn)一步研究了成都市農(nóng)村宅基地整理政策對農(nóng)民生活生產(chǎn)方式的影響。結(jié)果表明,宅基地整理增加了農(nóng)民的工作類出行距離,縮短了非工作類出行距離,提高了農(nóng)村居民的生活品質(zhì)。
另一方面,應(yīng)用大數(shù)據(jù)能精準(zhǔn)識別貧困人口助力農(nóng)村精準(zhǔn)扶貧,這是我國學(xué)術(shù)界一個熱點(diǎn)課題。Blumenstock等[48]基于手機(jī)使用數(shù)據(jù)對盧旺達(dá)人口的貧富狀況進(jìn)行了研究。聯(lián)合國與百度也在此領(lǐng)域形成了合作,建立了一個涵蓋互聯(lián)網(wǎng)條件、道路基礎(chǔ)設(shè)施在內(nèi)八個衡量標(biāo)準(zhǔn)的大數(shù)據(jù)分析網(wǎng)絡(luò),用以精準(zhǔn)識別貧困[49]。我國地方政府也進(jìn)行了大數(shù)據(jù)精準(zhǔn)扶貧的實(shí)踐,并取得了一定的成果,例如貴州省依據(jù)扶貧云平臺信息系統(tǒng),量化評價貧困戶信息,建立扶貧脫貧指標(biāo)體系,動態(tài)掌握貧困人口狀況,實(shí)現(xiàn)了對貧困人口的精準(zhǔn)識別與監(jiān)控[50]。
可以看到,目前手機(jī)使用與信令定位數(shù)據(jù)作為反映個體行為的高覆蓋度數(shù)據(jù)是農(nóng)民問題研究的一項(xiàng)主要大數(shù)據(jù)來源,所應(yīng)用的問題領(lǐng)域主要包括農(nóng)民時空行為規(guī)律識別及其所反映的農(nóng)民貧富狀況與生活福祉。與對城市居民的類似研究相比,農(nóng)民問題研究還較少采用社交媒體網(wǎng)站等互聯(lián)網(wǎng)使用數(shù)據(jù),而這類大數(shù)據(jù)可在客觀行為之外提供農(nóng)民主觀認(rèn)知信息,豐富農(nóng)民問題分析維度,但如何從眾多網(wǎng)站用戶中識別農(nóng)民用戶、農(nóng)民群體對各類網(wǎng)站的使用存在何種偏好與差異是未來研究可進(jìn)一步探索的問題。
雖然在大數(shù)據(jù)時代,與“三農(nóng)”問題相關(guān)的數(shù)據(jù)在不斷增加,使“三農(nóng)”問題研究的信息來源大為拓展,但與城市地區(qū)相比,農(nóng)村地區(qū)大數(shù)據(jù)無論在種類還是質(zhì)量方面都還存在一定差距。首先,在數(shù)據(jù)來源種類方面,由于城市政府的大量智慧城市建設(shè)投入、城市居民的高強(qiáng)度互聯(lián)網(wǎng)使用以及商業(yè)機(jī)構(gòu)數(shù)據(jù)采集對城市地區(qū)的側(cè)重等原因,目前各類大數(shù)據(jù)的可獲得性在城市與農(nóng)村之間仍存在明顯差異。例如,城市生活與經(jīng)濟(jì)運(yùn)行的大量信息都可以通過居民在互聯(lián)網(wǎng)上的瀏覽、購物、評論等數(shù)據(jù)進(jìn)行探測,而農(nóng)村居民的類似互聯(lián)網(wǎng)使用則相對較少;在人居環(huán)境方面,各類商業(yè)網(wǎng)站已積累了興趣點(diǎn)、街景等有關(guān)城市環(huán)境的大量精細(xì)數(shù)據(jù),而這些數(shù)據(jù)在農(nóng)村地區(qū)往往較為稀疏。同時,與農(nóng)業(yè)生產(chǎn)經(jīng)營相關(guān)的特色數(shù)據(jù)通常需要部署大量傳感設(shè)備,也導(dǎo)致相關(guān)數(shù)據(jù)目前主要以點(diǎn)狀覆蓋為主,尚難以在大范圍內(nèi)實(shí)現(xiàn)同等獲取。在數(shù)據(jù)質(zhì)量方面,農(nóng)村大數(shù)據(jù)也可能在數(shù)據(jù)精度、代表性等方面存在不足,如用途廣泛的手機(jī)信令定位數(shù)據(jù)在城市地區(qū)的精度一般能夠達(dá)到200~300 m,而在農(nóng)村地區(qū)由于基站分布較為稀疏,定位精度可能下降至1000 m甚至更低,為進(jìn)一步分析挖掘帶來了挑戰(zhàn)。但隨著“數(shù)字鄉(xiāng)村”等戰(zhàn)略的實(shí)施,預(yù)計上述城鄉(xiāng)之間的大數(shù)據(jù)資源差異將逐步縮小,各類新型數(shù)據(jù)將為“三農(nóng)”問題研究帶來更多創(chuàng)新。
上述農(nóng)村大數(shù)據(jù)的數(shù)據(jù)條件限制對數(shù)據(jù)分析的方法設(shè)計提出了更多要求,以實(shí)現(xiàn)在有限數(shù)據(jù)條件下對研究對象的準(zhǔn)確刻畫。例如,如何通過在數(shù)據(jù)條件較好的片區(qū)采集的局部信息推求整個研究范圍內(nèi)的總體情況,這類問題可能需要多種數(shù)據(jù)的聯(lián)合分析,如結(jié)合局部范圍、高粒度大數(shù)據(jù)與大范圍、粗粒度的傳統(tǒng)統(tǒng)計數(shù)據(jù),通過挖掘數(shù)據(jù)之間的映射關(guān)系實(shí)現(xiàn)局部信息到整體的擴(kuò)充。再如,某些研究問題在城市地區(qū)可以通過多種大數(shù)據(jù)的綜合分析進(jìn)行識別,如綜合居民個體的信令軌跡、職住地點(diǎn)特征、其他訪問地點(diǎn)特征對居民個體的社會經(jīng)濟(jì)屬性進(jìn)行識別,但在農(nóng)村地區(qū)可有效利用的大數(shù)據(jù)類型可能較為單一,這就需要借助更為豐富的研究方法實(shí)現(xiàn)分析目的,如Blumenstock等[48]使用特征工程方法從手機(jī)使用原始數(shù)據(jù)中構(gòu)造出上千個特征變量,在此基礎(chǔ)上構(gòu)建機(jī)器學(xué)習(xí)模型成功實(shí)現(xiàn)了僅依賴手機(jī)使用數(shù)據(jù)的用戶貧富水平識別。
大數(shù)據(jù)分析應(yīng)用并非單純追求方法創(chuàng)新,而是應(yīng)切實(shí)服務(wù)于“三農(nóng)”問題治理與相關(guān)政策制定。從更抽象意義上可以認(rèn)為大數(shù)據(jù)分析是機(jī)器智能的一種形式,通過計算機(jī)的強(qiáng)大計算能力從大規(guī)模數(shù)據(jù)中挖掘人類所不能直接觀察到的現(xiàn)象與規(guī)律,而在“三農(nóng)”問題治理方面,相關(guān)技術(shù)人員與政府管理人員也在長期的實(shí)踐工作中形成大量經(jīng)驗(yàn)積累,如何將機(jī)器智能與人類經(jīng)驗(yàn)有效整合是大數(shù)據(jù)應(yīng)用于“三農(nóng)”問題研究所要關(guān)注的深層問題,包括算法設(shè)計中的經(jīng)驗(yàn)嵌入、決策過程中的人機(jī)交互等。對這一問題的探索無法局限于技術(shù)研究領(lǐng)域,而是需要通過技術(shù)研究與“三農(nóng)”問題治理實(shí)踐的循環(huán)互動,在應(yīng)用實(shí)踐中探索大數(shù)據(jù)分析的邊界與局限以及與傳統(tǒng)經(jīng)驗(yàn)的整合途徑。
由前文1、2節(jié)可以看到,雖然與城市問題研究相比大數(shù)據(jù)在農(nóng)村區(qū)域問題研究方面的應(yīng)用還相對較少,但國內(nèi)外學(xué)者也已陸續(xù)針對一些相關(guān)課題展開探索。在我國農(nóng)村數(shù)字基礎(chǔ)設(shè)施水平不斷提高且“三農(nóng)”問題在國家發(fā)展中始終占據(jù)重要地位的背景下,利用多樣、精細(xì)的新型數(shù)據(jù)對各類“三農(nóng)”問題展開深入研究具有豐富前景與重要社會經(jīng)濟(jì)意義,下文將嘗試就其中可能的研究方向進(jìn)行探討。
由2.1節(jié)可以看到,國內(nèi)外學(xué)者已針對大數(shù)據(jù)應(yīng)用于農(nóng)業(yè)增產(chǎn)展開了若干新技術(shù)探索。與此同時,近年來隨著城市化的發(fā)展與互聯(lián)網(wǎng)等技術(shù)的傳播,在傳統(tǒng)農(nóng)業(yè)之外我國農(nóng)村也出現(xiàn)了多種新型業(yè)態(tài),包括“互聯(lián)網(wǎng)+”模式影響下出現(xiàn)的農(nóng)村電子商務(wù),傳統(tǒng)農(nóng)業(yè)與服務(wù)業(yè)相結(jié)合出現(xiàn)的觀光農(nóng)業(yè)、體驗(yàn)農(nóng)業(yè)、休閑農(nóng)業(yè)[51]、共享農(nóng)業(yè)等新式農(nóng)業(yè),以及農(nóng)村土地流轉(zhuǎn)后形成的農(nóng)業(yè)合作社等。這些新型業(yè)態(tài)的出現(xiàn)有利于促進(jìn)農(nóng)村發(fā)展、提高農(nóng)民收入,但其發(fā)展?fàn)顩r、發(fā)展機(jī)制、對農(nóng)業(yè)生產(chǎn)與農(nóng)村社會經(jīng)濟(jì)的綜合影響等問題還有待深入研究。
由于許多新型業(yè)態(tài)的運(yùn)營本身就以互聯(lián)網(wǎng)為重要平臺,因此相關(guān)互聯(lián)網(wǎng)大數(shù)據(jù)也是對這類業(yè)態(tài)展開研究的直接信息來源,如電子商務(wù)平臺的價格、銷量、評價等數(shù)據(jù)直觀的反映了農(nóng)村電子商務(wù)的發(fā)展情況,新式農(nóng)業(yè)作為一類休閑旅游活動往往也可通過旅游、點(diǎn)評類網(wǎng)站獲得其經(jīng)營情況及消費(fèi)者評價相關(guān)信息,此外還可利用廣泛反映人群行為的手機(jī)軌跡數(shù)據(jù)對農(nóng)村新型業(yè)態(tài)的經(jīng)營者與消費(fèi)者行為進(jìn)行分析。
科學(xué)合理的空間規(guī)劃是農(nóng)村社會經(jīng)濟(jì)發(fā)展的重要要素,近年來新農(nóng)村建設(shè)、土地整理等空間規(guī)劃工作在我國農(nóng)村大規(guī)模開展,急需開展相關(guān)研究為農(nóng)村生產(chǎn)、生活、生態(tài)空間規(guī)劃提供支撐。而現(xiàn)有研究往往主要以地形地貌、土地利用等數(shù)據(jù)為分析依據(jù)[52-53],以物質(zhì)環(huán)境評估為主,缺乏對當(dāng)前農(nóng)村物質(zhì)空間與社會經(jīng)濟(jì)活動互動關(guān)系的深入解析。針對這一問題,上文提到的各類新型數(shù)據(jù)應(yīng)用于農(nóng)村產(chǎn)業(yè)與農(nóng)民生活的相關(guān)研究路徑均可進(jìn)一步延伸至農(nóng)村“三生”空間規(guī)劃研究,如基于手機(jī)軌跡數(shù)據(jù)對不同空間格局村莊的農(nóng)民生產(chǎn)、生活行為與便利度等評價指標(biāo)進(jìn)行比較研究,從而總結(jié)符合當(dāng)代農(nóng)民生產(chǎn)、生活需求的農(nóng)村空間布局模式。
此外,新型數(shù)據(jù)也可提供較傳統(tǒng)數(shù)據(jù)更為精細(xì)的農(nóng)村空間環(huán)境信息,雖然興趣點(diǎn)、街景圖像等目前已在城市空間環(huán)境研究中得到大量運(yùn)用的數(shù)據(jù)在我國農(nóng)村地區(qū)的覆蓋率還較低,但仍存在部分可適當(dāng)利用的數(shù)據(jù)類型。如航拍、遙感圖片往往覆蓋范圍較廣,通過與計算機(jī)視覺技術(shù)相結(jié)合可提取農(nóng)村房屋狀況、道路狀況等精細(xì)信息,為空心村等農(nóng)村建設(shè)問題研究與改造規(guī)劃提供精準(zhǔn)依據(jù);各類平臺中的農(nóng)村環(huán)境圖像也可采用計算機(jī)視覺技術(shù)識別提取地域風(fēng)貌特征[54],為制定具有地域特色的農(nóng)村空間規(guī)劃與設(shè)計提供支撐。
在我國快速城市化背景下,農(nóng)民生活模式也在不斷變遷,對當(dāng)代農(nóng)民生活狀況的準(zhǔn)確認(rèn)知是各類農(nóng)村政策有效制定的重要基礎(chǔ)。有關(guān)農(nóng)民生活狀況的傳統(tǒng)信息來源主要為問卷調(diào)查、訪談等,此類方法面臨著成本高、樣本少、樣本代表性有限等方面的挑戰(zhàn),而前文第2節(jié)中提到的手機(jī)定位、互聯(lián)網(wǎng)使用等大數(shù)據(jù)為識別、分析當(dāng)前我國農(nóng)民日常活動與心理感受提供了有力的信息來源,筆者基于手機(jī)軌跡數(shù)據(jù)對成都農(nóng)民職住格局與日常活動模式的研究即是對這一研究方向的一項(xiàng)探索。未來研究可進(jìn)一步探索采用更多類型的新型數(shù)據(jù)對當(dāng)前我國農(nóng)民生活狀況進(jìn)行更為全面的刻畫與分析,如采用空間精度更高的手機(jī)GPS定位數(shù)據(jù)可以更精準(zhǔn)地識別農(nóng)民活動地點(diǎn)與活動內(nèi)容,進(jìn)而對農(nóng)民生活方式、生活便利度以及更深入的農(nóng)村貧困、老齡化等社會經(jīng)濟(jì)問題進(jìn)行解析;采集農(nóng)民群體的社交媒體數(shù)據(jù),包括內(nèi)容發(fā)布、瀏覽、評論等,可以對農(nóng)民的生活滿意度、幸福感等主觀感受進(jìn)行評估,從而主客觀相結(jié)合對當(dāng)前我國農(nóng)民的生活狀況進(jìn)行分析。