□尤偉杰 高 見 周 濤
[1.中國移動通信集團(tuán)四川有限公司 成都 610041;2.電子科技大學(xué) 成都 611731;3.成都新經(jīng)濟(jì)發(fā)展研究院 成都 610094]
黨的十九大以來,民生工程被放到了極其重要的位置。其中,精準(zhǔn)扶貧和應(yīng)急救災(zāi)是民生工程中兩個關(guān)鍵的組成部分。黨的十九大報告中指出“堅決打贏脫貧攻堅戰(zhàn)。讓貧困人口和貧困地區(qū)同全國一道進(jìn)入全面小康社會是我們黨的莊嚴(yán)承諾。要動員全黨全國全社會力量,堅持精準(zhǔn)扶貧、精準(zhǔn)脫貧……確保到2020年我國現(xiàn)行標(biāo)準(zhǔn)下農(nóng)村貧困人口實現(xiàn)脫貧……”十九大后,國務(wù)院整合多部委原有功能后新設(shè)立了“中華人民共和國應(yīng)急管理部”,習(xí)近平總書記指出:“防災(zāi)減災(zāi)救災(zāi)事關(guān)人民生命財產(chǎn)安全,事關(guān)社會和諧穩(wěn)定,是衡量執(zhí)政黨領(lǐng)導(dǎo)力、檢驗政府執(zhí)行力、評判國家動員力、體現(xiàn)民族凝聚力的一個重要方面”,充分體現(xiàn)了應(yīng)急救災(zāi)工作的重要性。
然而,精準(zhǔn)扶貧和應(yīng)急救災(zāi)工作難度極大。在偏遠(yuǎn)鄉(xiāng)村地區(qū),采集信息的手段相對匱乏,信息傳輸條件相對較差,對于村民的收入情況評估往往只能依賴填報數(shù)據(jù)甚至幾年一次的人口普查數(shù)據(jù),存在時間滯后和數(shù)據(jù)造假的問題。農(nóng)村發(fā)生自然災(zāi)害后,對于災(zāi)區(qū)情況和受災(zāi)民眾情況的精確信息,往往會滯后數(shù)天才能被政府掌握[1],這也給災(zāi)害援救和災(zāi)后援助工作帶來了困難。Batty預(yù)測在21世紀(jì)末,世界上絕大多數(shù)人口(大于90%)將生活在城市,可以說整個地球都被城市化了[2]。實際上,現(xiàn)在世界上已經(jīng)有超過50%的人口生活在城市,中國的城鎮(zhèn)化率也到了60%左右。在這種情況下,城市應(yīng)急事件,包括恐怖襲擊、騷動暴亂、大規(guī)模示威游行等社會事件以及地震、暴雨、颶風(fēng)等容易影響城市的自然災(zāi)害,也成為亟待解決的重大挑戰(zhàn)。
精確感知社會經(jīng)濟(jì)狀態(tài),掌握貧困的空間分布,定位貧困人群,實時識別突發(fā)應(yīng)急事件,及時掌握災(zāi)害地區(qū)受災(zāi)群眾的情況等,都需要對人群廣覆蓋且實時性好的感知器。移動手機(jī)用戶在2014年就超過了全球人口(發(fā)達(dá)地區(qū)人均手機(jī)數(shù)量超過1部),是目前可利用的最好的感知器之一(有類似作用的感知器還包括社交媒體和遙感衛(wèi)星等)。因此,運營商擁有的移動智能手機(jī)數(shù)據(jù)完全有望在精準(zhǔn)扶貧和應(yīng)急救災(zāi)中發(fā)揮巨大作用。
事實上,運營商已經(jīng)開始了一些有益的工作。以中國移動為例,其精準(zhǔn)扶貧平臺利用海量數(shù)據(jù),努力嘗試實現(xiàn)“六大精準(zhǔn)”—扶持對象精準(zhǔn)、項目安排精準(zhǔn)、資金使用精準(zhǔn)、措施到戶精準(zhǔn)、因村派人精準(zhǔn)、脫貧成效精準(zhǔn)。該系統(tǒng)已在河南、湖南、重慶等7省市的55個市縣落地,覆蓋697萬貧困人口,服務(wù)近40.8萬扶貧干部。在應(yīng)急救災(zāi)方面,中國移動匯聚整合國土資源、旅游、水務(wù)、氣象、林業(yè)、海洋漁業(yè)等六個部門的數(shù)據(jù),結(jié)合自身海量數(shù)據(jù),建設(shè)綜合防災(zāi)減災(zāi)救災(zāi)指揮中心監(jiān)測系統(tǒng)平臺,實現(xiàn)了山塘水庫水位報警、旅游景點人數(shù)分析、船只位置監(jiān)控、地震速報、火山安全監(jiān)測等功能。
總體而言,運營商利用自身數(shù)據(jù)在精準(zhǔn)扶貧和應(yīng)急救災(zāi)中已經(jīng)做出了重要的貢獻(xiàn)。與此同時,我們也注意到,大部分平臺和系統(tǒng)僅僅具有信息化和可視化的功能。但整體而言,智慧程度不高,數(shù)據(jù)利用還很不充分。本文將介紹國內(nèi)外在利用手機(jī)數(shù)據(jù)進(jìn)行貧困感知和分析應(yīng)急突發(fā)應(yīng)急事件的監(jiān)測和分析方面的一些前沿進(jìn)展,并進(jìn)一步討論我國可以在這方面開展的一些有益工作。
貧困是21世紀(jì)全球發(fā)展所長期面臨的難題,消除貧困是聯(lián)合國“千年發(fā)展目標(biāo)”的核心議程之一[3]。為了實現(xiàn)消除貧困的目標(biāo),首先要精準(zhǔn)和及時地感知社會經(jīng)濟(jì)狀態(tài),掌握貧困的空間分布,準(zhǔn)確定位貧困人群。傳統(tǒng)經(jīng)濟(jì)普查在貧困地區(qū)的操作更加費時、耗力,導(dǎo)致對貧困狀況的感知非常滯后。隨著手機(jī)在全球的普遍使用,近年來,基于手機(jī)數(shù)據(jù)的社會經(jīng)濟(jì)水平推斷方法已經(jīng)在感知貧困區(qū)域、識別貧困人群、制定精準(zhǔn)扶貧策略等方面展現(xiàn)出巨大的應(yīng)用價值和前景[4]。
不同社會經(jīng)濟(jì)狀況的個體在手機(jī)的擁有和使用上也千差萬別,因此可以通過手機(jī)使用數(shù)據(jù)來推測個體的財富狀況。Blumenstock等人分析了盧旺達(dá)的手機(jī)使用情況,發(fā)現(xiàn)擁有手機(jī)的人都相當(dāng)富裕,而且主要是男性[5]。Wesolowski等人分析了肯尼亞手機(jī)擁有和使用情況數(shù)據(jù),發(fā)現(xiàn)在農(nóng)村里貧困人口共享使用手機(jī)的情況非常普遍[6]。Sunds?y等人基于大規(guī)模手機(jī)使用數(shù)據(jù)構(gòu)建深度學(xué)習(xí)模型,能夠以77%的準(zhǔn)確性來區(qū)分社會經(jīng)濟(jì)水平高低的個體[7]。手機(jī)同時也記錄著與個人財務(wù)相關(guān)的數(shù)據(jù),例如通話費用和所購買的通話時間。Gutierrez 等人分析了科特迪瓦手機(jī)用戶的話費充值金額變化情況,發(fā)現(xiàn)個人的相對收入水平與通話時間購買量和頻次有顯著關(guān)聯(lián)性[8]。
個體的社會經(jīng)濟(jì)狀況與移動行為模式密切相關(guān),而恰恰手機(jī)數(shù)據(jù)在分析人類移動上有獨特優(yōu)勢。Frias-Martinez等人分析了一個拉美國家的大規(guī)模手機(jī)軌跡數(shù)據(jù),發(fā)現(xiàn)高收入群體在城市內(nèi)的移動范圍更大[9]。特別地,F(xiàn)rias-Martinez等人發(fā)現(xiàn)社會經(jīng)濟(jì)水平與移動總距離和回轉(zhuǎn)半徑非常相關(guān)—他們基于此提出的模型能夠以72%的準(zhǔn)確性預(yù)測個體社會經(jīng)濟(jì)狀況[9]。類似地,基于2000萬法國手機(jī)用戶數(shù)據(jù),Pappalardo等人分析人類移動模式與社會經(jīng)濟(jì)發(fā)展?fàn)顩r之間的關(guān)系,發(fā)現(xiàn)移動多樣性比移動總量更能預(yù)測人均收入、初等教育率和失業(yè)率等社會經(jīng)濟(jì)指標(biāo)[10]?;诟鐐惐葋喪锥?50萬手機(jī)用戶數(shù)據(jù),F(xiàn)lorez等人構(gòu)建了不同收入群體的通勤網(wǎng)絡(luò),發(fā)現(xiàn)通勤路線的多樣性與收入水平正相關(guān),貧困人群通勤距離更遠(yuǎn)、花費時間更多[11]。
基于手機(jī)通訊數(shù)據(jù)可以構(gòu)建社會網(wǎng)絡(luò),進(jìn)而利用社會網(wǎng)絡(luò)結(jié)構(gòu)推斷個體財富狀況。Leo等人分析了墨西哥手機(jī)數(shù)據(jù)與銀行信貸數(shù)據(jù),發(fā)現(xiàn)社會網(wǎng)絡(luò)中存在個人經(jīng)濟(jì)狀況的同配關(guān)聯(lián)現(xiàn)象,能夠根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)能推斷個體經(jīng)濟(jì)階層[12]。類似地,F(xiàn)ixman等人發(fā)現(xiàn)手機(jī)通訊網(wǎng)絡(luò)有很強的社會經(jīng)濟(jì)同質(zhì)性,收入水平相近的個體通訊更密切,他們提出的貝葉斯方法能以71%的準(zhǔn)確性預(yù)測個體收入水平[13]。Luo等人分析了超過1億用戶的手機(jī)通訊數(shù)據(jù),發(fā)現(xiàn)個體的經(jīng)濟(jì)狀況與其在社會網(wǎng)絡(luò)中的位置和影響力非常相關(guān)。綜合考慮個體的年齡和網(wǎng)絡(luò)位置,他們提出的復(fù)合指標(biāo)與經(jīng)濟(jì)狀況的相關(guān)性達(dá)到0.99[14]。最近,Jahani等人基于手機(jī)數(shù)據(jù)構(gòu)建自我中心網(wǎng)絡(luò)(ego network)[15],發(fā)現(xiàn)社會網(wǎng)絡(luò)結(jié)構(gòu)多樣性與個體收入水平具有強相關(guān)性[16]。
根據(jù)位置將手機(jī)通訊數(shù)據(jù)進(jìn)一步聚合,還能預(yù)測區(qū)域的社會經(jīng)濟(jì)發(fā)展水平。基于25億條科特迪瓦手機(jī)數(shù)據(jù),Smith-Clarke等人構(gòu)建區(qū)域通訊網(wǎng)絡(luò),發(fā)現(xiàn)通訊接收量大的區(qū)域社會經(jīng)濟(jì)水平高[17]。??epanovi?等人利用時空移動模式來預(yù)測社會經(jīng)濟(jì)指標(biāo),發(fā)現(xiàn)回轉(zhuǎn)半徑概率分布的空間變化能判斷區(qū)域財富狀況[18]?;诳铺氐贤呤謾C(jī)數(shù)據(jù),Smith等人發(fā)現(xiàn)區(qū)域內(nèi)的通訊活躍性與貧困指數(shù)強負(fù)相關(guān)[19]。Mao等人引入CallRank指數(shù)刻畫區(qū)域相對重要性,發(fā)現(xiàn)CallRank指數(shù)與區(qū)域的基尼系數(shù)顯著相關(guān),電話撥出比率與區(qū)域的年收入和貧困率相關(guān)[20]。Eagle等人分析了英國手機(jī)通訊網(wǎng)絡(luò),發(fā)現(xiàn)復(fù)合的社會網(wǎng)絡(luò)多樣性指標(biāo)與區(qū)域經(jīng)濟(jì)水平的關(guān)聯(lián)性達(dá)到0.78[21]。Blumenstock等人將盧旺達(dá)手機(jī)通話詳單與問卷數(shù)據(jù)結(jié)合,用856個用戶的數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)模型預(yù)測超過150萬人的財富狀況,從而繪制出高分辨率的國家財富分布地圖(見圖1),得到的結(jié)果與政府普查數(shù)據(jù)相關(guān)性高達(dá)0.79[22]。
圖1 基于150萬手機(jī)用戶通話詳單數(shù)據(jù)預(yù)測得到的盧旺達(dá)高分辨率財富狀況地圖
通過挖掘和分析大規(guī)模移動手機(jī)數(shù)據(jù),能為應(yīng)急救災(zāi)提供重要信息或者不易直接觀察的深刻洞見。從實時發(fā)現(xiàn)突發(fā)事件和精確感知受災(zāi)群眾狀態(tài)這兩個方面,具體介紹手機(jī)數(shù)據(jù)解決應(yīng)急問題的主要進(jìn)展。
手機(jī)被認(rèn)為是“性價比最高”的社會探針,很多學(xué)者相信當(dāng)人們遇到炸彈襲擊、騷亂暴動、颶風(fēng)地震等突發(fā)事件后,手機(jī)通訊的數(shù)量和模式都會發(fā)生變化。因此,可以用手機(jī)數(shù)據(jù)來實時發(fā)現(xiàn)可能的突發(fā)事件。Dobra等人基于盧旺達(dá)地區(qū)2005~2009年的通話數(shù)據(jù),利用手機(jī)通話頻率和手機(jī)用戶移動頻率兩個主要維度,來實時檢測是否發(fā)生了突發(fā)事件[23]。他們將總通話量分成每天的數(shù)據(jù)單元,并將盧旺達(dá)領(lǐng)土切割成5 km2的網(wǎng)格(通過基站響應(yīng)判斷用戶的移動),然后對比目標(biāo)時間和目標(biāo)區(qū)域的人群通話頻率和移動頻率是否異常偏高。如果兩者都偏離常態(tài),則被認(rèn)為有突發(fā)事件出現(xiàn)。Gundogdu等人分析了科特迪瓦地區(qū)的手機(jī)通訊數(shù)據(jù)[24]。盡管他們相信移動軌跡也有幫助,但他們認(rèn)為通話量的數(shù)據(jù)更加重要。Gundogdu等人建立了一個更精細(xì)的馬爾科夫模型下的泊松過程來刻畫通話量的變化,并通過數(shù)據(jù)反向估計對應(yīng)時間序列中存在突發(fā)事件因素的概率。對比以前的算法,Gundogdu等人的算法精度有了大幅度的提升,特別是召回率—他們能夠成功檢測19個標(biāo)注的突發(fā)事件中的15個和11個非突發(fā)事件(節(jié)假日、演唱會等帶來非常態(tài)人群活動但又不屬于突發(fā)應(yīng)急的事件)中的8個。
如何分辨同樣有大規(guī)模人群非常態(tài)活動的突發(fā)和非突發(fā)事件是一個有現(xiàn)實意義的問題。例如恐怖分子炸彈襲擊區(qū)域的人群和明星演唱會附近的人群有什么不同嗎?Gundogdu等人就承認(rèn)這是一個棘手的問題。Bagrow等人對比了8個突發(fā)事件和8個非突發(fā)事件前后手機(jī)通訊模式的不同[25]。他們發(fā)現(xiàn)突發(fā)事件之后手機(jī)通話量會立刻激增,幾乎沒有時延,到達(dá)峰值后會很快按指數(shù)下降到正常值,其明顯偏離正常態(tài)的時間較短。反過來,節(jié)假日、重大演出等非突發(fā)事件手機(jī)通話量也會上升,但是上升比較緩慢且往往持續(xù)更長的時間。他們還注意到,突發(fā)事件中手機(jī)通話量的增加部分很大程度上來源于平時在這個時間段不怎么使用手機(jī)的人,因此這個特點可以被很好利用起來分辨一次通話量異常是否對應(yīng)為突發(fā)事件。當(dāng)然,這需要遠(yuǎn)遠(yuǎn)多于群體分析的計算量。他們進(jìn)一步細(xì)致地分析發(fā)現(xiàn),突發(fā)事件發(fā)生后,接收到突發(fā)事件區(qū)域用戶電話的用戶有遠(yuǎn)遠(yuǎn)超出尋常的概率會在接下來的一段時間內(nèi)打回電話。這個現(xiàn)象既無法在非突發(fā)事件中觀察到,也沒有辦法用社會互惠性加以解釋[26]。
盡管很多人群的突然聚集并不是來源于突發(fā)事件,但是通過手機(jī)數(shù)據(jù)了解這種聚集也是很有幫助的。例如,景區(qū)、演唱會、球場、博覽會等地人員聚集太多,有可能導(dǎo)致?lián)頂D踩踏等惡性事件[27]。又比如,突然聚集的人群可能為某些傳染病突然大爆發(fā)提供了溫床[28]。最近,F(xiàn)inger等人就通過手機(jī)數(shù)據(jù)發(fā)現(xiàn)塞內(nèi)加爾在朝圣的時候會出現(xiàn)超大規(guī)模人群聚集(見圖2),而這種聚集很可能是導(dǎo)致2005年塞內(nèi)加爾霍亂疫情突然激增的主要原因[29]。
圖2 塞內(nèi)加爾朝圣時期的人群聚集。
手機(jī)數(shù)據(jù)也可以用于及時了解災(zāi)害,特別是造成嚴(yán)重影響的自然災(zāi)害發(fā)生之后受災(zāi)地區(qū)民眾的情況[30]。呂欣等人研究了2010年海地地震前后190萬手機(jī)用戶的移動軌跡數(shù)據(jù)[31]。他們發(fā)現(xiàn)震中地區(qū)太子港有23%的人口在災(zāi)后遷移并居住在其他城市,然后經(jīng)過近一年的時間,這些人中的大部分逐漸回到了原居住地(見圖3)。不僅是因災(zāi)遷移的人數(shù),而且遷移人員的去向,都可以通過手機(jī)數(shù)據(jù)實時獲得,而民政部門要獲得精確的數(shù)據(jù)所需要的費用和時間都要高得多。類似的技術(shù)已經(jīng)開始在中國應(yīng)用。四川九寨溝地震區(qū)域剛好是旅游區(qū),震后的一項主要工作是人員疏散和撤離景區(qū)。根據(jù)運營商數(shù)據(jù)顯示,地震發(fā)生時九寨溝景區(qū)及周邊區(qū)域人員數(shù)量在8萬人左右,經(jīng)過24小時的疏散,銳減到2萬人左右,有6萬人左右撤離災(zāi)區(qū)。
圖3 海地地震后人口移動數(shù)據(jù)。
呂欣等人研究了地震后海地的災(zāi)民并沒有出現(xiàn)所謂的“混亂”,實際上災(zāi)民行為的可預(yù)測性在經(jīng)過短時間的降低后變得比平時還高。Kenett和Portugali[32]認(rèn)為這一發(fā)現(xiàn)實際上從某個側(cè)面印證著名的“H?gerstrand理論”[33]—人們絕大多數(shù)時間都生活在某種重復(fù)的常規(guī)狀態(tài)中(受空間、經(jīng)濟(jì)、社會、心理等限制)。如果長時間脫離常規(guī)狀態(tài),人們會試圖回到原來的常態(tài)或者重建一種新常態(tài),然后繼續(xù)過“有規(guī)律的生活”[34]。
本文對手機(jī)數(shù)據(jù)結(jié)合深度挖掘分析算法在精準(zhǔn)扶貧和應(yīng)急救災(zāi)中的可能應(yīng)用進(jìn)行了回顧??傮w而言,我們堅信運營商的數(shù)據(jù)(最好在進(jìn)一步整合一些其他關(guān)鍵部門數(shù)據(jù)[35])可以在這兩個重大民生工程中發(fā)揮巨大作用。我們也注意到了運營商已經(jīng)做出的一些有益嘗試,但這種嘗試只是應(yīng)用了大量數(shù)據(jù)的簡單統(tǒng)計分析,距離真正的智慧化以及給出深刻洞見以支撐高效正確決策,還有很長的距離—當(dāng)然,這也是全球共同面對的困難和挑戰(zhàn)!
在精準(zhǔn)扶貧方面,運營商已經(jīng)建立了比較好的信息化系統(tǒng)和業(yè)務(wù)平臺,例如“渝扶通”扶貧大數(shù)據(jù)平臺能夠?qū)崿F(xiàn)對貧困對象、扶貧干部、扶貧工作等基礎(chǔ)數(shù)據(jù)的收集和更新,包括貧困程度、主要致貧原因、貧困戶屬性、家庭照片等。這類數(shù)據(jù)如果能夠結(jié)合動態(tài)的移動手機(jī)數(shù)據(jù),有望在定位貧困人群和量化扶貧前后效果方面做得更精確。進(jìn)一步地,對一個城市數(shù)據(jù)之間關(guān)聯(lián)的深度分析,也可以幫助在其他城市建立更準(zhǔn)確地從移動手機(jī)數(shù)據(jù)到貧困程度之間的模型。
在應(yīng)急事件發(fā)現(xiàn)方面,原來的專家規(guī)則,特別是僅僅關(guān)注重點區(qū)域的人員數(shù)量的閾值模型,很容易造成誤報(報警但實際沒有突發(fā)事件)和漏報(有突發(fā)事件但沒有報警)。運營商和政府應(yīng)該學(xué)習(xí)先進(jìn)的分析算法,大幅度提高預(yù)測的精準(zhǔn)度。在援災(zāi)救災(zāi)方面,也需要通過數(shù)據(jù)了解災(zāi)區(qū)人員流動和救災(zāi)人員及物資所在位置,以提高援災(zāi)救災(zāi)的效率。特別地,手機(jī)數(shù)據(jù)可以用于檢測政策是否產(chǎn)生效果,譬如Morales和Pastor就注意到墨西哥洪災(zāi)預(yù)警的信號發(fā)出來之后,涉災(zāi)區(qū)域的群眾根本不為所動(從手機(jī)通訊和移動模式上看不到異常),直到洪水到了,災(zāi)民才作出反應(yīng),結(jié)果造成重大損失[36]。這種對政策效果的定量分析和評估對于提高我國政府決策和治理能力特別重要。
電子科技大學(xué)學(xué)報(社科版)2018年6期