楊 學(xué) 習(xí),鄧 敏,劉 瑜
(1.中南大學(xué)地球科學(xué)與信息物理學(xué)院,湖南 長(zhǎng)沙 410083;2.北京大學(xué)地球與空間科學(xué)學(xué)院遙感與地理信息系統(tǒng)研究所,北京 100871)
社會(huì)感知(social sensing)是通過多源地理時(shí)空大數(shù)據(jù)研究人類時(shí)空間行為特征,進(jìn)而揭示社會(huì)經(jīng)濟(jì)現(xiàn)象的時(shí)空分布格局、聯(lián)系及演化過程的理論和方法[1],其通過場(chǎng)所語義感知[2]、空間交互感知[3]、動(dòng)態(tài)演化感知[4],充分挖掘多源時(shí)空大數(shù)據(jù)中蘊(yùn)含的豐富人群時(shí)空間行為信息,與遙感數(shù)據(jù)互為補(bǔ)充。近年來,信息與通信和物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,無線傳感器、手持智能終端設(shè)備等裝置的廣泛應(yīng)用,以及人們對(duì)互聯(lián)網(wǎng)和移動(dòng)通信網(wǎng)絡(luò)的依賴,產(chǎn)生了大量具有個(gè)體標(biāo)記和時(shí)空語義信息的時(shí)空“大數(shù)據(jù)”(big geo-data)[5],使得長(zhǎng)時(shí)間、高精度追蹤觀測(cè)個(gè)體的空間移動(dòng)成為可能。伴隨大數(shù)據(jù)時(shí)代的來臨,全面涵蓋人類活動(dòng)與地理環(huán)境信息的地理大數(shù)據(jù)突破了傳統(tǒng)目的性采樣數(shù)據(jù)在數(shù)據(jù)范圍、時(shí)空粒度與信息內(nèi)涵等方面的局限,為“人—地”關(guān)系的全面認(rèn)知帶來了全新的研究范式[6,7]。近年來,人工智能領(lǐng)域的技術(shù)進(jìn)步為地理空間相關(guān)領(lǐng)域研究的智能化發(fā)展和融合創(chuàng)新帶來了新機(jī)遇和新挑戰(zhàn)[8]。地理空間智能(GeoAI)作為地理空間科學(xué)與人工智能相結(jié)合的交叉學(xué)科研究方向,有力提升了對(duì)于地理現(xiàn)象和地球科學(xué)過程的動(dòng)態(tài)感知、智能推理和知識(shí)發(fā)現(xiàn)的能力[9]。因此,在地理大數(shù)據(jù)社會(huì)感知手段的支持下,探討地理空間智能的關(guān)鍵技術(shù)與應(yīng)用,可為地理學(xué)研究提供有力的方法和技術(shù)支撐。
面向?qū)W科發(fā)展與行業(yè)需求,《地理與地理信息科學(xué)》組織了“社會(huì)感知與地理空間智能”專欄,邀請(qǐng)國(guó)內(nèi)外從事時(shí)空大數(shù)據(jù)與社會(huì)感知的理論與方法、地理空間智能的前沿關(guān)鍵技術(shù)、時(shí)空大數(shù)據(jù)行為模式挖掘的理論與方法、時(shí)空大數(shù)據(jù)與社會(huì)感知的智慧城市應(yīng)用研究的學(xué)者介紹相關(guān)研究進(jìn)展、應(yīng)用實(shí)例,以期總結(jié)成果和經(jīng)驗(yàn),發(fā)現(xiàn)不足和問題,探索前沿和方向,推動(dòng)大數(shù)據(jù)時(shí)代社會(huì)感知與地理空間智能的創(chuàng)新和發(fā)展。該專欄論文集中反映了當(dāng)前社會(huì)感知與地理空間智能的研究動(dòng)態(tài)和熱點(diǎn)方向。本文作為導(dǎo)讀論文,通過對(duì)相關(guān)論文的系統(tǒng)分析和綜述,總結(jié)了當(dāng)前社會(huì)感知與地理空間智能的發(fā)展動(dòng)態(tài),并結(jié)合新時(shí)代下的新需求、新挑戰(zhàn)和新機(jī)遇,對(duì)社會(huì)感知與地理空間智能未來的發(fā)展方向進(jìn)行了初步探討。
“社會(huì)感知與地理空間智能”專欄包括15篇論文[10-24],內(nèi)容涵蓋COVID-19疫情分析、群體行為分析、場(chǎng)所情緒刻畫、個(gè)性出行推薦、城市路網(wǎng)感知等,選擇的典型研究區(qū)既包括長(zhǎng)三角城市群區(qū)域,也包括北京、廣州、武漢、長(zhǎng)沙、成都、西寧等典型城市,選擇的研究數(shù)據(jù)主要包括社交媒體數(shù)據(jù)、手機(jī)信令數(shù)據(jù)、GPS軌跡數(shù)據(jù)、街景數(shù)據(jù)等,采用的信息處理方法涉及機(jī)器學(xué)習(xí)新理論以及地理模擬、空間統(tǒng)計(jì)、空間聚類等空間分析方法,系統(tǒng)地呈現(xiàn)了當(dāng)前社會(huì)感知的研究進(jìn)展。專欄論文具體介紹如下:
姜偉等[10]以新浪微博數(shù)據(jù)作為主要數(shù)據(jù)源,結(jié)合實(shí)地問卷調(diào)查,提出了疫情場(chǎng)景下城市內(nèi)用戶群體多維情感響應(yīng)時(shí)空特征分析框架。該框架重點(diǎn)構(gòu)建了城市內(nèi)用戶群體對(duì)于疫情的多維情感強(qiáng)度精確評(píng)估方法,并分析疫情情感響應(yīng)的時(shí)空變化特征,解析情感響應(yīng)的顯著影響因子。該文通過將社交媒體大數(shù)據(jù)與規(guī)則采樣“小數(shù)據(jù)”相結(jié)合,高效地解析了大規(guī)模城市內(nèi)用戶群體的情感響應(yīng)時(shí)空特征,為政府疫情相關(guān)政策制定提供理論基礎(chǔ)。
朱炤瑗等[11]通過構(gòu)建COVID-19疫情防控期間的國(guó)家對(duì)抗和依賴關(guān)系交互網(wǎng)絡(luò)模型,提出一種基于時(shí)間序列聚類與空間統(tǒng)計(jì)的國(guó)家關(guān)系交互網(wǎng)絡(luò)演化模式探測(cè)方法。研究充分利用節(jié)點(diǎn)的網(wǎng)絡(luò)特征與空間屬性,有效發(fā)掘了疫情防控期間國(guó)家關(guān)系交互網(wǎng)絡(luò)節(jié)點(diǎn)的動(dòng)態(tài)演化模式與空間分布特征,為公共衛(wèi)生危機(jī)事件中的國(guó)際關(guān)系研究提供參考。
游憩熱點(diǎn)的識(shí)別和空間特征解析是城市管理者理解居民游憩活動(dòng)行為的重要依據(jù),師浩辰等[12]以“社會(huì)感知”視角為切入點(diǎn),以GPS眾包軌跡為數(shù)據(jù)源,提出基于“時(shí)、地、人”要素提取游憩熱點(diǎn)的新思路。通過“時(shí)、地”的雙重限定識(shí)別出每條軌跡的停留點(diǎn),結(jié)合核密度分析與 “頭尾劃分”法提取停留點(diǎn)的高密度區(qū)域,并以道路為基礎(chǔ)整合表達(dá)游憩熱點(diǎn)的空間分布。
馮澤琪等[13]采用新浪微博社交媒體數(shù)據(jù),通過用戶分類、微博情感分析、微博主題分析、微博負(fù)面情緒分析等進(jìn)行旅游者的情緒感知,并將情緒因素與時(shí)空行為研究相結(jié)合,提出一套系統(tǒng)的游客微博文本分析方法。該研究可為建設(shè)旅游目的地游客輿情監(jiān)測(cè)、預(yù)警和管控系統(tǒng)提供借鑒。
屈樹學(xué)等[14]針對(duì)微博社交媒體大數(shù)據(jù),利用機(jī)器學(xué)習(xí)算法區(qū)分游客與本地居民,進(jìn)而采用空間分析算法挖掘游客與居民的行為差異,從人群異質(zhì)性角度發(fā)現(xiàn)及揭示空間分異現(xiàn)象,研究結(jié)果可為旅游和規(guī)劃提供一定的參考。
王潤(rùn)澤等[15]基于POI數(shù)據(jù)利用功能密度指數(shù)、功能優(yōu)勢(shì)指數(shù)識(shí)別城市混合用地功能,在此基礎(chǔ)上以騰訊位置大數(shù)據(jù)刻畫人口流動(dòng)差異性和時(shí)空聚散模式,并區(qū)分為公共主導(dǎo)—聚散波動(dòng)、商務(wù)主導(dǎo)—持續(xù)集聚、居住主導(dǎo)—持續(xù)集聚、綠地主導(dǎo)—聚散交替、商業(yè)主導(dǎo)—?jiǎng)討B(tài)平衡和工業(yè)主導(dǎo)—先聚后散6種模式,為科學(xué)合理地制定國(guó)土空間規(guī)劃、完善配套設(shè)施建設(shè)等提供理論與實(shí)踐支撐。
吳濤等[16]提出一種基于眾源地理數(shù)據(jù)的個(gè)性化路線服務(wù)框架,通過將大眾對(duì)不同地點(diǎn)的偏好、時(shí)間與成本預(yù)算等信息映射到實(shí)際路網(wǎng)空間中,融合個(gè)人意向進(jìn)行動(dòng)態(tài)建模分析,從而為用戶提供合適且更具個(gè)性化的出行方案。
楊鴻海等[17]以手機(jī)信令數(shù)據(jù)作為數(shù)據(jù)源,研究西寧市居民在工作日和休息日的時(shí)空活動(dòng)差異及POI設(shè)施空間分布對(duì)居民活動(dòng)差異的影響。該研究從宏觀、時(shí)空動(dòng)態(tài)的角度分析西寧市居民的時(shí)空行為,有助于理解工作日和休息日居民在城市空間的時(shí)空活動(dòng)差異及影響機(jī)制,可為城市出行空間和基礎(chǔ)設(shè)施規(guī)劃提供參考。
郭鑫等[18]利用手機(jī)信令數(shù)據(jù)探索城市不同年齡群體活力空間分布模式,并從區(qū)位條件、交通可達(dá)性、建筑空間、功能空間和綠地景觀空間五方面構(gòu)建建成環(huán)境影響指標(biāo)體系,進(jìn)而通過多元線性逐步回歸模型和多尺度地理加權(quán)回歸模型,實(shí)現(xiàn)建成環(huán)境對(duì)城市不同年齡群體活力時(shí)空異質(zhì)性影響的定量刻畫。
肖通等[19]提出一種融合街景影像和手機(jī)信令數(shù)據(jù)的城市街道安全性評(píng)估方法,通過兩種類型數(shù)據(jù)反映的特征互補(bǔ)來減小“安全感知偏差”,從而有效刻畫研究區(qū)域街道真實(shí)安全性,并對(duì)低安全性區(qū)域提出針對(duì)性建議,研究結(jié)果可為城市街道合理規(guī)劃提供科學(xué)參考。
陶奕宏等[20]從微觀角度出發(fā),充分考慮地理區(qū)位、自然因素、社會(huì)經(jīng)濟(jì)因素的影響,借助GIS空間分析技術(shù)與人工神經(jīng)網(wǎng)絡(luò)挖掘不同類型智能體在城市擴(kuò)展過程中的偏好差異,結(jié)合多期遙感影像,運(yùn)用人工神經(jīng)網(wǎng)絡(luò)—智能體模型—元胞自動(dòng)機(jī)(ANN-ABM-CA)模型對(duì)城市擴(kuò)展進(jìn)行模擬,從而服務(wù)于城市可持續(xù)發(fā)展與國(guó)土空間規(guī)劃。
郭文峰等[21]從人群出行數(shù)據(jù)感知城市道路的角度出發(fā),采用共享單車GPS數(shù)據(jù)對(duì)城市歷史路網(wǎng)進(jìn)行變化路段檢測(cè)與更新,提出一種分段—聚類—聚合增量軌跡數(shù)據(jù)自動(dòng)生成道路方法。該文提出的基于局部路網(wǎng)更新的檢測(cè)—提取—更新思想,有效降低了路網(wǎng)數(shù)據(jù)更新成本,有助于快速感知城市交通路網(wǎng)動(dòng)態(tài)。
湯恒等[22]利用百度指數(shù)數(shù)據(jù)表征信息流,進(jìn)而分析長(zhǎng)三角城市群網(wǎng)絡(luò)的中心性特征和影響信息流網(wǎng)絡(luò)形成的因子,進(jìn)而發(fā)掘影響城市間關(guān)系的內(nèi)在因素,為全面理解城市群的空間結(jié)構(gòu)及其成因提供支持。
王鉞等[23]結(jié)合空間網(wǎng)絡(luò)分析模型與多尺度地理加權(quán)回歸模型,以成都市2020年二手住宅交易數(shù)據(jù)為研究對(duì)象,探究不同空間尺度下城市路網(wǎng)對(duì)住宅價(jià)格的影響機(jī)制及其間的差異,可為政府制定房地產(chǎn)市場(chǎng)的相關(guān)政策、房地產(chǎn)開發(fā)商的選址布局、城市交通規(guī)劃提供參考。
鐘怡然等[24]將高速公路智能監(jiān)控系統(tǒng)中的實(shí)體抽象為多粒度時(shí)空對(duì)象,并從時(shí)空參照、時(shí)空位置、空間形態(tài)、屬性特征、組成結(jié)構(gòu)、關(guān)聯(lián)關(guān)系、行為能力和認(rèn)知能力八方面的特征出發(fā),設(shè)計(jì)高速公路智能監(jiān)控系統(tǒng)概念數(shù)據(jù)模型,有助于監(jiān)控系統(tǒng)中實(shí)體及其復(fù)雜關(guān)系的組織與管理,以及支撐高速公路智能監(jiān)控系統(tǒng)的構(gòu)建與應(yīng)用。
地理時(shí)空大數(shù)據(jù)及其提供的社會(huì)感知手段,為信息地理學(xué)、人文地理學(xué)帶來了全新的研究范式,為地理規(guī)律的發(fā)現(xiàn)提供了重要的工具和手段,在“人—地”關(guān)系研究中發(fā)揮了重要作用。在取得這些進(jìn)展的同時(shí),同樣需要對(duì)當(dāng)前社會(huì)感知面臨的問題進(jìn)行冷靜的思考。
(1)社會(huì)感知提供了一種“由人及地”的研究范式,通過地理時(shí)空大數(shù)據(jù)蘊(yùn)含的海量人群的時(shí)空行為信息,在蓬勃發(fā)展的地理空間智能算法的優(yōu)化驅(qū)動(dòng)下,揭示空間要素的分布格局、地理單元的交互特征、地理場(chǎng)所的情感語義,可視為對(duì)城市精細(xì)化動(dòng)態(tài)運(yùn)行提供了一個(gè)“上帝視角”,在人工智能技術(shù)的支撐下,可望實(shí)現(xiàn)對(duì)設(shè)施的智能管理、人群出行的優(yōu)化調(diào)度,提高城市運(yùn)行效率。但在城市系統(tǒng)高效運(yùn)行的背后,如何平衡人們是否接受算法支配的倫理問題,是社會(huì)感知和人工智能研究面臨的重要挑戰(zhàn)。
(2)地理時(shí)空大數(shù)據(jù)豐富的信息內(nèi)涵如何充分感知利用?多源地理時(shí)空大數(shù)據(jù)覆蓋的時(shí)段、空間或滲透人群存在明顯的差異,產(chǎn)生了多視角的感知。以城市人群交通活動(dòng)為例,其活動(dòng)信息蘊(yùn)含于公交車、地鐵、出租車、私家車等不同交通方式,不同的出行方式反映了不同人群的出行規(guī)律,例如:公交或地鐵刷卡數(shù)據(jù)主要覆蓋出行相對(duì)規(guī)律的通勤者,出租車軌跡數(shù)據(jù)主要反映出租車出行者的規(guī)律,僅采用單一類型的出行數(shù)據(jù)獲得的人群交通活動(dòng)研究成果往往有所偏頗。不同來源地理大數(shù)據(jù)如何實(shí)現(xiàn)對(duì)某一地理事實(shí)的共同反映和表征?多源地理時(shí)空大數(shù)據(jù)的深度融合是解決上述問題的重要途徑[25],即需要在統(tǒng)一的時(shí)空框架下,依據(jù)具體的應(yīng)用需求對(duì)不同來源數(shù)據(jù)進(jìn)行融合,實(shí)現(xiàn)不同時(shí)態(tài)、不同語義、不同尺度地理時(shí)空大數(shù)據(jù)的協(xié)同、信息派生與增值[26],進(jìn)而采用多尺度建模、多視角協(xié)同、多特征認(rèn)知與多特性表達(dá)等手段[27],基于不同來源的地理大數(shù)據(jù)對(duì)同一地理事實(shí)的表征進(jìn)行深層次理解,發(fā)現(xiàn)不同來源地理時(shí)空大數(shù)據(jù)的一致性與互補(bǔ)性。
(3)如何破解“社會(huì)感知的結(jié)果多為驗(yàn)證性的”這一困局。地理時(shí)空大數(shù)據(jù)及其提供的社會(huì)感知手段在人的行為模式挖掘等方面取得了一些新的認(rèn)知成果,但是現(xiàn)有社會(huì)感知成果尚難以真正實(shí)現(xiàn)“未知知識(shí)”的發(fā)現(xiàn)。社會(huì)感知成果雖然使人們對(duì)“人—地”關(guān)系有了更加細(xì)化、定量化的認(rèn)識(shí),但是這些感知結(jié)果多是驗(yàn)證性、常識(shí)性的。如何真正感知地理時(shí)空大數(shù)據(jù)背后隱含的、新穎的知識(shí),取得諸如“胡煥庸線”的地理發(fā)現(xiàn),是大數(shù)據(jù)時(shí)代社會(huì)感知面臨的嚴(yán)峻挑戰(zhàn)。知識(shí)與數(shù)據(jù)雙重驅(qū)動(dòng)的社會(huì)感知挖掘手段有望成為破解當(dāng)前研究困局的重要方式,開放式、可擴(kuò)展的地理知識(shí)圖譜的構(gòu)建以及融合地理規(guī)律的機(jī)器學(xué)習(xí)模型的搭建是未來重要的研究方向。