□ 胡 敬
幾十年來,縱觀世界范圍信息化的發(fā)展,大致經(jīng)歷了3個(gè)階段:從1941年第一臺電子計(jì)算機(jī)的誕生到1995年,是以單機(jī)應(yīng)用為特征的數(shù)字化階段;從1995年到2015年,是以聯(lián)網(wǎng)應(yīng)用為特征的網(wǎng)絡(luò)化階段;從2015年至今,開啟了以數(shù)據(jù)的深度挖掘和融合應(yīng)用為特征的智慧化階段。應(yīng)該說,是大數(shù)據(jù)催生了信息化的3.0。與此相伴,“智慧城市”也應(yīng)運(yùn)而生,旨在融合大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算、人工智能等一系列最新的信息化技術(shù),打造智慧城市的大腦,提高我們的生活質(zhì)量。
隨著智能手機(jī)的普及、廉價(jià)及功能的極大豐富,以及無人機(jī)、無人車等智能移動終端的廣泛商用,傳統(tǒng)“以物為中心”的物聯(lián)網(wǎng)架構(gòu)逐漸暴露了移動性差、部署成本高、響應(yīng)時(shí)間長等問題。為了更好地進(jìn)行物聯(lián)網(wǎng)類大數(shù)據(jù)的采集,進(jìn)而有效地提升大數(shù)據(jù)驅(qū)動下的“智慧城市大腦”,多年來,北京理工大學(xué)劉馳教授團(tuán)隊(duì)專注于面向智慧城市的“人機(jī)協(xié)同”群智大數(shù)據(jù)采集方法研究,為新一代“智慧城市”藍(lán)圖提出自己的“三十六計(jì)”。
當(dāng)人們的生活已經(jīng)習(xí)慣了使用智能手機(jī),大到各國元首召開遠(yuǎn)程視頻會議,小到人們?nèi)粘2樵兲鞖狻⒋蜍?,看不見的高速通信網(wǎng)絡(luò)日夜為我們服務(wù),讓我們足不出戶就可以遍覽大好河山,和遠(yuǎn)隔萬里的朋友面對面談笑風(fēng)生。但是,當(dāng)暴雨、地震、洪水等一系列難以預(yù)料而又破壞力極強(qiáng)的災(zāi)難降臨時(shí),地面通信基礎(chǔ)設(shè)施遭到損毀,智能手機(jī)無法工作,而數(shù)量有限的搜救人員面對廣闊的受災(zāi)區(qū)域往往顯得心有余而力不足。如何切實(shí)有效地恢復(fù)地面通信成了智慧城市7/24不間斷服務(wù)的關(guān)鍵。
劉馳團(tuán)隊(duì)創(chuàng)新性地提出了基于分布式深度強(qiáng)化學(xué)習(xí)的多無人機(jī)通信覆蓋技術(shù)。無人機(jī)彼此之間借助WiFi等無線網(wǎng)絡(luò)保持聯(lián)通,其中少數(shù)可和通信衛(wèi)星連接,共同為地面用戶構(gòu)建與外界相連的“空中生命線”。由于通信覆蓋區(qū)域面積大,無人機(jī)數(shù)量較少,需要動態(tài)調(diào)整無人機(jī)的方位實(shí)現(xiàn)動態(tài)部署。與此同時(shí),無人機(jī)運(yùn)動中的電量消耗是延長網(wǎng)絡(luò)生存時(shí)間的關(guān)鍵,這樣在保持無人機(jī)群的適當(dāng)移動不放過一個(gè)死角的同時(shí),也需減小移動帶來的電量消耗。再者,無人機(jī)網(wǎng)絡(luò)需要保持時(shí)刻聯(lián)通,這樣保證了數(shù)據(jù)鏈路上通下聯(lián)。具體地,劉馳團(tuán)隊(duì)突破傳統(tǒng)深度強(qiáng)化學(xué)習(xí)技術(shù),如DQN方法只能處理非常有限的離散動作空間的限制,在連續(xù)動作空間控制actor-critic方法的基礎(chǔ)上,定義了一個(gè)新的能效利用率指標(biāo),來綜合考慮平均通信覆蓋率、通信覆蓋公平性、無人機(jī)群聯(lián)通性及能耗。劉馳團(tuán)隊(duì)提出了一種無人機(jī)群控制新方法——DRLEC3(DRL-based Energy-Control for Coverage and Connectivity),并且通過大量的仿真實(shí)驗(yàn)證明了它的有效性、魯棒性和優(yōu)越性,在使用深度強(qiáng)化學(xué)習(xí)訓(xùn)練無人機(jī)群提供通信覆蓋的智能控制領(lǐng)域走在了前列。相關(guān)成果連續(xù)發(fā)表在本領(lǐng)域頂級期刊IEEE JSAC和IEEE Trans.on Mobile Computing上。英國愛丁堡大學(xué)的研究團(tuán)隊(duì)在IEEE Communications Surveys & Tutorials評價(jià)這項(xiàng)研究“能夠動態(tài)學(xué)習(xí)環(huán)境狀態(tài),并與主流算法相比取得了突出的性能優(yōu)勢”。
群智感知的感念最早由美國Dartmouth College的A. Campbell教授在2008年提出,即“People-centric sensing”(以人為中心的感知),旨在破解傳統(tǒng)物聯(lián)網(wǎng)需人為部署傳感設(shè)備帶來的弊端。劉馳團(tuán)隊(duì)是國內(nèi)較早開始此類研究的團(tuán)隊(duì),旨在解決以下關(guān)鍵科學(xué)問題:如何評判參與者提供的感知數(shù)據(jù)的質(zhì)量,并滿足任務(wù)發(fā)布者的需求?如何保障參與者、任務(wù)發(fā)布者及本系統(tǒng)運(yùn)營者三方的利益?劉馳團(tuán)隊(duì)發(fā)表在IEEE INFOCOM、IEEE Trans. on Mobile Computing等本領(lǐng)域頂級會議和期刊上的文章,得到了國際同行廣泛引用并積極評價(jià):是“最早將信息質(zhì)量(Quality of Information)引入到群智感知系統(tǒng)激勵設(shè)計(jì)的工作之一”(IEEE Fellow、美國密蘇里科技大學(xué)Prof. S. Das教授團(tuán)隊(duì));是一種“具有代表性的工作,來提出一個(gè)群智感知網(wǎng)絡(luò)管理框架”(美國南佛羅里達(dá)大學(xué)研究團(tuán)隊(duì))。
劉馳團(tuán)隊(duì)提出了一種保障感知數(shù)據(jù)質(zhì)量的實(shí)時(shí)激勵機(jī)制,該機(jī)制兼顧群智感知平臺和參與者的雙方利益,允許平臺提供額外獎金來進(jìn)一步激勵優(yōu)秀數(shù)據(jù)提供者。通過在若干真實(shí)數(shù)據(jù)集上的廣泛模擬,劉馳團(tuán)隊(duì)證明了所提出算法具備數(shù)學(xué)上的真實(shí)性、個(gè)體合理性、預(yù)算可行性和高效計(jì)算性等優(yōu)質(zhì)特性。
通過合理的參與者選擇與在線激勵,智能手機(jī)真正地成了一個(gè)“神奇口袋”,而任務(wù)發(fā)布者僅需支付一定的報(bào)酬,就可以獲取過去難以獲取的城市大數(shù)據(jù)。
傳統(tǒng)的群智感知系統(tǒng)充分利用了人所攜帶的智能終端進(jìn)行城市大數(shù)據(jù)采集,這比提前部署傳感器已經(jīng)智慧了一些,但人類活動不可能做到全區(qū)域全天候覆蓋,且考慮到不穩(wěn)定的人為因素。隨著無人機(jī)、無人車等技術(shù)的日趨成熟,商用化成本逐漸降低,“忠心耿耿”的無人設(shè)備為“人機(jī)協(xié)同”群智感知這一新技術(shù)的發(fā)展鋪平了道路。自2017年起,劉馳團(tuán)隊(duì)是國內(nèi)外最早進(jìn)行此項(xiàng)課題的團(tuán)隊(duì)之一,并迅速取得了突破性進(jìn)展,研究成果連續(xù)發(fā)表在IEEE JSAC、IEEE Trans. on Mobile Computing等本領(lǐng)域頂級期刊上。
劉馳團(tuán)隊(duì)利用攜帶豐富傳感器的無人移動終端(如無人車、無人機(jī))在城市中進(jìn)行數(shù)據(jù)采集,這些無人移動終端均配備了“設(shè)備—設(shè)備”的通信接口(如WiFi、NB-IoT等),它們通過相互通信來獲取必要的信息。無人設(shè)備根據(jù)各自學(xué)習(xí)到的策略在一個(gè)區(qū)域中自主移動并收集數(shù)據(jù)。但是,它們所攜帶的電池是有限的,而增加電池的尺寸會進(jìn)一步增加重量,這對無人機(jī)而言尤其致命。同時(shí),所攜帶的傳感器的感知范圍和感知精度均受限,城市中也存在很多障礙物(如建筑、道路維護(hù)路段等),無人移動終端需學(xué)會避障。最后,通過部署后端中央控制中心來調(diào)度無人設(shè)備會十分低效,因此需設(shè)計(jì)分布式導(dǎo)航方案。
面對這樣復(fù)雜的群智感知任務(wù),劉馳團(tuán)隊(duì)創(chuàng)新性地提出了“e-Divert”調(diào)度算法。其在傳統(tǒng)actor-critic方法的基礎(chǔ)上,通過引入長短期記憶模型LSTM對時(shí)間軌跡特征進(jìn)行提取,并輔助卷積神經(jīng)網(wǎng)絡(luò)CNN做到時(shí)空數(shù)據(jù)分析。同時(shí),采用了Ape-X機(jī)制,為智能體創(chuàng)造“分身術(shù)”,從而在環(huán)境的訓(xùn)練副本中實(shí)現(xiàn)更廣泛深入的探索,優(yōu)化了經(jīng)驗(yàn)復(fù)用機(jī)制的性能。實(shí)驗(yàn)表明,算法在保證合作策略的同時(shí),有效地提取了當(dāng)前狀態(tài)序列的時(shí)空特征,進(jìn)而學(xué)會了類似“瞻前顧后,揚(yáng)長避短”的行為策略。
面向智慧城市的人機(jī)協(xié)同群智感知系統(tǒng)
除此之外,為了保障系統(tǒng)工作過程中的數(shù)據(jù)完整性、數(shù)據(jù)安全性和數(shù)據(jù)可靠性,劉馳團(tuán)隊(duì)又提出了一個(gè)結(jié)合Ethereum區(qū)塊鏈的深度強(qiáng)化學(xué)習(xí)框架。它既可以幫助每個(gè)移動智能終端感知附近的數(shù)據(jù)點(diǎn),從而實(shí)現(xiàn)上述高效的數(shù)據(jù)采集效果,同時(shí)也使區(qū)塊鏈在不同終端之間共享數(shù)據(jù),有效地保障了數(shù)據(jù)的安全級別。
智慧城市迅速發(fā)展的關(guān)鍵在于物聯(lián)網(wǎng)類大數(shù)據(jù)的有效獲取,用來補(bǔ)充互聯(lián)網(wǎng)數(shù)據(jù)在物理空間表征中的信息缺失。展望未來,在“人機(jī)協(xié)同”群智感知技術(shù)這一新的研究方向下,劉馳團(tuán)隊(duì)計(jì)劃從關(guān)鍵理論和場景技術(shù)兩個(gè)方面進(jìn)行攻關(guān)。具體地,在關(guān)鍵理論方面,將嘗試通過設(shè)計(jì)高效記憶機(jī)制來更好地利用人機(jī)協(xié)同條件下移動軌跡中的時(shí)空信息;在場景技術(shù)方面,將深入研究多任務(wù)深度強(qiáng)化學(xué)習(xí)技術(shù),探索不同城市內(nèi)群智感知任務(wù)的知識遷移、任務(wù)與激勵分配等核心技術(shù)。
多年來,為了破解智慧城市中物聯(lián)網(wǎng)類大數(shù)據(jù)的獲取技術(shù),北京理工大學(xué)劉馳教授團(tuán)隊(duì)一直在堅(jiān)持不懈地努力,也一直走在業(yè)界的前列。劉馳團(tuán)隊(duì)的終極目標(biāo)是實(shí)現(xiàn)真正完備的人機(jī)協(xié)同群智感知系統(tǒng),為“智慧城市大腦”的發(fā)展提供源源不斷的數(shù)據(jù)資源,為大數(shù)據(jù)、云計(jì)算、人工智能等技術(shù)與智慧城市中的實(shí)體經(jīng)濟(jì)深度融合提供有力支持。到那一天,技術(shù)走進(jìn)千家萬戶,百姓的生活質(zhì)量會得到進(jìn)一步提升。能夠助力美好中國的發(fā)展,劉馳團(tuán)隊(duì)也會因?qū)夹g(shù)的執(zhí)著追求取得的成果而流露出一絲欣慰。