從政策驅(qū)動(dòng)到技術(shù)踐行:大數(shù)據(jù)開(kāi)辟可持續(xù)發(fā)展研究新途徑
From policy-driven to practical implementation: big data opens up a new research paradigm for sustainable development
周綺鳳(1976-),女,博士,廈門大學(xué)自動(dòng)化系副教授。2002年起從事數(shù)據(jù)挖掘及智能系統(tǒng)方面的研究工作,2014-2015年在美國(guó)佛羅里達(dá)國(guó)際大學(xué)訪學(xué),主要研究興趣包括機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘及其在可持續(xù)發(fā)展等領(lǐng)域的應(yīng)用。
李濤(1975-),男,南京郵電大學(xué)計(jì)算機(jī)學(xué)院、軟件學(xué)院院長(zhǎng),南京郵電大學(xué)大數(shù)據(jù)研究院院長(zhǎng)。2004年7月獲美國(guó)羅徹斯特大學(xué)(University of Rochester)計(jì)算機(jī)科學(xué)博士學(xué)位,2004-2014年先后任美國(guó)佛羅里達(dá)國(guó)際大學(xué)(Florida International University)計(jì)算機(jī)學(xué)院助理教授、副教授(終身教授)、教授(full professor)、研究生主管(graduate program director)。由于在數(shù)據(jù)挖掘及應(yīng)用領(lǐng)域成效顯著的研究工作,曾多次獲得各種榮譽(yù)和獎(jiǎng)勵(lì),其中包括2006年美國(guó)國(guó)家自然科學(xué)基金委員會(huì)頒發(fā)的杰出青年教授獎(jiǎng),2010年IBM大規(guī)模數(shù)據(jù)分析創(chuàng)新獎(jiǎng),并于2009年獲得美國(guó)佛羅里達(dá)國(guó)際大學(xué)最高學(xué)術(shù)研究獎(jiǎng)。
可持續(xù)發(fā)展是世界對(duì)發(fā)展道路的審慎選擇,也是我國(guó)的基本發(fā)展戰(zhàn)略。隨著全球資源枯竭、環(huán)境惡化的日益嚴(yán)重以及人類文明的演進(jìn)和對(duì)生態(tài)保護(hù)理念的不斷深化,可持續(xù)發(fā)展已經(jīng)成為全球共識(shí),對(duì)這一領(lǐng)域的研究也越來(lái)越熱,日漸深入。
實(shí)現(xiàn)可持續(xù)發(fā)展的關(guān)鍵是如何制定合理的、能夠平衡環(huán)境、經(jīng)濟(jì)和社會(huì)需求的復(fù)雜決策。然而自然、社會(huì)、經(jīng)濟(jì)系統(tǒng)本身的高度復(fù)雜性、動(dòng)態(tài)性以及不確定性使得實(shí)現(xiàn)這一最優(yōu)或近似最優(yōu)的決策成為一個(gè)巨大的挑戰(zhàn)。目前,可持續(xù)發(fā)展戰(zhàn)略的實(shí)施仍然停留在政策驅(qū)動(dòng)的層面,如何落實(shí)到技術(shù)實(shí)戰(zhàn),成為切實(shí)實(shí)現(xiàn)可持續(xù)發(fā)展的瓶頸問(wèn)題。
近年來(lái)出現(xiàn)的計(jì)算可持續(xù)性(computational sustainability)是為解決可持續(xù)發(fā)展面臨的挑戰(zhàn)而出現(xiàn)的一個(gè)新興的跨學(xué)科研究領(lǐng)域[1,2],其目的是綜合應(yīng)用計(jì)算機(jī)科學(xué)、信息科學(xué)、運(yùn)籌學(xué)、應(yīng)用數(shù)學(xué)、統(tǒng)計(jì)學(xué)等多學(xué)科交叉技術(shù)來(lái)平衡環(huán)境、經(jīng)濟(jì)以及社會(huì)需求,以支持可持續(xù)的發(fā)展。計(jì)算可持續(xù)性研究涉及能源、生態(tài)、經(jīng)濟(jì)、環(huán)境等眾多學(xué)科,匯集了計(jì)算領(lǐng)域和各種具有悠久傳統(tǒng)的可持續(xù)性問(wèn)題,如生態(tài)多樣性、自然資源管理、生物與環(huán)境工程、資源經(jīng)濟(jì)學(xué)等。
計(jì)算可持續(xù)性研究的重點(diǎn)是針對(duì)可持續(xù)發(fā)展問(wèn)題,開(kāi)發(fā)計(jì)算模型、數(shù)學(xué)模型及相關(guān)方法,以幫助解決一些與可持續(xù)發(fā)展相關(guān)的最具挑戰(zhàn)性的問(wèn)題。計(jì)算可持續(xù)性研究涉及面極其廣泛,從野生動(dòng)物保護(hù)、生物多樣性到社會(huì)經(jīng)濟(jì)需求平衡、大規(guī)模環(huán)境布署以及再生能源的管理等都有涉及。如Cornell 大學(xué)的計(jì)算可持續(xù)性研究機(jī)構(gòu)(Institute for Computational Sustainability,ICS)采用計(jì)算的方法,對(duì)生態(tài)保護(hù)、物種遷移、人口分布等進(jìn)行研究,構(gòu)建數(shù)學(xué)模型并進(jìn)行優(yōu)化[3,4]。
大數(shù)據(jù)時(shí)代的來(lái)臨為可持續(xù)發(fā)展研究帶來(lái)新的機(jī)遇和挑戰(zhàn)。衛(wèi)星技術(shù)、傳感技術(shù)的發(fā)展日新月異,每天可以采集到的各類環(huán)境數(shù)據(jù)無(wú)時(shí)無(wú)刻不在增加。大數(shù)據(jù)蘊(yùn)含豐富的信息和潛在的知識(shí),給人們研究可持續(xù)發(fā)展開(kāi)辟了一個(gè)以數(shù)據(jù)為驅(qū)動(dòng)的全新的研究方式,將極大地促進(jìn)可持續(xù)發(fā)展研究[5,6]。
目前,數(shù)據(jù)驅(qū)動(dòng)的可持續(xù)發(fā)展研究已成為一個(gè)國(guó)際研究熱點(diǎn),各種會(huì)議正在持續(xù)熱烈地舉行。近年來(lái),在人工智能(artificial intelligence,AI)、機(jī)器學(xué)習(xí)(machine learning, ML)等國(guó)際權(quán)威學(xué)術(shù)會(huì)議上,每年都有關(guān)于可持續(xù)發(fā)展的專題研討。圖1給出了《人工智能》雜志2014年“計(jì)算可持續(xù)性(Comp Sust)”??l(fā)表的可持續(xù)與人工智能相關(guān)的文章主題,由此可以看到,越來(lái)越多的人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等方法被應(yīng)用到城市規(guī)劃、物種分布、政策制定、健康、農(nóng)業(yè)、交通、能源、智能電網(wǎng)等多種可持續(xù)性問(wèn)題研究中[7-9]。這些研究進(jìn)展預(yù)示著大數(shù)據(jù)將成為可持續(xù)發(fā)展研究中的重要技術(shù)支撐,基于數(shù)據(jù)驅(qū)動(dòng)的可持續(xù)發(fā)展問(wèn)題研究是一個(gè)很有潛力的研究方向,為解決生態(tài)、環(huán)境、經(jīng)濟(jì)等諸多可持續(xù)發(fā)展問(wèn)題提供以數(shù)據(jù)為驅(qū)動(dòng)的解決途徑,具有重要意義。
圖1 2014年《人工智能》雜志Comp Sust??l(fā)表的計(jì)算可持續(xù)性相關(guān)研究主題1
在大數(shù)據(jù)時(shí)代,計(jì)算可持續(xù)性研究同樣面臨著新的機(jī)遇和挑戰(zhàn)。一方面,大數(shù)據(jù)限制了研究者可以使用相對(duì)簡(jiǎn)單的分析技術(shù),已有的構(gòu)建和優(yōu)化這些模型的方法遇到了可擴(kuò)展性等挑戰(zhàn);另一方面,大數(shù)據(jù)所蘊(yùn)含的豐富信息和潛在知識(shí),將開(kāi)辟一個(gè)以數(shù)據(jù)為驅(qū)動(dòng)的全新的研究方式,可以幫助解決更加復(fù)雜、更大規(guī)模的計(jì)算可持續(xù)性問(wèn)題。筆者所帶領(lǐng)的研究團(tuán)隊(duì),在國(guó)內(nèi)率先開(kāi)展基于大數(shù)據(jù)的計(jì)算可持續(xù)性研究,研究思路如圖2所示。
圖2 基于大數(shù)據(jù)的可持續(xù)發(fā)展研究思路
綜合運(yùn)用各種大數(shù)據(jù)處理、大數(shù)據(jù)分析以及大數(shù)據(jù)挖掘技術(shù),解決大數(shù)據(jù)環(huán)境下計(jì)算可持續(xù)性面臨的問(wèn)題復(fù)雜性、計(jì)算效率、方法可擴(kuò)展性等挑戰(zhàn),并結(jié)合可持續(xù)發(fā)展中亟待解決的焦點(diǎn)問(wèn)題,開(kāi)展可持續(xù)發(fā)展應(yīng)用研究,整體研究框架如圖3所示。
在該研究思路和框架下,認(rèn)為大數(shù)據(jù)是應(yīng)用、算法、數(shù)據(jù)和平臺(tái)4個(gè)要素的有機(jī)結(jié)合,并通過(guò)理論、算法研究與實(shí)際問(wèn)題、應(yīng)用研究相結(jié)合,以平臺(tái)建設(shè)為支撐,將可持續(xù)發(fā)展研究從現(xiàn)有的政策驅(qū)動(dòng)真正落實(shí)到技術(shù)實(shí)施。下面以可持續(xù)發(fā)展中的一個(gè)焦點(diǎn)問(wèn)題——建筑環(huán)境影響評(píng)價(jià)為例,簡(jiǎn)要闡述上述研究思路的具體實(shí)施[10]。
圖3 基于大數(shù)據(jù)的計(jì)算可持續(xù)性研究框架
氣候變化與環(huán)境污染的首要因素是溫室氣體(green housegases,GHG)的排放,而建筑行業(yè)和建筑物正是產(chǎn)生GHG的主要來(lái)源之一[11]。在我國(guó),建筑環(huán)境影響更是城市化加速發(fā)展過(guò)程中無(wú)法回避的重要議題。目前,我國(guó)的建筑業(yè)仍處于高投入、高消耗換取高增長(zhǎng)的發(fā)展模式,給我國(guó)的生態(tài)環(huán)境帶來(lái)了巨大影響[12]。近年來(lái),我國(guó)碳排放和建筑揚(yáng)塵等導(dǎo)致霧霾天氣頻發(fā),嚴(yán)重影響了人們的正常生產(chǎn)和生活。開(kāi)展建筑環(huán)境影響評(píng)價(jià)有助于緩解日益突出的建筑發(fā)展與環(huán)境惡化之間的矛盾,具有重要意義。
圖4 基于數(shù)據(jù)驅(qū)動(dòng)的建筑環(huán)境影響評(píng)價(jià)模型
然而,目前廣泛使用的環(huán)境影響評(píng)價(jià)方法代價(jià)高昂,且僅能從建筑生態(tài)學(xué)的角度給出局部或簡(jiǎn)化的評(píng)價(jià)結(jié)果,無(wú)法充分利用海量、高維、異構(gòu)的建筑環(huán)境影響評(píng)價(jià)數(shù)據(jù)。對(duì)此,基于計(jì)算可持續(xù)性的研究理念,采用大數(shù)據(jù)挖掘技術(shù),提出了基于數(shù)據(jù)驅(qū)動(dòng)的建筑環(huán)境影響評(píng)價(jià)模型(如圖4所示)。在該模型中,利用基于約束的特征選擇研究解決環(huán)境熱點(diǎn)分析問(wèn)題;利用異構(gòu)社區(qū)發(fā)現(xiàn)、半監(jiān)督聚類集成研究降低大規(guī)模建筑環(huán)境影響評(píng)價(jià)的代價(jià);利用多重異構(gòu)聚類研究輔助綠色建筑設(shè)計(jì)指導(dǎo)。
在該研究中,建筑環(huán)境影響評(píng)價(jià)數(shù)據(jù)處理的難題被轉(zhuǎn)化為一系列特征選擇、分類、聚類的數(shù)據(jù)挖掘問(wèn)題,再通過(guò)構(gòu)建大規(guī)模分布式可持續(xù)發(fā)展數(shù)據(jù)處理平臺(tái),實(shí)現(xiàn)任務(wù)的分解與集成以及大規(guī)模算法的高效求解,從而利用大數(shù)據(jù)挖掘技術(shù)填補(bǔ)現(xiàn)有環(huán)境影響評(píng)價(jià)問(wèn)題中數(shù)據(jù)處理的缺陷,并大大降低已有評(píng)估方法所需的時(shí)間和代價(jià)。
在計(jì)算可持續(xù)性研究的框架下,可持續(xù)發(fā)展的關(guān)鍵問(wèn)題最終可以轉(zhuǎn)化成計(jì)算和信息科學(xué)領(lǐng)域的決策和優(yōu)化問(wèn)題。大數(shù)據(jù)技術(shù)使得計(jì)算可持續(xù)性研究中大規(guī)模、動(dòng)態(tài)、復(fù)雜問(wèn)題的建模和求解可以以數(shù)據(jù)驅(qū)動(dòng)的方式來(lái)解決,從而極大地提升了計(jì)算可持續(xù)性研究的效力并擴(kuò)展了其研究范圍,進(jìn)一步地,將可持續(xù)發(fā)展問(wèn)題從人們普遍認(rèn)為的政策驅(qū)動(dòng),真正落實(shí)到技術(shù)踐行。
[1] GOMES C P. Computational sustainability: computational methods for a sustainable environment, economy, and society[J]. The Bridge, 2009, 39(4):5-13.
[2] FRENKEL K A. Computer science meets environmental science[J]. Communications of the ACM, 2009, 52(9):23.
[3] CONRAD J, GOMES C, HOEVE W J V, et al. Connections in networks: hardness of feasibility versus optimality[C]// Proceedings of the Fourth International Conference on the Integration of AI and OR Techniques Constraint Programming, Brussels, Belgium, May 23-26, 2007. Berlin: Springer Berlin Heidelberg,2007:16-28.
[4] BARRETT C B, LITTLE P, CARTER M. Understanding and Reducing Persistent Poverty in Africa[M]. London:Routledge, 2008.
[5] 周綺鳳,李濤. 大數(shù)據(jù)與計(jì)算可持續(xù)性[J].南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版), 2015, 35(5): 20-31. ZHOU Q F, LIT. Big data and computational sustainability[J]. Journal of Nanjing University of Posts and Telecommunications(Natural Science), 2015, 35(5): 20-31.
[6] 李濤. 數(shù)據(jù)挖掘的應(yīng)用與實(shí)踐[M]. 廈門:廈門大學(xué)出版社,2013. LI T. Data Mining Where Theory Meets Practice[M]. Xiamen: Xiamen University Press, 2013.
[7] KRAUSE A,GOLOVIN D,CONVERSE S. Sequential decision making in computational sustainability via adaptive submodularity[J]. AI Magazine, 2014, 35(2):8-18.
[8] FINK D, HOCHACHK A W M, SORTE F A L, et al. Documenting stewardship responsibilities across the annual cycle for birds on US public lands[J]. Ecological Applications, 2015, 25(1): 39-51.
[9] MILA NOM, O’SULL IVA NB, GAVANELLI M. Sustainable polic y making: astrategic challenge for artificial intelligence[J]. AI Magazine, 2014, 35(3): 22-35.
[10] ZHOU Q, ZHOU H, ZHU Y, et al. Datadriven solutions for building environmental impact assessment[C]//Proceedings of IEEE International Conference on Semantic Computing (ICSC), Anaheim, C A,USA, February 7-9, 2015. Piscataway: IEEE Press, 2015: 316-319.
[11] COMSTOCK M, GARRIGAN C, POUFFARY S,et al. Building Design and Construction: Forging Resource Efficiency and Sustainable Development[R]. Technical Report, United National Environmental Program (UNEP), 2012.
[12] 2012-2016年中國(guó)建筑行業(yè)市場(chǎng)全景調(diào)研及投資價(jià)值分析研究報(bào)告[R/O L]. (2012-07).http://www.chinabgao.com/report/372466.html. Research report of the research and investment value analysis of the chinese construction industry market in 2012-2016[R/OL].(2012-07). http://www.chinabgao.com/report/372466.html.
TP399
A
10.11959/j.issn.2096-0271.2016013