王錚
(中國科學院科技政策與管理科學研究所 北京 100190華東師范大學地理信息科學教育部重點實驗室 上海 200062)
計算地理學是地理學的新興學科,正在獲得越來越多的應用,同時也越來越多地提出地理學的理論問題。對計算地理學的一般理解是:應用計算科學解決地理問題的學科。與早年的計量地理不同,計算地理學除了數(shù)據處理,還致力于建模、計算模擬模型、知識發(fā)現(xiàn)、算法和計算平臺等的研究。就如數(shù)學物理方法之于物理學一樣,計算地理學作為地理學的工具促進了地理學科的發(fā)展。
建模非常重要。在物理學中,模型的基本構架是理論性的,有牛頓第二定律、麥克斯韋方程、薛定諤方程??墒堑乩韺W缺少明確的方程,這就使得建模成為了地理學深入研究的一個障礙關。建模這一工作也就使得計算地理學承擔了一部分理論地理學的功能。
1970年代,以Wilson為代表的地理學家發(fā)起了第二次地理計量革命,提倡用物理學原理來建模,進而解釋地理現(xiàn)象。Wilson給出了成功的實例,用熱力學系統(tǒng)逼近地理系統(tǒng)。Wilson取得了成功,此后受這一成功的帶動,系統(tǒng)分析方法在地理學中迅速發(fā)展。80年代,Wilson繼續(xù)出版了用系統(tǒng)論方法分析地理問題的著作,例如他的Catastrophe Theory and Bifurcation:Applications to Urban and Regional Systems[1], 給 出了一種分析模式。1983年起,錢學森先生連續(xù)寫了許多封信給中國地理學家,提倡地理學應用系統(tǒng)方法。系統(tǒng)分析方法的優(yōu)點就是他的缺點,它可以對具體對象建立模型,但是離開這個具體,模型就沒有適應性了,系統(tǒng)論帶來的是方法學的進步。然而人們很快就發(fā)現(xiàn),系統(tǒng)論帶來的是思想革命而非方法革命,因為地理問題的復雜性,地理學即使建立了模型也往往難以解析求解。這就意味著地理學需要方法的改進。許多學者由此認為,第二次計量革命失敗了。
在地理學第二次計量革命發(fā)展的同時,地理信息系統(tǒng) (Geographical Information System,GIS)發(fā)展起來。地圖作為地理學分析的基本工具已經有數(shù)千年的歷史,它的第一次突破是洪堡發(fā)明了等值線。在信息技術發(fā)展的現(xiàn)代,地圖的延伸成為了地理信息系統(tǒng)。地理信息系統(tǒng)是1960年代發(fā)展起來的一門計算技術。最初的地理信息系統(tǒng),其最主要的作用是利用當時的計算機技術,提高空間數(shù)據的管理水平和處理水平。進入80年代,由于計算機技術的發(fā)展,尤其是PC機的出現(xiàn),GIS得到了快速發(fā)展,在許多領域得到了廣泛的應用。進入90年代,網絡的快速發(fā)展又進一步推動了地理信息系統(tǒng)的發(fā)展,網絡上的數(shù)據共享發(fā)布技術以及開放式GIS成為這一時期研究的熱點。地理信息系統(tǒng)的這種應用,立即暴露出它的基本形態(tài)——電子地圖的不足,GIS缺少分析功能。雖然GIS的出現(xiàn)在很大程度上增強了計算機的空間表達能力,但是GIS在某種程度上是地理學的一種倒退,因為它所提供的數(shù)據模型和分析方法從地理學意義來看并不豐富,不能滿足地理分析的要求,GIS系統(tǒng)連那些最早引起計量革命的地理問題也不能解決[2]。在這種情形下,地理信息系統(tǒng)的權威人士Goodchild提出了地理信息科學的概念[3]:他認為地理信息科學主要研究在應用計算機技術對地理信息進行處理、存儲、提取以及管理和分析過程中所提出的一系列基本問題?!胺治觥币辉~使得地理信息系統(tǒng)學科的發(fā)展需要模型,需要理論。因此在80年代開始冷寂的以建模為中心的第二次計量革命的余燼被發(fā)現(xiàn)蘊藏著巨大的熱量。把建模方法與計算機技術結合成為了新的潮流。就在Wilson任職的英國Leeds大學,Openshaw提出一個新概念:geocomputation,地理計算,并出版了第一本專著 Geocomputation:a Primer[4]。Openshaw和Abrahart[5]指出,地理計算是GIS的一種后繼發(fā)展,當GIS的數(shù)據庫建立起來并不斷擴展時,地理計算就開始起作用了。它是在科學研究范疇內,關于利用各種不同的地學數(shù)據以及開發(fā)相關方法的地學工具。Longley、Goodchild、Maguire[6]認為,在許多重要方面,地理計算和地理信息科學是同義詞,和其他的許多相似詞匯,如Geomatics/Geoinformatics、空間信息科學、地理信息工程等等,都意味著采用科學的方法來研究GIS和相關技術所帶來的基本問題。在后來的發(fā)展中,地理計算基本上以地理信息科學的分支或核心學科形式發(fā)展。
1998年Couclelis[7]提出根據操作數(shù)和運算的類型將地理計算分為4類:利用非空間運算來解決非空間問題(類型4);用非空間運算來解決空間問題(類型2);用空間運算來解決非空間問題(類型3)和用空間運算來解決空間問題(類型1)。關于空間運算來解決空間問題的典型代表是元胞自動機、形狀文法、分形自相似等。這種認識實際上提出了元胞自動機等的建模,這就意味著一種新的理論描述工具,不是牛頓的方程式,而是運算規(guī)則。這種運算規(guī)則,為地理學的理論提供了另外的描述工具,地理學可以以運算規(guī)則理論化,一個新的理論地理學時代開始了。這時,僅僅用地理計算表述新的學科不準確了,計算地理學(computational geography),一個包含著分析技術和包含著理論模式的學科開始了。
在后來的發(fā)展中,Gahegan(2002)認為地理計算中仍存在的問題是:(1)將地理“領域知識”變成工具以提高性能和可信度;(2)設計合適的地理算子(operators)來進行數(shù)據挖掘和知識發(fā)現(xiàn);(3)發(fā)展能夠計算跨越時空尺度的魯棒的聚類算法(clustering algorithms);(4)針對目前軟硬件還無法解決的復雜地理問題,提出可計算方法;(5)將地理現(xiàn)象可視化,提供虛擬現(xiàn)實范式(paradigm)幫助人們探索、理解地理現(xiàn)象,交流地理知識。Gahegan的思想最重要的一點是突破了“空間”的約束,而強調了時空??臻g是地理學的一個基本概念,但是這個概念優(yōu)勢成為了一種硬性的不合適的約束。例如中國地理學的一個重要成果,竺可楨的“中國近5000年氣候演化曲線”,研究的是一個時間過程,采用的是數(shù)據挖掘和知識發(fā)現(xiàn)的方法。按Gahegan的分類,竺可楨的研究永遠只能排斥在地理學的計算分析之外。在地理學中,存在大量的類似中國5000年氣候變化序列這樣的問題。這時中國地理學家陳述彭提出兩個概念,第一個是地球信息科學,他把計算地理學的分析范圍不再限定為“地理信息科學”,后者過分地依賴空間概念。另一個是“圖譜”,盡管人們以各種各樣理解來解說圖譜,圖譜本質上是物理學pattern。Pattern使得地理學的理論表述回到了統(tǒng)計物理學,理論正在完備化。
20世紀末興起的基于自主體的模擬方法,很快就深入到計算地理學中。基于自主體模擬(Agent-based Simulation,ABS)被認為是針對復雜系統(tǒng)的科學分析方法。所謂復雜系統(tǒng),就是有多種類型個體但是這些個體具有一定可識別性和自主行為,數(shù)量多但是不足以多到在宏觀觀察層面具有穩(wěn)定的統(tǒng)計特征的系統(tǒng),它的核心是自主體(agent)。自主體這個詞最初來自于人工智能領域[8],雖然之后被廣泛應用于計算機科學、經濟學、社會學、人類學、地理學、生物學等領域,它在性質上類似于統(tǒng)計物理學的粒子,與粒子相比它不僅具有原則上可統(tǒng)計的特征,而且具有感知和行為的能力,基于它們在系統(tǒng)中的角色、技能以及所處的環(huán)境,自主體具有自主的能力。
Wooldridge和 Jennings(1995) 認為,Agent應該具有以下特性:自主性(autonomy):Agent能夠在不受人類或者其他實體的直接干擾的情況下獨立操作,并且能夠在一定范圍內控制自己的行為與內在狀態(tài)。社交性 (social ability):Agent通過Agent交流語言與其他Agent進行交互。適應性(reactivity):Agent能夠感知環(huán)境,并能夠對環(huán)境的變化做出相應的反應。自發(fā)性(pro-activeness):Agent并不只是簡單地對環(huán)境做出反應,它能夠通過主動性的行為展開有目的的行為。
Franklin和Graesser[9]認為,自主體是處于一定環(huán)境下的一個系統(tǒng),它能感知環(huán)境并對環(huán)境做出反應。在時間演化中,自主體具有各自的事件流程,并以此影響到它們將來要感知的信息。王錚、吳靜、楊念[10]則從物理學角度認識自主體:單個自主體具有個性:自主體系統(tǒng)中的個體或者說粒子,具有自身區(qū)別于其他個體的關鍵屬性,這種屬性是具有標識性的。借助這種屬性,我們可以對任何單個粒子進行跟蹤,在時間序列上同步獲得粒子的狀態(tài)。另外,自主體粒子總是按照自己的“思想意識”來進行決策,不同的個體具有不同的行為決策過程,由此得到的行為方式不同于一般布朗粒子或者不可辨識的全同粒子;其次,自主體間具有關聯(lián)性:在一般物理系統(tǒng)中粒子被強調作獨立隨機運動,在自主體體系中,更多地強調自主體之間的聯(lián)系,實際上正是這種聯(lián)系使得自主體模擬具有一般粒子分析不能達到的結果。雖然單個粒子的“思想”、“行為”是具有個性的,但是在粒子進行決策之前,粒子往往需要充分獲取環(huán)境中其他粒子的狀態(tài)以作為自身行為決策的參考因素。也就是說,環(huán)境中的粒子相互之間是關聯(lián)的關系,一個粒子的狀態(tài)會影響到其他粒子的行為決策。這與粒子的個性并不矛盾,關聯(lián)性為粒子提供決策所需的信息,在獲得足夠多的信息之后,粒子的個性即體現(xiàn)在它們之間不同的行為方式上。
總之,自主體是一個自主的、自我行為的實體,它們通過使用可支配資源以實現(xiàn)目標集合。由于自主體這種特性,用它就可以描述有大量個性個體構成地理系統(tǒng)的內部行為,因此基于自主體的算法就可以模擬地理現(xiàn)象,特別是一些空間信息,比如聚集、擴散。因此基于自主體的模擬就成為計算地理學的主要方法?,F(xiàn)代計算地理學,正在以基于自主體的模擬ABS為骨干。
展覽室內,毛主席像章滿墻、滿柜。墻上一個個鏡框里,用像章拼成的毛主席詩詞、題字與五角星、紅太陽、長城、長征路線等圖案,琳瑯滿目。毛主席塑像、毛主席著作與紅寶書等等,不勝枚舉。64歲的收藏家、館長李建明頭發(fā)斑白,背稍微駝,面帶微笑,指點講述。
ABS作為一種非數(shù)值計算方法,也就繞過了傳統(tǒng)的理論表達的方程式,它以個體行為特征及其活動約束來構成理論基礎,地理學關于地理學現(xiàn)象的各種經驗認識,都可以成為各自主體行為規(guī)則,構成理論地理學元素。這就為理論地理學開辟了一條新的模型道路。而ABS又作為一種算法解決模型的求解。在過去的理論地理學中,即使得到模型,也不可能得到解析解,只能數(shù)值求解。現(xiàn)在借助ABS的理念和計算機,可以得到理性的和定量的認識。ABS因此從根本上開拓了理論地理學。
到目前為止,帶有理論地理學特色的計算地理學形成了如下一系列分支。
王錚等[11]認為,計算地理學的數(shù)據挖掘是從地理學問題出發(fā),對各種數(shù)據作地理學的模型處理、結果計算、發(fā)現(xiàn)地理知識的過程。地理數(shù)據與其他方面的數(shù)據不同之處在于:它具有空間屬性。這些數(shù)據除了具有明顯的含義之外,還有豐富的隱含意義,需要通過分析或挖掘才能顯示。常見的地理數(shù)據挖掘的問題范疇包括數(shù)據恢復、信號提取、指標的權重估計、地理事物關聯(lián)分析、地理演變特征分析、地理結構特別是空間結構發(fā)現(xiàn)。以遙感圖像為例,遙感圖像的去云彩處理就是數(shù)據恢復,遙感圖像增強就是信號提取,遙感圖像聚類分析就是聯(lián)系分析。
空間運籌是計算地理學的另一個主要領域。1970—1980年代末期地理學研究領域引進了規(guī)劃方法、網絡分析方法和決策方法等運籌學方法,并吸收了系統(tǒng)分析方法、系統(tǒng)優(yōu)化方法等現(xiàn)代系統(tǒng)學方法,在此環(huán)境中空間運籌學逐步形成,并向著更為嚴密的理論方向發(fā)展。一方面,地理學為運籌學提供了研究問題的空間,擴大了其研究的范圍和深度;另一方面,運籌學為地理學中的空間管理問題提供了技術解決手段。90年代以后,隨著計算機技術和GIS的迅速發(fā)展,使用運籌學的方法處理大數(shù)據量空間問題成為可能??臻g運籌學在地理學中的運用已越來越廣泛,涉及軍事、物流管理、環(huán)境管理以及設施區(qū)位等方面。目前的發(fā)展是向著選擇算法更簡單、精度更高,問題更為繁瑣的方向發(fā)展,力圖解決更多實際問題??梢灶A測的是,隨著風險管理思想的引入,空間運籌理論將會有突破,而且由此發(fā)展地理學的一些理論學科,實際上地理學的經典理論——區(qū)位論,就是借助空間運籌的發(fā)展,形成了設施區(qū)位理論這一新分支,被應用于城市與區(qū)域規(guī)劃、軍事地理等領域。
在計算地理學中不可忽視的是數(shù)值模擬。數(shù)值模擬以方程為基礎,例如我們經常提到的地貌學計算,其很多計算基于原理清楚的動力學方程?;谠砬宄膭恿W,是科學計算的主流,在地理學的水文分析、氣候分析、生態(tài)分析、經濟地理分析都有廣泛的應用,例如洪水災害的淹沒范圍、滑坡災害的發(fā)生臨界值、氣候變化的區(qū)域影響、企業(yè)競爭的區(qū)位共軛都離不開數(shù)值模擬。當然,由于地理問題的復雜性,特別是邊界條件難于確定,往往是數(shù)值計算勞而無功,但是這可以隨著理論的完善,計算技術的提高來完成。在這方面,數(shù)學方程模型,往往作為科學的數(shù)據基礎,為許多地理數(shù)值計算提供支撐。
非數(shù)值計算是近年最熱門的研究領域之一。所謂非數(shù)值計算是依賴計算機的高速計算性能及其大容量存取技術,通過關系運算來求解問題的計算方法。關系運算不同于傳統(tǒng)基本代數(shù)運算(如加、減、乘、除),而是在給定前提條件下進行的邏輯運算。常見的非數(shù)值計算包括神經網絡算法、進化算法、元胞自動機算法和基于自主體模擬等。這里主要討論基于自主體的算法的地理學意義。
自主體模擬的亞類元胞自動機。這種方法把空間劃分為若干單元,賦予每個單元在外界刺激或者相互作用下的變化規(guī)則,因此適合描述地理現(xiàn)象。從20世紀80年代開始,它被用于描述城市的發(fā)展。此后,由于GIS技術的發(fā)展,元胞自動機方法被廣泛地應用。
多自主體系統(tǒng)以較元胞自動機更優(yōu)越的自主性、智能性、可移動性、動態(tài)性受到了學術界的青睞,現(xiàn)在多自主體模擬方法已經被用于模擬許多現(xiàn)象,特別是城市社會現(xiàn)象、人口地理現(xiàn)象、產業(yè)創(chuàng)新擴散甚至經濟危機及經濟管治的研究中。在2000年以后,自主體模擬成為科學研究的一種主體方法。
關于ABS作為地理學方法,目前主要的問題還不在于與GIS的結合,而是發(fā)展適合地理現(xiàn)象的模型,這就是一種理論探索。例如在地理系統(tǒng)中,企業(yè)作為自主體個體,它們又組織為區(qū)域,區(qū)域作為一種特殊組實行同一政策,分別影響個體,這就意味著自主體系統(tǒng)分為了兩層。這種含層結構的模型需要新的自主體理論和軟件包。
地理計算平臺由于其兼顧時間和空間要素的建模特點,正在各行各業(yè)得到逐步的推廣。地理計算平臺的開發(fā)是一個系統(tǒng)工程,需要基于軟件工程理論,全面了解用戶需求,合理選擇模型的接口,科學設計平臺界面,定期維護平臺的運行。只有建立用戶友好、模型科學、數(shù)據完備、高效計算的地理計算平臺,才能為各個領域的用戶提供真正有價值的決策支持。
目前流行的地理計算平臺按類型分有:地理信息管理平臺,即常規(guī)GIS;地理規(guī)劃平臺,即在常規(guī)GIS基礎上疊加空間運籌功能的計算平臺,支撐地理空間規(guī)劃;地理過程模擬平臺,支撐地理過程的模擬,如國際上一些水文、氣候過程模擬,在這個平臺中,GIS已經蛻化為信息顯示模塊;實驗人文地理學平臺,是本文作者提出的新型平臺類型,該平臺利用GIS構成一個虛擬地理環(huán)境,針對某些人文現(xiàn)象,設計實驗,讓現(xiàn)實的人在虛擬地理環(huán)境中做出行為選擇,發(fā)現(xiàn)人文地理規(guī)律,檢驗人文地理理論。
地理計算平臺的開發(fā),實際上已經成為地理信息科學主要應用領域。
顧名思義,高性能計算(HPC,High Performance Computing)指的是利用高性能計算系統(tǒng)來解決問題。計算機是一種多功能的機器,可以用于科學和工程中的計算,可以用于數(shù)據存儲,也可以用于網絡服務,不同的功能需求對于性能的定義是不一樣的,因此衡量計算系統(tǒng)性能高低的標準并不唯一。本文所討論的計算性能的高低,指的是科學和工程計算的性能。地理計算在許多場合涉及大規(guī)模計算問題,因此地理計算與高性能計算密切聯(lián)系。事實上,多年來高性能計算都被列為Geocomputation年會的主題。
高性能計算中的許多問題是計算機科學問題,但是也存在一些地理學約束系統(tǒng)如何組織高性能地理計算的問題,這就引出地理計算模式問題。計算技術領域積累了許多成功的計算模式,如共享內存(Shared Memory)計算模式、主從(Master-Worker)計算模式、客戶機/服務器(Client/Server,C/S)模式、瀏覽器/服務器(Browser/Server,B/S)模式、點對點(Peer-to-Peer,P2P)模式等等。針對網格計算環(huán)境,典型的計算模式包括主從計算、C/S計算、匯聚計算、點對點計算等。這些模式如何與地理學計算特色結合,還在研究中。
計算地理學作為一個新興學科,不僅是一個方法性學科,而且從根本上創(chuàng)新了地理學思想和分析模式。長期以來,由于地理學對象的復雜性,基于解析動力學過程的經典理論物理學思維在地理學領域遭遇了眾多困難,計算地理學為克服這些困難提供了途徑,因此它將促進理論地理學的發(fā)展。計算地理學的出現(xiàn),也將從根本上改變地理學在理論上依賴于其他學科的局面,形成一個更具自我創(chuàng)新特色的科學學科。王錚、吳靜等的《計算地理學》[12]對這一學科開展了系統(tǒng)的探索。
1 Wilson A E.Catastrophe Theory and Bifurcation:Applications to Urban and Regional Systems.London:Croom Held Ltd.,1981.
2 Gahegan M.What is GeoComutation?A history and outline.2002.www.geocomputation.org
3 Goodchild M F.Geographical information science.International Journal of Geographical Information Science,1992,6(1):31-45.
4 Openshaw S.Geocomputation:A Primer.Chichester:Wiley,1998.
5 Openshaw S,Abrahart R J.Geocomputation.Taylor and Francis,2004.
6 Longley P A,Goodchild M F,Maguire D J et al.Geographic Information Systems and Science.(2nd Edition).Chichester:Wiley,2005.
7 Couclelis H.Geocomputation and space.Environment and Planning B:Planning and Design(Anniversary Issue),1998:41-47.
8 Wooldridge M,Jennings N R.Intelligent agents:theory and practice.Knowledge Engineering Review,1995,10(2):115-152.
9 Franklin S,Graesser A.A Software Agent Model of Consciousness.Consciousness and Cognition,1999,8(3):285-301.
10 王錚,吳靜,楊念.多自主體在地理學中應用的回顧與展望.復雜系統(tǒng)與復雜性科學,2005,2(3):52-60.
11 王錚,隋文娟,姚梓璇等.地理計算及其前沿問題.地理科學進展,2007,(4):1-10.
12 王錚,吳靜等.計算地理學.北京:科學出版社,2011.