劉 瑜,郭 浩,李海峰,董衛(wèi)華,裴 韜
1.北京大學(xué)遙感與地理信息系統(tǒng)研究所,北京 100871;2.北京大學(xué)人工智能研究院,北京 100871; 3.中南大學(xué)地球科學(xué)與信息物理學(xué)院,湖南 長沙 410083;4.北京師范大學(xué)地理科學(xué)學(xué)部,北京 100875;5.中國科學(xué)院地理科學(xué)與資源研究所資源與環(huán)境信息系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室,北京 100101
地理異質(zhì)性是地理學(xué)科存在的基礎(chǔ),因?yàn)榈乩韺W(xué)的最初目的就是為了描述不同地理單元的人文與自然屬性。近代以來,該傳統(tǒng)被康德、赫特納、哈特向等一直強(qiáng)調(diào),形成了地理學(xué)研究源遠(yuǎn)流長的區(qū)域傳統(tǒng)。如康德指出,地理學(xué)研究特定具體事物中的關(guān)系,而不是事物抽象的一般特性,并且集中注意力于自然的差異性,而不是相似性[1];哈特向則認(rèn)為“地理學(xué)關(guān)心的是提供地球表面各種性質(zhì)精確的、有條理的、合理的描述與解釋”[2]。然而,如果地理學(xué)的目的僅是為了描述不同地理要素的空間分布,那么它很難成為真正意義的現(xiàn)代科學(xué),而更像是博物學(xué)。這一點(diǎn),與其他地球科學(xué)(如地質(zhì)學(xué))相比存在很大區(qū)別。盡管后者也是試圖去描述人類獨(dú)一無二的家園——地球,但是由于其研究對(duì)象的時(shí)空尺度通常大于地理學(xué),因此存在太多的未知現(xiàn)象作為其研究目標(biāo),從而符合科學(xué)的“探索未知”屬性。作為對(duì)比,地理學(xué)的研究對(duì)象分布于人類最為熟悉的地球表層。地理大發(fā)現(xiàn)的時(shí)代早已過去,人類的足跡已經(jīng)遍布地表的各個(gè)角落,遙感技術(shù)又為全面、高分辨率認(rèn)識(shí)我們的星球提供了有力的技術(shù)手段。因此,如果地理學(xué)還是停留于描述地理事物和現(xiàn)象的空間分布,則其學(xué)科價(jià)值將大大降低。
在此背景下,地理研究產(chǎn)生了對(duì)于一般性地理規(guī)律、地理法則探索的需求[3]。其意義一方面在于幫助人類理解地理分布及其演化背后的驅(qū)動(dòng)機(jī)制;另一方面,從地理空間的角度也有助于在不同地理單元間遷移知識(shí),從而做出正確預(yù)測(cè)。在以物理學(xué)為代表的現(xiàn)代自然科學(xué)中,對(duì)稱性被認(rèn)為是物質(zhì)世界所遵循的基本規(guī)律之一。如果一條地理規(guī)律具有時(shí)空平移對(duì)稱性,則可以被認(rèn)為是一般的普適性規(guī)律,并且具有可復(fù)現(xiàn)性(replicability)[4-6]。可復(fù)現(xiàn)性使得用戶可以將在給定地區(qū)發(fā)現(xiàn)的規(guī)律和法則應(yīng)用于另一個(gè)地區(qū),并與當(dāng)?shù)鼐唧w情況相結(jié)合,從而得到關(guān)于該地區(qū)的新的知識(shí)。例如,將一個(gè)區(qū)域分析得到的坡度、巖性、植被覆蓋等參數(shù)與滑坡風(fēng)險(xiǎn)之間的定量關(guān)系,遷移到新的區(qū)域,并對(duì)該區(qū)域的滑坡風(fēng)險(xiǎn)進(jìn)行評(píng)估和制圖,這正是地理學(xué)研究的意義所在。這種研究范式蘊(yùn)含了一個(gè)地理事實(shí):對(duì)于特定感興趣的地理變量,其影響變量的空間環(huán)境配置越相似,則該變量的值越接近,該事實(shí)被文獻(xiàn)[7]用地理學(xué)第三定律加以概括。
對(duì)普適性規(guī)律的追求,有兩個(gè)方向的產(chǎn)出。第1類偏于機(jī)理揭示,這類規(guī)律通常是基于現(xiàn)象的空間分布,運(yùn)用其他領(lǐng)域的法則,解釋所觀測(cè)到的空間分布模式。例如,不同類型土壤的空間分布,促使土壤學(xué)家從母質(zhì)、氣候、植被等要素出發(fā),利用物理的、化學(xué)的、生物的規(guī)律,解釋不同類型土壤的成因。很明顯,這些規(guī)律本身與空間無關(guān)。上述研究范式使得不同地理要素研究的學(xué)科脫離地理學(xué),是造成地理學(xué)空心化的主要原因。第2類稱為唯象模型,它試圖形式化地理現(xiàn)象的空間分布模式,或在空間框架中構(gòu)造“黑箱化”的解釋[8]。一個(gè)典型的例子是預(yù)測(cè)空間交互的重力模型,其中引入了刻畫空間最重要的參數(shù)——距離。而重力模型已經(jīng)被廣泛應(yīng)用于如四階段法交通流規(guī)劃的應(yīng)用中,說明了該模型的普適性。
在地理學(xué)中,關(guān)于特殊性和規(guī)律性對(duì)立的討論由來已久,而舍費(fèi)爾與哈特向之爭是體現(xiàn)這個(gè)對(duì)立的重要事件[3,9]。舍費(fèi)爾主導(dǎo)的方向即對(duì)地理例外論的批判,在一定程度上推動(dòng)了計(jì)量革命的出現(xiàn)。計(jì)量革命時(shí)代的成果與同時(shí)代計(jì)算機(jī)技術(shù)相結(jié)合,推動(dòng)了地理信息系統(tǒng)的進(jìn)步[10]。值得指出的是,地理信息系統(tǒng)在繼承計(jì)量革命成果的同時(shí),也在積極吸收相鄰學(xué)科的成果,典型的如源于地質(zhì)學(xué)的地統(tǒng)計(jì)學(xué)[11]。
地理信息系統(tǒng)通過提供豐富的空間分析工具,體現(xiàn)了具有一般性的地理規(guī)律。插值方法可以視為一類空間預(yù)測(cè)手段,有很多具體的實(shí)現(xiàn)方式,如距離倒數(shù)權(quán)重方法,被廣泛應(yīng)用于DEM數(shù)據(jù)的生成,而與數(shù)據(jù)分布的具體區(qū)域無關(guān),換言之,距離倒數(shù)權(quán)重插值方法所形式化的地理規(guī)律是普適的。具體而言,它正是實(shí)現(xiàn)了Tobler地理學(xué)第一定律所陳述的空間鄰近對(duì)于地理現(xiàn)象屬性分布的影響。此外,GIS支持下的分析方法兼顧了地理特殊性和規(guī)律性,如地理加權(quán)回歸[12],也體現(xiàn)了地理學(xué)研究在特殊性和普遍性之間的折中[13]。
考察地理現(xiàn)象的空間分布特征,有助于理解空間異質(zhì)性和普遍規(guī)律性之間的關(guān)系。圖1(a)、(b)展示了某區(qū)域的高程及人口密度分布,兩種數(shù)據(jù)都很“自然”,地理空間分析中經(jīng)常會(huì)處理這類數(shù)據(jù)。它們表達(dá)了不同地理現(xiàn)象的分布,體現(xiàn)了空間異質(zhì)性。然而,如果仔細(xì)觀察會(huì)發(fā)現(xiàn),它們并不是完全無規(guī)律的。在數(shù)字高程模型中,空間上相近的區(qū)域,高程(或坡度、坡向)也相似,從而使得我們能夠很容易識(shí)別出一些有意義的面狀地形單元,如山脊、山谷等;同樣的,在人口分布中,也很容易發(fā)現(xiàn)一些高密度的城市化區(qū)域。這種地理現(xiàn)象的分布特征被托布勒地理學(xué)第一定律所刻畫,即大量地理現(xiàn)象的分布呈正的空間自相關(guān)??臻g自相關(guān)對(duì)于地理研究和空間分析方法構(gòu)建的意義至關(guān)重要。為了闡述這一點(diǎn),可以假定一種極端的情形,即對(duì)于某種地理現(xiàn)象,不存在空間自相關(guān)。如圖1(c)所示,任意一點(diǎn)的屬性都與周邊位置的屬性差異很大,這使得不可能識(shí)別出區(qū)內(nèi)相似程度較高的地理單元,并進(jìn)行歸納總結(jié),進(jìn)而提取有意義的分布模式。同樣地,對(duì)于這種極端分布的地理現(xiàn)象,很多分析方法(如空間插值)不再有效,因?yàn)闊o法根據(jù)已知周圍點(diǎn)的數(shù)值,內(nèi)插得到一個(gè)未知點(diǎn)的數(shù)值。大量地理研究的目標(biāo)是對(duì)特定區(qū)域進(jìn)行區(qū)劃,而能夠進(jìn)行這種分析,正是由于在空間異質(zhì)性的基礎(chǔ)上存在受距離影響的相對(duì)的相似性。值得指出的是,地理現(xiàn)象的空間分布也不是完全規(guī)則的(圖1(d)),如果地理現(xiàn)象分布可以用簡單的數(shù)學(xué)函數(shù)表達(dá),地理學(xué)家的任務(wù)將變得異常簡單,這樣地理學(xué)存在的意義也將大大降低。正是由于真實(shí)的地理現(xiàn)象分布是兩種極端情形的中間狀態(tài),給地理分析帶來了復(fù)雜性和難度,也使得地理信息系統(tǒng)的實(shí)現(xiàn)要兼顧特殊性和一般性。
圖1 真實(shí)的地理現(xiàn)象分布和虛擬的地理現(xiàn)象分布
科學(xué)研究的目的是發(fā)現(xiàn)科學(xué)規(guī)律,大量的科學(xué)規(guī)律,尤其是物理學(xué)中的規(guī)律是確定性的,并且可以表達(dá)為數(shù)學(xué)公式,如牛頓第二定律F=ma。確定性規(guī)律的優(yōu)勢(shì)在于可以準(zhǔn)確做出預(yù)測(cè),并且能夠驗(yàn)證;當(dāng)發(fā)現(xiàn)反例時(shí),就需要否定相應(yīng)的規(guī)律,或?qū)σ?guī)律進(jìn)行修改。通常對(duì)規(guī)律進(jìn)行修改的方式是對(duì)其進(jìn)行擴(kuò)展,使其能夠容納反例。假定有兩條規(guī)律L1和L2,形式化為L1:?x∈S1,P1(x)和L2:?x∈S2,P2(x),如果L1的論域S1是L2論域S2的子集,即S1?S2,而謂詞P1(x)蘊(yùn)含P2(x):?xP1(x)→P2(x),則L1表達(dá)了比L2更特殊的規(guī)律,而L2是L1的擴(kuò)展和泛化。規(guī)律擴(kuò)展的一個(gè)經(jīng)典例子就是牛頓力學(xué)和愛因斯坦相對(duì)論之間的關(guān)系,前者可認(rèn)為是后者在低速運(yùn)動(dòng)系統(tǒng)中的一個(gè)近似。
當(dāng)然,一個(gè)規(guī)律也可以用定性的方式表達(dá),這在社會(huì)科學(xué)中尤為常見,地理學(xué)第一定律也采用了定性的方式描述,其中的“距離近”“關(guān)聯(lián)性強(qiáng)”定性表達(dá)了程度的強(qiáng)弱。一條定量的規(guī)律可以擴(kuò)展為定性方式的表達(dá)。如給定兩個(gè)變量x和y,假定有如下3條描述其關(guān)系規(guī)律的謂詞:P1:y=2x,P2:y和x正相關(guān),P3:y與x相關(guān),很明顯有P1→P2→P3。定性規(guī)律的缺點(diǎn)是難以基于它進(jìn)行預(yù)測(cè),如根據(jù)“y和x正相關(guān)”和給定的x值,無法確定y的數(shù)值。然而定性模型的優(yōu)勢(shì)在于其泛化能力,即適用范圍通常更廣。定性規(guī)律相對(duì)寬松的表述使得尋找反例并打破規(guī)律變得困難。盡管預(yù)測(cè)能力相對(duì)較弱,定性模型依然可以幫助我們理解一個(gè)系統(tǒng)背后的關(guān)鍵驅(qū)動(dòng)因子,從而提供可理解性。因此,盡管我們認(rèn)為一個(gè)好的規(guī)律應(yīng)該兼具預(yù)測(cè)性和可理解性,像物理學(xué)中大部分規(guī)律那樣,但是預(yù)測(cè)性和可理解性分離的法則也應(yīng)該是可以接受的[14]。
人類智能具有很強(qiáng)的歸納、泛化、類比能力,從而能夠發(fā)現(xiàn)規(guī)律,學(xué)習(xí)知識(shí)。梭羅認(rèn)為“所有對(duì)于真理的認(rèn)識(shí)都是通過類比得來的”。由于泛化和類比能力,人們很容易將基于個(gè)體得到的知識(shí)恰當(dāng)?shù)胤夯揭粋€(gè)類別;或從一個(gè)小的類別泛化到大的類別。例如,一個(gè)人吃到美味的水果后,得到的知識(shí)通常不局限于“這個(gè)水果”好吃,而是“這一類水果”好吃。當(dāng)我們?cè)诘乩砜臻g的框架下去理解上述泛化學(xué)習(xí)過程時(shí),就形成了地理研究的基本方法論:從描述局部的地理現(xiàn)象分布開始,得到局部的規(guī)律,進(jìn)而對(duì)規(guī)律進(jìn)行擴(kuò)展,使其能夠泛化到更多的區(qū)域,從而得到更一般的乃至全局的普適規(guī)律。當(dāng)然,一個(gè)過于泛化的法則可能在實(shí)踐中沒有價(jià)值,我們可以控制規(guī)律擴(kuò)展的約束,使其僅適用于局部,從而形成泛化邊界。
地理學(xué)關(guān)注區(qū)域特性,較少將地球作為一個(gè)整體研究。因此,基于上述框架,可以重新認(rèn)識(shí)地理學(xué)的空間異質(zhì)性和規(guī)律性。由于空間異質(zhì)性,普適的地理規(guī)律相對(duì)而言難以構(gòu)建。然而,在不同的位置可以有相應(yīng)的局部規(guī)則,只要該規(guī)則在一個(gè)足夠大的空間范圍內(nèi)適用,我們就可以應(yīng)用它進(jìn)行空間預(yù)測(cè)。盡管如此,這并不意味著尋求普適的一般性規(guī)律是不可能的任務(wù)。只要我們對(duì)規(guī)律進(jìn)行擴(kuò)展,即使這樣的規(guī)律從進(jìn)行預(yù)測(cè)的角度而言價(jià)值不高,但是依然可以幫助我們認(rèn)識(shí)時(shí)空模式及影響因素,從而具有高的可理解性。從這個(gè)角度,托布勒第一定律是一條完全合格的規(guī)律——盡管它不是直接表示為數(shù)學(xué)公式。但是在不同的區(qū)域,針對(duì)不同的目的,它可以指導(dǎo)構(gòu)建不同的數(shù)學(xué)模型,如距離倒數(shù)權(quán)重插值[15]。
此外,需要指出的是,大部分地理研究并沒有天然的分析單元。在一個(gè)區(qū)域得到的規(guī)律,依賴于該區(qū)域的空間單元?jiǎng)澐址绞剑瑥亩a(chǎn)生了可變面積單元問題(modifiable areal unit problem,MAUP)[16],尤其是基于空間延展型變量進(jìn)行的分析,MAUP問題更為明顯。此外,不確定性地理語境問題(uncertain geographic context problem)[17]同樣也會(huì)影響所建立的模型。這進(jìn)一步增加了發(fā)現(xiàn)普適性法則的難度:即使針對(duì)同一研究區(qū)域,也會(huì)得到不同的規(guī)律。哪條規(guī)律更為正確取決于空間單元的劃分及空間語境的確定。
因此,討論一條地理規(guī)律時(shí),需要同時(shí)確定其謂詞的泛化性,以及適用的空間范圍和相應(yīng)的空間配置參數(shù),如空間劃分方式和空間語境。同樣的,討論地理發(fā)現(xiàn)的可復(fù)現(xiàn)性時(shí),需要考慮對(duì)于規(guī)律的擴(kuò)展和泛化。一條嚴(yán)格的規(guī)律,如果通過擴(kuò)展,適當(dāng)放松其定義,就可以在更大的空間范圍或另一個(gè)場(chǎng)所再現(xiàn),這可以稱為一種“弱可復(fù)現(xiàn)性”[18]。
地理空間人工智能(GeoAI)是地理學(xué)與人工智能交叉的研究領(lǐng)域,致力于引進(jìn)最新的人工智能技術(shù)方法,提升地理科學(xué)的研究能力[19-20],并延伸至地理信息獲取的能力[21]。而地理研究的重要任務(wù)之一是探求一般性的普適規(guī)律,這使得針對(duì)特定區(qū)域研究得到的結(jié)論面臨著“該結(jié)論在多大程度上能夠應(yīng)用到其他區(qū)域”的可復(fù)現(xiàn)性問題。該問題與人工智能技術(shù)中的可泛化性、可解釋性密切相關(guān)。因此,實(shí)現(xiàn)地理空間人工智能,需要充分認(rèn)識(shí)地理規(guī)律及其可復(fù)現(xiàn)性問題。
機(jī)器學(xué)習(xí)是實(shí)現(xiàn)人工智能的核心技術(shù)之一,近年在人工智能領(lǐng)域取得的眾多突破主要源于以深度神經(jīng)網(wǎng)絡(luò)為代表的機(jī)器學(xué)習(xí)方法的進(jìn)步。機(jī)器學(xué)習(xí)是指利用特定算法,針對(duì)特定任務(wù),基于訓(xùn)練數(shù)據(jù)和預(yù)定義的性能指標(biāo),不斷提升完成該任務(wù)能力的計(jì)算機(jī)程序。機(jī)器學(xué)習(xí)可以解決的問題很多,但是最基本的兩個(gè)應(yīng)用是分類和回歸,這兩類問題在地理學(xué)研究中十分常見。分類和回歸分析的主要目的是發(fā)現(xiàn)數(shù)據(jù)中的模式和規(guī)律,并識(shí)別驅(qū)動(dòng)因素(可理解性),進(jìn)而支持相應(yīng)的預(yù)測(cè)分析(預(yù)測(cè)性)。一個(gè)典型的地理學(xué)應(yīng)用就是房價(jià)回歸分析,即在房價(jià)和一組變量(如面積、戶型、區(qū)位等)之間建立數(shù)學(xué)關(guān)聯(lián)關(guān)系,從而發(fā)現(xiàn)解釋房價(jià)的關(guān)鍵因子,同時(shí)預(yù)測(cè)在特定解釋變量組合下的房價(jià)。
在機(jī)器學(xué)習(xí)訓(xùn)練過程中,泛化和過擬合是需要關(guān)注的基礎(chǔ)問題之一。一個(gè)過擬合的模型對(duì)于訓(xùn)練數(shù)據(jù)具有很好的擬合優(yōu)度,但是不具備良好的泛化能力,即不能很好地處理特征空間中訓(xùn)練樣本之外的情形,如圖2所示。通常,一個(gè)過擬合的模型需要更多的參數(shù)。根據(jù)“奧卡姆剃刀原則”,我們傾向選擇參數(shù)更少、能達(dá)到較高擬合優(yōu)度的模型。在實(shí)際應(yīng)用中,過擬合標(biāo)準(zhǔn)并不易確定。如果目的僅限于對(duì)訓(xùn)練樣本對(duì)應(yīng)特征空間內(nèi)的情形進(jìn)行預(yù)測(cè),則一個(gè)適度過擬合的模型是可以接受的;但是,若要追求一個(gè)較大范圍內(nèi)適用的模型,就必須避免過擬合的出現(xiàn)。
圖2 機(jī)器學(xué)習(xí)中的欠擬合和過擬合
用機(jī)器學(xué)習(xí)思想重訪地理研究中的規(guī)律發(fā)現(xiàn)和可復(fù)現(xiàn)性可以發(fā)現(xiàn),一個(gè)針對(duì)特定區(qū)域的研究就是建立該區(qū)域的機(jī)器學(xué)習(xí)模型,從而解釋、預(yù)測(cè)感興趣地理空間變量(如房價(jià)、PM2.5濃度)的時(shí)空格局。但如前所述,地理研究的一個(gè)重要使命是探求更一般的普適性規(guī)律,這使得針對(duì)特定區(qū)域研究得到的結(jié)論面臨著“該結(jié)論在多大程度上能夠泛化到其他區(qū)域”的問題。從更大的空間范圍而言,考慮到地理異質(zhì)性的存在,針對(duì)一個(gè)區(qū)域構(gòu)建的模型更傾向是“過擬合”的。因此,根據(jù)第2節(jié)的論述,當(dāng)需要將基于特定區(qū)域觀測(cè)數(shù)據(jù)得到的模型擴(kuò)展到其他區(qū)域時(shí),需要對(duì)模型進(jìn)行松弛,如減少參數(shù)的數(shù)量,從而提升泛化能力。
假設(shè)我們基于一定的觀測(cè)數(shù)據(jù)歸納得到了一條局部適用的地理知識(shí),一個(gè)自然的問題是,我們的發(fā)現(xiàn)是否可以遷移到其他位置,即這條知識(shí)在多大程度上是空間可泛化的。解答這一問題需要更大范圍的觀測(cè)數(shù)據(jù)。假定整個(gè)研究區(qū)(如全國)的觀測(cè)數(shù)據(jù)完備,可以從一條局部知識(shí)(如適用于某個(gè)城市的知識(shí))出發(fā),嘗試將其擴(kuò)展到鄰近位置,直至知識(shí)不再適用,由此可以確定知識(shí)的空間泛化邊界。圖3給出了一個(gè)地理知識(shí)泛化的簡單示例。給定一個(gè)變量a的空間分布,對(duì)于較小的區(qū)域S1,規(guī)律L1用一條精度較高的謂詞(取值區(qū)間為[4,6])表達(dá)該區(qū)域變量的分布特征。若研究區(qū)逐步擴(kuò)大到S2、S3,則規(guī)律L1不再適用,需要對(duì)謂詞進(jìn)行松弛,即擴(kuò)大取值區(qū)間的范圍,依次得到規(guī)律L2、L3。
圖3 地理知識(shí)的空間泛化示例
以兩個(gè)空間變量回歸應(yīng)用為例,已知研究區(qū)內(nèi)各面狀單元自變量X和因變量Y的取值,首先選取若干空間單元構(gòu)成的空間連續(xù)區(qū)域A,利用A中各單元的數(shù)據(jù)擬合得到回歸模型Y=f(X);然后選取一個(gè)與A相鄰的空間單元c,考慮將其加入A,此時(shí)模型的參數(shù)可能需要調(diào)整,以達(dá)到最優(yōu)擬合(即知識(shí)的更新),但只要模型對(duì)A中每個(gè)單元的擬合誤差仍小于給定閾值,我們就認(rèn)為模型可以泛化到c。這一過程重復(fù)進(jìn)行,直到模型不再能泛化到相鄰單元為止。上述討論給出了確定一條地理知識(shí)空間泛化邊界的一種途徑。對(duì)于泛化邊界之外的某一空間單元,我們認(rèn)為這條知識(shí)并不適用;以該單元為出發(fā)點(diǎn),重復(fù)上述流程,可以得到適用于另一區(qū)域的一條新知識(shí);并最終得到研究區(qū)的一個(gè)區(qū)域劃分,每個(gè)區(qū)域?qū)?yīng)適用于該區(qū)域的一條知識(shí),如圖4所示。事實(shí)上,各區(qū)域的知識(shí)泛化過程可以借助區(qū)域劃分[22]的空間優(yōu)化框架同時(shí)實(shí)現(xiàn),我們把得到的若干條謂詞及對(duì)應(yīng)的區(qū)域稱為知識(shí)集。仍以前述兩個(gè)變量的空間回歸為例,區(qū)域劃分的優(yōu)化目標(biāo)可以是“在每個(gè)區(qū)域的最大殘差不超過閾值ε的條件下,使分區(qū)數(shù)目盡可能少”,這一優(yōu)化目標(biāo)在保證知識(shí)歸納準(zhǔn)確性的同時(shí),通過最小化知識(shí)的條數(shù),實(shí)現(xiàn)了知識(shí)集的概括性。更一般的,可以將知識(shí)集的精確性(最小化歸納誤差)和概括性(最小化分區(qū)數(shù)目)同時(shí)作為優(yōu)化目標(biāo),此時(shí)我們關(guān)注的是所有滿足帕累托最優(yōu)性的解,它們體現(xiàn)了精確性與概括性不同程度的折中[23]。
圖4 知識(shí)泛化過程的區(qū)域劃分視角
在知識(shí)泛化的過程中,不僅其中的參數(shù)可以更新,知識(shí)的形式(模型的假設(shè)空間)也可以進(jìn)行調(diào)整,如多項(xiàng)式模型變?yōu)榫€性模型、定量關(guān)系變?yōu)槎ㄐ悦枋龅?。如前所述,?fù)雜度較高的模型往往具有更大的過擬合風(fēng)險(xiǎn),因而有必要在泛化過程中對(duì)知識(shí)進(jìn)行松弛。在前述區(qū)域劃分的優(yōu)化目標(biāo)中,知識(shí)集的概括性可以加入知識(shí)形式復(fù)雜度的度量,由此可以在犧牲精確性的條件下提升概括性,知識(shí)歸納的結(jié)果將因此具有更強(qiáng)的可泛化性。
地理學(xué)異質(zhì)性、規(guī)律及可復(fù)現(xiàn)性存在著基本的矛盾。例如,許多機(jī)器學(xué)習(xí)方法依賴樣本獨(dú)立同分布假設(shè),而空間異質(zhì)性使得獨(dú)立同分布假設(shè)不再成立。這些基本的矛盾決定了我們需要重新思考地理空間人工智能的一般假設(shè)和基礎(chǔ)理論[24]。從人工智能提出的初衷而言,模仿人類智能一直是一個(gè)階段性的目標(biāo),即開發(fā)“像人那樣思考”的計(jì)算機(jī)程序。現(xiàn)代深度學(xué)習(xí)模型由于其強(qiáng)大的通用逼近能力(萬億參數(shù)),通過擬合前所未有的海量數(shù)據(jù)(PB級(jí)訓(xùn)練數(shù)據(jù)),已經(jīng)在計(jì)算機(jī)視覺、自然語言處理、圍棋等一些封閉任務(wù)表現(xiàn)出超越人類的性能[25-26]。例如,由OpenAI設(shè)計(jì)的GPT v3模型表明,計(jì)算機(jī)可以在超大語料庫上完全利用語言自身的信號(hào)而無須任何人工標(biāo)注,訓(xùn)練一個(gè)具有1750億參數(shù)的語言通用模型,并且在無關(guān)任務(wù)上(如答題、翻譯、寫文章、數(shù)學(xué)計(jì)算等)表現(xiàn)出強(qiáng)勁的能力[27]。
然而,在人類思考智能的獨(dú)特能力——?dú)w納、類比和泛化能力上,人類依然占據(jù)無與倫比的優(yōu)勢(shì)。雖然人工智能實(shí)現(xiàn)過程也設(shè)計(jì)了相關(guān)的機(jī)制(如遷移學(xué)習(xí)),以模擬實(shí)現(xiàn)人類智能的泛化能力,但依然與后者具有較大差距,因?yàn)槿祟惥哂刑烊坏姆夯芰?,并且很容易確定泛化邊界。因此,實(shí)現(xiàn)學(xué)習(xí)過程中對(duì)于規(guī)律的歸納、類比和泛化,依然是人工智能面臨的巨大挑戰(zhàn)。
綜上所述,從4個(gè)基本問題入手,即泛化能力何以可能,模型通用性和專業(yè)性的何以平衡,什么學(xué)習(xí)才是有效的,動(dòng)態(tài)和開放環(huán)境下的學(xué)習(xí)原則如何,構(gòu)建地理空間人工智能應(yīng)該實(shí)現(xiàn)4個(gè)基本假設(shè):組合泛化假設(shè)、知識(shí)歸納偏置假設(shè)、學(xué)習(xí)假設(shè)、記憶和進(jìn)化假設(shè)。
3.3.1 組合泛化假設(shè)
人類智力表現(xiàn)出強(qiáng)大的組合泛化能力[28],即通過組合已知的基本元素理解和產(chǎn)生新的、近乎無窮的組合。對(duì)于地理規(guī)律和泛化性而言,一個(gè)根本性質(zhì)就是需要從可以觀察到的數(shù)據(jù)中獲得基本原子語義;通過原子語義的重新組合,將觀察轉(zhuǎn)化為泛化規(guī)律。因此,地理空間人工智能也必須具備“組合泛化”能力,從而獲得強(qiáng)大的數(shù)據(jù)解釋能力,且能夠?qū)Σ煌瑫r(shí)空尺度的任務(wù)保持足夠的泛化能力。
3.3.2 知識(shí)歸納偏置假設(shè)
地理學(xué)研究既有對(duì)于普適規(guī)律的追求,也有區(qū)域研究的傳統(tǒng)。普適規(guī)律的追求要求我們得到的規(guī)律能夠盡量通用,即在不同的時(shí)空范圍都有效。這也是物理學(xué)的基本假設(shè)——時(shí)空不變性,也即物理定律不會(huì)隨著時(shí)間和空間的改變而改變;區(qū)域傳統(tǒng)則是追隨異質(zhì)性假設(shè),認(rèn)為不同的區(qū)域得到的地理學(xué)定律不盡相同。兩者是一個(gè)統(tǒng)一的矛盾體,可以通過知識(shí)歸納偏置假設(shè)進(jìn)行描述和統(tǒng)一[29]。知識(shí)歸納偏置中的歸納指的是從有偏采樣中尋找共性、泛化,形成一個(gè)較通用的規(guī)律的過程,然后通過引入偏置對(duì)觀測(cè)數(shù)據(jù)的理解、先驗(yàn)或規(guī)則進(jìn)行建模。這些理解、先驗(yàn)或規(guī)則形成了對(duì)模型的約束,進(jìn)而起到模型選擇的作用,幫助我們從候選假設(shè)中選擇更符合觀察數(shù)據(jù)的模型。
對(duì)于地理空間人工智能而言,普適規(guī)律性是對(duì)于地理學(xué)基本定律更宏觀、更一般的認(rèn)識(shí);而區(qū)域傳統(tǒng)則可以看成是引入知識(shí)歸納偏置的過程,幫助我們通過先驗(yàn)或假設(shè)解決具體的問題。從這個(gè)角度而言,奧卡姆剃刀原則就可以看成是一種歸納偏置,即在所有可選假設(shè)中,選擇最少假設(shè)的那個(gè)。不要奢望能找到一種算法對(duì)所有問題都適用,也可以解釋普適性、泛化性與特殊性、區(qū)域性的內(nèi)在辯證邏輯關(guān)系。
3.3.3 學(xué)習(xí)假設(shè)
3.3.4 進(jìn)化假設(shè)
由于觀測(cè)手段等限制,本質(zhì)上很難獲得研究對(duì)象的全體觀測(cè)。而地理觀測(cè)數(shù)據(jù)時(shí)空異質(zhì)性的存在,使采樣偏差變得更加顯著。地理觀測(cè)數(shù)據(jù)源自開放世界,數(shù)據(jù)和規(guī)律的演化在持續(xù)發(fā)生,因此地理空間人工智能必須能夠以一種依賴于時(shí)間和空間的方式演化[30],通過增量式的、持續(xù)式的、終身式的學(xué)習(xí)范式解決越來越復(fù)雜的任務(wù)。因此,記憶并以記憶為基礎(chǔ)進(jìn)化是地理空間人工智能能夠持續(xù)發(fā)展并形成終身學(xué)習(xí)能力的關(guān)鍵。
當(dāng)前,地理信息科學(xué)迫切需要與腦科學(xué)、人工智能等領(lǐng)域跨學(xué)科交叉與深度融合,從地理大數(shù)據(jù)自動(dòng)抽取通用特征和知識(shí),構(gòu)建驅(qū)動(dòng)地理科學(xué)知識(shí)發(fā)現(xiàn)的地理空間人工智能框架,推動(dòng)地理信息科學(xué)走向智能化。具體包括以下4個(gè)方面。
(1)在機(jī)制上,地理空間人工智能對(duì)知識(shí)的學(xué)習(xí)、記憶、遷移及泛化能力的需求使得探究地理空間認(rèn)知機(jī)制成為未來地理信息科學(xué)研究面臨的挑戰(zhàn)之一。人腦具有面向多尺度、多模式、多任務(wù)地理空間的認(rèn)知能力。揭示人腦地理空間認(rèn)知和類腦空間決策過程能夠?yàn)榘l(fā)展智能化地理信息科學(xué)提供重要的理論參考,也是構(gòu)建具有高度通用性的地理空間人工智能的關(guān)鍵途徑。因此,需要系統(tǒng)地分析實(shí)驗(yàn)場(chǎng)景、任務(wù)、材料及人群的設(shè)置條件,在嚴(yán)格控制實(shí)驗(yàn)變量的前提下,開展地理空間綜合認(rèn)知實(shí)驗(yàn),揭示人腦地理空間認(rèn)知神經(jīng)機(jī)制。
(2)在模型上,構(gòu)建空間異質(zhì)性、空間依賴性、空間交互性、空間聚集性等空間效應(yīng)的通用智能模型,推動(dòng)地理空間智能從理論走向?qū)嵺`。在這一方面,需要突破傳統(tǒng)的經(jīng)驗(yàn)驅(qū)動(dòng)的地理規(guī)律建模方式,利用多通道人類生理物理數(shù)據(jù)與地理空間時(shí)空大數(shù)據(jù),以數(shù)據(jù)驅(qū)動(dòng)為主要研究手段,針對(duì)不同環(huán)境、不同尺度和不同對(duì)象的地理空間時(shí)空演化規(guī)律的數(shù)學(xué)本質(zhì)進(jìn)行挖掘與建模。
(3)在方法上,地理空間人工智能方法體系是發(fā)展智能驅(qū)動(dòng)的地理科學(xué)知識(shí)發(fā)現(xiàn)的第五范式的重要技術(shù)前提和挑戰(zhàn)。地理空間人工智能是建立在地理空間時(shí)空規(guī)律基礎(chǔ)上的智能計(jì)算模型,傳統(tǒng)的人工智能模型已無法滿足基于地理空間認(rèn)知的類腦智能決策需求。因此,需要基于人腦的空間認(rèn)知機(jī)制,揭示人腦信息加工與知識(shí)提取框架,解構(gòu)人腦知識(shí)關(guān)聯(lián)與映射圖譜結(jié)構(gòu),結(jié)合地理空間規(guī)律模型,開辟以自學(xué)習(xí)、記憶與進(jìn)化、可解釋、因果推理為基石的地理空間人工智能方法體系。
(4)在應(yīng)用上,未來地理空間人工智能的應(yīng)用將致力于突破人地耦合復(fù)雜巨系統(tǒng)理解、模擬、優(yōu)化等瓶頸,助力解決全球氣候變化、環(huán)境污染、經(jīng)濟(jì)發(fā)展等人類社會(huì)面臨的大挑戰(zhàn)[31]?;诘乩砜臻g人工智能模型,如何面向多尺度、多層級(jí)、多因素的復(fù)雜地理過程進(jìn)行適配也是重要挑戰(zhàn)之一。為此,需要從認(rèn)知機(jī)制發(fā)現(xiàn)、規(guī)律建模、方法修正3個(gè)層次進(jìn)行研究,對(duì)地理過程的模擬進(jìn)行模塊化,發(fā)現(xiàn)并建立模塊間的耦合機(jī)理,從而開發(fā)面向不同地理問題的地理空間人工智能算法。