秦 昆,康朝貴
(武漢大學(xué) 遙感信息工程學(xué)院,湖北 武漢 430072)
?
計算社會科學(xué)的時空分析理論與方法
秦 昆,康朝貴
(武漢大學(xué) 遙感信息工程學(xué)院,湖北 武漢 430072)
正在向智慧社會方向發(fā)展的大數(shù)據(jù)時代的計算社會科學(xué)具有復(fù)雜性、自適應(yīng)性、社會交互性和時空特性等特點,從社會數(shù)據(jù)、信號、情報到社會智慧的轉(zhuǎn)化及量化是智慧社會的核心目標(biāo)。計算社會科學(xué)利用先進的計算技術(shù)、信息技術(shù)和智能技術(shù)等定量分析方法,研究復(fù)雜的人類行為及社會運行,既體現(xiàn)了日趨復(fù)雜的人類活動和網(wǎng)絡(luò)社會所提出的迫切現(xiàn)實需求,也促進了計算機技術(shù)及多學(xué)科交叉所產(chǎn)生的新方法、新工具的快速發(fā)展。
然而,作為一種新的研究范式,計算社會科學(xué)在引起普遍關(guān)注的同時,也引發(fā)了廣泛的爭論和質(zhì)疑。要充分認(rèn)識計算社會科學(xué)的積極意義與價值,我們必須對自然科學(xué)、以技術(shù)為主導(dǎo)的學(xué)科、工業(yè)界與計算社會科學(xué)的交叉融合及未來發(fā)展趨勢進行深入思考:社會科學(xué)的可計算性及其核心技術(shù)是什么?社會系統(tǒng)的復(fù)雜自適應(yīng)性及其如何度量?社會系統(tǒng)具有何種時空分布及演變規(guī)律?腦科學(xué)與智能科學(xué)與技術(shù)如何影響計算社會科學(xué)?如何分析大數(shù)據(jù)時代計算社會科學(xué)的物理機制和生態(tài)學(xué)機制?如何分析大數(shù)據(jù)時代計算社會科學(xué)的社會交互網(wǎng)絡(luò)?如何建立相對合理完善的計算社會科學(xué)的方法體系?正確認(rèn)識這些問題,乃是理解和預(yù)測計算社會科學(xué)及其支撐學(xué)科的走向和發(fā)展前景、促進社會科學(xué)研究者接受和發(fā)展計算社會科學(xué)研究的動力。
上述問題中,時空問題已成為大數(shù)據(jù)時代計算社會科學(xué)順利發(fā)展的關(guān)鍵問題之一。如何借助遙感(RS:Remote Sensing)、地理信息系統(tǒng)(GIS:Geographical Information System)、全球衛(wèi)星導(dǎo)航系統(tǒng)(GNSS:Global Navigation Satellite System)等空間信息科學(xué)與技術(shù),從時空觀的角度,研究和探討計算社會科學(xué)的時空分析理論和方法,是擁抱大數(shù)據(jù)時代計算社會科學(xué)的重要發(fā)展方向。
時空問題是社會理論的核心。社會科學(xué)是以“人”為研究對象的學(xué)科,同時研究人與地理空間的關(guān)系;地理空間信息科學(xué)是以“地理空間”為研究對象的學(xué)科,同時研究地理空間與人的關(guān)系。二者分別從不同的視角研究“人——地關(guān)系”和“地——人關(guān)系”。
社會的一切結(jié)構(gòu)性和過程性變遷,不僅都是在時空維度上進行的,而且時空變化構(gòu)成了一切社會變化最基礎(chǔ)的層面。因此,社會時空視角被看作研究社會發(fā)展的基本視角,社會時空分析被廣泛運用于社會科學(xué)領(lǐng)域。以人文社會科學(xué)研究的“空間轉(zhuǎn)向”為契機,運用地理空間信息科學(xué)的空間綜合思維,可以加強社會科學(xué)基礎(chǔ)性研究成果的整理、挖掘與可視化表達(dá),促進社會科學(xué)相關(guān)學(xué)科的交叉與融合,形成新的研究方向和研究課題,從而推動計算社會科學(xué)研究走向縱深。然而,受限于數(shù)據(jù)采集、管理、分析、展示的能力,傳統(tǒng)社會科學(xué)研究學(xué)者對“時空”進行研究在尺度、粒度、直觀度等方面已經(jīng)顯得較為落后,從而限制了相關(guān)研究及結(jié)果的傳播。
因此,抓住大數(shù)據(jù)、地理計算、遙感科學(xué)、地理信息科學(xué)和社會智能等科技進步帶來的重大機遇,尋求建立更具綜合性和一般性的空間綜合人文社會科學(xué)理論,是人文科學(xué)、社會科學(xué)、計算科學(xué)和空間科學(xué)、地理信息科學(xué)等領(lǐng)域?qū)W者的共同歷史使命。以遙感、地理信息系統(tǒng)、全球衛(wèi)星導(dǎo)航系統(tǒng)為核心的地理空間信息科學(xué)與技術(shù),集地理信息、空間分析方法與地理空間知識于一體,為多種學(xué)科、多種來源的數(shù)據(jù)整合與集成提供了技術(shù)平臺,為擴展傳統(tǒng)學(xué)科、促進學(xué)科交叉融合和開拓新興學(xué)科提供了信息和學(xué)術(shù)支撐。
以大數(shù)據(jù)時代計算社會科學(xué)的時空觀為理論基礎(chǔ),針對時空分析與時空可視化的迫切需求,計算社會科學(xué)應(yīng)重點開展以下幾個方面的時空分析方法研究。
(一)計算社會科學(xué)的空間化與可視化方法
利用地理編碼方法,將計算社會科學(xué)中的文本信息、描述性信息進行空間化處理,進行地學(xué)可視化表達(dá),讓抽象的描述性文字在地理空間中進行地學(xué)可視化,將為計算社會科學(xué)的研究提供更加形象和科學(xué)的表達(dá)方法。
地理編碼(Geocoding),也稱為地址匹配,是將地址映射成地理坐標(biāo)的過程,它提供了一種把描述文本地址的地理位置信息轉(zhuǎn)換成地理坐標(biāo)的方式。地理編碼,可以利用地址數(shù)據(jù)庫來建立地址與地理坐標(biāo)空間的對應(yīng)關(guān)系,地址編碼技術(shù)是大量業(yè)務(wù)數(shù)據(jù)可視化定位和空間分析的橋梁。通過地理編碼,可以實現(xiàn)原有信息系統(tǒng)和空間信息的融合,將日常的經(jīng)濟、社會、人文、歷史、旅游、商業(yè)等一系列城市生活中的信息空間化,用于在空間信息支持下進行空間分析和決策應(yīng)用。
地學(xué)可視化(Geo-visualization),也稱地理空間數(shù)據(jù)可視化,指運用地圖學(xué)、計算機圖形學(xué)和圖像處理技術(shù),將地學(xué)信息輸入、處理、查詢、分析以及預(yù)測的數(shù)據(jù)及結(jié)果采用圖形符號、圖形、圖像,并結(jié)合圖表、文字、表格、視頻、音頻等可視化形式顯示,進行交互處理的理論、方法和技術(shù)。對計算社會科學(xué)數(shù)據(jù)進行地學(xué)可視化,可以讓社會科學(xué)問題在實際的地理空間進行可視化展現(xiàn),從而在可視化的“人——地”空間中進行社會問題的分析,將產(chǎn)生一系列有效的計算社會科學(xué)的地學(xué)可視化分析方法。
我們認(rèn)為:抓住信息科學(xué)發(fā)展的機遇,引入地理空間信息科學(xué)領(lǐng)域的地理編碼技術(shù)和地學(xué)可視化技術(shù),對社會科學(xué)研究的問題和社會要素數(shù)據(jù)在地理空間進行空間定位、地學(xué)可視化展示,將對社會科學(xué)的研究方法和思路產(chǎn)生革命性的變化,并將促進計算社會科學(xué)的極大發(fā)展。
(二)計算社會科學(xué)的時空統(tǒng)計分析方法
統(tǒng)計分析是社會調(diào)查研究的常用方法。但是,面對大數(shù)據(jù)時代計算社會科學(xué)中的海量時空數(shù)據(jù),傳統(tǒng)的社會統(tǒng)計分析方法已經(jīng)難以勝任,迫切需要發(fā)展計算社會科學(xué)的時空統(tǒng)計分析方法,具體包括:
1.社會科學(xué)數(shù)據(jù)的探索性時空統(tǒng)計分析方法。探索性時空統(tǒng)計分析方法是在探索的基礎(chǔ)上再對數(shù)據(jù)進行時空建模的方法,不預(yù)先作理論假設(shè),實際上是 “讓時空數(shù)據(jù)說話”的方法。
2.社會科學(xué)數(shù)據(jù)的時空相關(guān)性統(tǒng)計分析方法。時空相關(guān)性是一些時空變量之間時間和空間的相互依賴性,包括全局性時空相關(guān)性統(tǒng)計和局部時空相關(guān)性統(tǒng)計。從時間和空間兩個維度,對計算社會科學(xué)的社會要素數(shù)據(jù)之間的空間相關(guān)性、時間相關(guān)性,以及時空交互的時空相關(guān)性進行統(tǒng)計分析。
3.社會科學(xué)數(shù)據(jù)的時空聚集模式探測方法。對一些社會現(xiàn)象的時空分布模式進行分析,對于社會科學(xué)研究具有十分重要的意義。這些社會現(xiàn)象的時空分布是規(guī)則的聚集分布模式,還是隨機分布模式?是什么因素影響和造成了這種分布模式?一種社會現(xiàn)象的時空分布是否會對另一種社會現(xiàn)象的時空分布產(chǎn)生影響?如何量化這種影響?諸如此類問題的分析需要建立和發(fā)展社會科學(xué)數(shù)據(jù)的時空聚集模式探測方法,可以將地理空間信息科學(xué)的時空聚集模式探測方法,引入社會科學(xué)數(shù)據(jù)分析領(lǐng)域,并進行適應(yīng)性改造,從而發(fā)展社會科學(xué)數(shù)據(jù)的時空聚集模式探測方法。
我們認(rèn)為:將社會科學(xué)領(lǐng)域的一般統(tǒng)計方法,擴展為社會科學(xué)數(shù)據(jù)的時空統(tǒng)計分析方法,將社會空間與地理空間進行統(tǒng)一分析,必將產(chǎn)生一些創(chuàng)新性的時空統(tǒng)計分析方法,也將促進計算社會科學(xué)、時空統(tǒng)計分析方法的大發(fā)展。
(三)計算社會科學(xué)的時空數(shù)據(jù)挖掘與知識發(fā)現(xiàn)方法
在大數(shù)據(jù)時代,我們積累了越來越多的社會科學(xué)數(shù)據(jù),含有豐富的時空信息,將這些數(shù)據(jù)和信息轉(zhuǎn)化為有效的知識,是計算社會科學(xué)服務(wù)于智慧社會的迫切需要。時空數(shù)據(jù)挖掘與知識發(fā)現(xiàn),是從時空數(shù)據(jù)中提取隱含其中的、事先未知的、潛在有用的、最終可理解的時空知識和規(guī)則的過程。將時空數(shù)據(jù)挖掘與知識發(fā)現(xiàn)方法引入大數(shù)據(jù)時代的計算社會科學(xué),可產(chǎn)生以下方法:(1)計算社會科學(xué)數(shù)據(jù)的時空聚類方法;(2)計算社會科學(xué)的時空關(guān)聯(lián)挖掘方法;(3)計算社會科學(xué)數(shù)據(jù)的時空預(yù)測方法。
將時空數(shù)據(jù)挖掘與知識發(fā)現(xiàn)方法引入計算社會科學(xué)領(lǐng)域,可以發(fā)展計算社會科學(xué)的大數(shù)據(jù)挖掘技術(shù),將研究出一些創(chuàng)新性的社會數(shù)據(jù)時空數(shù)據(jù)挖掘與知識發(fā)現(xiàn)方法。
(四)計算社會科學(xué)的時空分析建模與輔助決策服務(wù)方法
時空分析建模是運用地理時空分析方法建立有效的時空分析模型,產(chǎn)生期望的信息,并提供輔助決策服務(wù)的過程和方法。智慧社會是大數(shù)據(jù)時代計算社會科學(xué)的發(fā)展目標(biāo),通過對大數(shù)據(jù)時代社會科學(xué)的特點進行研究,分析和吸收大數(shù)據(jù)時代與計算社會科學(xué)相關(guān)的多學(xué)科協(xié)同創(chuàng)新成果,研究計算社會科學(xué)在智慧社會中的具體應(yīng)用,如教育問題、農(nóng)民工問題、社會治理創(chuàng)新、群體性事件發(fā)生時的應(yīng)對等,通過分析這些具體的社會問題,構(gòu)建時空分析模型,提供輔助決策服務(wù),從而有利于促進計算社會科學(xué)自身在智慧社會領(lǐng)域的長期可持續(xù)發(fā)展。
計算社會科學(xué)研究的最終目的是為社會服務(wù),為解決現(xiàn)實中的教育問題、農(nóng)民工問題、社會治理問題、群體性事件問題等貢獻一份力量。通過構(gòu)建計算社會科學(xué)問題研究的時空分析模型,并提供輔助決策服務(wù),將為現(xiàn)實社會問題的解決提供更加科學(xué)有效的方法。
下面以我們正在開展的一項社會科學(xué)與地理空間信息科學(xué)學(xué)科交叉的項目為例,介紹空間人文社會調(diào)查與分析方法,對大數(shù)據(jù)時代計算社會科學(xué)的時空分析方法進行一個實際的探索性研究。
GIS(地理信息系統(tǒng))與GPS(全球定位系統(tǒng))技術(shù)正在逐步應(yīng)用于人文社會科學(xué),為人文社會科學(xué)的研究提供了空間化、計量化的新技術(shù)和新手段。我們的項目從測繪地理信息科學(xué)與社會科學(xué)學(xué)科交叉入手,研究和探討基于GIS和GPS的空間人文社會調(diào)查與分析方法,具體包括:(1)GIS支持下的社會調(diào)查空間抽樣方法;(2)GIS和GPS支持下的社會調(diào)查輔助技術(shù);(3)社會調(diào)查的行為軌跡分析方法;(4)社會調(diào)查數(shù)據(jù)的空間統(tǒng)計分析方法。
上述研究將為社會調(diào)查提供空間化和可視化的新方法,拓展GIS和GPS在人文社會科學(xué)領(lǐng)域的應(yīng)用,從而為測繪地理信息科學(xué)與社會科學(xué)的交叉融合做出基礎(chǔ)性貢獻。
本文對大數(shù)據(jù)時代計算社會科學(xué)的時空分析理論、方法和應(yīng)用進行了探索性的討論。在計算社會科學(xué)的新語境下,社會科學(xué)與地理空間信息科學(xué)的交叉融合,正成為國際研究的新熱點,雙方的學(xué)者日益注重借鑒對方的視角,對社會結(jié)構(gòu)與社會過程中的“人——地關(guān)系”和“地——人關(guān)系”展開創(chuàng)新性的交叉研究。從社會科學(xué)研究者的角度來看,社會科學(xué)研究急需地理信息科學(xué)(遙感、地理信息系統(tǒng)、全球衛(wèi)星導(dǎo)航系統(tǒng))為其提供空間化、可視化、定量化的新技術(shù)手段。站在地理信息科學(xué)研究者的角度而言,地理信息科學(xué)領(lǐng)域的學(xué)者也迫切需要拓展在人文社會科學(xué)領(lǐng)域的應(yīng)用,研究地理信息科學(xué)理論與技術(shù)在人文社會科學(xué)中應(yīng)用的新理論和新方法。兩大領(lǐng)域?qū)W者的合作研究與交流討論必將產(chǎn)生更多的創(chuàng)新性成果,必將促進兩大學(xué)科各自產(chǎn)生長足的進步,從而共同為推動社會發(fā)展和進步貢獻一份力量。
2016-09-12
國家社科基金重大項目“大數(shù)據(jù)時代計算社會科學(xué)的產(chǎn)生、現(xiàn)狀與發(fā)展前景研究”(16ZDA086)的階段性成果。
秦 昆(1972-),男,湖北隨州人,武漢大學(xué)遙感信息工程學(xué)院教授,博士生導(dǎo)師。研究方向:空間分析與數(shù)據(jù)挖掘、智能空間信息處理;康朝貴(1987-),男,湖南衡陽人,武漢大學(xué)遙感信息工程學(xué)院講師,博士。研究方向:軌跡計算、城市信息學(xué)。