張小勁 孟天廣
〔摘要〕 大數(shù)據(jù)時代的到來,既向傳統(tǒng)的學科分野及其方法論范式提出挑戰(zhàn),又為新學科發(fā)展及范式突破準備了基礎條件。作為前沿交叉學科,計算社會科學既是大數(shù)據(jù)時代科技進步、數(shù)據(jù)爆炸和方法創(chuàng)新的產(chǎn)物,又是社會科學長久以來的計算傳統(tǒng)知識積累的成果,致力于應用數(shù)據(jù)思維、數(shù)據(jù)資源和數(shù)據(jù)分析學以研究人類社會行為和社會運行規(guī)律等。近年來計算社會科學的發(fā)展使新學科成為現(xiàn)實,這種學科創(chuàng)新體現(xiàn)為圍繞著數(shù)據(jù)驅動和算法驅動,采取不同融合方式的一系列“問題解決性、應用導向”多元化進路,推動社會科學范式轉換。
〔關鍵詞〕 大數(shù)據(jù),計算社會科學,范式轉換,方法論
〔中圖分類號〕C05 〔文獻標識碼〕A 〔文章編號〕1004-4175(2017)06-0033-06
大數(shù)據(jù)時代的到來,既向傳統(tǒng)的學科分野及其方法論范式提出了挑戰(zhàn),又為新學科發(fā)展及其方法論突破準備了條件?!坝嬎闵鐣茖W”概括了社會科學在大數(shù)據(jù)時代所呈現(xiàn)出的新發(fā)展、新路徑和新范式。計算社會科學以“計算”為核心,通過將研究對象充分數(shù)字化、網(wǎng)絡化延伸了人類器官的感知功能,拓寬了思維視野,有利于多學科協(xié)同發(fā)展和知識創(chuàng)新,已經(jīng)顯現(xiàn)出獨特魅力。本文將系統(tǒng)闡述計算社會科學的緣起,并探討學科發(fā)展從“分化”走向“整合”的多學科進路等特征、范式轉換以及關鍵性方法論創(chuàng)新。
一、計算社會科學的緣起
盡管計算社會科學這一新名詞容易夸大其與傳統(tǒng)社會科學的聯(lián)系。然而,計算社會科學正是在對傳統(tǒng)社會科學之繼承和發(fā)展的過程中逐步形成的,亦立基于社會科學各學科長久以來的計算傳統(tǒng)及其知識沉淀,包括質性分析和量化分析等方法論的知識積累?;仡櫽嬎闵鐣茖W的起源史有助于我們深刻把握計算社會科學的主要特征。
(一)計算社會科學的“史前史”:社會研究與計算技術的學科發(fā)展。倘以Lazer等人發(fā)表《計算社會科學》一文劃界,那么,從18世紀末到21世紀初這一漫長時段的社會科學發(fā)展歷程可看作是計算社會科學的“史前史”階段。從計算社會科學的發(fā)展脈絡來看,這一“史前史”階段的意義在于,它從基礎理論、專業(yè)知識、技術方法上為計算社會科學的誕生奠定了堅實的基石。更確切地講,社會科學自脫離“社會哲學”而成為日益壯大的學科門類統(tǒng)稱以來,其追尋自然科學的模式以探求社會規(guī)律的學術努力始終未曾中斷。社會科學早期大師涂爾干就開始廣泛使用統(tǒng)計學思維和大量數(shù)據(jù)分析探究自殺之社會規(guī)律。尤其值得注意的是,17世紀中葉政治算術(Political Arithmetick)學派在英國創(chuàng)立,威廉·配第明確提出要用“數(shù)字、重量和尺度的詞匯”來描述英國的社會經(jīng)濟狀況,這也標志著現(xiàn)代統(tǒng)計學的誕生。同期在德國形成了所謂的“國勢學派”,這個學派所使用的“statistik”一詞,后來英譯為statistics,即成為“統(tǒng)計學”的冠名。統(tǒng)計學的發(fā)展史,無疑凸顯了統(tǒng)計學之于治國理政、社會分析等社會科學應用的時代貢獻。美國著名學者斯蒂格勒認為,統(tǒng)計學史的首要論題是概念性問題,涉及經(jīng)濟學、政治學和社會學等學科對于社會統(tǒng)計數(shù)據(jù)的解讀。統(tǒng)計學從最初收集、匯編數(shù)據(jù)而為行政管理服務,最終發(fā)展成為有一整套原理和研究方法的獨立學科,而那些具有深刻洞識的理論往往是從一些非常簡單實際的問題中發(fā)展起來并贏得共識的,進而影響了其他學科 〔1 〕11??傊y(tǒng)計學發(fā)展史的考察充分說明社會科學研究具有深遠的計算傳統(tǒng)。
(二)計算社會科學的“前身”:定量社會科學的發(fā)展。計算社會科學固然是計算機和信息技術的發(fā)展進入大數(shù)據(jù)時代的產(chǎn)物,但就學科發(fā)展脈絡而言,計算社會科學無疑與定量社會科學(Quantitative Social Sciences)有著深厚的淵源。按照哈佛大學定量社會科學研究所主任、著名方法論學者加里·金(Gary King)的解釋,定量社會科學不僅是指長期以來社會科學發(fā)展歷程中相對于質化研究而言的量化研究方法,而且是經(jīng)歷了近十年的突破發(fā)展而引發(fā)當代社會科學轉型的一股浪潮。他認為“我們的確正在起航。不過,在龐大的新數(shù)據(jù)來源的支持下,量化的前進步伐將會踏遍學術、商業(yè)和政府領域。沒有一個領域不被觸及?!?〔2 〕1
定量社會科學從經(jīng)濟學起源,在半個世紀之內逐步擴展到社會科學各領域,極大地推動了社會科學方法論及理論知識的發(fā)展。經(jīng)濟學無疑是在定量社會科學道路上起步最早而且走得最遠的學科。早在1926年,挪威經(jīng)濟學家弗里希(R. Frisch)便仿照“生物計量學”一詞提出了“計量經(jīng)濟學”(Econometrics);1930年國際計量經(jīng)濟學學會成立,并在三年后創(chuàng)辦了《計量經(jīng)濟學》雜志。計量經(jīng)濟學突破了經(jīng)濟學以往大多只能進行定性研究的局限,以數(shù)學方法和數(shù)理統(tǒng)計學為方法論基礎,對于經(jīng)濟問題展開定量分析。保羅·薩繆爾森的《經(jīng)濟分析基礎》更加全面地對數(shù)學方法在經(jīng)濟學的應用作出了系統(tǒng)性的說明,從而使經(jīng)濟學從以往的自然語言表達和圖解式分析解脫出來而轉變?yōu)橛矛F(xiàn)代數(shù)理經(jīng)濟分析方法進行分析和表達,由此創(chuàng)立的“數(shù)理經(jīng)濟學”成為經(jīng)濟學中的顯學。伴隨著經(jīng)濟學研究方法的成熟以及研究范圍的擴展,包括政治學、社會學、教育學、新聞傳播學等學科在內的社會科學主流學科均受到了深刻而持續(xù)的影響。
心理學在定量社會科學的發(fā)展史上占據(jù)了獨特的地位。心理學行為主義學派創(chuàng)始人約翰·華生撰寫了《行為主義者心目中的心理學》《行為主義》等系列著作,廣泛宣傳他的行為主義觀點。這些著作不僅系統(tǒng)論述了行為主義心理學,而且擴展論述了行為主義社會科學的理論基礎。在他看來,社會科學研究的對象不是意識而是行為,因而社會科學應當關注行為與環(huán)境之間的關系,社會科學的研究方法必須拋棄傳統(tǒng)的內省法,而代之以自然科學常用的實驗法和觀察法。在行為主義心理學的影響下,整個社會科學發(fā)生了“行為主義革命”。在這一波次的學科轉型中,政治學、社會學和教育學首當其沖,接續(xù)發(fā)生了方法論意義上的創(chuàng)新。在政治學領域,“行為主義革命”既反對傳統(tǒng)政治哲學研究中抽象思辨和演繹的方法,也反對舊制度主義的靜態(tài)描述,主張將政治科學研究的對象鎖定到實際存在的、可觀察到的政治行為;為此,又強調政治數(shù)據(jù)的收集和整理,并要求在進行價值中立的同時,在現(xiàn)象和數(shù)據(jù)允許的范圍內使用統(tǒng)計學、形式模型、計算機模擬等開展研究,從而達到對政治行為的解釋、預測和控制。endprint
基于社會科學研究范式的上述轉型,巴比于1975年出版了《社會研究方法》一書,集成了當時已經(jīng)達成相當共識的社會科學方法論知識,對于定量社會科學作出系統(tǒng)化的論說。時隔近20年之后,加里·金、羅伯特·基歐漢和悉尼·維巴合著的《社會科學中的研究設計》試圖超越量化研究與質性研究的長期對立與沖突,通過對社會科學實證推論層次上的論述而建構出適用于整個社會科學的研究架構。至此,定量社會科學的發(fā)展達到了成熟形態(tài),并且伴隨著計算機技術和信息技術的發(fā)展而進入了新的發(fā)展階段。正是在回顧這一時期定量社會科學的發(fā)展歷程時,加里·金認為定量社會科學至今影響的范圍廣泛,重塑了世界500強公司的經(jīng)營策略;建立新興產(chǎn)業(yè);大幅度提高人類的表現(xiàn)能力;改變醫(yī)藥、人際網(wǎng)絡、政治宣傳、公共衛(wèi)生、立法、治安、經(jīng)濟、運動、公共政策、商業(yè)與項目評估等 〔3 〕。定量社會科學走向主流地位和邏輯統(tǒng)合的發(fā)展趨勢為計算社會科學奠定了堅實的方法論和技術基礎。
(三)計算社會科學的創(chuàng)生:新興學科本體論的探討。20世紀后半葉以來,社會科學發(fā)展的趨勢正是研究者自發(fā)地使用海量數(shù)據(jù)開展以純理論或應用為目的研究。早在1972年,蘭德公司就建立了“蘭德恐怖主義年鑒”數(shù)據(jù)庫,為美國政府提供政策咨詢。在預測系統(tǒng)方面,基于QJMA方法的TNDM模型也在20世紀70年代誕生并擴展應用 〔4 〕。這些都屬于計算社會科學的早期探索。2009年,Lazer等人第一次正式提出了計算社會科學的概念,概括了計算社會科學的出現(xiàn)及其發(fā)展,強調了網(wǎng)絡科學研究在其中所扮演的角色和數(shù)字化媒體所提供的機遇。此后,有關計算社會科學的研究得到了學術界廣泛關注,并且產(chǎn)生了大量的研究成果。
早在Lazer之前,關于科學發(fā)展進入全新階段的討論即已初顯端倪。著名學者、1998年圖靈獎得主、關系數(shù)據(jù)庫的鼻祖Jim Gray早在2006年就發(fā)表了題為《第四范式:數(shù)據(jù)密集型科學發(fā)現(xiàn)》的公開演講。Gary認為,人類科學發(fā)展先后經(jīng)歷了四種“范式”:早起科學以記錄和描述自然現(xiàn)象為主,可稱為“實驗科學”即第一范式,其典型案例如鉆木取火;文藝復興以來,科學家們開始利用模型歸納總結過去記錄的現(xiàn)象,發(fā)展出“理論科學”即第二范式,其典型案例如牛頓三定律、相對論等;過去數(shù)十年間,計算機的出現(xiàn),催生了“計算科學”即第三范式,可以對復雜現(xiàn)象進行模擬仿真,推演出越來越多復雜的現(xiàn)象,其典型案例如模擬核試驗;而大數(shù)據(jù)時代科學的發(fā)展趨勢是隨著數(shù)據(jù)量的高速增長,計算機將不僅僅能做模擬仿真,還能對海量數(shù)據(jù)進行分析總結,進而發(fā)現(xiàn)規(guī)律,稱為所謂的“數(shù)據(jù)密集型科學”即第四范式。Gary關于第四范式的論說給世人留下了極其深刻的啟發(fā),事實表明大數(shù)據(jù)、人工智能等技術革新無一不印證了Gary的預言。
由英國eScience計劃前首席科學家Tony Hey等人編著的《第四種范式》一書于2009年正式出版。在Gary首倡的“第四種范式”框架下,此書進一步論述了數(shù)據(jù)驅動型科學研究的發(fā)展動態(tài),系統(tǒng)介紹了地球與環(huán)境科學、生命與健康科學、數(shù)字信息基礎設施和數(shù)字化學術信息交流等方面基于海量數(shù)據(jù)的科研活動、過程、方法和基礎設施,生動揭示了在海量數(shù)據(jù)和無處不在網(wǎng)絡上發(fā)展起來的與實驗科學、理論推演、計算機仿真這三種科研范式相輔相成的科學研究第四范式——數(shù)據(jù)密集型科學;強調在未來的科學研究和技術應用方面,要更多地利用數(shù)據(jù),要在科研領域發(fā)展并推廣數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)傳輸、云計算、數(shù)據(jù)可視化、科研信息搜索等方面的技術;要促進數(shù)據(jù)和科研成果的分享和更加廣泛的使用,因此,要促進研究者之間的新型合作,這將是一種大規(guī)模的、跨學科的、高頻率的合作。
二、計算社會科學的發(fā)展:從分化到跨學科
2009年Lazer等人發(fā)表《計算社會科學》,標志著計算社會科學的誕生。計算社會科學是以大數(shù)據(jù)及其相關技術的應用為背景的。在這里,“大數(shù)據(jù)”可以從兩個層面加以定義。狹義的“大數(shù)據(jù)”是指體量異常龐大、結構復雜,以至于傳統(tǒng)數(shù)據(jù)處理方法難以應對的數(shù)據(jù)集。人們通常用“5V”或“6C”來加以概括。而廣義的“大數(shù)據(jù)”則不僅指海量數(shù)據(jù),還包括獲取、傳輸、存儲、挖掘、分析和應用海量數(shù)據(jù)的一系列方法、技術和模式,后者通常被稱為“大數(shù)據(jù)分析學”(Big Data Analytics)。
2012年,由來自意大利國家科研委員會的R. Conte領銜,來自歐美國家的14位學者又在《歐洲物理學刊-??罚ǖ?期)發(fā)表了《計算社會科學宣言》。這篇《宣言》從時代機遇、技術發(fā)展、方法創(chuàng)新、當下挑戰(zhàn)和預期影響等五個方面全景式地說明了計算社會科學發(fā)展現(xiàn)狀及其未來的前景。《宣言》強調,當下時代社會科學將經(jīng)歷一個巨大的范式轉變。與實驗方法相結合的計算方法,將使社會科學更接近于建立理論、經(jīng)驗事實和研究之間的良好連接。同時,計算社會科學的影響還將更加廣泛,其提供的新方法會適用于任何以大數(shù)據(jù)為資料的研究,因此,計算社會科學可以通過大數(shù)據(jù)分析模擬研究改善管理,增進政策決策與評估的科學性,從而推動經(jīng)濟的增長。還將在有關社會項目中發(fā)揮主導作用,因為計算社會科學可以對全球范圍內的社會進程進行建模和模擬,進而充分理解與今日世界相關聯(lián)的、極其復雜的遠距離間的相互關系,并用于支持政策制定者的決策,使他們可以有效識別社會發(fā)展的最佳路徑。最后,計算社會科學的開放性還將極大地提高公民在這一決策過程中的參與程度。這些發(fā)展將會開啟一個更安全、更可持續(xù)和更公平的全球社會。概言之,從Gary的《第四范式》,經(jīng)由Lazer等人的《計算社會科學》,再到Conte等人的《計算社會科學宣言》,這些研究成果對計算社會科學給出了高屋建瓴般的論說。
與這些全景式的論證相媲美的是,有關社會科學分支學科的“計算化”進路的探索早在20世紀已開啟,并為計算社會科學的構建奠定了領域基礎。在對于計算機技術有著特殊敏感性的經(jīng)濟學領域,早在1996年就出版了《計算經(jīng)濟學手冊》,對應用計算機技術開展經(jīng)濟學研究進行了集中評價。2006年和2014年,《計算經(jīng)濟學手冊》又先后推出了第二卷和第三卷,持續(xù)跟蹤計算經(jīng)濟學的前沿發(fā)展動態(tài)。而1988年創(chuàng)刊的《經(jīng)濟管理中的計算機科學》在2000年后正式改名為《計算經(jīng)濟學》,涉及宏觀經(jīng)濟學、微觀經(jīng)濟學、決策理論、預測理論等方面的發(fā)展狀況。在政治學領域,盡管尚未有“計算政治學”的統(tǒng)一用語,但政治學量化研究在競選、議會政治、政治傳播等領域較早引入機器學習、非結構化數(shù)據(jù)挖掘和大規(guī)模社會實驗等研究方法。例如,奧地利人工智能研究所所長Trappl領銜于2005年出版了《為和平編碼:國際爭端解決與干預的計算機輔助方法》,從統(tǒng)計建模技術介紹了計算社會科學方法在基于案例之上的輔助決策、沖突預測、打擊犯罪、危機預警等方面的應用。在社會學領域,長期從事社會模擬的Michael W. Macy于2002年發(fā)表《從要素到行動者:計算社會學與行為者模型化》,首次提出“計算社會學”概念 〔5 〕。計算社會學是廣泛應用計算機技術研究、認知和理解社會現(xiàn)象的社會學分支,包括計算機模擬、人工智能、復雜統(tǒng)計方法、社會網(wǎng)絡分析技術等在內的多種手段和工具,通過對多樣化社會互動的基礎建模方式而提出并檢驗了關于復雜社會進程的多種理論發(fā)現(xiàn)。endprint
此外,計算社會科學還廣泛應用于更多的跨學科研究,包括“計算新聞學”“計算語言學”“計算犯罪學”“計量分類學”以及“計算創(chuàng)新”等范疇,均有極其重要的研究進展。同樣,在人文學科領域,包括“計算史學”“計算法學”等分支學科,長期的研究積累加之以現(xiàn)代計算技術的輔助,也產(chǎn)出了大量令人矚目的研究成果。2016年,R. Michael Alvarez編著的《計算社會科學:發(fā)現(xiàn)與預測》全面回顧和概括了計算社會科學的發(fā)展狀況,發(fā)現(xiàn)計算社會科學擁有豐富的工具箱,并廣泛應用于社交媒體、抗爭運動、議會表決、新型政黨組建、政府治理以及社會營銷學等領域。
三、計算社會科學的多學科進路:數(shù)據(jù)驅動與算法驅動
在當前的大數(shù)據(jù)背景下,計算社會科學更多地是以“大數(shù)據(jù)+”的形式出現(xiàn),因而相應產(chǎn)生了大數(shù)據(jù)社會學、大數(shù)據(jù)政治學等學科領域。但在具體的分支學科領域,“計算化”的發(fā)展和成熟程度存在著明顯的差異,這既與分支學科的歷史積累有關,又與學科知識的實際應用偏好有關。然而,值得注意的是,作為計算社會科學的分支,它們的知識發(fā)展同樣受到“雙重驅動”的關鍵影響。一是“數(shù)據(jù)驅動”,即學科在何種程度上利用了本領域產(chǎn)生的數(shù)據(jù);二是“算法驅動”,即學科在何種程度上發(fā)展了適合自身需要的算法和模型。就此而論,具體的學科領域之于相關社會生活領域的寬狹大小、相關社會生活領域的“數(shù)字化生存”程度高低以及數(shù)據(jù)生成能力的大小和數(shù)據(jù)密集程度的高低,作為外部主體的體量會嚴重限定具體學科受到“數(shù)據(jù)驅動”的壓力大小。而具體的學科領域在其前期發(fā)展所積累的量化知識總量、計算能力的高低乃至于與其他計算學科的共享融合水平,作為主體的內生變量會嚴重影響其“算法驅動”的強度。
大數(shù)據(jù)經(jīng)濟學則既受益于數(shù)據(jù)驅動又歸功于算法驅動,其主要分支包括大數(shù)據(jù)宏觀經(jīng)濟研究、大數(shù)據(jù)金融學、大數(shù)據(jù)經(jīng)濟心理學等。劉濤雄等認為,大數(shù)據(jù)時代極大地拓寬了信息來源,提高了獲取信息的時效性,而新數(shù)據(jù)的非結構化特征對宏觀經(jīng)濟分析的技術和方法提出了新要求 〔6 〕。大數(shù)據(jù)語境下,數(shù)據(jù)噪聲會影響數(shù)據(jù)質量,因而宏觀經(jīng)濟數(shù)據(jù)挖掘變得十分重要,這就要改進數(shù)據(jù)挖掘技術,加強對非結構化和半結構化數(shù)據(jù)的挖掘。實時、快速、海量的數(shù)據(jù)為更加準確的宏觀經(jīng)濟預測提供了可能。此外,機器學習與宏觀經(jīng)濟分析方法的結合可以有效解決“維數(shù)災難”,提高宏觀經(jīng)濟分析的準確性。大數(shù)據(jù)影響著政府經(jīng)濟政策制定和評估的變革,進而提升政策的時效性和服務效率。劉志洋、湯珂認為,大數(shù)據(jù)時代信息產(chǎn)生和傳遞的速度空前加快,如互聯(lián)網(wǎng)上的大量信息是實時的,移動互聯(lián)網(wǎng)和物聯(lián)網(wǎng)使每個人隨時隨地都可能制造數(shù)據(jù),這導致經(jīng)濟模型可以充分利用數(shù)據(jù)的實時性,提高分析或預測的時效性,為經(jīng)濟預警和政策制定提供最快速的資料和依據(jù) 〔7 〕。簡言之,大數(shù)據(jù)帶來經(jīng)濟分析的方法論變革,隨著信息量的極大拓展和處理信息能力的提高,經(jīng)濟分析可能從樣本統(tǒng)計時代走向總體普查時代。此外,復雜經(jīng)濟系統(tǒng)中,充分利用多元要素之間的相關關系對于經(jīng)濟預測、政策制定與評估的作用,為經(jīng)濟分析提供了新機遇。
大數(shù)據(jù)政治學主要應用大數(shù)據(jù)分析學和海量數(shù)據(jù)資源探究新信息時代的政治現(xiàn)象。大數(shù)據(jù)將政治場域從物理空間擴展到虛擬空間,為政府、公民、企業(yè)等行為主體創(chuàng)造新的互動空間和模式,重塑各主體間的關系模式 〔8 〕。大數(shù)據(jù)在政治領域的影響力主要通過兩種機制來體現(xiàn):一方面,大數(shù)據(jù)作為一種創(chuàng)新制度推動著更開放、更高效和更智能的治理制度的建設,為政治行為和政策過程創(chuàng)造了新型平臺 〔9 〕;另一方面,大數(shù)據(jù)所生產(chǎn)并傳播的豐富信息突破了傳統(tǒng)政治信息傳播和發(fā)揮影響的時間和空間限制,信息日益成為政治表達、政治互動、政策決策與制度運行的關鍵要素,進而推動著治理制度及其現(xiàn)實運作的變化。此外,大數(shù)據(jù)政治學對數(shù)據(jù)分析學的依賴取決于政治學研究的方法傳統(tǒng),與政治學量化傳統(tǒng)不同,大數(shù)據(jù)為政治學研究提供了諸如文本、圖片、視頻等定性研究素材,而數(shù)據(jù)分析學作為嫁接定性研究和定量研究的橋梁,為定性資料的定量分析、定量分析的定性闡釋提供了可行性。大數(shù)據(jù)方法一定程度上可以穿透政治現(xiàn)象的復雜性和特殊性,為中國政治的研究者帶來深刻而豐富的洞見,并為其理論提供更強大的說服力。
計算社會科學是一門數(shù)據(jù)驅動的、以數(shù)據(jù)密集化為特征的交叉學科,其研究和應用的范圍十分廣泛。其發(fā)展大致受到四種相互區(qū)別的議題的共同作用:一是傳統(tǒng)議題與新興議題。計算社會科學一方面著眼于利用新數(shù)據(jù)新技術來應對人類世界出現(xiàn)的新問題新挑戰(zhàn);另一方面又致力于以全新方式和全新視角重構和解讀社會學研究的經(jīng)典概念,包括階層/階級、社會流動、社會觀念等。二是主體性與群體性。計算社會科學的靈活性和適應性有助于從點到面地對人與群體的互動展開研究,既著眼于個人行為屬性分析的基礎性地位,又強調社會關系、社會網(wǎng)絡及群體特征分析的宏觀架構。三是外部條件性與內部動力性。計算社會科學一方面強調社會生活中信息規(guī)律和制度演變等外部條件的探討,如由信息內容分布的解析到話題發(fā)現(xiàn)和言論傳播;另一方面又關注此類外部條件與人類個體心靈之間相互作用、相互影響的關系。四是獨立性與交互性:計算社會科學一方面通過對范式和話語體系的重構來為以往社會學研究中的模糊概念“劃界”,另一方面由強調不同概念及不同概念所代表的社會現(xiàn)實之間的交互性,著重探討個體的傾向性、可信度和影響力等屬性對外界條件的響應模式、傳導機理和交互適應性,以及關系網(wǎng)絡演變。
相較于傳統(tǒng)心理學,大數(shù)據(jù)心理學具有新的研究對象和研究范式。心理學長期關注心理過程和行為,傳統(tǒng)心理學采用大量的行為實驗來探究心理現(xiàn)象。大數(shù)據(jù)時代數(shù)據(jù)就是行為,即大數(shù)據(jù)記錄的信息實際上就是普遍化的人類行為,而且被數(shù)據(jù)記錄的行為具有自愿化特征,是自然發(fā)生的,反映人自覺自愿的行為 〔10 〕。與傳統(tǒng)數(shù)據(jù)相比,大數(shù)據(jù)的產(chǎn)生并非有意采集或生產(chǎn),大多是自覺自愿的真實社會實踐記錄。這與傳統(tǒng)實驗研究采取現(xiàn)金激勵或課程激勵等方式招募被試存在重要區(qū)別,然而卻更接近社會現(xiàn)實。在研究范式方面,心理學強調研究的可重復性、可比較性和標準化,而大數(shù)據(jù)的行為數(shù)據(jù)為可復制、可比較地開展研究提供了數(shù)據(jù)和算法條件。此外,與大數(shù)據(jù)相關的新興技術的快速發(fā)展與應用(如物聯(lián)網(wǎng)、云計算、可穿戴設備、人工智能、增強/虛擬現(xiàn)實等)催生了新的管理和商業(yè)模式、新興產(chǎn)業(yè),為社會經(jīng)濟生活注入了新活力,極大地豐富和拓展了大數(shù)據(jù)在管理科學、法學、傳播學、人文學科等領域的創(chuàng)新應用,為學術界、產(chǎn)業(yè)界以及政府部門的知識需求和交流帶來新模式。endprint
四、大數(shù)據(jù)時代社會科學研究的范式轉換
社會科學的范式發(fā)展經(jīng)歷了宏大理論時期、行為主義時期、后行為主義時期和計算社會科學時期。早期的社會科學以宏大理論的提出和對社會現(xiàn)象的結構化-反思化分析為主,其典型代表即是帕森斯的社會結構理論。宏大理論提供豐富視角的同時也因其“理論壟斷”性質而引發(fā)了學界的不滿,以假設-檢驗為主要研究模式的行為主義范式日漸發(fā)展起來。行為主義的壯大得益于知識需求、量化方法和本體論三個因素。在知識需求方面,20世紀上半葉意識形態(tài)的分化、階級和種族沖突、經(jīng)濟政治制度的變革、國際格局的深刻調整,引發(fā)了社會對社會知識的高度關注,譬如美國為適應冷戰(zhàn)需要而對相關研究注入了強大推動力,而同期量化方法和社會科學本體論的發(fā)展為社會現(xiàn)象或行為的科學化研究提供了方法論支撐。后行為主義是在行為主義與后現(xiàn)代主義為代表的新理論論爭的過程中產(chǎn)生的。它一方面承認行為主義的固有缺陷,另一方面又反對后現(xiàn)代主義等所主張的反科學主義、反客觀主義和反敘事主義的態(tài)度。后行為主義在學科范式上對行為主義的改良并非是革命性的。
從科學哲學的角度看,計算科學的發(fā)展歷程向我們呈現(xiàn)了一個科學范式發(fā)生轉化的生動例證。近年來學界討論計算社會科學革命的聲音不斷增加。庫恩認為任何科學的發(fā)展都要經(jīng)過一個相同的歷程:前科學—常規(guī)科學—危機—革命—新的常規(guī)科學—新的危機—新的革命,這個過程循環(huán)往復不斷進行,推動科學不斷進步。在常規(guī)科學階段,為科學家共同體所公認并用以指導其研究工作的統(tǒng)攝性理論框架或科學研究視角形成,科學共同體中的科學家運用相同的范式去解決該領域中的科學難題。當常規(guī)科學發(fā)展到一定時候,科學家會遇到既有范式無法解決的反常問題,使得人們開始對范式失去信心,于是“危機”出現(xiàn)。在這種情況下,為了解決反常問題,有人會提出新的范式。如果新的范式被科學家共同體廣泛接受,科學革命便發(fā)生。因此,所謂科學革命,就是一種新的科學范式取代原有范式的過程。一般而言,一種新的范式不可能立即取代原有的范式,總要經(jīng)過或長或短時間的爭論乃至斗爭。
計算社會科學是建立在社會科學量化分析的本體論和多元化技術積累基礎上的。計算社會科學盡管更為強調數(shù)據(jù)、模型、算法等“計算”維度,但它確實可被視為行為主義與后現(xiàn)代主義為代表的新理論的某種妥協(xié)和融合。首先,計算社會科學承認個體或群體層面的人類行為具有某些用行為主義的研究范式難以覺察并加以研究的因素,但其處理方法,則是將此類因素分為潛變量和顯變量,盡管有些因素確實是難以直接測量和觀察的,但它們可被視為影響行為的潛變量,并因此可以用其作為其外在表征的顯變量來呈現(xiàn)和測量。其次,計算社會科學承認人類行為的復雜性,認為抽象模型和變量不足以反映社會現(xiàn)象,但處理方法則是將大量變量納入分析中,變量的豐富性及變量間的復雜關系無疑超出了任何人類研究者進行純粹定性研究的研究能力。從這個意義上講,盡管人們將計算科學與“數(shù)據(jù)驅動”“計算”等概念聯(lián)系在一起,但是計算社會科學的學科范式確實是各種范式相互競爭、相互啟發(fā)、相互融合的結果。物質生產(chǎn)形態(tài)的變化、科學技術條件的進步及知識創(chuàng)新范式的轉換是社會科學范式轉換的重要成因。因為上述三者既影響人類社會的組織和生活方式,更影響解釋或理解人類社會的基本假設和研究范式 〔11 〕。計算社會科學是社會科學定性-定量傳統(tǒng)、相關-因果傳統(tǒng)、社會科學與自然科學競爭與融合的產(chǎn)物,而技術進步、學科間融合、新數(shù)據(jù)分析技術的應用、新的商業(yè)和組織環(huán)境正在加速推動這種范式轉換?,F(xiàn)有研究逐步表明,計算社會科學會引發(fā)社會科學的一場革命,即社會科學的計算路徑有潛力為社會科學共同體接受,從而成為一種在社會科學研究中有競爭力的研究范式。
社會科學的發(fā)展史已經(jīng)證明,一門新興學科的興起是多種條件共同作用的結果。具體到計算社會科學而言,實際就是社會科學知識、現(xiàn)實經(jīng)濟社會發(fā)展需要、數(shù)據(jù)收集及分析技術、網(wǎng)絡與計算基礎設施、算法模型等方面發(fā)展共同促成的產(chǎn)物。計算社會科學的發(fā)展史已經(jīng)顯示,不同要素之間不僅具有外在聯(lián)系,而且也具有內在聯(lián)系,往往一種要素并不會“等待”其它要素的改變以形成新學科,而是會主動促成其它要素的改變。計算社會科學使用海量數(shù)據(jù)為基礎,服務于日益興盛的社會經(jīng)濟需求,而與海量數(shù)據(jù)分析相應的并行計算、多元算法和硬件條件幾乎是在很短的時間內完成整合的。近兩年來,計算社會科學的發(fā)展逐步使新學科的形成成為現(xiàn)實,這種學科創(chuàng)新將體現(xiàn)為圍繞著數(shù)據(jù)驅動和算法驅動采取不同融合方式而形成的一系列“問題解決性、應用導向”研究領域。
當然,大數(shù)據(jù)時代,熟悉計算技術的社會科學家能夠以前所未有的工具和手段借助自然科學的“實驗—理論—驗證”的范式研究社會現(xiàn)象,這是社會科學當代發(fā)展的必然。然而,個體行動者的個體差異、相互交往和網(wǎng)絡關系的異常復雜且日益加劇,數(shù)據(jù)獲取和處理的困難,以及研究對象的數(shù)據(jù)隱私及其倫理接點,加上計算思維在社會科學研究中的應用還處在初始起步階段,觀念的滯后、理論的零散、方向的模糊、多學科背景的綜合人才極度缺乏、原有學科框架的知識制約,也會成為計算社會科學發(fā)展的障礙。因此,計算社會科學的發(fā)展仍需要有更多志同道合者的共同努力。
參考文獻:
〔1〕C.R.勞.統(tǒng)計與真理〔M〕.北京:科學出版社,2004.
〔2〕郭曉科.大數(shù)據(jù)〔M〕.北京:清華大學出版社,2013.
〔3〕King Gary. Restructuring the Social Sciences: Reflections from Harvards Institution for Quantitative Social Science〔J〕. Political Science & Politics, 2013(1).
〔4〕吳 江,張小勁.大數(shù)據(jù)國際政治研究的回顧與展望〔J〕.華中師范大學學報(人文社會科學版),2016(7).
〔5〕Macy, Michael W., Willer Robert. From Factors to Actors: Computational Sociology and Agent-Based Modeling〔J〕. Annual Review of Sociology, 2002(28).
〔6〕劉濤雄,徐曉飛.互聯(lián)網(wǎng)搜索行為能幫助我們預測宏觀經(jīng)濟嗎?〔J〕.經(jīng)濟研究,2015(12).
〔7〕劉志洋,湯 珂.互聯(lián)網(wǎng)金融的風險本質與風險管理〔J〕.探索與爭鳴,2014(11).
〔8〕孟天廣,郭鳳林.大數(shù)據(jù)政治學:新信息時代的政治現(xiàn)象及其路徑探析〔J〕.國外理論動態(tài),2015(1).
〔9〕孟天廣,李 鋒.網(wǎng)絡空間的政治互動:公民訴求與政府回應性——基于全國性網(wǎng)絡問政平臺的大數(shù)據(jù)分析〔J〕.清華大學學報(哲學社會科學版),2015(3).
〔10〕喻 豐,彭凱平,鄭先雋.大數(shù)據(jù)背景下的心理學:中國心理學的學科體系重構及特征〔J〕.科學通報,2015(5).
〔11〕李 強.大數(shù)據(jù)社會科學〔J〕.清華大學學報(哲學社會科學版),2015(3).
責任編輯 蘇玉娟endprint