池志培 侯娜
【內(nèi)容提要】 大數(shù)據(jù)事件庫的出現(xiàn)給量化國家間關(guān)系提供了一種新的可能路徑。本文利用目前全球最大的事件數(shù)據(jù)庫GDELT來測量1993—2016年的中美關(guān)系,并探討五種不同的計算方法及其問題。本文討論了如何判斷測量的準確性問題,并將結(jié)果與清華大學的“中國與大國關(guān)系數(shù)據(jù)庫”中同時段的中美關(guān)系測量值進行比較,證明基于大數(shù)據(jù)的測量具有一定的價值。本文同時分析了大數(shù)據(jù)測量方法存在的問題,并探討了其解決方法。
【關(guān)鍵詞】 GDELT 大數(shù)據(jù) 事件 雙邊關(guān)系測量 中美關(guān)系
【作者簡介】 池志培,中央財經(jīng)大學國防經(jīng)濟與管理研究院助理研究員,中央財經(jīng)大學全球經(jīng)濟與可持續(xù)發(fā)展研究中心兼職研究員。
國際關(guān)系的研究對象是國與國之間的關(guān)系,但由于國與國之間的關(guān)系往往是多維和復雜的,因而對關(guān)系的判斷通常只能依賴于研究者的經(jīng)驗、直覺和理論偏好,這也就意味著不同的研究者對于國與國之間關(guān)系的判斷差異很大。要解決這個問題,一個方法是對于國家間的關(guān)系進行量化研究。量化是當代社會科學研究的趨勢,通過準確的數(shù)據(jù),我們才能進行跨時段、跨國的比較,從而發(fā)現(xiàn)趨勢與規(guī)律,甚至提供某種預測。但是要將國家間關(guān)系轉(zhuǎn)化成單一維度的數(shù)字來測量還面臨著方法論和實際操作中的巨大困難。
目前衡量國家間關(guān)系的主要方法是分析事件數(shù)據(jù)。從理論上來說,如果能對國家之間發(fā)生的所有事件進行統(tǒng)一的分析,那么應(yīng)該就能很好地把握它們之間的關(guān)系,因為關(guān)系必然要通過事件來體現(xiàn)。如果所有的事件都能通過一個統(tǒng)一的測量標準進行衡量,再將這些測量的結(jié)果進行匯總,那么就能對關(guān)系進行量化。由于雙邊關(guān)系是所有關(guān)系的基礎(chǔ),多邊關(guān)系可以還原成多組雙邊關(guān)系,所以本文的研究將聚焦于雙邊關(guān)系的測量。
近年來,隨著計算機技術(shù)和智能硬件技術(shù)的飛速發(fā)展和普及以及網(wǎng)絡(luò)社會的形成和算法的進步,人類得以累積了海量數(shù)據(jù),即所謂的大數(shù)據(jù)。雖然不同的學者或者機構(gòu)對于大數(shù)據(jù)的定義有所區(qū)別,但是對于大數(shù)據(jù)的一些共性特征,各方還是有一些共識——大數(shù)據(jù)包含了3個V關(guān)于大數(shù)據(jù)的不同定義,可以參見:Jonathan Stuart Ward and Adam Barker, “Undefined By Data:A Survey of Big Data Definitions,” arxiv.org/abs/1309.5821.關(guān)于大數(shù)據(jù)的簡要歷史,可參見:Gil Press,”A Very Short History Of Big Data,” Forbes, May 9, 2013, https://www.forbes.com/sites/gilpress/2013/05/09/a-very-short-history-of-big-data/#5db944eb65a1.此外,亦有觀點認為大數(shù)據(jù)還需要第四個V,即veracity,指數(shù)據(jù)的真實性。:量(volume),數(shù)據(jù)量非常巨大;種類(variety),即數(shù)據(jù)類型多樣,從文本到圖像、視頻,等等;速度(velocity),即數(shù)據(jù)產(chǎn)生和處理的速度非???。本文討論所涉及的目前全球最大的社會科學數(shù)據(jù)庫GDELT(Global Database of Events, Language, and Tone)就是其中一個,它從全世界超過100種語言的媒體中收集信息,并通過特定的編碼體系由計算機自動將其編碼成一個個事件,時間跨度從1979年到今天,并持續(xù)每天更新。目前已經(jīng)收集了超過2.5億個事件的信息,包括事件的發(fā)起者、對象、地理位置、事件類型、信息來源等32個變量。就傳統(tǒng)國際關(guān)系關(guān)注的國家之間的關(guān)系而言,這個數(shù)據(jù)庫幾乎涵蓋了所有已經(jīng)公開的事件。正如維克多·麥爾-荀伯格(Viktor Mayer-Schnberger)所提及的,抽樣數(shù)據(jù)會變得過時,因為我們可以獲得全部的數(shù)據(jù)Kenneth Cukier and Viktor Mayer-Schoenberger, “The Rise Of Big Data:How It's Changing the Way We Think about The World,” Foreign Affairs, Vol.92, No.3, 2013, pp.28-40.。如果能充分利用這些巨量的事件大數(shù)據(jù),那么就應(yīng)該可以相當準確地對雙邊關(guān)系的現(xiàn)狀和趨勢作出判斷。那么,使用這些海量數(shù)據(jù)能否得到可靠的結(jié)論,與現(xiàn)有的方法相比如何呢?同時,使用這些大數(shù)據(jù)可能遇到的問題和可能的解決方式又有什么呢?本文將以中美關(guān)系為例,通過對GDELT事件數(shù)據(jù)的使用來探討這些問題。
一、 事件數(shù)據(jù)與雙邊關(guān)系:歷史與文獻回顧
雖然大數(shù)據(jù)事件庫是近些年才出現(xiàn)的,但是人類通過記錄事件數(shù)據(jù)來發(fā)現(xiàn)和研究社會已經(jīng)有很長的歷史了,一個例子就是對犯罪事件的記錄。當代學術(shù)意義上的通過事件數(shù)據(jù)來考察兩國之間的關(guān)系開始于1960年代,隨著社會科學中的行為主義革命而產(chǎn)生。行為主義革命者希望采用能觀察到的變量和計量方法來研究社會現(xiàn)象。對于國際關(guān)系、外交政策的分析而言,這個能被測量的對象就是事件(event)。關(guān)于事件數(shù)據(jù)庫的起源與行為主義革命的關(guān)系以及早期發(fā)展,可以參見:Stephen J.Andriole and Gerald W.Hopple, “The Rise and Fall of Event Data:From Basic Research to Applied Use in the US Department of Defense,” International Interactions, Vol.10, No.3-4, 1984, pp.293-309; John Lewis Gaddis, “Expanding the Data Base:Historians, Political Scientists, and the Enrichment of Security Studies,” International Security, Vol.12, No.1, 1987, pp.5-7; Philip A.Schrodt, “The Statistical Characteristics of Event Data,” International Interactions, Vol.20, No.1-2, 1994:35-53.關(guān)于政治學中的行為主義革命的特征及其簡要歷史,可以參見:Robert Dahl, ?“The Behavioral Approach in Political Science:Epitaph for a Monument to A Successful Protest,” American Political Science Review, Vol.55, No.4, 1961, pp.763-772; David Easton, “Introduction:The Current Meaning of ‘Behavioralism’ in Political Science,”in J.S.Charlesworth, ed., The Limits of Behavioralism in Political Science (Philadelphia:American Academy of Political and Social Science,1962), pp.1-25; David Easton, “Political Science in the United States:Past and Present,” International Political Science Review, Vol.6, No.1, 1985, pp.133-152.查爾斯·麥克萊蘭(Charles McClelland)最早從他對外交史的研究開始了這種嘗試。最初的事件數(shù)據(jù)的生成采用的是人工手動編碼的方式。由于人工編碼需要大量的人力,研究者不得不在分析的廣度和成本之間作取舍Richard L.Merritt, “Measuring Events for International Political Analysis,” International Interactions, Vol.20, No.1-2, 1994, p.6.。覆蓋的來源越多、廣度越大,就意味著研究成本的急劇上升,因此研究者不得不選擇很有限的幾個事件的數(shù)據(jù)來源。同時,人工編碼也容易受個人身體狀態(tài)(比如疲勞等)和主觀判斷的影響在關(guān)于事件數(shù)據(jù)庫的研究開始以后,研究者對于人工編碼存在的各種可能的問題也進行了研究,包括利用同一數(shù)據(jù)來源來比較不同編碼者之間的差異,不同的編碼者和數(shù)據(jù)庫的表現(xiàn)差異很大,有從40%到90%不等的可靠性。參見:Philip A.Schrodt and Christopher Donald, “Machine Coding of Events Data,” paper presented at the International Studies Association meetings, Washington DC, April 1990, p.6.,因此,事件分析方法的局限比較明顯。早年的代表性數(shù)據(jù)庫有魯?shù)婪颉斆罓枺≧udolph J.Rummel)的“國家的維度”(Dimensionality of Nations,DON; Rummel, 1972),查爾斯·赫爾曼(Charles Hermann)等的“國家事件比較研究”(Comparative Research on the Events of Nations,CREON; Hermann et al., 1977),愛德華·阿薩爾(Edward Azar)的 “沖突與和平數(shù)據(jù)集”(Conflict and Peace Data Bank,COPDAB; Azar, 1980, 1982; Azar and Sloan, 1975),查爾斯·麥克萊蘭(Charles McClelland)的“世界事件互動測量” (World Event/Interaction Survey,WEIS; Charles McClelland,1976)等。這些數(shù)據(jù)庫被廣泛應(yīng)用于國際關(guān)系研究,尤其是關(guān)于沖突、動亂和戰(zhàn)爭的研究。Philip A.Schrodt, “The Statistical Characteristics of Event Data,” International Interactions, Vol.20, No.1-2, 1994, pp.35-6.其中COPDAB和WEIS的數(shù)據(jù)在經(jīng)濟相互依賴與沖突的研究中時常被使用。Solomon W.Polachek, “Conflict and Trade,” Journal of Conflict Resolution, Vol.24, No.1, 1980, pp.55-78; Mark Gasiorowski and Solomon W.Polachek, “Conflict and Interdependence:East-West Trade and Linkages in the Era of Détente,” Journal of Conflict Resolution, Vol.26, No.4, 1982, pp.709-729; Jon C.Pevehouse, “Interdependence Theory and the Measurement of International Conflict,” The Journal of Politics, Vol.66, No.1, 2004, pp.247-266.在1970年代末和1980年代初,美國的政府機構(gòu)如國務(wù)院和國防部也組織了類似的項目,主要用于沖突預警。
在計算機廣泛應(yīng)用于社會科學研究之后,有學者將計算機程序自動編碼引入事件分析之中,以解決廣度和成本的矛盾。從1980年代末和1990年代初開始,美國國家科學基金會(National Science Foundation, NSF)支持了“國際關(guān)系中的數(shù)據(jù)發(fā)展”項目(Data Development in International Relations, DDIR),利用計算機來自動編碼新聞事件。在這項資金的支持下,堪薩斯大學的美國政治學家德波拉·耶納(Deborah J.Gerner)和菲利普·斯洛德特(Philip Shrodt)等人利用WEIS的事件編碼系統(tǒng),實現(xiàn)了自動事件編碼處理,形成堪薩斯事件數(shù)據(jù)系統(tǒng)(Kansas Event Data System,KEDS),成為當時最大的事件數(shù)據(jù)庫。耶納和斯洛德特等后來開發(fā)了新的編碼系統(tǒng)——沖突和調(diào)停事件觀察(Conflict and Mediation Event Observations, CAMEO),并為后來的大型事件數(shù)據(jù)庫所廣泛使用。另一個不太常用的自動編碼系統(tǒng)是the Integrated Data for Event Analysis (IDEA),為另一個自動事件數(shù)據(jù)項目the Protocol for the Assessment of Nonviolent Direct Action (PANDA)所使用。斯洛德特還開發(fā)了使用這個編碼系統(tǒng)的程序——以強化替換說明進行的文本分析(Textual Analysis by Augmented Replacement Instructions, TABARI)。
2008年,美國國防部下的國防高級研究計劃局(Defense Advanced Research Projects Agency,DARPA)資助了一個事件數(shù)據(jù)庫項目“綜合沖突早期預警系統(tǒng)”(the Integrated Conflict Early Warning System,ICEWS),通過收集事件數(shù)據(jù)來進行風險預警,主要是針對亞太地區(qū)。該項目資助開發(fā)了新的自動編碼程序BBN ACCENT,達到了相當高的準確率,與人工編碼比照,大概在80%左右。Elizabeth Boschee, et al., “ICEWS Coded Event Data,” Harvard Dataverse, V22, 2015, https://doi.org/10.7910/DVN/28075; BBN ACCENT Event Coding Evaluation.updated v01.pdf這個數(shù)據(jù)庫在3年的試驗期后轉(zhuǎn)交給了美國海軍。其數(shù)據(jù)涵蓋了1995年到當下,并且大量數(shù)據(jù)已經(jīng)放置于哈佛的開源數(shù)據(jù)庫(Harvard Dataverse)中,不過開源部分的數(shù)據(jù)只能到當前年份的前一年。美國國家科學基金會在2013年也再次資助了事件庫的開發(fā)和研究,目前有一個歷史數(shù)據(jù)庫(Cline Center Historical Phoenix Event Data)和一個實時數(shù)據(jù)庫(Phoenix Near-Real-Time Data),可以回溯到1945年,但是新聞來源相對有限。
the New York Times (1945—2005), the BBC Monitoring's Summary of World Broadcasts (1979—2015) and the CIA's Foreign Broadcast Information Service (1995—2004).目前最新的仍在進行的工作是重新開發(fā)新的編碼系統(tǒng)——可驗證事件數(shù)據(jù)的政治語言本體(Political Language Ontology for Verifiable Event Records, PLOVER)和編碼軟件——文本解析與相關(guān)編碼體系的派森引擎(Python Engine for Text Resolution and Related Coding Hierarchy,PETRARCH-2),而這將是事件數(shù)據(jù)庫發(fā)展的一個新階段,將取代目前主要數(shù)據(jù)庫所采用的CAMEO編碼系統(tǒng)。同時這些最新的開發(fā)工作都是開源的,源代碼都放在了開源社區(qū)Github中。
與前面述及的這些數(shù)據(jù)庫相比,GDELT要更為龐大。它是由卡勒夫·李塔魯(Kalev Hannes Leetaru)和斯洛德特在2012年啟動的一個項目。它也是使用計算機自動編碼的方式,從全球超過100種語言的媒體中自動挖掘信息,將新聞信息編碼成一個個事件的輸入。其中,最重要的3個信息來源是法新社、美聯(lián)社和新華社。時間范圍是從1979年到現(xiàn)在,并將擴展到1800年。同時,計算機每天都會從世界各地的媒體中持續(xù)收集信息,日增約10萬個事件。編碼體系采用的是CAMEO系統(tǒng)。在CAMEO系統(tǒng)中總共有20個大類超過300種不同的事件類型。而GDELT又將300多類的事件最終分成4個大類,即言語合作(verbal cooperation)、現(xiàn)實合作(material cooperation)、言語對抗(verbal conflict)和現(xiàn)實對抗(material conflict)。GDELT項目的每一個輸入包含了許多不同的信息項目,從1979年到2013年3月31日止的輸入包含57個信息,而2013年4月1日開始則增加到58個信息,增加了信息的來源以便核對。這些信息包括每個事件的時間,行為主體和行為對象的國家、名字、組織、類別,事件本身的性質(zhì)、影響程度、在所有來源中被提及的次數(shù),描述的語氣,事件的地理信息(包括經(jīng)緯度等)以及錄入日期、信息來源,等等。目前的數(shù)據(jù)已達數(shù)以億計,并可以免費獲得。
數(shù)據(jù)規(guī)模的龐大以及容易獲得使得GDELT一經(jīng)推出就引起了廣泛關(guān)注和討論,雖然事件數(shù)據(jù)庫主要用于沖突研究,但也已經(jīng)有一些研究嘗試利用GDELT來測量雙邊關(guān)系。如帕斯卡·阿卜(Pascal Abb)和蓋爾·斯特伍(Georg Strüver)的文章利用GDELT來衡量中國與東盟各國的關(guān)系,即利用GDELT事件數(shù)據(jù)中每個事件的Goldstein分值來衡量雙邊關(guān)系。Goldstein分值衡量了沖突或者合作事件的強度。他們將中國與東盟各個國家每年所有相關(guān)事件的Goldstein分值的平均值作為測量方式。Pascal Abb and Georg Strüver, “Regional Linkages and Global Policy Alignment:The Case of China-Southeast Asia Relations”, SSRN, March 15, 2015, https://ssrn.com/abstract=2600419 or http://sci-hub.tw/10.2139/ssrn.2600419.
國內(nèi)利用事件數(shù)據(jù)庫來測量雙邊關(guān)系開始得相對較晚。最早的研究來自李少軍,他2002年的一篇文章從《人民日報》中選取了克林頓政府期間中美關(guān)系的642個事件,并通過給每個事件賦值然后再求和計算的方式來判斷中美關(guān)系的沖突與合作水平。李少軍:《“沖突—合作模型”與中美關(guān)系的量化分析》,《世界經(jīng)濟與政治》2002年第4期,第43—49頁。而最有影響力的研究是來自清華大學閻學通團隊的系統(tǒng)工作。他們建立了一套自己的編碼體系,然后采用了人工編碼的方式見“事件分值基準表”,閻學通、周方銀:《 國家雙邊關(guān)系的定量衡量》,《中國社會科學》2004年第6期,第101—103頁。,主要基于《人民日報》和外交部的數(shù)據(jù),系統(tǒng)地梳理了從1953年開始的最為重要的中國雙邊關(guān)系的月度變化數(shù)據(jù),包括中國與美、日、俄、英、法、澳、越、印尼、巴基斯坦的關(guān)系。通過對每個月發(fā)生的雙邊關(guān)系事件的賦值打分和加總計算,展示了中國這些重要雙邊關(guān)系的演變,為實證研究雙邊關(guān)系的變化及其影響提供了非常重要的數(shù)據(jù)支持,產(chǎn)生了一系列重要的學術(shù)成果。但是,由于基于人工編碼的方式,所涉及的工作量極大,也因而難以擴展到更多的信息來源,而這也是許多評論者認為還需要改進的方面。陳定定:《定量衡量的得與失——簡評〈中外關(guān)系鑒覽1950—2005:中國與大國關(guān)系定量衡量〉》,《國際政治研究》2010年第4期,第163頁;董青嶺:《從事件賦值走向關(guān)系賦值:雙邊關(guān)系的定量衡量——評〈中外關(guān)系鑒覽1950— 2005:中國與大國關(guān)系定量衡量〉》,《外交評論》2011年第2期,第155頁。
事件大數(shù)據(jù)的出現(xiàn)提供了一個新的機會來重新思考雙邊關(guān)系的度量,在這種全覆蓋的方式下我們是否可以獲得更為準確的數(shù)值呢?接下來本文將以中美關(guān)系的測量為例,探討如何利用事件大數(shù)據(jù)來度量雙邊關(guān)系,并討論其準確性以及潛在的問題和應(yīng)對。
二、 GDELT與中美關(guān)系(1993—2016)的測量
(一) 計算方法
雖然GDELT包含了海量數(shù)據(jù)可供進一步分析,但是我們?nèi)孕枰獙⑦@些事件通過一定的算法進行處理來變成一個關(guān)系的量值?;贕DELT中能夠獲取的信息,有五種方式可以構(gòu)建出關(guān)系量值。
第一,由于GDELT中每一個事件最終都可以歸結(jié)成沖突事件或合作事件,所以計算每年合作數(shù)量與沖突數(shù)量的比值就可以衡量出雙邊關(guān)系的好壞。如果合作事件與沖突事件的比值很高,那么說明合作事件的數(shù)量要遠多于沖突事件,那么就可以認為雙邊關(guān)系處于較為良好的狀態(tài)。通過觀察年度數(shù)據(jù)的變化,自然也就可以衡量出雙邊關(guān)系的變化。這種方式的問題在于沒有將事件的強度考慮進去,有些事件可能比另外一些事件對雙邊關(guān)系的影響更大。
第二,也可以將合作事件數(shù)量減去沖突事件數(shù)量的差值作為雙邊關(guān)系的一個衡量。但是這個方法在當下使用會遇到嚴重的問題,即事件數(shù)量的逐年增加。由于過去幾十年中技術(shù)的飛速進步、網(wǎng)絡(luò)對社會生活滲透程度的巨大變化以及跨國交往的急劇增加,數(shù)據(jù)庫收錄的事件數(shù)量越往后越多,直接的差值也會隨著年份往后而急劇變大,因而很難用來測量雙邊關(guān)系的變化。當然,如果將來技術(shù)和社會變革到了平臺期,這種方式可能也可以較好地反映雙邊關(guān)系的變化。此外,這種方法也沒有考慮到事件之間強度的差異。
第三種方法略有不同。由于GDELT也給出了每個事件的Goldstein分值,這個值衡量了事件的強度,因此也可以用這個值來構(gòu)建雙邊關(guān)系的值。可以將所有事件的Goldstein分值相加,最后的結(jié)果即雙邊關(guān)系的賦值。這種測量方式的問題是事件的影響并不能相互抵消,即即便一個合作事件與一個沖突事件的影響的Goldstein值相同,在計算中會相互抵消,但是現(xiàn)實中對關(guān)系的影響也可能依然存在,尤其是在雙邊的復雜關(guān)系中。同時,一個Goldstein值為-10的事件對關(guān)系的影響也很難同10個Goldstein值為-1的事件的影響等同。此外,這種計算方式也無法反映出事件數(shù)量。而在雙邊關(guān)系的大部分事件為低烈度事件的時候,事件數(shù)量可能比強度能更好地把握雙邊關(guān)系。同時,這個方法也會受到事件數(shù)據(jù)的自然膨脹的影響,遇到與第二種方法類似的問題,所以如果要使用大數(shù)據(jù)事件庫來測量計算的話,這個方法會有內(nèi)在缺陷,導致它也不是很適合使用。李少軍利用事件數(shù)據(jù)來衡量中美關(guān)系的論文實際上就是采用了這個計算方法,當然,他的數(shù)據(jù)來源是單一的,不存在逐年自然擴張的問題,因此準確度要更高一些。
第四種方法基于Goldstein分值的計算,是在將所有事件的Goldstein分值加總以后,再除以事件數(shù),得出所有事件的平均Goldstein值作為雙邊關(guān)系的一個度量。阿卜和斯特伍的文章對于中國與東南亞國家關(guān)系的度量即采用了這種方法。這種方法解決了事件數(shù)量隨年份增加的問題,但是也沒有解決事件之間相互抵消的問題。當然,這也是所有通過事件來衡量關(guān)系的方法都會遇到的問題,即一個正值事件與一個負值事件或者一個高值事件與多個低值事件之間的權(quán)衡問題。
第五種方法也是基于Goldstein分值,即分別計算沖突事件和合作事件的Goldstein分值的平均值,然后以兩者比值的絕對值作為雙邊關(guān)系的衡量。由于沖突數(shù)據(jù)的Goldstein分值為負數(shù),所以最后比值也為負數(shù),故取絕對值。取平均值是為了避免事件數(shù)量在不同年份的巨大差異。這種方式測量的雙邊關(guān)系值是合作事件和沖突事件的平均強度的比值。這里也會遇到與第三種方法相同的問題,即無法反映出事件的數(shù)量。同時也會遇到事件之間的折算問題,比如,一個Goldstein值為5的事件是否對雙邊關(guān)系的影響等于5個Goldstein值為1的事件。同時,在對計算值的解釋上也會有一定的困難。雙邊關(guān)系中合作事件和沖突事件的平均強度的比值作為雙邊關(guān)系的衡量不夠直觀,在具體進行研究的時候會遇到對結(jié)果的闡釋問題。
除計算方法外,這里還會涉及時間段的選擇問題。用事件數(shù)據(jù)庫的方法來進行測量,我們必須選擇特定的時間段即一個時期內(nèi)發(fā)生的事件,這個時期可以是一周、一個月、一年或者任意長度的時間段。閻學通和周方銀對李少軍以及一般的用事件數(shù)據(jù)來衡量關(guān)系的一個批評,是事件分析法沒有將歷史考慮進去,基于事件的分析總是從零開始計算關(guān)系。某個月沒有發(fā)生沖突或者合作的事件,雙邊關(guān)系也并不會是零。如果某個月都是負值事件,也不表示兩國關(guān)系就是以沖突為主。閻學通、周方銀:《 國家雙邊關(guān)系的定量衡量》,《中國社會科學》2004年第6期,第92頁。這一批評有一定的合理性,但是并不完全準確。這個問題的實質(zhì)是時間段選擇的問題。一個月內(nèi)發(fā)生的事件可能具有一定的偶然性,一個月內(nèi)可能確實不會發(fā)生大的事情或者都是同一方向的,但是如果選取的時間段足夠長,那么對該時間段內(nèi)所有雙邊事件的考察應(yīng)該足以反映出雙邊關(guān)系。在較長的一個時間段內(nèi),兩國關(guān)系的種種不同方面應(yīng)該都會通過事件反映出來,畢竟歷史本身也就只是一個時間段。筆者認為,在用事件衡量雙邊關(guān)系時,一年是一個比較合適的時間區(qū)間。一年內(nèi)發(fā)生的事件應(yīng)該足以體現(xiàn)雙邊關(guān)系的歷史性基礎(chǔ),因為人類社會的計劃周期也一般以一年為基礎(chǔ),比如年齡計算、預算周期、工作報告,等等。而在政治世界中,年度周期也是比較明顯的,比如年度峰會、年度會晤、年度報告,等等??紤]到當今世界雙邊關(guān)系的互動程度,在一年之內(nèi)沒有發(fā)生合作或者沖突事件或者只發(fā)生一種類型事件的可能性是可以忽略的。還有一個考量是基于與現(xiàn)實的其他數(shù)據(jù)庫的匹配,政治類的數(shù)據(jù)庫多以年度更新為主,故以年度事件數(shù)據(jù)為依據(jù)計算也便于結(jié)合其他的數(shù)據(jù)進行分析。因此,在以事件數(shù)據(jù)來計算雙邊關(guān)系時,采用年度變化值是比較合適的,基本能夠避免測量非歷史性的批評。
(二)測量的準確性
討論完測量方法之后的另一個問題,就是如何知道我們的測量是否可靠地、比較真實地反映了雙邊關(guān)系的事實,而這也是測量最為重要的一個方面。
最為直接和常見的方法當然是與我們的常識相比較,如果度量的結(jié)果過于反常識,可能就意味著測量或者計算的方法有一定的問題。比如,如果兩國之間發(fā)生戰(zhàn)爭,雙邊關(guān)系的值反而顯示出雙邊關(guān)系更為友好,那么對雙邊關(guān)系的測量顯然是有嚴重的偏誤。比常識更為嚴格的檢驗是專業(yè)人士的共識,畢竟專家們能夠掌握更多更全面的信息,對雙邊關(guān)系這種復雜事實的把握要比常識更為可靠,所以我們的測量值也可以同專家們比較一致的意見相比較來考察其準確度。但是這兩種方法都是定性的考察,而我們的測量則是定量的。要想較為準確地比較定性和定量的分析存在方法論上的困難,畢竟定性語言的含混性與定量語言的準確性之間有難以彌合的鴻溝。定性語言的區(qū)分度要更低一些,從數(shù)值3到3.5或者4的變化在定性研究者看來也許都屬于友好關(guān)系,難以再進行進一步的區(qū)分。
如果我們使用定量的方法來檢驗,那么我們可以使用的方法包括與現(xiàn)成的數(shù)據(jù)庫相比較,又或者通過替換數(shù)據(jù)源的方式。具體到用GDELT的數(shù)據(jù)來衡量中美關(guān)系,我們可以與清華大學中國與大國關(guān)系數(shù)據(jù)庫中的中美關(guān)系值相比較。由于后者已經(jīng)給出了中美關(guān)系的月度變化值,所以將計算結(jié)果與之比較就能考察利用事件大數(shù)據(jù)進行雙邊關(guān)系測量的準確性,并且由于清華大學的數(shù)據(jù)來自于人工篩選和計算,這種比較就顯得更有價值。需要說明的是,由于基本方法論和計算方式上的差別,直接的數(shù)值比較并沒有意義,能夠進行比較的應(yīng)該是對趨勢的把握,即雙邊關(guān)系的變化趨勢在兩種測量方式下的比較。
當然,定性和定量的方法在思考測量的準確性時可以同時使用,并非相互排斥。
(三) 中美關(guān)系(1993—2016)
基于前面的論述,這一部分將具體討論用GDELT來測量雙邊關(guān)系。由于中美關(guān)系的重要性,現(xiàn)有的通過事件數(shù)據(jù)來測量雙邊關(guān)系的研究都特別關(guān)注中美關(guān)系,也選取中美關(guān)系進行測量,而這也有利于將本文的研究置于對中美關(guān)系的普遍關(guān)注和討論中。另一方面,GDELT中,時間越往后,數(shù)據(jù)的數(shù)量越多,所以本文選擇的時間范圍是冷戰(zhàn)結(jié)束以后,即克林頓執(zhí)政(1993年)以后。由于用于比較的數(shù)據(jù)可獲得性的原因,本文數(shù)據(jù)截止于2016年底。因此,本文研究的時間范圍是1993年至2016年。在這段時期內(nèi),中美關(guān)系整體上處于一個較為穩(wěn)定的狀態(tài)。
筆者首先從GDELT提供的數(shù)據(jù)中選取了從1993年到2016年中美政府間的事件,將其按照4個大類計算;同時由于區(qū)分了施動者,所以又可以分為中國對美國的事件和美國對中國的事件,簡單的總和計數(shù)如表1所示??梢园l(fā)現(xiàn),合作事件要遠遠多于沖突事件,而言語合作事件又要多于言語沖突事件。并且中美各自發(fā)起的沖突和合作的事件數(shù)量也大體相同,體現(xiàn)了兩個大國之間較為對等的關(guān)系。合作事件要遠遠多于沖突事件,這應(yīng)該也是符合常識和多數(shù)專家意見的,即中美兩國雖然時有沖突,但是還是合作更多。
清華大學的中國與大國關(guān)系數(shù)據(jù)庫顯示,中美關(guān)系在這個區(qū)間內(nèi)也是正值要遠多于負值(按該數(shù)據(jù)庫的定義說明,關(guān)系在普通區(qū)間以上,即合作多于沖突)。學術(shù)界的普遍看法是,冷戰(zhàn)后從克林頓政府開始,美國對華采取了接觸政策(engagement)為主的戰(zhàn)略,強調(diào)以合作塑造中國的行為,對這一政策的反思近年來在美國學界和政界頗多,可參見:Kurt Campbell and Ely Ratner, “The China Reckoning:How Beijing Defied American Expectations,” Foreign Affairs, Vol.97, March/April Issue, 2018, pp.60-70.這篇Foreign Affairs上的文章引發(fā)了一些最為知名的中美關(guān)系學者對美國對華政策以及中美關(guān)系的討論,參見:Wang Jisi et al., “Did America Get China Wrong?:The Engagement Debate,” Foreign Affairs, July/August Issue 2018, https://www.foreignaffairs.com/articles/china/2018-06-14/did-america-get-china-wrong.對美國政府對華政策的內(nèi)部考量,還可參見:Michael Green, By More Than Providence:Grand Strategy and American Power in the Asia Pacific since 1783 (New York:Columbia University Press, 2017).另一方面,雖然承認中美之間在利益上有差異和沖突,但國內(nèi)學者也認為合作是冷戰(zhàn)后的中美關(guān)系的基本基調(diào),參見:王緝思:《淺論中美關(guān)系的大環(huán)境和發(fā)展趨勢》,《美國研究》2006年第1期,第89—96頁;金燦榮、段皓文:《當前中美關(guān)系的問題與出路》,《國際觀察》2014年第1期,第71—83頁。 當然,主流的說法是“中美關(guān)系好不到哪里去,也壞不到哪里去”,強調(diào)對分歧的管控。
前文已經(jīng)討論了5種將事件轉(zhuǎn)化為關(guān)系的算法,在現(xiàn)有的GDELT中,不同年度收錄的事件數(shù)據(jù)有著比較大的差異,并且越往后的年度數(shù)據(jù)越多,因此基于差值計算的方法將會面臨年度數(shù)據(jù)越往后越大的問題,很難反映出是關(guān)系的變化還是數(shù)據(jù)收集技術(shù)的變化帶來的差別。本文采用合作與沖突事件次數(shù)的比值和年度平均Goldstein分值的方法進行計算。
首先是用合作和沖突事件次數(shù)比值的方法。這種計算方法暗含的假定是所有事件的權(quán)重相同。閻學通和周方銀的文章已經(jīng)證明,即便只計算事件的個數(shù)(假定權(quán)重賦值都相同),得出的結(jié)果依然是相當準確的。閻學通、周方銀:《 國家雙邊關(guān)系的定量衡量》,《中國社會科學》2004年第6期,第96頁。筆者隨后計算了中美從1993年到2016年每年的合作和沖突事件的比值(圖1)。可以看到,合作事件遠多于沖突事件,兩者的比值較大。但是隨著時間的推移,雖然具體年份值的高低并不是一個線性的變化過程,但是這個值有減少的趨勢,也就是說沖突事件的比例在上升,這意味著雙邊關(guān)系有逐漸緊張的趨勢。需要說明的是,雖然有這種趨勢變化,但中美之間仍是合作遠多于沖突。這符合我們一般的對中美關(guān)系的認知,即中美關(guān)系總體是和平合作的,而隨著中國國力的逐漸增強,中美之間競爭的一面會越來越強。閻學通將中美關(guān)系總結(jié)為“假朋友關(guān)系”,兩者之間關(guān)系不穩(wěn)定,時有沖突,長期來看對抗的趨勢不可避免。另外一個有意思的現(xiàn)象是,在GDELT測量值中,一般在總統(tǒng)選舉年中美關(guān)系的值都處于低值(除了1996年),這大概與選舉年美國的政客需要表現(xiàn)強硬有關(guān)系,雙方的言語沖突會更多一些。
如前所說,GDELT的所有事件都區(qū)分了施動者和受動者,所以我們也可以將中美對對方的政策給出類似的測量,用來衡量政策的合作和沖突的程度(圖2)。與雙邊關(guān)系的總體情況類似,兩國的政策也是合作為主,但是競爭的一面隨著時間的推移在緩慢地增加。并且相對而言,中國的政策穩(wěn)定性可能要更強一些(趨勢線的斜率要略小于美國),但是近年來兩國的政策越來越趨近。但是這個結(jié)果受到1998年的異常值影響較大。如果在數(shù)據(jù)中刪除1998年的值,則中美兩國的趨勢線則幾乎是平行的。這種測量是相對于清華大學中國與大國關(guān)系數(shù)據(jù)庫的一個優(yōu)勢,在清華數(shù)據(jù)庫中并不能區(qū)分出行為方向,而是從一個第三者的角度去觀察。在某些研究中,這種對雙方政策的描述會有重要的用途,比如考察中美兩國對對方的政策如何影響其他國家的相關(guān)政策。
從常識和專家意見來看,通過GDELT大數(shù)據(jù)的直接測量可以抓住雙邊關(guān)系的一些基本事實。為了進一步考察其準確性,筆者將其與清華大學中國與大國關(guān)系數(shù)據(jù)庫中的中美關(guān)系值作了比較。由于計算方法不同,所以兩者的分值不能直接比較,這里比較的是趨勢變化。由于GDELT中計算出來的值較大,為了便于觀察,從GDELT中計算的值都除以10。同時,對清華大學的月度數(shù)據(jù)分別采用取年平均值和年末月度值的方式來轉(zhuǎn)化成年度值。由于年末的數(shù)據(jù)反映了當年前11個月的雙邊關(guān)系運行的結(jié)果,所以第12個月也可以作為當年的關(guān)系值。圖3和圖4即結(jié)果。
簡單來看,兩種方式計算的值的變化比較相似,比如,不管哪種測量,都認為冷戰(zhàn)后中美關(guān)系的峰值在1998年,但是谷值卻有所不同。其中的差異在于,如果某年發(fā)生了極為負面的事件,在清華大學的數(shù)據(jù)里面影響要更大一些,而由于只是事件計數(shù),如果當年也發(fā)生了很多合作性的事件,那么從GDELT中計算出來的數(shù)值就不會是極低值。比如在1996年,雖然臺海危機導致兩國關(guān)系非常緊張,但是在當年3月危機之后,兩國關(guān)系即過了最低點,緊接著1997年和1998年雙方元首互訪,并將關(guān)系定位于“戰(zhàn)略伙伴關(guān)系”,因此1996年在GDELT的測量值中不會出現(xiàn)極低值。類似的是2001年,雖然發(fā)生了南海撞機事件,但是“9·11”事件之后兩國關(guān)系的迅速改善也使得當年的值不會是極低值。這種差別也貫穿在其他年份中,比如1997年和2004年。也需要看到,清華大學數(shù)據(jù)本身的年平均值與年末值也有差異。GDELT計算的數(shù)據(jù)與清華大學的數(shù)據(jù)在2005年之后的變化曲線要更為相似一些,這可能與GDELT的數(shù)據(jù)來源有關(guān),事件越早,GDELT中的數(shù)據(jù)越少,所以偏誤的可能性也更大,這在后文討論大數(shù)據(jù)的缺陷和問題時再進一步討論。
當然,最根本的區(qū)別在于趨勢線,不管是用年平均值還是用年末值來計算,清華大學中國與大國關(guān)系數(shù)據(jù)庫的年度數(shù)據(jù)都有上升的趨勢,即雙邊關(guān)系有逐步改善的傾向,只是在2016年奧巴馬執(zhí)政的最后一年有一個急劇的下滑。具體來看,清華大學數(shù)據(jù)顯示,奧巴馬時期的中美關(guān)系總體要好于小布什時期,除了最后兩年的急劇下滑。但是GDELT數(shù)據(jù)顯示,奧巴馬時期總體不如小布什時期,最后兩年的下滑也沒有那么戲劇化。這種差別很可能源于GDELT對于南海中美沖突事件的抓取要多于清華大學,畢竟清華大學的主要源數(shù)據(jù)來自于外交部和《人民日報》,相關(guān)內(nèi)容的報道比GDELT數(shù)據(jù)源要少??傮w來看,通過計算GDELT中合作和沖突事件的比值來度量中美雙邊關(guān)系具有一定的學術(shù)價值,值得進一步考察。
另一種測量方法是計算Goldstein年平均值(圖5、圖6)。這個值波動幅度很小,在整個時間段內(nèi)都在2~3之間浮動,整體趨勢略微向下。如果我們關(guān)注其折線變化的話,可以發(fā)現(xiàn)其波動變化趨勢與合作沖突比計算結(jié)果的變化幾乎是一致的,只是幅度要小得多,而與清華數(shù)據(jù)也有一定程度的相似性。最為明顯的差別是在2015年、2016年,Goldstein分值的平均值計算顯示雙邊關(guān)系有好轉(zhuǎn),與其他測量都是相反的結(jié)果。此外,與其他測量值相比,Goldstein平均值這種計算方法似乎沒有很好地反映出雙邊關(guān)系的波動性,其年度之間的變化強度比其他度量要更小。可能的原因是在當前中美關(guān)系的情勢下,事件數(shù)量比權(quán)重的考慮更為重要。在低烈度競爭狀態(tài)下,將所有事件的權(quán)重近似為相同得出的結(jié)果可能更能把握雙邊關(guān)系的實質(zhì),與前文所引的閻學通和周方銀的結(jié)論類似。而這可能也是用GDELT事件數(shù)量比值的測量更能把握雙邊關(guān)系趨勢的一個原因。
三、 大數(shù)據(jù)測量雙邊關(guān)系的問題與解決方法
雖然基于如GDELT這種大數(shù)據(jù)事件庫的測量為雙邊關(guān)系度量帶來一種新的覆蓋面更廣也更為簡便的實現(xiàn)方法,但是它也存在著很多問題需要解決。需要說明的是,這些問題很多也存在于人工編碼的事件數(shù)據(jù)庫中,并且人工編碼還涉及不同的編碼者之間不一致的問題,所以并非人工編碼就一定優(yōu)于機器編碼。接下來這一部分將側(cè)重探討機器編碼事件大數(shù)據(jù)庫可能遇到的問題及其可能的解決途徑。
(一) 數(shù)據(jù)來源的質(zhì)量問題
對于所有的大數(shù)據(jù)研究來說,數(shù)據(jù)來源的可靠性問題都是最為重要的。如果數(shù)據(jù)的源頭被污染,那么所有結(jié)論都會被質(zhì)疑。具體對于如GDELT這種事件數(shù)據(jù)庫而言,其數(shù)據(jù)質(zhì)量問題也一直是有爭議的,很多學者也主張數(shù)據(jù)在使用之前需要進行“數(shù)據(jù)清洗”董青嶺:《反思國際關(guān)系研究中的大數(shù)據(jù)應(yīng)用》,《探索與爭鳴》2016年第7期,第91—94頁。。數(shù)據(jù)質(zhì)量問題的原因有很多種,比較嚴重的包括報道視角、重復和新聞質(zhì)量。
在所有的新聞報道中,報道者都有其視角,因此必然會包含其對問題有意識或者無意識的特定看法,這無疑會導致由此生成的事件數(shù)據(jù)也帶有同樣的偏見,進而難以用來客觀地測量雙邊關(guān)系。當然,這不僅僅限于大數(shù)據(jù)事件庫,在人工數(shù)據(jù)庫中,由于涉及大量的勞動力和高強度的重復工作,往往只能有選擇性地偏重于特定數(shù)據(jù)來源。比明顯的偏見更為嚴重的問題則涉及更為根本的哲學爭論,即對事件的報道并不是一個完全客觀的問題,報道者及闡釋者都參與建構(gòu)了事實。事件數(shù)據(jù)庫往往只選擇了特定解釋、“唯一的”解釋、假想的“上帝視角”客觀無偏差地看待一件事的發(fā)生。Gavan Duffy, “Events and Versions:Reconstructing Event Data Analysis,” International Interactions, Vol.20, No.1-2, 1994, pp.147-167.現(xiàn)實情況是同一個事件存在著多個不同版本的敘事,而對于計算機編碼而言,被編碼成不同事件的可能性很大。這就涉及收錄新聞事件重復的問題。如果是對同一事實不同角度的表述,那么是否屬于重復就需要進一步探討。
除了新聞事件中的多重視角和建構(gòu)問題,重復錯誤也是大數(shù)據(jù)事件庫中普遍存在的一個問題。在今天媒體活躍的時代,同一個事件在一定時間內(nèi)會被反復地、類似地描述和報道,并被大量的媒體轉(zhuǎn)載報道。在這種情況下,計算機可能會自動抓取這些重復數(shù)據(jù),使得數(shù)據(jù)庫中收錄的事件數(shù)據(jù)要(大大)多于實際所發(fā)生的數(shù)據(jù)。沃德(Ward)等人則將GDELT與另一個機器自動編碼的事件數(shù)據(jù)庫ICEWS相比較,他們發(fā)現(xiàn)GDELT編碼的事件與ICEWS編碼有相當?shù)某鋈?,前者要比后者?shù)量龐大得多。他們認為GEDLT編碼的事件比實際要多Michael D.Ward et al., “Comparing GDELT and ICEWS Event Data,” Analysis, ?Vol.21, No.1, 2013, pp.267-297.,而ICEWS則比實際少。在某些受事件數(shù)量影響的特定算法下,這可能會嚴重干擾雙邊關(guān)系測量的準確性。
事件數(shù)據(jù)庫還存在著源新聞質(zhì)量的問題,即新聞錯誤甚至是假新聞,尤其是在媒體和自媒體更為發(fā)達的今天,在這個極為強調(diào)媒體時效性的時代,新聞出現(xiàn)錯誤甚至是故意制造假新聞的情況都不罕見。2016年的美國總統(tǒng)大選就飽受假新聞困擾,假新聞甚至被認為對最后結(jié)果產(chǎn)生了巨大影響。如果沒有甄別出來這種新聞錯誤或者假新聞,事件數(shù)據(jù)庫的客觀性必然會受到影響,進而影響到對雙邊關(guān)系的客觀測量。
針對這些問題,也有特定的途徑來解決或者減少它們對于最終數(shù)據(jù)和結(jié)果的影響。首先,擴大數(shù)據(jù)源和增加更多數(shù)據(jù)。更多數(shù)據(jù)和更廣覆蓋范圍可以使得偏見問題得到部分解決,如果我們認為人的偏見是內(nèi)在的、難以避免的,那么包含了所有偏見的數(shù)據(jù)比只包含特定偏見的數(shù)據(jù)就要更為準確和客觀。同時,如果我們能夠增加更多可靠的數(shù)據(jù)源,那么假新聞和新聞錯誤的影響也會被相應(yīng)地縮小。當數(shù)據(jù)量極大的時候,即便存在一部分錯誤和重復,其對最終結(jié)果也不會有影響。其次,利用人工智能識別假新聞和新聞錯誤。深度學習很適合用于發(fā)現(xiàn)數(shù)據(jù)中的特定模式,因此,通過訓練能讓機器自動過濾很多假新聞和新聞錯誤。目前,很多大科技公司已經(jīng)在利用類似的算法來識別和過濾假新聞Josh Constine, “Facebook Chose To Fight Fake News With AI, Not Just User Reports,”Tech Crunch, Nov 15, 2016, ?https://techcrunch.com/2016/11/14/facebook-fake-news/.。最后,適時的人工干預。對最終數(shù)據(jù)進行人工篩查依然是最為可靠的解決方式之一。當然,這種方法隨著數(shù)據(jù)量的增加會越來越不現(xiàn)實和低效,但是這種工作可以依靠計算機輔助,有選擇性地對特定數(shù)據(jù)進行篩查以提高效率。
(二) 編碼系統(tǒng)與編碼程序
事件數(shù)據(jù)庫面臨的第二個挑戰(zhàn)來自自動編碼系統(tǒng)和編碼程序。目前自動編碼系統(tǒng)生成的事件數(shù)據(jù)庫使用的基本都是CAMEO,而編碼程序則有斯洛德特的TABARI和ICEWS自己開發(fā)的BBK-ACCENT。根據(jù)與人工編碼的數(shù)據(jù)比較,目前BBK-ACCENT編碼程序的準確率可以達到80%左右,但這也意味著仍然有數(shù)量相當巨大的錯誤編碼事件存在。錯誤編碼事件自然會影響事件數(shù)據(jù)庫的準確性以及最終測量的雙邊關(guān)系的準確性。目前的編碼程序采用的是基于字典的稀疏句法分析(dictionary driven sparse parsing) Philip Schrodt and Jay Yonamine, ?“A Guide To Event Data:Past, Present, And Future,” All Azimuth:A Journal of Foreign Policy and Peace, Vol.2, No.2, ?2013, ?pp.12-13.,即基于新聞中的有效信息與字典的匹配進行事件分類。這種方法導致計算機對于復雜語言的分析能力并不強,分析語境或者分析使用修辭語的復雜語言的能力很有限。比如,很可能分不清一場拳擊賽與一場沖突之間的區(qū)別,又或者大量使用比喻等。當然,在主要的媒體新聞尤其是國際新聞中,句法一般不會太復雜。
但進一步而言,這個問題還需要區(qū)分隨機錯誤與系統(tǒng)錯誤。隨機錯誤即錯誤的出現(xiàn)是無規(guī)律的。就GDELT中的測量而言,錯誤出現(xiàn)在合作和沖突事件庫中的可能性是一樣的,這種情況對于最終結(jié)果的影響相對要小,尤其是當數(shù)據(jù)量極大的時候,這種影響甚至可以忽略。而如果是系統(tǒng)性的錯誤,那么對結(jié)果的影響就將是顯著的。比如,如果編碼程序的錯誤導致其偏好合作事件,那么最后測量的關(guān)系值必然也會偏向合作。系統(tǒng)性的錯誤無法通過增加數(shù)據(jù)量來解決。
對于編碼程序的質(zhì)量和錯誤問題,一方面是要增加數(shù)據(jù)量,解決大數(shù)據(jù)問題的一個重要方法永遠是更多更大的數(shù)據(jù),以此來使得其中的錯誤微不足道,不會影響到對關(guān)系的測量。另一個途徑則是增加方法和數(shù)據(jù)的透明度,以便學界能夠清楚地知道數(shù)據(jù)的產(chǎn)生過程,并能共同改進。在2013年4月1日以后的事件中,GDELT都提供了信息來源,以方便研究者進行進一步的數(shù)據(jù)篩查,而這將有助于事件數(shù)據(jù)準確性的提高。最后一個也是最基本的方法,是改進編碼系統(tǒng)和編碼程序的分析能力。目前學界已經(jīng)在積極地改進編碼系統(tǒng)和編碼程序,新一代系統(tǒng)(Patriarch 2)正在開發(fā)之中。這一發(fā)展將進一步使得利用大數(shù)據(jù)進行雙邊關(guān)系研究更具有可信度。目前,飛速發(fā)展的人工智能深度算法分析語言和句法的能力大大增強,在智能手機上廣泛使用的語音識別工具(如蘋果的SIRI),其所表現(xiàn)出的語言識別能力已經(jīng)非常驚人,將它與事件分析相結(jié)合,將能很大程度解決目前編碼程序遇到的問題。John Beieler, “Generating Politically-relevant Event Data,” arXiv, 2016, preprint arXiv:1609.06239.
(三) ?事件的性質(zhì)與數(shù)量的關(guān)系
關(guān)于雙邊關(guān)系的量化度量,一致存在的爭論是關(guān)于事件性質(zhì)與數(shù)量的取舍。對于雙邊關(guān)系來說,對單個事件賦值與只考慮事件的數(shù)量,哪個能更加有效地測量雙邊關(guān)系值呢?前文對這些問題已經(jīng)有所討論,很大程度上,對事件權(quán)重與數(shù)量的取舍取決于研究問題和對于雙邊關(guān)系的一般判斷。一般而言,當事件數(shù)量很少時,就不得不考慮事件的權(quán)重;而當事件數(shù)量非常巨大時,單個事件的權(quán)重就不那么重要了。
另一個問題是,言語和行為需要區(qū)別對待嗎?在政府與政府的交往中,言語行為與實際行為往往一樣重要,它們都對雙邊關(guān)系有著巨大影響。比如,雙方領(lǐng)導人關(guān)于雙邊關(guān)系定位的言論對雙邊關(guān)系起指導作用。因此,言語本身是測量雙邊關(guān)系的一個重要指標,不需要將它與實際行為分離考慮。
當然,在實際進行測量的時候,依然需要針對具體研究問題來設(shè)計,設(shè)計取決于我們更關(guān)注重大事件還是整體圖景對雙邊關(guān)系的影響。在設(shè)計時,要根據(jù)研究問題來選擇變量的測量。
(四) ?數(shù)據(jù)來源的轉(zhuǎn)換翻譯問題
目前的事件數(shù)據(jù)庫都基于英語,而自動編碼程序使用的字典也是英文的,所以其他語言的新聞是通過谷歌翻譯然后再用程序進行抓取。這會直接導致一個問題,即翻譯過程中的意義損失。沒有任何翻譯是完美的,尤其是機器翻譯。雖然隨著人工智能的發(fā)展,機器翻譯的質(zhì)量有了飛速提高,但是由于語言對于社會背景與傳統(tǒng)的依賴,不同語言之間的翻譯依然意味著很多意義可能流失,進而影響對事件的理解。
這個問題的解決方法是給不同語言的新聞編輯以同種語言的字典。關(guān)于中文句法分析,在Stanford Universal Dependencies項目下已經(jīng)有了中文字典,但是事件數(shù)據(jù)自動處理中的中文字典還沒有。如果將來中國要建立類似GDELT的事件數(shù)據(jù)庫,那么編撰自動編碼系統(tǒng)的中文字典是首先需要完成的工作之一。
四、 結(jié) 論
大數(shù)據(jù)事件庫的出現(xiàn)為國際關(guān)系研究提供了新的數(shù)據(jù)來源,也為量化研究和實證檢驗國際關(guān)系理論提供了計算基礎(chǔ)。通過對從GDELT中數(shù)據(jù)生成的中美關(guān)系值與清華大學中國與大國關(guān)系數(shù)據(jù)庫中的中美關(guān)系值以及相關(guān)的定性研究對比,本文證明利用大數(shù)據(jù)度量雙邊關(guān)系具有一定的學術(shù)價值與進一步發(fā)展的潛力。而雙邊關(guān)系作為更為復雜的多邊關(guān)系的基礎(chǔ),應(yīng)用在雙邊關(guān)系上的方法也可以很容易地擴展到多邊關(guān)系的研究上。因此,大數(shù)據(jù)對整個國際關(guān)系的量化具有潛在的重大貢獻。本文是這種努力的一個初步嘗試。
當然,沒有數(shù)據(jù)和方法是完美的,大數(shù)據(jù)的事件依然存在種種問題,但是這些問題大都能在某種程度上得到緩解。隨著新一代自動編碼系統(tǒng)、編碼程序以及人工智能的發(fā)展,事件數(shù)據(jù)庫的質(zhì)量也將進一步提升,而利用事件數(shù)據(jù)庫的大數(shù)據(jù)來進行國際關(guān)系研究的前景將更為廣闊。研究者在利用這些新工具時,也需要時刻意識到它可能存在的缺陷并通過研究設(shè)計來盡量避免這些不足。在大數(shù)據(jù)時代,最終決定研究質(zhì)量的仍將是研究者的研究設(shè)計和分析方法。Gary King:《大數(shù)據(jù)與數(shù)據(jù)無關(guān)》,鐘楊主編:《實證社會科學》(第三卷),上海交通大學出版社,2017年,第10—16頁。