謝明+++劉愛民
摘要:盡管大數(shù)據(jù)的理論和應(yīng)用已有著相關(guān)學科的各類研究,但既有的研究缺乏對不同政策適用大數(shù)據(jù)方法進行評估的考察。文章的目的就是檢視不同政策適用大數(shù)據(jù)方法進行評估的情況。文章基于對大數(shù)據(jù)相關(guān)文獻的介紹和梳理,分別從理論邏輯、現(xiàn)實應(yīng)用、實證經(jīng)驗三個維度對使用大數(shù)據(jù)方法進行政策評估的可行性進行分析,最后構(gòu)建“數(shù)據(jù)收集—數(shù)據(jù)分析”矩陣來描述何種政策可使用大數(shù)據(jù)方法進行評估。
關(guān)鍵詞:大數(shù)據(jù)方法;政策評估;收集數(shù)據(jù);分析數(shù)據(jù)
政策評估在我國發(fā)展至今,其重要性已經(jīng)得到一定的認可,但無論是作為政策理論研究的重要內(nèi)容,還是作為政策實踐的關(guān)鍵環(huán)節(jié),政策評估的地位及其在政策活動中應(yīng)發(fā)揮的作用都有待進一步發(fā)掘。問題的成因之一可能在于國內(nèi)學界目前缺乏對政策評估方法的研究,導致政策評估難為“無米之炊”。
黨的十八屆三中全會提出治理能力現(xiàn)代化的目標,并強調(diào)加強頂層設(shè)計。這對公共政策領(lǐng)域也提出了全新的要求,引入更加科學、規(guī)范、有效的評估方法是新時期政策評估發(fā)展的題中之義。傳統(tǒng)的政策評估方法主要包括規(guī)范研究方法和實證研究方法,兩者各有所長,又都有局限。面對日益多元而復雜的政策環(huán)境,運用單一的研究方法進行評估已經(jīng)難以滿足現(xiàn)時政策發(fā)展的需求。運用大數(shù)據(jù)方法進行政策評估正是在此背景下應(yīng)運而生。
一、 基于大數(shù)據(jù)進行政策評估的邏輯
一般認為,規(guī)范研究和實證研究是政策評估中彼此分立的兩種評估思路。目前國際上主流的政策研究人員也據(jù)此形成兩個旗幟鮮明的陣營:主張政策評估應(yīng)以價值判斷為主從事規(guī)范研究的傳統(tǒng)政治學家,以及具備定量分析背景并強調(diào)量化指標進行實證評估的經(jīng)濟學家。雖然兩種方法論的支持者觀點不同,但是不同方法論本身的關(guān)系并非完全對立,而是相輔相成,互為補充,更有學者倡導二者的混合與共融。事實上,無論采用何種方法進行評估,都必須基于數(shù)據(jù)(包括簡單的計數(shù)數(shù)據(jù)和高度復雜的數(shù)據(jù)信息)的獲取。缺乏數(shù)據(jù)的評估方法不能成其為科學嚴謹?shù)脑u估方法。政策評估的嚴肅性要求評估方法必須用事實說話,憑數(shù)據(jù)定論??梢?,政策評估本質(zhì)上應(yīng)該是一種“循數(shù)評估”——通過分析數(shù)據(jù)來研判具體采取何種評估方法的“數(shù)據(jù)驅(qū)動”型評估模式。
嚴格來說,循數(shù)評估的有效實施必須基于一個運行著大量數(shù)據(jù)的環(huán)境,數(shù)據(jù)無處不在,隨時可用,這顯然是傳統(tǒng)的社會和科技條件所不支持的。大數(shù)據(jù)時代的到來為循數(shù)評估創(chuàng)造了條件,海量數(shù)據(jù)、強調(diào)相關(guān)性分析、實時、動態(tài)等方面與循數(shù)評估的要求不謀而合。我們知道,政策評估的內(nèi)核是分析因果關(guān)系,必須指出,“因果關(guān)系不過是相關(guān)關(guān)系中的一部分,分析相關(guān)關(guān)系也正是為了間接得出對因果關(guān)系的認識”。這就是大數(shù)據(jù)與政策評估相契合的邏輯。
二、 大數(shù)據(jù)方法在我國的現(xiàn)實應(yīng)用
1. 既有對大數(shù)據(jù)的認知。大數(shù)據(jù)的概念在不同的研究中表述不一,關(guān)于其界定尚未形成共識。大數(shù)據(jù)通常被視為有價值的產(chǎn)業(yè)信息,是一系列體量巨大,尚不能運用現(xiàn)有管理和分析手段對之進行有效處理的數(shù)據(jù)集。大數(shù)據(jù)的開發(fā)利用對國家治理具有重要意義——大數(shù)據(jù)既是國家治理的環(huán)境和工具,又是國家治理的對象和結(jié)果。作為國家治理的重要內(nèi)容,政策評估也將受益于大數(shù)據(jù)的發(fā)展。
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)成為一種新的自然資源,作為重要生產(chǎn)要素的大數(shù)據(jù)已經(jīng)滲透到各行各業(yè)。大數(shù)據(jù)的分析方法隨之應(yīng)運而生,如可視分析技術(shù)、人機交互、任務(wù)建模理論等方法技術(shù)的應(yīng)用將帶來新的變革契機,人類社會進入科學發(fā)現(xiàn)的“第四范式”。
2. 大數(shù)據(jù)在我國的現(xiàn)實應(yīng)用。目前,大數(shù)據(jù)的分析方法已廣泛運用于智能交通、環(huán)境監(jiān)控和災(zāi)難預警等方面。國家治理層面,利用大數(shù)據(jù)的方法能提升國家的智慧決策水平、公共服務(wù)能力、防治腐敗能力和風險治理能力。借助大數(shù)據(jù)的分析方法,可以提高公共管理的透明度、發(fā)現(xiàn)公眾需求、提高政策的針對性、進行輔助決策、引導管理部門實現(xiàn)內(nèi)外創(chuàng)新。大數(shù)據(jù)方法通過數(shù)據(jù)多維采集,提供即時線索,提高相關(guān)動態(tài)數(shù)據(jù)的采集精度,從而無限逼近社會真實狀態(tài)。在此背景下,運用大數(shù)據(jù)方法可實現(xiàn)評估數(shù)據(jù)多維采集、評估數(shù)據(jù)集成挖掘和評估可視化解析,無疑是政策評估的全新范式。
3. 運用大數(shù)據(jù)方法的其他路徑??傮w看來,現(xiàn)有的大部分文獻對大數(shù)據(jù)方法做了可觀的技術(shù)性探討,且以介紹性的描述居多,而研究內(nèi)容上則主要圍繞大數(shù)據(jù)的概念、方法、意義展開,側(cè)重宏觀分析。相比之下,針對社會科學實務(wù)層面的應(yīng)用研究較少,尤其是將大數(shù)據(jù)方法與政策評估結(jié)合起來展開研究尚處于起步階段。本文試圖厘清大數(shù)據(jù)方法與政策評估方法論之間的關(guān)系,在借鑒國外運用大數(shù)據(jù)方法開展政策評估經(jīng)驗的基礎(chǔ)上,嘗試對可能存在的大數(shù)據(jù)方法適用于政策評估的規(guī)律做出總結(jié)。
三、 來自國外的經(jīng)驗
國外對利用大數(shù)據(jù)方法推進政策評估已有一定研究。宏觀來看,許多發(fā)達國家確立了本國的大數(shù)據(jù)戰(zhàn)略,競相增加該領(lǐng)域的研究投入,試圖從中找到新的國家治理思路。具體而言,不少學者在SSCI的國際主流期刊上相繼發(fā)文,論述自己的研究發(fā)現(xiàn)。以下,我們列舉兩例:
1. 利用搜索查詢的大數(shù)據(jù)來評估環(huán)保態(tài)度的研究。Donghyun Lee等在“Energy Policy”上發(fā)表的文章介紹了基于大數(shù)據(jù)的思路利用搜索查詢的大數(shù)據(jù)對環(huán)保態(tài)度加以評估的研究。文章圍繞在政府能源政策制定和執(zhí)行過程中發(fā)揮越來越大作用的公眾意見進行實證檢驗。為了對當?shù)孛癖婋S著時間而不斷變化的環(huán)保態(tài)度進行量化,作者采用互聯(lián)網(wǎng)大數(shù)據(jù)的方法,對特定地域民眾的谷歌搜索查詢的數(shù)據(jù)做了采集,并通過普通最小二乘法的結(jié)果對民眾的環(huán)保行為進行驗證。為了檢驗這種方法的政策評估適用性,該研究再次考察了美國州政府制定的三項廣為人知的綠色電力政策--可再生能源份額政策、凈計量規(guī)則政策和公益基金政策。由于各州實行這三項政策的情況不一,作者選取的是右偏數(shù)據(jù),運用累進失敗時間序列模型的方法進行雙重計量。研究發(fā)現(xiàn)控制其他傳統(tǒng)時變政策選取的因素后,州域內(nèi)民眾的態(tài)度對政策的影響具備統(tǒng)計學意義上的顯著性。尤其是綠色能源政策中的反環(huán)保意見對政策的影響程度更高。據(jù)此,作者認為地方政府可以制定出更有針對性的環(huán)境政策。文章最后特別指出,能源政策領(lǐng)域內(nèi)與民意相關(guān)的問題都可以借鑒這種方法進行討論。endprint
2. 利用谷歌趨勢及推特大數(shù)據(jù)來評估空間政策民意的研究。Wendy N. Whitman Cobb在“Space Policy”發(fā)表的題為“Trending now: Using big data to examine public opinion of space policy”的文章介紹的是關(guān)于利用谷歌趨勢和推特網(wǎng)的大數(shù)據(jù)評估空間政策民意的研究。文章首先對傳統(tǒng)測量民意的方法做了介紹,然后提出全新的民意測量工具,進而通過新舊測量方法的對比得出結(jié)論。作者認為,民意在美國空間政策中扮演著至關(guān)重要的角色,而谷歌趨勢和推特網(wǎng)的大數(shù)據(jù)分別為之提供了新的宏觀和微觀的視角。對比蓋勒普等民調(diào)組織的調(diào)研統(tǒng)計,大數(shù)據(jù)的方法能更加靈活地獲取反映民意的即時有用數(shù)據(jù),相關(guān)機構(gòu)皆可從中受益:就空間政策而言,空間領(lǐng)域和政治領(lǐng)域的政策企業(yè)家都可以利用通過大數(shù)據(jù)方法獲取的數(shù)據(jù)來游說國會和行政部門,以爭取他們更多支持和資金投入以幫助NASA進一步開展活動;科學界可借助大數(shù)據(jù)方法將他們的研究與大眾的興趣結(jié)合起來,以增進外界對其工作的了解和支持;而華盛頓的官員則可以在不具備相關(guān)專業(yè)背景的情況下,通過大數(shù)據(jù)方法讀懂高度專業(yè)化的數(shù)據(jù)信息。
3. 小結(jié)。民意,或謂之公眾態(tài)度,在政策的制定和執(zhí)行過程中發(fā)揮著關(guān)鍵作用,獲取即時有用的民意數(shù)據(jù)并及時評估,可以有效推動政府制定出更加符合民眾預期的政策,同時還能降低政策演變的成本。國外的經(jīng)驗表明,大數(shù)據(jù)方法已經(jīng)為政策評估的這一需求提供了解決思路。不可否認,大數(shù)據(jù)方法仍存在一定局限,比如大數(shù)據(jù)的產(chǎn)生和發(fā)展較晚,缺乏長期數(shù)據(jù);處理大數(shù)據(jù)的難度較大;收集的大數(shù)據(jù)僅來源于可接觸互聯(lián)網(wǎng)的人群等。但這些局限都不足以影響將大數(shù)據(jù)方法作為一種可行的政策評估思路。
四、 基于大數(shù)據(jù)方法的政策評估分析矩陣
以上我們探討了將大數(shù)據(jù)方法運用于政策評估的理論邏輯、現(xiàn)實依據(jù)及國外經(jīng)驗,由此明確大數(shù)據(jù)方法可用于政策評估的結(jié)論。那么,何種類型的政策才能適用這一方法?為回答這一問題,基于Forte和Ward等學者在信息和數(shù)據(jù)方面的已有貢獻、Economist Intelligence Unit (EIU)的“發(fā)展階段”概念,以及Joseph Amankwah-Amoah對不同國家開發(fā)大數(shù)據(jù)的國家能力所做的分析,我們開發(fā)出用以檢視一項政策是否可通過大數(shù)據(jù)方法進行評估的“數(shù)據(jù)收集-數(shù)據(jù)分析”矩陣。首先,我們設(shè)定數(shù)據(jù)收集和數(shù)據(jù)分析是一項政策可采用大數(shù)據(jù)方法進行評估的兩項重要指標。同時,我們認為不同政策通常在這兩個維度的具體分布不同。一些些政策可在互聯(lián)網(wǎng)等媒介搜索與之相關(guān)的大量信息,從而為大數(shù)據(jù)的收集創(chuàng)造條件,另一些則不然。因此,不同政策用做評估的大數(shù)據(jù)“基礎(chǔ)”分別處于“數(shù)據(jù)貧乏”到“數(shù)據(jù)豐富”區(qū)間的不同層次(見圖1)。
數(shù)據(jù)豐富,是指與政策相關(guān)的數(shù)據(jù)可通過互聯(lián)網(wǎng)或其他方式大量獲取?;ヂ?lián)?和社交媒體的出現(xiàn)意味著大數(shù)據(jù)的現(xiàn)實可用。信息豐富,指的是對數(shù)據(jù)進行分析,將其轉(zhuǎn)化為知識并加以理解,以作為公共政策評估的基礎(chǔ)和行動依據(jù)。為使分析矩陣的建立具備更為堅實有力的理論基礎(chǔ),我們選定數(shù)據(jù)收集和數(shù)據(jù)分析這兩個關(guān)鍵指標,利用“2×2”矩陣對不同政策在這兩個維度上分布的情況進行分類,如圖1所示。這些模式強調(diào)影響不同政策可利用大數(shù)據(jù)方法進行評估的程度差異,各政策可在不同模式中進行轉(zhuǎn)換。鑒于僅掌握大數(shù)據(jù)并不能開展政策評估,因而用作政策評估的大數(shù)據(jù)必須同時滿足“可識別”和“能解析”的要求。接下來的部分將對“數(shù)據(jù)搜集—數(shù)據(jù)分析”矩陣進行重點介紹,從而揭示如何利用大數(shù)據(jù)作為政策評估的依據(jù)。
1. 模式一:數(shù)據(jù)現(xiàn)金型(數(shù)據(jù)豐富,信息豐富)。該模式具備將大數(shù)據(jù)運用于公共政策評估的清晰路徑?!皵?shù)據(jù)現(xiàn)金型”政策通常是全國性的政策,其特點是:公眾在互聯(lián)網(wǎng)平臺可搜索與之相關(guān)的大量信息,最有可能從中獲取政策評估所需的大數(shù)據(jù)。這源于技術(shù)的進步使得對網(wǎng)絡(luò)、手機和社交媒體的大型數(shù)據(jù)進行收集和分析成為可能,進而為政策評估提供依據(jù)。該模式的另一特點是數(shù)據(jù)可在政府部門及其分支機構(gòu)、服務(wù)提供商和政策評估方之間互通共享。大數(shù)據(jù)為彌補知識差距創(chuàng)造了機會,借助大數(shù)據(jù)中提取的有價值信息,可以幫助破解政策評估中信息不對稱的難題。
2. 模式二:數(shù)據(jù)期貨型(數(shù)據(jù)貧乏,信息豐富)。模式二中,政策的相關(guān)信息通常較少見諸于網(wǎng)聯(lián)網(wǎng)平臺,民眾搜索頻率不高,但偶爾可能出現(xiàn)的政策熱點會產(chǎn)生包含大量有用信息的大數(shù)據(jù)。這類政策已經(jīng)具備較為成熟的使用大數(shù)據(jù)方法進行評估的條件,充分利用出現(xiàn)的時機對收集到的數(shù)據(jù)做出分析,就能對該政策做出有效的評估。一種可能的解釋是,一項政策在大部分時間運行平穩(wěn),當其做出調(diào)整,引發(fā)民眾大量關(guān)注,并在較短時間內(nèi)在互聯(lián)網(wǎng)等媒介產(chǎn)生大量搜索。當然,也可能歸因于與該政策相關(guān)的大規(guī)模數(shù)據(jù)收集不被允許,從而轉(zhuǎn)向收集有限數(shù)據(jù)并作出高質(zhì)量的分析??梢?,掌握并運用大數(shù)據(jù)方法可以提高決策質(zhì)量,改變政策評估的未來。
3. 模式三:數(shù)據(jù)原料型(數(shù)據(jù)豐富,信息貧乏)。該模式中政策的特點是:在互聯(lián)網(wǎng)或社交媒體上擁有與該政策有關(guān)的大量信息檢索,可收集的數(shù)據(jù)體量可觀,但這些數(shù)據(jù)與政策本身無關(guān),可用性不高,或現(xiàn)有技術(shù)水平尚不能對之進行有效分析,只能棄之不用。此外,政府或其他機構(gòu)的數(shù)據(jù)共享機制缺失也是可能的原因。進入21世紀,成箱的觀察筆記、軟盤,滿櫥柜的數(shù)據(jù)表以及各地詳實的數(shù)據(jù)表要么未經(jīng)處理,要么沒有連接到中央數(shù)據(jù)庫的現(xiàn)象并不罕見,進而導致典型的“數(shù)據(jù)豐富—信息貧乏”綜合征。一些機構(gòu)可能收集和存儲了大量與此政策相關(guān)的數(shù)據(jù),卻由于未經(jīng)有效加工而無法關(guān)聯(lián),而從當?shù)貦C構(gòu)獲取數(shù)據(jù)來分析則費時且昂貴。久而久之,豐富的數(shù)據(jù)由于缺乏整合導致可從數(shù)據(jù)中提取有用信息的能力非常有限。另外一些政策相關(guān)的大數(shù)據(jù)收集可能涉及道德倫理問題,必須對二者做出平衡。相當數(shù)量的數(shù)據(jù)可能因此不被用于政策評估。最后,收集的數(shù)據(jù)“通常不是直接可用,或不可直接用做臨床和管理的支持信息”,此外,如果現(xiàn)有技術(shù)水平還不能對某些數(shù)據(jù)進行處理和分析,它們也同樣不能輔助政策評估。endprint
4. 模式四:數(shù)據(jù)稀缺型(數(shù)據(jù)貧乏,信息貧乏)。模式四為數(shù)據(jù)稀缺型,該類政策規(guī)范的內(nèi)容與民眾缺乏關(guān)聯(lián)度,民眾對其關(guān)注度不高;或者政策相關(guān)信息很少公開,更是鮮見于互聯(lián)網(wǎng);現(xiàn)有技術(shù)水平的局限尚不能對相關(guān)數(shù)據(jù)進行有效的收集和分析也是一種可能的原因。對于后者,技術(shù)的不斷進步會讓問題迎刃而解。數(shù)據(jù)稀缺性政策的評估缺乏大數(shù)據(jù)的基礎(chǔ),因而大數(shù)據(jù)方法不可用于該類政策的評估。
5. 小結(jié)?;趯仃嚨纳鲜鲇懻摚覀兲岢鲆韵录僭O(shè):
假設(shè)性命題1: 如果政策相關(guān)信息的公開程度越低,那么使用大數(shù)據(jù)方法對之進行評估的可能性越低;
假設(shè)性命題2: 如果在全國范圍內(nèi)收集和分析數(shù)據(jù)的能力越弱,那么運用大數(shù)據(jù)方法進行政策評估的可能性越低;
假設(shè)性命題3:如果政策運行越平穩(wěn),民眾的關(guān)注度越低,那么運用大數(shù)據(jù)方法進行政策評估的可能性越低;
假設(shè)性命題4:如果收集的數(shù)據(jù)不能形成全國性的數(shù)據(jù)網(wǎng)絡(luò),共享程度越低,那么運用大數(shù)據(jù)方法進行政策評估的可能性越低。
五、 結(jié)論與討論
本文通過檢視不同政策適用大數(shù)據(jù)方法進行評估的情況對大數(shù)據(jù)的運用做了擴展研究。研究揭示了數(shù)據(jù)與信息之間的關(guān)系。借助概念化構(gòu)建了一個“2×2”的分析框架,用以呈現(xiàn)不同政策分別適用大數(shù)據(jù)方法進行評估的情況及其所屬模式。幾種模式分別是“數(shù)據(jù)現(xiàn)金型”“數(shù)據(jù)期貨型”“數(shù)據(jù)原料型”,以及“數(shù)據(jù)稀缺型”。
本研究的構(gòu)想還有助于厘清大數(shù)據(jù)并不必然轉(zhuǎn)化為大知識、大認知的線索。運用大數(shù)據(jù)方法進行政策評估不僅是一種全新的評估范式,同時也有助于改善政策評估的質(zhì)量。盡管已有學者對大數(shù)據(jù)信息系統(tǒng)做了探討,卻對大數(shù)據(jù)如何被用來幫助政策評估缺乏系統(tǒng)性檢視。需要指出,由于大數(shù)據(jù)方法本身不是盡善盡美,我們的“2×2”分析框架也存在一些固有局限。比如數(shù)據(jù)有時具有欺騙性,某些數(shù)據(jù)并不必然具備政策意涵等。
雖然本研究還存在一些不足,卻對這一方向的探索起到拋磚引玉的作用,這至少表現(xiàn)在兩個方面:“2×2”分析框架顯然不能囊括所有政策,開發(fā)一個更為全面的擴展框架勢在必行,本研究為這種探索奠定了一定基礎(chǔ)。此外,本文很大程度上忽視了包括道德問題在內(nèi)的運用大數(shù)據(jù)方法產(chǎn)生的內(nèi)生性問題。必須強調(diào),能夠運用大數(shù)據(jù)方法進行政策評估也就意味著相關(guān)主體具備大數(shù)據(jù)收集和分析能力,這必然給公民的活動帶來巨大影響。相關(guān)問題的研究還有待于將來做進一步探索。
參考文獻:
[1] 和經(jīng)緯.中國公共政策評估研究的方法論取向,走向?qū)嵶C主義 [J].中國行政管理,2008,(9).
[2] 邱東.大數(shù)據(jù)時代對統(tǒng)計學的挑戰(zhàn)[J].統(tǒng)計研究,2014,(1).
[3] Cobb W N W. Trending now: Using big data to examine public opinion of space policy[J]. Space Policy,2015,(32):11-16.
[4] Amankwahamoah J.Safety or no safety in numbers? Governments, big data and public policy formulation[J].Industrial Management & Data Systems,2015,(9).
作者簡介:謝明(1958-),男,漢族,北京市人,中國人民大學公共管理學院教授、博士生導師,研究方向為公共政策基礎(chǔ)理論、公共政策分析、中國公共政策研究;劉愛民(1987-),男,漢族,廣西壯族自治區(qū)資源縣人,中國人民大學公共管理學院博士生,研究方向為公共政策。
收稿日期:2017-09-11。endprint