陳 瑜 李廣建
(1.北京大學(xué)信息管理系 北京 100871)
科技政策是政府支持科學(xué)、技術(shù)和創(chuàng)新產(chǎn)生和傳播的公共措施。近年來,世界主要發(fā)達(dá)經(jīng)濟(jì)體的科技創(chuàng)新政策都處于加速轉(zhuǎn)型和體系重構(gòu)中,以科技政策為重要手段的創(chuàng)新環(huán)境競(jìng)爭(zhēng)日趨激烈。 各國普遍通過選擇優(yōu)先區(qū)域,制定發(fā)展規(guī)劃與路線圖,出臺(tái)配套措施來保障科技戰(zhàn)略的有效實(shí)施。在此背景下,對(duì)科技政策效果的評(píng)價(jià)就變得非常重要和迫切,同時(shí)也更具挑戰(zhàn)。 當(dāng)前,各國對(duì)于科技創(chuàng)新政策的效果評(píng)價(jià)都處于摸索狀態(tài),還沒有形成統(tǒng)一的理論和方法,以及公認(rèn)的評(píng)價(jià)體系,各國都在投入力量加強(qiáng)研究和實(shí)踐探索。我國從2012 年左右開始就持續(xù)增加用于科技政策評(píng)價(jià)的資金預(yù)算,科技政策效果評(píng)價(jià)迎來了新的重要發(fā)展契機(jī)。
科技政策效果評(píng)價(jià)是科技評(píng)價(jià)的重要組成部分,是政策效果評(píng)價(jià)的延伸。政策效果也稱政策影響,指的是由政策作用因素所引起的政策對(duì)象及社會(huì)環(huán)境的狀態(tài)改變,政策效果評(píng)價(jià)(評(píng)估)也稱影響評(píng)價(jià)。 在政策評(píng)價(jià)中,效果是一個(gè)廣義的概念,在有些研究中也稱“績效”“效益”“效率”“產(chǎn)出”“成效”等。 不同學(xué)者使用不一樣的詞匯,通常是出于語言習(xí)慣和上下文的需要,但實(shí)質(zhì)上都屬于政策效果評(píng)價(jià)的范疇。 因此,本文不對(duì)上述詞匯進(jìn)行細(xì)化區(qū)分,統(tǒng)一稱作“效果”。
科技政策效果評(píng)價(jià)是情報(bào)學(xué)的重要研究內(nèi)容。一方面,情報(bào)學(xué)長期關(guān)注科技發(fā)展監(jiān)測(cè)、關(guān)注創(chuàng)新知識(shí)增長與流動(dòng)規(guī)律,相關(guān)理論與方法已經(jīng)在政策效果評(píng)價(jià)中得到了應(yīng)用,特別是文獻(xiàn)計(jì)量指標(biāo)已成為評(píng)價(jià)實(shí)踐中公認(rèn)的有效指標(biāo),情報(bào)學(xué)中相關(guān)的理論和方法已經(jīng)成為政策評(píng)價(jià)研究的重要組成部分;另一方面,科技政策評(píng)價(jià)目前遇到了諸如文本信息量大、評(píng)價(jià)信息來源復(fù)雜多樣、難以從海量數(shù)據(jù)中挖掘政策效果產(chǎn)生機(jī)制與規(guī)律等難題,因此需要借鑒和使用情報(bào)學(xué)的理論和方法。 本文旨在總結(jié)科技政策效果評(píng)價(jià)的主要流派和主流方法,分析科技政策效果評(píng)價(jià)的發(fā)展趨勢(shì),以期為情報(bào)學(xué)領(lǐng)域的相關(guān)研究提供參考借鑒。
回顧既往研究與實(shí)踐,根據(jù)評(píng)價(jià)過程在理念和方法路徑上的差異,本文將政策效果評(píng)價(jià)劃分為三個(gè)主要流派,分別是以計(jì)算效益為重點(diǎn)的評(píng)價(jià)流派、以結(jié)果為重點(diǎn)的評(píng)價(jià)流派和以內(nèi)容為重點(diǎn)的評(píng)價(jià)流派。 需要說明的是,這些流派并不是涇渭分明的,因此,在分析某項(xiàng)評(píng)價(jià)工作屬于哪一個(gè)流派時(shí),主要依據(jù)是其主流理念和方法以及研究人員或評(píng)價(jià)人員自身對(duì)評(píng)價(jià)過程解釋的傾向。
以計(jì)算效益為重點(diǎn)的科技政策效果評(píng)價(jià)在20世紀(jì)70 年代中期到90 年代初期最為盛行。 效益流派認(rèn)為,提高全人類的社會(huì)福利和生活質(zhì)量是科技政策的主要目標(biāo),提升社會(huì)福祉的具體化方式是通過社會(huì)經(jīng)濟(jì)影響實(shí)現(xiàn)的,也就是說,政策效益或效率是政策效果的一種表達(dá)方法。 效益流派的主要理念及核心特征包括:(1)側(cè)重于定量衡量科技政策的社會(huì)經(jīng)濟(jì)影響,影響可以分為宏觀和微觀兩個(gè)分析層次,前者關(guān)注科技研發(fā)支出所帶來的宏觀經(jīng)濟(jì)效應(yīng),后者關(guān)注對(duì)企業(yè)績效的影響;(2)效益派的評(píng)價(jià)與經(jīng)濟(jì)學(xué)原理和計(jì)量方法關(guān)聯(lián)緊密,強(qiáng)調(diào)計(jì)算政策的投入產(chǎn)出比,要求評(píng)價(jià)方法是可量化和可計(jì)算的;(3)評(píng)價(jià)指標(biāo)以貨幣量化為主要形式,以便計(jì)算投資回報(bào)率和經(jīng)濟(jì)貢獻(xiàn)。 效益派評(píng)價(jià)的局限性主要在于關(guān)注投入和主要經(jīng)濟(jì)結(jié)果之間的總體關(guān)系,隱含地假定了所有經(jīng)濟(jì)行為都有統(tǒng)一的影響機(jī)制,對(duì)理解創(chuàng)新過程的幫助甚少。
效益派的代表人物之一是美國公共政策學(xué)家托馬斯·戴伊,他從技術(shù)理性的角度提出了系統(tǒng)評(píng)估政策效果的方法。戴伊認(rèn)為政策影響就是它對(duì)現(xiàn)實(shí)世界產(chǎn)生的所有效果,政策效果等于所有收益之和減去所有成本之和。 其中,成本的構(gòu)成包括“所有當(dāng)前和未來的政策目標(biāo)群體、非目標(biāo)群體成本”收益的構(gòu)成包括“所有當(dāng)前和未來的政策目標(biāo)群體、非目標(biāo)群體收益”。確定成本效益構(gòu)成時(shí)除了要考慮政策作用對(duì)象范圍和時(shí)間因素,還應(yīng)區(qū)分直接成本(即政策實(shí)施時(shí)直接消耗的資源)和間接成本(也稱機(jī)會(huì)成本,即為執(zhí)行當(dāng)前政策實(shí)施方案而放棄的其他活動(dòng)所能帶來的收益)。 經(jīng)濟(jì)合作與發(fā)展組織(OECD)在效益派的評(píng)價(jià)當(dāng)中具有很強(qiáng)的影響力,他們從效率的角度定義了政策效果評(píng)價(jià),即政策在多大程度上能夠或可能以經(jīng)濟(jì)且及時(shí)的方式實(shí)現(xiàn)結(jié)果。其中,“經(jīng)濟(jì)”是指以盡可能最具成本效果的方式將政策投入(資金、專業(yè)知識(shí)、自然資源、時(shí)間等)轉(zhuǎn)化為政策結(jié)果(產(chǎn)出、成果和影響等)。OECD 還指出,計(jì)算政策的投入產(chǎn)出比只是效益派評(píng)價(jià)中的一個(gè)方面,科技政策效果最終要匯總到對(duì)宏觀經(jīng)濟(jì)的影響上面來,據(jù)此,OECD 定義了效益派評(píng)價(jià)需要回答的關(guān)鍵問題:(1)科技政策對(duì)國家經(jīng)濟(jì)增長的影響,需要回答科技政策能夠提高經(jīng)濟(jì)績效嗎?(2)科技政策能夠提高產(chǎn)業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)嗎?(3)科技政策是否會(huì)影響生產(chǎn)過程,能否提高生產(chǎn)率? 等。
與效益派不同的是,以結(jié)果為重點(diǎn)的政策效果評(píng)價(jià)不是依靠計(jì)算投入產(chǎn)出來衡量科技政策效果的,而是通過對(duì)比政策實(shí)施后特定結(jié)果指標(biāo)的變化來判斷效果。 以結(jié)果為重點(diǎn)的評(píng)價(jià)是國際組織開展政策效果評(píng)價(jià)的主要方法,很多國際組織在對(duì)一些欠發(fā)達(dá)國家進(jìn)行發(fā)展援助后,需要評(píng)估相關(guān)干預(yù)措施的效果,以促進(jìn)可持續(xù)發(fā)展。以結(jié)果為重點(diǎn)的政策效果評(píng)價(jià)的特點(diǎn)是注重政策結(jié)果,強(qiáng)調(diào)對(duì)政策結(jié)果的測(cè)度,既可以用經(jīng)濟(jì)指標(biāo)來測(cè)度,也可以用非經(jīng)濟(jì)指標(biāo)來測(cè)度,具體地說,以結(jié)果為重點(diǎn)的政策效果評(píng)價(jià)的核心特征包括:(1)強(qiáng)調(diào)通過實(shí)驗(yàn)或統(tǒng)計(jì)的方法幫助構(gòu)建“反事實(shí)”對(duì)照組,反事實(shí)的作用是回答如果沒有政策,結(jié)果會(huì)有什么不同?從而將政策的效果與非政策的效果分離開來;(2)不完全依靠對(duì)投入產(chǎn)出的計(jì)算,避開了科技政策的投入和產(chǎn)出難以貨幣量化的難題;(3)解決政策效果定量計(jì)算問題的核心方法是統(tǒng)計(jì)學(xué)中的回歸分析法,通過形式化表達(dá)將政策效果與其影響因素之間的復(fù)雜關(guān)系進(jìn)行了簡化,使效果計(jì)算邏輯簡明清晰。結(jié)果派的主要挑戰(zhàn)是并不總是能夠找到合適的對(duì)照。
世界銀行是結(jié)果派的典型代表之一,他們認(rèn)為效果評(píng)價(jià)就是將影響和改變歸因于特定政策,并提出了計(jì)算政策效果的形式化表達(dá),即“效果等于有政策干預(yù)(Y1)和無政策干預(yù)(Y0)的結(jié)果指標(biāo)之差。 也就是說,效果=Y1-Y0”。 他們強(qiáng)調(diào)要采用實(shí)驗(yàn)或準(zhǔn)實(shí)驗(yàn)方法,獲得結(jié)果指標(biāo)的反事實(shí)值Y0,并加以嚴(yán)格的統(tǒng)計(jì)學(xué)檢驗(yàn),從而解決政策歸因的問題。要想證明政策效果評(píng)價(jià)指標(biāo)與政策干預(yù)之間存在因果關(guān)系,最嚴(yán)格的方式是實(shí)施隨機(jī)對(duì)照試驗(yàn)(RCT)。 但是,隨機(jī)構(gòu)建證偽試驗(yàn)有很大的難度,在政策評(píng)價(jià)領(lǐng)域幾乎是不可行的。 鑒于此,OECD 在最新版的《科技創(chuàng)新活動(dòng)測(cè)度指南(2018)》(也稱《奧斯陸手冊(cè)》)中提出了一種解決科技政策效果歸因的方法(見圖1),該手冊(cè)以企業(yè)創(chuàng)新政策為例,按照有無科技政策的干預(yù)和結(jié)果是否可以進(jìn)行觀察,將企業(yè)創(chuàng)新結(jié)果劃分為四個(gè)象限,其中一、二象限的內(nèi)容和三、四象限的內(nèi)容互為反事實(shí),由于一、三象限中的數(shù)據(jù)在實(shí)踐中幾乎無法觀察,因此,可以比較二、四象限的內(nèi)容(見圖1 中的對(duì)角箭頭),也就是說,理論上只需計(jì)算或說明當(dāng)政策干預(yù)組和未干預(yù)組二者結(jié)果指標(biāo)的數(shù)值之差(或存在不同表現(xiàn))即可得到政策的效果,這種比較是實(shí)踐中可行的政策效果評(píng)價(jià)方案。
圖1 可觀察的政策效果和不可觀察的反事實(shí)——以企業(yè)創(chuàng)新支持政策為例
近年來,受到科技發(fā)展環(huán)境變化、評(píng)價(jià)理念轉(zhuǎn)變、大數(shù)據(jù)技術(shù)普及等因素的影響,興起了以內(nèi)容分析為重點(diǎn)的政策效果評(píng)價(jià)。 內(nèi)容分析的核心是將要研究的信息內(nèi)容進(jìn)行編碼,通過對(duì)直接顯示的內(nèi)容的量化處理來判別其間接的、潛在的動(dòng)機(jī)和效果。內(nèi)容派的理念是將文本內(nèi)容分析的方法應(yīng)用于科技政策效果評(píng)價(jià)問題,其主要特征包括:(1)強(qiáng)調(diào)政策內(nèi)容的擴(kuò)散以及與政策內(nèi)容相關(guān)的科研成果在數(shù)量和質(zhì)量上的增長和提高;(2)不僅要研究科技成果本身的“量”與“質(zhì)”,還要強(qiáng)調(diào)其“溢出”科技界之外的社會(huì)影響;(3)評(píng)價(jià)過程當(dāng)中,除了要分析政策本身的文本內(nèi)容以外,還要分析與政策相關(guān)的內(nèi)容,如論文、專利、專業(yè)新聞這些反映科技成果和發(fā)展動(dòng)態(tài)的文本中的內(nèi)容以及它們的內(nèi)容與政策文本變化之間的關(guān)聯(lián);(4)以定量分析為主,定性分析為輔,采用計(jì)算機(jī)輔助的定量分析手段,以更為智能化的方式進(jìn)行內(nèi)容分析。
歐盟委員會(huì)是內(nèi)容派的主要代表,他們認(rèn)為,隨著研究和創(chuàng)新的新范式轉(zhuǎn)向更廣泛的社會(huì)參與,需要轉(zhuǎn)變以往一直以科學(xué)研究的卓越程度作為衡量政策成功與否的做法,要進(jìn)一步衡量科學(xué)對(duì)創(chuàng)新、經(jīng)濟(jì)和社會(huì)的溢出效應(yīng)。鑒于此,歐盟通過Data4Impact項(xiàng)目首次將基于文本內(nèi)容的分析方法引入了歐盟科技政策評(píng)價(jià)體系中,并探索方法在應(yīng)用場(chǎng)景上的普適性。 以內(nèi)容為重點(diǎn)的方法既可以評(píng)價(jià)政策對(duì)基礎(chǔ)研究的影響,也可以用于評(píng)價(jià)靠近市場(chǎng)端的政策效果。在分析靠近基礎(chǔ)研究端的政策效果時(shí),傳統(tǒng)評(píng)價(jià)通常使用論文數(shù)量指標(biāo)和/或引文指標(biāo),而以內(nèi)容為重點(diǎn)的評(píng)價(jià)則還進(jìn)一步挖掘政策優(yōu)先布局領(lǐng)域與科學(xué)研究主題之間的關(guān)聯(lián),以獲得比傳統(tǒng)方法更為豐富的分析結(jié)果。 在評(píng)價(jià)靠近市場(chǎng)端的政策效果時(shí),一旦學(xué)術(shù)研究成果在新產(chǎn)品中得到應(yīng)用,就表示創(chuàng)新知識(shí)具備了有用性和適用性,而通過分析企業(yè)新聞中對(duì)新產(chǎn)品的描述信息(如企業(yè)新聞中創(chuàng)新產(chǎn)品公告的數(shù)量、 新技術(shù)術(shù)語出現(xiàn)的頻次以及其他文本特征),可以快速捕捉技術(shù)應(yīng)用所處的階段和企業(yè)創(chuàng)新產(chǎn)出情況,從而揭示政策在促進(jìn)創(chuàng)新知識(shí)向現(xiàn)實(shí)生產(chǎn)力轉(zhuǎn)化方面的效果。 此外,內(nèi)容派在分析方法上更容易與大數(shù)據(jù)和自動(dòng)化文本分析技術(shù)相結(jié)合。Data4Impact 中大量使用了文本挖掘、主題建模、機(jī)器學(xué)習(xí)等方法實(shí)現(xiàn)自動(dòng)文本分類和主題分析,通過對(duì)文本型評(píng)價(jià)資源的長期跟蹤和快速分析,及時(shí)了解歐盟科技政策對(duì)社會(huì)發(fā)展的實(shí)際貢獻(xiàn)和長期影響。
近年來,科技政策效果評(píng)價(jià)方法呈現(xiàn)多元發(fā)展趨勢(shì),不斷有新方法加入。本文結(jié)合政策效果評(píng)價(jià)方法研究的最新進(jìn)展以及各效果評(píng)價(jià)流派當(dāng)中所使用的方法取向,將科技政策效果評(píng)價(jià)的主流方法分為面向經(jīng)濟(jì)影響的評(píng)價(jià)方法、基于反事實(shí)的因果推斷方法以及智能化定量分析方法,并從方法的原理、實(shí)施過程、應(yīng)用效果、優(yōu)點(diǎn)與局限性方面進(jìn)行簡要介紹。 需要說明的是,科技政策效果往往是多方面的,通常需要在一個(gè)評(píng)價(jià)任務(wù)中綜合運(yùn)用上述方法,形成方法的“組合拳”。
面向經(jīng)濟(jì)影響的評(píng)價(jià)方法將效果評(píng)價(jià)轉(zhuǎn)化為衡量政策引導(dǎo)下的科技活動(dòng)對(duì)社會(huì)經(jīng)濟(jì)的影響問題,此類方法有兩個(gè)基本類型:第一類旨在將科技研發(fā)活動(dòng)的價(jià)值貨幣化并計(jì)算回報(bào)率,常用計(jì)算方法是成本效益分析法;第二類旨在分析政府科技研發(fā)投入對(duì)宏觀經(jīng)濟(jì)數(shù)據(jù)的影響,生產(chǎn)函數(shù)法是其典型代表。
2.1.1 成本效益分析法
成本效益分析(Cost-Benefit analysis,CBA)旨在對(duì)政策實(shí)施的投入成本與政策效果的產(chǎn)出作比較。該方法的核心是將科技創(chuàng)新活動(dòng)的價(jià)值貨幣化,用于表達(dá)整體貨幣效應(yīng)的典型經(jīng)濟(jì)指標(biāo)包括凈現(xiàn)值、年值、效益成本比和內(nèi)部收益率等,原則上能夠?qū)崿F(xiàn)對(duì)政策投入產(chǎn)出比的計(jì)算。進(jìn)行成本效益分析的主要實(shí)施步驟包括:(1)確定受到政策影響的群體,用投入產(chǎn)出表量化每個(gè)群體的經(jīng)濟(jì)與非經(jīng)濟(jì)、 直接與間接影響;(2)利用折現(xiàn)法獲得成本和收益的現(xiàn)值,對(duì)于無法量化的成本和收益要借助評(píng)分和加權(quán)等手段;(3)政策的凈收益總值等于各個(gè)會(huì)計(jì)期間的成本和收益相減后的年度凈收益現(xiàn)值的代數(shù)和。
在分析政策的投入產(chǎn)出時(shí),首先需要明確受到政策影響的群體,政策影響群體因具體評(píng)價(jià)對(duì)象而異。OECD 厘清了公共資助研究中的五類利益相關(guān)者和對(duì)應(yīng)的成本收益表現(xiàn)形式,提供了政府科技研發(fā)成本效益分析的一般性框架。 美國先進(jìn)技術(shù)計(jì)劃(ATP)和澳大利亞聯(lián)邦科學(xué)與工業(yè)研究組織(CSIRO)常使用成本效益法分析研發(fā)活動(dòng)所產(chǎn)生的經(jīng)濟(jì)影響。如CSIRO 委托第三方評(píng)估機(jī)構(gòu)ACIL Allen 對(duì)其2017 年的部分研發(fā)活動(dòng)價(jià)值進(jìn)行的評(píng)估發(fā)現(xiàn),根據(jù)7%的實(shí)際貼現(xiàn)率計(jì)算,CSIRO 支持的研發(fā)活動(dòng)收益約為每年12.7 億澳元,遠(yuǎn)超聯(lián)邦政府提供的每年7.935 億澳元的研發(fā)投入,這意味著CSIRO 每年的整體研究收益估值將達(dá)到26 億澳元左右, 收益成本比約為2:1。開展成本效益分析需要較大的時(shí)間和資源投入,因此出于成本方面的考慮,只能用于評(píng)價(jià)有限的政策或項(xiàng)目。
2.1.2 生產(chǎn)函數(shù)法
生產(chǎn)函數(shù)法(the production-function approach,PFA)是反映生產(chǎn)要素投入量的組合與產(chǎn)出量之間依存關(guān)系的方法,可以表明在給定政策發(fā)揮作用時(shí),最有可能發(fā)生什么樣的經(jīng)濟(jì)效應(yīng),如產(chǎn)出、收入、就業(yè)等的增加或上漲。 宏觀經(jīng)濟(jì)學(xué)新古典增長理論的奠基人索洛提出了改進(jìn)的柯布—道格拉斯生產(chǎn)函數(shù)(簡稱“C-D 生產(chǎn)函數(shù)”),其基本假設(shè)是在規(guī)模收益不變的情況下,全要素生產(chǎn)率(TFP)增長的根源在于技術(shù)進(jìn)步。 改進(jìn)的C-D 生產(chǎn)函數(shù)可以用于估算政府研發(fā)投入對(duì)宏觀經(jīng)濟(jì)指標(biāo)的影響, 其一般形式為Y=A(t)LK,其中L 代表勞動(dòng)投入數(shù)量,K 代表資本投入數(shù)量,A(t)的常見形式為A(t)=A0e,式中的λ 即為技術(shù)進(jìn)步率。
生產(chǎn)函數(shù)有很多變體,如知識(shí)生產(chǎn)函數(shù)、創(chuàng)新生產(chǎn)函數(shù)等。 由Guellec D 等主導(dǎo)的一項(xiàng)在政策領(lǐng)域極具影響力的研究就采用生產(chǎn)函數(shù)法對(duì)非平穩(wěn)時(shí)間序列數(shù)據(jù)建模,分析了1990-1998 年間15 個(gè)經(jīng)合組織國家的面板數(shù)據(jù),發(fā)現(xiàn)公共研發(fā)支出對(duì)全要素生產(chǎn)率的彈性為0.171,也就是說,政府每增加1%的公共研發(fā)投入,可使生產(chǎn)力水平提高約0.17%。 國內(nèi)學(xué)者趙立雨也利用生產(chǎn)函數(shù)評(píng)價(jià)了我國政府研發(fā)投入對(duì)國內(nèi)生產(chǎn)總值(GDP)的貢獻(xiàn)。 該研究收集了1987-2008 年間的國內(nèi)經(jīng)濟(jì)數(shù)據(jù),以GDP 作為產(chǎn)出變量,研發(fā)經(jīng)費(fèi)投入(RDK)及研發(fā)人員投入(RDL)作為投入變量,構(gòu)建了如下生產(chǎn)函數(shù)模型的對(duì)數(shù)形式:lnGDP=lnA+λt+αlnRDK+βlnRDL+μ, 式中,α 和β 分別為研發(fā)資本和勞動(dòng)的彈性系數(shù),為μ 為隨機(jī)誤差項(xiàng)。 回歸分析結(jié)果顯示參數(shù)α 的估計(jì)值為0.8761,意味著我國每增加1%的研發(fā)投入,就會(huì)產(chǎn)生0.87%的GDP 貢獻(xiàn)。生產(chǎn)函數(shù)法的局限性在于難以處理多維投入產(chǎn)出指標(biāo),此時(shí)可以結(jié)合數(shù)據(jù)包絡(luò)分析法(data envelopment analysis, DEA)計(jì)算基于多維指標(biāo)的科技政策投入效率。
反事實(shí)因果推斷是一種統(tǒng)計(jì)學(xué)方法,用于量化某一特定政策是否在某些預(yù)先確定的結(jié)果方面產(chǎn)生了預(yù)期的效果。 其核心是利用實(shí)驗(yàn)法或準(zhǔn)實(shí)驗(yàn)法構(gòu)建合理的反事實(shí)對(duì)照組,反事實(shí)既可以是真實(shí)的也可以是數(shù)學(xué)模擬的,在此基礎(chǔ)上,計(jì)算政策實(shí)施組與反事實(shí)組的差異,即為政策的效果。反事實(shí)因果推斷是以結(jié)果為重點(diǎn)的科技政策效果評(píng)價(jià)所使用的主要方法,其中以基于匹配的方法和雙重差分法最為常見,在實(shí)踐中,前者常用來構(gòu)建反事實(shí)對(duì)照組,后者則是準(zhǔn)確量化政策效果的核心方法。
2.2.1 基于匹配的反事實(shí)構(gòu)建方法
基于匹配的方法(matching approach)是政策效果評(píng)價(jià)中的常用方法。該方法旨在利用統(tǒng)計(jì)學(xué)方法,找到與政策干預(yù)組具有相同特征的個(gè)體,匹配為反事實(shí)對(duì)照組。如要為有政策支持的一組企業(yè)T 匹配一個(gè)反事實(shí)對(duì)照組C,考慮以營業(yè)額作為匹配因素(在統(tǒng)計(jì)學(xué)中稱為協(xié)變量),那么,只要找到一組與T 在同一時(shí)間點(diǎn)營業(yè)額相同的企業(yè)C,C 即為T 的反事實(shí)對(duì)照組。但是,當(dāng)協(xié)變量數(shù)量較多時(shí),就不太可能實(shí)現(xiàn)基于原始協(xié)變量的匹配。Rosenbaum 和Rubin提出了一種傾向評(píng)分匹配方法(Propensity Score Matching,PSM),旨在將多維協(xié)變量降至一維,從而降低匹配難度,具體實(shí)施步驟包括:(1)確定協(xié)變量X,即找到匹配對(duì)照組的關(guān)鍵特征指標(biāo),這一步可以參考既往研究的結(jié)果來選擇協(xié)變量;(2)計(jì)算傾向分?jǐn)?shù),通常采用logistic 回歸分析模型計(jì)算傾向分值,記作e(X)=Pr(z=1|X),e(X)為個(gè)體受到政策干預(yù)的傾向概率;(3)選擇匹配算法,基于(2)計(jì)算得到的傾向分?jǐn)?shù),選擇適當(dāng)?shù)乃惴ǎㄈ缱钹徑ヅ?、核匹配等),為干預(yù)組匹配傾向得分相近的個(gè)體作為對(duì)照組;(4)根據(jù)兩組之間的差異計(jì)算政策效果以及標(biāo)準(zhǔn)誤差。
Guo D 等采用傾向得分匹配法結(jié)合固定效應(yīng)回歸模型,分析了中國的企業(yè)研發(fā)支持政策能否使企業(yè)在商業(yè)化創(chuàng)新(以新產(chǎn)品銷售額和出口情況衡量)和技術(shù)創(chuàng)新(以專利數(shù)量衡量)上實(shí)現(xiàn)更多產(chǎn)出,該研究也是首個(gè)面向我國最大的政府支持企業(yè)研發(fā)政策——中小企業(yè)創(chuàng)新基金的效果評(píng)價(jià)研究。 研究者在構(gòu)建對(duì)照組時(shí),將政策實(shí)施前的企業(yè)績效作為匹配的重點(diǎn),選擇標(biāo)準(zhǔn)行業(yè)分類代碼、位置、規(guī)模、杠桿率、新產(chǎn)品銷售額、出口和專利存量作為協(xié)變量,以企業(yè)獲得政策支持的預(yù)測(cè)概率表示傾向分?jǐn)?shù),最后得到從1999-2007 年間,2638 家政策支持企業(yè)的18224 個(gè)觀察結(jié)果,以及10739 家非政策支持企業(yè)的64991 個(gè)觀察結(jié)果。研究者利用上述數(shù)據(jù)構(gòu)建了多個(gè)固定效應(yīng)面板數(shù)據(jù)回歸模型,在模型中引入了政策虛擬變量InnoAftit,分析結(jié)果顯示,與未得到政策支持的企業(yè)相比,政策支持企業(yè)銷售額提高的概率增加了7.88%,產(chǎn)品出口的概率提高了2.41%,發(fā)明專利授權(quán)量的增長率提高了8.6%,表明我國企業(yè)研發(fā)支持政策產(chǎn)生了實(shí)質(zhì)性的效果。
2.2.2 基于差異對(duì)比的效果計(jì)算方法
雙重差分法(Difference in difference analysis,DID)是計(jì)算政策效果的主要方法之一,DID 方法的基本原理是分別計(jì)算政策干預(yù)組與非干預(yù)組隨時(shí)間推移發(fā)生變化的兩個(gè)差異。 我們假設(shè)政策實(shí)施前后,干預(yù)組的結(jié)果指標(biāo)測(cè)量值分別是Y和Y;政策實(shí)施前后,非干預(yù)組的結(jié)果指標(biāo)測(cè)量值分別是Y和Y,那么,政策效果等于(Y-Y)-(Y-Y)。基于上述思路,政策結(jié)果計(jì)算的回歸模型可以表達(dá)為:Y=α+βT+γt+δ(Tt)+ε。 式中,i 表示政策干預(yù)對(duì)象個(gè)體,因變量Y為政策結(jié)果指標(biāo),(Ti·t)是以乘法方式引入的虛擬變量,其中T 和t 的取值為0 或1,T=1 代表i 有政策干預(yù),T=0 代表i 沒有政策干預(yù);t=0 代表政策實(shí)施前的情況,t=1 代表政策實(shí)施后的情況,交互項(xiàng)系數(shù)δ 的估計(jì)值即為政策效果。 雙重差分法的特點(diǎn)是適用于面板數(shù)據(jù),并且要求政策干預(yù)組和非干預(yù)組在起點(diǎn)時(shí)具有相同的發(fā)展趨勢(shì)。
2017 年,英國研究與創(chuàng)新署(UKRI)首次對(duì)其研發(fā)與創(chuàng)新支持政策的效果進(jìn)行了全面評(píng)價(jià),著重分析了公共研發(fā)投入對(duì)提升企業(yè)業(yè)績的影響。 該評(píng)價(jià)是一項(xiàng)典型的以結(jié)果為重點(diǎn)的評(píng)價(jià),采用傾向評(píng)分匹配法結(jié)合雙重差分法作為解決效果計(jì)算問題的核心方法。 評(píng)價(jià)的過程主要分為兩個(gè)步驟:首先,采用傾向評(píng)分匹配篩選出了近6000 家獲得政府研發(fā)資金支持的英國企業(yè)作為政策干預(yù)組,以及同樣數(shù)量的未得到政府研發(fā)資金支持的企業(yè)作為對(duì)照組。在效果計(jì)算階段,該研究將企業(yè)員工數(shù)量和營業(yè)額的年平均增長率作為結(jié)果指標(biāo),再基于DID 的原理分別構(gòu)建以員工數(shù)量和營業(yè)額增長率為因變量的線性回歸模型。 結(jié)果顯示,與沒有政策的情況相比,有政策支持的企業(yè)短期就業(yè)增長提高了4.8%,短期營業(yè)額增長約為7.6%??傮w來看,在政策實(shí)施后的第5年,有政策扶持的企業(yè)多創(chuàng)造了約150 個(gè)新就業(yè)崗位,營業(yè)額增加近4500 萬英鎊,表明政策對(duì)提高英國企業(yè)生產(chǎn)率具有顯著的積極影響。
智能化定量分析方法是內(nèi)容派的核心評(píng)價(jià)方法,它旨在實(shí)現(xiàn)政策效果評(píng)價(jià)的自動(dòng)化,其特點(diǎn)是采用文獻(xiàn)計(jì)量、文本挖掘、自然語言處理和機(jī)器學(xué)習(xí)等方法,對(duì)文本類型評(píng)價(jià)資源的內(nèi)、外部特征進(jìn)行量化計(jì)算,分析科技創(chuàng)新過程、產(chǎn)出及影響與科技政策的關(guān)聯(lián)。 智能化定量分析方法主要包括兩種類型,分別是智能化的知識(shí)計(jì)量方法和智能化的文本分析方法。
2.3.1 基于知識(shí)計(jì)量的方法
基于知識(shí)計(jì)量的方法是以知識(shí)和科學(xué)活動(dòng)作為研究對(duì)象,以論文和專利為代表的文獻(xiàn)為主要載體,采用計(jì)量學(xué)方法對(duì)知識(shí)活動(dòng)及其影響等進(jìn)行定量研究的一類方法。 在科技政策效果的因果傳遞中,知識(shí)溢出和流動(dòng)扮演了重要的角色。 借助知識(shí)計(jì)量的方法,能夠?qū)?chuàng)新知識(shí)流動(dòng)過程顯性化、定量化,因此也是目前公認(rèn)的衡量政策目標(biāo)實(shí)現(xiàn)程度、 產(chǎn)出是否符合預(yù)期、政策帶來的短期和中長期影響的主要依據(jù)和有效方法。
基于知識(shí)計(jì)量的科技政策效果評(píng)價(jià)方法有三種基本實(shí)施途徑:(1)數(shù)量分析,即對(duì)知識(shí)出版物的數(shù)量特征進(jìn)行統(tǒng)計(jì)分析,根據(jù)出版物的數(shù)量特征及其變化趨勢(shì),解釋科技政策在促進(jìn)創(chuàng)新知識(shí)增長方面的效果。如以學(xué)術(shù)論文為例,論文一方面是科學(xué)知識(shí)的主要載體,科學(xué)知識(shí)的創(chuàng)造、傳播和應(yīng)用是技術(shù)活動(dòng)的重要基礎(chǔ);另一方面,論文代表著基礎(chǔ)研究的水平,基礎(chǔ)研究是創(chuàng)新的動(dòng)力和源泉, 在技術(shù)發(fā)展中起著重要作用。 因此,在科技政策效果評(píng)價(jià)中,論文數(shù)量(特別是高質(zhì)量論文數(shù)量)被用作衡量早期創(chuàng)新活動(dòng)和科學(xué)實(shí)力的指標(biāo),反映了科技政策對(duì)基礎(chǔ)研究的影響,也是衡量科技政策產(chǎn)出的基礎(chǔ)性指標(biāo);(2)引文分析,即通過分析論文和專利等的引證和被引證現(xiàn)象揭示科技政策效果。如專利引文為分析知識(shí)溢出效應(yīng)創(chuàng)造了條件,論文中的內(nèi)容被專利引用提示了基礎(chǔ)研究成果已經(jīng)開始向應(yīng)用端轉(zhuǎn)移,引用數(shù)量、內(nèi)容、時(shí)間效率等指標(biāo)均能夠反映政策對(duì)加速科技成果轉(zhuǎn)化的催化作用;(3)基于共現(xiàn)與合著的網(wǎng)絡(luò)分析,如論文、 專利和項(xiàng)目報(bào)告等反映科技成果的文獻(xiàn)中所包含的主題詞共現(xiàn)、作者機(jī)構(gòu)共現(xiàn)等現(xiàn)象可以作為揭示知識(shí)流動(dòng)、創(chuàng)新協(xié)同和學(xué)科交叉融合的重要提示。如通過計(jì)算產(chǎn)學(xué)研項(xiàng)目合作網(wǎng)絡(luò)強(qiáng)度,可以定量地分析政策對(duì)促進(jìn)知識(shí)流動(dòng)與共享以及整合研發(fā)與創(chuàng)新能力方面的效果。
2.3.2 智能化文本分析方法
在數(shù)字化轉(zhuǎn)型的背景下,研究與創(chuàng)新領(lǐng)域的數(shù)字化程度也在不斷提高,產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù)的種類和數(shù)量持續(xù)增加,越來越多的非結(jié)構(gòu)化文本信息可以作為反映政策目標(biāo)、內(nèi)容、效果和影響的直接或間接依據(jù)。很多數(shù)據(jù)類型(如文本)無法用傳統(tǒng)方法進(jìn)行分析,需要采用適應(yīng)新數(shù)據(jù)類型的定量分析方法。 智能化文本分析方法旨在自動(dòng)化地分析處理海量的非結(jié)構(gòu)化文本信息,包括智能主題建模、文本相似度計(jì)算和情感分析等。
智能主題建模是文本挖掘領(lǐng)域最重要的分析手段之一。 主題模型中最重要的方法是概率隱性語義索引(LSI)以及隱含狄利克雷分布(LDA)等,主題可以看成是詞項(xiàng)的概率分布,主題模型通過詞項(xiàng)在文檔級(jí)的共現(xiàn)信息抽取出語義相關(guān)的主題集合,并能夠?qū)⒃~項(xiàng)空間中的文檔變換到主題空間,得到文檔在低維空間中的表達(dá)。 主題模型在科技政策效果評(píng)價(jià)中的應(yīng)用場(chǎng)景之一是針對(duì)政策文本本身的分析,通過政策文本主題建模,可以快速掌握政策內(nèi)容及其演化情況,作為后續(xù)與效果指標(biāo)進(jìn)行關(guān)聯(lián)分析的基礎(chǔ)。 主題模型的另一個(gè)重要應(yīng)用場(chǎng)景是以論文、專利、科技新聞、企業(yè)公告等一系列反映科技成果和發(fā)展動(dòng)態(tài)的科技情報(bào)源作為分析對(duì)象,將研究主題作為反映政策效果的指標(biāo),從內(nèi)容層面捕捉政策對(duì)研發(fā)過程的影響。如歐盟的Data4Impact 項(xiàng)目是國際上最早將智能主題建模和情感分析技術(shù)應(yīng)用于科技政策效果評(píng)價(jià)的研究之一。 該評(píng)價(jià)將政策效果分為投入、產(chǎn)出、學(xué)術(shù)影響、經(jīng)濟(jì)影響和社會(huì)/健康影響5 個(gè)維度,共29 項(xiàng)指標(biāo)。其中,基于智能主題建模的指標(biāo)有11 項(xiàng),如政策實(shí)施前后健康領(lǐng)域中的研究主題強(qiáng)度變化、各研究主題下的研究團(tuán)隊(duì)數(shù)量分布、政策支持的研究主題在新聞文章、博客、帖子、推文中的討論熱度排名等。以政策的學(xué)術(shù)影響維度下的“健康領(lǐng)域中的研究主題強(qiáng)度”這一指標(biāo)為例,其計(jì)算過程如下:(1)輸入數(shù)據(jù),為從Pubmed 等數(shù)據(jù)庫獲取的框架計(jì)劃資助的出版物全文及相關(guān)元數(shù)據(jù);(2)數(shù)據(jù)分析,使用的方法主要包括概率主題模型、語義標(biāo)注以及實(shí)體識(shí)別;(3)輸出結(jié)果,通常是基于文本主題的定性和定量分析結(jié)果,如每篇文檔/專利包含的主題數(shù)量等。 分析結(jié)果顯示,在2004-2018 年間,以非小細(xì)胞肺癌、胰腺癌為代表的研究主題呈逐年增長趨勢(shì),表明歐盟框架計(jì)劃促進(jìn)了癌癥研究的發(fā)展。
文本相似度計(jì)算旨在量化文本之間的共性和差異,共性越大、差異越小,則相似度越高,也就是說,相似度與文本共性成正相關(guān)。相似度一般可用[0,1]之間的實(shí)數(shù)表示, 該實(shí)數(shù)可通過語義距離計(jì)算獲得。在政策效果評(píng)價(jià)中,文本相似度計(jì)算的主要應(yīng)用場(chǎng)景是進(jìn)行主題耦合,即通過主題相似度建立文本之間的聯(lián)系,從而揭示政策對(duì)研究主題演化以及知識(shí)流動(dòng)和轉(zhuǎn)移的影響。 如匡奕臣提出了基于主題模型與證據(jù)鏈生成的科技政策效果評(píng)價(jià)模型,該研究主要采用了基于時(shí)間序列的論文主題指標(biāo)分析論文主題演化與政策內(nèi)容之間的關(guān)聯(lián)。 研究首先使用LDA 主題模型識(shí)別我國學(xué)者在國際期刊上發(fā)表的癌癥領(lǐng)域論文的Top10 主題;然后,根據(jù)語義相似度與余弦相似度的綜合相似度建立相鄰時(shí)間窗口的主題之間的關(guān)聯(lián);最后,按照設(shè)定的主題相似度閾值篩選出具有延續(xù)性的主題演化路徑,定性分析了論文主題變化與政策導(dǎo)向作用的聯(lián)系。
在數(shù)字化高速發(fā)展和大數(shù)據(jù)技術(shù)普及的背景下,政策評(píng)價(jià)領(lǐng)域迎來了重要的發(fā)展契機(jī),在積極采納新的技術(shù)手段的同時(shí),推動(dòng)了評(píng)價(jià)理論、方法與實(shí)踐的快速發(fā)展。政策效果評(píng)價(jià)作為政策評(píng)價(jià)研究的重點(diǎn)和難點(diǎn),其在大數(shù)據(jù)環(huán)境下的新發(fā)展引起了人們的格外關(guān)注,具體來看,主要呈現(xiàn)出以下發(fā)展趨勢(shì):
政策評(píng)價(jià)的基本內(nèi)容包括政策方案評(píng)估、執(zhí)行評(píng)價(jià)、過程評(píng)估、效果評(píng)估等,以往,效果評(píng)價(jià)僅被看作是各類政策評(píng)價(jià)活動(dòng)的一個(gè)組成部分,和其他評(píng)價(jià)類型處于同等地位。但是從發(fā)展趨勢(shì)上來看,隨著科技政策的作用及影響面的不斷擴(kuò)大,政策效果評(píng)價(jià)的作用也將越來越重要。 據(jù)國家科技評(píng)估中心的一項(xiàng)研究統(tǒng)計(jì),我國近四十年的科技政策評(píng)價(jià)論文可以概括為六個(gè)主題,以政策效果、效益評(píng)價(jià)為題的論文占比達(dá)到了22%, 屬于集中度較高的主題,且發(fā)表時(shí)間多集中在近十五年左右,充分說明效果評(píng)價(jià)未來將在政策評(píng)價(jià)和決策過程中占據(jù)主導(dǎo)地位。 這主要是因?yàn)閷?duì)政策方案和過程的評(píng)價(jià)固然重要,但人們也越來越關(guān)注政策的結(jié)果和長期影響,反過來,政策結(jié)果本身又會(huì)對(duì)政策的制定和規(guī)劃起到積極的促進(jìn)作用,因此,幾乎所有的政策評(píng)價(jià)活動(dòng)都離不開對(duì)政策結(jié)果的評(píng)價(jià)。此外,由于政策的過程與結(jié)果存在不確定性,導(dǎo)致政策的實(shí)施效果并不一定總是能對(duì)實(shí)現(xiàn)目標(biāo)起到正向的促進(jìn)作用,這就要求我們時(shí)刻關(guān)注政策的效果,及時(shí)調(diào)整政策內(nèi)容和方向。
事實(shí)上,在政策評(píng)價(jià)的發(fā)展歷程中,人們本就十分重視對(duì)政策效果的評(píng)價(jià)。但是受到評(píng)價(jià)手段、方法、時(shí)間等方面的限制,對(duì)于效果的研究一直沒有取得突破性進(jìn)展,學(xué)者們的注意力也分散在對(duì)其他相關(guān)問題的研究上。在大數(shù)據(jù)環(huán)境下,政策效果評(píng)價(jià)的條件已經(jīng)發(fā)生了根本性的變化,政策所帶來的影響以及給政策目標(biāo)和非目標(biāo)群體帶來的行為改變等都會(huì)暴露于泛在信息環(huán)境中,這就為政策效果評(píng)價(jià),既帶來了機(jī)遇也帶來了挑戰(zhàn)。 挑戰(zhàn)在于需要我們進(jìn)一步的開發(fā)更符合大數(shù)據(jù)環(huán)境的評(píng)價(jià)方法,機(jī)遇在于,效果評(píng)價(jià)將會(huì)成為政策評(píng)價(jià)中的領(lǐng)頭羊,在推動(dòng)政策評(píng)價(jià)整體發(fā)展中起到關(guān)鍵的帶頭作用。
大數(shù)據(jù)環(huán)境下,評(píng)價(jià)數(shù)據(jù)來源和數(shù)據(jù)類型復(fù)雜多樣、效果評(píng)價(jià)時(shí)效要求嚴(yán)格,決定了手工評(píng)價(jià)的效率不能滿足現(xiàn)實(shí)要求,而利用大數(shù)據(jù)技術(shù)能夠做到政策效果的自動(dòng)化評(píng)價(jià),滿足政策效果評(píng)價(jià)對(duì)質(zhì)量和效率的要求。
一方面,科技政策的體量龐大、體系復(fù)雜,解決效果評(píng)價(jià)問題需要考慮整個(gè)科技創(chuàng)新數(shù)據(jù)價(jià)值鏈,從保障決策信息全面性的角度提高評(píng)價(jià)質(zhì)量。 創(chuàng)新過程中產(chǎn)生的數(shù)據(jù)是分散異構(gòu)的,首要工作是把科技創(chuàng)新過程中產(chǎn)生的多元數(shù)據(jù)鏈接起來,因此需要利用多源信息融合的理念和方法綜合開發(fā)利用各類數(shù)據(jù)。如歐盟“地平線2020”資助的IntelComp 項(xiàng)目就構(gòu)建了一個(gè)基于多源信息融合的科技創(chuàng)新政策決策競(jìng)爭(zhēng)情報(bào)高性能計(jì)算(HPC)平臺(tái)。 該平臺(tái)匯聚了對(duì)科技政策效果分析至關(guān)重要的大型科學(xué)技術(shù)和創(chuàng)新(STI)數(shù)據(jù)集,囊括了所有歐盟國家和組織層面的公共行政、科技創(chuàng)新利益相關(guān)者和社會(huì)公眾產(chǎn)生的大量動(dòng)態(tài)、跨語言的異構(gòu)數(shù)據(jù),涵蓋了國家科技創(chuàng)新戰(zhàn)略、計(jì)劃和工作方案、項(xiàng)目、報(bào)告、科學(xué)出版物、專利、媒體新聞等科技情報(bào)資源,并在歐洲開放科學(xué)云(EOSC)的高性能計(jì)算模擬環(huán)境進(jìn)行分析處理。IntelComp 的目標(biāo)是提供一個(gè)平臺(tái)和工具來協(xié)助STI政策的全過程(包括議程設(shè)置、實(shí)施、監(jiān)測(cè)和評(píng)估),并通過建立協(xié)作、可視化、交互式及共享的模式實(shí)現(xiàn)創(chuàng)新主體的共同參與。 目前,IntelComp 已經(jīng)在“地平線歐洲”計(jì)劃重點(diǎn)關(guān)注的人工智能、氣候變化和健康三大領(lǐng)域開展了試點(diǎn)。
另一方面,政策效果評(píng)價(jià)正在從以定性分析為主轉(zhuǎn)變?yōu)橐远吭u(píng)價(jià)為主導(dǎo)、定量和定性分析相結(jié)合的方式,并越來越多地與大數(shù)據(jù)技術(shù)(網(wǎng)絡(luò)爬蟲、自然語言處理和機(jī)器學(xué)習(xí)等)相結(jié)合,以實(shí)現(xiàn)非結(jié)構(gòu)化文本的自動(dòng)分析,與傳統(tǒng)的基于調(diào)查的方法相比,改善了評(píng)價(jià)效率和客觀性。近期,英國國家科技藝術(shù)基金會(huì)(NESTA)發(fā)表的一份工作報(bào)告指出,在產(chǎn)業(yè)政策效果評(píng)價(jià)中,傳統(tǒng)評(píng)價(jià)方法難以及時(shí)捕捉到新興技術(shù)企業(yè)的創(chuàng)新活動(dòng),因?yàn)榻?jīng)典的創(chuàng)新調(diào)查方法通常是基于比較嚴(yán)格的行業(yè)分類來進(jìn)行的,對(duì)傳統(tǒng)科技行業(yè)更為有效。 而利用大數(shù)據(jù)技術(shù),可以實(shí)現(xiàn)對(duì)互聯(lián)網(wǎng)上的非結(jié)構(gòu)化企業(yè)信息進(jìn)行大規(guī)模數(shù)據(jù)收集和機(jī)器爬取,再利用機(jī)器學(xué)習(xí)方法對(duì)企業(yè)所屬行業(yè)進(jìn)行自動(dòng)分類,則打破了傳統(tǒng)行業(yè)分類標(biāo)準(zhǔn)對(duì)創(chuàng)新統(tǒng)計(jì)的限制,展現(xiàn)了自動(dòng)化技術(shù)手段在靈活性和效率方面的優(yōu)勢(shì)。
在數(shù)字化的社會(huì)環(huán)境下,社會(huì)媒體、大眾創(chuàng)新、人員流動(dòng)性等因素在科技政策擴(kuò)散過程中扮演著越來越重要的角色,可利用的評(píng)價(jià)資源越來越豐富,包括項(xiàng)目申請(qǐng)書、研究報(bào)告、專業(yè)文章、新聞報(bào)道、企業(yè)信息、社交媒體討論和產(chǎn)品評(píng)論等在內(nèi)的多源異構(gòu)數(shù)據(jù)都已成為評(píng)價(jià)信息的重要來源。
傳統(tǒng)的科技政策評(píng)價(jià)往往是以政策文本作為分析對(duì)象,或僅對(duì)某項(xiàng)政策的產(chǎn)出情況進(jìn)行評(píng)價(jià),不能涵蓋政策組合的整體效果和更廣泛的社會(huì)效應(yīng),以及影響政策結(jié)果的其他關(guān)鍵因素。 如社會(huì)媒體能夠及時(shí)捕捉從復(fù)雜的人際和知識(shí)網(wǎng)絡(luò)中涌現(xiàn)出來的新事物(如新思想、新技術(shù)和新行業(yè)等),具有很強(qiáng)的感知社會(huì)熱點(diǎn)和發(fā)展趨勢(shì)的能力,應(yīng)用十分廣泛。當(dāng)與政策密切相關(guān)的內(nèi)容在社交媒體或新聞報(bào)道中頻繁出現(xiàn)時(shí),往往代表政策產(chǎn)生了一定的社會(huì)影響,反之則說明政策的社會(huì)影響和效果尚不顯著。也就是說,可以進(jìn)一步從社會(huì)媒體討論的數(shù)量、主題、實(shí)體關(guān)系、情感傾向等多種視角出發(fā),探索將社會(huì)大數(shù)據(jù)應(yīng)用于科技政策效果評(píng)價(jià)的具體途徑??梢哉f,利用社會(huì)媒體大數(shù)據(jù)已成為政策效果評(píng)價(jià)的重要趨勢(shì)。
此外,大數(shù)據(jù)的運(yùn)用還能夠有效改善傳統(tǒng)評(píng)價(jià)數(shù)據(jù)存在的一些不足。如專利數(shù)據(jù)在內(nèi)容范圍、分析粒度、及時(shí)性和數(shù)據(jù)獲取成本方面都有局限性,尤其是用于評(píng)價(jià)政策對(duì)企業(yè)創(chuàng)新進(jìn)程的影響時(shí),專利并不能直接反映某些關(guān)鍵技術(shù)是否進(jìn)入了市場(chǎng)應(yīng)用階段。 而從Web 大數(shù)據(jù)中則可以識(shí)別出與創(chuàng)新成果應(yīng)用有關(guān)的信息,其中,企業(yè)網(wǎng)站是創(chuàng)新研究的一個(gè)特別重要的數(shù)據(jù)源。 因?yàn)槠髽I(yè)網(wǎng)站經(jīng)常發(fā)布有關(guān)潛在創(chuàng)新產(chǎn)品、服務(wù)以及與其他公司合作的信息,分析網(wǎng)站內(nèi)容并從中提取與創(chuàng)新相關(guān)的信息,有可能為研究人員和政策制定者提供一種經(jīng)濟(jì)且高效的方式來調(diào)查數(shù)百萬計(jì)的科技企業(yè),并深入了解他們的創(chuàng)新活動(dòng)、合作和技術(shù)應(yīng)用情況。NESTA 支持的一項(xiàng)研究以石墨烯行業(yè)的政策效果評(píng)價(jià)為例,從中小企業(yè)的網(wǎng)站上提取了石墨烯技術(shù)和產(chǎn)品方面的信息,以捕捉這些企業(yè)的創(chuàng)新活動(dòng)和經(jīng)濟(jì)活動(dòng),充分證明了大數(shù)據(jù)資源在政策效果評(píng)價(jià)過程中的價(jià)值與優(yōu)勢(shì)。
隨著科技創(chuàng)新的不斷發(fā)展, 科技政策效果評(píng)價(jià)的數(shù)據(jù)、指標(biāo)和分析領(lǐng)域正在不斷擴(kuò)展,傳統(tǒng)和經(jīng)典的評(píng)價(jià)指標(biāo)已經(jīng)無法滿足當(dāng)前科技政策效果評(píng)價(jià)的要求,也無法充分利用信息技術(shù)發(fā)展所帶來的便捷優(yōu)勢(shì),因此,亟待開發(fā)新的科技政策效果評(píng)價(jià)指標(biāo),擴(kuò)展評(píng)價(jià)的視野和范圍,以適應(yīng)不斷擴(kuò)大的科技政策影響面、揭示更為復(fù)雜的政策影響路徑,從而為科技政策制定提供堅(jiān)實(shí)的基礎(chǔ)。
2019 年,德國聯(lián)邦教育與研究部(BMBF)資助的一項(xiàng)政府高科技戰(zhàn)略效果評(píng)價(jià)研究提出了社會(huì)創(chuàng)新指標(biāo)(IndiSI)的概念,他們認(rèn)為通過分析與社會(huì)挑戰(zhàn)相關(guān)的社會(huì)媒體內(nèi)容,可以識(shí)別創(chuàng)新的傳播模式、感知和追溯社會(huì)需求與創(chuàng)新概念形成的早期階段,該研究總結(jié)了基于社會(huì)媒體數(shù)據(jù)的四類評(píng)價(jià)指標(biāo),分別是:(1)主題指標(biāo);(2)參與者和網(wǎng)絡(luò)指標(biāo);(3)時(shí)空動(dòng)態(tài)指標(biāo);(4)事件和資源指標(biāo)。 此外,基于大數(shù)據(jù)的指標(biāo)可以作為傳統(tǒng)指標(biāo)的補(bǔ)充和替代已成為專家學(xué)者的共識(shí),因?yàn)榇髷?shù)據(jù)指標(biāo)能夠提供更為詳細(xì)的分析數(shù)據(jù)和更加精準(zhǔn)的測(cè)量結(jié)果,提升捕捉政策效果變化方面的洞察能力。如BMBF 委托歐洲經(jīng)濟(jì)研究中心(ZEW)開展的一項(xiàng)研究在評(píng)價(jià)中小型科技創(chuàng)新企業(yè)的創(chuàng)新產(chǎn)出時(shí),采用了一系列基于企業(yè)大數(shù)據(jù)的創(chuàng)新指標(biāo)。 該研究發(fā)現(xiàn),企業(yè)網(wǎng)站的可用性和網(wǎng)站特征(如文本內(nèi)容、子頁面和超鏈接的數(shù)量、文本規(guī)模、使用的語言)因企業(yè)規(guī)模、年齡和所屬行業(yè)而異,而且,這些特征與企業(yè)創(chuàng)新能力有著密切的關(guān)聯(lián)。基于此,該研究提出了將企業(yè)網(wǎng)站特征轉(zhuǎn)化為有價(jià)值的創(chuàng)新指標(biāo)的幾種方法,包括:(1)基于文本特征的指標(biāo);(2)基于網(wǎng)站元信息的指標(biāo);(3)基于網(wǎng)絡(luò)超鏈接的指標(biāo)等。實(shí)證結(jié)果顯示,基于文本內(nèi)容的指標(biāo)(如主題流行度指數(shù)、英語的使用和網(wǎng)頁上的總字符數(shù)量)以及網(wǎng)站的子頁面數(shù)量等是分析企業(yè)創(chuàng)新產(chǎn)出的有效指標(biāo)。
綜上所述,科技政策效果評(píng)價(jià)的重要性與日俱增,從理論、方法到實(shí)踐都在經(jīng)歷變化轉(zhuǎn)型,但相關(guān)研究仍在持續(xù)探索之中,在評(píng)價(jià)理念、評(píng)價(jià)方法、評(píng)價(jià)對(duì)象等方面仍有待做進(jìn)一步的研究。 本文只是相關(guān)研究的初步總結(jié),以起到拋磚引玉之效果,進(jìn)一步提升科技政策效果評(píng)價(jià)的相關(guān)研究。