裴雷 孫建軍 周兆韜
編者按:當(dāng)Jim Gray提出數(shù)據(jù)密集型科學(xué)研究范式,David Lazer提出計(jì)算性社會(huì)科學(xué)等研究理念后,以數(shù)據(jù)分析和計(jì)算思維為引導(dǎo)的方法理論也逐漸與傳統(tǒng)人文社會(huì)科學(xué)結(jié)合,產(chǎn)生了數(shù)字人文、社會(huì)計(jì)算、計(jì)算傳播學(xué)以及相關(guān)計(jì)算性人文社會(huì)科學(xué),并得到廣泛的應(yīng)用和發(fā)展。計(jì)算分析方法在政策研究和政策分析領(lǐng)域卻一直獨(dú)立發(fā)展,雖然在政見分析、比較政黨研究、政治演講分析、政策認(rèn)同和政策情感研究領(lǐng)域都取得了不錯(cuò)的研究進(jìn)展,但政策計(jì)算分析一直沒有作為一個(gè)獨(dú)立術(shù)語或研究范疇被提出。事實(shí)上,在政策分析領(lǐng)域計(jì)算機(jī)輔助政策分析和政策文本計(jì)算分析擁有悠久的歷史,并產(chǎn)生了如內(nèi)容分析(content analysis)、一致性分析(concordance analysis)、話語分析(conversational analysis)、話語文本分析(discourse analysis)、計(jì)算詮釋學(xué)(computational hermeneutics)、定量文本分析(qualitative text analysis)等相關(guān)的研究方法和工具。
本專題三篇研究論文系教育部人文社會(huì)科學(xué)青年項(xiàng)目“基于概念統(tǒng)計(jì)的信息政策文本計(jì)算與實(shí)證”(項(xiàng)目編號(hào): 11YJC870020)與國(guó)家社會(huì)科學(xué)基金青年項(xiàng)目“信息政策擴(kuò)散與轉(zhuǎn)移研究”(項(xiàng)目編號(hào): 12CTQ024)的系列研究成果。具體而言,《政策文本計(jì)算:一種新的政策文本解讀方式》主要從方法論角度討論政策文本計(jì)算方法的可行性與應(yīng)用前景,通過梳理計(jì)算分析方法在政策分析領(lǐng)域的應(yīng)用,對(duì)政策文本計(jì)算的方法論、應(yīng)用工具和典型研究議題的跟蹤,提出了政策文本計(jì)算方法的主要特征以及政策計(jì)算分析的可能應(yīng)用前景;《中國(guó)信息化政策擴(kuò)散中政策主題跟蹤研究》則以課題組構(gòu)建的中國(guó)信息政策語料庫中的國(guó)民經(jīng)濟(jì)和社會(huì)信息化中長(zhǎng)期規(guī)劃為研究樣本,從主題承繼與主題創(chuàng)新、主題躍遷與主題衰退、政策擴(kuò)散漣漪效應(yīng)和漏斗效應(yīng)等角度研究了政策擴(kuò)散中的政策主題變化特征,并從信息化政策文本的計(jì)算分析中,發(fā)掘了信息化政策在地域擴(kuò)散和歷時(shí)擴(kuò)散兩個(gè)維度的擴(kuò)散特征;《政策擴(kuò)散時(shí)間滯后效應(yīng)及其實(shí)證評(píng)測(cè)——以江浙信息化政策實(shí)踐為例》則選擇了從擴(kuò)散滯后效應(yīng)測(cè)度的角度,通過二維政策主題密度分布中的差異化象限,提出通過政策詞頻的密度分布可以間接反映政策擴(kuò)散所處的階段,從而間接測(cè)度擴(kuò)散滯后性,并針對(duì)兩省信息化政策文本與信息化政策理論研究的實(shí)測(cè),發(fā)現(xiàn)了該方法的可行性。
摘 要:政策文本計(jì)算是大數(shù)據(jù)環(huán)境下政策分析科學(xué)與計(jì)算科學(xué)交叉融合的產(chǎn)物。文章通過對(duì)政策文本計(jì)算的方法論、應(yīng)用工具和典型研究議題的跟蹤和梳理,提出了政策文本計(jì)算方法的主要特征與不足,并討論了該方法在精細(xì)化政策分析和定量政治研究領(lǐng)域的研究前景。
關(guān)鍵詞:政策文本計(jì)算;政策詮釋;政策分析;方法論
中圖分類號(hào): D03 文獻(xiàn)標(biāo)識(shí)碼: A DOI:10.11968/tsyqb.1003-6938.2016110
Abstract Policy text computing is a new integrated methodology combined with policy analysis science and computing science in the big data era. This paper reviewed the development of computing methods in political text analysis, summarized the typical research topics, tools and applications in this area, then concluded the main characters and shortcomings of this methodology, and discussed the potential application of policy text computing in meta-policy analysis and qualitative political analysis.
Key words policy text computing; policy interpretation; policy analysis; methodology
1 引言
政策文本是指因政策活動(dòng)而產(chǎn)生的記錄文獻(xiàn),既包括政府或國(guó)家或地區(qū)的各級(jí)權(quán)力或行政機(jī)關(guān)以文件形式頒布的法律、法規(guī)、部門規(guī)章等官方文獻(xiàn),也包括政策制定者或政治領(lǐng)導(dǎo)人在政策制定過程中形成的研究、咨詢、聽證或決議等公文檔案,甚至包括政策活動(dòng)過程中因辯論、演說、報(bào)道、評(píng)論等形成的政策輿情文本,歷來是政策研究的重要工具和載體[1]。如在政策研究方法論中,Trauth[2]認(rèn)為主要有“預(yù)測(cè)-描述”的詮釋范式、“價(jià)值批判-價(jià)值構(gòu)建”的價(jià)值范式、政策過程范式以及政策評(píng)估和績(jī)效范式等主要形式,其中詮釋范式又分政策文本分析、政策分類或框架體系、政策生命周期律、政策社會(huì)系統(tǒng)等理論??梢?,政策文本研究在政策分析研究領(lǐng)域占有重要地位。
隨著計(jì)算機(jī)方法的引入應(yīng)用,政策文本分析所能處理的素材量和處理精度得到了大幅提升,并引入了新的方法和理念。尤其是政策文本數(shù)據(jù),如文本型數(shù)據(jù)(Textual Data)、數(shù)據(jù)文本(Text as Data)、文本數(shù)據(jù)空間(Text Universe)等相關(guān)概念的提出,研究者在政策文本內(nèi)容分析法的基礎(chǔ)上相繼提出了政策文本語料庫分析和政策文本數(shù)據(jù)挖掘方法,并利用上述方法解讀和獲知政策立場(chǎng)、政策傾向、政策價(jià)值、政策情感等深層政策內(nèi)涵以及廣義的政策比較分析。我國(guó)李江等[3]提出運(yùn)用政策計(jì)量(Policiometrics)的研究思路來揭示政策引用、主題共現(xiàn)以及機(jī)構(gòu)共現(xiàn)等政策關(guān)系。本文通過梳理國(guó)內(nèi)外政策文本內(nèi)容分析、政策語料庫以及政策文本挖掘的相關(guān)理論研究進(jìn)展,探討了政策文本計(jì)算分析的可行框架與應(yīng)用前景。
2 政策文本計(jì)算的方法論解析
政策文本計(jì)算是21世紀(jì)初Michchael Laver、Kenneth Benoit和Will Lowe等提出的,運(yùn)用計(jì)算機(jī)科學(xué)、語言學(xué)和政治學(xué)的理論建立的海量政策文本挖掘和計(jì)算分析框架。政策文本計(jì)算主張運(yùn)用政策編碼、政策概念詞表或政策與語詞之間的映射關(guān)系進(jìn)行政策概念的自動(dòng)識(shí)別和自動(dòng)處理,最終構(gòu)建從政策文本到政策語義的自動(dòng)解析框架,并在此基礎(chǔ)上關(guān)注政策文本及其內(nèi)涵分析。具體到方法論層次,政策文本計(jì)算被認(rèn)為是一種非介入式、非精確性的解析方式,并廣泛應(yīng)用于元政策分析領(lǐng)域。
2.1 政策文本計(jì)算是非介入式研究方法
從分析主體看,政策文本計(jì)算源自政策話語分析,是作為政策分析的一種非介入式方法引入政策科學(xué)領(lǐng)域。在政策分析傳統(tǒng)中,一般強(qiáng)調(diào)以政策利益相關(guān)者的心理或行為假設(shè)為出發(fā)點(diǎn),以公共政策績(jī)效或調(diào)整結(jié)果為評(píng)價(jià),并對(duì)政策過程、政策工具的可行性進(jìn)行相關(guān)評(píng)估研究。因此,不論是運(yùn)用控制論、運(yùn)籌學(xué)、系統(tǒng)分析或博弈論等過程分析方法,還是運(yùn)用行為科學(xué)、社會(huì)心理學(xué)、組織理論、權(quán)威理論、群體理論等行為解釋理論,或是預(yù)設(shè)一定的分析框架予以驗(yàn)證,都不可避免地要預(yù)設(shè)政策立場(chǎng)以及政策價(jià)值取向,作為政策分析的判斷標(biāo)準(zhǔn)。而政策文本分析或政策話語分析(Discourse Analysis)認(rèn)為政策文本已經(jīng)蘊(yùn)含了政策交流系統(tǒng)中的語義與價(jià)值情感[4],研究者無需再設(shè)計(jì)相應(yīng)的政策框架,僅需要轉(zhuǎn)述或提取政策文本中蘊(yùn)含的語義,并有序表達(dá)。
非介入式方法的優(yōu)點(diǎn)是研究結(jié)果的中立與客觀性,弱化了研究者因政策立場(chǎng)偏見、被調(diào)查者(樣本)主觀偏性而帶來的效度瑕疵[5],并且便于將研究結(jié)果復(fù)現(xiàn)和應(yīng)用于大范圍尺度和長(zhǎng)時(shí)間尺度,在宏觀政策研究、比較政策研究和非預(yù)見性研究中具有廣闊應(yīng)用前景[6];但不足是文本處理過程效度不夠,無法兼顧政策語境的差異性,研究結(jié)果的可解釋性較弱。
2.2 政策文本計(jì)算是非精確性研究方法
從分析方法看,政策文本計(jì)算的出發(fā)點(diǎn)是政策文本的自然語言處理,即政策的語法解析。雖然眾多政策文本計(jì)算研究者試圖構(gòu)建語法文本與語義文本、語用文本的映射關(guān)系,或依據(jù)研究者的理解構(gòu)建分析詞表或抽取若干政策元素或?qū)傩裕缓笠浴熬劢埂狈椒ǜ櫻芯?。但早期通過這種“重構(gòu)”或“再塑造”方式建構(gòu)的政策文本內(nèi)容分析方法,不僅耗時(shí)長(zhǎng)、成本高,而且在方法論上形成了研究者事實(shí)上的“意識(shí)介入”,研究者本身作為研究工具存在于研究過程,其可靠性依然為學(xué)界所詬病。
隨著政策文本數(shù)量的激增和開放獲取的便捷性,基于海量政策文本的語義自動(dòng)提取方法日益成熟,在顯性政策要點(diǎn)、政策情感以及政策立場(chǎng)領(lǐng)域的識(shí)別精度越來越高。如Hjorth等[7]對(duì)自動(dòng)文本分析與專家調(diào)查分析的對(duì)照分析發(fā)現(xiàn),兩種自動(dòng)分析方法和專家分析對(duì)CMP RILE measure政治演講語料庫的對(duì)比分析中,自動(dòng)分析政策主題排序與專家主題分析排序的spearman相關(guān)系數(shù)(Spearmans ρ)顯著優(yōu)于專家與一般選民識(shí)別的spearman相關(guān)系數(shù)。不過,從政策計(jì)算的分析結(jié)果看,政策文本分析結(jié)果仍然是非精確性的。如Proksch和 Slapin[8]認(rèn)為,現(xiàn)有的政策文本處理的算法缺陷、政策文本的語言特征以及政策文本結(jié)構(gòu)和語境適用性缺失都是政策文本計(jì)算分析的致命不足;雖然Mikhaylov和Benoit等[9-10]在研究政見語料庫時(shí)均發(fā)現(xiàn),專家研究的手工編碼誤差并不比計(jì)算機(jī)自動(dòng)編碼誤差小,因而政策文本計(jì)算的分析誤差來自編碼本身,而非計(jì)算機(jī)算法或處理誤差。而在主流政策分析領(lǐng)域,政策研究者雖認(rèn)可政策計(jì)量在問題識(shí)別和政策分析中的價(jià)值[11],但認(rèn)為政策計(jì)算分析的結(jié)果仍是非精確性的、參考性的[12]。Grimmer和Stewart[13]甚至提出政策自動(dòng)文本分析的“4原則”:第一,所有的自動(dòng)文本分析結(jié)論都是“錯(cuò)誤”的,但可用;第二,自動(dòng)文本分析永遠(yuǎn)無法替代政策分析者本身;第三,永遠(yuǎn)沒有最好的文本分析解決方案;第四,連說三遍“研究效度”。因此,研究者普遍認(rèn)為,加強(qiáng)政策的解釋性分析,并融合質(zhì)性方法的混合方法更具有應(yīng)用前景[14]。
2.3 政策文本計(jì)算聚焦于元政策分析
在政策分析中,元政策一般是“政策的政策”,是從現(xiàn)有政策中抽象出的理念或方法,其關(guān)注的是整個(gè)政策系統(tǒng)及其改進(jìn), 涉及公共政策的指導(dǎo)思想、價(jià)值標(biāo)準(zhǔn)、行為準(zhǔn)則、程序步驟、方式方法等[15]。而從分析對(duì)象看,政策文本計(jì)算處理對(duì)象多為政策語詞、政策概念(主題)、政策義素等顯性政策功能詞,或政策立場(chǎng)、意識(shí)形態(tài)、政策傾向、政策情感、政策價(jià)值、政策態(tài)度等元政策領(lǐng)域。
究其原因:首先,元政策分析的非精確編碼屬性與政策計(jì)算分析的非精確性具有很好的契合度,具備了元政策計(jì)算分析的方法論基礎(chǔ);其次,元政策抽離了政策工具、政策區(qū)域以及政策地域的語境影響,一是形成了最大可能的頻次聚焦,二是具備了跨區(qū)域政策比較的可能性;最后,元政策具有非顯在性,無法通過簡(jiǎn)單觀察獲知,而借助計(jì)量或計(jì)算方法的元政策識(shí)別機(jī)制能為研究者所接受。
3 政策文本計(jì)算分析的典型方法與議題
政策文本計(jì)算既是一種政策分析研究理念和研究框架,也是完整的政策分析流程。從分析方法角度看,Wiedemann將政策文本計(jì)算,或稱為計(jì)算機(jī)輔助文本分析(Computer Assisted Text Analysis,CATA)分為文本內(nèi)容分析、文本數(shù)據(jù)處理和文本挖掘三個(gè)研究層次,并先后經(jīng)歷了計(jì)算化內(nèi)容分析(Computational Content Analysis,CCA)、計(jì)算機(jī)輔助定量數(shù)據(jù)分析(Computer-Assisted Qualitative Data Analysis,CAQDA)以及語料計(jì)算學(xué)(Lexicometrics for Corpus Exploration)等不同發(fā)展階段[16];從分析流程角度看,Grimmer和Steward[13]將政策計(jì)算分為政策文本獲?。ˋcquire Documents)、政策文本處理(Process)和政策文本分析三個(gè)典型階段(見表1)。兩者均認(rèn)為政策文本處理和文本挖掘方法是政策文本計(jì)算分析的核心,本文則從政策文本內(nèi)容分析、政策文本計(jì)量分析、政策文本數(shù)據(jù)處理和政策文本挖掘四個(gè)方面考察政策文本計(jì)算的典型方法。
3.1 政策文本內(nèi)容分析方法
政策文本內(nèi)容分析是一種介于定性與定量之間的半定量研究方法,與之類似的還有一致性分析(Concordance Analysis)、話語分析(Conversational Analysis)、話語文本分析(Discourse Analysis)、計(jì)算詮釋學(xué)(Computational Hermeneutics)、定量文本分析(Qualitative Text Analysis)等研究方法。從20世紀(jì)80年代開始業(yè)內(nèi)就陸續(xù)研制了相關(guān)的文本分析軟件用于文本標(biāo)記、文本編碼和相應(yīng)的編碼管理工具,如Atlas.ti、MAXQDA、QDAMiner、NVivo、SPSS Text
Analytics for Surveys、QCAmap、CATMA、LibreQDA、MONK Project等文本數(shù)據(jù)管理軟件工具。雖然引入了計(jì)算機(jī)軟件對(duì)政策文本進(jìn)行概念抽取和定量化統(tǒng)計(jì),并具有文本數(shù)據(jù)的自動(dòng)統(tǒng)計(jì)和關(guān)系識(shí)別方法,但其概念抽取方法仍采用傳統(tǒng)的文本分析方法和流程,在數(shù)據(jù)處理環(huán)節(jié)仍主要依賴研究者的人工提取,體現(xiàn)為一種半計(jì)算化分析工具。
因此,這類計(jì)算處理方法能夠處理的政策文本數(shù)據(jù)有限,一般處理政策樣本集(Sample,n≤200),最多通過協(xié)作方式處理政策主題集(Subsets,N≈1000)范疇的政策文本集,而對(duì)政策語料庫(Corpus,N≥10000)基本上無法處理。因而,這類研究方法的研究議題也主要沿襲了政治學(xué)和詮釋學(xué)中的政治話語研究和政治文本內(nèi)容分析框架中的符號(hào)論和政治語詞解讀(政策主題識(shí)別與比較)的研究傳統(tǒng)。
3.2 政策文本計(jì)量分析方法
政策文本計(jì)量分析主要是采用文本計(jì)量分析的基本理論與方法,通過對(duì)已有政策文本數(shù)據(jù)庫或政策文本語料庫在政策主題分布、政策發(fā)布時(shí)間序列分布、政策引證以及政策主體關(guān)系等要素進(jìn)行計(jì)量分析[3]。在Grimmer的政策計(jì)算分析框架中,政策文本主要來自政策數(shù)據(jù)庫和已有語料庫、網(wǎng)絡(luò)政策文本和非電子化政策文本。因此,政策文本計(jì)量分析的主要方法和工具也主要有三種類型:一是政策文本數(shù)據(jù)庫自有的文本計(jì)量分析方法與工具,如Lexis Nexis、ProQuest、Westlaw、HeinOnline、北大法寶和CNKI政府公報(bào)數(shù)據(jù)庫等政策或法律文本數(shù)據(jù)庫, 利用數(shù)據(jù)庫自帶的字段設(shè)定結(jié)合政策主題、類型、時(shí)間、地域等進(jìn)行政策統(tǒng)計(jì)或計(jì)量分析,或應(yīng)用共詞或共現(xiàn)分析,能有效分析政策文獻(xiàn)增長(zhǎng)、擴(kuò)散、流變等變化規(guī)律;二是利用網(wǎng)絡(luò)分析和替代計(jì)量學(xué)(Altermetrics)方法和工具進(jìn)行網(wǎng)絡(luò)政策文本分析[17],如Wiley, NPG和PLOS One 等開始提供 Altmetric 服務(wù),Altmetric也可以對(duì)國(guó)內(nèi)新浪微博進(jìn)行追蹤,因而對(duì)社會(huì)媒體中的政策文本以及跟蹤研究也成為可能,如匹茲堡大學(xué)創(chuàng)建的MPQA政策辯論語料和卡內(nèi)基梅隆大學(xué)Sailing實(shí)驗(yàn)室Jacob Eisenstein和 Eric Xing創(chuàng)建的政治博客文本集語料;三是通過政策文本采集與語料庫構(gòu)建并提出新的統(tǒng)計(jì)口徑和研究方法,如蘇竣和黃萃等對(duì)中國(guó)科技政策的類型統(tǒng)計(jì)分析[18]以及卡內(nèi)基梅隆大學(xué)Wilson等對(duì)網(wǎng)站隱私政策的主題解析分析[19]。
3.3 政策文本數(shù)據(jù)處理方法
從政策文本的范圍看,政策文本結(jié)構(gòu)性差異很大:既有政府的政策文本、法律檔案(聽證會(huì)材料、判例),也有政策新聞、媒體數(shù)據(jù)和政策研究文獻(xiàn);既有總統(tǒng)競(jìng)選綱領(lǐng)、演說文本集,也有社交媒體的公眾政治言論和政治評(píng)論。而通過自然語言處理將政策文本解析為結(jié)構(gòu)化文本數(shù)據(jù)(Textual Data),并構(gòu)建語詞、語義或情感等特殊對(duì)象,不僅能形成對(duì)大規(guī)模政策文本語料的系統(tǒng)化處理,而且能在不同的政策文本集中進(jìn)行比較分析和一致性分析,推動(dòng)政策文本融合分析。結(jié)合政策文本分析的應(yīng)用,典型的研究方法和工具有政策文本自然語言處理和語法計(jì)量分析、政策文本處理以及政策語義分析(見表2)。
在政策文本數(shù)據(jù)處理過程中,政策文本或語料集適用于通用的自然語言處理方法和文本數(shù)據(jù)處理方法,政策語詞分析和政策語義分析在政策主題統(tǒng)計(jì)(聚類)、政策熱點(diǎn)識(shí)別、政策意見分析中應(yīng)用較多[20-21]。目前,在政策文本處理領(lǐng)域最受關(guān)注的議題:一是語料庫尺度的政策內(nèi)容分析[22-24],主要是對(duì)政策語料庫的統(tǒng)計(jì)和計(jì)量分析,識(shí)別政策語境中的熱點(diǎn)議題[25],關(guān)注政策議題的擴(kuò)散或影響[26-27],尤其是政治演說語料庫、政見語料庫、政治綱領(lǐng)語料庫分析;二是政黨和選舉研究中的政策立場(chǎng)分析和政策傾向研究,政策文本計(jì)算的概念本身即為比較政見研究(CMP)的Michchael Laver提出,而基于先驗(yàn)詞權(quán)(Reference Score)的WordScore和無先驗(yàn)詞權(quán)的WordFish也是政策文本計(jì)算分析中應(yīng)用最廣泛的分析軟件,CMP以及后續(xù)研究項(xiàng)目(MARPOR)提供的政見語料庫也是采納率最廣的語料庫。
3.4 政策文本數(shù)據(jù)挖掘方法
文本挖掘,又稱為文本數(shù)據(jù)挖掘或文本知識(shí)發(fā)現(xiàn),是指在大規(guī)模文本集合中發(fā)現(xiàn)隱含的、以前未知的、潛在有用的模式的過程[28],涉及數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、自然語言處理、可視化技術(shù)、數(shù)據(jù)庫技術(shù)等多個(gè)學(xué)科領(lǐng)域的知識(shí)和技術(shù)[29]。與政策文本處理更注重政策語詞或語義分析相比,政策文本數(shù)據(jù)挖掘更注重在大量文本數(shù)據(jù)集合中發(fā)現(xiàn)分類/聚類特征、發(fā)現(xiàn)關(guān)聯(lián)知識(shí)或規(guī)則,并注重深層潛在語義的知識(shí)發(fā)現(xiàn)。因此,政策情感分析、政策意見分析、政府行為預(yù)測(cè)等典型方法得到政策研究領(lǐng)域的廣泛關(guān)注,如Saremento等對(duì)用戶評(píng)論的政策傾向分析[30]、Hopkins和King[31]對(duì)博客政策意見的分析。政策情感分析在西方國(guó)家選情預(yù)測(cè)中尤為關(guān)注,包括政治領(lǐng)導(dǎo)人的政策情感傾向[32]、選民的情感反饋與傾向[33-34]以及整體選情預(yù)測(cè)[35-37];在政策意見分析中,公眾意見收集和政治意見追蹤也是常見的研究主題,并將公眾政策意見與其政治立場(chǎng)和政黨支持度關(guān)聯(lián),建立了計(jì)算化的政黨輿情監(jiān)測(cè)、政黨競(jìng)爭(zhēng)或政黨派系識(shí)別以及政策結(jié)果評(píng)估的分析方法[38-39];政府行為預(yù)測(cè)體現(xiàn)了政策預(yù)測(cè)分析的方法和思路,通過對(duì)政府領(lǐng)導(dǎo)人、政黨的競(jìng)選綱領(lǐng)或關(guān)鍵政策文本的分析,挖掘潛在的政策熱點(diǎn)或發(fā)展軌跡。國(guó)內(nèi)研究者也利用數(shù)據(jù)挖掘方法對(duì)政策熱點(diǎn)[40]以及政策價(jià)值[41]進(jìn)行了分析,或系統(tǒng)利用文本挖掘方法對(duì)政策文本的內(nèi)部結(jié)構(gòu)關(guān)系進(jìn)行了主題識(shí)別或關(guān)聯(lián)分析[42-44],但總體上缺乏系統(tǒng)性和連續(xù)性。
4 政策文本計(jì)算應(yīng)用研究進(jìn)展
4.1 政策文本語料庫建設(shè)
政策語料庫以及語料庫語言分析是政策文本計(jì)算分析的基礎(chǔ)。早期的政策語料庫一般針對(duì)政府出版物或公開政治文本進(jìn)行采集加工,如政策條文、相關(guān)政策解釋、政治人物傳記、語錄或新聞紀(jì)錄等;現(xiàn)在則擴(kuò)展到更加多樣化的語料來源。除了Lexis Nexis、北大法寶等傳統(tǒng)的法律信息服務(wù)提供商,目前比較典型的政策語料庫有:
(1)德國(guó)柏林社會(huì)科學(xué)研究中心比較政見研究項(xiàng)目政見文本語料庫(MRG / CMP / MARPOR) [45]。Manifesto語料庫是目前政策分析領(lǐng)域加工最為成熟的開放政策語料,包括1945-2015年70年跨度,涉及所有歐洲國(guó)家和少數(shù)英美聯(lián)邦國(guó)家(美國(guó)、加拿大、澳大利亞、南非、新西蘭)總計(jì)超過50個(gè)國(guó)家的4051個(gè)政見語料集,涵蓋了1979-1989年政見研究組MRG(Manifesto Research Group)、1989-2009年比較政見研究CMP(Comparative Manifestos Project)以及當(dāng)前基于政治表達(dá)的政見研究MARPOR(Manifesto Research on Political Representation)持續(xù)研究的政策語料。在語料分析工具包中,既包括手工編碼的政策術(shù)語編碼手冊(cè)(Code Book),也包括794,536個(gè)跨語種的機(jī)器識(shí)別政策術(shù)語、短語或詞條;既包括軟件版本的WordScore分析工具,也包括R語言的分析包ManifestoR。因此,Manifesto語料庫和WordScore分析軟件是目前政見分析和政策文本計(jì)算領(lǐng)域引用率最廣的語料庫,尤其在政策立場(chǎng)和政策傾向研究中。
(2)美國(guó)康奈爾大學(xué)政策文本語料庫(Corpus of political discourse)[46],它是康奈爾大學(xué)計(jì)算機(jī)系龐大的語料集中的一個(gè)子集,主要是由Matt Thomas, Bo Pang和 Lillian Lee整理的總統(tǒng)國(guó)會(huì)演講數(shù)據(jù)集(Congressional speech data),同時(shí)因Lillian Lee設(shè)計(jì)開發(fā)了相應(yīng)的情感開發(fā)工具ReadMe,因此在嚴(yán)肅政策文本的政策情感研究領(lǐng)域受關(guān)注度較高,目前共有22篇研究文獻(xiàn)利用或援引了該數(shù)據(jù)集。
(3)美國(guó)匹茲堡大學(xué)計(jì)算機(jī)系的MPQA Opinion Corpus語料庫(Multi-Perspective Question Answer, MPQA)[47],主要是新聞報(bào)紙素材的語料,包含4個(gè)子庫、4個(gè)詞表和基于語料庫分析技術(shù)開發(fā)的OpinionFinder系統(tǒng)(目前提供2.0版本下載),其中有一個(gè)專門子庫為政策辯論數(shù)據(jù)庫(Political Debate Data)。同時(shí),因其情感標(biāo)注系統(tǒng)比較出色,因而也是博客、評(píng)論等開源語料政策情感分析的主要素材和工具。
(4)卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)系Sailing實(shí)驗(yàn)室的政治博客語料庫[48]。由Jacob Eisenstein 和Eric Xing整理開發(fā),主要采集了2008年6個(gè)博客平臺(tái)的13246個(gè)政治博客文本記錄,并且通過意識(shí)形態(tài)的分層抽樣,也是政治博客研究比較重要的語料資源。類似的語料集還有美國(guó)海軍學(xué)院Twitter政策語料集。
(5)香港浸會(huì)大學(xué)整理開發(fā)的政治演講語料集(Corpus of Political Speeches-HKBU Library)[49]。目前主要包括4個(gè)部分:美國(guó)歷屆總統(tǒng)演說語料文本集和多媒體文本(1789-2015)(約443萬字)、歷屆香港總督或特首施政報(bào)告語料集(1984-1996,1997-2015,約43萬字)、歷屆中國(guó)臺(tái)灣地區(qū)領(lǐng)導(dǎo)人新年致辭和雙十演講語料集以及中國(guó)歷屆政府總理施政報(bào)告語料集,是比較完整的中文政策語料集之一。
此外,德國(guó)柏林Brandenburg科學(xué)研究院的阿德萊登·巴拉巴西提供的德國(guó)政策語料集[50]則結(jié)合了政策語料分析與可視化研究,利用這個(gè)政策語料集可進(jìn)行總統(tǒng)演講頻率、演講主題和演講所涉及的政策語言的可視化分析, 網(wǎng)站提供粗語料、分詞后的語料以及標(biāo)引后的語料等不同版本的語料。
4.2 政策文本分析工具研制
因語境意義對(duì)政策文本分析的現(xiàn)實(shí)意義更大,當(dāng)前政策文本計(jì)算比較注重政策詞典和政策文本分析專用工具的研制。目前,主要有兩類研究方法:
第一,測(cè)試通用文本分析工具在政策文本分析中的適用性。典型如政策情感分析領(lǐng)域,Lori Young等[51]對(duì)DICTION、LIWC、RID、TAS/C、ANEW、DAL、WNA、PMI以及LSD等眾多情感分析詞典的對(duì)比研究發(fā)現(xiàn),LSD在選民情緒跟蹤研究和對(duì)比研究中具有明顯優(yōu)勢(shì);Bei Yu等[32]則發(fā)現(xiàn)政策評(píng)論或政策演說文本中,情感詞匯的使用頻率明顯低于普通文本,并且不同于一般情感分析主要負(fù)載于謂詞描述,大量政策情感負(fù)載于名詞性的體詞描述中,需要結(jié)合上下文才能完全識(shí)別,因此在政策文本分類的算法中(SVM、NB),訓(xùn)練文本需更充足。
第二,研制政策分析專有詞表和分析工具。典型如政策立場(chǎng)和政見研究中的WordScore算法和WordFish算法。兩種方法都注重政策語詞對(duì)政策內(nèi)涵表達(dá)的影響權(quán)重差異,WordScore方法通過專家判定的參考文本作為政策語詞權(quán)重依據(jù),從而生成政策分析文本中政策內(nèi)涵的表達(dá)效果,其實(shí)質(zhì)是對(duì)詞頻結(jié)果進(jìn)行語義加權(quán)處理,類似一種基于動(dòng)態(tài)“詞典”的分類算法;WordFish算法認(rèn)為政策文本具有不同的政策特征向量,在某一特征中政策語詞的概率分布符合泊松分布,因此可以通過一種類似非監(jiān)督學(xué)習(xí)的方式對(duì)政策文本所蘊(yùn)含的“政策立場(chǎng)”進(jìn)行分類。由于WordScore算法的分類效果和可解釋性優(yōu)于WordFish,但分類效果受參考文本的影響大,在歷時(shí)分析或跨文化環(huán)境的比較參考分析中效度不高。此外,政策文本計(jì)算因德語或北歐國(guó)家特有的構(gòu)詞方式而具有一定研究效度,而在英語地區(qū)卻并不顯著,這也是當(dāng)前政策文本計(jì)算研究興盛于德國(guó)和北歐,而英美地區(qū)進(jìn)展緩慢的主要原因。
因此,政策文本分析詞表、文本分析效度改進(jìn)工具和跨語言政策文本分析工具都是目前政策文本分析工具研究的熱點(diǎn)問題。
5 政策文本計(jì)算的應(yīng)用前景與障礙
政策文本計(jì)算方法是大數(shù)據(jù)環(huán)境下政策分析科學(xué)與計(jì)算科學(xué)交叉融合的產(chǎn)物,目前已經(jīng)形成了較為穩(wěn)定的研究議題和研究隊(duì)伍。隨著政策文本資料的日益豐裕以及大數(shù)據(jù)分析方法日益為社會(huì)科學(xué)研究者所采納,可以預(yù)見未來政策文本計(jì)算在精細(xì)化政策分析和定量政治研究領(lǐng)域具有廣闊的研究前景。
5.1 政策文本計(jì)算的應(yīng)用前景
就政策文本計(jì)算的應(yīng)用領(lǐng)域而言,精細(xì)化政策分析主要體現(xiàn)在政策預(yù)測(cè)、政策沖突分析與政策輔助決策、元政策評(píng)價(jià)與政策比較等研究領(lǐng)域,定量政治研究則體現(xiàn)為政黨研究、政治立場(chǎng)、政治態(tài)度、政策認(rèn)同、政治聯(lián)盟以及選舉、外交等政治活動(dòng)領(lǐng)域。
第一,政策文本計(jì)算在精細(xì)化政策分析領(lǐng)域已經(jīng)具有研究基礎(chǔ),尤其在語料庫政策語言分析中形成了相對(duì)成熟的研究框架。首先,計(jì)算方法的引入提供了跨語料分析和實(shí)時(shí)語料分析的研究可能,對(duì)政策預(yù)測(cè)的時(shí)效性和精確度都將大大提升;其次,計(jì)算方法的引入將改進(jìn)政策分析的精度和深度,在政策制定中不同政策源的立場(chǎng)識(shí)別和主題識(shí)別可以避免顯性的政策條款沖突,同時(shí)對(duì)政策主題關(guān)系識(shí)別也能評(píng)判政策相似度或政策形式質(zhì)量預(yù)判,輔助政策制定決策;再次,通過政策文本與政策語義的對(duì)應(yīng)關(guān)聯(lián),能夠挖掘政策的潛在語義和元政策要素,從政策價(jià)值、政策傾向、政策工具、意識(shí)形態(tài)等高度評(píng)價(jià)或比較不同時(shí)期、不同地域甚至不同國(guó)別的政策差異,更好地跟蹤政策擴(kuò)散過程,促進(jìn)政策學(xué)習(xí)與創(chuàng)新。
第二,定量政治研究則融合了政治學(xué)、媒介理論以及政黨研究的理論視角,能通過泛在的政策文本載體,識(shí)別公眾的政治態(tài)度、政治立場(chǎng)以及不同主體之間的政治互動(dòng)關(guān)系,進(jìn)一步通過政治文本解析框架可以分析政治立場(chǎng)、政治距離和政治關(guān)系緊密度,從而發(fā)現(xiàn)政黨合作、國(guó)際合作的潛在空間;另一方面,通過不同政治參與主體的互動(dòng)機(jī)制,可以在政策認(rèn)同、政黨監(jiān)督、政黨競(jìng)爭(zhēng)以及選情預(yù)測(cè)等領(lǐng)域進(jìn)行有效分析。
5.2 政策文本計(jì)算的應(yīng)用障礙
正如國(guó)內(nèi)外學(xué)者對(duì)人文社會(huì)科學(xué)計(jì)算方法的擔(dān)憂[13,52-53],政策文本計(jì)算不論從方法論本身,還是從應(yīng)用場(chǎng)景的研究效度看,其只能作為決策分析工具,而無法替代政策分析者本身。究其原因,首先,政策文本語料庫的局限。語料庫具有一定時(shí)效性與完備性限制,而語料庫規(guī)模和多樣性是政策文本計(jì)算分析效度的關(guān)鍵,但語料庫構(gòu)建成本和可用技術(shù)的限制使得語料庫很難完全滿足政策分析者的需要;其次,文本挖掘和相關(guān)計(jì)算分析方法的局限。文本挖掘結(jié)果的呈現(xiàn)是抽象的或數(shù)據(jù)化的,只有結(jié)合相關(guān)的應(yīng)用背景才能完全理解相關(guān)內(nèi)涵;文本挖掘或計(jì)算分析注重研究創(chuàng)新點(diǎn)的突破,很難兼顧整體研究面的覆蓋,因而其結(jié)論往往是片面的、非系統(tǒng)的;文本計(jì)算分析方法是探索性分析方法,其研究結(jié)論是非可預(yù)期的、不確定的,而文本語料庫建設(shè)是高成本的,政策文本計(jì)算具有一定的研究風(fēng)險(xiǎn);第三,政策文本計(jì)算是跨學(xué)科研究方法,需要政策研究和計(jì)算機(jī)研究學(xué)者的緊密配合,而實(shí)際研究過程中很難兼顧二者。
因此,在未來的政策文本計(jì)算研究實(shí)踐中,一是需要加強(qiáng)學(xué)科合作,推動(dòng)專業(yè)化的政策語料庫的建設(shè),開發(fā)適用于政策文本分析的工具;二是政策文本計(jì)算研究具有良好的中立性與客觀性,國(guó)家應(yīng)該在智庫建設(shè)和國(guó)際政策比較研究中更加重視政策量化和定量政治研究。
參考文獻(xiàn):
[1] Chilton P A,Sch?覿ffner C.Politics as text and talk:analytic approaches to political discourse[M].John Benjamins Publishing,2002.
[2] E.M.Trauth.An integrative approach to information policy research[J].Telecommunications Policy,1986,10(1): 41-50.
[3] 李江,劉源浩,黃萃,等.用文獻(xiàn)計(jì)量研究重塑政策文本數(shù)據(jù)分析——政策文獻(xiàn)計(jì)量的起源、遷移與方法創(chuàng)新[J].公共管理學(xué)報(bào),2015(2):138-144.
[4] 楊正聯(lián).公共政策文本分析:一個(gè)理論框架[J].理論與改革,2006(1):24-26.
[5] 黃萃,任弢,張劍.政策文獻(xiàn)量化研究:公共政策研究的新方向[J].公共管理學(xué)報(bào),2015(2):129-137.
[6] Beauchamp N,Laver M,Nagler J,et al.Using Text to Scale Legislatures with Uninformative Voting[EB/OL].[2016-09-20].http://nickbeauchamp.com/work/Beauchamp_scaling_current.pdf.
[7] Hjorth F,Klemmensen R,Hobolt S,et al.Computers,coders,and voters:Comparing automated methods for estimating party positions[J].Research & Politics,2015,2(2):1-9.
[8] Sven-Oliver Proksch,Jonathan B.Slapin.How to Avoid Pitfalls in Statistical Analysis of Political Texts:The Case of Germany[J].German Politics,2009,18(18):323-344.
[9] Mikhaylov S,Laver M,Benoit K R.Coder reliability and misclassification in the human coding of party manifestos[J].Political Analysis,2010,20(1):78-91.
[10] Benoit K,Laver M.Estimating party policy positions: Comparing expert surveys and hand-coded content analysis[J].Electoral Studies,2007,26(1):90-107.
[11] Hansen,Ejnar M.Back to the Archives?A Critique of the Danish Part of the Manifesto Dataset[J].Scandinavian Political Studies,2008,31(2):201-216.
[12] Benoit K,Laver M,Mikhaylov S.Treating words as data with error:Uncertainty in text statements of policy positions[J].American Journal of Political Science,2009,53(2):495-513.
[13] Grimmer J,Stewart B.M.Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts[J].Political Analysis,2013,21(3):267-297.
[14] 孫建軍.大數(shù)據(jù)使社科研究不再“望數(shù)興嘆”[N].人民日?qǐng)?bào),2016-02-18(7).
[15] 李民,肖旭東.元政策視角下科學(xué)發(fā)展觀的價(jià)值分析[J].江漢論壇,2009(11):17-20.
[16] Wiedemann G.Computer-Assisted Text Analysis in the Social Sciences[M].Text Mining for Qualitative Data Analysis in the Social Sciences.Springer Fachmedien Wiesbaden,2016:17-53.
[17] Piwowar H.Altmetrics:Value all research products[J].Nature,2013,493(7431):159.
[18] 蘇竣,黃萃.中國(guó)科技政策要目概覽[M].北京:科學(xué)技術(shù)文獻(xiàn)出版社,2012.
[19] Wilson S,Schaub F,Ramanath R,et al.Crowdsourcing Annotations for Websites' Privacy Policies:Can It Really Work?[C].International Conference on World Wide Web.International World Wide Web Conferences Steering Committee,2016.
[20] Simon B A F,Xeons M.Dimensional Reduction of Word-Frequency Data as a Substitute for Intersubjective Content Analysis[J].Political Analysis,2010,12(1):63-75.
[21] Klebanov B B,Beigman E.Lexical Cohesion Analysis of Political Speech[J].Political Analysis,2008,16(4):447-463.
[22] ?魧del, Annelie.How to Use Corpus Linguistics in the Study of Political Discourse[M].Anne O'Keeffe and Michael McCarthy.The Routledge Handbook of Corpus Linguistics.Abingdon:Routledge,2010.
[23] Rowe C.Politics as Text and Talk:Analytic Approaches to Political Discourse,by Paul A.Chilton;Christina Sch?覿ffner[J].International Politics,2004,41(2):286-287.
[24] 涂端午.政策生產(chǎn):價(jià)值的權(quán)威控制及其演變——1979-1998年中國(guó)高等教育政策文本分析[J].比較教育研究,2009(11):95-96.
[25] Laver M,Benoit K.Locating TDs in Policy Spaces:The Computational Text Analysis of Dáil Speeches[J].Irish Political Studies,2010,17(1):59-73.
[26] Budge I,Pennings P.Do they work?Validating computerised word frequency estimates against policy series[J].Electoral Studies,2007,26(1):121-129.
[27] Monroe B L.Fightin' Words:Lexical Feature Selection and Evaluation for Identifying the Content of Political Conflict[J].Political Analysis,2008,16(4):372-403.
[28] 諶志群,張國(guó)煊.文本挖掘研究進(jìn)展[J].模式識(shí)別與人工智能,2005,18(1):65-74.
[29] 郭金龍,許鑫,陸宇杰.人文社會(huì)科學(xué)研究中文本挖掘技術(shù)應(yīng)用進(jìn)展[J].圖書情報(bào)工作,2012,56(8):10-17.
[30] Sarmento,Lu,Carvalho P,Silva,M,et al.Automatic creation of a reference corpus for political opinion mining in user-generated content[C].International CIKM Workshop on Topic-Sentiment Analysis for MASS Opinion.ACM,2009:29-36.
[31] Hopkins D J,King G.A Method of Automated Nonparametric Content Analysis for Social Science[J].American Journal of Political Science,2010,54(1):229-247.
[32] Yu B,Kaufmann S,Diermeier D.Classifying Party Affiliation from Political Speech[J].Journal of Information Technology & Politics,2008,5(1):33-48.
[33] Ceron A,Curini L,Iacus S M,et al.Every tweet counts?How sentiment analysis of social media can improve our knowledge of citizens political preferences with an application to Italy and France[J].New Media & Society,2014,16(2):340-358.
[34] Gerber E R,Lewis J B.Beyond the Median: Voter Preferences,District Heterogeneity,and Political Representation[J].Journal of Political Economy,2004,112(6):1364-1383.
[35] Choy M,Cheong M L F,Ma N L,et al.A sentiment analysis of Singapore Presidential Election 2011 using Twitter data with census correction[EB/OL].[2016-09-20].http://ink.library.smu.edu.sg/sis_research/1436.
[36] O'Connor B,Balasubramanyan R,Routledge B R,et al.From Tweets to Polls: Linking Text Sentiment to Public Opinion Time Series[C].International Conference on Weblogs and Social Media,2010.
[37] Sudhahar S,Veltri G A,Cristianini N.Automated analysis of the US presidential elections using Big Data and network analysis[J].Big Data & Society,2015,2(1):1-28.
[38] Hobolt S B,Klemmensen R.Government Responsiveness and Political Competition in Comparative Perspective[J].Comparative Political Studies,2008,41(3):309-337.
[39] Laver M,Benoit K,Sauger N.Policy competition in the 2002 French legislative and presidential elections[J].European Journal of Political Research,2006,45(4):667-697.
[40] 楊慧,楊建林.融合LDA模型的政策文本量化分析——基于國(guó)際氣候領(lǐng)域的實(shí)證[J].現(xiàn)代情報(bào),2016,36(5):71-81.
[41] 張惠,王冰.基于文本挖掘的政府公共價(jià)值測(cè)度與比較[J].安徽理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2015,17(1):35-39.
[42] 張永安,閆瑾.基于文本挖掘的科技成果轉(zhuǎn)化政策內(nèi)部結(jié)構(gòu)關(guān)系與宏觀布局研究[J].情報(bào)雜志,2016,35(2):44-49.
[43] 胡嫣然.基于文本挖掘的中國(guó)鐵路運(yùn)輸企業(yè)財(cái)稅支持政策研究[D].北京:北京交通大學(xué),2016.
[44] 程婷.基于文本挖掘的中國(guó)環(huán)境保護(hù)政策文本量化研究[D].武漢:華中科技大學(xué),2014.
[45] Volkens A,Lehmann P,Matthie T,et al.The Manifesto Data Collection.Manifesto Project(MRG / CMP / MARPOR)[EB/OL].[2016-10-20].https://visuals.manifesto-project.wzb.eu/mpdb-shiny/cmp_dashboard_dataset/.
[46] Corpus of political discourse in Cornell University[EB/OL].[2016-10-20].//www.cs.cornell.edu/home/llee/data/.
[47] MPQA Opinion Corpus[EB/OL].[2016-10-20].http://mpqa.cs.pitt.edu/corpora/political_debates/.
[48] Eisenstein J,Xing E.The CMU 2008 Political Blog Corpus.2010[EB/OL].[2016-10-20].http://www.sailing.cs.cmu.edu/main/?page_id=713.
[49] Ahrens,ed.Corpus of Political Speeches.Hong Kong Baptist University Library,Retrieved date of access(2015)[EB/OL].[2016-10-20].http://digital.lib.hkbu.edu.hk/corpus/.
[50] Barbaresi A.German Political Speeches,Corpus and Visualization(2012)[EB/OL].[2016-10-20].http://adrien.barbaresi.eu/corpora/speeches/.
[51] Young L,Soroka S.Affective News:The Automated Coding of Sentiment in Political Texts[J].Political Communication,2012,29(29):205-231.
[52] 陸宇杰,許鑫,郭金龍.文本挖掘在人文社會(huì)科學(xué)研究中的典型應(yīng)用述評(píng)[J].圖書情報(bào)工作,2012,56(8):18-25.
[53] Benoit K,Laver M,Mikhaylov S.Treating Words as Data with Error: Uncertainty in Text Statements of Policy Positions[J].American Journal of Political Science,2009,53(2):495-513.
作者簡(jiǎn)介:裴雷,男,南京大學(xué)信息管理學(xué)院副教授,研究方向:信息政策分析與信息資源管理;孫建軍,男,南京大學(xué)信息管理學(xué)院教授,研究方向:大數(shù)據(jù)分析與人文社會(huì)科學(xué)、網(wǎng)絡(luò)信息計(jì)量與網(wǎng)絡(luò)信息資源管理;周兆韜,女,南京大學(xué)信息管理學(xué)院研究生,研究方向:政策語料庫分析(CAPS)。