董克 程妮 邱均平
摘要:智庫研究是當前各學科領域關注的共同熱點。文章通過搜集WOS數據庫中與智庫相關的727篇研究論文,利用Stanford TMT主題模型工具包對研究論文的文本進行了主題挖掘,分析結果表明,當前國際智庫研究主要包括智庫建設與發(fā)展研究、特定領域和問題解決中的智庫研究等兩大類10個主題;通過本研究的主題挖掘結果,也證明利用StanfordTMT主題模型工具包能夠有效挖掘出文獻隱含的語義主題,主題模型分析能夠對共詞分析等文獻計量方法進行良好的補充,
關鍵詞:智庫研究;研究趨勢;內容挖掘;主題模型;Stanford TMT
中圖分類號:G250.25 文獻標識碼:A DOI:10.11968/tsyqb.1003-6938.2016038
1.引言
智庫(Think Tank)一詞主要出現于19世紀50年代,是研究宣傳社會、政治和經濟等特定主題的政策、戰(zhàn)略的一類組織。智庫的建立可以追溯到19世紀早期,如1831年成立的英國皇家聯合軍種國防研究所等。美國賓夕法尼亞大學發(fā)布的《2014全球智庫指數報告》指出,截至2014年,全球共有智庫6618個,作為一類為政策和決策服務、生產思想和知識的社會組織,智庫已經成為整個社會發(fā)展中不可或缺的機構,也是各國“軟實力”競爭的新焦點。
2015年1月,中共中央、國務院印發(fā)了《關于加強中國特色新型智庫建設的意見》,我國的智庫建設進入快速發(fā)展階段,相關的研究也逐步引起包括圖書情報領域在內的各個學科的重視。目前我國擁有的智庫在全球已經具有一定的影響力,但智庫研究開展時間較短,成果也較少,而國際上的智庫研究則積累了相對豐富的研究成果。本文利用斯坦福大學自然語言處理小組開發(fā)的Stanford TMT主題模型工具包對國際智庫研究論文進行內容挖掘研究,旨在分析國際智庫研究的主題結構,揭示當前智庫研究的趨勢,以期為我國新型智庫建設提供相應的理論支持和參考。
2.數據來源與分析方法
2.1數據來源
本研究的數據來源為WOS(Web 0f Science)核心合集,包含SCI、SSCI、A&HCI;、CPCI-SH和CPCI-SSH等5個數據庫,檢索字段選擇為主題,檢索式為“think tank*”O(jiān)R“brain box*”,文獻類型為articles、proceedings paper和review,檢索時間為2015年11月30日,共獲得文獻記錄727條,進一步抽取記錄中的題名、關鍵詞、摘要字段作為主題模型分析對象。
從智庫研究論文發(fā)表的時間分布(見表1)來看,WOS數據庫中最早與智庫相關的論文發(fā)表于1968年,威斯康辛大學法學家Nieburg在該文中論述了美國保守派智庫哈德遜研究所的創(chuàng)始人赫爾曼,卡恩在智庫工作方面的得失。但1968-1998這30年間發(fā)文量為95篇,僅占到目前為止發(fā)文總量的13%左右。進入新世紀以來,智庫在美國、加拿大、英國和西歐各國的政策制定中起到越來越重要的作用,與之相呼應的,從2000年左右開始,國際學術界關于智庫研究的論文數量也開始出現快速的增長。
2.2分析方法
隨著內容分析技術的發(fā)展,許多新的方法逐漸被應用于學科主題的發(fā)現,LDA(Latent Dirichlet Allocation)就是其中一種典型的挖掘技術。LDA分析過程中包含三個核心要素:詞、主題與文本。LDA模型假設詞首先構成潛在的語義主題,語義主題再進一步構成文本;詞與語義主題、語義主題與文本之間均遵從狄利克雷分布:由于詞和文本已知,通過Gibbs抽樣等方法對模型求解,最后得到的主題均反映了文獻的內容。作為一種無監(jiān)督學習的文本內容挖掘方法,LDA不需要對文本進行前期的標引,算法的復雜性也不高,提出后得到了廣泛的認可和應用。TMT(Topic Modeling Toolbox)是由斯坦福大學的自然語言處理小組專為社會科學研究人員進行主題模型開發(fā)的分析工具。TMT支持Excel和Csv的數據格式,并且提供了LDA、Labeled-LDA、PLDA等多種主題模型分析算法供用戶選擇。用戶不需要較強的代碼能力就可以通過TMT設定相應的運算參數,實現對主題模型分析過程的控制,最終生成包含豐富信息的分析主題結果,因此本研究以該工具進行主題挖掘。
3.智庫研究主題分布
經過多次試驗,本研究最終選擇了10個主題進行模型計算。最終分析得到主題和各主題中出現頻次前5的詞(見表2),通過這些詞可以很容易地確定各研究主題的內容。如主題4和主題5均與醫(yī)學相關,但主題4出現的內容較泛,而主題5中出現了patients(病患)和cardiovascular(心血管的)等詞,說明該主題4與醫(yī)學與健康教育相關,而主題5則是具體的特定病例智庫。
各主題在文獻集中的頻率分布,概率越高,說明該主題相關的研究越多。從10個主題的出現頻率中可以發(fā)現,專家知識與智庫建設、智庫在風險管理、區(qū)域發(fā)展中的作用、醫(yī)學病例智庫等主題是當前研究的重點;各國智庫發(fā)展狀況、智庫在外交和安全事務中的作用、智庫與全球氣候變化應對、醫(yī)學診療智庫等方面主題的研究居于其次:與信息獲取與決策支持、智庫與媒體關系等相關主題的研究略少。10個主題中,專業(yè)知識與智庫建設、信息獲取與決策支持、各國智庫建設主要與智庫的建設及其現狀相關:其余主題則主要是智庫在特定問題和領域中應用的研究。由于LDA的分析結果中包含了每篇論文在每個主題上的載荷,因此可以根據載荷最高的核心論文分析各個主題的具體內容。
4.智庫研究主題的具體內容
4.1智庫建設與發(fā)展現狀研究
(1)專家知識和智庫建設研究。專家是構成智庫的重要單元,專家知識在智庫發(fā)揮其功能的過程中具有重要的作用,國外對于專家知識在智庫建設中的作用研究開始較早,且一直以來都是研究的熱點。澳大利亞皇家墨爾本大學的公共管理學者Marden認為,在公共政策的決策過程中,智庫往往被認為是具有專業(yè)知識的群體,Marden通過對智庫來源和發(fā)展歷史的分析,評估了在澳大利亞政治活動中出現的新保守主義。美國哈佛大學的學者Nye認為專家知識、學術理論和實踐工作中存在的差距在政策的制定過程中十分明顯,且彼此之間的脫節(jié)有愈演愈烈的趨勢,Nye探討了這種現象產生的原因,認為如何在政策研究過程中搭建理論和實踐之間的橋梁,是智庫發(fā)展的重要基礎。英國格拉斯哥大學的學者Schlesinger討論了媒體、文化和公共事務領域智庫提供的專家意見和專業(yè)知識成為政府決策依據的過程,并以英國為例,分析了英國智庫在影響國家公共政策制定和創(chuàng)新經濟發(fā)展過程中的作用。認為從歷史的角度來看,專家的意見和專業(yè)知識在整個智庫的發(fā)展過程中起到了至關重要的作用。芝加哥大學全國民意研究中心的研究人員Struyk等認為,地方政策智庫在經濟發(fā)展和社會治理過程中發(fā)揮了重要的政策咨詢作用,地方政策智庫的建設應當充分重視能力建設,并提出了評估地方政策智庫發(fā)展能力的評價方案,取得了較好的實踐效果。
(2)信息獲取與決策支持研究。智庫在信息獲取問題上的態(tài)度和能力決定了智庫的決策支持能力,早期的相關研究主要集中于智庫的信息獲取傾向,近年來,隨著社交網絡的興起,Twitter、微博等作為智庫獲取信息的新來源受到學者們的關注。德國學者Schulz-Hardt和Frey認為智庫實質上就是一個提供決策支持的團體,決策的科學與否依賴于智庫所獲取的信息是否全面可靠:由此,他們從社會心理學的角度分析了組織決策過程中的信息檢索行為,發(fā)現了集體信息搜索過程中偏見產生的機理,并展望了如何利用該研究成果使智庫更好地獲取信息并履行自身職能。Schulz-Hardt還進一步研究了一個由201名專家所構成的智庫團體的決策過程,發(fā)現信息獲取策略的不同是導致爭論產生的主要原因,從決策過程來說,觀點上的異質性和信任是保持智庫團體獲取客觀信息,并且做出正確決策的有效依據。美國學者Golbeck和Hansen分析了媒體偏見對于政策信息搜尋的影響,并設計了一種新的方法來計算評估Twitter粉絲的政治性行為和觀點,他們開發(fā)了相應的計算機程序并進行了實驗研究,結果表明該方法能夠良好地反映智庫決策受到媒體和政策信息來源影響的機理。德國學者Hennig等認為博客是智庫進行決策的重要開源信息來源,每天以百萬數量級增加的博客中涵蓋了大量的熱點信息,可以利用博客信息進行預測分析。
(3)各國智庫建設現狀研究。世界各國均較為重視智庫在政治、經濟和社會生活中的作用,特別是隨著發(fā)展中國家智庫建設進程的加快,越來越多的學者開始重視發(fā)展中國家的智庫建設工作。如學者Politzer對導致巴西國內研發(fā)效率低下的因素及其產生的原因進行了回顧,發(fā)現巴西國內的一些戰(zhàn)略智庫提出的解決方案具有重要的參考價值。英國學者Weston等論述了在南非召開的企業(yè)與艾滋病智庫研討會的內容,該智庫由中小企業(yè)、公共部門和半官方機構等構成,智庫會議提出的政策和程序性建議對如何克服南非所面臨的艾滋病社會問題提供了重要的參考。國外學者對中國智庫的工作也進行了許多研究,由英國倫敦大學出版的期刊《中國季刊》刊載了許多中國智庫研究方面的文章。美國學者Shambaughtl91認為,中國智庫在國家外交政策的制定和情報分析中的作用十分重要,這些智庫不僅支撐著國家的決策,也成為了國際社會認識中國的重要途徑。美國戰(zhàn)略與國際問題研究中心的學者Glaser認為,在中國參加國際社會活動的過程中,民問智庫發(fā)揮的作用越來越重要,并分析了中國民間智庫參與國家政策制定的途徑以及民間智庫的角色、職能和發(fā)展趨勢。加州大學圣迭戈分校的中國問題專家Naughton認為,在整個中國經濟政策的決策網絡中,經濟智庫是其中的關鍵節(jié)點,但是從發(fā)展趨勢上看,中國智庫的趨同性越來越明顯,個性缺失是中國智庫發(fā)展面臨的主要問題。
(4)媒體視角的智庫研究。媒體是智庫產生社會影響力的重要渠道,也是智庫的重要發(fā)聲渠道,媒體視角的智庫研究主要集中于兩個問題:一是媒體如何在智庫功能實現過程中發(fā)揮作用;二是通過媒體進行智庫政治傾向分析。美國威克弗里斯特大學的媒體研究專家Rich等依據6份全國性報紙分析了全美51個公共政策智庫的表現,研究表明,在美國政府支持色彩較重的保守派智庫和不具備特定意識形態(tài)的智庫相比,更容易獲得媒體方面的知名度,美國的媒體整體上而言表現的十分保守,保守派公共政策智庫受到了更多的關注,并且在美國新聞媒體中更加頻繁的出現。臺灣學者Tung等以海峽兩岸的關系研究為例,論述了如何依據智庫和專業(yè)協會公布的在線研究成果作為重要的數據來源開展研究。加州州立大學的教育學專家McDonald通過研究發(fā)現,媒體是智庫在教育政策制定過程中發(fā)揮影響力的主要渠道,從當前美國的現狀來看,保守派智庫通過媒體對教育政策的影響力比中間派、自由派與進步派的智庫更強。
4.2特定領域中的智庫應用
(1)氣候變化與應對。國際上關于氣候變化及其應對方面的研究并非主要集中于智庫在其中發(fā)揮的作用,而是更多的集中在分析智庫及其所代表的政黨的態(tài)度,且這方面的研究一直都是重點。澳大利亞新南威爾士大學的學者Pearse等通過調研發(fā)現,許多智庫和專家認為碳排放是全球氣候變暖的主要原因,各國智庫應加強對碳交易市場的研究,以提供更多的環(huán)境保護建議。由于受到政治環(huán)境的影響,許多智庫并未對環(huán)境保護問題持有正確的立場和公正的態(tài)度。美國學者Jacques和Dunlap等認為,環(huán)境懷疑論是應對當前國際氣候變化所面臨的主要挑戰(zhàn)之一,他們分析了1972-2005年間出版的142本環(huán)境懷疑論的著作后發(fā)現,美國保守派智庫是該論調的主要持有者,其目的在于打擊環(huán)保主義,并推卸美國在氣候變暖方面應承擔的責任。密歇根大學的學者Schtddt等通過調查發(fā)現,美國的保守派智庫傾向于使用“全球變暖”而非“氣候變化”,試圖通過這一稱謂潛移默化的改變公眾對氣候問題嚴重程度的認知。學者Dunlap等認為美國的保守主義智庫在氣候危機問題方面一貫采取否定的態(tài)度,在通過分析相關的環(huán)境問題專著后發(fā)現,美國保守主義智庫所持有的環(huán)境問題懷疑論態(tài)度通過媒體和政治精英的放大作用,已經逐步擴散到其它國家,這些問題應引起環(huán)境保護主義者的重視。
(2)醫(yī)學與健康教育智庫。作為一個復雜的知識系統,現代醫(yī)學面臨許多新的挑戰(zhàn),特別是在健康教育方面,傳統的學校教育與醫(yī)院的臨床教學已經不能滿足當前高速發(fā)展的形勢,通過智庫的集體智慧制定醫(yī)學健康教育的標準、規(guī)范、要求已經得到廣泛的重視。耶魯大學醫(yī)學院的專家Henry等調查了一個兒童手術培訓教育的智庫建議的實施情況,通過分析工作時間規(guī)定與兒科手術培訓效果之間的關系,發(fā)現該智庫建議確實有效地改變了兒童手術培訓的效果,但手術后期的護理需要提供更多的可行性建議。加拿大健康智庫專家Barclav-Goddard等認為,慢性疾病患者和殘疾人治療的主要目標是實現病患的自我管理,從而優(yōu)化健康狀況和生活質量,通過對病人開展變革型的健康教育和健康生活價值觀的培養(yǎng),能夠有效優(yōu)化病人的生活質量。醫(yī)學智庫組織美國心臟病學基金會2015年發(fā)布的心血管核心培訓聲明是一份具有較大影響力的醫(yī)學教育智庫報告,該報告詳細規(guī)定了醫(yī)生進入美國心臟??婆嘤柕臈l件、要求、程序以及課程,充分體現了醫(yī)學智庫在推動整個社會的醫(yī)學與健康教育方面的影響力,該智庫成員Bedacher等詳細介紹了全美心臟超聲培訓和美國超聲心動圖學會在培訓和教育方面的工作,并提出了許多建設性的建議以推動健康教育的發(fā)展。
(3)病癥與病例智庫。病癥和病例對于醫(yī)學診療具有重要的參考價值,針對特定病癥所建立的智庫能夠為醫(yī)學專家交流治療經驗提供有效的渠道,發(fā)達國家一直較為重視病癥與病例智庫的建設,力圖發(fā)揮病癥與病例智庫在臨床治療中的作用。美國泌尿病癥診療智庫與美國心臟安全聯盟智庫常以年會的形式開展診療方案的討論,如該智庫2010年的國際咨詢年會廣泛討論了相關病癥對民眾健康以及社會經濟的影響,并提出了未來診療的發(fā)展方向。杜克大學的醫(yī)學專家Al-Khatib等[蚓介紹了美國心臟安全研究聯盟智庫SAFARI的工作情況,智庫由美國心臟安全聯盟、杜克大學醫(yī)學院等機構組成,主要針對在美國已經對公共健康產生重要影響的心臟疾病的病例進行分析,通過國家健康協同網絡對不同病癥治療建立統一的注冊和會診,該智庫的建設有效提升了全美心臟疾病治療的效率。
(4)城市與社區(qū)發(fā)展。城市和社區(qū)的發(fā)展面臨社會、經濟、地理、區(qū)域規(guī)劃等各方面的問題,智庫能夠在提供綜合性的解決方案方面發(fā)揮重要的作用。加拿大學者Maclellan-Wright等對21位智庫專家進行調研發(fā)現,目前加拿大大量的公共服務機構以社區(qū)為中心開展工作,如何衡量這些工作的效果和產出是管理工作面臨的難點,智庫專家建議從9個關鍵領域開展社區(qū)能力評估并取得了較好的實施結果。瑞士學者Cavin認為當前的城市可持續(xù)發(fā)展仍舊面臨許多困難,并介紹了瑞士聯邦智庫提出的城市自然公園建設方案,發(fā)現該智庫較為重視環(huán)境質量控制,相關成果為瑞士取得城市區(qū)域發(fā)展和自然保護中的平衡提供了重要的參考。
(5)風險應對與問題解決。社會和科學的發(fā)展必然伴隨著風險,這類風險問題大多具有高度的復雜性,需要不同層面的知識進行決策的支持,許多學者對智庫在風險應對和問題解決過程中的作用進行了研究。英國智庫機構公共政策研究所(Institute of Public Policy Research,IPPR)對英聯邦政府公布了公務員制度改革計劃存在的風險進行了系統研究,并發(fā)布了一系列的智庫研究報告以降低政策風險。環(huán)大西洋毒理學智庫組織(Transatlantic Think-Tank of Toxicology:t4)提出,為了應對相關風險,國際組織應當建立一個可靠、開放的信息交換機制,以防止問題的產生。美國癌細胞擴散研究智庫系統討論了特殊癌癥的治療及生物治療方案可能存在的風險問題,并對癌癥診斷、預后和質量控制方面存在的方案提供了一系列轉移建議。此外,為了增強生物樣本的可識別性,降低實驗風險,來自美國癌癥基因組學、生物信息學等多個領域的46名專家組成了一個研究智庫,該智庫認為通過建立數據共享體系能夠有效規(guī)避因生物樣本材料的不確定導致的實驗風險問題。
(6)外交與安全事務。外交與安全問題是世界各國政治生活的關注重點,也是智庫發(fā)揮作用的重要領域。西班牙學者Prado分析了歐洲與東盟、日本以及中國質檢的外交關系,研究表明,在多元化的外交關系建立過程中,智庫及精英知識分子對政策的制定起到了主導作用。倫敦大學學院的國際關系專家Klinke認為,從地緣政治學的角度來看,歐盟所持的“后現代”領土觀念和俄羅斯所持有的“現代”領土觀念并不對應,智庫專家、記者和政治學家已經成為兩者正式外交對華的重要通道。哥本哈根大學學者Beding以冷戰(zhàn)后的歐洲安全問題為例,分析了外交關系形成過程中存在的外交理論與實踐的脫離問題,認為外交關系的形成應當充分重視其過程,智庫在外交關系的形成過程中起到了重要的作用。德國外交問題專家Abb經過調查發(fā)現,中國的外交政策智庫在過去的10年中得到了長足的發(fā)展,這些智庫的專業(yè)化水平和學術水平已經有了明顯的提升,在中國外交關系的制定中也發(fā)揮著越來越重要的作用。
5.結論與討論
5.1結論
本文通過利用斯坦福大學自然語言處理研究小組開發(fā)的主題模型分析工具包TMT對WOS數據庫中國際智庫研究論文進行了內容挖掘分析。從本研究的主題挖掘結果來看,國際智庫研究主要包括兩大類型:一類是關于智庫建設的研究,包含專家知識如何在智庫建設過程中發(fā)揮作用、如何獲取有效的信息和情報保障智庫決策、國際社會智庫的發(fā)展現狀以及媒體視角的智庫研究等4個研究主題;第二類研究包含的6個研究主題主要集中于智庫在特定問題的應用,這些問題大多為當前國際社會普遍關注的領域,具有高度的復雜性,且是單純依賴某一行業(yè)或某一領域知識已經無法徹底解決的問題,如醫(yī)學健康問題、全球氣候變暖、國際安全問題、地區(qū)發(fā)展問題等,智庫所具有的集體智慧能夠為這些問題的解決提供重要支持。特別是在醫(yī)學健康領域,由于現代醫(yī)學需要綜合利用各種知識提供完整的解決方案,因此無論是高效的醫(yī)學教育,還是具體的病癥診療,均重視利用智庫來構建相關的解決方案。從各主題發(fā)展的時間上來看,智庫在特定領域中的應用在未來會受到越來越多的關注。
本研究還發(fā)現,國際社會,無論是美國、英國還是歐洲大陸,大量的智庫實質上具有明顯的政府背景,特別是國際上的保守派智庫發(fā)布的報告就是保守政黨執(zhí)政思路的重要體現,因此,智庫的政治傾向及其研究成果可以成為公共政策及政黨態(tài)度分析的重要情報源。同時,國際社會常以中國智庫建設過程中政府色彩濃重而否認我國智庫獨立性的觀點并不成立。
5.2討論
信息計量中常用的共詞分析法并不考慮詞本身所代表的語義,因此很容易受到關鍵詞歧義的影響而導致出現分析不準確等問題。相對而言,主題模型能夠較好地發(fā)現研究內容中隱含的語義主題,以本文中的“風險管理與應對”為例,在該主題上載荷較高的論文涵蓋了醫(yī)學研究、政策執(zhí)行、科學實驗等多個領域,依據共詞分析很難發(fā)現這些論文之間的相關性,但主題模型則可以深入內容,挖掘出論文研究內容之間的共性:此外,主題模型的分析結果還為不同研究主題內容的解讀提供了相對客觀的依據,能夠避免對專家主觀認知的過度依賴。因此,主題模型分析為識別領域研究結構提供了良好的渠道,同時能夠對共詞分析進行良好的補充。
此外,主題模型方法也存在一些缺陷,與共詞分析類似,主題模型更側重于對研究結構的分析,所以主題模型很難揭示不同研究領域的發(fā)展脈絡、研究進展和應用背景:雖然可以通過主題在時序上的變化分析出大致的趨勢,但是缺乏對趨勢進行精確解釋的必要條件。因此,本文的研究結果雖然能夠反映國際智庫研究主要研究內容,但在各主題本身的發(fā)展過程分析上還存在不足。較為合適的解決方案是綜合多種方法全面揭示研究領域的結構和發(fā)展趨利,如可以通過引文時序分析揭示研究領域的發(fā)展脈絡和主干,再利用主題模型對引文聚類的內容進行進一步的分析,相關內容將在本文后續(xù)的研究中得到進一步的探討。