饒緒黎 林晶 趙佳旭 林峰 陳志德
摘要:本文提出了一種基于TextRank的多維度智庫相互影響力評估模型,該模型綜合考慮智庫的內、外影響力評估。在評估內影響力方面,該模型基于TextRank算法提取智庫文章主題,通過各文章主題來衡量智庫文章之間內容的相似度,引入時間衰減因子描述時間對影響力的削弱;在評估外影響力方面,該模型計算主題流行度來衡量智庫文章對外部環(huán)境的影響。實驗表明:本文提出的模型,立足于文章內容本身,多維度評估文章的內外影響力,能夠有效評估智庫文章的影響力,具有一定的實用性和指導意義。
關鍵詞:智庫;影響力;相似度;主題流行度;時間衰減
0 引言
智庫(Think Tank)概念來源于美國,目前智庫的概念不再局限于軍事和國際關系的研究機構,而是延伸到從事政治、經濟、社會等公共問題的研究機構[1]。智庫以公共決策為研究對象,以公共利益為研究導向,以社會利益為研究準則的專業(yè)研究機構,又稱為“智慧庫”、“智囊團”等。智庫通常由多個學科專家組成,在社會、經濟、科技、軍事、外交等各方面問題為決策者出謀劃策,提供最佳理論、策略、方法、思想。智庫與公民利益直接相關,以知識的形式表達社會的需求[2]。文獻[3]中指出,智庫可以通過情報分析、專家預測為國家提供決策依據,可以為解決國內經濟社會發(fā)展難題提供決策,可以為總統(tǒng)決策期間提供施政綱領,進行政策解讀,以獲得民眾支持。因此,關于智庫影響力的研究尤其重要。
由于缺乏統(tǒng)一的評估工具和標準,智庫影響力難以準確評估,實證分析難度大,因此以往智庫的研究主要是定性研究。隨著現代信息技術的發(fā)展,一些研究者開始著手于實證分析智庫影響力,研究的方法包括問卷調查分析、智庫網站分析、智庫網絡分析等。(1)問卷調查研究:Trimbath S[4]首次嘗試使用定量分析的方法評估了1997.7~1999.6期間12家經濟政策智庫發(fā)布新聞能見度。Leeson P T等[5]使用計量回歸的方法分析了美國州智庫在相關公共政策的影響力。金晨[6]通過分析統(tǒng)計已發(fā)布的智庫研究報告,分析了中國高校智庫的影響力情況。這些方法局限于智庫的外在機構特性,僅采取主觀的研究方法,對智庫自身的研究成果和研究主題卻少有涉及,客觀性不足。(2)智庫網站分析:一些學者通過研究智庫網站,基于智庫的訪問與出入鏈數據來評估影響力,文獻[7]中提出了出鏈數的概念,認為網頁的出鏈數可以用于描述文獻的被引用量,出鏈數越大,反映了網頁的指向能力強,也就是網頁資源的開放程度越強。文獻[8]中提出通過鏈接分析法對中美智庫網站進行分析,從總網頁數、總鏈接數、內鏈接數、外鏈接數、文檔鏈接數、被鏈接網站數等數據指標對中國智庫網站建設提出改進方法。這些方法通過客觀的網站數據,能夠定性分析智庫的影響力,不過這類研究往往忽略網頁的內容,僅關注網站的鏈接數據,欠缺內容相關性。(3)智庫網絡分析:智庫集群和智庫網絡影響是西方新興的智庫研究方向,這類研究將關注點放在智庫聯(lián)合構成的同盟和組織上,研究這些智庫組織對政策和社會的影響力。如文獻[9]中將研究智庫專家研究成果的引用率、曝光率作為依據展開智庫及其專家影響力的排名。Richard Messnarz等[10]以構成歐洲智庫的單位-創(chuàng)新集群為研究對象,通過智庫的結構特點來評估智庫的影響力。Pautz等[11]通過建立量表的方法分析英國智庫的聯(lián)合網絡,對學術、記者、工會等不同背景智庫聯(lián)合的影響力進行評估。這類研究立足于智庫聯(lián)合化的新趨勢,有著重要的實際意義,但是對影響力僅止于定性研究,缺少量化研究的方法;另一方面,對智庫聯(lián)合成員的個體影響缺少研究的措施。
綜上所述,目前已有通過實證方式評估智庫影響力的研究,但是這些方法主要依賴智庫的外在內容,忽視了智庫的“內在”,即智庫的文章與思想。而實際上,智庫的本質在于學者們會圍繞相關主題探討思想,撰寫文章。若撰寫文章針對某主題的思想被認可,文章的影響將逐步擴散,相關主題的熱度也會隨之上升。若能利用智庫文章的影響力來衡量整個智庫的影響力,即從智庫的“內在”來評估其影響力,則評估準確程度就會更高。因此本文引入數據挖掘分析的方法,立足于智庫文章內容,采用自然語言處理技術,提出了一種基于TextRank的多維度智庫相互影響力評估模型,該模型綜合考慮智庫文章的內、外影響力問題,詳細構建了智庫文章的影響力評估方法。具體評估時,本文通過文本分析算法提取智庫文章的文本特征,實現文本到特征向量的轉換,隨后基于特征向量進行內、外影響力分析,進而綜合評估智庫文章的影響力。實驗數據表明:該評估模型從內部影響及外部影響兩個方面,有效刻畫智庫文章的影響,能為決策者在決策時提供參考意見。
1 基于TextRank的多維度智庫相互影響力評估模型
本文在評估智庫數據的影響力時,評估所用的文本數據,主要來源于智庫研究機構所發(fā)表的文章。智庫中發(fā)表的某主題文章,產生的影響包含內、外兩方面的影響:內影響產生于文章對智庫內其他文章的影響;外影響產生于文章對外部社會觀點的影響。例如當文章P提出某主題T后,后續(xù)發(fā)表一定數量的文章圍繞主題T進行討論,則說明文章P對智庫產生了一定的內影響力。其次文章P發(fā)布后,社會上或其他智庫圍繞該主題T也發(fā)布了一定數量的文章,則說明該文章P對智庫外產生了外影響力。因此智庫觀點會引起廣泛討論的特點使得我們需要通過內、外兩方面綜合評估智庫文章的影響力。接下來本文將展開討論智庫文章內、外兩部分影響力評估的構建。
1.1 內影響力評估
為評估文章對智庫內部文章產生的影響力,本文采用TextRank算法[12]挖掘智庫文章的關鍵詞數據,構建文章的特征向量。TextRank算法以PageRank鏈接分析理論為基礎,對文章詞語的重要程度迭代計算,只需要文檔本身即可實現詞語重要程度的計算,是目前無監(jiān)督關鍵詞挖掘的主流方法,簡潔并高效。本文在分析智庫文章中,涉及大量的文本關鍵詞提取,計算量較大且精確度要求高,故使用TextRank算法進行文章關鍵詞提取。
挖掘到文章特征關鍵詞后,組建文章特征向量,并依據特征向量計算某篇文章與該篇文章發(fā)表后的所有文章之間的相似度,相似度越大,說明兩篇文章內容越相似,即發(fā)表時間在前的文章對發(fā)表時間在后的文章影響越大。同時,考慮到由于文章的影響力會隨著時間的推移逐漸減弱,在評估影響力時引入了時間衰減因子。
為實現文章間相似度的計算,本文首先基于TextRank算法對文章進行特征提取。該算法通過將文本分割成若干組成單元(如單詞、句子)并建立圖模型,利用局部詞匯之間關系(共現窗口)迭代傳播圖模型的各個節(jié)點權重,直至收斂,最后對關鍵詞進行排序,得到最重要的n個單詞。TextRank利用單篇文檔本身包含的文本信息即可實現關鍵詞提取、文本摘要的提取,該算法廣泛應用于實際的文本挖掘中。
智庫文章同樣存在著多層影響關系,類似于學術研究領域的引文網絡,文章影響關系示例如圖1所示,文章Pi可影響文章Pj的內容,而Pj又影響文章Pk的內容,那么Pi與Pk之間存在的是一種間接影響關系而非直接影響關系,文章Pi的影響力也應有所下降。隨著時間的推移,間接影響關系會逐漸增強,文章Pi的影響力也相應逐漸下降。因此,為體現這種文章影響力隨時間衰減的情況,需引入時間衰減因子。
其中,λ為衰減率,DTj表示時間衰減因子,隨著Tj的增加而衰減。引入了時間衰減因子的影響量ETi,用于評價文章內容的影響力,相比影響量Ei更為貼近現實,更為準確。
1.2 外影響力評估
通過文章總影響量的計算,可以衡量文章與文章間的內部影響關系。而文章的影響力還會體現在對外部環(huán)境的影響:影響力大的文章發(fā)表后,會引起同行對該主題的關注,并帶動起學術界對該主題的討論。所以文章的影響力大不僅體現在影響了許多的后繼者,也體現為成為研究熱潮的推動者。
其中PopularityTi表示在Ti時間段內發(fā)表的文章流行度,FTi在Ti時間段內某一特定主題所發(fā)表的文章數量,FTi表示在Ti時間段文章發(fā)表的增長率,實際意義為該時間段的文章引發(fā)了后續(xù)多少篇文章的討論,即反映了一個時間段內的文章對外部環(huán)境的總影響趨勢貢獻率。為了將貢獻率均分到發(fā)表在該時間段內的文章上,將貢獻率FTi'除以文章數。
1.3 智庫文章影響力評估
其中,ET為文章Pi的帶時間權重影響量,即Pi的內部影響量。FTi+1表示Ti+1時間段的總文章數,PopularityTi表示文章Pi的流行度,即文章Pi對Ti+1時間段內文章數目增長的貢獻率,PopularityTi與FTi+1的乘積表示文章Pi對外部環(huán)境熱度的貢獻量,即文章Pi的外部影響量。
內部與外部影響量的和即文章的總影響量,作為文章影響力的評價指標,EFi值越大,說明文章的影響力越大。
2 實驗分析
2.1 實驗數據來源
本實驗數據來源于國內外87個著名智庫機構站點,共采集到45 492篇文章進行實驗,采集到的文章發(fā)表時間從1975年3月~2019年8月。同時為了使實驗數據更加集中,實驗結果更有意義,本文選取關于nuclear、iran、afghanistan、iraq、african、korea、environment、korean、japanese、intelligence主題的智庫文章進行實驗。
2.2 閾值有效性
本文在1.1節(jié)中提出了采用歐式距離衡量兩兩文章間的特征向量的相似度,并采用設定閾值的方式,計算文章內容的影響量。相似度大于設定的閾值,則認為該文章與所對比的文章內容相似,兩篇文章之間存在影響與被影響關系。
為了驗證本文相似度閾值的有效性,本實驗采用TextRank算法提取文章的關鍵詞,并選取其中出現頻率高的關鍵詞或主題名詞作為研究主題,如表1中所示的10個主題。同一主題下的文章內容在理論上會具有一定的相似性,實驗通過高于相似度閾值所占的比例來判斷閾值的有效性。通過計算該主題下的兩兩文章對數之間的特征向量歐式距離,來衡量兩篇文章間的相似度,距離越小,相似度越高。由于environment主題涉及的文章內容相對比較廣泛,因此數據較為不理想,小于等于閾值0.15的文章占比較低,如表1所示。而除了environment主題外,其他主題的文章距離小于等于閾值0.15的占比均在86%以上,距離大于0.15的文章占比在13%以下。在圖2中,橫軸表示文本距離閾值,縱軸表示文章對數,從圖2中可以發(fā)現,文本距離在0.15左側的文章對數更多,而當文本距離大于0.15的文章對數較少。因此,本實驗將相似度閾值設為0.15。
2.3 影響力評估算法分析
本文提出了一種基于TextRank的多維度智庫相互影響力評估模型,首先,通過TextRank算法提取文章特征向量,利用歐式距離衡量特征向量間的相似度,統(tǒng)計相似度高的文章數量并引入時間衰減因子作為文章內部影響量;然后計算主題流行度來衡量文章對外部環(huán)境熱度的貢獻量,作為文章的外部影響量;最后,將文章內部影響與外部影響結合作為文章的綜合影響力。
一篇來源于卡內基國際和平基金組織發(fā)布的標題為“Iran Nuclear Propulsion:IAEA Firewalls”的文章,文章主要內容關于伊朗擴大核活動范圍的計劃的討論[14],本文采用TextRank算法提取文章關鍵詞后的結果如表2文章關鍵詞提取結果所示。
如圖3所示為本文第1.1節(jié)中引入的時間衰減因子函數圖,從圖中可以發(fā)現,在不同λ取值下,隨著時間的增長,衰減系數不斷減少,同時,λ值越大,衰減系數下降得越緩慢。為了更好地擬合智庫文章隨時間推移,文章影響力不斷減弱的現象,本文實驗選取λ=0.3。圖3 時間衰減因子函數圖
最后,通過結合基于相似度的文章內部影響量,與基于主題流行度的文章外部影響量,得到智庫文章的綜合影響力值,如表3所示為部分智庫文章綜合影響力值示例。
內部影響值越大,說明智庫中的其他文章與該檢測的文章內容相似度越高;而外部影響值越大,說明該檢測的文章對整體智庫主題熱度的貢獻越大,即引發(fā)其他文章對同一主題的討論和發(fā)布?!度蛑菐靾蟾妗穂15],是美國賓夕法尼亞大學智庫與公民社會項目連續(xù)第十一年為全球智庫進行綜合評價的權威報告,與表3中文章來源的智庫機構進行對比,對比結果如表4,表中數據表示智庫機構在相應的地區(qū)或研究領域的排名。
同時,這些頂級智庫在其他領域均有上榜全球報告,例如,海因里?!げ疇柣饡习褡罴颜h智庫,加拿大國際治理創(chuàng)新中心、南非國際事務研究所、卡內基國際和平基金組織上榜國際發(fā)展頂級智庫,加拿大國際治理創(chuàng)新中心、卡內基莫斯科中心、卡內基國際和平基金組織上榜具有突出政策導向的智庫等。這些數據進一步說明本文提出的算法,能夠有效計算智庫文章的綜合影響力值,具有準確性。
3 結論
本文提出了一種基于TextRank的多維度智庫相互影響力評估模型,結合智庫文章內容的相似度,時間的衰減因素以及文章對外部環(huán)境的貢獻率多維度評估智庫的影響力。本文的創(chuàng)新點在于,從智庫文章本身內容的角度衡量文章的影響力,從文章與文章之間內容的相似性,計算影響力,更加符合實際分析。同時引入對外部環(huán)境的影響進行綜合評估文章的影響力。實驗結果表明:本文提出的智庫影響力評估模型具有合理性和實用性,能夠快速找出影響力較高的智庫文章,具有一定的實用價值和指導意義。
參考文獻:
[1] 上海社會科學院智庫研究中心項目組,李凌.中國智庫影響力的實證研究與政策建議[J].社會科學,2014(4):4-21.
[2] 朱旭峰.“思想庫”研究:西方研究綜述[J].國外社會科學,2007(1):60-69.
[3] 王莉麗.旋轉門:美國思想庫研究[M].北京:國家行政學院出版社,2010.
[4] Trimbath S.Think Tanks:Who's Hot and Who's Not[J].The International Economy,2000,14(5):10-47.
[5] Leeson P T,Ryan M E,Williamson C R.Think tanks-MyScienceWork[J].Journal of Comparative Economics,2012,40(1):62–77.
[6] 金晨.我國高校智庫影響力及其提升研究——基于一流高校智庫的分析[J].中國高教研究,2019(7):63-69.
[7] 邱均平.網絡計量學[M].北京:科學出版社,2010:182-183,185.
[8] 黃開木,樊振佳,盧勝軍,等.基于鏈接分析法的中美智庫網站比較研究[J].情報理論與實踐,2014,37(11):129-133.
[9] 金芳,孫震海,國峰,等.西方學者論智庫[M].上海:上海社會科學院出版社,2010:13-27,89-93.
[10] Richard Messnarz,Andreas Riel,Gabriele Sauberer.Forming a European Innovation Cluster as a Think Tank and Knowledge Pool[C].European Conference on Software Process Improvement.Graz:Springer International Publishing,2016.
[11] Pautz,Hartwig.British Think-Tanks and Their Collaborative and Communicative Networks[J].Politics,2014,34(4):345-361.
[12] Mihalcea,Rada,Tarau,et al.TextRank:Bringing Order into Texts[C].Proc Conference on Empirical Methods in Natural Language Processing.Barcelona:Association for Computational Linguistics,2004.
[13] Li L,Zheng L,Yang F,et al.Modeling and Broadening Temporal User Interest in Personalized News Recommendation [J].Expert Systems with Applications,2014,41(7):3 168-3 177.
[14] Mark Hibbs.Iran Nuclear Propulsion:IAEA Firewalls [EB/OL].(2017-01-04)[2020-09-01]http://carnegieendowment.org/2017/01/04/iran-nuclear-propulsion-iaea-firewalls-pub-66603.
[15] 韋路,李佳瑞.2008-2018全球智庫發(fā)展變遷及對中國媒體智庫的啟示[J].當代傳播,2019(5):4-9,49.
[責任編輯:鄭筆耕]