張?chǎng)巍∥霓?/p>
摘要:[目的/意義]智庫(kù)建設(shè)是目前社會(huì)科學(xué)界熱議的話題,如何科學(xué)合理地研究和評(píng)價(jià)智庫(kù)也成為日益受關(guān)注的問(wèn)題,高質(zhì)量的智庫(kù)研究報(bào)告需要高質(zhì)量的數(shù)據(jù)平臺(tái)支撐。[方法/過(guò)程]本文從智庫(kù)研究與評(píng)價(jià)的需求出發(fā),總結(jié)了目前智庫(kù)知識(shí)資源體系的主要類型和建設(shè)現(xiàn)狀,提出了大數(shù)據(jù)環(huán)境下面向智庫(kù)研究的知識(shí)資源平臺(tái)建設(shè)困難和挑戰(zhàn),介紹平臺(tái)建設(shè)的原則思路和主要技術(shù)。[結(jié)果/結(jié)論]以中華智庫(kù)研究網(wǎng)為實(shí)例,介紹面向智庫(kù)研究的知識(shí)資源中心的建設(shè),以及資源中心支撐智庫(kù)研究的實(shí)踐。
關(guān)鍵詞:智庫(kù)研究? 知識(shí)資源中心? 多源數(shù)據(jù)融合
分類號(hào):G350.7
DOI: 10.19318/j.cnki.issn.2096-1634.2020.03.09
中國(guó)特色新型智庫(kù)建設(shè)是目前國(guó)內(nèi)社會(huì)科學(xué)界熱議的話題。從國(guó)家層面到地區(qū)層面,都出臺(tái)了一系列政策,指導(dǎo)和促進(jìn)新型智庫(kù)建設(shè)。
在國(guó)家層面上,2015年1月,中共中央辦公廳、國(guó)務(wù)院辦公廳印發(fā)《關(guān)于加強(qiáng)中國(guó)特色新型智庫(kù)建設(shè)的意見(jiàn)》,將智庫(kù)的作用與重要性提到了空前的高度,文件指出,“中國(guó)特色新型智庫(kù)是以戰(zhàn)略問(wèn)題和公共政策為主要研究對(duì)象、以服務(wù)黨和政府科學(xué)民主依法決策為宗旨的非營(yíng)利性研究咨詢機(jī)構(gòu)”。2015年11月9日,中央深改組第十八次會(huì)議通過(guò)《國(guó)家高端智庫(kù)建設(shè)試點(diǎn)工作方案》,開(kāi)啟了中國(guó)特色新型智庫(kù)建設(shè)的新探索。2015年12月,國(guó)家推出了中國(guó)社會(huì)科學(xué)院、中國(guó)科學(xué)院、國(guó)務(wù)院發(fā)展研究中心等25家高端智庫(kù)。在地方層面上,2016年以來(lái),智庫(kù)建設(shè)由國(guó)家層面細(xì)化到地方層面,上海、山東、江蘇、廣東、湖南、四川等省份先后出臺(tái)了本省的高端智庫(kù)建設(shè)方案,一系列地域特色鮮明的智庫(kù)成為各個(gè)省市重點(diǎn)扶植培育的對(duì)象。
在國(guó)家和地方的大力支持下,智庫(kù)建設(shè)蓬勃發(fā)展,大批地涌現(xiàn),中國(guó)的智庫(kù)數(shù)量已經(jīng)躍居世界前列,如何科學(xué)合理地評(píng)價(jià)智庫(kù)也是當(dāng)前智庫(kù)界關(guān)心的話題。而科學(xué)準(zhǔn)確的評(píng)價(jià)離不開(kāi)豐富完備的數(shù)據(jù)資源庫(kù)的支撐。本文介紹了筆者及團(tuán)隊(duì)幾年來(lái)在面向智庫(kù)評(píng)價(jià)數(shù)據(jù)資源中心建設(shè)方面的一些理論思考和實(shí)踐工作。
1? 智庫(kù)評(píng)價(jià)對(duì)知識(shí)資源平臺(tái)的需求
高質(zhì)量的智庫(kù)評(píng)價(jià)報(bào)告離不開(kāi)豐富完善的數(shù)據(jù)資源支撐。隨著2015年以來(lái)國(guó)家和地方出臺(tái)政策支持智庫(kù)發(fā)展,智庫(kù)建設(shè)駛?cè)肓丝燔嚨馈S旰蟠汗S般出現(xiàn)的智庫(kù)機(jī)構(gòu)、智庫(kù)產(chǎn)品等,它們的質(zhì)量良莠不齊,如何科學(xué)、客觀、公正地評(píng)價(jià)智庫(kù)是當(dāng)前我國(guó)建設(shè)、發(fā)展和管理智庫(kù)的一個(gè)重要內(nèi)容。目前,國(guó)內(nèi)外的智庫(kù)評(píng)價(jià)模式主要有政府主導(dǎo)評(píng)估、市場(chǎng)主導(dǎo)評(píng)估、第三方機(jī)構(gòu)評(píng)估、學(xué)術(shù)專家評(píng)估研究等。
列舉幾種國(guó)外的智庫(kù)評(píng)價(jià)模式有:韓國(guó)的智庫(kù)評(píng)價(jià)主要由政府主導(dǎo);德國(guó)學(xué)風(fēng)一向嚴(yán)謹(jǐn),他們的智庫(kù)評(píng)價(jià)由政府主導(dǎo),萊布尼茨協(xié)會(huì)等第三方機(jī)構(gòu)實(shí)施;美國(guó)的智庫(kù)運(yùn)作獨(dú)立性更強(qiáng),自然對(duì)其評(píng)價(jià)也以民間機(jī)構(gòu)為主。詹姆斯·麥甘教授的《全球智庫(kù)報(bào)告》從2006年起發(fā)布至今,每年1期,麥甘教授的智庫(kù)報(bào)告在國(guó)內(nèi)雖然爭(zhēng)議不斷,但也影響頗大。此外國(guó)外智庫(kù)評(píng)價(jià)還有Michael Dolny[1]、Donald E.Abelson[2]、Andrew Rich[3]等幾家。
國(guó)內(nèi)的智庫(kù)評(píng)價(jià)“已經(jīng)形成多家競(jìng)爭(zhēng)的新格局”[4],主要是各個(gè)智庫(kù)研究中心以項(xiàng)目的方式進(jìn)行。朱敏[5]、雷佳麗[6]等人的文章總結(jié)了國(guó)內(nèi)外智庫(kù)研究進(jìn)展和評(píng)價(jià)指標(biāo)體系。綜合前人研究,筆者將目前國(guó)外內(nèi)比較有影響力的智庫(kù)評(píng)價(jià)總結(jié)如下,見(jiàn)表1。
朱旭峰等將當(dāng)前的智庫(kù)評(píng)價(jià)研究方法的發(fā)展趨勢(shì)概括為:從主觀到客觀,從定性到定量,從小樣本到大樣本,從小數(shù)據(jù)到大數(shù)據(jù)[14]。主觀評(píng)價(jià)容易受到選取的評(píng)審專家個(gè)人觀念的影響,由于中國(guó)新型智庫(kù)類型豐富多樣,而調(diào)查問(wèn)卷選取的專家往往只對(duì)某些特定領(lǐng)域的智庫(kù)了解較深入,而對(duì)其他領(lǐng)域的智庫(kù)了解不夠,專家評(píng)審有時(shí)也會(huì)受到專家固有思維的影響,對(duì)智庫(kù)當(dāng)年表現(xiàn)的動(dòng)態(tài)變化感知不夠。而客觀的基于數(shù)據(jù)的評(píng)價(jià),作為主觀評(píng)價(jià)的補(bǔ)充,正好可以解決主觀評(píng)價(jià)的這些問(wèn)題,通過(guò)收集各類智庫(kù)的成果、活動(dòng)數(shù)據(jù),基于科學(xué)合理的指標(biāo)體系計(jì)算,能夠定量反應(yīng)各個(gè)智庫(kù)的年度表現(xiàn),為排名提供有效的數(shù)據(jù)支撐。客觀評(píng)價(jià)需要準(zhǔn)確權(quán)威科學(xué)的數(shù)據(jù)支撐,覆蓋多家智庫(kù)的、多來(lái)源的數(shù)據(jù)的收集、整理和加工,需要資源平臺(tái)做支撐。
2? 目前智庫(kù)資源平臺(tái)建設(shè)現(xiàn)狀
隨著國(guó)家和地方對(duì)于智庫(kù)建設(shè)的支持力度加大和網(wǎng)絡(luò)時(shí)代的發(fā)展,各種各樣的智庫(kù)知識(shí)資源平臺(tái)全面建立,各種平臺(tái)建設(shè)主體各異,建設(shè)目標(biāo)各不相同,卻都在智庫(kù)知識(shí)保存共享上發(fā)揮了一定的作用。智庫(kù)資源平臺(tái)從建設(shè)主體和資源覆蓋范圍上大概分為以下4類,見(jiàn)表2。
2.1? 智庫(kù)機(jī)構(gòu)知識(shí)庫(kù)或知識(shí)管理系統(tǒng)
智庫(kù)知識(shí)庫(kù)[15]和機(jī)構(gòu)知識(shí)庫(kù)有相似之處,主要是指智庫(kù)機(jī)構(gòu)自己建立的,維護(hù)自身的知識(shí)的數(shù)據(jù)平臺(tái)系統(tǒng),美國(guó)的蘭德公司、德國(guó)國(guó)際政治與安全研究所,中國(guó)科學(xué)院等智庫(kù)單位都建設(shè)有自己的知識(shí)庫(kù)系統(tǒng),以支撐研究和決策。
2.2? 媒體主導(dǎo)的智庫(kù)知識(shí)資源中心
以光明網(wǎng)、中國(guó)網(wǎng)等為代表的一些媒體積極參與和報(bào)道智庫(kù)活動(dòng)信息,并發(fā)揮自身優(yōu)勢(shì),建立“智庫(kù)頻道”“智庫(kù)中國(guó)”[16]等專欄或?qū)n}頁(yè)面,報(bào)導(dǎo)智庫(kù)相關(guān)重大活動(dòng)、重要事件,形成相應(yīng)的數(shù)據(jù)庫(kù)或資源中心。
這類資源中心的主要特點(diǎn)為:收錄智庫(kù)的活動(dòng)、事件等媒體信息較多,很多信息是媒體的第一手信息,對(duì)了解智庫(kù)動(dòng)態(tài)作用很大。但收錄智庫(kù)的論文、報(bào)告、成果、項(xiàng)目等信息較少,數(shù)據(jù)的全面性不夠。
2.3? 地方政府或行業(yè)智庫(kù)知識(shí)資源中心
隨著各省市加強(qiáng)新型智庫(kù)建設(shè)指導(dǎo)實(shí)施意見(jiàn)的發(fā)布,為了分享本地區(qū)智庫(kù)的研究成果,交流智庫(kù)建設(shè)經(jīng)驗(yàn),加強(qiáng)本地智庫(kù)交流與合作,構(gòu)建高端智庫(kù)交流平臺(tái),各省地區(qū)也建設(shè)有自己省市范圍內(nèi)的智庫(kù)平臺(tái),例如“湖南智庫(kù)網(wǎng)”“江蘇智庫(kù)網(wǎng)”等。
各個(gè)專業(yè)領(lǐng)域或行業(yè)聯(lián)盟也建立了自己的領(lǐng)域特色智庫(kù)知識(shí)平臺(tái),如國(guó)務(wù)院發(fā)展研究中心主辦、各地方政府發(fā)展研究中心共建的中國(guó)智庫(kù)網(wǎng),主要收錄該系統(tǒng)內(nèi)智庫(kù)的數(shù)據(jù),搭建了領(lǐng)域內(nèi)智庫(kù)的交流與合作平臺(tái)[17]。
這類智庫(kù)資源網(wǎng)站面向領(lǐng)域內(nèi)智庫(kù),面向本領(lǐng)域內(nèi)機(jī)構(gòu),收集本領(lǐng)域的信息,在領(lǐng)域內(nèi)數(shù)據(jù)較全面,而且能夠收集部分領(lǐng)域?qū)<业脑瓌?chuàng)性言論成果,但收錄范圍相對(duì)較小。
2.4? 綜合知識(shí)資源中心
南京大學(xué)等單位合作研發(fā)的“中國(guó)智庫(kù)索引”(Chinese Think Tank Index,以下簡(jiǎn)稱CTTI)兼具智庫(kù)的大數(shù)據(jù)管理與智庫(kù)評(píng)價(jià)的雙重功能,在同類網(wǎng)站中收錄數(shù)據(jù)相對(duì)較全面。目前CTTI數(shù)據(jù)依賴各個(gè)智庫(kù)的上傳情況,而國(guó)內(nèi)各個(gè)智庫(kù)對(duì)CTTI的重視程度不同,而且每家智庫(kù)對(duì)專家的范圍界定有所區(qū)別,導(dǎo)致CTTI各家智庫(kù)數(shù)據(jù)參差不齊。
清華大學(xué)公管學(xué)院的智庫(kù)研究中心也與清博數(shù)據(jù)公司合作建立了智庫(kù)大數(shù)據(jù)平臺(tái),主要收錄智庫(kù)的微博微信等新媒體數(shù)據(jù)。CNKI基于自身積累的豐富成果數(shù)據(jù),建設(shè)了“中國(guó)特色新型智庫(kù)知識(shí)資源總庫(kù)”。
3? 面向智庫(kù)評(píng)價(jià)的知識(shí)資源中心體系設(shè)計(jì)
3.1? 大數(shù)據(jù)環(huán)境下智庫(kù)資源中心建設(shè)的挑戰(zhàn)
當(dāng)前網(wǎng)絡(luò)大數(shù)據(jù)環(huán)境下,智庫(kù)知識(shí)資源數(shù)據(jù)中心建設(shè)面臨以下挑戰(zhàn)。
3.1.1? 智庫(kù)知識(shí)資源來(lái)源豐富,分散各處? 如智庫(kù)機(jī)構(gòu)主頁(yè)、智庫(kù)機(jī)構(gòu)知識(shí)庫(kù)、新聞媒體網(wǎng)站、論文圖書資源集成數(shù)據(jù)庫(kù)、專家的微博、微信等,需要從公開(kāi)的海量碎片化數(shù)據(jù)之中提取有用的知識(shí)信息。不僅如此,各個(gè)不同的數(shù)據(jù)資源之間的數(shù)據(jù)質(zhì)量參差不齊,知識(shí)價(jià)值判斷困難。
3.1.2? 智庫(kù)知識(shí)資源動(dòng)態(tài)變化? 這不僅表現(xiàn)在智庫(kù)機(jī)構(gòu)的設(shè)立、合并、更名,智庫(kù)專家的隸屬機(jī)構(gòu)改變、兼職等基礎(chǔ)元數(shù)據(jù)的改變,更表現(xiàn)在中國(guó)特色新型智庫(kù)以服務(wù)決策為主要目標(biāo),智庫(kù)機(jī)構(gòu)的研究領(lǐng)域和方向隨著社會(huì)熱點(diǎn)議題不斷變化
3.1.3? 智庫(kù)成果歸屬判定難? 一方面表現(xiàn)為自然語(yǔ)言表達(dá)的智庫(kù)領(lǐng)域知識(shí)存在多樣性和歧義性問(wèn)題,突出表現(xiàn)為智庫(kù)機(jī)構(gòu)別名現(xiàn)象和智庫(kù)學(xué)者重名現(xiàn)象,網(wǎng)絡(luò)資源中出現(xiàn)的往往不是準(zhǔn)確的智庫(kù)學(xué)名,而是智庫(kù)名稱的多種簡(jiǎn)稱、別名或上下級(jí)機(jī)構(gòu)名。另一方面表現(xiàn)為兼職人員成果處理問(wèn)題,由于目前各個(gè)智庫(kù)的治理模式各不相同,有些智庫(kù)大而全,全職成員比例高,兼職人員比例相對(duì)低,且發(fā)揮的作用相對(duì)小,如社科院等單位。而許多高影響力的智庫(kù)則采用“強(qiáng)核心,大網(wǎng)絡(luò)”的方式構(gòu)建研究隊(duì)伍,全職人員比例較低,兼職專家在智庫(kù)中發(fā)揮的作用很大,如中國(guó)工程院,目前主要依靠龐大的院士隊(duì)伍在國(guó)家重大工程決策之中發(fā)揮重要作用。
3.1.4? 智庫(kù)私密成果獲取難? 決策影響力一直是智庫(kù)評(píng)價(jià)的重點(diǎn)關(guān)注領(lǐng)域,權(quán)威的幾家智庫(kù)評(píng)價(jià)報(bào)告都設(shè)計(jì)了相應(yīng)的評(píng)價(jià)指標(biāo),通過(guò)智庫(kù)的對(duì)策建議批示數(shù)據(jù)來(lái)度量,這個(gè)指標(biāo)數(shù)據(jù)的權(quán)威數(shù)據(jù)獲取較為困難,可能還會(huì)涉及保密的問(wèn)題,目前往往是采用向智庫(kù)管理部門發(fā)邀請(qǐng)函的方式進(jìn)行。
3.2? 面向智庫(kù)評(píng)價(jià)的知識(shí)資源中心體系設(shè)計(jì)的原則
3.2.1? 采用準(zhǔn)確的智庫(kù)機(jī)構(gòu)遴選機(jī)制? 智庫(kù)研究首要進(jìn)行就是研究對(duì)象的選取,這也是資源平臺(tái)建設(shè)的基礎(chǔ),平臺(tái)之后的所有數(shù)據(jù)收集、數(shù)據(jù)建設(shè)工作都是圍繞著這些研究對(duì)象進(jìn)行的。由于國(guó)家和地方層面對(duì)智庫(kù)建設(shè)的大力支持,智庫(kù)建設(shè)成績(jī)有目共睹,但以“智庫(kù)”之名的“智庫(kù)變異體”仍大量存在,“商業(yè)化”“泛化”“泛娛樂(lè)化”現(xiàn)象廣泛存在[4],需要以一個(gè)科學(xué)合理的標(biāo)準(zhǔn)流程進(jìn)行智庫(kù)機(jī)構(gòu)遴選?!蛾P(guān)于加強(qiáng)中國(guó)特色新型智庫(kù)建設(shè)的意見(jiàn)》文件中給出8條基本標(biāo)準(zhǔn),為智庫(kù)機(jī)構(gòu)遴選提供指導(dǎo)。南京大學(xué)中國(guó)智庫(kù)研究中心是國(guó)內(nèi)較早開(kāi)展智庫(kù)機(jī)構(gòu)遴選的機(jī)構(gòu),采用“摸底、推薦、評(píng)審、審核”遴選的過(guò)程[12],為入選機(jī)構(gòu)頒發(fā)“CTTI來(lái)源智庫(kù)證書”,并對(duì)智庫(kù)機(jī)構(gòu)進(jìn)行動(dòng)態(tài)更新。CTTI來(lái)源智庫(kù)名單為多家智庫(kù)研究提供借鑒。此外,各地方各領(lǐng)域的特色高端智庫(kù)建設(shè)方案中的智庫(kù)名單也是機(jī)構(gòu)遴選的重要補(bǔ)充。
3.2.2? 集成科學(xué)合理的評(píng)價(jià)指標(biāo)體系? 在方茜[18]、王文[4]等學(xué)者研究的基礎(chǔ)上,筆者認(rèn)為評(píng)價(jià)指標(biāo)的選取應(yīng)該遵循4大原則,即評(píng)價(jià)目標(biāo)導(dǎo)向原則、科學(xué)性原則、系統(tǒng)性原則、可行性原則。上海社會(huì)科學(xué)院、南京大學(xué)、四川省社會(huì)科學(xué)院等幾家報(bào)告雖然選擇的具體指標(biāo)略有區(qū)別,數(shù)據(jù)獲取方式各異,但從大的方面來(lái)看,都是從決策影響力、輿論影響力、社會(huì)影響力、專業(yè)影響力、國(guó)際影響力幾個(gè)方面進(jìn)行評(píng)價(jià),支撐影響力指標(biāo)的數(shù)據(jù)基礎(chǔ)具有很多的共性。
3.2.3? 利用豐富準(zhǔn)確的數(shù)據(jù)來(lái)源? 目前的智庫(kù)研究和智庫(kù)評(píng)價(jià)的數(shù)據(jù)主要有主觀數(shù)據(jù)和客觀數(shù)據(jù),主觀數(shù)據(jù)主要是通過(guò)邀請(qǐng)領(lǐng)域?qū)<姨顚憜?wèn)卷方式進(jìn)行收集,表征領(lǐng)域?qū)<覍?duì)于智庫(kù)的主觀看法;客觀數(shù)據(jù)的來(lái)源有兩個(gè),一是智庫(kù)管理部門提交的數(shù)據(jù),二是通過(guò)網(wǎng)絡(luò)采集挖掘獲取得到的數(shù)據(jù)。評(píng)價(jià)所需的數(shù)據(jù)來(lái)源非常豐富,類型也各異。數(shù)據(jù)不一定要大而全,但一定需要準(zhǔn)確,為保證研究質(zhì)量,可以采用多數(shù)據(jù)源相結(jié)合校對(duì)的方式。
3.2.4? 支持有效的數(shù)據(jù)更新維護(hù)機(jī)制? 數(shù)據(jù)更新機(jī)制是知識(shí)資源中心得以不斷煥發(fā)生機(jī)的源泉,也是基于資源平臺(tái)的智庫(kù)評(píng)價(jià)方法優(yōu)于問(wèn)卷調(diào)查方法的地方。問(wèn)卷調(diào)查和當(dāng)事人填報(bào)的方式往往不能夠及時(shí)更新數(shù)據(jù),而資源平臺(tái)建設(shè)中可以采用任務(wù)調(diào)度機(jī)制,及時(shí)從新聞網(wǎng)站等數(shù)據(jù)源采集數(shù)據(jù)信息,為研究所用,并能實(shí)時(shí)進(jìn)行數(shù)據(jù)展示,動(dòng)態(tài)評(píng)價(jià)。由于不同資源的時(shí)效性不同,適宜采用不同的數(shù)據(jù)更新機(jī)制,新聞?lì)悢?shù)據(jù)實(shí)時(shí)性強(qiáng),可做到日更新甚至實(shí)時(shí)更新,對(duì)于每年特定時(shí)間才會(huì)發(fā)布的基金項(xiàng)目類數(shù)據(jù),可以根據(jù)相應(yīng)發(fā)布時(shí)間進(jìn)行更新。
3.3? 面向智庫(kù)研究的資源平臺(tái)架構(gòu)設(shè)計(jì)
面向智庫(kù)研究的知識(shí)資源中心架構(gòu)如圖1所示,自底向上可以劃分為數(shù)據(jù)層、大數(shù)據(jù)平臺(tái)層和展示層。
3.3.1? 數(shù)據(jù)層? 該層集成各種資源的收集與匯繳策略。針對(duì)各類不同的數(shù)據(jù)資源,采用不同的收集匯繳機(jī)制。根據(jù)數(shù)據(jù)來(lái)源不同,需要人工和自動(dòng)結(jié)合的方式,包括分布式爬蟲技術(shù)采集,利用批量導(dǎo)出功能采集,機(jī)構(gòu)管理部門填寫等等。對(duì)于數(shù)據(jù)源格式多樣,采集困難的個(gè)別資源,還需要采用手工錄入方式,平臺(tái)提供數(shù)據(jù)錄入功能接口。
3.3.2? 大數(shù)據(jù)平臺(tái)層? 該層是平臺(tái)的核心和基礎(chǔ),集成主要的數(shù)據(jù)清理與知識(shí)融合方法流程,又可以細(xì)分為數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析和數(shù)據(jù)接口幾部分,并集成用戶授權(quán)、訪問(wèn)認(rèn)證機(jī)制。
根據(jù)數(shù)據(jù)的體量和類型,數(shù)據(jù)存儲(chǔ)子層可以采用傳統(tǒng)的數(shù)據(jù)庫(kù)存儲(chǔ)、本地文件存儲(chǔ)、大數(shù)據(jù)分布式文件存儲(chǔ)、分布式數(shù)據(jù)存儲(chǔ)等存儲(chǔ)機(jī)制。
數(shù)據(jù)分析子層,集成多源數(shù)據(jù)融合體系和方法,提供數(shù)據(jù)的分析與關(guān)聯(lián)的功能,通過(guò)基于規(guī)則、基于機(jī)器學(xué)習(xí)命名實(shí)體識(shí)別等方法準(zhǔn)確識(shí)別出機(jī)構(gòu)信息,構(gòu)建機(jī)構(gòu)合作、機(jī)構(gòu)關(guān)聯(lián)等關(guān)系,實(shí)現(xiàn)單指標(biāo)評(píng)分、綜合評(píng)價(jià)等數(shù)據(jù)計(jì)算功能。
數(shù)據(jù)接口子層實(shí)現(xiàn)與展示層的數(shù)據(jù)對(duì)接,并可以提供其他相關(guān)系統(tǒng)的數(shù)據(jù)交互接口。
面向智庫(kù)評(píng)價(jià)的領(lǐng)域資源知識(shí)庫(kù)是語(yǔ)義搜索和知識(shí)挖掘的基礎(chǔ),以關(guān)系數(shù)據(jù)庫(kù)、三元組等形式存儲(chǔ)在數(shù)據(jù)庫(kù)之中,供數(shù)據(jù)檢索調(diào)用,通過(guò)平臺(tái)實(shí)現(xiàn)知識(shí)庫(kù)動(dòng)態(tài)變化更新。
3.3.3? 展示層? 該層是平臺(tái)與用戶交互接口,提供機(jī)構(gòu)檢索、專家檢索、關(guān)鍵詞檢索和語(yǔ)義智能檢索等功能,方便關(guān)注智庫(kù)的學(xué)者查找智庫(kù)相關(guān)資源信息。展示層中應(yīng)集成智庫(kù)機(jī)構(gòu)的自動(dòng)評(píng)價(jià)與機(jī)構(gòu)對(duì)比分析功能。將通用智庫(kù)評(píng)價(jià)的指標(biāo)集合和專業(yè)化評(píng)價(jià)指標(biāo)集合在平臺(tái)中進(jìn)行固化,并采用直方圖、折線圖、餅圖、詞云圖等豐富可視化方式進(jìn)行結(jié)果展示。
4? 面向智庫(kù)評(píng)價(jià)的領(lǐng)域知識(shí)圖譜構(gòu)建關(guān)鍵技術(shù)
4.1 知識(shí)圖譜中知識(shí)單元構(gòu)建方法
面向智庫(kù)評(píng)價(jià)的領(lǐng)域知識(shí)圖譜中主要包含3類知識(shí)單元,智庫(kù)機(jī)構(gòu)、智庫(kù)專家和智庫(kù)成果活動(dòng)信息,知識(shí)單元構(gòu)建過(guò)程中主要解決這幾類知識(shí)單元相關(guān)的數(shù)據(jù)檢索與數(shù)據(jù)融合方法問(wèn)題。著力研究智庫(kù)專家、智庫(kù)機(jī)構(gòu)、智庫(kù)成果和活動(dòng)幾類知識(shí)單元概念及其相關(guān)的關(guān)系信息,構(gòu)建相應(yīng)的專家畫像、機(jī)構(gòu)畫像和成果畫像。這3類知識(shí)單元的概念及其概念關(guān)系見(jiàn)圖2。
機(jī)構(gòu)實(shí)體、專家實(shí)體、成果實(shí)體等領(lǐng)域知識(shí)庫(kù)支持的主要知識(shí)實(shí)體信息,需要將這幾類知識(shí)實(shí)體相關(guān)數(shù)據(jù),采用語(yǔ)義規(guī)則等方法,進(jìn)行深度關(guān)聯(lián)融匯。
機(jī)構(gòu)—專家。融合各個(gè)機(jī)構(gòu)官網(wǎng)、領(lǐng)域資源網(wǎng)站中的專家信息表,夯實(shí)機(jī)構(gòu)—專家對(duì)應(yīng)關(guān)系,特別是要考慮到專家兼職、專家重名等現(xiàn)象?;诔晒c活動(dòng)數(shù)據(jù)集中的同時(shí)含有機(jī)構(gòu)信息和專家信息的數(shù)據(jù)項(xiàng),為機(jī)構(gòu)—專家對(duì)應(yīng)表建立補(bǔ)充關(guān)系。根據(jù)成果與活動(dòng)等數(shù)據(jù)的結(jié)合建立機(jī)構(gòu)畫像和專家畫像。
專家—成果。通過(guò)專家信息,在資源網(wǎng)站中檢索出成果信息和活動(dòng)信息數(shù)據(jù)。根據(jù)成果元數(shù)據(jù)、成果內(nèi)容數(shù)據(jù)或?qū)<摇獧C(jī)構(gòu)對(duì)應(yīng)數(shù)據(jù)判定出成果對(duì)應(yīng)的機(jī)構(gòu),通過(guò)專家名—機(jī)構(gòu)聯(lián)合檢索的方式解決專家重名問(wèn)題。
機(jī)構(gòu)—成果。通過(guò)智庫(kù)機(jī)構(gòu)名或父級(jí)機(jī)構(gòu)名在資源網(wǎng)站中檢索出相應(yīng)的成果與活動(dòng)數(shù)據(jù),再根據(jù)成果元數(shù)據(jù)、成果內(nèi)容數(shù)據(jù)或?qū)<摇獧C(jī)構(gòu)對(duì)應(yīng)數(shù)據(jù)準(zhǔn)確推斷出相應(yīng)子機(jī)構(gòu),解決部分成果的機(jī)構(gòu)信息不完整問(wèn)題。
4.2? 領(lǐng)域知識(shí)圖譜的構(gòu)建流程和知識(shí)更新方法機(jī)制
面向智庫(kù)評(píng)價(jià)的領(lǐng)域圖譜構(gòu)建的整體流程如圖3所示,網(wǎng)絡(luò)資源數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)清洗和存儲(chǔ),形成結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),對(duì)結(jié)構(gòu)化數(shù)據(jù)采用
基于語(yǔ)義規(guī)則庫(kù)的語(yǔ)義匹配算法,對(duì)非結(jié)構(gòu)化數(shù)據(jù)采用基于語(yǔ)義挖掘和機(jī)器學(xué)習(xí)的實(shí)體關(guān)系抽取方法,初步構(gòu)建知識(shí)體,再通過(guò)知識(shí)匹配和屬性擴(kuò)展方法,將知識(shí)體進(jìn)行融合。構(gòu)建領(lǐng)域知識(shí)庫(kù)的時(shí)候,根據(jù)各種知識(shí)融合模型評(píng)價(jià)算法,同步進(jìn)行知識(shí)融合結(jié)果評(píng)價(jià)和優(yōu)化,最終形成面向智庫(kù)評(píng)價(jià)的領(lǐng)域知識(shí)庫(kù)。
同時(shí),由于智庫(kù)機(jī)構(gòu)具有關(guān)注時(shí)事,關(guān)注熱點(diǎn)等特征,面向智庫(kù)評(píng)價(jià)的智庫(kù)領(lǐng)域知識(shí)庫(kù)也要與時(shí)俱進(jìn),不斷更新?;谶@一特點(diǎn),領(lǐng)域知識(shí)融合體系盡量采用與智庫(kù)研究數(shù)據(jù)采集同步更新的方式進(jìn)行知識(shí)庫(kù)的更新,新采集到領(lǐng)域數(shù)據(jù)后,同步進(jìn)行知識(shí)沖突監(jiān)測(cè)和領(lǐng)域知知識(shí)庫(kù)數(shù)據(jù)更新。
5? 平臺(tái)建設(shè)與應(yīng)用示范
“中華智庫(kù)研究網(wǎng)”是中國(guó)科學(xué)院成都文獻(xiàn)情報(bào)中心和四川省社科院合作研發(fā)的,網(wǎng)站持續(xù)為《中華智庫(kù)影響力報(bào)告》提供客觀數(shù)據(jù)支撐。該數(shù)據(jù)平臺(tái)可通過(guò)雙方合作“中華智庫(kù)研究網(wǎng)”進(jìn)行授權(quán)訪問(wèn)。
不斷完善平臺(tái)數(shù)據(jù)質(zhì)量,持續(xù)不斷、客觀準(zhǔn)確地收集智庫(kù)的相關(guān)數(shù)據(jù)是平臺(tái)能夠持久生存,并且不斷擴(kuò)大影響力的關(guān)鍵。平臺(tái)基礎(chǔ)數(shù)據(jù)在“機(jī)器抓取,人工錄入審核”大原則下,利用中心豐富的數(shù)據(jù)資源,采用相對(duì)權(quán)威的數(shù)據(jù)源,嚴(yán)格按照“三重過(guò)濾,兩重審核”機(jī)制,確保數(shù)據(jù)質(zhì)量,見(jiàn)圖4。針對(duì)不同數(shù)據(jù)類目的特點(diǎn),完善不同的數(shù)據(jù)更新機(jī)制,確保數(shù)據(jù)的完整性和時(shí)效性。
圖4? 系統(tǒng)數(shù)據(jù)來(lái)源和質(zhì)量保證機(jī)制
Figure 4? Data sources and quality assurance mechanisms
5.1? 豐富的數(shù)據(jù)來(lái)源
充分利用購(gòu)買和自主建設(shè)的數(shù)據(jù)資源,以及龐大的互聯(lián)網(wǎng)資源,使用權(quán)威數(shù)據(jù)源或收錄數(shù)據(jù)相對(duì)全面準(zhǔn)確,且檢索方式友好的資源網(wǎng)站為基礎(chǔ)數(shù)據(jù)源。人工采集數(shù)據(jù)主要來(lái)源于近500家智庫(kù)機(jī)構(gòu)的官方網(wǎng)站、國(guó)家科學(xué)技術(shù)獎(jiǎng)勵(lì)工作辦公室網(wǎng)站、國(guó)家自然科學(xué)基金委和全國(guó)哲學(xué)社會(huì)科學(xué)基金規(guī)劃辦公室,以及各個(gè)省區(qū)市社科聯(lián)和科技廳的官方網(wǎng)站。自動(dòng)收集的數(shù)據(jù)主要來(lái)自于中國(guó)知網(wǎng)(CNKI)、百度新聞、百度學(xué)術(shù)、佰騰網(wǎng)、Web of Science數(shù)據(jù)庫(kù)、中國(guó)社會(huì)科學(xué)院皮書數(shù)據(jù)庫(kù)等等。此外,還會(huì)從100余家國(guó)家和地方主流報(bào)紙、期刊的官方網(wǎng)站,各個(gè)智庫(kù)機(jī)構(gòu)和智庫(kù)專家的微博中補(bǔ)充部分?jǐn)?shù)據(jù)。
5.2? 數(shù)據(jù)的完整性和準(zhǔn)確性保障機(jī)制
近年來(lái)在國(guó)家的良好政策背景下,各個(gè)智庫(kù)蓬勃發(fā)展,很多新增智庫(kù)成立時(shí)間較晚,或規(guī)模較小,或?yàn)榉欠ㄈ藛挝?,某些智?kù)的重要數(shù)據(jù)可能沒(méi)有直接與智庫(kù)名相關(guān)聯(lián),直接用智庫(kù)名稱檢索會(huì)出現(xiàn)大量數(shù)據(jù)缺失。例如國(guó)家自科基金、社科基金和國(guó)家獎(jiǎng)勵(lì)數(shù)據(jù)往往只會(huì)細(xì)化到如中國(guó)人民大學(xué)之類的高校層面,而不會(huì)明確指出如中國(guó)人民大學(xué)重陽(yáng)金融研究院之類的智庫(kù)機(jī)構(gòu)。
針對(duì)這些問(wèn)題,平臺(tái)采用:①上級(jí)法人單位名稱+專家名稱檢索標(biāo)注方法;②基于機(jī)構(gòu)同義詞詞表的檢索方法;③全數(shù)據(jù)集收集和關(guān)鍵詞匹配的方法;④主題時(shí)間過(guò)濾方法等等,以保證數(shù)據(jù)的完整性。
對(duì)所有人工錄入的數(shù)據(jù)以及機(jī)器收集的數(shù)據(jù),嚴(yán)格按照“機(jī)器抓取,人工審核”和“人工錄入,交叉審核”的兩重審核方法,確保數(shù)據(jù)的準(zhǔn)確性。平臺(tái)的具體數(shù)據(jù)來(lái)源和數(shù)據(jù)更新機(jī)制見(jiàn)表3。
中華智庫(kù)研究網(wǎng)和中華智庫(kù)研究大數(shù)據(jù)平臺(tái)持續(xù)為《中華智庫(kù)影響力報(bào)告》提供強(qiáng)有力的數(shù)據(jù)支撐。截止到2018年底,平臺(tái)收錄中國(guó)大陸和港澳臺(tái)智庫(kù)機(jī)構(gòu)近500家,主辦網(wǎng)站500余個(gè),有智庫(kù)專家8,000余位,年度新增國(guó)內(nèi)期刊論文和報(bào)紙文章數(shù)59,339篇,主流媒體采訪數(shù)據(jù)7,890篇,圖書3,860本。
6? 總結(jié)和討論
本文分析了面向智庫(kù)評(píng)價(jià)的智庫(kù)知識(shí)資源中心建設(shè)面臨的困難和挑戰(zhàn),以及平臺(tái)的設(shè)計(jì)原則,并以中華智庫(kù)研究網(wǎng)數(shù)據(jù)平臺(tái)為例,介紹智庫(kù)評(píng)價(jià)知識(shí)資源中心的建設(shè)實(shí)踐。
誠(chéng)然,目前的智庫(kù)研究百花齊放,百家爭(zhēng)鳴,一系列的研究成果不斷涌現(xiàn),但現(xiàn)在的第三方機(jī)構(gòu)進(jìn)行評(píng)價(jià)的方式天生具有的數(shù)據(jù)缺陷暫時(shí)還難以克服。智庫(kù)研究的平臺(tái)也正經(jīng)歷在探索中完善,建設(shè)中發(fā)展的階段,未來(lái)的智庫(kù)研究平臺(tái)可以從以下幾方面進(jìn)行研究建設(shè)。
6.1? 集成分類評(píng)價(jià)指標(biāo),開(kāi)展專題和特色研究
近年來(lái),智庫(kù)的評(píng)價(jià)正在由大而全的評(píng)價(jià)報(bào)告向各個(gè)分類細(xì)化,社科院智庫(kù)、高校智庫(kù)等都發(fā)布了各自體系的評(píng)價(jià)報(bào)告,如浙江工業(yè)大學(xué)的《中國(guó)大學(xué)智庫(kù)發(fā)展報(bào)告》、山東社會(huì)科學(xué)院的《地方社科院智庫(kù)意識(shí)評(píng)估報(bào)告》等。不同類型的智庫(kù)機(jī)構(gòu)由于治理結(jié)構(gòu)的不同,成果形式多樣,相應(yīng)的評(píng)價(jià)指標(biāo)也會(huì)有所區(qū)別。相應(yīng)的知識(shí)資源平臺(tái)上也要多集成一些特色的指標(biāo)體系,并支持指標(biāo)分類組合,以適應(yīng)特色評(píng)價(jià)需求。
6.2? 不斷夯實(shí)平臺(tái)的數(shù)據(jù)基礎(chǔ)
數(shù)據(jù)的完整性和準(zhǔn)確性是評(píng)價(jià)類平臺(tái)的價(jià)值所在,數(shù)據(jù)基礎(chǔ)的好壞對(duì)研究結(jié)果有很大的影響,現(xiàn)在主流智庫(kù)評(píng)價(jià)平臺(tái)主要的數(shù)據(jù)問(wèn)題是反映智庫(kù)決策影響力的建議批示等數(shù)據(jù)獲取困難,真實(shí)性較難保證。未來(lái)的解決方法是積極與國(guó)家和地方智庫(kù)建設(shè)主管部門合作,參與主管部門組織的智庫(kù)研究與評(píng)價(jià),以自上而下的方式獲得真實(shí)性更好的數(shù)據(jù)。智庫(kù)建設(shè)經(jīng)過(guò)了幾年的發(fā)展,很多主管部門也期望了解建設(shè)效果到底怎么樣,他們有評(píng)價(jià)的需求,也希望與智庫(kù)研究評(píng)價(jià)機(jī)構(gòu)進(jìn)行合作。
6.3? 擴(kuò)展個(gè)性化專題展示功能
針對(duì)國(guó)家經(jīng)濟(jì)社會(huì)發(fā)展中的重要事件和熱點(diǎn)問(wèn)題,建立專題頁(yè)面,追蹤各個(gè)智庫(kù)的專家相關(guān)成果、言論等信息。針對(duì)平臺(tái)不同用戶的需求,提供特色化個(gè)性化的服務(wù)。
總而言之,高質(zhì)量的智庫(kù)評(píng)價(jià)研究報(bào)告離不開(kāi)高質(zhì)量的基礎(chǔ)數(shù)據(jù)資源建設(shè)。而高質(zhì)量的數(shù)據(jù)資源平臺(tái)不僅僅可用于智庫(kù)研究。以資源平臺(tái)建設(shè)為基礎(chǔ),以平臺(tái)促進(jìn)智庫(kù)研究,以智庫(kù)研究成果指導(dǎo)智庫(kù)建設(shè),促進(jìn)中國(guó)特色新型智庫(kù)建設(shè)事業(yè)蓬勃發(fā)展。
參考文獻(xiàn):
[1] MICHAEL D. The think tank spectrum: For the media, some thinkers are more equal than others[EB/OL]. [2019-10-01]. https://fair.org/extra/the-think-tank-spectrum/.
[2] ABELSON D E. Old world, new world: the evolution and influence of foreign affairs think-tanks[J]. International Affairs, 2014, 90(1): 125-142.
[3] ANDREW R. Think tanks in the US media[J]. The Harvard International Journal of Press/Politics, 2000, 5(4): 81-103.
[4] 王文, 李振. 中國(guó)智庫(kù)評(píng)價(jià)體系的現(xiàn)狀與展望[J]. 智庫(kù)理論與實(shí)踐, 2016, 1(4): 20-24, 71.
[5] 朱敏, 房俊民. 智庫(kù)評(píng)價(jià)研究進(jìn)展及我國(guó)智庫(kù)評(píng)價(jià)建設(shè)[J]. 情報(bào)雜志, 2017, 36(8): 33-38, 46.
[6] 雷佳麗, 鄭軍衛(wèi). 國(guó)內(nèi)外智庫(kù)評(píng)價(jià)方法比較分析[J]. 情報(bào)理論與實(shí)踐, 2019, 42(4): 166-171.
[7] MCGANN J G. 2018 Global go to think tank index report[EB/OL]. [2019-05-14]. https://repository.upenn.edu/think_tanks/16/.
[8] 上海社會(huì)科學(xué)院智庫(kù)研究中心. 2018年中國(guó)智庫(kù)報(bào)告: 影響力排名與政策建議[EB/OL]. [2019-05-14]. http://www.pjzgzk.org.cn/upload/file/20190320/20190320110443_241.pdf.
[9] 荊林波. 中國(guó)智庫(kù)綜合評(píng)價(jià)AMI研究報(bào)告(2017)[M]. 北京: 中國(guó)社會(huì)科學(xué)出版社, 2018: 2-15.
[10] 四川省社會(huì)科學(xué)院-中國(guó)科學(xué)院成都文獻(xiàn)情報(bào)中心 中華智庫(kù)研究中心. 中華智庫(kù)影響力報(bào)告(2018)[EB/OL]. [2019-05-14]. http://www.chinesethinktanks.cn/.
[11] 方茜, 廖沖緒. 中華智庫(kù)影響力報(bào)告(2015-2017)[M]. 北京: 人民出版社, 2018: 9-12.
[12] 南京大學(xué)中國(guó)智庫(kù)研究與評(píng)價(jià)中心-光明日?qǐng)?bào)智庫(kù)研究與發(fā)布中心聯(lián)合課題組.“中國(guó)智庫(kù)索引”(CTTI)首批來(lái)源智庫(kù)及遴選過(guò)程[N]. 光明日?qǐng)?bào), 2016-12-21(16).
[13] 清華大學(xué)公共管理學(xué)院智庫(kù)研究中心. 清華大學(xué)智庫(kù)大數(shù)據(jù)報(bào)告2017 [EB/OL]. [2019-05-13]. http://www.sppm.tsinghua.edu.cn/eWebEditor/UploadFile//20180423041936218.pdf.
[14] 朱旭峰. 智庫(kù)影響力測(cè)量的多維性[N]. 學(xué)習(xí)時(shí)報(bào), 2017-04-10(6).
[15] 許鑫, 吳珊燕. 智庫(kù)知識(shí)庫(kù)的構(gòu)建研究[J]. 情報(bào)理論與實(shí)踐, 2014, 37(3): 68-72.
[16] 智庫(kù)中國(guó)[EB/OL].[2019-05-14]. http://www.china.com.cn/opinion/think/index.htm.
[17] 國(guó)務(wù)院發(fā)展研究中心. 中國(guó)智庫(kù)網(wǎng)-關(guān)于我們[EB/OL]. [2019-05-14]. http://www.chinathinktanks.org.cn/.
[18] 方茜. 基于系統(tǒng)理論的中國(guó)特色新型智庫(kù)影響力評(píng)價(jià)及特征分析[J]. 經(jīng)濟(jì)體制改革, 2018(2): 164-171.
作者貢獻(xiàn)說(shuō)明:
張? 鑫:提出研究思路,建設(shè)平臺(tái),撰寫論文;
文? 奕:指導(dǎo)平臺(tái)建設(shè),修改論文。
Abstract: [Purpose/significance] Think tank construction is a hot topic in social science, and it attracts more and more attention on how to research and evaluate think tanks scientifically and reasonably. High-quality research reports of think tanks need high-quality data support. [Method/process] Starting from the needs of research and evaluation of think tanks, this paper summarizes the main types and construction status of the knowledge resource system of think tanks at present, puts forward the difficulties and challenges of building a knowledge resource center for think tanks research, and introduces the design principles and main technologies of platform construction. [Result/conclusion] Taking Chinese Think Tank Website as an example, this paper introduces the construction of knowledge resource center for think tank and the practice of resource center supporting think tank research.
Keywords: think tank research? ? knowledge resource center? ? multi-source data fusion
收稿日期:2019-11-01? ? ? 修回日期:2019-12-13