(浙江工業(yè)大學(xué) 全球智庫(kù)研究中心,浙江 杭州 310023)
2013年4月,習(xí)近平總書(shū)記首次提出建設(shè)“中國(guó)特色新型智庫(kù)”的目標(biāo),這為中國(guó)特色新型智庫(kù)建設(shè)指明了根本方向。2015年1月,中共中央辦公廳、國(guó)務(wù)院辦公廳印發(fā)了《關(guān)于加強(qiáng)中國(guó)特色新型智庫(kù)建設(shè)的意見(jiàn)》[1],指出要建設(shè)定位明晰、特色鮮明、規(guī)模適度、布局合理的中國(guó)特色新型智庫(kù)體系,中國(guó)大學(xué)智庫(kù)建設(shè)開(kāi)始呈現(xiàn)出百花齊放的態(tài)勢(shì),這既是政府和管理部門(mén)全力推進(jìn)的結(jié)果,也是大學(xué)智庫(kù)機(jī)構(gòu)自身建設(shè)的必然要求。為了適應(yīng)新形勢(shì)對(duì)大學(xué)智庫(kù)的新要求,建立新的發(fā)展導(dǎo)向,引導(dǎo)大學(xué)智庫(kù)肩負(fù)起新的責(zé)任和使命,必須要重視現(xiàn)階段中國(guó)大學(xué)智庫(kù)建設(shè)的評(píng)價(jià)方法,構(gòu)建大學(xué)智庫(kù)評(píng)價(jià)的指標(biāo)體系,這不僅具有理論價(jià)值,更具有現(xiàn)實(shí)意義。
大學(xué)智庫(kù)是中國(guó)特色新型智庫(kù)的重要組成部分。大學(xué)智庫(kù)依托大學(xué)的學(xué)科、學(xué)術(shù)、人才及身份優(yōu)勢(shì)(獨(dú)立性、公正性、嚴(yán)謹(jǐn)性),既有一般智庫(kù)的共性,又有其獨(dú)特的個(gè)性,尤其在評(píng)價(jià)方法、評(píng)價(jià)邏輯和評(píng)價(jià)指標(biāo)等方面具有獨(dú)特性。研究大學(xué)智庫(kù)評(píng)價(jià)方法和評(píng)價(jià)指標(biāo)體系,能夠引導(dǎo)、規(guī)范中國(guó)大學(xué)智庫(kù)建設(shè)健康有序地發(fā)展。為此,以梅新林教授領(lǐng)銜的全球智庫(kù)研究中心提出了具有中國(guó)特色的大學(xué)智庫(kù)評(píng)價(jià)“三維模型”[2],即通過(guò)“契合度—活躍度—貢獻(xiàn)度”三個(gè)維度來(lái)整體評(píng)價(jià)中國(guó)大學(xué)智庫(kù)機(jī)構(gòu)的發(fā)展?fàn)顟B(tài)和建設(shè)水平。
契合度(Fitness)是評(píng)價(jià)大學(xué)智庫(kù)基本標(biāo)準(zhǔn)與任務(wù)要求滿足程度的重要維度和指標(biāo)。中國(guó)大學(xué)智庫(kù)多為學(xué)術(shù)研究機(jī)構(gòu)轉(zhuǎn)型或?qū)W科綜合而成,契合度評(píng)價(jià)能有效引導(dǎo)大學(xué)智庫(kù)逐步向?qū)嶓w性、專業(yè)化、規(guī)范化的中國(guó)特色新型智庫(kù)方向發(fā)展?;钴S度(Activity)代表大學(xué)智庫(kù)機(jī)構(gòu)和首席專家在國(guó)內(nèi)外公開(kāi)場(chǎng)合發(fā)表理論觀點(diǎn)、提供政策建議的傳播能力和頻率,進(jìn)而轉(zhuǎn)化成社會(huì)、公眾和政府影響力[3]。目前,全球最大的中文搜索引擎百度(Nasdaq:BIDU)的搜索頻度可表征特定對(duì)象的活躍度和影響力,為“互聯(lián)網(wǎng)+量化評(píng)價(jià)”提供了重要基礎(chǔ)和實(shí)現(xiàn)可能。貢獻(xiàn)度(contribution)代表大學(xué)智庫(kù)對(duì)社會(huì)產(chǎn)生的效益和影響,評(píng)價(jià)大學(xué)智庫(kù)貢獻(xiàn)度主要是關(guān)注其在治國(guó)理政、戰(zhàn)略規(guī)劃、決策咨詢、公共政策、公共外交等領(lǐng)域,在資政建言采納、理論成果研究、智庫(kù)人才培養(yǎng)方面所呈現(xiàn)的重要貢獻(xiàn)。
自2006年開(kāi)始,由詹姆斯·麥甘(James McGann)擔(dān)任主任的美國(guó)賓夕法尼亞大學(xué)“智庫(kù)與公民社會(huì)項(xiàng)目”(TTCSP)每年都會(huì)發(fā)布一份全球智庫(kù)排名報(bào)告,從“資源—效用—成果—影響力”指標(biāo)等四個(gè)維度對(duì)智庫(kù)進(jìn)行評(píng)價(jià),其報(bào)告具有一定影響力[4]。2017年,詹姆斯·麥甘研究團(tuán)隊(duì)依據(jù)全球4 750名政策制定者、新聞?dòng)浾摺⒐?私人)捐助人以及各類區(qū)域?qū)<业囊庖?jiàn)和建議,對(duì)全球175家頂級(jí)智庫(kù)進(jìn)行排名[5],這種完全主觀定性的研究方法受到學(xué)界的質(zhì)疑。正如梅新林教授所說(shuō)的,“其評(píng)價(jià)標(biāo)準(zhǔn)、評(píng)價(jià)方法尤其是智庫(kù)排名主要還是基于西方的導(dǎo)向性評(píng)價(jià)理念與標(biāo)準(zhǔn)。所以特別需要通過(guò)建構(gòu)新型智庫(kù)研究的理論模型,打造更符合中國(guó)國(guó)情和大學(xué)特征的‘中國(guó)標(biāo)準(zhǔn)’,然后通過(guò)對(duì)大學(xué)智庫(kù)、中國(guó)智庫(kù)、世界智庫(kù)的評(píng)價(jià)與排名,將承載中國(guó)特色話語(yǔ)體系的‘中國(guó)標(biāo)準(zhǔn)’推向世界”[6]。
基于“三維評(píng)價(jià)模型”的大學(xué)智庫(kù)指標(biāo)體系構(gòu)建,體現(xiàn)了“中國(guó)特色”和“中國(guó)標(biāo)準(zhǔn)”。 因?yàn)橹袊?guó)大學(xué)智庫(kù)建設(shè)正處在探索期、轉(zhuǎn)型期和過(guò)渡期,為了適應(yīng)新形勢(shì)對(duì)大學(xué)智庫(kù)的新要求,建立新的發(fā)展導(dǎo)向,引導(dǎo)大學(xué)智庫(kù)肩負(fù)起新的責(zé)任和使命,體現(xiàn)國(guó)家目標(biāo)要求和政策導(dǎo)向的目標(biāo)需要,大學(xué)智庫(kù)評(píng)價(jià)的“三維模型”需要具體的指標(biāo)體系來(lái)學(xué)理性和邏輯性地表達(dá),通過(guò)分級(jí)指標(biāo)和權(quán)重界定進(jìn)行具體量化評(píng)價(jià),并由微觀評(píng)價(jià)和觀測(cè)要點(diǎn)來(lái)落腳和加權(quán),從而體現(xiàn)“三維模型”的評(píng)價(jià)指標(biāo)體系的導(dǎo)向性、應(yīng)用性、可操作性的價(jià)值。
大學(xué)智庫(kù)評(píng)價(jià)方法和指標(biāo)體系要求各指標(biāo)之間要有一定的邏輯關(guān)系,它們不但要從不同的側(cè)面反映出大學(xué)智庫(kù)建設(shè)和發(fā)展的主要特征、狀態(tài)和內(nèi)在聯(lián)系[7],而且每一個(gè)子系統(tǒng),即一級(jí)、二級(jí)指標(biāo)和微觀測(cè)量點(diǎn),均由一組指標(biāo)構(gòu)成,各指標(biāo)之間相互獨(dú)立又彼此聯(lián)系,共同構(gòu)成一個(gè)有機(jī)統(tǒng)一體。指標(biāo)體系的構(gòu)建具有層次性,自上而下,從宏觀到微觀層層深入,形成一個(gè)不可分割的評(píng)價(jià)指標(biāo)體系。因此,體現(xiàn)“中國(guó)標(biāo)準(zhǔn)”的大學(xué)智庫(kù)評(píng)價(jià)指標(biāo)體系應(yīng)包括以下指標(biāo):(1)契合度的二級(jí)指標(biāo):(A)組織機(jī)構(gòu);(B)研究隊(duì)伍;(C)資金來(lái)源,以及三級(jí)觀測(cè)點(diǎn)指標(biāo)11個(gè)。(2)活躍度的二級(jí)指標(biāo):(A)學(xué)術(shù)交流活躍度;(B)網(wǎng)絡(luò)媒體活躍度;(C)資政建言活躍度,以及三級(jí)觀測(cè)點(diǎn)指標(biāo)13個(gè)。(3)貢獻(xiàn)度的二級(jí)指標(biāo):(A)決策咨詢;(B)學(xué)術(shù)研究;(C)人才培養(yǎng),以及三級(jí)觀測(cè)點(diǎn)指標(biāo)12個(gè)。以上指標(biāo)共同構(gòu)成一個(gè)可測(cè)度、可比較、可操作的量化指標(biāo)體系。
從理論上講,構(gòu)建評(píng)價(jià)模型、設(shè)置評(píng)價(jià)指標(biāo)、確定指標(biāo)權(quán)重是特定對(duì)象的評(píng)價(jià)研究中不可或缺的重要環(huán)節(jié)和基礎(chǔ),它對(duì)揭示評(píng)價(jià)對(duì)象的規(guī)律,解構(gòu)評(píng)價(jià)樣本的特點(diǎn),把握評(píng)價(jià)主體的狀態(tài),具有宏觀性、戰(zhàn)略性和指導(dǎo)性的意義。但是,任何理論性的評(píng)價(jià)指標(biāo)體系都會(huì)遇到評(píng)價(jià)信息、評(píng)價(jià)數(shù)據(jù)的來(lái)源問(wèn)題、落地問(wèn)題、可行性問(wèn)題、可操作性問(wèn)題,甚至反過(guò)來(lái)需要修改或修正指標(biāo)體系,使之更有效、更便捷、更客觀。而基于“三維模型”的大學(xué)智庫(kù)評(píng)價(jià)方法和指標(biāo)體系構(gòu)建后,也同樣會(huì)遇到智庫(kù)評(píng)價(jià)信息的數(shù)據(jù)采集問(wèn)題、方法問(wèn)題以及破解基礎(chǔ)數(shù)據(jù)“困境”的路徑問(wèn)題。
困境一:信息與數(shù)據(jù)不對(duì)稱、不完整。傳統(tǒng)研究和評(píng)價(jià)方法,如問(wèn)卷調(diào)查、實(shí)地調(diào)研、專題研討,不僅工作量大,難度和成本也高。由于任何評(píng)價(jià)對(duì)象都是歷史的、動(dòng)態(tài)的、發(fā)展的,人為跟蹤評(píng)價(jià)研究具有很高的難度,甚至智庫(kù)機(jī)構(gòu)提供的信息和數(shù)據(jù)也會(huì)受到數(shù)據(jù)的系統(tǒng)性和真實(shí)性之質(zhì)疑。盡管國(guó)內(nèi)智庫(kù)評(píng)價(jià)機(jī)構(gòu)也探索與設(shè)計(jì)客觀評(píng)價(jià)指標(biāo)體系,采取多輪主觀評(píng)價(jià)方法,以問(wèn)卷調(diào)查和專家評(píng)議相結(jié)合的方式開(kāi)展研究,甚至采用決策咨詢的用戶評(píng)價(jià)、同行評(píng)價(jià)與社會(huì)評(píng)價(jià)相結(jié)合的方法(見(jiàn)上海社會(huì)科學(xué)院智庫(kù)研究中心《2015年中國(guó)智庫(kù)報(bào)告——影響力排名與政策建議》),兼顧樣本“點(diǎn)”上的專業(yè)性、代表性及調(diào)查“面”上的差異性、多樣性,并取得了一些突破和進(jìn)展。如由南京大學(xué)中國(guó)智庫(kù)研究與評(píng)價(jià)中心聯(lián)合《光明日?qǐng)?bào)》智庫(kù)研究與發(fā)布中心自主研發(fā)的“中國(guó)智庫(kù)索引”系統(tǒng),在信息數(shù)據(jù)采集機(jī)制上展開(kāi)了有益的嘗試,這一系統(tǒng)可以通過(guò)智庫(kù)機(jī)構(gòu)或?qū)<易灾魈顖?bào)、工作人員手工搜集整理以及網(wǎng)絡(luò)爬蟲(chóng)自動(dòng)采集三種方式獲得智庫(kù)數(shù)據(jù),但目前還是主要依靠智庫(kù)機(jī)構(gòu)或?qū)<易灾魈顖?bào)為主,這也使得評(píng)價(jià)信息和數(shù)據(jù)出現(xiàn)不對(duì)稱、不完整的特點(diǎn),影響了全面、快速、高效、客觀地開(kāi)展智庫(kù)評(píng)價(jià)??梢?jiàn),如何有效跟蹤智庫(kù)機(jī)構(gòu)和首席專家的動(dòng)態(tài)與變化,傳統(tǒng)的社會(huì)科學(xué)研究方法仍力不從心,信息數(shù)據(jù)問(wèn)題仍然困擾研究與評(píng)價(jià)工作深入。
困境二:信息與數(shù)據(jù)海量化、碎片化。隨著互聯(lián)網(wǎng)和信息技術(shù)的發(fā)展,信息與數(shù)據(jù)的獲取方式和路徑也發(fā)生了革命性的變化,政府原有的封閉的海量信息與數(shù)據(jù)正逐步對(duì)公眾開(kāi)放,數(shù)據(jù)增長(zhǎng)正在體現(xiàn)“摩爾定律(Moore’s Law)”,即數(shù)據(jù)在未來(lái)18個(gè)月內(nèi),數(shù)據(jù)量將增加一倍。因此,今天的人們突然發(fā)現(xiàn)信息與數(shù)據(jù)“大爆炸”,數(shù)據(jù)越來(lái)越呈現(xiàn)出顆粒度小、無(wú)序性高、碎片化強(qiáng)的特點(diǎn),傳統(tǒng)研究方法顯得無(wú)能為力。各種社會(huì)科學(xué)研究包括智庫(kù)評(píng)價(jià)研究等都面臨著“堆積如山”無(wú)序化的海量數(shù)據(jù),如何快速采集、有效界定、分層遴選、判斷歸類、科學(xué)評(píng)價(jià)、實(shí)時(shí)跟蹤變成了處理信息與數(shù)據(jù)必須要面對(duì)的諸多現(xiàn)實(shí)問(wèn)題。好在大數(shù)據(jù)、云計(jì)算和人工智能等新一代信息技術(shù),為不同類型、不同體量的數(shù)據(jù)結(jié)構(gòu)化存儲(chǔ)、批量處理以及價(jià)值挖掘提供了技術(shù)支撐,也為獲得公共數(shù)據(jù)資源的“紅利”提供了技術(shù)路徑。
眾所周知,隨著信息技術(shù)和互聯(lián)網(wǎng)的快速發(fā)展,全球數(shù)據(jù)呈現(xiàn)爆發(fā)增長(zhǎng)、海量集聚的特點(diǎn),對(duì)經(jīng)濟(jì)社會(huì)產(chǎn)生了重大影響。公共數(shù)據(jù)資源作為數(shù)據(jù)中的一種,有著其特殊的地位和作用,美國(guó)國(guó)家科學(xué)院國(guó)際科技信息項(xiàng)目部主任保羅·烏勒(PaulUhlir)在給聯(lián)合國(guó)教科文組織起草《發(fā)展和促進(jìn)公共領(lǐng)域信息的政策指導(dǎo)草案》時(shí),把公共數(shù)據(jù)資源定義為“不受知識(shí)產(chǎn)權(quán)和其它法定制度限制使用以及公眾能夠有效利用而無(wú)需授權(quán)也不受制約的各種數(shù)據(jù)資源”。推動(dòng)公共數(shù)據(jù)資源整合和開(kāi)放共享,業(yè)已成為中國(guó)實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略的重要內(nèi)容,而這也為量化評(píng)價(jià)智庫(kù)提供了實(shí)現(xiàn)的基礎(chǔ)。
通過(guò)研究不難發(fā)現(xiàn),過(guò)往的智庫(kù)評(píng)價(jià)之所以偏重傳統(tǒng)的主觀定性研究,是由于開(kāi)展評(píng)價(jià)的量化研究缺少成熟的手段和方法。令人欣慰的是,新一代信息技術(shù)的發(fā)展,為在公共數(shù)據(jù)資源進(jìn)行特定對(duì)象和目標(biāo)的表征搜索與挖掘提供了可能性與可行性[8]。研究表明,大學(xué)智庫(kù)機(jī)構(gòu)和首席專家等所參與的國(guó)內(nèi)外重大活動(dòng)、論壇報(bào)告、媒體發(fā)聲、觀點(diǎn)闡述等都會(huì)轉(zhuǎn)換成網(wǎng)絡(luò)信息被大量傳播或轉(zhuǎn)發(fā)、被關(guān)注或推送、被留痕或記錄,這里包括主持和承擔(dān)的國(guó)家基金重大項(xiàng)目、政府委托的重大研究課題以及在國(guó)內(nèi)外發(fā)表的學(xué)術(shù)論文、理論觀點(diǎn),甚至包括智庫(kù)網(wǎng)站的源信息數(shù)據(jù)等,這些共同組成了公眾都可獲取的公共數(shù)據(jù)資源,它為“互聯(lián)網(wǎng)+量化評(píng)價(jià)”提供了重要基礎(chǔ)和可能[9]。我們對(duì)大學(xué)智庫(kù)評(píng)價(jià)設(shè)立“活躍度”這一維度,就是為彌補(bǔ)大學(xué)智庫(kù)信息數(shù)據(jù)不完整性的一種方法,也是希望利用公共數(shù)據(jù)信息平臺(tái),運(yùn)用大數(shù)據(jù)和云計(jì)算技術(shù)開(kāi)展大學(xué)智庫(kù)的活躍度的量化評(píng)價(jià),從而使得數(shù)據(jù)化、數(shù)字化改變傳統(tǒng)人文社會(huì)科學(xué)的評(píng)價(jià)方法成為一種可能或趨勢(shì)。
大學(xué)智庫(kù)評(píng)價(jià)研究中,一方面應(yīng)重視考察、調(diào)研、問(wèn)卷、研討等傳統(tǒng)研究方法,對(duì)大學(xué)智庫(kù)發(fā)展?fàn)顟B(tài)作出直接判斷與評(píng)價(jià);另一方面應(yīng)充分利用公共數(shù)據(jù)資源,如政府開(kāi)放的各種公共數(shù)據(jù),包括(1)國(guó)家自然科學(xué)基金、國(guó)家社會(huì)科學(xué)基金、政府決策類咨詢研究項(xiàng)目的立項(xiàng)數(shù)據(jù)庫(kù);(2)第三方數(shù)據(jù),如國(guó)內(nèi)外各類學(xué)術(shù)論文數(shù)據(jù)庫(kù),包括影響力(被引用率—quoted rate數(shù)據(jù))等;(3)大學(xué)智庫(kù)機(jī)構(gòu)網(wǎng)站(源信息與數(shù)據(jù));(4)網(wǎng)絡(luò)媒體、傳統(tǒng)媒體的數(shù)字化等信息資源和數(shù)據(jù)資源。通過(guò)對(duì)以上公共數(shù)據(jù)庫(kù)的檢索,充分利用各類搜索引擎技術(shù),不斷更新與豐富智庫(kù)的基本情況數(shù)據(jù)、智庫(kù)活動(dòng)信息、首席專家社會(huì)活動(dòng)數(shù)據(jù)(圖1),做實(shí)“契合度·活躍度·貢獻(xiàn)度”三大基礎(chǔ)數(shù)據(jù)。
1.豐富“契合度”基礎(chǔ)數(shù)據(jù)。通過(guò)問(wèn)卷、調(diào)研、考察方法,同時(shí)利用大學(xué)智庫(kù)網(wǎng)站的“源數(shù)據(jù)”特點(diǎn),收集微觀評(píng)價(jià)和觀測(cè)數(shù)據(jù),跟蹤大學(xué)智庫(kù)機(jī)構(gòu)的發(fā)展?fàn)顟B(tài),如研究平臺(tái)建設(shè)、組織架構(gòu)、數(shù)據(jù)信息處理能力和基礎(chǔ)、資政建言的渠道建設(shè)、首席專家變化、專職人員增減情況、研究經(jīng)費(fèi)來(lái)源與規(guī)模情況、運(yùn)營(yíng)經(jīng)費(fèi)來(lái)源與數(shù)量變化等數(shù)據(jù)。
2.采集“活躍度”基礎(chǔ)數(shù)據(jù)。眾所周知,百度(Nasdaq:BIDU)是全球最大的中文搜索引擎,中國(guó)市場(chǎng)占有率達(dá)90%,百度搜索頻度可表征特定對(duì)象的活躍度和影響力。采用大數(shù)據(jù)、云計(jì)算和AI技術(shù),從公共數(shù)據(jù)資源中,對(duì)大學(xué)智庫(kù)機(jī)構(gòu)和首席專家,進(jìn)行總量搜索、年度搜索、月度搜索,獲得“活躍度”評(píng)估的基礎(chǔ)數(shù)據(jù)。搜索的內(nèi)容包含大學(xué)智庫(kù)機(jī)構(gòu)和首席專家發(fā)布的咨詢報(bào)告,參與的咨政活動(dòng),開(kāi)展的學(xué)術(shù)交流、國(guó)際合作以及在各類媒體上的智庫(kù)發(fā)聲等。
3.搜索“貢獻(xiàn)度” 基礎(chǔ)數(shù)據(jù)。運(yùn)用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)(Zoology)進(jìn)行定向搜索、精度搜索、持續(xù)搜索,通過(guò)快速收集、清洗過(guò)濾、價(jià)值判斷、分類儲(chǔ)存等手段,提供客觀、豐富、實(shí)時(shí)的基礎(chǔ)數(shù)據(jù),如領(lǐng)導(dǎo)批示數(shù)量與層級(jí)、資政建言的成效、參與政策制定和規(guī)劃研究的層級(jí)、科研項(xiàng)目數(shù)量與層級(jí)、國(guó)內(nèi)外論文與專著發(fā)表情況、研究成果獲獎(jiǎng)層級(jí)與數(shù)量、智庫(kù)人才培養(yǎng)與國(guó)際培訓(xùn)等數(shù)據(jù)。
信息與數(shù)據(jù)是一組既有聯(lián)系又有區(qū)別的概念,數(shù)據(jù)是信息的表現(xiàn)形式和載體,信息是數(shù)據(jù)的內(nèi)涵。數(shù)據(jù)和信息是不可分離的,信息依賴數(shù)據(jù)來(lái)表達(dá),數(shù)據(jù)的最終目標(biāo)是為傳遞特定的信息。要形成豐富、真實(shí)、全面的大學(xué)智庫(kù)評(píng)價(jià)基礎(chǔ),有賴于數(shù)據(jù)的收集、存儲(chǔ)、歸類、運(yùn)算,最后得到評(píng)價(jià)所需的各類信息。
大學(xué)智庫(kù)數(shù)據(jù)采集有“兩條路徑”:(1)采用API (Application Programming Interface)采集,以“大數(shù)據(jù)”為代表的數(shù)據(jù)資源,來(lái)源更加廣泛,數(shù)據(jù)粒度更小,記錄單元更加碎片化。但云計(jì)算技術(shù)可從相關(guān)性中快速獲得有價(jià)值的數(shù)據(jù)挖掘,從而獲得特定大學(xué)智庫(kù)機(jī)構(gòu)或首席專家的重要信息和數(shù)據(jù)。(2)網(wǎng)絡(luò)爬蟲(chóng)技術(shù)(Zoology)是一種自動(dòng)獲取網(wǎng)頁(yè)內(nèi)容的程序,是搜索引擎的重要組成部分,可實(shí)時(shí)、定向搜索大學(xué)智庫(kù)信息和數(shù)據(jù),將一定數(shù)量信息和數(shù)據(jù)存儲(chǔ)在云池(HDFS),再經(jīng)人工方式的定性分析和價(jià)值判斷,分類進(jìn)入大學(xué)智庫(kù)研究的數(shù)據(jù)庫(kù)系統(tǒng)(圖2)。
基于云計(jì)算架構(gòu)的公共數(shù)據(jù)的Hadoop采集與挖掘及跟蹤分析平臺(tái),首先將公共數(shù)據(jù)資源中搜索和獲得的大學(xué)智庫(kù)數(shù)據(jù)進(jìn)行清理、轉(zhuǎn)換、加載等預(yù)處理,再通過(guò)數(shù)據(jù)挖掘、價(jià)值判斷、分類處置,為智庫(kù)評(píng)價(jià)提供數(shù)據(jù)分析基礎(chǔ)和依據(jù)。Hadoop是一個(gè)由Apache基金會(huì)所開(kāi)發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu)。Hadoop的優(yōu)點(diǎn)是在用戶不了解分布式底層細(xì)節(jié)的情況下,開(kāi)發(fā)分布式程序。Hadoop基礎(chǔ)架構(gòu)最核心的設(shè)計(jì)就是:HDFS和MapReduce。HDFS為海量的數(shù)據(jù)提供了存儲(chǔ),MapReduce為海量的數(shù)據(jù)提供了計(jì)算。
大學(xué)智庫(kù)數(shù)據(jù)庫(kù)系統(tǒng)建設(shè)是一項(xiàng)基礎(chǔ)性、建設(shè)性和創(chuàng)新性的工作,數(shù)據(jù)庫(kù)建設(shè)本身也是一個(gè)不斷豐富、充實(shí)、完善和發(fā)展的過(guò)程。數(shù)據(jù)庫(kù)不僅需要容量大、速度快、便于統(tǒng)計(jì)與計(jì)算,而且需要一個(gè)開(kāi)放、共建、共享的平臺(tái)和載體。構(gòu)建基于Wiki技術(shù)之上的數(shù)據(jù)庫(kù)系統(tǒng)具有眾多優(yōu)點(diǎn),可作為中國(guó)大學(xué)智庫(kù)建設(shè)的一種可行方案。
眾所周知,維基(Wiki)的發(fā)明者是沃德·坎寧安(Ward Cunningham),世界上第一個(gè)維基(Wiki)網(wǎng)站就是由他在1995年建立的。維基(Wiki)是指一種超文本的編輯系統(tǒng),這種超文本系統(tǒng)支持面向社群的協(xié)作式寫(xiě)作,利用這一技術(shù)可以實(shí)現(xiàn)在Web的基礎(chǔ)上對(duì)文本的瀏覽、創(chuàng)建、更改操作,這一技術(shù)的最大優(yōu)勢(shì)是只要具備基本的Web瀏覽和文字錄入技能的人都能輕松、熟練的使用,并可以多人同時(shí)在線錄入和修改,提升了大學(xué)智庫(kù)數(shù)據(jù)庫(kù)的建設(shè)效率,降低了建設(shè)成本,縮短了建設(shè)周期。利用Wiki技術(shù)在數(shù)據(jù)分析中的快捷、易用、方便、開(kāi)放、實(shí)時(shí)、可擴(kuò)展等特點(diǎn),構(gòu)建基于維基百科(Wikipedia)的大學(xué)智庫(kù)數(shù)據(jù)庫(kù),形成“四大專題數(shù)據(jù)庫(kù)”:(1)評(píng)價(jià)指標(biāo)庫(kù);(2)績(jī)效數(shù)據(jù)庫(kù);(3)數(shù)據(jù)內(nèi)容庫(kù);(4)信息資源庫(kù)。研究團(tuán)隊(duì)可基于標(biāo)準(zhǔn)化、規(guī)范化、數(shù)據(jù)化的要求,添加、移動(dòng)和編輯常態(tài)化數(shù)據(jù)內(nèi)容,在不需要了解HTML和其他編碼語(yǔ)言的多人協(xié)作下構(gòu)建大學(xué)智庫(kù)數(shù)據(jù)庫(kù),從而實(shí)現(xiàn)大學(xué)智庫(kù)數(shù)據(jù)的共建和共享,為遴選、評(píng)價(jià)、比較大學(xué)智庫(kù)發(fā)展?fàn)顟B(tài)提供堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。
浙江工業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2018年2期