亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        智庫(kù)信息組織策略及其在大數(shù)據(jù)環(huán)境下的挑戰(zhàn)*

        2017-08-07 10:31:19安楠祝忠明
        智庫(kù)理論與實(shí)踐 2017年3期
        關(guān)鍵詞:知識(shí)庫(kù)智庫(kù)本體

        ■ 安楠祝忠明

        1中國(guó)科學(xué)院蘭州文獻(xiàn)情報(bào)中心 蘭州 7300002中國(guó)科學(xué)院大學(xué) 北京 100049

        智庫(kù)信息組織策略及其在大數(shù)據(jù)環(huán)境下的挑戰(zhàn)*

        ■ 安楠1,2祝忠明1

        1中國(guó)科學(xué)院蘭州文獻(xiàn)情報(bào)中心 蘭州 7300002中國(guó)科學(xué)院大學(xué) 北京 100049

        [目的/意義]高水平的新型智庫(kù)離不開(kāi)高水平的信息支持機(jī)制,大數(shù)據(jù)時(shí)代背景下傳統(tǒng)的智庫(kù)信息組織機(jī)制已無(wú)法適應(yīng)當(dāng)前的數(shù)據(jù)特征及決策要求,構(gòu)建支持決策過(guò)程的知識(shí)庫(kù)已成為智庫(kù)發(fā)展的必然趨勢(shì)。[方法/過(guò)程]本文選取《全球智庫(kù)報(bào)告2016》中具有參考價(jià)值的國(guó)外智庫(kù)機(jī)構(gòu)作為研究對(duì)象,應(yīng)用文獻(xiàn)調(diào)研法和案例分析法總結(jié)歸納了目前智庫(kù)常見(jiàn)的信息組織方式,分析了大數(shù)據(jù)下數(shù)據(jù)價(jià)值鏈及其對(duì)組織環(huán)節(jié)的要求,并據(jù)此提出智庫(kù)知識(shí)庫(kù)構(gòu)建的必要性。[結(jié)果/結(jié)論]最終提出一個(gè)通用的面向決策過(guò)程的智庫(kù)知識(shí)庫(kù)框架,并采用語(yǔ)義本體方法構(gòu)建了知識(shí)庫(kù)內(nèi)部的知識(shí)組織模型,以期為智庫(kù)在大數(shù)據(jù)下逐漸實(shí)現(xiàn)半自動(dòng)到自動(dòng)化的決策研究過(guò)程提供參考借鑒。

        智庫(kù) 知識(shí)庫(kù) 大數(shù)據(jù) 信息組織 組織策略 決策研究 本體

        1 引言

        智庫(kù)是公共政策的研究分析和參與機(jī)構(gòu),針對(duì)國(guó)內(nèi)、國(guó)際問(wèn)題開(kāi)展政策導(dǎo)向性的研究、分析和咨詢,以使得政策制定者和公眾能夠依據(jù)可靠的信息進(jìn)行決策[1]。其主要作用是為決策制定者提供及時(shí)、全面、準(zhǔn)確的支持信息,支持信息的范圍、數(shù)量、質(zhì)量、服務(wù)內(nèi)容、服務(wù)方式等都將直接影響到?jīng)Q策制定的效果[2],因此擁有完善的信息支持機(jī)制是智庫(kù)產(chǎn)生高質(zhì)量決策咨詢成果的重要保障。

        大數(shù)據(jù)時(shí)代信息呈現(xiàn)出體量巨大、形式繁多、更新速度快及價(jià)值密度低的4V數(shù)據(jù)特征[3-4],在這種數(shù)據(jù)爆炸的形勢(shì)下,任何研究過(guò)程都呈現(xiàn)出一種數(shù)據(jù)驅(qū)動(dòng)的趨勢(shì),如何從海量信息中及時(shí)發(fā)現(xiàn)、提取有價(jià)值的知識(shí)為自己所用,將成為影響智庫(kù)決策研究過(guò)程及產(chǎn)出效率的關(guān)鍵。

        大數(shù)據(jù)驅(qū)動(dòng)下的智庫(kù)決策研究必須解決以下兩個(gè)問(wèn)題:一是如何構(gòu)建一個(gè)統(tǒng)一的數(shù)據(jù)模型,使得任何大數(shù)據(jù)資源都能夠通過(guò)該數(shù)據(jù)模型的加工處理最終成為可支持決策研究的智能數(shù)據(jù),逐漸實(shí)現(xiàn)半自動(dòng)到自動(dòng)化的決策研究過(guò)程。二是如何針對(duì)決策研究過(guò)程對(duì)各種來(lái)源各種形式的相關(guān)信息進(jìn)行語(yǔ)義化處理,加強(qiáng)數(shù)據(jù)之間的關(guān)聯(lián)以提升知識(shí)發(fā)現(xiàn)的能力,為決策者提供更有價(jià)值的政策參考信息。因此,本文將圍繞大數(shù)據(jù)分析能力需求及智庫(kù)決策研究過(guò)程嘗試構(gòu)建支持多源異構(gòu)的數(shù)據(jù)集成框架,為語(yǔ)義化地建造支持大數(shù)據(jù)情報(bào)處理和分析的智能數(shù)據(jù)集提供統(tǒng)一的概念模型。

        2 智庫(kù)信息組織機(jī)制現(xiàn)狀研究

        智庫(kù)如何對(duì)數(shù)據(jù)內(nèi)容進(jìn)行組織加工將直接影響到研究人員與情報(bào)專家對(duì)信息資源的利用效率,科學(xué)合理的組織方式不僅能提高數(shù)據(jù)存取效率,更有助于挖掘數(shù)據(jù)中的潛在價(jià)值信息,產(chǎn)生增值效應(yīng)。

        2.1 國(guó)外智庫(kù)信息組織機(jī)制發(fā)展現(xiàn)狀

        現(xiàn)代意義上的智庫(kù)最早形成于二戰(zhàn)時(shí)期的西方國(guó)家,相比我國(guó),西方國(guó)家無(wú)論在智庫(kù)研究領(lǐng)域還是智庫(kù)自身建設(shè)方面都已發(fā)展得相對(duì)完善,選取西方有影響力的智庫(kù)作為研究對(duì)象將更具代表性。本文依據(jù)賓大《全球智庫(kù)報(bào)告2016》的綜合排名及各項(xiàng)領(lǐng)域排名,選取了排名靠前的十余家具有代表性的國(guó)外智庫(kù)作為研究對(duì)象(見(jiàn)表1),通過(guò)對(duì)其官方網(wǎng)站上信息資源的展示方式以及可獲取的各種類(lèi)型智庫(kù)產(chǎn)品的調(diào)研,對(duì)其信息組織策略進(jìn)行了分析。

        表1 調(diào)研涉及的國(guó)外智庫(kù)Table 1 Foreign think tanks involved in the research

        通過(guò)調(diào)研比較與分析,歸納了西方智庫(kù)機(jī)構(gòu)常見(jiàn)的信息搜集及組織策略(見(jiàn)圖1),總結(jié)了當(dāng)前西方智庫(kù)信息支持機(jī)制的發(fā)展現(xiàn)狀。在智庫(kù)的信息搜集策略中,主要以需要較多依靠人工參與的手動(dòng)采集和半自動(dòng)采集為主,其中搜集公開(kāi)數(shù)據(jù)以其可操作性較強(qiáng)、數(shù)據(jù)范圍廣、相對(duì)成本低等特點(diǎn)成為智庫(kù)最常用的信息搜集方式之一,幾乎所有上述智庫(kù)都將通過(guò)互聯(lián)網(wǎng)獲取公開(kāi)數(shù)據(jù)作為數(shù)據(jù)搜集的最常規(guī)途徑。此外因智庫(kù)研究的實(shí)時(shí)性和新穎性,智庫(kù)經(jīng)常對(duì)所需數(shù)據(jù)有特殊要求或涉及到諸如戰(zhàn)爭(zhēng)形勢(shì)、行為科學(xué)、藥物病理等特定項(xiàng)目,沒(méi)有完全適用的數(shù)據(jù)或先前數(shù)據(jù)參考價(jià)值不大,因此智庫(kù)研究人員還需通過(guò)直接生產(chǎn)創(chuàng)造途徑作為對(duì)間接搜集獲取途徑的補(bǔ)充,其中文獻(xiàn)調(diào)查法因其低成本且易開(kāi)展成為使用頻率最高的直接獲取數(shù)據(jù)方式,例如美國(guó)布魯金斯學(xué)會(huì)、胡佛研究所、卡內(nèi)基國(guó)際和平基金會(huì)等老牌智庫(kù)在傳統(tǒng)調(diào)研運(yùn)用中都是最典型的代表。當(dāng)然,在調(diào)查研究過(guò)程中智庫(kù)專家經(jīng)常不拘泥于某種特定方法,而是各種方法相互交錯(cuò)、靈活運(yùn)用。依據(jù)內(nèi)容的組織形式,搜集到的信息資源可被組織為數(shù)據(jù)庫(kù)、信息檢索系統(tǒng)、知識(shí)庫(kù)3種形式(詳見(jiàn)圖1)。

        2.1.1 數(shù)據(jù)庫(kù)(數(shù)據(jù)集) 對(duì)于智庫(kù)通過(guò)直接或間接途徑搜集到的數(shù)據(jù),組織方式之一就是將其結(jié)構(gòu)化為數(shù)據(jù)庫(kù)或數(shù)據(jù)集,這種結(jié)構(gòu)化數(shù)據(jù)形式的優(yōu)點(diǎn)是便于管理、共享性高、冗余度低、容易擴(kuò)充。

        布魯蓋爾國(guó)際經(jīng)濟(jì)研究所(Bruegel)是一家專注于國(guó)際經(jīng)濟(jì)政策研究的智庫(kù),其將關(guān)于政策經(jīng)濟(jì)的7個(gè)專業(yè)數(shù)據(jù)集對(duì)外開(kāi)放[5],包括(1)全球及地區(qū)基尼系數(shù);(2)歐元區(qū)貨幣總量Divisia指數(shù);(3)178個(gè)國(guó)家的實(shí)際有效匯率;(4)全球經(jīng)濟(jì)下的歐洲企業(yè):外部競(jìng)爭(zhēng)下的內(nèi)部政策;(5)持有的主權(quán)債券;(6)歐元體系流動(dòng)性;(7)在PATSTAT應(yīng)用程序上基于回歸的記錄鏈接。斯德哥爾摩國(guó)際和平研究所(SIPRI)以其對(duì)全球安全問(wèn)題權(quán)威性的評(píng)估享譽(yù)世界,SIPRI所有研究的根據(jù)和來(lái)源均完全開(kāi)放,因此其研究成果成為國(guó)際政治家、研究人員及媒體人員經(jīng)常使用的權(quán)威性資料來(lái)源。SIPRI擁有4個(gè)專業(yè)數(shù)據(jù)庫(kù):(1)多邊和平行動(dòng)數(shù)據(jù)庫(kù);(2)軍費(fèi)開(kāi)支數(shù)據(jù)庫(kù);(3)武器轉(zhuǎn)讓數(shù)據(jù)庫(kù);(4)軍需工業(yè)數(shù)據(jù)庫(kù)。此外,SIPRI還全面掌握了關(guān)于軍備控制和裁軍的數(shù)據(jù)集[6],包括軍火禁運(yùn)報(bào)告、國(guó)家軍火報(bào)告、全球軍火貿(mào)易價(jià)值報(bào)告等等,這些專業(yè)數(shù)據(jù)庫(kù)對(duì)SIPRI的研究活動(dòng)提供了強(qiáng)有力的信息支持。

        圖1 國(guó)外智庫(kù)信息支持策略Figure 1 Information support strategies of foreign think tanks

        2.1.2 信息檢索系統(tǒng) 一個(gè)機(jī)構(gòu)信息檢索系統(tǒng)的完善程度也可以直接反映出其信息組織的好壞,對(duì)于智庫(kù)來(lái)說(shuō),強(qiáng)大的檢索系統(tǒng)不僅能從內(nèi)部為研究專家提供高效率的數(shù)據(jù)支持,同時(shí)為用戶快速準(zhǔn)確地獲取所需信息提供了便利。

        卡內(nèi)基國(guó)際和平基金會(huì)提供了簡(jiǎn)潔易用的站內(nèi)檢索系統(tǒng),用戶可選擇精確匹配或任意匹配的方式對(duì)題名、作者名或全文進(jìn)行檢索,檢索結(jié)果可通過(guò)文檔類(lèi)型、發(fā)表年份、地區(qū)、主題、項(xiàng)目進(jìn)一步篩選,并可按照日期或相關(guān)度對(duì)結(jié)果進(jìn)行排序。蘭德公司的檢索系統(tǒng)功能相對(duì)完善,用戶可以通過(guò)關(guān)鍵詞匹配、額外屬性、文檔特征等多種檢索條件進(jìn)行限定,額外屬性包括頁(yè)面標(biāo)題、所屬蘭德部門(mén)、內(nèi)容類(lèi)型、起始日期等,文檔特征涵蓋了題名、作者、主題、ISBN等,用以快速定位到相關(guān)資源。美國(guó)中央情報(bào)局(CIA)作為美國(guó)乃至世界著名的情報(bào)機(jī)構(gòu)之一,力求對(duì)海量情報(bào)進(jìn)行科學(xué)管理使其效果得到最大程度發(fā)揮,這也令CIA成為情報(bào)機(jī)構(gòu)中進(jìn)行信息資源管理與增值的典范。CIA的解密檔案檢索系統(tǒng)在對(duì)檔案材料進(jìn)行數(shù)字化保存時(shí)采用了元數(shù)據(jù)方法(見(jiàn)表2),統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)將海量信息資源進(jìn)行科學(xué)歸類(lèi),同時(shí)能夠?qū)⑽谋?、音視頻等不同類(lèi)型的媒介資源進(jìn)行有機(jī)融合,使其在同一個(gè)存取體系內(nèi)進(jìn)行統(tǒng)一檢索,極大提高了信息利用效率。

        表2 CIA解密文檔檢索系統(tǒng)元數(shù)據(jù)Table 2 Metadata of CIA decrypted document retrieval system

        2.1.3 知識(shí)庫(kù) 在信息環(huán)境中知識(shí)庫(kù)(knowledge repository)可以被定義為一個(gè)組織圍繞特定應(yīng)用目的(如支持科研、教育或管理過(guò)程等)建立的知識(shí)集合。一般地,知識(shí)庫(kù)有兩種基本的類(lèi)型:領(lǐng)域/專題知識(shí)庫(kù)和機(jī)構(gòu)知識(shí)庫(kù)。前者收集、組織和傳播特定學(xué)科領(lǐng)域或主題的知識(shí)內(nèi)容,后者主要提供對(duì)一個(gè)機(jī)構(gòu)產(chǎn)出的知識(shí)進(jìn)行保存和傳播管理的服務(wù)。知識(shí)庫(kù)作為一種存儲(chǔ)、組織和管理數(shù)字知識(shí)的機(jī)制,在科研領(lǐng)域已經(jīng)有著較為廣泛的應(yīng)用,然而在智庫(kù)等決策咨詢機(jī)構(gòu)中的應(yīng)用還尚不成熟,相當(dāng)一部分智庫(kù)由于資金、資源等原因或者還沒(méi)有意識(shí)構(gòu)建智庫(kù)內(nèi)部的知識(shí)庫(kù),仍停留在信息“存儲(chǔ)庫(kù)”的階段。

        本文結(jié)合之前已有的研究[7],通過(guò)調(diào)研從館藏建設(shè)、情報(bào)搜集、技術(shù)支持3個(gè)方面對(duì)比分析了美國(guó)蘭德公司(RAND)和德國(guó)國(guó)際和安全事務(wù)研究所(SWP)在知識(shí)庫(kù)建設(shè)過(guò)程中的情況(見(jiàn)表3),通過(guò)分析可以看出,RAND和SWP都非常重視對(duì)信息資源的建設(shè),內(nèi)部館藏豐富,數(shù)據(jù)庫(kù)內(nèi)容涉及廣泛。在知識(shí)組織方面均采用了分類(lèi)組織的方式,依據(jù)研究主題建立專題知識(shí)庫(kù),同時(shí)也選擇地區(qū)作為研究項(xiàng)目分類(lèi)的依據(jù)。兩大智庫(kù)均通過(guò)技術(shù)手段開(kāi)發(fā)了信息支持系統(tǒng),并且都積極嘗試與其他機(jī)構(gòu)部門(mén)開(kāi)展信息資源共享、信息共建等合作,以彌補(bǔ)自身專業(yè)缺陷,同時(shí)能減少數(shù)據(jù)冗余。

        表3 RAND與SWP知識(shí)庫(kù)構(gòu)建情況對(duì)比Table 3 Comparison of knowledge repositories between RAND and SWP

        2.2 大數(shù)據(jù)時(shí)代對(duì)智庫(kù)信息組織的挑戰(zhàn)

        由調(diào)研可以看出,雖然當(dāng)下全球各大智庫(kù)的信息支持機(jī)制已發(fā)展得較為全面,但是仍存在很多不足。一方面,以數(shù)據(jù)庫(kù)/數(shù)據(jù)集形式組織起來(lái)的信息之間是相對(duì)獨(dú)立的,即使數(shù)據(jù)庫(kù)對(duì)所存儲(chǔ)的信息會(huì)從主題或其他特征進(jìn)行大致分類(lèi),但在更細(xì)粒度層面的數(shù)據(jù)上,數(shù)據(jù)之間彼此獨(dú)立,缺乏必要的關(guān)聯(lián),不利于智庫(kù)在進(jìn)行數(shù)據(jù)挖掘和數(shù)據(jù)分析時(shí)對(duì)潛在知識(shí)的發(fā)現(xiàn)。此外,這種數(shù)據(jù)相互獨(dú)立的信息組織方式?jīng)]有基于上下文(context-based)的聯(lián)系,缺乏語(yǔ)境化和情景化的知識(shí)應(yīng)用,即針對(duì)同一概念在不同情景下的理解能力較弱。另一方面,在以信息檢索系統(tǒng)形式組織信息的智庫(kù)中,絕大部分僅僅標(biāo)注了信息的外延,并沒(méi)有針對(duì)信息內(nèi)容進(jìn)行更深層的語(yǔ)義化標(biāo)注,不利于計(jì)算機(jī)對(duì)數(shù)據(jù)信息的理解以及智庫(kù)決策過(guò)程自動(dòng)化的發(fā)展,這在大數(shù)據(jù)時(shí)代智庫(kù)對(duì)國(guó)際形勢(shì)響應(yīng)速度要求越來(lái)越高的情況下顯然已經(jīng)阻礙了智庫(kù)的決策產(chǎn)出效率。為了能夠?qū)⒋髷?shù)據(jù)中的無(wú)意義數(shù)據(jù)加工為可支持決策研究的智能數(shù)據(jù),各種信息必須從非結(jié)構(gòu)化的、彼此獨(dú)立存在的粗粒度數(shù)據(jù)被加工成結(jié)構(gòu)化的、計(jì)算機(jī)可操作的、相互關(guān)聯(lián)的、具有上下文語(yǔ)境的細(xì)粒度數(shù)據(jù)。

        全球知名咨詢公司麥肯錫最早提出了“大數(shù)據(jù)”時(shí)代的到來(lái),大數(shù)據(jù)時(shí)代各種數(shù)字資源急劇增長(zhǎng),逐漸成為信息資源的主流。面對(duì)大數(shù)據(jù)的4V特征,傳統(tǒng)的智庫(kù)信息支持機(jī)制已無(wú)法高效處理如此海量的異構(gòu)數(shù)據(jù),如何有效地從紛雜的數(shù)據(jù)中獲取有價(jià)值的信息,如何對(duì)采集到的海量信息進(jìn)行科學(xué)的管理和組織,并以此為用戶提供迅速、準(zhǔn)確的服務(wù),這些問(wèn)題要求新型智庫(kù)必須及時(shí)調(diào)整對(duì)數(shù)據(jù)的采集、存儲(chǔ)及組織策略以適應(yīng)當(dāng)前的大數(shù)據(jù)特征。 T.Gustafson和D.Fink于2013年提出“大數(shù)據(jù)價(jià)值鏈”的概念[8],認(rèn)為每條大數(shù)據(jù)價(jià)值鏈簡(jiǎn)化后都至少應(yīng)由4個(gè)基本階段組成:數(shù)據(jù)獲取—數(shù)據(jù)存儲(chǔ)—數(shù)據(jù)分析—數(shù)據(jù)應(yīng)用。智庫(kù)作為知識(shí)組織型機(jī)構(gòu),其決策研究及決策產(chǎn)出過(guò)程實(shí)際上也是一個(gè)知識(shí)增值的過(guò)程。基于此,提出大數(shù)據(jù)環(huán)境下的智庫(kù)數(shù)據(jù)價(jià)值鏈(如圖2),智庫(kù)數(shù)據(jù)價(jià)值鏈反映了智庫(kù)決策研究及產(chǎn)出的各個(gè)階段圍繞數(shù)據(jù)進(jìn)行的活動(dòng),而大數(shù)據(jù)則對(duì)各環(huán)節(jié)提出了要求。

        與一般依賴計(jì)算機(jī)自動(dòng)化抽取、處理并分析大數(shù)據(jù)得到結(jié)果的商業(yè)化研究的數(shù)據(jù)價(jià)值鏈不同,智庫(kù)數(shù)據(jù)價(jià)值鏈進(jìn)行知識(shí)增值的過(guò)程是一個(gè)基于前者對(duì)大數(shù)據(jù)的充分處理和組織后,作為決策研究的支持?jǐn)?shù)據(jù)提供給智庫(kù)專家,與智庫(kù)專家的隱形知識(shí)共同作用最后形成智庫(kù)產(chǎn)品的過(guò)程。在這種數(shù)據(jù)驅(qū)動(dòng)的決策過(guò)程下,最終提供給智庫(kù)專家的支撐數(shù)據(jù)的及時(shí)性、全面性、準(zhǔn)確性以及數(shù)據(jù)組織完善程度都將直接影響到最后智庫(kù)產(chǎn)品的產(chǎn)出效率和質(zhì)量。

        圖2 大數(shù)據(jù)環(huán)境下的智庫(kù)數(shù)據(jù)價(jià)值鏈Figure 2 The data value chain of think tanks in the context of big data

        從智庫(kù)數(shù)據(jù)價(jià)值鏈中對(duì)各環(huán)節(jié)的要求可以看出,大數(shù)據(jù)時(shí)代對(duì)傳統(tǒng)智庫(kù)研究的一系列流程都產(chǎn)生了影響,其中最關(guān)鍵的應(yīng)是處于中間環(huán)節(jié)的數(shù)據(jù)組織階段。作為承前啟后的中間環(huán)節(jié),智庫(kù)在開(kāi)展數(shù)據(jù)組織工作時(shí)既要適應(yīng)之前智庫(kù)從各種數(shù)據(jù)源采集的復(fù)雜數(shù)據(jù)類(lèi)型,又需為后續(xù)進(jìn)行存儲(chǔ)及數(shù)據(jù)分析要使用的技術(shù)和工具提前做好相應(yīng)準(zhǔn)備。綜上,大數(shù)據(jù)環(huán)境下智庫(kù)需要一個(gè)能夠結(jié)合管理手段和信息技術(shù)對(duì)捕獲并保存的信息進(jìn)行有效組織和管理的信息支持系統(tǒng),即智庫(kù)知識(shí)庫(kù)。

        3 基于本體的智庫(kù)知識(shí)庫(kù)數(shù)據(jù)集成框架

        智庫(kù)知識(shí)庫(kù)[9](Knowledge Repository)泛指支持和服務(wù)于智庫(kù)運(yùn)作的知識(shí)庫(kù)系統(tǒng),是智庫(kù)知識(shí)能力建設(shè)的重要機(jī)制。圍繞智庫(kù)研究和服務(wù)的決策領(lǐng)域,進(jìn)行相關(guān)知識(shí)內(nèi)容的收集、保存、組織和提供服務(wù),是智庫(kù)知識(shí)庫(kù)的首要任務(wù);同時(shí),發(fā)布和傳播智庫(kù)自身產(chǎn)出的決策咨詢產(chǎn)品也是智庫(kù)知識(shí)庫(kù)的重要功能。因此,智庫(kù)知識(shí)庫(kù)兼具領(lǐng)域知識(shí)庫(kù)和機(jī)構(gòu)知識(shí)庫(kù)的雙重屬性和功能——既是智庫(kù)正常運(yùn)作及決策產(chǎn)品產(chǎn)出的重要信息支撐工具,也是智庫(kù)有效管理并利用其知識(shí)資產(chǎn)的工具。

        實(shí)現(xiàn)信息的語(yǔ)義化是大數(shù)據(jù)環(huán)境下智庫(kù)數(shù)據(jù)組織環(huán)節(jié)的首要目標(biāo)。通過(guò)分析與總結(jié)相關(guān)文獻(xiàn)[10-11],本文針對(duì)智庫(kù)知識(shí)庫(kù)構(gòu)建了一個(gè)基于決策支持本體的數(shù)據(jù)集成框架(如圖3),該框架依次按照數(shù)據(jù)資源→數(shù)據(jù)集→文檔→實(shí)體4個(gè)層次對(duì)大數(shù)據(jù)資源粒度由粗到細(xì)進(jìn)行描述和組織,描繪了大數(shù)據(jù)環(huán)境下不同來(lái)源不同類(lèi)型的數(shù)據(jù)信息經(jīng)過(guò)信息抽取后在智庫(kù)知識(shí)庫(kù)中被進(jìn)一步語(yǔ)義化處理,最終都轉(zhuǎn)化為可用于支持決策研究的“智能數(shù)據(jù)”的過(guò)程。智能數(shù)據(jù)是指通過(guò)對(duì)海量數(shù)據(jù)進(jìn)行處理分析后,從數(shù)據(jù)中提取出有價(jià)值的信息和知識(shí),使數(shù)據(jù)具有“智能”,相比大數(shù)據(jù)的“大”而言,智能數(shù)據(jù)擁有更高的數(shù)據(jù)價(jià)值,更值得進(jìn)行深入挖掘,可通過(guò)建立模型尋求現(xiàn)有問(wèn)題的解決方案或進(jìn)行預(yù)測(cè),“啤酒+尿布”就是一個(gè)典型的智能數(shù)據(jù)應(yīng)用案例。該數(shù)據(jù)集成框架的信息處理過(guò)程主要包含了以下5個(gè)階段:信息抽取階段、數(shù)據(jù)存儲(chǔ)階段、數(shù)據(jù)準(zhǔn)備階段、語(yǔ)義數(shù)據(jù)模型和決策應(yīng)用階段。

        圖3 基于決策支持本體的數(shù)據(jù)集成框架Figure 3 Data integration framework based on decision support ontology

        3.1 信息抽取階段

        這是智庫(kù)對(duì)大數(shù)據(jù)環(huán)境下信息資源進(jìn)行語(yǔ)義化處理過(guò)程的第一步,主要是從適當(dāng)?shù)男畔⒃粗谐槿∠嚓P(guān)數(shù)據(jù)資料,信息源可以是從外界自動(dòng)抓取數(shù)據(jù)的外部信息源,也可以是從內(nèi)部機(jī)構(gòu)人員處收集成果的內(nèi)部信息源。針對(duì)信息資源格式的不同,可以將抽取過(guò)程分為結(jié)構(gòu)化抽取和非結(jié)構(gòu)化抽取兩部分進(jìn)行,并分別存儲(chǔ)在不同類(lèi)型的存儲(chǔ)庫(kù)中。

        3.2 數(shù)據(jù)存儲(chǔ)階段

        將上一階段從智庫(kù)機(jī)構(gòu)內(nèi)部和外部數(shù)據(jù)源搜集到的數(shù)據(jù)進(jìn)行保存。針對(duì)數(shù)據(jù)的類(lèi)型分為結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)和非結(jié)構(gòu)化存儲(chǔ)兩種方式,存儲(chǔ)工具也從傳統(tǒng)的數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)如MySql、PostgresSQL等,到企業(yè)級(jí)數(shù)據(jù)倉(cāng)儲(chǔ)(EDW)和大規(guī)模并行處理數(shù)據(jù)庫(kù)(MPP)如PADB和SAND等,此外HDFS、HBase這種分布式文件系統(tǒng)和MongoDB、CouchDB等NoSQL數(shù)據(jù)庫(kù)也經(jīng)常被用于非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)。

        3.3 數(shù)據(jù)準(zhǔn)備階段

        在數(shù)據(jù)準(zhǔn)備階段,存儲(chǔ)設(shè)備中的結(jié)構(gòu)化和非結(jié)構(gòu)化信息資源將根據(jù)智庫(kù)機(jī)構(gòu)的服務(wù)對(duì)象和研究目標(biāo)按照專題(topic)、學(xué)科領(lǐng)域(subject/ domain)或項(xiàng)目(project)等被組織成數(shù)據(jù)集的形式,并在各個(gè)數(shù)據(jù)集中被進(jìn)一步細(xì)分為一個(gè)個(gè)由文本組成的文檔。

        這一過(guò)程中涉及到對(duì)數(shù)據(jù)的清洗以使數(shù)據(jù)符合目標(biāo)模式,其中一些典型的處理方法包括對(duì)數(shù)據(jù)的規(guī)范化、數(shù)據(jù)去重、完整性約束違規(guī)檢查、基于正則表達(dá)式過(guò)濾數(shù)據(jù)、排序和分組數(shù)據(jù)等等。

        3.4 語(yǔ)義模型階段

        語(yǔ)義數(shù)據(jù)模型是數(shù)據(jù)集成框架的核心部分,也是面向決策研究的信息資源實(shí)現(xiàn)語(yǔ)義化的關(guān)鍵。

        在語(yǔ)義數(shù)據(jù)模型中,支持決策研究的本體將首先被構(gòu)建,之后依據(jù)智庫(kù)決策研究涉及的具體領(lǐng)域和問(wèn)題進(jìn)行專業(yè)領(lǐng)域本體、問(wèn)題本體和任務(wù)本體的構(gòu)建,此外還將復(fù)用現(xiàn)有的本體和各種通用本體,以針對(duì)不斷更新的信息對(duì)本體模型進(jìn)行擴(kuò)展。最后經(jīng)過(guò)本體間數(shù)據(jù)字段的映射、相似數(shù)據(jù)字段對(duì)齊等一系列操作形成一個(gè)面向決策研究過(guò)程的通用的語(yǔ)義數(shù)據(jù)模型。因本研究重點(diǎn)關(guān)注針對(duì)智庫(kù)決策過(guò)程的支持信息的數(shù)據(jù)組織,問(wèn)題本體和任務(wù)本體的構(gòu)建暫不在討論范圍之內(nèi)。到這一階段為止,智庫(kù)知識(shí)庫(kù)的數(shù)據(jù)組織模型的構(gòu)建已基本完成,大數(shù)據(jù)下從任何來(lái)源采集到的任何數(shù)據(jù)都可以經(jīng)過(guò)上述一系列步驟實(shí)現(xiàn)面向決策研究的語(yǔ)義化,成為一個(gè)個(gè)相互關(guān)聯(lián)的實(shí)例,從而更有利于決策者挖掘其中的潛在知識(shí),為決策制定提供信息支持。

        3.5 決策應(yīng)用階段

        經(jīng)過(guò)充分語(yǔ)義化后的數(shù)據(jù)資源已經(jīng)成為具有較高價(jià)值的智能數(shù)據(jù),可以根據(jù)決策研究過(guò)程中的不同需求從不同角度為決策者提供信息支持。與目前傳統(tǒng)的較多人工參與的智庫(kù)決策信息支持機(jī)制相比,一方面該信息處理框架利用各種信息處理技術(shù)和工具將大數(shù)據(jù)作為原材料進(jìn)行深度加工,使其成為能被計(jì)算機(jī)自動(dòng)處理的“可計(jì)算信息”,逐步實(shí)現(xiàn)半自動(dòng)直至自動(dòng)化的決策過(guò)程。另一方面,得益于大數(shù)據(jù)巨大的數(shù)據(jù)體量,以及語(yǔ)義化模塊對(duì)數(shù)據(jù)資源的語(yǔ)義化處理,使得更深層次的潛在知識(shí)和知識(shí)關(guān)聯(lián)得以被挖掘并發(fā)現(xiàn),最終提供給決策者的是智能化的決策支持?jǐn)?shù)據(jù)而非一般數(shù)據(jù)信息,因而這種基于大數(shù)據(jù)分析的決策研究方法能夠得出較傳統(tǒng)方法更科學(xué)、更可靠也更迅速的決策結(jié)果。

        4 決策支持本體的構(gòu)建

        本體作為“共享概念模型的明確的形式化規(guī)范說(shuō)明”[12],其目標(biāo)是獲取、描述和表示相關(guān)領(lǐng)域的知識(shí),提供對(duì)該領(lǐng)域知識(shí)的共同理解,確定領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同形式的形式化模式上給出了這些詞匯(術(shù)語(yǔ))和詞匯之間相互關(guān)系的明確定義[13]。針對(duì)大數(shù)據(jù)下智庫(kù)在信息采集和組織環(huán)節(jié)面臨的海量非結(jié)構(gòu)化數(shù)據(jù),本文選擇使用本體方法對(duì)這些復(fù)雜類(lèi)型數(shù)據(jù)進(jìn)行語(yǔ)義化處理,實(shí)現(xiàn)本體驅(qū)動(dòng)的決策過(guò)程。

        面向決策過(guò)程的決策支持本體是智庫(kù)知識(shí)庫(kù)中數(shù)據(jù)語(yǔ)義模型的核心組成部分,決策支持本體的結(jié)構(gòu)設(shè)計(jì)包含3個(gè)階段:需求分析、本體建模和本體實(shí)施。

        4.1 需求分析

        首先通過(guò)文獻(xiàn)調(diào)研和網(wǎng)絡(luò)調(diào)研識(shí)別出圍繞決策研究過(guò)程的關(guān)鍵問(wèn)題,對(duì)其進(jìn)行分解,提煉出實(shí)體類(lèi)型和關(guān)系類(lèi)型。在決策研究過(guò)程中涉及的實(shí)體和關(guān)系具有一些重要的特征,對(duì)本體的設(shè)計(jì)提出了相應(yīng)的要求,主要包括:

        (1)決策研究過(guò)程中涉及的實(shí)體種類(lèi)較多,如事件、人員、機(jī)構(gòu)、地理位置等,這些實(shí)體又可能被進(jìn)一步細(xì)分。例如某次水資源污染事件中,涉及的機(jī)構(gòu)類(lèi)型可能包括企業(yè)、司法部門(mén)、工商部門(mén)等。此外,事件的關(guān)注者有時(shí)也是直接參與事件的實(shí)體人員或機(jī)構(gòu),例如當(dāng)?shù)鼐用癫粌H關(guān)注并投訴了該事件,也是飲用了污染水的受害者。本體需要具有容納各種各樣相關(guān)實(shí)體的能力。

        (2)與決策研究相關(guān)的實(shí)體和關(guān)系具有時(shí)效性, 決策議題、相關(guān)事件、參與者和關(guān)系都存在于特定的時(shí)間內(nèi)。本體需要描述時(shí)間維度, 以支持對(duì)事件發(fā)展過(guò)程的表示和分析。

        (3)對(duì)每一個(gè)實(shí)體和關(guān)系,都有大量對(duì)應(yīng)的數(shù)據(jù)資料為其提供豐富的描述和評(píng)論。這些數(shù)據(jù)資料經(jīng)過(guò)處理整合,可以提供揭示性的定量或定性參考。決策本體有必要將這些基礎(chǔ)性的支撐性數(shù)據(jù)資料也包含在內(nèi)。

        (4)決策本體應(yīng)保留對(duì)其他本體的接口,支持對(duì)現(xiàn)有本體和新建本體的擴(kuò)展。例如科技領(lǐng)域問(wèn)題會(huì)用到學(xué)科領(lǐng)域本體,支撐性資料會(huì)用到出版物本體。

        本體設(shè)計(jì)的整體要求是在支持上述分析的同時(shí),邏輯模型應(yīng)盡量簡(jiǎn)明。

        4.2 本體建模

        明確需求之后,要選取合適的構(gòu)建方法對(duì)決策研究問(wèn)題進(jìn)行本體建模。面向決策研究過(guò)程的本體設(shè)計(jì)就是根據(jù)決策支持本體的構(gòu)建目標(biāo)建立其概念模型的過(guò)程。構(gòu)建決策支持本體的目標(biāo)是建立基于決策支持信息的語(yǔ)義檢索系統(tǒng),為智庫(kù)專家和政策研究人員提供語(yǔ)義化的信息查詢方式,突破傳統(tǒng)的智庫(kù)決策信息支持機(jī)制,提供語(yǔ)義級(jí)的決策信息查詢服務(wù)。

        本文根據(jù)決策研究問(wèn)題的實(shí)際情況和需要,選擇國(guó)際上較為成熟的七步法作為參照主體來(lái)構(gòu)建科技智庫(kù)知識(shí)庫(kù)中的決策支持本體。具體構(gòu)建步驟如下:

        (1)確定本體的范疇和目的

        界定決策支持本體的范疇,即要明確如何描述一個(gè)決策相關(guān)的事件或資源,以及描述到何種程度。目的是希望能夠建立一個(gè)通用的面向決策研究過(guò)程的本體,用以描述針對(duì)某決策議題或事件引發(fā)的問(wèn)題,以及針對(duì)問(wèn)題作出的回應(yīng)、涉及到的項(xiàng)目、相關(guān)參與人、機(jī)構(gòu)及其相互之間的關(guān)系等等。

        (2)考慮復(fù)用現(xiàn)有本體的可能性

        本文選擇復(fù)用DC和ABC本體。都柏林核心DC作為目前使用最為廣泛的本體之一,其對(duì)資源基本情況的語(yǔ)義描述具有很廣泛的適用性和擴(kuò)展性。改變模型的能力使得ABC本體適合于描述各種各樣的實(shí)體和它們之間的關(guān)系,包括所有媒體類(lèi)型的對(duì)象(文本、圖像、視頻、音頻、網(wǎng)頁(yè)和多媒體等)。它還可以用于模擬諸如知識(shí)內(nèi)容和時(shí)間實(shí)體的抽象概念,例如對(duì)象發(fā)生的性能或生命周期事件。因此本文最終選擇復(fù)用DC和ABC本體中的相關(guān)類(lèi)和屬性,同時(shí)利用XML schema、RDF schema、OWL等命名空間。所有復(fù)用的本體如表4所示。

        表4 復(fù)用本體Table 4 Reused ontologies

        (3)列出本體中的重要術(shù)語(yǔ)

        確定本體中核心概念的具體表述詞匯及其邏輯關(guān)系,最常見(jiàn)的方式就是直接抽取對(duì)應(yīng)領(lǐng)域主題詞表和分類(lèi)表中的主題詞和分類(lèi)詞。

        (4)列出關(guān)鍵實(shí)體和類(lèi)

        對(duì)提取出的核心概念進(jìn)行評(píng)估,按照一定的邏輯規(guī)則進(jìn)行分組,設(shè)計(jì)合理的類(lèi)及其層次結(jié)構(gòu)。本文通過(guò)參考相關(guān)研究的論文及研究結(jié)果[14-15],結(jié)合決策研究過(guò)程的實(shí)際特征,最后確定從問(wèn)題類(lèi)(Issue)、決策產(chǎn)品類(lèi)(Decision output)、決策建議類(lèi)(Decision suggestion)、參與者類(lèi)(Participant)、資源類(lèi)(Resource)這5個(gè)核心方面構(gòu)建決策本體,并據(jù)此展開(kāi)整個(gè)類(lèi)層次結(jié)構(gòu)。

        問(wèn)題類(lèi)(Issue)是指由科技領(lǐng)域或其他相關(guān)領(lǐng)域事件(Event)引發(fā)產(chǎn)生的各種問(wèn)題。

        決策產(chǎn)品類(lèi)(Decision output)是指智庫(kù)研究人員及決策者針對(duì)產(chǎn)生的問(wèn)題進(jìn)行科技政策研究,最終得到的決策產(chǎn)品以及在研究過(guò)程中產(chǎn)生的各種中間數(shù)據(jù)。具體分類(lèi)體系如圖4所示。

        決策建議類(lèi)(Decision suggestion)是科技智庫(kù)決策研究過(guò)程的最終產(chǎn)物,是決策產(chǎn)品類(lèi)的一個(gè)子類(lèi)。決策產(chǎn)品的另一個(gè)子類(lèi)是中間產(chǎn)品類(lèi)(Mid-product),指在決策者進(jìn)行政策制訂的過(guò)程中原始數(shù)據(jù)經(jīng)參與研究的智庫(kù)專家及研究人員的加工生成一系列為其提供思路的中間數(shù)據(jù),這些中間數(shù)據(jù)對(duì)于今后類(lèi)似項(xiàng)目的研究有很大參考價(jià)值,通常也被智庫(kù)進(jìn)行組織并保存。

        參與者類(lèi)(Participant)是指所有直接或間接參與到?jīng)Q策研究過(guò)程中的個(gè)人(Individual)或組織(Organization),其分類(lèi)體系如圖5所示。

        資源類(lèi)(Resource)是指在決策研究過(guò)程中為決策產(chǎn)品的生成提供支持的各類(lèi)信息資源,包括各種數(shù)據(jù)(data)、方法(method)、模型(model)、工具(tool)等,同時(shí)也為科技問(wèn)題的溯源和詢證(evidence-based)提供了途徑,詳細(xì)分類(lèi)體系如圖6所示。

        圖4 決策產(chǎn)品分類(lèi)Figure 4 The classification of decision output

        圖5 參與者分類(lèi)Figure 5 The classification of participants

        圖6 資源分類(lèi)Figure 6 The classification of resources

        最終構(gòu)建的決策支持本體的總體框架見(jiàn)圖7,整個(gè)本體框架分成3層:核心層、擴(kuò)展層和支撐層:

        ①核心層——問(wèn)題Issue、決策產(chǎn)品Decision output;

        ②擴(kuò)展層——參與者Participant、事件Event、項(xiàng)目Project、任務(wù)Task、決策建議Decision suggestion、中間產(chǎn)品Mid-product等;

        ③支撐層——資源Resource、數(shù)據(jù)Data、模型Model、方法Method、工具Tool等。

        分層結(jié)構(gòu)提供了簡(jiǎn)明的邏輯模型,使得核心層、擴(kuò)展層和支撐層的實(shí)體關(guān)系清晰有序;不同層次存儲(chǔ)的數(shù)據(jù)結(jié)構(gòu)復(fù)雜度和精確度不同,允許系統(tǒng)根據(jù)查詢需求對(duì)準(zhǔn)確性和全面性的權(quán)衡,滿足個(gè)性化的查詢和分析結(jié)果。

        (5)分析實(shí)體的屬性

        本體的數(shù)據(jù)屬性是表示類(lèi)或概念與值的關(guān)系,例如年齡屬性“at age of”的數(shù)值將代表某種生物的具體年齡,而本體的對(duì)象屬性則表示類(lèi)之間的非等級(jí)關(guān)系,例如屬性“trigger”或“cause”可以用以表示兩個(gè)類(lèi)之間的因果關(guān)系,一個(gè)類(lèi)觸發(fā)了另一個(gè)類(lèi),恰當(dāng)?shù)囟x數(shù)據(jù)屬性和對(duì)象屬性可以有效地反映類(lèi)間的關(guān)系。限于篇幅僅展示核心層的部分屬性如下表5。

        圖7 科技智庫(kù)的決策支持本體總體框架Figure 7 Decision-making ontology of science and technology think tanks

        表5 核心層類(lèi)的部分屬性Table 5 Parts of properties of classes in the core layer

        (6)分析屬性的約束

        對(duì)屬性進(jìn)行必要的約束限制,針對(duì)數(shù)據(jù)屬性的約束條件包括描述屬性的值的類(lèi)型(字符串、布爾型、枚舉型等)、值域、基數(shù)(單個(gè)基數(shù)或多個(gè)基數(shù))等特性。例如將時(shí)間屬性的Year字段的最大值設(shè)為2017,又比如人的性別只能從“男”或“女”兩個(gè)值中選擇一項(xiàng)等。

        (7)創(chuàng)建實(shí)例

        根據(jù)之前步驟已經(jīng)建立的概念模型創(chuàng)建具體的實(shí)例。本文使用protégé4.3選擇一個(gè)具體領(lǐng)域的問(wèn)題進(jìn)行部分實(shí)例添加作為展示。此外,也可借助API工具實(shí)現(xiàn)對(duì)實(shí)例的批量導(dǎo)入。本文將創(chuàng)建的本體以O(shè)WL文本的格式保存在本地計(jì)算機(jī)中以便于本體的復(fù)制與備份,并可隨時(shí)進(jìn)行編輯和修改。

        4.3 智庫(kù)知識(shí)庫(kù)的實(shí)施過(guò)程

        智庫(kù)知識(shí)庫(kù)的總體運(yùn)作流程見(jiàn)圖8(以科技智庫(kù)為例)。通過(guò)API工具和爬蟲(chóng)工具可以在互聯(lián)網(wǎng)上抓取所研究領(lǐng)域的相關(guān)事件和問(wèn)題內(nèi)容,同時(shí)收集用戶的政策需求或政策方案,對(duì)自然語(yǔ)言進(jìn)行處理后,再通過(guò)信息抽取等文本處理工具分析上述內(nèi)容,提取其中的實(shí)體和類(lèi)型,使用上述本體構(gòu)建模型和Protégé等編輯工具進(jìn)行本體的構(gòu)建與數(shù)據(jù)維護(hù),并且可依據(jù)信息源的性質(zhì)及數(shù)據(jù)特征引入外部本體,如在本例中的DC元數(shù)據(jù)和科技領(lǐng)域本體。最終將從現(xiàn)實(shí)世界所采集的內(nèi)容全部實(shí)現(xiàn)實(shí)體化,形成相互具有語(yǔ)義關(guān)聯(lián)的智能數(shù)據(jù),結(jié)合之前用戶的政策需求或政策方案提供相應(yīng)的匹配結(jié)果,為政策制定者提供決策支持信息。最終預(yù)期達(dá)到的目標(biāo)是能夠基于智庫(kù)采集處理的大數(shù)據(jù)信息構(gòu)建一套面向決策研究過(guò)程的語(yǔ)義驅(qū)動(dòng)的檢索系統(tǒng)(圖9)。

        圖8 智庫(kù)知識(shí)庫(kù)運(yùn)作流程Figure 8 Knowledge repository operation process of think tanks

        圖9 語(yǔ)義驅(qū)動(dòng)的決策檢索系統(tǒng)示例Figure 9 An example of a semantic-driven decisionmaking retrieval system

        在這套檢索系統(tǒng)中,社會(huì)熱點(diǎn)事件、某個(gè)社會(huì)問(wèn)題、新聞報(bào)道、研究出版物等大數(shù)據(jù)下的海量數(shù)據(jù)資料被智庫(kù)抽取并進(jìn)行自然語(yǔ)言處理,再經(jīng)過(guò)智庫(kù)知識(shí)庫(kù)的處理并存儲(chǔ),成為智能數(shù)據(jù)。在檢索時(shí),用戶的查詢需求同樣先進(jìn)行自然語(yǔ)言處理,之后請(qǐng)求數(shù)據(jù)以相同的方式被映射到智庫(kù)知識(shí)庫(kù)中的決策本體中,繼而匹配之前生成的實(shí)體化數(shù)據(jù),返回給用戶基于智能數(shù)據(jù)的檢索結(jié)果,這種基于語(yǔ)義驅(qū)動(dòng)和智能數(shù)據(jù)的檢索系統(tǒng)相比傳統(tǒng)智庫(kù)在決策研究中的資料查找和收集方式,能夠得到更為全面、更為科學(xué)、相互關(guān)聯(lián)的檢索結(jié)果,概括來(lái)講就是基于上下文情境(context based)的結(jié)果,這種檢索結(jié)果可以更容易地進(jìn)行潛在知識(shí)挖掘,帶有情境也更方便被直接投入決策應(yīng)用。例如,對(duì)“霧霾防治”相關(guān)信息進(jìn)行檢索,通過(guò)該語(yǔ)義驅(qū)動(dòng)的決策檢索系統(tǒng),用戶將會(huì)得到某次霧霾發(fā)生事件的起因、起止時(shí)間、地點(diǎn)、相關(guān)人員、相關(guān)機(jī)構(gòu)、相關(guān)出版物描述,以及霧霾防治政策的相關(guān)研究機(jī)構(gòu)、研究人員、政策實(shí)施情況、產(chǎn)生的影響等等一系列信息。由此實(shí)現(xiàn)了一種面向決策研究的、提供上下文情境的語(yǔ)義化的檢索機(jī)制。打破了傳統(tǒng)的較依賴人工的智庫(kù)決策信息支持機(jī)制。

        5 總結(jié)

        本文主要調(diào)研了當(dāng)前智庫(kù)傳統(tǒng)信息支持機(jī)制及其在大數(shù)據(jù)時(shí)代背景下受到的挑戰(zhàn),從而提出了一種一般性的語(yǔ)義化的智庫(kù)決策信息處理框架,并依據(jù)該框架設(shè)計(jì)了科技智庫(kù)知識(shí)庫(kù)的數(shù)據(jù)組織模式,以期為大數(shù)據(jù)下新型智庫(kù)的建設(shè)提供參考借鑒。

        關(guān)于針對(duì)智庫(kù)政策領(lǐng)域研究的本體創(chuàng)建,目前在國(guó)內(nèi)的嘗試還少之又少,后續(xù)要進(jìn)行的工作還有很多。在不斷完善該智庫(kù)決策信息處理框架功能并維護(hù)決策本體的同時(shí),本文下一步的研究工作將圍繞決策本體的本體映射、本體評(píng)價(jià)、集成擴(kuò)展等方面繼續(xù)進(jìn)行。

        [1] James G. McGann, University of Pennsylvania, 2016 Global Go To Think Tank Index Report[EB/OL]. [2016-08-10]. http://repository.upenn.edu/think_tanks/10/.

        [2] 吳育良. 國(guó)外智庫(kù)決策信息支持研究及啟示[J]. 圖書(shū)館理論與實(shí)踐, 2015(10): 31-35.

        [3] 廖球, 嚴(yán)揚(yáng)帆, 莫崇菊. 大數(shù)據(jù)時(shí)代機(jī)構(gòu)自建學(xué)術(shù)數(shù)據(jù)庫(kù)研究[J]. 圖書(shū)館學(xué)刊, 2014(4): 34-36.

        [4] MOORTHY J, et al. Big data: prospects and challenges[J]. The Journal for Decision Makers, 2015, 40(1): 74-96.

        [5] Bruegel. Datasets[EB/OL]. [2017-03-01]. http://bruegel. org/publications/datasets/.

        [6] SIPRI. Databases[EB/OL]. [2017-03-01]. https://www. sipri.org/databases.

        [7] 許鑫, 吳珊燕. 智庫(kù)知識(shí)庫(kù)的構(gòu)建研究[J]. 情報(bào)理論與實(shí)踐, 2014(3): 68-72.

        [8] Studer R, Benjamins C R, Fensel D. Knowledge Engineering, Principles and Methods[J]. Data and Knowledge Engineering, 1998, 25(1-2): 161-197.

        [9] Benjamin Horne, Tanya Torres, Jessica Mackenzie. Think Tank Management: Establishing a Knowledge Repository[EB/OL]. [2016-12-30]. http://www.ksiindonesia.org/en/news/detail/think-tank-managementestablishing-a-knowledge-repository.

        [10] Srividya K Bansal, Sebastian Kagemann. Semantic Extract-Transform-Load framework for Big Data Integration[J]. Computer, 2015, 48(3): 42-50.

        [11] Francesco Corcoglioniti, Marco Rospocher, etc. The KnowledgeStore: A Storage Framework for Interlinking Unstructured and Structured Knowledge[J]. International Journal on Semantic Web and Information Systems, 2015, 11(2): 1-35.

        [12] Studer R, Benjamins C R, Fensel D. Knowledge Engineering, Principles and Methods[J]. Data and Knowledge Engineering. 1998, 25(1-2).

        [13] 廖軍. 基于領(lǐng)域本體的信息檢索研究[D]. 長(zhǎng)沙: 中南大學(xué), 2007.

        [14] Leo Wanner, Marco Rospocher, etc. Ontology-centered environmental information delivery for personalized decision support[J]. Expert System with Applications, 2015(42): 5032-5046.

        [15] Studer R, Benjamins C R, Fensel D. Knowledge Engineering, Principles and Methods[J]. Data and Knowledge Engineering. 1998, 25(1-2): 161-197.

        作者貢獻(xiàn)說(shuō)明:

        安 楠:開(kāi)展調(diào)研,撰寫(xiě)論文;

        祝忠明:提供思路,指導(dǎo)修改。

        The Challenges and Data Organization Strategies for Foreign Think Tanks Within the Context of Big Data

        An Nan1,2Zhu Zhongming1

        1Lanzhou Library, National Science Library of Chinese Academy of Sciences, Lanzhou 730000
        2University of Chinese Academy of Sciences, Beijing 100049

        [Purpose/signif i cance] The high level of new types of think tanks cannot be separated from the high level information support mechanism. The traditional think tank information organization mechanism in the big data era cannot adapt to the current data characteristics and decision-making requirements. Constructing the knowledge repository that supports the decision-making process is becoming the inevitable trend of the development of think tanks. [Method/process] This paper chose foreign think tanks with reference value in 2016 Global Go To Think Tank Index Report as the research objective, and summarized several kinds of information organization methods which were common in the current think tanks by using the literature research method and case analysis method. It also analyzed the data value chain and its requirements for all aspects of think tanks, and accordingly put forward the necessity of the construction of knowledge repository of think tanks. [Result/ conclusion] Finally, a general knowledge repository framework for decision-making process is proposed, and the knowledge organization model in the knowledge repository is constructed by the semantic ontology method to provide references for the achievement of the transformation from the semi-automatic decision-making process to the automatic one.

        think tank knowledge repository big data information organization organizational strategy decision research ontology

        G359

        10.19318/j.cnki.issn.2096-1634.2017.03.04

        2017-04-16

        2017-05-18 本文責(zé)任編輯:唐果媛

        *本文系中國(guó)科學(xué)院文獻(xiàn)情報(bào)能力建設(shè)項(xiàng)目“中國(guó)科學(xué)院知識(shí)資產(chǎn)存繳管理中心建設(shè)”(項(xiàng)目編號(hào):Y6ZG421001)的研究成果之一。

        安楠(ORCID: 0000-0002-9981-8720),中國(guó)科學(xué)院蘭州文獻(xiàn)情報(bào)中心碩士研究生,E-mail:annan@mail.las. ac.cn;祝忠明(ORCID: 0000-0002-2365-3050),中國(guó)科學(xué)院蘭州文獻(xiàn)情報(bào)中心研究館員,博士生導(dǎo)師,E-mail:zhuzm@ llas.ac.cn。

        猜你喜歡
        知識(shí)庫(kù)智庫(kù)本體
        Abstracts and Key Words
        對(duì)姜夔自度曲音樂(lè)本體的現(xiàn)代解讀
        基于TRIZ與知識(shí)庫(kù)的創(chuàng)新模型構(gòu)建及在注塑機(jī)設(shè)計(jì)中的應(yīng)用
        微智庫(kù)
        微智庫(kù)
        高速公路信息系統(tǒng)維護(hù)知識(shí)庫(kù)的建立和應(yīng)用
        《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
        基于Drupal發(fā)布學(xué)者知識(shí)庫(kù)關(guān)聯(lián)數(shù)據(jù)的研究
        智庫(kù)能為我們做什么?
        全球化(2015年9期)2015-02-28 12:40:12
        建智庫(kù),話擔(dān)當(dāng)
        狠狠色婷婷久久一区二区三区| 欧美日韩一卡2卡三卡4卡 乱码欧美孕交 | 中文字幕丰满乱子无码视频| 欧美巨大xxxx做受中文字幕| 天天插天天干天天操| 亚洲av成人久久精品| av网站一区二区三区| 91偷自国产一区二区三区| 日韩亚洲一区二区三区四区| 亚洲av综合av国产av中文| 内射爽无广熟女亚洲| 成人性生交大片免费看r| 亚洲AV无码乱码精品国产草莓| 中文字幕一区二区三区亚洲| 美女视频在线观看亚洲色图| 免费观看全黄做爰大片| 少妇熟女天堂网av| 亚洲av无码精品色午夜蛋壳| 亚洲人成网站18男男| 亚洲码专区亚洲码专区| 华人在线视频精品在线| 日韩日韩日韩日韩日韩日韩日韩| 国产福利精品一区二区| 亚洲色偷偷色噜噜狠狠99| 一区二区免费电影| 日韩精品有码中文字幕 | 国产成人AⅤ| 亚洲综合天堂一二三区| 精品国产三区在线观看| 伊人青青草综合在线视频免费播放| 亚洲av永久无码天堂网小说区| 久久久久久国产精品免费免费男同 | 亚洲熟女精品中文字幕| 永久黄网站色视频免费看| 中文字幕无码日韩专区免费| 白嫩少妇激情无码| 久久婷婷国产五月综合色| 国产精品又爽又粗又猛又黄| av网站在线观看亚洲国产| 丁香美女社区| 欧美韩日亚洲影视在线视频|