李慧佳 王楠
摘? ?要:智庫是知識決策咨詢體系的重要組成部分,其主要通過智庫資源的知識發(fā)現(xiàn)和智庫專家的經(jīng)驗(yàn)智慧相結(jié)合來生產(chǎn)智庫產(chǎn)品,進(jìn)而影響相關(guān)領(lǐng)域的知識決策。利用語義關(guān)聯(lián)來構(gòu)建的智庫資源知識組織體系可實(shí)現(xiàn)智庫資源的知識化、有序化、關(guān)聯(lián)化組織,從而實(shí)現(xiàn)智庫資源的利用、共享、傳播和增值等知識化服務(wù)。
關(guān)鍵詞:智庫;語義關(guān)聯(lián);知識組織;CSpace DR;知識服務(wù);知識決策
Abstract Think tank is an important part of the scientific and technological strategic decision-making consulting system, through the vast amount of knowledge resources and experience and wisdom to influence the relevant areas of knowledge decision-making. This paper constructs knowledge organization system framework of think tank resources with semantic link, so as to realize the knowledgeable, ordering and linkable of think tank resources, and then realize the use of think tank resources, sharing, dissemination and value-added knowledge services.
Key words think tank; sematic link; knowledge organization; CSpace DR; knowledge service; knowledge decision
在邁向知識決策的道路上,智庫占據(jù)重要的地位。智庫通過海量的知識資源和智囊團(tuán)的經(jīng)驗(yàn)及智慧來影響相關(guān)領(lǐng)域的知識決策,因此由專家、機(jī)構(gòu)、資訊、智庫出版物、專題數(shù)據(jù)庫等組成了智庫這一共同體。在以知識創(chuàng)新引領(lǐng)創(chuàng)新驅(qū)動發(fā)展的戰(zhàn)略背景下,智庫作為決策咨詢體系的重要組成部分,針對不同領(lǐng)域構(gòu)建基于語義關(guān)聯(lián)的智庫資源知識組織體系,一方面可為創(chuàng)新型的科技戰(zhàn)略研究、科研績效分析、科技與產(chǎn)業(yè)競爭力分析等科技決策與咨詢工作提供流程框架,最終形成以各領(lǐng)域語義關(guān)聯(lián)知識資源發(fā)現(xiàn)組織、集成和深度分析能力為基礎(chǔ),有效開展面向領(lǐng)域科技決策需求的戰(zhàn)略情報研究與智庫服務(wù)能力體系,另一方面可為決策者、智庫專家等用戶提供精準(zhǔn)的智庫資源服務(wù)。
1? ?資源知識組織是智庫決策的有效支撐
近幾年,大數(shù)據(jù)時代的到來和智庫數(shù)量呈現(xiàn)飛躍式增長的趨勢,使得決策者和智囊團(tuán)專家陷入信息泛濫、信息無序的困境中,大量過剩的信息反而成為智庫決策束縛。迫切需要能夠?qū)⒅菐熨Y源進(jìn)行科學(xué)處理、組織、關(guān)聯(lián),最終形成真正可以解決現(xiàn)實(shí)問題的知識資源。
1.1? ?從元數(shù)據(jù)到語義關(guān)聯(lián):不斷發(fā)展的知識組織方法
在知識計算等技術(shù)的推動下,知識組織的方法、工具從元數(shù)據(jù)、本體模型、知識地圖,到語義關(guān)聯(lián),得到了不斷的繼承和發(fā)展[1]。其中,基于元數(shù)據(jù)的知識組織方式主要擅長揭示文獻(xiàn)資源整體結(jié)構(gòu),但無法實(shí)現(xiàn)異構(gòu)資源之間錯綜復(fù)雜關(guān)系的揭示;基于本體模型的知識組織主要是通過詞表、語義關(guān)聯(lián)技術(shù)、領(lǐng)域本體等方法來構(gòu)建知識組織框架,是目前較為流行的知識組織方法之一。如JeromeDL項(xiàng)目通過構(gòu)建MareOnt本體來實(shí)現(xiàn)各種元數(shù)據(jù)的語義轉(zhuǎn)換[2]。但此種方法受到資源質(zhì)量參差不齊、學(xué)科領(lǐng)域差異性,以及缺乏可用的互操作性標(biāo)準(zhǔn)和規(guī)范等方面的因素的制約,導(dǎo)致本體模型在構(gòu)建知識組織的可操作性較差。以知識地圖的方法進(jìn)行學(xué)術(shù)資源的知識組織,主要是通過可視化的形式來展示資源內(nèi)部和外部間的關(guān)系,優(yōu)點(diǎn)是可以更加直觀、便捷的呈現(xiàn)知識資源,從而實(shí)現(xiàn)了知識的重用、共享和創(chuàng)新[3]。但目前國內(nèi)外關(guān)于知識地圖以理論研究為主,而知識地圖的構(gòu)建受到應(yīng)用領(lǐng)域的局限,缺乏通用性和普適性,很難展開全方位的應(yīng)用及研究。
語義關(guān)聯(lián)通過識別和分析數(shù)字資源的語義信息,并通過自動整合、轉(zhuǎn)換與處理,來解釋不同資源之間的語義關(guān)系[4]。利用語義關(guān)聯(lián)進(jìn)行數(shù)字資源的知識組織可以彌補(bǔ)元數(shù)據(jù)方法只能用于表示資源語法關(guān)系的缺陷,并借助本體模型來表示資源的語義信息,從而改變數(shù)字資源知識組織的樹狀結(jié)構(gòu),通過資源見得深度關(guān)聯(lián)形成無限延伸的網(wǎng)狀結(jié)構(gòu),打破了本體模型在應(yīng)用領(lǐng)域內(nèi)的局限,為不同學(xué)科領(lǐng)域、多源異構(gòu)數(shù)字資源的知識組織提供了技術(shù)支持。
1.2? ? 國內(nèi)外資深智庫的資源知識組織主要策略
智庫的作用是決策支持,但智庫的資源范圍、數(shù)量、質(zhì)量,服務(wù)內(nèi)容、方式等都直接影響決策[5]。智庫決策需要全面而準(zhǔn)確的知識資源作為保障,國外資深智庫都有可靠的信息來源,以及專門的情報信息網(wǎng)絡(luò)。如斯坦福研究所在美國各地區(qū)設(shè)有分支機(jī)構(gòu),并且在歐洲、中東、日本和中國香港等地均設(shè)有辦事處,這些構(gòu)成了斯坦福研究所的情報信息網(wǎng)絡(luò)[6]。但多種來源種類各異的情報信息網(wǎng)絡(luò)必須通過有效的資源組織才能真正為智庫服務(wù)。
目前,國內(nèi)外智庫的資源知識組織策略主要有:(1)按資源類型分類組織。智庫機(jī)構(gòu)將其直接生產(chǎn)或間接搜集的資源進(jìn)行歸類存儲,這樣的資源組織方式可以實(shí)現(xiàn)智庫資源的簡單快速整合和存儲,但也存在很多弊端:分類標(biāo)準(zhǔn)不統(tǒng)一;元數(shù)據(jù)不規(guī)范;資源冗余較多;開放權(quán)益不明確;跨庫檢索不易實(shí)現(xiàn)等;(2)按專題數(shù)據(jù)庫組織。隨著信息技術(shù)的發(fā)展,越來越多的智庫機(jī)構(gòu)開始通過建設(shè)專題數(shù)據(jù)庫的方式來組織智庫資源。知名智庫幾乎都建有各具特色的智庫資源數(shù)據(jù)庫,如蘭德公司開發(fā)了十幾種專題數(shù)據(jù)庫用于存儲各類專題資源(健康調(diào)查數(shù)據(jù)庫、統(tǒng)計數(shù)據(jù)庫、世界恐怖事件數(shù)據(jù)庫等),這些數(shù)據(jù)庫都是蘭德公司智庫決策的重要支撐[7];瑞典斯德哥爾摩國際和平研究所(SIPRI)自建了5個專題數(shù)據(jù)庫,分別是武器轉(zhuǎn)讓、國際關(guān)系與安全趨勢、軍火工業(yè)、多國和平行動、軍事開支專題數(shù)據(jù)庫[8],但也存在著資源難以有效關(guān)聯(lián)和發(fā)現(xiàn)等問題;(3)智庫資源共建共享。根據(jù)美國賓夕法尼亞大學(xué)“智庫與公民社會計劃”(TTCSP)項(xiàng)目發(fā)布的《全球智庫報告》可以看出全球智庫從2008年的5465家增長到2018年的8162家,10年智庫新增率為49%[9]。智庫的不斷增加使得相似的專題上會存在多個獨(dú)立的數(shù)據(jù)庫,從而導(dǎo)致信息數(shù)據(jù)重復(fù)存儲,使用效率低下等問題。解決這一問題最好的辦法就是實(shí)現(xiàn)智庫資源的共建共享。智庫資源的共建共享最早可追溯到1992年德國國際政治與安全研究所與德國12家研究機(jī)構(gòu)共同建立的信息網(wǎng)絡(luò)中心——EINRAS(European Information Network International Relations and Area Studies),該網(wǎng)絡(luò)中心的任務(wù)是促進(jìn)在研究和實(shí)踐中收集、管理、分析和使用信息和文件的問題進(jìn)行實(shí)際合作和交流[10]。EINRAS的建立可以最大程度的整合資源,確保相關(guān)領(lǐng)域的國際競爭力;同時,可以避免資源的重復(fù)建設(shè),實(shí)現(xiàn)資源的最優(yōu)配置。2002年,著名智庫美國企業(yè)公共政策研究所與布魯金斯學(xué)會合作共建了網(wǎng)絡(luò)資源平臺,解決了美國總統(tǒng)選舉制度改革過程中出現(xiàn)的大量重要資料分散的問題[11]。
1.3? ? 語義關(guān)聯(lián)為智庫的資源知識組織提供了新選擇
語義關(guān)聯(lián)不僅可以將錯綜復(fù)雜的智庫資源有序呈現(xiàn),而且可以揭示隱藏在智庫資源深層、不易被人們察覺的隱形知識。因而,基于語義關(guān)聯(lián)的智庫資源知識組織體系構(gòu)建的價值在于:
(1)智庫資源知識化。智庫資源知識化過程是通過對智庫資源的梳理、加工和再組織,從而形成可以實(shí)現(xiàn)咨詢和決策的智庫知識。智庫資源知識化可以使智庫突破傳統(tǒng)智庫服務(wù)模式,挖掘智庫資源中的隱形知識,并將其轉(zhuǎn)換為顯性知識,從而提高智庫資源的利用價值。
(2)智庫資源有序化。智庫資源有序化是對相互獨(dú)立的智庫資源按照一定的需求進(jìn)行分類、關(guān)聯(lián)和管理,更有利于智庫知識的檢索利用。相互獨(dú)立的智庫資源本身無法體現(xiàn)知識,只有通過對智庫資源的有序化處理,以形成更有價值的智庫知識,從而改善和提升智庫服務(wù)的質(zhì)量。
(3)智庫服務(wù)知識化。智庫服務(wù)知識化是智庫資源知識組織體系構(gòu)建的最終目標(biāo),利用構(gòu)建智庫資源的語義關(guān)聯(lián)模型,能從各種顯性和隱形智庫資源中有針對性的提煉出智庫知識,最終實(shí)現(xiàn)智庫知識的利用、共享、傳播和增值等功能,從而為智庫咨詢、決策和戰(zhàn)略規(guī)范提供有效支持。
2? ?智庫資源知識組織的內(nèi)容
2.1? ? 智庫資源的實(shí)體類型
智庫資源主要包括智庫機(jī)構(gòu)、智庫專家、智庫產(chǎn)品、智庫動態(tài)(見圖1)。各類智庫資源相互碰撞、有效融合,最終形成新的、增值的智庫知識。
(1)智庫機(jī)構(gòu)。智庫機(jī)構(gòu)是為智庫提供信息數(shù)據(jù)的主要載體,智庫機(jī)構(gòu)可以直接生產(chǎn)資源,也可以間接搜集信息和數(shù)據(jù)。因此智庫機(jī)構(gòu)是智庫資源結(jié)構(gòu)中處于頂端的資源,是其他智庫資源的觸發(fā)器。依據(jù)不同的智庫構(gòu)建理念可將智庫分為學(xué)術(shù)型智庫、契約型智庫等,但無論何種類型智庫都依托于一個或多個的機(jī)構(gòu)成立。TTCSP發(fā)布的《全球智庫報告2018》,通過對8000余家智庫依托機(jī)構(gòu)進(jìn)行調(diào)研分析發(fā)現(xiàn),智庫依托機(jī)構(gòu)以高校、研究院所、學(xué)協(xié)會、基金會、政府機(jī)構(gòu)、企業(yè)為主。
(2)智庫專家。智庫專家是提高智庫影響力的重要因素之一,也是智庫的核心競爭力所在,是智庫資源中不可或缺的寶貴資源。智庫專家既可以是隸屬于智庫機(jī)構(gòu)的專職專家,也可以是智庫機(jī)構(gòu)以外的領(lǐng)域?qū)<?。智庫專家對信息?shù)據(jù)具有超強(qiáng)的敏感性,在特定領(lǐng)域有一定的社會地位和話語權(quán),具有洞悉前沿?zé)狳c(diǎn),把握政策趨勢的能力,并能正確的對正在發(fā)生或未來會發(fā)生的事情做出判斷,以及給出咨詢建議。國內(nèi)外眾多高影響力的智庫都針對不同的領(lǐng)域設(shè)立不同的研究部門,用于組織相關(guān)智庫專家集中為特定領(lǐng)域提供信息服務(wù)。如德國科學(xué)與政治基金會(SWP)針對其下8個專題研究部門設(shè)立了專門的信息研究室,用于組織專家為該基金會以及德國聯(lián)邦議院和聯(lián)邦政府各部門提供信息服務(wù)[12]。
(3)智庫產(chǎn)品。智庫產(chǎn)品是智庫研究成果的展示,也是智庫機(jī)構(gòu)開展咨詢和影響決策的主要方式之一[13]。智庫產(chǎn)品的類型沒有統(tǒng)一標(biāo)準(zhǔn),大致可分為報告(Report)、論文(Article)、博客(Blog)、評論(Comment)。另外,還有智庫機(jī)構(gòu)(如學(xué)協(xié)會、基金會等)會面向特定地區(qū)發(fā)布智庫項(xiàng)目,用以尋求特定研究主題的合作研究。一般而言可將智庫產(chǎn)品分為兩類:一是智庫機(jī)構(gòu)和智庫專家直接產(chǎn)生的智庫成果,包括智庫報告、智庫論文、博客、評論和智庫政策。其中智庫報告包含技術(shù)報告(Technical Report)、通用報告(Report)、年度報告(Annual Report)、工作報告(Working Paper)等;智庫論文包括期刊論文、會議論文、灰色文獻(xiàn)等;博客是指智庫專家通過社交平臺發(fā)表的非正式言論;評論是指智庫機(jī)構(gòu)或智庫專家提出的具有評價性、針對性的觀點(diǎn)或建議;智庫政策不僅是正式出版或發(fā)布的政策性文檔(Policy Paper),也有通過特定標(biāo)題(Policy/Decision/Proposal/Recommendation)從智庫報告中抽取得到的片段性文檔。二是智庫機(jī)構(gòu)對外公布的智庫項(xiàng)目,旨在通過多方合作來完成特定主體的研究。
(4)智庫動態(tài)。智庫動態(tài)是指在智庫機(jī)構(gòu)網(wǎng)站上發(fā)表簡明的、公開的、具有時效性和針對性的文章或消息。智庫動態(tài)可以使人們以最快的速度了解特定領(lǐng)域最新的或最具價值的信息。由于智庫動態(tài)具有固定的結(jié)構(gòu),一般包括標(biāo)題、導(dǎo)語、主體、背景和結(jié)語,可將其視為結(jié)構(gòu)化文檔。因此不僅智庫動態(tài)本身是重要的智庫資源,智庫動態(tài)中還有大量隱形資源可為智庫的政策制定提供支持。
2.2? ? 智庫資源的實(shí)體要素
以智庫機(jī)構(gòu)為主線出發(fā),可將智庫活動過程中的概念實(shí)體化,本文采用復(fù)用PROV模型中的Organization、Person、Activity、Asset實(shí)體來表達(dá)智庫資源,即智庫機(jī)構(gòu)(prov:organization)、智庫專家(prov:person)、智庫動態(tài)(prov:activity)和智庫產(chǎn)品(prov:asset)。
(1)智庫機(jī)構(gòu)實(shí)體要素。作為智庫資源的首要資源,智庫機(jī)構(gòu)是智庫知識的源泉,主要包括機(jī)構(gòu)名稱、其他名稱、機(jī)構(gòu)簡介、機(jī)構(gòu)網(wǎng)址、成立日期、機(jī)構(gòu)類型、語種、國家、電子郵箱、聯(lián)系電話和聯(lián)系地址等。
(2)智庫專家實(shí)體要素。智庫專家屬包括專家姓名、個人簡介、研究方向、出生日期、職稱、國家、性別、頭像和電子郵箱等。
(3)智庫產(chǎn)品實(shí)體要素。智庫產(chǎn)品的屬性包括:DOI、題名、其他題名、摘要、語種、產(chǎn)品類型、格式、學(xué)科、出版日期、作者、出版者、URL和關(guān)鍵詞等。在DC元數(shù)據(jù)標(biāo)準(zhǔn)或其他文獻(xiàn)資源的元數(shù)據(jù)標(biāo)準(zhǔn)中沒有適用于智庫產(chǎn)品類型,可直接被復(fù)用的元數(shù)據(jù)字段,因此,對于智庫產(chǎn)品類型的元數(shù)據(jù)將采用復(fù)用其他本體中實(shí)體要素的方式進(jìn)行描述。
(4)智庫動態(tài)實(shí)體要素。智庫動態(tài)的屬性包括:題名、其他題名、內(nèi)容、語種、URL、作者、出版日期和關(guān)鍵詞等。
3? ?基于語義關(guān)聯(lián)的智庫資源知識組織框架
基于語義關(guān)聯(lián)的智庫資源知識組織框架分為元數(shù)據(jù)層、關(guān)聯(lián)層和應(yīng)用層等三個層次(見圖2)。該框架通過對智庫資源進(jìn)行元數(shù)據(jù)規(guī)范、語義化描述,進(jìn)而提供統(tǒng)一的資源訪問機(jī)制,實(shí)現(xiàn)多源異構(gòu)資源之間的語義互操作。
3.1? ? 元數(shù)據(jù)層
資源組織/存儲系統(tǒng)中最基礎(chǔ)的組織方式就是通過元數(shù)據(jù)標(biāo)準(zhǔn)對資源進(jìn)行規(guī)范化描述,常用的元數(shù)據(jù)標(biāo)準(zhǔn)有支持網(wǎng)絡(luò)資源的Dublin Core、IAFA Template、CDF、Web Collections;支持文獻(xiàn)資源的MARC、Dublic Core。對于多源異構(gòu)多種類型智庫資源而言,往往會用多種元數(shù)據(jù)標(biāo)準(zhǔn)對資源進(jìn)行描述。這些元數(shù)據(jù)標(biāo)準(zhǔn)之間既存在相似之處(如共享相同的核心元素),但并完全兼容。為了使不同類型多源異構(gòu)智庫資源的元數(shù)據(jù)具備良好的兼容性和互操作性,就必須在元數(shù)據(jù)核心元素的基礎(chǔ)上最大限度的整合元數(shù)據(jù)標(biāo)準(zhǔn),形成一套適用于智庫資源的元數(shù)據(jù)標(biāo)準(zhǔn)。然而,元數(shù)據(jù)雖然提供了一定的語義基礎(chǔ),使資源有了基本的微觀結(jié)構(gòu),但是元數(shù)據(jù)并不能完全解決語義異構(gòu)問題,包括資源采用不同元數(shù)據(jù)方案所造成的微觀結(jié)構(gòu)的異構(gòu)問題以及資源對象之間存在的復(fù)雜的關(guān)聯(lián)關(guān)系[14]。
3.2? ? 關(guān)聯(lián)層
為了更有效呈現(xiàn)多源異構(gòu)資源之間關(guān)聯(lián)關(guān)系,需要在智庫資源知識組織框架中元數(shù)據(jù)層的基礎(chǔ)上構(gòu)建智庫資源的元數(shù)據(jù)本體以及關(guān)聯(lián)關(guān)系,進(jìn)而實(shí)現(xiàn)不同類型智庫資源元數(shù)據(jù)的語義互操作。元數(shù)據(jù)本體的構(gòu)建方法有兩種:一是通過本體描述語言構(gòu)建一個集成的元數(shù)據(jù)本體,并基于集成的元數(shù)據(jù)本體實(shí)現(xiàn)不同源數(shù)據(jù)的語義互操作;另一種是在通過本體描述語言對每一種元數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行本體化描述,然后通過不同元數(shù)據(jù)本體之間的映射關(guān)系來實(shí)現(xiàn)不同元數(shù)據(jù)本體間的語義互操作[15]。智庫資源是由網(wǎng)絡(luò)資源和文獻(xiàn)資源組成,并且智庫資源的組成相對穩(wěn)定,不會出現(xiàn)頻繁增加新的元數(shù)據(jù)標(biāo)準(zhǔn)的現(xiàn)象。同時,DC元數(shù)據(jù)標(biāo)準(zhǔn)既可以用來描述網(wǎng)絡(luò)資源,也可以用來描述文獻(xiàn)資源。因此,在智庫資源知識組織框架中構(gòu)建一個集成元數(shù)據(jù)本體無疑是最優(yōu)方案。首先,構(gòu)建一個基于DC的核心元數(shù)據(jù)本體;其次,對于專門元數(shù)據(jù)元素可通過復(fù)用其他元數(shù)據(jù)標(biāo)準(zhǔn)中元素集的形式對核心元數(shù)據(jù)本體進(jìn)行擴(kuò)展;最終形成智庫資源的集成元數(shù)據(jù)本體。
元數(shù)據(jù)本體解決了智庫資源中文獻(xiàn)類資源的元數(shù)據(jù)描述問題,同時揭示了文獻(xiàn)資源之間的顯性關(guān)系。為了實(shí)現(xiàn)不同類型、多源異構(gòu)的智庫資源之間的互聯(lián)互通,需要在智庫資源集成元數(shù)據(jù)本體的基礎(chǔ)上采用關(guān)聯(lián)數(shù)據(jù)方式對智庫資源進(jìn)行再組織。通過關(guān)聯(lián)數(shù)據(jù)方式對智庫資源進(jìn)行知識組織的優(yōu)勢在于用戶既可更全面、完整的直接瀏覽和檢索到相關(guān)知識,也可實(shí)現(xiàn)與其他相關(guān)資源、信息和數(shù)據(jù)的溝通。智庫資源知識組織的關(guān)聯(lián)層實(shí)現(xiàn)了智庫資源的自動發(fā)現(xiàn)、采集、組織、存儲等功能,并向應(yīng)用層提供對外服務(wù)的開放服務(wù)接口。
3.3? ? 應(yīng)用層
智庫資源知識組織框架的應(yīng)用層是在集成智庫資源的基礎(chǔ)上,提供統(tǒng)一的服務(wù)接口,為用戶提供增值服務(wù),如智庫資源語義檢索、關(guān)聯(lián)瀏覽、精準(zhǔn)推薦、個性化定制等。語義檢索是在傳統(tǒng)詞檢索方式的基礎(chǔ)上,進(jìn)一步提供的問答檢索方式;關(guān)聯(lián)瀏覽是在語義檢索的結(jié)果上為用戶提供其他相似、相關(guān)資源的瀏覽;精準(zhǔn)推薦是根據(jù)用戶的檢索行為將相似、相關(guān)資源主動推薦給用戶的服務(wù);個性化定制是用戶可通過主題詞、資源類型進(jìn)行智庫資源的定制,同時也可對智庫研究熱點(diǎn)、可視化分析的結(jié)果進(jìn)行定制。
4? ?基于語義關(guān)聯(lián)的智庫知識組織實(shí)踐
為了提高全球智庫資源的組織的效率,中科院西北環(huán)境生態(tài)資源研究院蘭州文獻(xiàn)情報中心以CSpace DR為底層平臺構(gòu)建全球智庫信息集成服務(wù)系統(tǒng),結(jié)合元數(shù)據(jù)法和關(guān)聯(lián)本體模型進(jìn)行多源異構(gòu)智庫資源的知識組織體系構(gòu)建。該服務(wù)系統(tǒng)旨在快速集成國內(nèi)外權(quán)威智庫資源,通過對智庫資源(智庫、智庫專家、智庫報告、智庫觀點(diǎn)、機(jī)構(gòu)、新聞等)的知識組織采用本文設(shè)計的知識組織三層框架進(jìn)行有序化組織和關(guān)聯(lián)化呈現(xiàn),從而實(shí)現(xiàn)了智庫資源的利用、共享、傳播和增值等知識化服務(wù)。本文主要對構(gòu)建智庫資源知識組織體系關(guān)聯(lián)層的內(nèi)容進(jìn)行研究。
4.1? ? 智庫資源的實(shí)體-屬性-關(guān)系本體構(gòu)建
首先通過對不同類型多源異構(gòu)的智庫資源進(jìn)行分析,并將分析得到的概念抽象為實(shí)體類,建立實(shí)體類之間的關(guān)系,從而構(gòu)建組織關(guān)聯(lián)智庫資源實(shí)體類的模型,其中類和關(guān)系的表示參考復(fù)用了 PROV本體、VIVO本體的類和屬性以及DC元素(見圖3)。
DC Term中對實(shí)體關(guān)系的定義較為寬泛,在對多源異構(gòu)智庫資源的實(shí)體關(guān)系進(jìn)行描述時不能明確表達(dá)實(shí)體關(guān)系的含義。因此,我們依然通過復(fù)用其他本體模型中實(shí)體關(guān)系的方式對智庫資源實(shí)體關(guān)系進(jìn)行擴(kuò)展描述,主要復(fù)用prov本體模型中的關(guān)系屬性(如pro: affliatedOrganization、prov: generated)。
(1)屬于(prov:affliatedOrganization):復(fù)用prov模型中affliatedOrganization,用以表示智庫專家(prov:person)隸屬于智庫機(jī)構(gòu)(prov:organization);
(2)出版(dcterms:hasPublished):復(fù)用dcterms元素中的Published,用以表示智庫機(jī)構(gòu)(prov:organization)出版或發(fā)布智庫動態(tài)(prov:activity)或智庫產(chǎn)品(prov:asset);
(3)產(chǎn)出(prov:generated):復(fù)用prov模型中的generated,用以表示智庫專家(prov:person)發(fā)表了相關(guān)的智庫產(chǎn)品(prov:asset);
(4)包含(dcterms:hasPart):復(fù)用dcterms元素中的關(guān)聯(lián)關(guān)系hasPart,用以表示智庫產(chǎn)品(prov:asset)包含智庫報告(fabio: Report)、智庫論文(bibo: Article)、博客(blog)、評論(commentary)、智庫政策(policy)。
在設(shè)計智庫資源元數(shù)據(jù)元素集時,主要以DC元數(shù)據(jù)標(biāo)準(zhǔn)構(gòu)建智庫資源的核心元數(shù)據(jù)元素集合,同時融合專門元數(shù)據(jù)元素對核心元數(shù)據(jù)進(jìn)行補(bǔ)充和擴(kuò)展,最終形成適用于智庫資源的集成元數(shù)據(jù)標(biāo)準(zhǔn)。在完成集成元數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)后,在智庫資源實(shí)體化的基礎(chǔ)上對其屬性以及相互關(guān)系進(jìn)行定義,并按照集成元數(shù)據(jù)標(biāo)準(zhǔn)建立智庫資源的“實(shí)體-屬性-關(guān)系”網(wǎng)絡(luò)圖(見圖4),為構(gòu)建智庫資源的集成元數(shù)據(jù)本體奠定基礎(chǔ)。
集成元數(shù)據(jù)本體解決了智庫資源元數(shù)據(jù)語義異構(gòu)的問題,包括資源采用不同元數(shù)據(jù)方案所造成的微觀結(jié)構(gòu)的異構(gòu)問題以及資源對象之間存在的復(fù)雜的關(guān)聯(lián)關(guān)系,使智庫資源有了基本的微觀結(jié)構(gòu)。但智庫資源包含了不同類型多源異構(gòu)資源,僅構(gòu)建智庫資源的集成元數(shù)據(jù)本體不足以實(shí)現(xiàn)全球智庫信息集成服務(wù)系統(tǒng)在應(yīng)用層面的語義化服務(wù)。因此,我們在智庫資源集成元數(shù)據(jù)本體的基礎(chǔ)上采用關(guān)聯(lián)數(shù)據(jù)的方式對智庫資源進(jìn)行再組織,從而為實(shí)現(xiàn)全球智庫信息集成服務(wù)系統(tǒng)的語義化服務(wù)提供保障。
4.2? ?智庫資源知識組織關(guān)聯(lián)模型實(shí)例
全球智庫信息集成服務(wù)系統(tǒng)在智庫資源集成元數(shù)據(jù)本體的基礎(chǔ)上,依據(jù)上文分析的智庫資源實(shí)體、屬性和關(guān)系,建立了本體模型的實(shí)體類和屬性(包括對象屬性和數(shù)值屬性)來表示智庫資源的語義關(guān)聯(lián)體系。如智庫資源實(shí)體類、智庫資源對象屬性、智庫資源實(shí)體類的本體層級關(guān)系(見圖5)、智庫資源語義關(guān)聯(lián)本體模型(見圖6)等。
4.3? ? ?智庫資源知識組織實(shí)踐的價值應(yīng)用
智庫資源語義關(guān)聯(lián)本體模型為全球智庫信息集成服務(wù)系統(tǒng)中發(fā)現(xiàn)隱形知識、挖掘隱形關(guān)系提供了概念模型,通過概念模型可以實(shí)現(xiàn)全球智庫信息集成服務(wù)系統(tǒng)的語義化服務(wù),具體包括:
(1)整合智庫資源、發(fā)現(xiàn)智庫知識。傳統(tǒng)智庫活動中、智庫相關(guān)內(nèi)容之間相互獨(dú)立存在,面向語義關(guān)聯(lián)的智庫資源知識組織將獨(dú)立的、分散的智庫資源進(jìn)行有效整合,不僅可以通過關(guān)聯(lián)模型梳理智庫資源之間的關(guān)聯(lián)關(guān)系,并且可以通過智庫資源之間的富語義關(guān)系發(fā)現(xiàn)隱藏的智庫知識,從而為智庫決策和戰(zhàn)略規(guī)劃提供輔助支撐。
(2)構(gòu)建可擴(kuò)展的智庫組織管理模式。智庫產(chǎn)品進(jìn)一步細(xì)化,并與智庫主體產(chǎn)生關(guān)系,實(shí)現(xiàn)了不同維度對智庫資源的組織管理模式。面向語義關(guān)聯(lián)的智庫資源知識組織體系具有良好的可擴(kuò)展性,此模型可在不改變現(xiàn)有智庫資源實(shí)體及關(guān)系的前提下,任意維度均可快速添加新的實(shí)體或關(guān)系。
(3)揭示豐富的智庫資源關(guān)系。智庫資源語義關(guān)聯(lián)模型擴(kuò)展了智庫資源關(guān)系的類型,解釋了較為復(fù)雜的關(guān)聯(lián)關(guān)系,使得智庫資源成為富語義的對象,促進(jìn)智庫知識庫可以提供更加豐富知識關(guān)聯(lián)服務(wù)。
5? ?結(jié)語
本文提出了一個面向語義關(guān)聯(lián)的智庫資源知識組織框架,該框架具有三個層次,即元數(shù)據(jù)層、關(guān)聯(lián)層和應(yīng)用層。關(guān)聯(lián)層是該框架的核心層,其中重點(diǎn)在于智庫資源集成元數(shù)據(jù)本體的設(shè)計、智庫資源“實(shí)體-屬性-關(guān)系”的網(wǎng)絡(luò)圖設(shè)計、多源異構(gòu)智庫資源的元數(shù)據(jù)語義互操作實(shí)現(xiàn)等。通過構(gòu)建集成元數(shù)據(jù)本體,并在此基礎(chǔ)上構(gòu)建智庫資源之間的關(guān)聯(lián)關(guān)系,從而解決了智庫資源之間,以及智庫資源與外部資源之間的互聯(lián)互通,最終可為用戶提供智庫知識化服務(wù)。在今后的研究中,還將對關(guān)聯(lián)數(shù)據(jù)的發(fā)布、語義化服務(wù)的擴(kuò)展進(jìn)行深入的研究。