徐 雷 葉均玲
(武漢大學語義出版與知識服務(wù)實驗室,湖北 武漢 430072)
蘇聯(lián)著名情報學家米哈依諾夫在其科學交流系統(tǒng)理論中,將基于科技文獻載體的信息交流稱為正式科學交流,把學者之間的直接交流稱為非正式交流[1]?;ヂ?lián)網(wǎng)流行之前的科學交流過程,受到時空的嚴重制約,科學創(chuàng)作、發(fā)表、評議、傳播等環(huán)節(jié)相對獨立且周期較長,科學交流的效率不高。進入網(wǎng)絡(luò)時代,科學交流的載體和方式都發(fā)生了巨大變化,不再受時空限制,科學交流環(huán)節(jié)不斷出現(xiàn)新的交流媒介??茖W知識發(fā)布與傳播的過程表現(xiàn)出較強的即時性和動態(tài)性,正式交流和非正式交流過程在新型技術(shù)平臺支持下逐漸融合,科學交流的效率得到空前提高。除傳統(tǒng)書報刊等物理載體及交流渠道外,當前的科學交流環(huán)境主要以各類學術(shù)數(shù)據(jù)庫、學術(shù)社交平臺、開放科學數(shù)據(jù)等為主要技術(shù)特征,以網(wǎng)絡(luò)評審、多渠道分發(fā)、多方式溝通等為主要交流手段,并出現(xiàn)了諸如預(yù)印本、網(wǎng)絡(luò)首發(fā)、開放獲取、開放評審等科學交流實踐與理念,形成新的科學交流生態(tài)系統(tǒng)??茖W成果發(fā)表周期縮短,以數(shù)字出版物為主要載體的科學知識呈井噴式增長,在看似高效的科學交流系統(tǒng)中,科研人員正面臨著被海量科技文獻淹沒的困境。為了跳脫這一困境,實現(xiàn)高效的科學交流,滿足科研人員的各類需求,顯然需要新的理論和方法來適應(yīng)變化中的科學交流活動??茖W交流活動圍繞著科學知識的生產(chǎn)、消費過程展開,可通過革新科學知識的組織和呈現(xiàn)方式來提升科學交流的效率。語義出版技術(shù)[2]通過對數(shù)字資源進行細粒度的結(jié)構(gòu)化組織進而為智能化知識服務(wù)場景提供支撐,是知識組織與知識服務(wù)的有效手段,對于提升科學交流效率具有重要應(yīng)用價值。實踐中,語義出版技術(shù)通常表現(xiàn)為使用各類語義模型來對科學交流環(huán)節(jié)中涉及的各類科學交流實體進行不同粒度的語義關(guān)聯(lián)組織,以出版物為中心來組織各類科技資源的語義出版實踐最為常見,從科學交流的動態(tài)性及全局性視角來組織各類科學交流實體,進而構(gòu)建科學交流語義模型的實踐較少。本文基于科學交流相關(guān)理論及語義出版實踐,將科學交流全過程語義化,提取科學交流典型場景和核心要素,并從事件視角構(gòu)建科學交流語義框架模型,并將該模型應(yīng)用于科學交流知識服務(wù)場景。
建立科學交流語義框架模型,目的在于對科學交流的特征、演變和核心流程進行語義組織,進而為科學交流場景提供智能支撐。當前的研究實踐主要從3個方面開展:宏觀科學交流模型設(shè)計、具體科學交流環(huán)節(jié)語義模型構(gòu)建以及科學交流事件視角下的語義模型設(shè)計。
宏觀科學交流模型通?;谛畔⑸芷诶碚?,通過對科學交流過程進行調(diào)研和歸納,提取典型場景、核心要素并以流程圖的形式來表達其中的科學信息流動情況。具有代表性的模型主要有Garvey-Griffith[3]、Roosendaal[4]、Hurd的科學交流預(yù)測模型[5]以及SCLC模型[6]等。其中,Garvey-Griffith模型從時間角度,梳理出了開始研究、完成研究、投稿、出版、年度評審和引用六大科學交流典型事件;Roosendaal模型從功能視角總結(jié)了4個科學交流環(huán)節(jié),即注冊(Registration)、認證(Certification)、告知(Awareness)和存檔(Archiving);Hurd的預(yù)測模型提出了在2020年將會出現(xiàn)的科學交流要素:電子機構(gòu)庫、數(shù)字圖書館、自存檔、聚合服務(wù)器站點等數(shù)字化要素,在當今已得到了驗證。SCLC模型將科學交流視為動態(tài)循環(huán)過程,采用IDEFO建模方法詳細梳理了從資助研發(fā)、開展研究、成果交流到知識應(yīng)用4個階段的近200個科學交流活動。除上述科學交流模型之外,從生命周期視角來對科學交流環(huán)節(jié)進行建模的實踐還很多,如墨爾本大學圖書館的5階段科學交流模型[7]、中佛羅里達大學圖書館的5階段科學交流模型[8]、西悉尼大學圖書館的6階段科學交流模型[9],這些模型基本上都包括了提出研究問題、開展研究、成果發(fā)布、傳播、存檔等環(huán)節(jié)。
除從宏觀角度對科學交流體系進行建模外,還可以從微觀視角深入科學交流的具體環(huán)節(jié),對不同環(huán)節(jié)進行語義建模。在具體科學交流環(huán)節(jié)語義模型構(gòu)建方面,SPAR[10]是該領(lǐng)域目前最具代表性的本體模型,其包括CiTO/C4O(文本引用類型及統(tǒng)計本體)、BiRO(書目參考本體)、DoCO(文檔區(qū)塊本體)、PSO(出版狀態(tài)本體)、PWO(出版工作流本體)、PRO(出版角色本體)和SCoRO(學術(shù)貢獻和角色本體)等15個本體,分別用于組織科學交流不同環(huán)節(jié)中的文獻元數(shù)據(jù)、文獻引用、篇章結(jié)構(gòu)等資源信息以及出版流程、利益相關(guān)者、出版狀態(tài)等相關(guān)實體,對于構(gòu)建科學交流語義模型具有很強的參考價值。此外,還有SWRC(Semantic Web for Research Communities)[11]本體、EXPO(Ontology of Scientific Experiments)[12]本體、SWC(Semantic Web Conference)[13]本體、RO(Research Object Ontology)[14]本體分別用于描述研究社群、科學實驗、學術(shù)會議和研究對象等科學活動構(gòu)成要素。
此外,因科學交流活動具有很強的動態(tài)性,可從事件視角看待和組織整個科學交流體系。事件視角下的科學交流語義模型以科學事件為基礎(chǔ)來組織科學交流活動,事件語義模型[15]一般包括Event(事件)、Agent(代理)、Time(時間)、Place(地點)等事件要素。典型的科學交流事件本體有SEDE(Scholarly Event Description Ontology)學術(shù)活動描述本體[16]、SEO(Scientific Event Ontology)科學事件本體[17]。其中,SEDE從事件的施動者和受動者的角度切入,將學術(shù)事件解構(gòu)到原子級別;SEO則注重描述科學事件與其他實體之間的屬性關(guān)聯(lián)。
上述實踐分別從宏觀和微觀層面設(shè)計了科學交流的實踐框架,宏觀科學交流模型偏向于科學交流環(huán)節(jié)的劃分,具體環(huán)節(jié)語義模型偏向于特定的科學交流組成要素,事件視角下的科學交流語義模型側(cè)重于典型科學交流事件的組織。不同框架中涉及的科學交流要素和環(huán)節(jié)通常具有很強的同質(zhì)性,但是目前這些框架缺乏統(tǒng)一的組織體系和廣泛的關(guān)聯(lián)。因此,亟需一個統(tǒng)一的科學交流語義框架模型,一方面對科學交流的全流程進行系統(tǒng)建模;另一方面對現(xiàn)有的相關(guān)實踐進行關(guān)聯(lián)。
通過調(diào)查現(xiàn)有研究與實踐,綜合考慮科學交流的生命周期和功能特性,本文歸納出科學交流的六大典型場景:準備研究(Prepare Research)、開展研究(Conduct Research)、發(fā)表成果(Publish Results)、傳播(Dissemination)、評價(Evaluation)和存檔(Archiving)。一般而言,準備研究階段是科研人員發(fā)現(xiàn)科學問題,針對待解決的問題收集與處理文獻資源、尋找合作伙伴、獲取資助,并制定相應(yīng)研究方案的過程;開展研究階段是作者根據(jù)已制定的研究方案,選取合適的研究方法開展科學實驗、進行文獻研究等科研活動,進而將研究結(jié)果形成論文、專利或?qū)嶒瀳蟾娴榷喾N形式文獻資源的過程;在發(fā)表成果階段,作者進行期刊投稿或?qū)@蛯?,通過領(lǐng)域?qū)<液蛯W者的同行評議,再經(jīng)過作者修改、編輯排版等環(huán)節(jié)后由出版商以紙質(zhì)或數(shù)字化形式發(fā)布在多種平臺上;傳播階段主要是在以科學出版物為代表的文獻資源發(fā)表以后,科學社區(qū)中的研究人員通過正式或非正式渠道獲取、閱讀和分享文獻資源,并基于文獻資源中研究結(jié)果開展具體學術(shù)交流活動的過程;評價階段主要是相關(guān)評價組織通過制定評價方案對研究人員、研究機構(gòu)、出版物等進行評價得到評價結(jié)果并應(yīng)用的過程;存檔階段是指將紙質(zhì)或數(shù)字版本的文獻資源保存在機構(gòu)庫、數(shù)據(jù)庫或者檔案館中,以便于長期訪問和廣泛傳播的過程。
需要注意的是,這6個場景不具有嚴格意義上的時序關(guān)系,實踐中科學交流的場景通常存在重疊和交叉。從整個科學交流過程看,前3個場景是科學知識的生產(chǎn)階段,后3個場景是科學知識的消費階段。提出研究問題可視為科學交流的起點,推動新一輪科學研究的萌芽、發(fā)展和產(chǎn)出。評價和存檔階段產(chǎn)生的評價結(jié)果以及保存的文獻資源可以作為準備研究階段查找、篩選和閱讀文獻的依據(jù),此階段的科學交流信息會流入下一輪的科學知識生產(chǎn)中??茖W交流活動的6個典型場景就產(chǎn)生了有機聯(lián)系,科學知識的生產(chǎn)與消費形成了循環(huán)往復的過程,并在不斷的反思和革新中推動著學科的進步。在歸納出6個典型的科學交流場景之后,進一步細化出18個子場景,如表1所示。因科學交流活動深受技術(shù)和媒介形態(tài)變革的影響,科學交流體系的場景和環(huán)節(jié)在未來極有可能會發(fā)生變化,對科學交流體系的認識應(yīng)該是一個動態(tài)更新、不斷修正的過程。
表1 科學交流典型場景
在梳理科學交流典型場景之后,通過進一步識別科學交流的核心要素、設(shè)計頂層框架,以結(jié)構(gòu)化、語義化科學交流體系?;趯唧w科學交流活動的觀察和科學研究的一般經(jīng)驗,本文從事件的視角歸納出科學交流過程的核心要素,即科學事件(Scientific Event)、利益相關(guān)者(Agent)、角色(Scientific Role)、時間(Time)、地點(Place)、科技資源(Scientific Resource)??茖W事件(Scientific Event)泛指各類具有完整時空信息的科學交流活動,比如典型的同行評議、學術(shù)會議等活動,以及文獻收集、數(shù)據(jù)共享、學術(shù)匯報等不同粒度的具有研究人員個人特色的科學活動??茖W事件一般發(fā)生在特定的時間(Time)和地點(Place)情境中。利益相關(guān)者(Scientific Agent)即參與科學交流活動的對象,比如研究人員、研究機構(gòu)、出版商、資助機構(gòu)等,利益相關(guān)者一般以特定的角色(Scientific Role)參與具體的科學交流環(huán)節(jié),比如同一個科研人員可分別作為作者、審稿人等參與到論文撰寫、同行評議等科學交流環(huán)節(jié)中??萍假Y源(Scientific Resource)是具體科學事件開展過程中涉及各類資源的統(tǒng)稱,比如準備研究階段使用的各類學術(shù)數(shù)據(jù)庫平臺、參考的各類論文資源,開展研究階段使用的科學數(shù)據(jù)、算法、實驗設(shè)備等軟硬件資源,發(fā)布成果階段產(chǎn)生的評審信息、不同修訂版本的論文等資源。其中,出版物(Publication)是科學交流活動中核心的科技資源,當前的科學交流活動主要圍繞出版物的生產(chǎn)與消費展開。
在科學交流典型場景和核心要素的基礎(chǔ)上,梳理各要素之間的語義關(guān)系,搭建起科學交流語義模型的頂層框架,如圖1所示。該頂層框架以科學事件為核心,由相應(yīng)的組織(Organization)或個人(Person)等利益相關(guān)者參與(hasActor),該過程需要各類科技資源的投入(hasInput),并生成各類科技資源產(chǎn)出(hasOutput)??茖W事件包括準備研究、開展研究、發(fā)表成果、傳播、評價和存檔6個子類,并通過hasSubEvent、hasNextEvent等語義關(guān)系反映子科學事件之間的包含和時序關(guān)系,通過holdsRoleInEvent表征相應(yīng)的利益相關(guān)者在該科學事件中承擔的角色。
圖1 科學交流語義模型頂層框架
在確定科學交流的核心要素和語義模型的頂層框架后,本文采用自頂向下的方式,來進一步劃分科學交流語義模型中的核心要素及其語義關(guān)系。由于不同的科研人員開展具體的科研活動深受個人學術(shù)經(jīng)驗的影響,具體科學交流環(huán)節(jié)的劃分、命名、操作過程具有較大的差異。為了保證所設(shè)計的科學交流語義模型具有較強的通用性,語義模型中的概念要保證一定的抽象粒度,諸如科學事件概念,因科研人員的個人特色以及科學交流媒介的多樣性,使得細粒度的科學事件無法窮盡。因此,本文將科學事件概念劃分為6個典型場景和18個抽象的子環(huán)節(jié),為未來細粒度科學事件的擴展提供可能。此外,本體作為特定領(lǐng)域的共享概念體系,其構(gòu)建過程通常需要遵循復用性原則,因此本文構(gòu)建的科學交流語義框架模型復用了FOAF、SPAR、RO等大量的本體詞匯,比如時間概念復用了Time本體,可根據(jù)具體的時間信息來選擇使用時間點(Time Instant)還是時間段(Time Interval)來描述,遵循復用性原則為語義框架模型的互操作奠定了基礎(chǔ)。
對于科學交流語義框架模型的構(gòu)建過程而言,本文選用本體構(gòu)建七步法[18],具體構(gòu)建流程如圖2所示。首先基于科學交流的一般經(jīng)驗,梳理科學交流的典型場景和核心要素,建立語義模型的頂層框架;然后通過收集科學交流相關(guān)本體、科學交流理論模型等資源,復用相關(guān)本體詞匯及分類方法;之后使用OWL本體描述語言對科學交流語義模型中的核心要素及關(guān)系進行形式化表達,初步形成語義模型的類屬結(jié)構(gòu);再通過隨機抽樣的方法選取20個不同學科領(lǐng)域的學術(shù)會議官網(wǎng),判斷該模型是否蘊含會議網(wǎng)站中提及的科學事件和實體,以驗證該模型的合理性;最后,通過具體的科學交流場景對該模型進行實例化,以驗證該模型在應(yīng)用中的有效性。
圖2 科學交流語義本體構(gòu)建原則與流程
在科學交流語義模型頂層框架的基礎(chǔ)上,對本體的核心類及屬性進行細化和分類,進一步規(guī)范和完善科學交流語義框架模型的類屬結(jié)構(gòu),并將該本體命名為科學交流本體(Scientific Communication Ontology,簡稱SCO)。本體的核心類如表2所示,主要屬性如表3所示。
表2 科學交流本體中的核心類
表3 科學交流本體中的主要屬性
學術(shù)會議是典型的科學交流活動,為了驗證該本體模型類屬結(jié)構(gòu)的合理性和全面性,本文隨機選擇20個不同領(lǐng)域的學術(shù)會議網(wǎng)站,通過解讀這些網(wǎng)頁中的征文、會議議程、會議主題等不同板塊的內(nèi)容信息,抽取其中的科學交流相關(guān)實體、具體科學領(lǐng)域?qū)嶓w、行為動詞等詞匯,通過抽象出這些詞匯的概念類型來檢驗這類具體科學交流信息與本文設(shè)計的框架模型的映射匹配程度。通過匹配映射操作,驗證本文設(shè)計的框架模型能夠很好地覆蓋該類特定類型的科學交流場景。
本體構(gòu)建中必不可少的環(huán)節(jié)就是本體復用,在明確SCO類屬結(jié)構(gòu)的過程中共復用了20個相關(guān)本體,并通過relatedModel關(guān)系提供了關(guān)聯(lián)更多相關(guān)語義模型的能力。具體涉及SPAR系列本體、SEM事件本體、Time時間本體、DBO地點本體、PAV來源及版本控制本體、RO研究對象本體等。圖3呈現(xiàn)了在SCO基礎(chǔ)上,通過relatedModel屬性來關(guān)聯(lián)科學交流語義本體詞匯與被復用的本體的情況,可以看到本文構(gòu)建的科學交流語義框架模型的核心類屬結(jié)構(gòu)都有相對應(yīng)的本體被復用,該本體可以作為導航、集成和鏈接其他科學交流相關(guān)語義模型的門戶,增強科學交流相關(guān)實踐的體系性和規(guī)范性。對被復用本體和復用具體情況的描述如表4所示,在復用方式上,可分為直接復用和間接復用兩大類型。其中,直接復用即指通過類、屬性的重用或者父/子類、屬性的繼承進行直接關(guān)聯(lián),如出版物(Publication)類直接復用FaBiO本體中的對應(yīng)類(fabio:Publication)、科學事件類(Scientific Event)則繼承了SEM本體中的sem:Event類;間接復用指通過屬性的定義域、值域或者屬性之間的互逆等關(guān)系進行間接關(guān)聯(lián)[19],比如對出版物(Publication)類引用計數(shù)情況的描述使用了C4O本體中的c4o:GlobalCitationCount類作為其值域(range)。統(tǒng)觀表4中被復用的本體,大多數(shù)從學術(shù)資源等科學交流實體的視角來進行建模,實踐中科學社區(qū)對同一類型的資源描述存在大量的重復建?,F(xiàn)象,而從動態(tài)流程視角構(gòu)建本體的實踐較少。本文從事件動態(tài)的維度來組織科學交流過程中的各類要素進而構(gòu)建科學交流語義框架模型,克服了以資源為中心的組織模式不能有效反映科學交流動態(tài)性的不足,同時從科學交流全生命周期視角進行建??梢詫F(xiàn)有的語義模型以及未來的相關(guān)實踐都納入到一個宏觀的科學交流體系,加強科學交流領(lǐng)域中語義模型的自動發(fā)現(xiàn)、復用、補充、完善等實踐環(huán)節(jié)。
圖3 本體復用關(guān)聯(lián)關(guān)系
表4 科學交流本體復用情況
基于科學交流語義框架模型,對6個典型場景進行實例化操作,準備研究、開展研究、發(fā)表成果和傳播階段以上海交通大學金耀輝教授團隊2021年在國際頂尖人工智能聯(lián)合會議(International Joint Conference on Artificial Intelligence,以下簡稱為IJCAI)上發(fā)表的會議論文《A Generative-Symbolic Model for Logical Reasoning in NLU》為實例,展示相對完整的科學研究過程。評價和存檔階段則分別選取評價科研人員和存檔圖書兩種科學場景,以顯示科學交流語義模型的適用性。
準備研究階段包括提出研究問題、準備與處理相關(guān)資源、尋找科研合作伙伴、獲取科研資助和制定研究方案等子環(huán)節(jié)。一般而言,科學研究的開展主要依靠科研人員自主進行研究規(guī)劃設(shè)計,準備研究階段的實例化可由科研人員借助各類科研輔助工具進行,諸如文獻管理工具、科研筆記工具、研究數(shù)據(jù)管理工具等都可用于對準備研究階段的行為數(shù)據(jù)進行收集管理,語義框架模型可嵌入到這類工具中進行實例化。由于該階段信息的獲取程度有限,為了驗證該階段模型實例化的可行性,本文通過事后驗證的方式獲取這類信息進行實例化。具體而言,合作伙伴和科研資助對應(yīng)于科研成果的作者、科研基金信息,這些信息可以直接獲取并被實例化。而研究問題、研究方案的內(nèi)容往往隱藏在正文中,一般不能直接獲取,需要通過人工或自動化程序?qū)茖W論文進行解讀與抽取。本文通過人工閱讀理解的方式獲取這類信息,并通過復用SWAN、FaBiO等本體中的詞匯進行實例化,如圖4所示。
圖4 準備研究階段實例化示例
開展研究階段包括執(zhí)行研究方案和表達研究結(jié)果等子環(huán)節(jié)。類似于準備研究階段,本文也通過從已發(fā)表的論文等相關(guān)資源中獲取開展研究階段包含的科學事件,如開展科學實驗、數(shù)據(jù)分析等,實例化結(jié)果如圖5所示。
圖5 開展研究階段實例化示例
發(fā)表成果階段包括投稿、同行評議、通知修改和準備出版等子環(huán)節(jié)。發(fā)表成果階段在出版商等外部中介的參與下,此階段的科學信息相對研究階段更加開放,但部分科學信息如責任編輯信息、同行評議結(jié)果、手稿不同修改版本等都保存在平臺內(nèi)部,其可見性由平臺的開放程度決定。因此,發(fā)表成果階段一方面可借助投審稿系統(tǒng)、期刊網(wǎng)站、開放同行評審平臺等的公開信息;另一方面也可從已發(fā)表文獻資源中提取有關(guān)科學信息進而對投稿、同行評議等科學事件進行實例化,實例化結(jié)果如圖6所示。
圖6 發(fā)表成果階段實例化示例
在實例化的基礎(chǔ)上,可以進行語義查詢以支撐科學信息的共享和利用。此處以科學出版物在同行評議環(huán)節(jié)的評審信息的查詢?yōu)槔?,查詢結(jié)果不僅能夠增強對評審過程和質(zhì)量的信任[21],還能為作者提供期刊會議投稿注意事項、審稿風格等信息。此處查找以“NLU”作為研究問題的論文的評審信息,如圖7所示。
圖7 科學評審結(jié)果SPARQL查詢
傳播階段包括數(shù)據(jù)庫訂閱、網(wǎng)絡(luò)學術(shù)社區(qū)互動和參加學術(shù)活動等子環(huán)節(jié)。傳播階段實例化可借助科學交流工具如學術(shù)會議官網(wǎng)、網(wǎng)絡(luò)學術(shù)社區(qū)、學術(shù)數(shù)據(jù)庫等發(fā)布的信息來完成,相關(guān)實例信息的開放程度較高但較為分散,可從多種渠道檢索與獲取,實例化結(jié)果如圖8所示。
圖8 傳播階段實例化示例
評價階段是對文獻資源、研究人員或研究機構(gòu)等進行科學評價并形成評價結(jié)果的過程。本文以愛思唯爾2021年發(fā)布的中國高被引學者年度榜單為例,該評價活動向社會面公開透明,能夠借助機構(gòu)發(fā)布的評價相關(guān)信息完成實例化過程,實例化結(jié)果如圖9所示。
圖9 評價階段實例化示例
存檔階段是將科學交流過程中產(chǎn)生的文獻資源等進行存檔的過程。本文以書籍《科學交流與情報學》在武漢大學圖書館存檔為例,圖書在圖書館員的操作下入庫后會生成相應(yīng)的存檔版本,實例化結(jié)果如圖10所示。
圖10 存檔階段實例化示例
從上面的實例化過程可以看出,科學交流的不同環(huán)節(jié)具有不同的開放程度,這就意味著科學交流語義框架模型的應(yīng)用需要不同的主體協(xié)同參與,才能更好地實現(xiàn)科學交流全流程的語義化。具體來說,可從研究人員視角切入,在其準備、開展研究階段,就結(jié)構(gòu)化、語義化其研究過程中的數(shù)據(jù),為未來科學研究的可共享性和可再現(xiàn)性提供支撐,實現(xiàn)真正的語義出版[22];還可以從出版商視角入手,結(jié)構(gòu)化并開放同行評議流程、評審意見、評審結(jié)果等信息,提升科學交流過程的透明性、可信任性。其他參與主體諸如期刊編輯、會議贊助商和技術(shù)服務(wù)商等都可以在科學交流全流程語義化中發(fā)揮作用。
本文提出了一種面向科學交流全流程的語義框架模型,構(gòu)建了一個可用于描述不同粒度科學交流事件的頂層框架,致力于科學交流全生命周期過程的語義化。本文首先基于科學交流理論與實踐,歸納出科學交流的典型場景,再從其中識別科學交流核心要素構(gòu)建科學交流語義模型頂層框架?;诒倔w構(gòu)建原則和方法,完善科學交流語義本體的類屬結(jié)構(gòu),同時進行本體復用情況分析,最后以科學研究實際開展過程作為實例來驗證本體結(jié)構(gòu)的科學性。
科學交流語義模型的設(shè)計為科學交流的全流程提供了統(tǒng)一的語義框架,其類屬結(jié)構(gòu)在設(shè)計時保持一定的抽象性來容納具體科學交流環(huán)節(jié)的差異性,并通過復用大量語義出版本體模型來增強該框架模型的可重用性。語義框架模型的設(shè)計為科學交流各個階段的語義化實踐提供了關(guān)聯(lián)接口和可復用的候選本體集合,也為開拓新的科學交流語義化場景提供了宏觀視角。同時,在語義框架模型的具體實例化等實踐過程中也看到,不同科研主體介入科學交流的不同環(huán)節(jié)會產(chǎn)生不同權(quán)屬與開放程度的科學數(shù)據(jù),這就需要多方科研主體參與到科學交流不同環(huán)節(jié)的語義實踐中,進一步開放各個階段的科學數(shù)據(jù),集成多種科學交流工具和平臺,革新科學交流生態(tài)體系,實現(xiàn)開放科學實踐的全流程覆蓋與互通,才能更好地發(fā)揮語義框架模型在科學交流全流程中的作用,為實現(xiàn)科學交流全生命周期的智能化知識服務(wù)場景提供支撐,從而進一步提升當前科學交流的效率。