谷紫藤
(河北大學(xué)管理學(xué)院圖書館 河北 保定 071000)
國(guó)內(nèi)語義出版領(lǐng)域相關(guān)概念研究綜述
谷紫藤
(河北大學(xué)管理學(xué)院圖書館 河北 保定 071000)
語義出版是基于傳統(tǒng)互聯(lián)網(wǎng)技術(shù)和語義網(wǎng)技術(shù),結(jié)合自然語言處理、本體和信息可視化技術(shù)而發(fā)展起來的一種新興出版形態(tài),是數(shù)字出版的高級(jí)形式。本文以中國(guó)知網(wǎng)、萬方、維普三大中文數(shù)據(jù)庫(kù)為檢索平臺(tái),收集了三大數(shù)據(jù)庫(kù)在語義出版領(lǐng)域的研究文獻(xiàn),梳理了語義出版的概念及發(fā)展歷程,對(duì)語義出版相關(guān)概念,可視化出版、互動(dòng)出版、增強(qiáng)出版等進(jìn)行辨別,以期能對(duì)當(dāng)下語義出版領(lǐng)域的發(fā)展現(xiàn)狀作出分析,為語義出版的未來發(fā)展趨勢(shì)作出預(yù)測(cè)。
語義出版;數(shù)字出版;納米出版物;知識(shí)組織
如今,博客、微博、社交網(wǎng)絡(luò)、移動(dòng)服務(wù)在互聯(lián)網(wǎng)時(shí)代飛速發(fā)展,這給我們帶來了很大的便利,與此同時(shí),我們也面臨著“信息過載”“信息迷航”“信息孤島”等問題。此外,傳統(tǒng)的元數(shù)據(jù)描述已經(jīng)無法滿足科研用戶對(duì)于資源的獲取以及檢索需求。所以,面向以關(guān)聯(lián)數(shù)據(jù)為基礎(chǔ)技術(shù)的web3.0的語義技術(shù)在出版領(lǐng)域得到應(yīng)用,它增強(qiáng)了出版內(nèi)容的語義標(biāo)識(shí),使得信息組織在語義時(shí)代又有了新的發(fā)展。語義技術(shù)解決了正式學(xué)術(shù)交流與非正式學(xué)術(shù)交流共同面對(duì)的問題,揭示了出版物之間的關(guān)聯(lián),實(shí)現(xiàn)內(nèi)容支架的互操作和交互。
語義出版是借助信息技術(shù)對(duì)傳統(tǒng)數(shù)字出版物進(jìn)行語義標(biāo)注、語義關(guān)聯(lián)等富語義化操作并形成語義出版物的一系列過程。語義出版的實(shí)質(zhì)是在線信息服務(wù)提供商和大型學(xué)術(shù)出版機(jī)構(gòu)運(yùn)用語義網(wǎng)的核心思想與相關(guān)技術(shù)向用戶提供科學(xué)知識(shí)的智能化發(fā)布、個(gè)性化獲取和共享處理機(jī)制。自從2009年提出這個(gè)概念以來,學(xué)者們對(duì)于這個(gè)領(lǐng)域的研究逐漸深入,每年發(fā)表的論文也日益增多,對(duì)于語義出版的研究方向及角度也各有千秋,在此,對(duì)于已經(jīng)發(fā)表的文獻(xiàn)進(jìn)行分析,梳理當(dāng)下文獻(xiàn),對(duì)當(dāng)下語義出版領(lǐng)域的發(fā)展現(xiàn)狀做出分析,為語義出版的未來發(fā)展趨勢(shì)做出預(yù)測(cè)。
本文選取中國(guó)知網(wǎng)、萬方、維普這三大中文數(shù)據(jù)庫(kù)為檢索平臺(tái),選定期刊論文、學(xué)位論文、會(huì)議論文選項(xiàng),分別進(jìn)行高級(jí)檢索,檢索式為“主題=“語義出版”or“主題=增強(qiáng)出版”or“主題=納米出版物”(2017年6月28日)在將檢索結(jié)果導(dǎo)出到NoteExpress文獻(xiàn)管理軟件,然后對(duì)三大數(shù)據(jù)庫(kù)的記錄再進(jìn)行查重合并,在對(duì)檢索結(jié)果進(jìn)行剔除,共經(jīng)過兩輪剔除,其中第一輪剔除標(biāo)準(zhǔn)為剔除人物訪談、期刊索引、會(huì)議通知、以及主要題錄信息不全面的文章。第二輪剔除為質(zhì)量剔除,質(zhì)量剔除的標(biāo)準(zhǔn)為體現(xiàn)語義出版、增強(qiáng)出版、納米出版物的語義信息,在本次檢索過程中,主要針對(duì)的是“增強(qiáng)出版產(chǎn)業(yè)”與“增強(qiáng)出版”的分辨以及對(duì)一些帶書名號(hào)的書目的語義處理信息進(jìn)行剔除,例如《修辭語義:描寫與闡釋》出版、增強(qiáng)創(chuàng)新意識(shí)提高出版競(jìng)爭(zhēng)力,最終得到檢索結(jié)果40條記錄。
科技出版和科學(xué)交流的發(fā)展植根于科學(xué)研究本身的范式轉(zhuǎn)換,因此其表現(xiàn)不限于數(shù)字技術(shù)推動(dòng)的載體遷移與升級(jí),而是朝著增強(qiáng)型科學(xué)出版和交流的方向發(fā)展,并集中體現(xiàn)在語義出版、可視化出版、互動(dòng)出版和增強(qiáng)出版等方面。從科學(xué)出版和交流的內(nèi)容來看,新增海量數(shù)據(jù)將轉(zhuǎn)化為有效的結(jié)構(gòu)型數(shù)據(jù),并向著語義和智能出版方向發(fā)展;從科學(xué)出版和交流的工具來看,科技文獻(xiàn)將普遍采用3D圖像、視頻、動(dòng)畫、虛擬現(xiàn)實(shí)等多種媒介呈現(xiàn)方式和技術(shù);從科研成果的組織方式來看,科學(xué)信息和內(nèi)容將根據(jù)用戶需求從線性向非線性組織方式發(fā)展,并表現(xiàn)出更強(qiáng)的交互性特征。[1]
(一)可視化出版
可視化出版利用可視化技術(shù)、虛擬仿真技術(shù)及可視化工具將科學(xué)數(shù)據(jù)和信息立體地呈現(xiàn)在研究人員面前,具有直觀、生動(dòng)、交互性強(qiáng)等優(yōu)點(diǎn),能夠幫助科研人員快速分析和理解抽象概念。在醫(yī)學(xué)、生物學(xué)、天文學(xué)及地球科學(xué)等自然科學(xué)領(lǐng)域,可視化出版一直廣受關(guān)注。可視化出版充分利用2D、3D、虛擬現(xiàn)實(shí)技術(shù),將科研數(shù)據(jù)和信息資源的聯(lián)系與關(guān)聯(lián)生動(dòng)形象的展現(xiàn)出來,既便于科研人員發(fā)現(xiàn)其中的聯(lián)系,也更加明顯易懂。2011年2月,國(guó)際科技信息委員會(huì)(ICSTI)專門召開“科學(xué)信息出版的可視化與多媒體創(chuàng)新”主題研討會(huì),討論數(shù)據(jù)挖掘、可視化、虛擬情境、多媒體創(chuàng)新、圖像索引與分析、人機(jī)交互等多個(gè)主題[2]。可視化出版在信息泛濫的今天也具有意義非凡的利用價(jià)值。
(二)互動(dòng)出版
打破傳統(tǒng)的單向“傳播”模式轉(zhuǎn)而形成作者與用戶之間的雙向“交流”,這是互聯(lián)網(wǎng)環(huán)境下開放科學(xué)倡導(dǎo)的前進(jìn)方向。一直以來,科技出版業(yè)也在促進(jìn)科研工作者之間的互動(dòng)交流。從方式上看,主要包括以博客、社交網(wǎng)絡(luò)等為代表的互動(dòng)交流方式;以學(xué)術(shù)維基(wiki)為代表的動(dòng)態(tài)出版方式;還有以開放式同行評(píng)議為代表的互動(dòng)評(píng)價(jià)方式。當(dāng)博客最先興起時(shí),這一嶄新的交流平臺(tái)就得到科技出版機(jī)構(gòu)的積極采納。近幾年,互動(dòng)性更強(qiáng)的社交網(wǎng)站如推特、臉書、科學(xué)網(wǎng)博客等進(jìn)入科學(xué)交流領(lǐng)域,成為用戶、作者、編輯、出版商等各種角色的主要交流渠道。通過這種雙向的交流,使得用戶不僅作為被動(dòng)的接受者,也可以表達(dá)自己的看法,有利于增強(qiáng)學(xué)術(shù)交流的范圍。
(三)增強(qiáng)出版
為了更好地促進(jìn)研究成果的共享和傳播,數(shù)字出版越來重視增強(qiáng)型出版,增強(qiáng)出版物也應(yīng)運(yùn)而生。增強(qiáng)出版物是連接數(shù)據(jù)和文獻(xiàn)之間的橋梁和紐帶,能夠幫助科研人員發(fā)現(xiàn)大量的灰色文獻(xiàn)。增強(qiáng)出版主要具備以下幾個(gè)特點(diǎn):①可以將研究數(shù)據(jù)、額外資料及發(fā)表出版后的數(shù)據(jù),如元數(shù)據(jù)集、模型、圖表、算法及社交媒體等不同類型數(shù)據(jù)進(jìn)行集成連接,便于科研人員全面地理解數(shù)據(jù)及信息的產(chǎn)生、應(yīng)用與創(chuàng)新過[3];②能夠利用資源地圖(Resource Maps)及永久標(biāo)示符(Persistent Identifi cation Numbers)等在不同類型的資源之間建立關(guān)聯(lián)和資源描述框架,以方便用戶快速檢索和定位資源;③這些內(nèi)容需具備關(guān)鍵詞和數(shù)字摘要,具有機(jī)器可讀、智能標(biāo)記及結(jié)構(gòu)化的特點(diǎn)[4]。
綜上,科技出版和科學(xué)交流的發(fā)展正朝著增強(qiáng)型科學(xué)出版和交流的方向發(fā)展,并集中體現(xiàn)在語義出版、可視化出版、互動(dòng)出版和增強(qiáng)出版等方面,這幾個(gè)模式之間不相互排斥,反而相互融合,共同實(shí)現(xiàn)科學(xué)交流的價(jià)值目標(biāo)。要實(shí)現(xiàn)大規(guī)模的數(shù)據(jù)關(guān)聯(lián),數(shù)據(jù)集本身是否具有良好結(jié)構(gòu),標(biāo)記粒度是否足夠細(xì),它們之間的互操作性如何等又是必須解決的問題。在此過程中,語義出版、可視化出版、互動(dòng)出版、增強(qiáng)出版之間并不存在嚴(yán)格的分界線,而是體現(xiàn)出相互交織的特點(diǎn),共同服務(wù)于科學(xué)交流的價(jià)值目標(biāo),只要符合當(dāng)下及未來的發(fā)展導(dǎo)向的都可以理解為出版的優(yōu)越模式。
[1]徐麗芳,叢挺.數(shù)據(jù)密集、語義、可視化與互動(dòng)出版:全球科技出版發(fā)展趨勢(shì)研究[J].出版科學(xué),2012,(04):73-80.
[2]翁彥琴,李苑,彭?,B.英國(guó)皇家化學(xué)會(huì)(RSC)——科技期刊語義出版模式的研究[J].中國(guó)科技期刊研究,2013,(05):825-829.
[3]Saskia Woutersen-Windhouwer.Enhanced Publications:Linking Publications and Research Data in Digital Repositories[M].Amsterdam:Amsterdam University Press,2009.
[4]汪慶,任慧玲.新技術(shù)環(huán)境下STM出版發(fā)展趨勢(shì)探析[J].科技與出版,2014,(09):123-127.
谷紫藤(1995-),女,漢族,河北石家莊市人,本科生,河北大學(xué)管理學(xué)院圖書館學(xué)專業(yè),研究方向:圖書館學(xué)。