亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        科技出版資源組織方式及其創(chuàng)新

        2015-08-16 14:09:32
        新媒體研究 2015年6期
        關(guān)鍵詞:本體

        ?

        科技出版資源組織方式及其創(chuàng)新

        李弘

        電子工業(yè)出版社,北京100036

        摘要分析了當(dāng)前科技出版資源組織方式及其存在的問(wèn)題,歸納探討了科技出版資源組織方式創(chuàng)新的兩種趨勢(shì)——基于本體的資源組織模式、納米出版物和知識(shí)元出版模式,并闡述了其意義。

        關(guān)鍵詞科技出版;內(nèi)容組織;本體;知識(shí)元;納米出版物

        20世紀(jì)90年代末以來(lái),在互聯(lián)網(wǎng)技術(shù)與現(xiàn)實(shí)需求的雙重推動(dòng)下,科技出版經(jīng)歷了一輪數(shù)字化變革。但從本質(zhì)上講,科技出版的數(shù)字化變革并未改變其資源組織方式,主流學(xué)術(shù)出版商所提供的HTML網(wǎng)頁(yè)或者PDF文檔資源除了將傳統(tǒng)紙質(zhì)印刷版本搬運(yùn)到數(shù)字環(huán)境中來(lái)以外,改變很少。與此同時(shí),互聯(lián)網(wǎng)技術(shù)的進(jìn)步也在改變著科學(xué)知識(shí)交流的環(huán)境,科學(xué)知識(shí)資源呈幾何級(jí)增長(zhǎng)態(tài)勢(shì),高效、快捷地獲取和利用知識(shí)資源成為了科研人員日益迫切的愿望和要求。然而,當(dāng)前科技出版資源組織方式卻存在著語(yǔ)義匱乏、線性組織、非結(jié)構(gòu)化數(shù)據(jù)等問(wèn)題,使得科研人員較難從海量無(wú)序的相關(guān)資源中分析歸納出一條科學(xué)創(chuàng)新的線索,嚴(yán)重影響了科學(xué)交流的效率。為解決這一問(wèn)題,滿足科研人員的需求,科技出版機(jī)構(gòu)正在醞釀著一輪出版資源組織方式的變革。

        1 當(dāng)前科技出版資源組織方式及其問(wèn)題

        科技出版資源組織方式,是科技出版機(jī)構(gòu)在開(kāi)展科技出版活動(dòng)中所采用的內(nèi)容資源組織和存儲(chǔ)的方式。當(dāng)前主流的科學(xué)資源組織方式可以從兩個(gè)維度來(lái)看。從個(gè)體內(nèi)容的組織來(lái)看,當(dāng)前的科技出版資源主要以文獻(xiàn)為單位進(jìn)行組織。HTML網(wǎng)頁(yè)資源或是成為了事實(shí)標(biāo)準(zhǔn)的PDF格式文檔資源,改變的都是科技出版資源的載體,而其內(nèi)容組織方式則仍是以傳統(tǒng)的專(zhuān)著或者論文形式存在。從海量?jī)?nèi)容的組織方式來(lái)看,當(dāng)前的科技出版資源組織方式是基于信息的組織方式,即以知識(shí)的某些屬性特征,如題名、著者、摘要、關(guān)鍵詞、出版者、出版時(shí)間、參考文獻(xiàn)等內(nèi)容特征為基本單元的組織。

        在信息資源規(guī)模及其增速尚未呈現(xiàn)爆炸式發(fā)展之前,基于文獻(xiàn)和信息的科學(xué)資源組織方式能夠較好地滿足科學(xué)交流的需要。但是隨著技術(shù)環(huán)境的改變以及科學(xué)知識(shí)更新?lián)Q代的加快,科研信息已經(jīng)越來(lái)越呈現(xiàn)出爆炸式增長(zhǎng)的趨勢(shì),傳統(tǒng)的科技資源組織方式顯然已經(jīng)無(wú)法適應(yīng)科研人員方便、快速獲取科研信息的要求,以及科學(xué)交流發(fā)展的需要。這主要表現(xiàn)在以下幾個(gè)方面。

        1)缺乏足夠的語(yǔ)義揭示。當(dāng)前,學(xué)術(shù)期刊數(shù)據(jù)庫(kù)普遍采用元數(shù)據(jù),如都柏林核心元數(shù)據(jù)(DC),來(lái)對(duì)出版資源進(jìn)行標(biāo)識(shí)。但這些元數(shù)據(jù)僅僅只是一個(gè)個(gè)孤立的詞匯,相互之間沒(méi)有建立語(yǔ)義關(guān)聯(lián),論文中大量的實(shí)體中蘊(yùn)含的語(yǔ)義關(guān)系及其屬性,也沒(méi)有被標(biāo)識(shí)出來(lái)。計(jì)算機(jī)在面對(duì)這些沒(méi)有進(jìn)行語(yǔ)義標(biāo)注的信息時(shí),就像人類(lèi)面對(duì)一門(mén)用幾乎看不懂的語(yǔ)言擬寫(xiě)的文本,是難以處理的。當(dāng)讀者(特別是非領(lǐng)域?qū)<业钠胀ㄗx者)查找相關(guān)的資源時(shí),計(jì)算機(jī)很難提供精準(zhǔn)的檢索信息,更不用說(shuō)通過(guò)數(shù)據(jù)挖掘等技術(shù)從這些信息中發(fā)現(xiàn)隱含的科學(xué)創(chuàng)新點(diǎn)。語(yǔ)義信息的匱乏還使得當(dāng)前出版資源的組織方式停留在靜態(tài)的水準(zhǔn),無(wú)法滿足個(gè)性化重組和動(dòng)態(tài)更新的需要。

        2)組織粒度過(guò)粗,難以滿足碎片化知識(shí)獲取需求。在實(shí)際研究過(guò)程中,研究人員為了深入研究,往往需要完整地閱讀某篇文獻(xiàn),但研究人員也很可能只需要了解論文中的某一部分,如其中的一個(gè)圖表、一個(gè)結(jié)論或者相關(guān)數(shù)據(jù)等。當(dāng)前,基于文獻(xiàn)的科技信息組織使得研究人員借助搜索工具得到的只能是一篇篇完整的文獻(xiàn)資源,研究人員想要獲得細(xì)粒度的知識(shí)信息,必須逐一瀏覽文獻(xiàn)。而且在搜索工具搜索能力不高的情況下,很可能讀完搜索到的所有文獻(xiàn)還是沒(méi)能找到所需的信息。由此,不僅影響了科學(xué)研究的進(jìn)度,也降低了科學(xué)交流的效率。

        3)僅關(guān)注內(nèi)容的線性層面。當(dāng)前,科技出版物內(nèi)容呈現(xiàn)的線性化特征較為明顯。一般而言,單個(gè)科技出版物的內(nèi)容往往分為若干章,每一章又分為若干節(jié),節(jié)里面還有若干段落、句子,其中還會(huì)插入圖表和公式等。如此,文章的邏輯結(jié)構(gòu)往往隱藏在文章內(nèi)容中,使得讀者很難獲取內(nèi)容深層次的語(yǔ)義信息及內(nèi)容本身之外的補(bǔ)充信息。但事實(shí)上,讀者在閱讀過(guò)程中很多時(shí)候需要跳出內(nèi)容本身的框架,查找相關(guān)信息,如論文中相關(guān)術(shù)語(yǔ)的解釋信息、某個(gè)觀點(diǎn)的補(bǔ)充論證等。這些很可能是這種線性結(jié)構(gòu)的內(nèi)容本身無(wú)法提供的,需要讀者自身花費(fèi)大量的額外時(shí)間查找。這不僅增加了科研人員獲取科研信息的時(shí)間成本,也降低了科學(xué)交流的時(shí)效。

        2 科技出版資源組織方式的創(chuàng)新

        良好的資源組織能夠極大促進(jìn)科研人員快捷高效地獲取所需的科研信息,當(dāng)前科技出版資源組織方式的諸多不足阻礙了高效的科學(xué)交流的形成,這也促使部分知名科技出版機(jī)構(gòu)思考、探索種種改進(jìn)之法。在這些探索的過(guò)程中,一些新的出版資源組織方法也得以嘗試和實(shí)驗(yàn),其中,基于本體的出版資源組織方式、納米出版物和知識(shí)元出版等全新出版模式,得到了極大關(guān)注,并顯現(xiàn)出了未來(lái)廣闊的發(fā)展前景。

        2.1基于本體的資源組織模式

        數(shù)據(jù)的語(yǔ)義匱乏,計(jì)算機(jī)不能準(zhǔn)確識(shí)別用戶的需求,是致使科研人員無(wú)法快速準(zhǔn)確找到所需資源的重要原因。這就需要將內(nèi)容的組織由信息的線性結(jié)構(gòu)層面深入其語(yǔ)義結(jié)構(gòu)層面,從而使得計(jì)算機(jī)可以像人腦一樣理解信息的準(zhǔn)確含義,甚至進(jìn)行自動(dòng)的推理計(jì)算,提升信息的獲取效率及精度。而本體則能夠描述某一領(lǐng)域范圍內(nèi)的核心概念及這些概念之間復(fù)雜的語(yǔ)義關(guān)系和屬性,為人機(jī)交流(對(duì)話、互操作、共享等)提供一種語(yǔ)義基礎(chǔ)[1]。通過(guò)本體來(lái)標(biāo)識(shí)資源,建立資源的本體化描述,計(jì)算機(jī)就能夠準(zhǔn)確識(shí)別內(nèi)容資源的相關(guān)語(yǔ)義信息,進(jìn)而能夠?qū)崿F(xiàn)對(duì)資源的自動(dòng)化處理。正因此,近年來(lái)本體技術(shù)被引入到出版資源尤其是科技出版資源的組織過(guò)程中來(lái),并取得了積極進(jìn)展。如英國(guó)皇家化學(xué)會(huì)(RSC)已經(jīng)將本體技術(shù)納入其語(yǔ)義出版工作計(jì)劃之中,通過(guò)引入生命科學(xué)領(lǐng)域的本體對(duì)其旗下雜志《分子生物系統(tǒng)》的論文中的重要術(shù)語(yǔ)進(jìn)行標(biāo)注,實(shí)現(xiàn)了當(dāng)點(diǎn)擊論文中出現(xiàn)的這些術(shù)語(yǔ)時(shí),就會(huì)自動(dòng)鏈接到這些術(shù)語(yǔ)在本體中的定義等,有效地提高了研究人員資源查找和吸收的效率[2]。

        基于本體的資源組織模式,能夠推動(dòng)內(nèi)容組織由信息深入到信息的語(yǔ)義。通過(guò)本體來(lái)組織資源,能夠賦予資源計(jì)算機(jī)可以理解的語(yǔ)義信息,建立不同系統(tǒng)、不同應(yīng)用程序、人與計(jì)算機(jī)之間相互溝通理解的橋梁,信息與信息之間、信息與人的需求之間可以自動(dòng)地形成多方位的語(yǔ)義關(guān)聯(lián)。如此,計(jì)算機(jī)對(duì)海量資源找到用戶真正所需資源的能力將會(huì)極大提高,并進(jìn)而提高科學(xué)交流的效率。正如有學(xué)者指出,語(yǔ)義標(biāo)記之于科技出版,就如同基礎(chǔ)設(shè)施對(duì)于城市未來(lái)發(fā)展的作用。而本體則是語(yǔ)義標(biāo)記得以實(shí)現(xiàn)的基礎(chǔ)工具。因此,探索基于本體的語(yǔ)義標(biāo)引手段和出版資源組織模式必將是科技出版資源組織模式革新的一個(gè)方向。

        2.2納米出版物和知識(shí)元出版模式

        當(dāng)前,基于文獻(xiàn)的資源組織方式是一種線性的、粗粒度的方式,計(jì)算機(jī)很難根據(jù)人們的偏好自動(dòng)地完成對(duì)它們的重組和復(fù)用,嚴(yán)重制約了科學(xué)交流的效率。為此,知識(shí)管理學(xué)界與學(xué)術(shù)出版界均在嘗試打破資源粗糙、線性的組織方式,實(shí)現(xiàn)文獻(xiàn)資源的細(xì)粒度分割與非線性重組。

        其中,概念網(wǎng)絡(luò)聯(lián)盟(Concept Web Alliance,CWA)就于2009年提出了一種“納米出版物”(Nanopublication)的新的資源組織形態(tài)的概念構(gòu)想。所謂納米出版物,按照nanopub網(wǎng)站的定義,是指最小單元的可出版信息:一個(gè)可以唯一識(shí)別和擁有作者歸屬的斷言[3]。它主要以概念或?qū)嶓w作為基本元素,描述科學(xué)文獻(xiàn)中的基本結(jié)論、科學(xué)事實(shí)或大量實(shí)驗(yàn)數(shù)據(jù)中的實(shí)驗(yàn)結(jié)果,并提供唯一標(biāo)識(shí),描述結(jié)論的出處、原文作者、納米出版物的創(chuàng)建者等背景及語(yǔ)境信息,是科學(xué)文獻(xiàn)在細(xì)粒度上的語(yǔ)義表示、組織和出版形式[4]。納米出版物可以單獨(dú)出版、引用、采用標(biāo)準(zhǔn)的格式表示,還可以用RDF圖和本體進(jìn)行序列化表示,由此叩開(kāi)了機(jī)器可讀數(shù)據(jù)和互操作的大門(mén),使得基于海量、異構(gòu)、分散數(shù)據(jù)的關(guān)聯(lián)發(fā)現(xiàn)變得簡(jiǎn)單,獲得遠(yuǎn)遠(yuǎn)超過(guò)人類(lèi)的推理能力。也正因此,納米出版物自提出之后,已在一些項(xiàng)目中得以應(yīng)用。如Open PHACTS項(xiàng)目將納米出版作為用于表示實(shí)驗(yàn)數(shù)據(jù)和科學(xué)結(jié)論的標(biāo)準(zhǔn)格式;Queralt-Rosinach采用現(xiàn)有本體及可控詞匯集將基因疾病數(shù)據(jù)庫(kù)DisGeNET的數(shù)據(jù)由關(guān)系數(shù)據(jù)庫(kù)轉(zhuǎn)換為納米出版模式的RDF數(shù)據(jù);等等。

        目前,對(duì)納米出版物的研究應(yīng)用主要集中在國(guó)外,國(guó)內(nèi)鮮有相關(guān)的研究發(fā)表,但另一種同樣致力于實(shí)現(xiàn)細(xì)粒度資源表示的方法——知識(shí)元出版模式在國(guó)內(nèi)得到了重視。

        按照溫有奎等人的定義,知識(shí)元是具有完整語(yǔ)義的最小的知識(shí)組成單位,是構(gòu)造知識(shí)結(jié)構(gòu)的最小元素(基元)[5]。如一段文字、一幅圖表、一個(gè)公式、一章或一節(jié)等。基于知識(shí)元的資源組織方式,能夠?qū)ΜF(xiàn)有數(shù)據(jù)中的細(xì)粒度知識(shí)單元進(jìn)行表示和抽取,同時(shí)建立不同知識(shí)元之間以及知識(shí)元與原始文獻(xiàn)之間的語(yǔ)義鏈接。這一方面,目前,CNKI已經(jīng)構(gòu)建了一個(gè)具有一定規(guī)模的基于知識(shí)元庫(kù)的知識(shí)元搜索平臺(tái),能夠?qū)崿F(xiàn)對(duì)學(xué)術(shù)定義、新概念、表格、圖片、數(shù)字等知識(shí)元的直接搜索,并且提供翻譯助手、學(xué)術(shù)趨勢(shì)、分析、熱點(diǎn)統(tǒng)計(jì)分析等功能,較好地滿足了科研人員碎片化、個(gè)性化需求。

        納米出版物模式和基于知識(shí)元的資源組織模式突破了文獻(xiàn)組織方式粗粒度、線性化的局限,試能夠在更細(xì)粒度上實(shí)現(xiàn)資源的有效組織,提供全方位知識(shí)服務(wù)。在此種模式下,科研人員將不僅可以獲得基于文獻(xiàn)的粗粒度資源,也可以獲得基于知識(shí)元或者納米出版模式的細(xì)粒度資源,極大的增加了信息的可發(fā)現(xiàn)性與計(jì)算機(jī)可讀性,增強(qiáng)了知識(shí)交流高效率。

        3 結(jié)束語(yǔ)

        從手寫(xiě)到印刷再到在線,人類(lèi)科學(xué)交流的形式幾經(jīng)變革。但是從內(nèi)容組織的角度來(lái)看,過(guò)去的幾百年來(lái),科研成果一直都是以文獻(xiàn)的方式呈現(xiàn)在科研人員面前。數(shù)字化浪潮下,信息越來(lái)越豐富、內(nèi)容越來(lái)越龐雜,科研人員獲取科研信息的過(guò)程卻變得繁冗不堪。突破紛繁信息的遮蔽,讓有價(jià)值的信息更精準(zhǔn)地被挖掘和發(fā)現(xiàn),成為一個(gè)日益凸顯價(jià)值的新課題。而改變傳統(tǒng)線性的、靜態(tài)的、語(yǔ)義匱乏的文獻(xiàn)組織方式,實(shí)現(xiàn)內(nèi)容組織方式的創(chuàng)新正是回答這一問(wèn)題的關(guān)鍵。有志于此的出版機(jī)構(gòu)已經(jīng)先行在路途上,盡管長(zhǎng)路漫漫,但至少它們已經(jīng)向我們指明了方向。

        參考文獻(xiàn)

        [1]杜小勇,李曼,王大治.語(yǔ)義Web與本體研究綜述[J].計(jì)算機(jī)應(yīng)用,2004(10):45-48.

        [2]Shotton D,K Portwin,K Graham,M Alistair. Adventures in Semantic Publishing: Exemplar Semantic Enhancements of a Research Article. PLoS Computational Biology,2009.

        [3]Nano-Publication in the e-science era. http://www.w3.org/wiki/images/4/4a/HCLS$$ISWC2009$$Workshop$Mons.pdf.

        [4]吳思竹,李峰,張智雄.知識(shí)資源的語(yǔ)義表示和出版模式研究——以Nanopublication為例[J].中國(guó)圖書(shū)館學(xué)報(bào),2013(7):102-109

        [5]溫有奎.基于知識(shí)元的知識(shí)發(fā)現(xiàn)[M].西安:西安電子科技大學(xué)出版社,2009:120.

        作者簡(jiǎn)介:李弘,電子工業(yè)出版社副總編。

        基金項(xiàng)目:本文系文化產(chǎn)業(yè)發(fā)展專(zhuān)項(xiàng)資金項(xiàng)目“面向信息技術(shù)領(lǐng)域的動(dòng)態(tài)出版平臺(tái)研發(fā)與應(yīng)用”的研究成果之一。

        文章編號(hào)2096-0360(2015)06-0069-03

        文獻(xiàn)標(biāo)識(shí)碼A

        中圖分類(lèi)號(hào)G2

        猜你喜歡
        本體
        Abstracts and Key Words
        灰鑄鐵缸體本體抗拉強(qiáng)度提升的研究
        眼睛是“本體”
        對(duì)姜夔自度曲音樂(lè)本體的現(xiàn)代解讀
        領(lǐng)域本體的查詢(xún)擴(kuò)展和檢索研究
        山東冶金(2019年3期)2019-07-10 00:54:02
        本體在產(chǎn)品設(shè)計(jì)知識(shí)管理中的應(yīng)用研究
        《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
        一種基于本體的語(yǔ)義檢索設(shè)計(jì)與實(shí)現(xiàn)
        媒介生存:關(guān)于新聞史研究本體的思考
        專(zhuān)題
        无码人妻精品一区二区三区夜夜嗨| 午夜精品一区二区三区av免费| 精品无码一区二区三区亚洲桃色 | 中文字幕亚洲精品在线免费| 一本色道久久综合亚洲| 国产91人妻一区二区三区| 亚洲av无码乱码精品国产| 欧美乱大交xxxxx潮喷| 成人性生交大片免费看96| 国产无人区码一码二码三mba| 国产高清乱理伦片| 精品国产亚洲一区二区在线3d| 亚洲色图视频在线观看网站| 国产杨幂AV在线播放| 蜜桃av噜噜一区二区三区免费| 国产成人av区一区二区三| 久久久精品毛片免费观看| 亚洲中文字幕国产视频| 亚洲av无码国产精品色午夜字幕| 少妇高潮惨叫正在播放对白| 亚洲一区二区观看播放| 国产视频最新| 免费人成黄页网站在线观看国内 | 亚洲av本道一本二本三区| 国产成人综合精品一区二区| 77777亚洲午夜久久多喷| 精品国产第一国产综合精品| 桃花影院理论片在线| 国模无码人体一区二区| 国产精品 精品国内自产拍| 国产精品一区成人亚洲| 日韩精品一区二区亚洲观看av| 草逼短视频免费看m3u8| 狠狠色综合7777久夜色撩人| 久久久噜噜噜www成人网| 囯产精品无码va一区二区| 国产做床爱无遮挡免费视频 | 亚洲美国产亚洲av| 中文岛国精品亚洲一区| 手机在线中文字幕av| 一区二区在线观看精品在线观看|