亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        語(yǔ)義出版及其應(yīng)用現(xiàn)狀研究

        2021-07-19 00:45:06毛競(jìng)永
        理論與創(chuàng)新 2021年6期

        毛競(jìng)永

        【摘? 要】語(yǔ)義出版是建立在資源深度揭示與高度集成基礎(chǔ)之上的,作為數(shù)字出版的高級(jí)形態(tài),語(yǔ)義出版的深入研究與探索不僅為豐富數(shù)字圖書(shū)館資源集成提供了合理導(dǎo)向與明確目標(biāo),更為數(shù)字圖書(shū)館將資源組織單位由出版單元或文獻(xiàn)細(xì)化到揭示資源“微內(nèi)容”特性的知識(shí)單元提供了可能。本文對(duì)語(yǔ)義出版模型與及其構(gòu)建工具、語(yǔ)義出版關(guān)鍵技術(shù)、語(yǔ)義出版實(shí)踐進(jìn)行全面分析,旨在揭示語(yǔ)義出版在數(shù)字圖書(shū)館資源組織中的重要作用。

        【關(guān)鍵詞】語(yǔ)義出版;數(shù)字圖書(shū)館;數(shù)字資源;關(guān)聯(lián)數(shù)據(jù)

        引言

        語(yǔ)義出版在語(yǔ)義網(wǎng)的基礎(chǔ)上發(fā)展而來(lái),是數(shù)字出版的高級(jí)階段,語(yǔ)義出版的正式概念源自于David Shotton在2009年發(fā)表的《Semantic Publishing:the coming revolution in scientific journal publishing》一文,即,語(yǔ)義出版能增強(qiáng)已發(fā)表論文的含義,促進(jìn)論文能自動(dòng)化獲取,能鏈接到與其語(yǔ)義相關(guān)的文章,并提供多種獲取文章內(nèi)數(shù)據(jù)的訪問(wèn)途徑,使得論文之間的數(shù)據(jù)整合變得更加容易。

        經(jīng)過(guò)十年的發(fā)展,語(yǔ)義出版的對(duì)象已由狹義的學(xué)術(shù)期刊論文發(fā)展到圖書(shū)、學(xué)位論文等形式文獻(xiàn)型學(xué)術(shù)資源,其概念被不斷的豐富和充實(shí),王曉光等人認(rèn)為語(yǔ)義出版是基于語(yǔ)義技術(shù)及其相關(guān)信息技術(shù),通過(guò)語(yǔ)義標(biāo)記豐富期刊文章的表現(xiàn)形式和顯性內(nèi)容,提高文章信息的可操作性和交互性,增強(qiáng)文章關(guān)聯(lián)度,從而改進(jìn)出版流程,進(jìn)而實(shí)現(xiàn)智能化出版的方式。程維紅等人認(rèn)為語(yǔ)義出版是通過(guò)語(yǔ)義標(biāo)記豐富期刊文章表現(xiàn)形式,提高文章信息可操作性和交互性、增強(qiáng)文章關(guān)聯(lián)度、改進(jìn)出版流程的智能化出版方式。汪慶等人認(rèn)為,語(yǔ)義出版可以定義為任何能夠增強(qiáng)期刊文章語(yǔ)義的出版形式,具有語(yǔ)義化、結(jié)構(gòu)化和關(guān)聯(lián)化的特征,能夠?qū)崿F(xiàn)機(jī)器自動(dòng)處理、識(shí)別、集成與整合信息的目的。彭希珺等人則提出語(yǔ)義出版是通過(guò)揭示每篇論文中的知識(shí)單元及其語(yǔ)義類(lèi)型和語(yǔ)義關(guān)系,并且與其他論文、期刊和知識(shí)資源中的知識(shí)單元進(jìn)行關(guān)聯(lián),支持基于動(dòng)態(tài)關(guān)聯(lián)的知識(shí)發(fā)現(xiàn)。許鑫等人認(rèn)為,語(yǔ)義出版是一種語(yǔ)義增強(qiáng)的出版形式,通過(guò)對(duì)文章內(nèi)容和形式進(jìn)行語(yǔ)義標(biāo)記,增強(qiáng)內(nèi)容之間的關(guān)聯(lián),提高科研人員的檢索和獲取效率,實(shí)現(xiàn)智能化出版。

        1.語(yǔ)義出版模型與及其構(gòu)建工具研究

        隨著語(yǔ)義出版概念的不斷豐富,相關(guān)的語(yǔ)義出版模型與構(gòu)建工具也有了一定的成果。其中,語(yǔ)義出版建模的基本思路將出版物內(nèi)容結(jié)構(gòu)化和語(yǔ)義化,主要覆蓋了出版物的內(nèi)容要素、結(jié)構(gòu)要素、出版全流程三個(gè)層面。

        出版關(guān)鍵內(nèi)容建模主要是對(duì)論文關(guān)鍵知識(shí)進(jìn)行語(yǔ)義標(biāo)注,促進(jìn)計(jì)算機(jī)對(duì)論文關(guān)鍵貢獻(xiàn)的自動(dòng)識(shí)別。如國(guó)際概念網(wǎng)絡(luò)聯(lián)盟)提出的納米出版物,由聲明、出處和出版物信息組成來(lái)表示可出版信息最小單元。其中,聲明使用主-謂-賓結(jié)構(gòu)表達(dá)的思想最小單元;出處用于描述如何得到此聲明的情景信息,包括方法和歸屬元數(shù)據(jù);出版物信息將前兩者作為一個(gè)整體進(jìn)行表達(dá)。

        對(duì)出版物結(jié)構(gòu)建模主要是對(duì)文檔的構(gòu)成要素進(jìn)行結(jié)構(gòu)化組織,對(duì)象和關(guān)系的語(yǔ)義構(gòu)建。A.Bardi等人提出的增強(qiáng)型出版物元數(shù)據(jù)模型,描述了出版物的結(jié)構(gòu)和語(yǔ)義特征。該模型包括六部分:文檔構(gòu)成、嵌入部分、參考與引用、可執(zhí)行和可生成,并對(duì)各部分進(jìn)行了對(duì)象和關(guān)系的RDF描述和序列化。J.Kircz提出的模塊化模型中,模塊被定義為具有獨(dú)一無(wú)二特性、自含概念表示的信息單元,將論文看成是整合了數(shù)據(jù)集、圖像、音頻、視頻等模塊的對(duì)象。另外,為便于交流,模塊被連接成固定單元。

        對(duì)出版物全流程建模主要是對(duì)出版全流程(包括文檔信息和出版信息)的描述,支持全工作流的交互和共享。王文清等人報(bào)道的出版物內(nèi)容資源本體模型定義了多個(gè)類(lèi)、屬性和約束,可對(duì)多種出版物數(shù)字資源進(jìn)行統(tǒng)一建模和描述。此外,PUBO采用了OWL描述邏輯,可自動(dòng)驗(yàn)證模型的邏輯完整性,實(shí)現(xiàn)了資源統(tǒng)一管理、互相關(guān)聯(lián)與多系統(tǒng)復(fù)用。Hunter提出新信息格式的科學(xué)出版包,可用于封裝原始數(shù)據(jù)、來(lái)源產(chǎn)品、算法、軟件、文本、相關(guān)上下文環(huán)境以及元數(shù)據(jù),從而滿足科學(xué)家對(duì)科學(xué)結(jié)果的操作需求。

        在論文編輯工具方面,典型的有BioLit項(xiàng)目和SCOPE項(xiàng)目。BioLit項(xiàng)目中可使用基于XML的寫(xiě)作工具,利用美國(guó)醫(yī)學(xué)圖書(shū)館的文檔類(lèi)型定義存儲(chǔ)標(biāo)準(zhǔn)化且機(jī)器可讀的出版物,該工具為開(kāi)放文獻(xiàn)和生物學(xué)數(shù)據(jù)的集成提供方便,使用PLoS和Protein Data Bank(PDB)的全部語(yǔ)料做測(cè)試。

        2.關(guān)鍵技術(shù)研究

        XML。全稱(chēng)為可擴(kuò)展標(biāo)記語(yǔ)言,是根據(jù)萬(wàn)維網(wǎng)本身的特點(diǎn)從SGML所衍生出來(lái)的簡(jiǎn)化格式。XML的設(shè)計(jì)目標(biāo)是提出一種非常簡(jiǎn)單的標(biāo)記語(yǔ)言,并盡可能地減少抽象概念。XML提供了一個(gè)標(biāo)準(zhǔn),使得開(kāi)發(fā)人員可以根據(jù)實(shí)際需要定義自己的新的置標(biāo)語(yǔ)言,并可為這個(gè)置標(biāo)語(yǔ)言規(guī)定它特有的一套標(biāo)記。與HTML相比,XML最大的優(yōu)點(diǎn)是它不是固定的標(biāo)記,而是允許開(kāi)發(fā)人員根據(jù)它所提供的規(guī)則,定義數(shù)量不限的標(biāo)識(shí)和屬性來(lái)描述文檔中的資料,允許嵌套的結(jié)構(gòu)描述。

        RDF。全稱(chēng)為資源描述框架,其目的主要是提供一種通用的元數(shù)據(jù)結(jié)構(gòu)以滿足所有領(lǐng)域的使用要求使應(yīng)用程序之間能夠在Web上交換元數(shù)據(jù),以促進(jìn)網(wǎng)絡(luò)資源的自動(dòng)化處理。RDF的基本資料模型包括了三個(gè)對(duì)象類(lèi)型:①資源。所有以RDF表示法來(lái)描述的東西都叫做資源,使用統(tǒng)一資源標(biāo)識(shí)來(lái)命名,它可以是一個(gè)網(wǎng)站,可以是一個(gè)網(wǎng)頁(yè),可以只是網(wǎng)頁(yè)中的某個(gè)部分,甚至是不存在于網(wǎng)絡(luò)的東西,如紙本文獻(xiàn)、器物、人等。②屬性。屬性是用來(lái)描述資源的特定特征或關(guān)系,每一個(gè)屬性都有特定的意義,用來(lái)定義它的屬性值和它所描述的資源形態(tài),以及和其它屬性的關(guān)系。RDF的在概念上和傳統(tǒng)的屬性是相同的。③陳述。特定的資源以一個(gè)被命名的屬性與相應(yīng)的屬性值來(lái)描述,稱(chēng)為一個(gè)RDF陳述,其中資源是主詞,屬性是述詞,屬性值則是受詞,陳述的受詞除了可能是一個(gè)字符串,也可能是其它的資料形態(tài)或是一個(gè)資源。

        關(guān)聯(lián)數(shù)據(jù)。是W3C建議的用來(lái)發(fā)布和聯(lián)接各類(lèi)資源的一種規(guī)范,簡(jiǎn)單地說(shuō),關(guān)聯(lián)數(shù)據(jù)就是一些RDF格式的數(shù)據(jù),使用三元組(主體,謂詞,客體)來(lái)表示資源,它希望用一種通用的機(jī)制將網(wǎng)絡(luò)中的數(shù)據(jù)進(jìn)行發(fā)布,使任何人和機(jī)器都內(nèi)讀取和復(fù)用萬(wàn)維網(wǎng)上的數(shù)據(jù)。語(yǔ)義萬(wàn)維網(wǎng)將資源定義為“任何有URI標(biāo)識(shí)的東西”,分為信息資源和非信息資源兩類(lèi),信息資源用以表達(dá)任何信息,通常以某種編碼的文件形式而存在;非信息資源用以指代大千世界中的各類(lèi)實(shí)體對(duì)象,可以是自然界、人類(lèi)社會(huì)以及人類(lèi)意識(shí)所創(chuàng)造的精神世界的所有對(duì)象。

        本體。本體(ontology)是實(shí)體和關(guān)系之間的一種形式化表達(dá),起源于哲學(xué)領(lǐng)域,后引入進(jìn)計(jì)算機(jī)領(lǐng)域,本體制定了一種規(guī)范,可以在語(yǔ)義和知識(shí)層次上描述知識(shí),具有結(jié)構(gòu)化的特點(diǎn)。本體以樹(shù)狀結(jié)構(gòu)存儲(chǔ),相鄰層次的節(jié)點(diǎn)之間有嚴(yán)格的包含關(guān)系。本體包含四層含義:概念模型、明確、形式化和共享。具有良好的概念層次結(jié)構(gòu)和對(duì)邏輯推理的支持,可以通過(guò)層次網(wǎng)絡(luò)圖來(lái)表示,圖中的每個(gè)節(jié)點(diǎn)對(duì)應(yīng)一個(gè)概念,節(jié)點(diǎn)之間通過(guò)有向邊來(lái)連接,表示概念與概念之間的關(guān)聯(lián)關(guān)系。

        3.實(shí)踐研究

        目前,出版機(jī)構(gòu)、信息服務(wù)商、圖書(shū)館等建設(shè)主體正積極開(kāi)展語(yǔ)義出版實(shí)踐,如RSC、Elsevier和BBC等。

        RSC。RSC是全球知名的化學(xué)科學(xué)出版社之一,目前已出版44個(gè)同行評(píng)議期刊,提供一系列在線數(shù)據(jù)庫(kù)和文獻(xiàn)更新服務(wù),是語(yǔ)義出版領(lǐng)域的重要范例。2007年,RSC提出“Science Come Alive”并進(jìn)行積極探索,設(shè)立的RSC Prospect項(xiàng)目旨在通過(guò)語(yǔ)義增強(qiáng)實(shí)現(xiàn)期刊文章的機(jī)器可讀,豐富RSC期刊在線出版的功能。RSC語(yǔ)義出版模式的關(guān)鍵是利用本體和唯一的化合物標(biāo)識(shí)符,使文章可被計(jì)算機(jī)識(shí)別。RSC的技術(shù)編輯在文章中標(biāo)識(shí)出化合物、概念和數(shù)據(jù),將其鏈接至相關(guān)的學(xué)術(shù)環(huán)境,極大增強(qiáng)了RSC文章對(duì)學(xué)科知識(shí)的揭示和關(guān)聯(lián)能力。

        RSC語(yǔ)義出版的核心要素包括:①關(guān)聯(lián)化學(xué)學(xué)術(shù)環(huán)境。為更好地實(shí)現(xiàn)化學(xué)學(xué)科相關(guān)內(nèi)容和數(shù)據(jù)的讀取、對(duì)比,RSC將本體與自建的基于Web的化學(xué)結(jié)構(gòu)數(shù)據(jù)庫(kù)關(guān)聯(lián),形成RSC語(yǔ)義出版自有的基礎(chǔ)信息系統(tǒng)。②結(jié)構(gòu)化描述與標(biāo)記?;玖鞒贪╔ML預(yù)處理、XML編輯與修正、結(jié)合語(yǔ)境和主題領(lǐng)域?qū)?yīng)的XML標(biāo)注。③嵌入式HTML的呈現(xiàn)。RSC語(yǔ)義出版的學(xué)術(shù)期刊以RichHTML形式發(fā)布,且標(biāo)記為RichHTML的文章可實(shí)現(xiàn)全文嵌入式HTML標(biāo)記,并以不同顏色突出顯示定義的詞匯,實(shí)現(xiàn)語(yǔ)義分類(lèi)。

        Elsevier。是全球領(lǐng)先的多媒體出版集團(tuán)和科學(xué)、技術(shù)、醫(yī)學(xué)信息產(chǎn)品和服務(wù)提供商,其在語(yǔ)義出版方面進(jìn)行了積極的嘗試與探索,也取得了一定的成果,典型的有Article of the Future項(xiàng)目、ClinicalKey平臺(tái)等。Elsevier的語(yǔ)義出版路線圖闡釋了語(yǔ)義出版的最終目標(biāo)是使期刊論文變?yōu)楦缓Z(yǔ)義知識(shí)的智能內(nèi)容。

        英國(guó)廣播公司(BBC)。2010年世界杯網(wǎng)站是BBC動(dòng)態(tài)出版的首次成功應(yīng)用,如今,BBC已將動(dòng)態(tài)語(yǔ)義出版由體育領(lǐng)域擴(kuò)展到新聞、教育等多個(gè)領(lǐng)域。BBC動(dòng)態(tài)領(lǐng)域出版模式是按需重組的機(jī)制,即根據(jù)應(yīng)用層用戶動(dòng)態(tài)查詢的檢索詞,通過(guò)服務(wù)層獲取語(yǔ)義相關(guān)的內(nèi)容。該模式分為了數(shù)據(jù)層、服務(wù)層和應(yīng)用層。其中,數(shù)據(jù)層負(fù)責(zé)文字、圖片、視頻等多媒體類(lèi)型資源的管理,利用自然語(yǔ)言處理技術(shù)對(duì)內(nèi)容進(jìn)行基于領(lǐng)域本體的命名實(shí)體識(shí)別(實(shí)體抽?。?,并將識(shí)別結(jié)果以元數(shù)據(jù)的形式存儲(chǔ)在RDF三元組中;服務(wù)層負(fù)責(zé)對(duì)應(yīng)用層的請(qǐng)求響應(yīng)以及對(duì)數(shù)據(jù)層的內(nèi)容調(diào)用,是動(dòng)態(tài)語(yǔ)義出版實(shí)現(xiàn)按需重組的核心,主要利用關(guān)聯(lián)數(shù)據(jù)等對(duì)調(diào)用的內(nèi)容進(jìn)行語(yǔ)義增強(qiáng),豐富用戶的檢索結(jié)果;應(yīng)用層負(fù)責(zé)按需重組在內(nèi)容上有語(yǔ)義關(guān)聯(lián)的不同資源并將其以一定的方式呈現(xiàn)給用戶。

        4.結(jié)束語(yǔ)

        國(guó)外的出版組織和圖書(shū)館對(duì)語(yǔ)義出版高度關(guān)注相比,我國(guó)的研究明顯滯后。從廣度上看,只有中國(guó)知網(wǎng)、萬(wàn)方等少數(shù)學(xué)術(shù)數(shù)據(jù)庫(kù)服務(wù)商和出版機(jī)構(gòu)開(kāi)展過(guò)語(yǔ)義技術(shù)的應(yīng)用;從深度上看,當(dāng)前研究多集中在語(yǔ)義出版的概念、形式、特征以及國(guó)外相關(guān)項(xiàng)目的介紹和分析上,理論探討較多,應(yīng)用研究較少?!靶枨鬀Q定服務(wù),服務(wù)選擇資源”,語(yǔ)義出版作為一種創(chuàng)新服務(wù)模式,對(duì)館藏資源組織與利用提出了更高要求,是信息服務(wù)產(chǎn)業(yè)鏈中至關(guān)重要的環(huán)節(jié)之一。

        參考文獻(xiàn)

        [1]Shotton D.Semantic Publishing:the coming revolution in scientific journal publishing[J].Learned Publishing,2009(22):85-94.

        [2]王曉光,陳孝禹.語(yǔ)義出版:數(shù)字時(shí)代科學(xué)交流系統(tǒng)新模型[J].出版科學(xué),2012,20(04):81-86.

        [3]程維紅,任勝利,沈錫賓,方梅,王應(yīng)寬.中國(guó)科協(xié)科技期刊數(shù)字出版及傳播力建設(shè)[J].中國(guó)科技期刊研究,2014,25(03):340-345.

        [4]汪慶,任慧玲.新技術(shù)環(huán)境下STM出版發(fā)展趨勢(shì)探析[J].科技與出版,2014(09):123-127.

        [5]彭?,B,張曉林.國(guó)際學(xué)術(shù)期刊的數(shù)字化發(fā)展趨勢(shì)[J].中國(guó)科技期刊研究,2013,24(06):1033-1038.

        [6]許鑫,毛璐,江燕青.基于數(shù)字資源聚合的學(xué)術(shù)期刊語(yǔ)義出版研究[J].數(shù)字圖書(shū)館論壇,2019(07):2-8.

        [7]Nanopub.org.What is a Nanopublication[EB/OL].[2019-12-24].http://nanopub.org/wordpress/?page_id=65.

        Marcondes C H.A semantic model for scholarly electronic publishing[EB/OL][2020-10-24].http://www.ceur -ws.org/Vol-721/paper-06.pdf.

        [8]Bardi A, Manghi P.Enhanced publications:data models and information systems[J].Liberquarterly,2014, 23(4):240-273.

        [9]Kircz J G.Modularity:The Next Form of Scientific Information Presentation?[J].Journal of Documentation, 1998,54(2):210-235.

        [10]Kircz J G.New Practices for Electronic Publishing 2:New Forms of the Scientific Paper [J].Learned Publishing,2002,15(1):27-32.

        [11]王文清,劉春彤,張?jiān)孪?,陳?PUBO:面向出版的數(shù)字資源本體建模[J].大學(xué)圖書(shū)館學(xué)報(bào),2015,33(03):88-95.

        [12]Hunter J. Scientific Publication Packages-A Selective Approach to the Communication and Archival of Scientific Output[J].Journal of Digital Curation,2006,1(1):3-16.

        [13]Fink J L, Bourne P E. Reinventing Scholarly Communication for the Electronic Age [J].CTWatch Quarterly, 2007,3(3):26-31.

        [14]Enhanced Publications[EB/OL].[2019-12-24].http://www.doc88.com/p-873117284280.html.

        [15]翁彥琴,李苑,彭?,B.英國(guó)皇家化學(xué)會(huì)(RSC)——科技期刊語(yǔ)義出版模式的研究[J].中國(guó)科技期刊研究,2013,24(5):825-829.

        [16]王莉莉,欒冠楠.英國(guó)廣播公司(BBC)動(dòng)態(tài)語(yǔ)義出版模式研究[J].圖書(shū)情報(bào)工作,2017,61(08):126-132.

        日日摸夜夜添狠狠添欧美| 国产精品人成在线观看| 手机在线看片在线日韩av| 日本a级免费大片网站| 午夜男女很黄的视频| 激情欧美日韩一区二区| 4hu44四虎www在线影院麻豆| 熟女少妇精品一区二区三区| 欧美老肥妇做爰bbww| 少妇白浆高潮无码免费区| 国模精品无码一区二区二区| 亚洲AV无码中文AV日韩A| 日本一区二区三级在线| 女人脱了内裤趴开腿让男躁| 久久99久久99精品中文字幕| 99ri国产在线观看| АⅤ天堂中文在线网| 国产一区二区三区不卡视频| 国产精品久久久久高潮| 亚洲精品第一国产综合亚av| 无码人妻一区二区三区免费n鬼沢| 亚洲av午夜成人片精品| 日韩国产精品一区二区三区 | 网禁拗女稀缺资源在线观看| 免费啪啪视频一区| 亚洲精品尤物av在线网站| 国产精品一区二区黑丝| 小宝极品内射国产在线| 午夜精品一区二区三区无码不卡| 国产精品三级在线不卡| 又色又爽又黄的视频软件app| 久久99精品国产99久久| 亚洲成片在线看一区二区| 老岳肥屁熟女四五十路| 国产精品久久久亚洲| 色欲麻豆国产福利精品| 国产目拍亚洲精品区一区| 日韩av在线手机免费观看| 欧美丰满熟妇bbbbbb| 7878成人国产在线观看| 国产精品毛片大尺度激情|