亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        版權(quán)知識(shí)本體構(gòu)建方法研究

        2017-07-12 09:17:16任志遠(yuǎn)
        軟件導(dǎo)刊 2017年6期
        關(guān)鍵詞:版權(quán)知識(shí)庫(kù)本體

        任志遠(yuǎn)

        摘要:針對(duì)版權(quán)知識(shí)的結(jié)構(gòu)并考慮到版權(quán)本體需要不斷迭代更新,在充分分析版權(quán)知識(shí)結(jié)構(gòu)的基礎(chǔ)上融合現(xiàn)有本體構(gòu)建技術(shù),通過(guò)提取中華人民共和國(guó)國(guó)家版權(quán)局和中國(guó)裁判文書(shū)網(wǎng)數(shù)據(jù),提出適合版權(quán)知識(shí)本體的自動(dòng)構(gòu)建方法。

        關(guān)鍵詞:本體;版權(quán);知識(shí)庫(kù)

        DOIDOI:10.11907/rjdk.162585

        中圖分類號(hào):TP319

        文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2017)006-0142-03

        0 引言

        隨著社會(huì)發(fā)展,版權(quán)知識(shí)變得越來(lái)越重要。但是版權(quán)知識(shí)比較復(fù)雜瑣碎,人們查找學(xué)習(xí)版權(quán)知識(shí)時(shí)比較困難。目前,大部分知識(shí)庫(kù)都只是基于字符串檢索,檢索結(jié)果準(zhǔn)確性差,知識(shí)獲取效率低。本體作為語(yǔ)義網(wǎng)的重要組成部分,可以極大提高檢索效率。本文旨在探討版權(quán)知識(shí)本體的構(gòu)建方法,最大程度減少構(gòu)建版權(quán)知識(shí)本體的難度。

        1 本體構(gòu)建方法簡(jiǎn)述

        由于領(lǐng)域知識(shí)在構(gòu)建本體時(shí)有特定需求,比較成熟的方法有七步法、METHONTOLOGY法,另外還有骨架法、五步獲取法、循環(huán)獲取法。各方法的優(yōu)缺點(diǎn)及用途比較如表1所示。

        1.1 METHONTOLOGY法

        METHONTOLOGY法是專門(mén)用于構(gòu)建化學(xué)本體的方法,該方法支持本體層次構(gòu)建,但是該方法無(wú)法進(jìn)行更新迭代。該方法主要應(yīng)用于化學(xué)領(lǐng)域,流程如圖1所示。

        1.2 七步法

        七步法是由斯坦福大學(xué)提出的一種實(shí)用的本體開(kāi)發(fā)方式,但是該方法沒(méi)法評(píng)價(jià)過(guò)程,無(wú)法迭代更新,該方法適用于醫(yī)學(xué)本體構(gòu)建,開(kāi)發(fā)流程如圖2所示。

        1.3 五步循環(huán)法

        五步循環(huán)法主要用于語(yǔ)義網(wǎng)本體構(gòu)建,該方法有評(píng)價(jià)環(huán)節(jié),構(gòu)建的本體可以迭代更新,但是該方法操作性差,難度大,因此適用范圍不廣。

        2 版權(quán)知識(shí)本體構(gòu)建

        本文融合以上方法的優(yōu)點(diǎn)提出新的適合版權(quán)知識(shí)本體構(gòu)建方法,將版權(quán)本體的構(gòu)建分成兩方面,其中法律采用手動(dòng)構(gòu)建本體,而案例等采用自動(dòng)構(gòu)建。最后添加評(píng)價(jià)步驟,使得整個(gè)流程不斷地迭代更新。在本體構(gòu)建過(guò)程中,數(shù)據(jù)來(lái)源于中華人民共和國(guó)版權(quán)局和中國(guó)裁判文書(shū)網(wǎng)。

        2.1 改進(jìn)的本體構(gòu)建方法

        對(duì)于法律案例來(lái)說(shuō),一般裁判文書(shū)結(jié)構(gòu)明確,適合自動(dòng)構(gòu)建。從樣例中可以看出案例文書(shū)的結(jié)構(gòu)非常直接,案例涉及的人物等信息很容易被準(zhǔn)確提取出來(lái)。首先,本體構(gòu)建分成兩個(gè)主要方面,一方面是法律,因?yàn)榉傻膰?yán)謹(jǐn)性以及版權(quán)法字?jǐn)?shù)較少,可以人工構(gòu)建,中國(guó)裁判文書(shū)網(wǎng)涉及版權(quán)相關(guān)的數(shù)據(jù)條件大約有3萬(wàn)個(gè)。在已提出方法的基礎(chǔ)上改進(jìn)流程,使得符合版權(quán)知識(shí)的結(jié)構(gòu)特點(diǎn)。流程為:①整理版權(quán)概念詳細(xì)術(shù)語(yǔ);②根據(jù)知識(shí)內(nèi)容主要分為兩個(gè)具有代表性的類型,法律和案例;③對(duì)于法律來(lái)說(shuō)首先將概念之間的關(guān)系整理出來(lái),構(gòu)建概念模型;④使用OWL本體描述語(yǔ)言將第三步生成的結(jié)構(gòu)化文檔形式化表達(dá);⑤評(píng)價(jià)法律本體;⑥對(duì)于案例,在本體模板的基礎(chǔ)上,自動(dòng)提取案例的概念以及屬性;⑦檢查案例本體是否具有邏輯錯(cuò)誤。圖3為版權(quán)本體的構(gòu)建流程。

        2.2 版權(quán)法律本體構(gòu)建

        法律本體是版權(quán)知識(shí)本體的重要組成部分。法律本體構(gòu)建依據(jù)《中華人民共和國(guó)著作權(quán)法》、《計(jì)算機(jī)軟件保護(hù)條例》等相關(guān)法律。法律本體包括著作權(quán)相關(guān)概念、權(quán)利、處罰等內(nèi)容。

        2.2.1 復(fù)用本體

        目前已經(jīng)有LKIF、FOLaw兩個(gè)比較優(yōu)秀的法律本體模型。LKIF 基于LRI-Core但是減少了對(duì)子類的約束。LKIF包含200多個(gè)概念,但是LKIF提出的概念太抽象。而FOLaw更像是一個(gè)認(rèn)知框架,兩者對(duì)于著作權(quán)相關(guān)法律本體的構(gòu)建更多的是借鑒意義,復(fù)用意義不大。

        2.2.2 版權(quán)知識(shí)概念關(guān)系抽取

        根據(jù)領(lǐng)域知識(shí)界定,版權(quán)知識(shí)本體主要有9個(gè)類、55個(gè)子類、466個(gè)概念。這幾個(gè)類通過(guò)概念關(guān)系互相構(gòu)成一個(gè)網(wǎng)狀的概念圖,如作品、人物、權(quán)利等,如圖4所示。根據(jù)概念關(guān)系圖分類手動(dòng)提取法律法規(guī)文本中的概念。

        2.2.3 創(chuàng)建實(shí)例

        構(gòu)建本體框架以及提取概念及關(guān)系后,實(shí)例化本體的方法分為手動(dòng)構(gòu)建和自動(dòng)構(gòu)建。具體如下:①手動(dòng)導(dǎo)入,可以通過(guò)本體構(gòu)建工具Protégé手動(dòng)構(gòu)建本體。在Protégé的Individual by class選項(xiàng)卡中手動(dòng)輸入概念以及關(guān)系;②自動(dòng)導(dǎo)入,通過(guò)提取概念關(guān)系后,版權(quán)法律法規(guī)中的概念以及概念之間的關(guān)系已經(jīng)成為結(jié)構(gòu)化數(shù)據(jù)。然后通過(guò)Jena語(yǔ)義網(wǎng)工具讀取本體概念,添加本體的實(shí)例及屬性的方式將概念或?qū)傩蕴砑拥奖倔w文件中,實(shí)現(xiàn)本體自動(dòng)擴(kuò)充。

        2.3 案例知識(shí)本體構(gòu)建

        案例裁定書(shū)一般由五部分組成:首部、事實(shí)、理由、判決結(jié)果、尾部。首部主要說(shuō)明相關(guān)涉案人,事實(shí)包括公司再審審稱和法院再審復(fù)查查明等,理由是判決依據(jù),尾部是判決結(jié)果。

        2.3.1 案例知識(shí)結(jié)構(gòu)

        根據(jù)需求,首先構(gòu)建案例的概念之間關(guān)系以及概念跟屬性之間的關(guān)系。圖5為案例中的概念層次。

        2.3.2 概念提取

        (1) 結(jié)構(gòu)化數(shù)據(jù)提取。建立概念之間的關(guān)系以及屬性之間的關(guān)系,需要提取概念來(lái)實(shí)例化本體,而且文書(shū)格式比較嚴(yán)格,所以根據(jù)正則匹配就可以提取出大部分概念。首先將文書(shū)按照格式規(guī)范分成5部分,根據(jù)開(kāi)頭詞語(yǔ)確定該段落歸屬于哪一類。根據(jù)規(guī)范提取部分相關(guān)詞如表2所示。

        (2)非結(jié)構(gòu)化數(shù)據(jù)提取。提取非結(jié)構(gòu)化數(shù)據(jù)首先需要對(duì)文本進(jìn)行分詞,這一步使用開(kāi)源框架IKAnalyzer分詞工具進(jìn)行分詞、標(biāo)注。在分詞過(guò)程中使用版權(quán)術(shù)語(yǔ)表制作字典提高分詞準(zhǔn)確率,通過(guò)分詞標(biāo)注后,通過(guò)n-gram算法提取出其中的概念,將概念通過(guò)Jena語(yǔ)義網(wǎng)工具添加到本體中。

        3 結(jié)語(yǔ)

        由于本體在知識(shí)工程以及人工智能知識(shí)表示方面的優(yōu)勢(shì),使得本體一直是語(yǔ)義網(wǎng)的重點(diǎn)研究方向。然而,本體的構(gòu)建尚沒(méi)有成熟的標(biāo)準(zhǔn)體系。由于國(guó)內(nèi)也尚無(wú)標(biāo)準(zhǔn)評(píng)價(jià)體系和工具,本文沒(méi)有討論本體的評(píng)價(jià)問(wèn)題。目前本體質(zhì)量只能通過(guò)領(lǐng)域?qū)<疫M(jìn)行人工評(píng)定。本文主要討論了版權(quán)知識(shí)的基本結(jié)構(gòu),分析構(gòu)建本體的基本過(guò)程,為本體自動(dòng)構(gòu)建作準(zhǔn)備。下一步主要研究將機(jī)器學(xué)習(xí)整合到本體構(gòu)建的過(guò)程中,通過(guò)監(jiān)督學(xué)習(xí)使得本體構(gòu)建自動(dòng)化。

        參考文獻(xiàn):

        [1]賈焰,王永恒,楊樹(shù)強(qiáng).基于本體論的文本挖掘技術(shù)綜述[J].計(jì)算機(jī)應(yīng)用,2006,26(9):2013-2015.

        [2]曹燦.基于本體的軟件工程課程知識(shí)庫(kù)研究和應(yīng)用[D].北京:北京林業(yè)大學(xué),2010.

        [3]有關(guān)著作權(quán)(copyright)的一些詞匯(中英文對(duì)照)[EB/OL].http://blog.sina.com.cn/s/blog_4d53c365010188w7.html.

        [5]郭沖,王振宇.面向細(xì)粒度意見(jiàn)挖掘的情感本體樹(shù)及自動(dòng)構(gòu)建[J].中文信息學(xué)報(bào),2013,27(5):75-92.

        [6]巫建偉,陳崇成,葉曉燕,等.基于Jena的土地適宜性評(píng)價(jià)本體知識(shí)庫(kù)構(gòu)建研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2014,35(1):287-292.

        [7]李景.主要本體構(gòu)建工具比較研究[J].情報(bào)理論與實(shí)踐,2014,29(2):109-111.

        [8]田宏,馬朋云.基于Jena的城市交通領(lǐng)域本體推理和查詢方法[J].計(jì)算機(jī)應(yīng)用與軟件,2011,28(8):56-63.

        [9]李景.本體理論及在農(nóng)業(yè)文獻(xiàn)檢索系統(tǒng)中的應(yīng)用研究——以花卉學(xué)本體建模為例[D].北京:中國(guó)科學(xué)院研究生院,2004.

        [9]尚新麗.國(guó)外本體構(gòu)建方法比較分析[J].圖書(shū)情報(bào)工作,2012,56(4):116-119.

        (責(zé)任編輯:陳福時(shí))

        猜你喜歡
        版權(quán)知識(shí)庫(kù)本體
        Abstracts and Key Words
        對(duì)姜夔自度曲音樂(lè)本體的現(xiàn)代解讀
        基于TRIZ與知識(shí)庫(kù)的創(chuàng)新模型構(gòu)建及在注塑機(jī)設(shè)計(jì)中的應(yīng)用
        誤讀為“演繹”的“同人”
        微信傳播與版權(quán)法定許可制度的適用與建構(gòu)
        出版廣角(2016年15期)2016-10-18 00:33:32
        新聞作品權(quán)利歸屬與行使中的利益平衡
        出版廣角(2016年15期)2016-10-18 00:29:27
        新聞版權(quán)合理使用制度的反思與重構(gòu)
        出版廣角(2016年15期)2016-10-18 00:23:30
        高速公路信息系統(tǒng)維護(hù)知識(shí)庫(kù)的建立和應(yīng)用
        《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
        基于Drupal發(fā)布學(xué)者知識(shí)庫(kù)關(guān)聯(lián)數(shù)據(jù)的研究
        精品中文字幕手机在线| 国产国产裸模裸模私拍视频| 2018国产精华国产精品| √天堂中文官网8在线| 午夜不卡亚洲视频| 一区二区三区视频偷拍| 虎白m粉嫩小在线播放| 深夜福利啪啪片| 色播久久人人爽人人爽人人片av| 国产精品九九热| 精品人妻中文字幕一区二区三区| 亚洲精品在线一区二区| 亚洲国产精品无码aaa片| a级毛片免费观看在线| 成黄色片视频日本秘书丝袜| 看全色黄大色大片免费久久久| 国产3p一区二区三区精品| 国产免费观看黄av片| 久久无码av中文出轨人妻| 97色噜噜| 中文字幕一区二区三在线| 蜜桃免费一区二区三区| 色欲网天天无码av| 性大片免费视频观看| 丰满熟妇人妻无码区| 日本国产精品高清在线| 欧美拍拍视频免费大全| 国偷自产视频一区二区久| 亚洲国产麻豆综合一区| 99久久亚洲精品加勒比| 精品国产一区二区三区av免费| 亚洲国产日韩av一区二区| 国产一区二区精品网站看黄| 91乱码亚洲精品中文字幕| 国产成人综合亚洲国产| 青青草视频在线观看网| 麻豆婷婷狠狠色18禁久久| 亚洲av无码成人精品区在线观看| 男女上床视频免费网站| 亚洲精品中文字幕导航| 中国人妻与老外黑人|