亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于模糊概念相似度的模糊本體構(gòu)建方法

        2014-03-29 02:01:00李鵬劉勝全劉艷張華楠劉華鵬
        計算機工程與應(yīng)用 2014年13期
        關(guān)鍵詞:外延本體聚類

        李鵬,劉勝全,2,劉艷,張華楠,劉華鵬

        1.新疆大學(xué)信息科學(xué)與工程學(xué)院,烏魯木齊830046

        2.新疆大學(xué)現(xiàn)代教育技術(shù)中心,烏魯木齊830046

        1 引言

        當(dāng)前語義Web[1]研究領(lǐng)域中,本體(Ontology)[2]通過對概念及其相互關(guān)系的規(guī)范化描述,可勾畫出某一領(lǐng)域的基本知識體系。但在許多應(yīng)用領(lǐng)域中,由經(jīng)典本體支持的形式化概念不足以表示模糊信息,通常的解決方法是將模糊集理論[3]引入本體以處理模糊信息。因此,模糊本體(Fuzzy Ontology)的構(gòu)建方法成為亟待解決的問題。

        手工構(gòu)建模糊本體費時費力,常需要領(lǐng)域?qū)<业慕忉?,故自動?gòu)建方法成為目前國內(nèi)外主流的研究趨勢,主要有基于模糊概念模型、基于語言變量、基于MDA及基于模糊聚類的構(gòu)建方法等。其中基于模糊聚類的構(gòu)建方法是依據(jù)模糊集理論,將模糊聚類技術(shù)引入到模糊本體的自動構(gòu)建中,是目前模糊本體構(gòu)建的研究熱點之一。文獻[4]提出了一個模糊本體自動生成框架,其自動生成方法分為以下幾步:模糊形式概念分析、概念層次生成、模糊本體的框架生成。文獻[5]研究了一種從模糊背景生成模糊本體的方法,通過模糊概念格聚類生成模糊概念層次。文獻[6]提出一種基于模糊概念格的概念距離聚類方法來構(gòu)建模糊本體。但上述文獻對模糊概念間相似度的計算還存在不足,忽略了內(nèi)涵和外延對模糊概念的制約關(guān)系,最終影響了模糊概念聚類的質(zhì)量。本文提出一種基于模糊概念相似度的模糊本體構(gòu)建方法,對模糊概念的相似度從內(nèi)涵和外延兩個方法進行了計算,并引入權(quán)重因子對內(nèi)涵和外延進行調(diào)節(jié),以適應(yīng)不同領(lǐng)域中模糊概念的特點。

        2 模糊本體相關(guān)理論知識

        2.1 模糊本體構(gòu)建框架

        本體是共享概念模型的明確的形式化規(guī)范說明[2]。包含5個基本的建模元語:概念、關(guān)系、函數(shù)、公理、實例。模糊本體表示的是模糊概念及其之間的模糊關(guān)系。模糊本體可用四元組OF=(CF,P,R,X)來表示,其中CF為模糊概念集,P為屬性集,R為模糊概念集與屬性集之間的笛卡爾積,X為公理集。模糊概念可表示為CF=,其中oi是對象,ai是oi的屬性[4]。

        運用模糊概念聚類方法構(gòu)建模糊本體,其構(gòu)建框架如圖1所示。

        圖1 模糊本體構(gòu)建框架圖

        其主要思想是首先抽取領(lǐng)域內(nèi)的不確定信息形成模糊形式背景,再運用漸進式算法從模糊形式背景中構(gòu)建出模糊概念格,然后采用基于模糊概念相似度的概念聚類算法將模糊概念格聚類并轉(zhuǎn)化為模糊概念層次,最后映射得到模糊本體原型。

        2.2 模糊形式概念分析

        為處理現(xiàn)實世界中的不確定信息,將模糊集理論與形式概念分析(FCA)相結(jié)合,從特定領(lǐng)域的不確定信息中構(gòu)造模糊形式背景,在構(gòu)造好的模糊形式背景上運用一定的構(gòu)建算法構(gòu)建出模糊概念格,這一過程稱為模糊形式概念分析[7]。模糊形式概念分析建立在以下概念基礎(chǔ)之上。

        定義1 模糊形式背景。一個模糊形式背景表示為F=(O,A,I),其中O為一個對象集合,A為一個屬性集合,映射I稱為隸屬度函數(shù)。這個函數(shù)滿足:I(o,a)=μ,其中o∈O,a∈A,μ∈[0,1]。

        定義2 模糊概念。給定一個模糊形式背景F=(O,A,I)和閥值Φd,對?O1?O:

        對?A1?A:

        則模糊概念是二元對C1=(O1,A1),O1?O,A1?A,f(O1)=A1,g(A1)=O1。其中O1和A1分別為模糊概念C1的外延(extent)和內(nèi)涵(intent)。

        定義3 模糊參數(shù)δ。對于對象集合O,屬性集合A=f(O),a∈A:

        參數(shù)δ描述的是對象的平均隸屬度。

        定義4設(shè)(O1,A1)和(O2,A2)為模糊形式背景(O,A,I)的兩個模糊概念,當(dāng)且僅當(dāng)O1?O2,則有A1?A2,則(O1,A1)是(O2,A2)的子概念,(O2,A2)是(O1,A1)的父概念。

        定義5 模糊概念格。模糊形式背景F的所有模糊概念的集合記為CS(F),CS(F)上的結(jié)構(gòu)是一種偏序關(guān)系。若滿足O1?O2,則(O1,A1)≤(O2,A2),通過此關(guān)系得到的有序集-CS(F)=(CS(F),≤)稱為模糊形式背景F的模糊概念格。

        算法1 模糊概念格的漸進式構(gòu)建算法

        用Intent(C)表示概念節(jié)點C的內(nèi)涵,Extent(C)表示概念節(jié)點C的外延。

        步驟1 模糊概念格-CS(F)初始化為空。

        步驟2 從模糊形式背景F取出一個對象x,形成節(jié)點({x},f({x})),如果-CS(F)中沒有節(jié)點C使得f({x})?Intent(C),則將節(jié)點({x},f({x}))加入-CS(F)。

        步驟3 掃描-CS(F)中的所有節(jié)點,找出所有內(nèi)涵小于等于新增對象x內(nèi)涵的節(jié)點C(Intent(C)?f(x)),則節(jié)點C為更新節(jié)點。將每個更新節(jié)點更新為(Extent(C)∪{x},Intent(C)),邊不更新;轉(zhuǎn)步驟5。

        步驟4 掃描-CS(F)中的所有節(jié)點,如果節(jié)點C與x的內(nèi)涵交集不等于-CS(F)中任意節(jié)點的內(nèi)涵,則定義為產(chǎn)生子節(jié)點(交集相同的節(jié)點中取外延最大的),將每個產(chǎn)生子節(jié)點與此x一起生成新生成節(jié)點(Extent(C)∪{x},Intent(C)∩f(x))。如果-CS(F)中存在新生成節(jié)點的更新節(jié)點,則更新這些節(jié)點,否則加入新生成節(jié)點到-CS(F),并連接新生成節(jié)點到它的子節(jié)點和父節(jié)點。

        步驟5 直到所有的對象加入-CS(F)中;否則轉(zhuǎn)步驟2。

        步驟6 搜索-CS(F)中所有沒有子節(jié)點的節(jié)點,如果這樣的節(jié)點多于一個,則生成底節(jié)點(Φ,A),并增加底節(jié)點到這些點的邊。搜索所有沒有父節(jié)點的節(jié)點,如果這樣的節(jié)點多于一個,則生成頂節(jié)點(Φ,A)加入-CS(F),并增加頂節(jié)點到這些點的邊。

        3 基于模糊概念相似度的概念聚類算法

        隨著模糊形式背景中對象和屬性數(shù)量的增加,模糊概念格中的模糊形式概念數(shù)量也會隨之增長。同時,很多對象會因為屬性值上的細微差別而被分到不同的模糊形式概念中,實際上,這些對象應(yīng)該屬于同一模糊概念,這樣模糊概念格就存在許多冗余的概念。故應(yīng)采用概念聚類的方法對模糊概念格中模糊形式概念進行處理,并產(chǎn)生層次結(jié)構(gòu)。

        基于模糊概念相似度的概念聚類算法,其中心思想是計算模糊概念格中有父子繼承關(guān)系的模糊形式概念的內(nèi)涵和外延相似度,增加內(nèi)涵及外延的權(quán)重因子,使之可根據(jù)所分析的目標(biāo)概念格的特點調(diào)節(jié),并以此為依據(jù)將相似度較高的模糊形式概念聚為一類,以取得較為滿意的聚類結(jié)果。

        對于兩個模糊形式概念C1=(O1,A1),C2=(O2,A2),C1為C2的子概念,給出概念相似度相關(guān)定義如下:

        定義6 外延相似度(similarity on Extent)兩個概念的外延相似度是用其外延集合的交集的勢的2倍除以兩個概念的外延集合的勢的和的結(jié)果。

        定義7 內(nèi)涵相似度(similarity on Intent)兩個概念的內(nèi)涵相似度是計算其內(nèi)涵集合交集中的每個屬性在各自概念中的δ的偏差值的絕對值,再將其值減1的絕對值的和的2倍除以兩個概念的內(nèi)涵集合的勢的和的結(jié)果。

        由于在模糊概念格中不同的模糊形式概念所包含的相同的屬性還可能存在程度上的差異,因此這里計算內(nèi)涵相似度時用到了模糊參數(shù)δ。

        定義8 概念相似度(similarity on concept)兩個概念的總體概念相似度根據(jù)其外延和內(nèi)涵的相似度來進行計算。

        其中,α和β分別為外延和內(nèi)涵相似度的權(quán)重因子,可以根據(jù)所分析的目標(biāo)模糊形式概念格的特點進行調(diào)節(jié)。

        算法2 基于模糊概念相似度的概念聚類算法

        輸入:模糊概念格-CS(F),相似度閥值Ts;

        輸出:模糊概念聚類-CS′(F)。

        步驟1預(yù)處理,讀取-CS(F)中的邊集CXCY(Cx為CY的父節(jié)點,邊包括父子節(jié)點及節(jié)點間相似度相關(guān)參數(shù))。

        步驟2 順序查找邊集中的邊CiCj(CiCj∈CXCY),計算概念相似度sim(Ci,Cj)。

        步驟3 若sim(Ci,Cj)>Ts,聚類CiCj成為一個新節(jié)點Cij;否則轉(zhuǎn)步驟5。

        步驟4 更新節(jié)點Cij({OX∪OY},{AX∪AY}),并代替父節(jié)點Ci,更新邊集,Ci的父節(jié)點連到Cij,Cij連到Cj的子節(jié)點,刪除子節(jié)點Cj。

        步驟5 轉(zhuǎn)到步驟2,直至不存在邊CiCj,使得sim(CiCj)>Ts成立

        步驟6 邊集存入-CS′(F)。

        4 模糊概念聚類映射規(guī)則

        模糊概念聚類有以下性質(zhì)[8]:

        (1)模糊概念聚類有層次關(guān)系,其層次關(guān)系可從模糊形式概念格中的模糊形式概念導(dǎo)出,即若兩聚類中的形式概念存在父子關(guān)系,則兩聚類也存在父子關(guān)系。

        (2)一個模糊形式概念至少屬于一個模糊概念聚類,但可以同時屬于多個模糊概念聚類。

        根據(jù)模糊概念聚類層次及模糊本體中元素的對應(yīng)關(guān)系,運用映射規(guī)則可以構(gòu)造模糊本體原型。映射規(guī)則如圖2所示。

        圖2 模糊概念聚類與模糊本體的映射規(guī)則

        由圖2中模糊概念層次到模糊本體的映射規(guī)則可知,模糊概念層次中的概念節(jié)點標(biāo)識就是模糊本體的概念類名,概念節(jié)點的內(nèi)涵是模糊本體中相應(yīng)概念的屬性,概念節(jié)點的外延是模糊本體中相應(yīng)概念的實例,節(jié)點屬性的隸屬度值是模糊本體相應(yīng)概念的相應(yīng)屬性的值,模糊概念層次中概念間的層次關(guān)系是模糊本體相應(yīng)概念間的關(guān)系。這樣就把模糊概念層次映射成了模糊本體,包括模糊本體概念、模糊本體概念屬性,以及其隸屬度的值、模糊本體實例和模糊本體概念間分類關(guān)系。

        通過上述映射規(guī)則得到的模糊本體原型,還需要領(lǐng)域?qū)<业膮⑴c,添加概念間非分類關(guān)系以及屬性、公理、實例等,擴充模糊本體原型,才能得到比較完善的模糊本體。

        5 實例構(gòu)建及比較

        5.1 構(gòu)造模糊形式背景及模糊概念格

        本文在Eclipse平臺下,采用Java語言實現(xiàn)模糊概念格的漸進式構(gòu)建算法和基于模糊概念相似度的概念聚類算法,選用文獻[6]給出的實例數(shù)據(jù),以連續(xù)5天的天氣為對象,以溫度、紫外線、風(fēng)力和雨水為屬性,設(shè)定閥值Φd為0.5,約簡后的模糊形式背景如表1所示。

        表1 模糊形式背景

        根據(jù)模糊形式背景表1,采用算法1[9]構(gòu)造模糊概念格,如圖3所示。

        圖3 模糊概念格

        各模糊形式概念的構(gòu)成及模糊參數(shù)值如表2所示。為方便描述,在表2中模糊形式背景中的7個屬性分別用符號a、b、c、d、e、f、g來代替。

        表2 模糊形式概念構(gòu)成表

        5.2 模糊概念聚類

        利用第3章的基于模糊概念相似度的概念聚類算法,對圖3模糊概念格進行聚類。計算模糊概念格中有父子繼承關(guān)系的模糊形式概念的概念相似度,如下所示。

        本實例中選取α=β=0.5(即內(nèi)涵與外延權(quán)重相當(dāng)?shù)那闆r下):

        sim(2,3)=0.60,sim(2,5)=0.70

        sim(3,4)=0.58,sim(3,6)=0.53

        取相似度閥值Ts=0.59,對模糊概念格進行聚類,如圖4所示。

        圖4 模糊概念聚類示意圖

        5.3 模糊本體生成

        由于節(jié)點1和節(jié)點7分別是領(lǐng)域內(nèi)最大概念和空概念,所以在模糊本體構(gòu)建中不作考慮,切斷其與其他節(jié)點的關(guān)系。

        根據(jù)第4章映射規(guī)則,由圖4映射得到模糊本體原型如圖5。每個節(jié)點為模糊本體中一個模糊概念,節(jié)點的層次關(guān)系為模糊本體中的分類關(guān)系。

        圖5 模糊本體原型

        以模糊概念B為例,其屬性為溫度高(0.6),紫外線強(0.6),紫外線弱(0.9),風(fēng)力大(0.8),其實例為2、4、5,它是模糊模糊概念A(yù)的子概念。

        在實際應(yīng)用中,還可以在領(lǐng)域?qū)<业闹笇?dǎo)下,將模糊本體原型導(dǎo)入本體編輯工具Protégé,添加概念間的非分類關(guān)系以及屬性、公理、實例等,最后得到較為完善的模糊本體。

        5.4 比較

        在邏輯學(xué)上,概念包含了概念的內(nèi)涵和外延。概念的內(nèi)涵是概念所反映的對象所特有的屬性,特別是本質(zhì)屬性在概念中的反映。概念的外延是具有概念所反映的本質(zhì)屬性的對象。概念的內(nèi)涵和外延具有反變關(guān)系,即指同一個從屬關(guān)系中,內(nèi)涵越豐富,外延就越??;反之,內(nèi)涵越簡單,外延就越大。故在模糊概念聚類中,全面衡量模糊形式概念的內(nèi)涵外延的相似度是聚類的關(guān)鍵之處。

        對比本文聚類方法與文獻[5]和文獻[6]方法,以聚類后模糊概念數(shù)量等于3為例,采用不同的聚類算法進行模糊聚類后的模糊本體原型,如圖6所示。

        圖6 模糊本體原型對比圖

        可以看出,采用本文聚類算法產(chǎn)生的模糊本體更符合概念的反變關(guān)系,即模糊本體的上層概念外延較大,內(nèi)涵較簡單,表示的概念較為抽象;下層概念外延較小,內(nèi)涵較豐富,表示的概念較為具體。不僅如此,本文在計算模糊概念相似度時引入了內(nèi)涵和外延的權(quán)重因子,可以根據(jù)所分析的目標(biāo)概念格的特點進行調(diào)節(jié),力求更逼近領(lǐng)域中模糊概念實際的語義度量。

        6 結(jié)束語

        研究了模糊本體構(gòu)建中的基于模糊概念相似度的概念聚類算法,與文獻[5]和文獻[6]提出的模糊本體構(gòu)建方法相比,本文算法對模糊概念間的相似度從內(nèi)涵和外延兩個方面進行了計算,并增加內(nèi)涵和外延的權(quán)重因子,可針對不同領(lǐng)域的模糊概念的特點對內(nèi)涵和外延的比重進行調(diào)節(jié)。下一步的工作,將對模糊本體原型的生成算法以及模糊推理方法進行研究。

        [1]Berners-Lee T,Hendler J,Lassila O.The semantic Web[J].Scientific American,2001,284(5):34-43.

        [2]Borst W N.Construction of engineering ontologies for know ledge sharing and reuse[D].Enschede:University of Twente,1997.

        [3]Zadeh L A.Fuzzy sets[J].Information and Control,1965,8(3):338-353.

        [4]Quan T T,Hui S C,Cao T H.FOGA:a fuzzy ontology generation framework for scholarly semantic Web[C]//Proceedings of the 2004 Know ledge Discovery and Ontologies Workshop(KDO’04),Pisa,Italy,2004.

        [5]強宇,劉宗田,李旭,等.一種基于模糊聚類的模糊本體生成方法[J].計算機科學(xué),2006,33(4):148-150.

        [6]李慧琳,劉寧,李冠宇.模糊本體構(gòu)建的概念距離聚類方法[J].計算機工程與設(shè)計,2012(4):1538-1541.

        [7]劉宗田,強宇,周文,等.一種模糊概念格模型及其漸進式構(gòu)造算法[J].計算機學(xué)報,2007,30(2):184-188.

        [8]Tho Q T,Hui S C,F(xiàn)ong A C M,et al.Automatic fuzzy ontology generation for semantic Web[J].IEEE Trans on Know ledge and Data Eng,2006,18(6):842-856.

        [9]強宇.模糊概念格模型及其應(yīng)用研究[D].上海:上海大學(xué),2006.

        猜你喜歡
        外延本體聚類
        Abstracts and Key Words
        對姜夔自度曲音樂本體的現(xiàn)代解讀
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        關(guān)于工資內(nèi)涵和外延界定的再認識
        入坑
        意林(2016年13期)2016-08-18 22:38:36
        愛情的內(nèi)涵和外延(短篇小說)
        《我應(yīng)該感到自豪才對》的本體性教學(xué)內(nèi)容及啟示
        基于改進的遺傳算法的模糊聚類算法
        一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
        自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
        欧美乱人伦中文字幕在线不卡| 日韩高清不卡一区二区三区| 极品人妻被黑人中出种子| 成人欧美一区二区三区在线| 亚洲av无码潮喷在线观看| 国产96在线 | 亚洲| 伊人久久亚洲综合影院首页| 嗯啊 不要 啊啊在线日韩a| 亚洲av第二区国产精品| 亚洲精品一区二区在线免费观看| 少妇无套裸按摩呻吟无呜| 国产又大又硬又粗| 大桥未久亚洲无av码在线| 永久免费无码av在线网站 | 尤物视频一区二区| 日韩亚洲欧美精品| 日本黑人人妻一区二区水多多| 96中文字幕一区二区| 精品国际久久久久999波多野| 亚洲精品久久久久久| 精品国产爱在线观看| av手机免费在线观看高潮| 国产一区二区三区日韩精品| 国产激情内射在线影院| 狠狠丁香激情久久综合| 亚洲精品一区二在线观看| 亚洲人成精品久久久久| 国产美女遭强高潮网站| 国产精品亚洲av国产| 国产成人激情视频在线观看| av在线观看免费天堂| 成人影院yy111111在线| 国产无遮挡裸体免费视频| 日韩二三区| 亚洲av日韩av天堂久久不卡| 99久久无码一区人妻| 亚洲人午夜射精精品日韩| 亚洲电影中文字幕| 国产自拍视频一区在线| 午夜免费视频| 性大片免费视频观看|