亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        語義轉換影響因素評價方法研究

        2016-11-04 02:14:16劉平芝張衛(wèi)柱徐道柱
        測繪科學與工程 2016年1期
        關鍵詞:相似性語義概念

        熊 順,劉平芝,張衛(wèi)柱,徐道柱

        1.信息工程大學地理空間信息學院,河南 鄭州,450052;2.西安測繪研究所,陜西 西安,710054;3.地理信息工程國家重點實驗室,陜西 西安,710054

        ?

        語義轉換影響因素評價方法研究

        熊順1,2,3,劉平芝2,3,張衛(wèi)柱2,3,徐道柱1,2,3

        1.信息工程大學地理空間信息學院,河南 鄭州,450052;2.西安測繪研究所,陜西 西安,710054;3.地理信息工程國家重點實驗室,陜西 西安,710054

        影響語義信息轉換模型算法結果的因素很多,其模糊性和隨機性的特點使模型算法的影響因素選取問題很難解決。本文分析了語義相似性算法影響因素,引入模糊數學思想,針對算法因子提出多級模糊綜合評價方法,通過對算法因子的評價,為相似性模型算法因子的選取提供重要判斷依據,對于提高算法模型的效率和準確度具有重要意義。

        語義;相似性;多級模糊評價;語義距離

        1 前 言

        目前,國內系列比例尺的基礎地理信息數據庫基本建立,數據信息更新速度越來越快,數據內容涵蓋范圍越來越廣泛,數據類型也越來越繁多,數據應用對于屬性信息多樣化的要求也越來越高,因此,數據共享服務中針對解決語義信息轉換的需求也越來越迫切。語義信息的無損轉換,是實現不同類型地理信息之間數據交換和共享的基本技術途徑,也是當前信息共享迫切需要解決的關鍵技術問題。

        語義信息的轉換,可以從定量的角度,通過語義相似關系的判斷來實現。相似性是現實世界中不同地理現象之間所存在的一種普遍關系。研究地理信息的相似性,是人類認知地理空間關系的重要內容。相似性通常采用基于人工判斷的方法、基于領域應用的定性方法和基于計算機語言學的定量方法對概念之間的關系進行描述。其中,定量的方法是通過計算元素(概念)之間的語義相似度(Semantic Similarity)或者語義距離(Semantic Distance)等具體數值來表示概念之間的關系[1,2]。語義相似度的計算須借助數學理論和方法,建立語義相似度量模型實現語義相似程度的量化,這是解決本體語義異質問題的有效技術途徑。語義相似性度量是語義關系的重要判斷依據。影響語義相似性模型算法結果的因素很多,如何判斷并選取這些影響因素,對于提高算法模型的效率和準確度具有重要意義,解決該問題的關鍵在于對語義相似性算法因子評價方法的研究。

        由于語義相似性結果涉及因素較多,如可以進行定量描述的概念節(jié)點的深度、密度、屬性容量和屬性的重要度、關系描述、類型等,這些因素都具有模糊性和隨機性,這就決定了語義相似性算法因子權重取值的不確定性[3]。根據這些因子的模糊性和復雜性,本文引入多級模糊數學綜合評判的原理和方法,對語義相似性算法因子進行評價,來研究這些因子對算法結果的影響度。

        2 語義相似性模型及算法因子的選擇

        語義相似性的量化計算方法,比較流行的有兩種[4]:一是同義詞詞典方法。該方法基于本體庫,利用同義詞詞典(Thesaurus)來計算相似度。Princeton大學的WordNet就是一部樹狀的英語語義字典,樹狀圖上兩片樹葉之間的距離,就是這兩個概念的語義距離,由語義距離可進一步得出語義相似度。二是詞語相關性方法。該方法是基于大規(guī)模的本體庫統(tǒng)計信息,利用詞語的相關性來計算相似度。通常選取一組特征詞,利用在實際大規(guī)模本體庫中上下文的出現頻率得到相關性的特征向量,用向量的夾角余弦來計算相似度[5]。本文采用第一種方法,通過概念之間的詞義距離來衡量概念語義的相似程度[6]?,F有的語義距離計算方法比較成熟,其中,戴維民(2008)根據概念之間邊的關系以及最低共同祖先與語義距離的關系,提出了一個經典的語義距離計算公式[7]:

        (1)

        (2)

        以上公式對于基于語義距離的語義相似度計算比較準確,但是該方法忽略了其它因素的影響,比如概念節(jié)點的密度、重要度等。為了更為準確地獲得語義相似性計算的算法因子,必須針對概念層次結構以及概念的相關屬性進行研究,找出影響相似性計算結果的因素,從而實現對上述算法的優(yōu)化。

        算法因子的引入,必須充分考慮到概念節(jié)點的實際含義、所處的層次、相對的位置、出現的頻率和屬性描述等信息。通過概念語義關系的分析,確定引入以下算法因子:語義距離、節(jié)點密度den(vi,vj)、節(jié)點深度dep(vi,vj)、節(jié)點重要度imp(vi,vj)、節(jié)點類型rel(vi,vj)、屬性容量cap(vi,vj)、知識范圍reg(vi,vj)。其中語義距離、節(jié)點密度、節(jié)點深度與語義相似性之間成反比,節(jié)點重要度、屬性容量與語義相似性之間成正比,而節(jié)點類型和知識范圍是從節(jié)點之間的關系來界定其相似性的。

        (3)

        其中,ω=[α,β,γ,δ,ε,θ,μ]為運算因子的調節(jié)參數,且(α,β,γ,δ,ε,θ,μ)∈[0,1],滿足α+β+γ+δ+ε+θ+μ=1。

        3 基于多級模糊的算法因子評價方法

        針對模糊綜合評價的不足[3],多級模糊綜合評價能充分考慮到算法因子的不確定性對相似性算法的影響,從影響因素的層次關系入手,彌補模糊綜合評價的缺陷[8]。

        3.1多級模糊綜合評價原理[8]

        首先設定選擇的m個因素的集合為U={U1,U2,…,Um},n個評價集合為W={W1,W2,…,Wn}。然后,確定評價等級,即確定相應的相似性置信區(qū)間。本文分為4個區(qū)間,即完全不等價V1∈[0,0.2],低概念等價V2∈(0.2,0.5],基本等價V3∈(0.5,0.9),完全的等價V4∈[0.9,1]。評價等級標準集為V={ V1,V2, V3, V4}。如果選擇 rij表示第i個因素對第j種評價的隸屬度[3],則所有的影響因素集合和評價集合之間的關系可以用模糊矩陣表達

        (4)

        其中,rij必須滿足0≤rij=μR(Ui,Wj)≤1,i=1,2,…,m,j=1,2,…,n。

        (5)

        其中B是最終的綜合評價集合,整個評價過程是從最低級向上逐級運算的,也就是說第k級的評價結果就是第k-1級影響因素的隸屬度。計算的步驟如下:

        1)因為k=3,所以首先進行第三級的計算,獲得Bij=Aij×Rij,然后令

        (6)

        2)完成第三級計算后開始第二級計算,獲得Bi=Ai×Ri,然后令

        (7)

        3)通過最后一級的運算,可以獲得最終的評價集合

        B=A×RT

        (8)

        3.2算法因子的多級模糊評價

        改進的算法模型在計算中考慮的影響因素有:概念語義距離、概念的節(jié)點密度、節(jié)點深度、節(jié)點重要度、節(jié)點類型、屬性容量、知識范圍等7個因素,因此設定影響因素集合U={U1,U2,U3,U4,U5,U6,U7},具體的影響因素定義如表1所示。

        U1為概念語義距離因素,U1所對應的下一級因素為U1={U11,U12},U11為概念集合的總深度,U12為節(jié)點之間的最短距離,而U12={U121,U122},其中U121為節(jié)點vi的位置,U122為節(jié)點vj的位置;

        U2為概念節(jié)點密度因素,U2所對應的下一級因素為U2={U21,U22,U23},U21為節(jié)點層次,U22為節(jié)點總數,U23為節(jié)點差值,而U23={U231,U232},其中U231為節(jié)點vi位置的節(jié)點數,U232為節(jié)點vj位置的節(jié)點數;

        U3為概念節(jié)點深度因素,U3所對應的下一級因素為U3={U31,U32,U33,U34},U31為概念集合的總深度,U32為節(jié)點總數,U33為節(jié)點差值,U34為概念之間的公共節(jié)點,而U33={U331,U332},其中U331為節(jié)點vi位置,U332為節(jié)點vj位置;

        U4為概念節(jié)點重要度因素,U4所對應的下一級因素為U4={U41,U42},U41為概念集合的數據集大小,U42為概念節(jié)點在數據集中的頻率關系,而U42={U421,U422},其中U421為節(jié)點vi在數據集中的頻率,U422為節(jié)點vj在數據集中的頻率;

        U5為概念節(jié)點類型因素,U5所對應的下一級因素為U5={U51,U52},U51為概念節(jié)點類型分布特征,U52為節(jié)點類型關系;

        U6為概念屬性容量因素,U6所對應的下一級因素為U6={U61,U62},U61為概念節(jié)點之間的屬性總量,U62為節(jié)點之間的公共屬性,而U62={U621,U622},其中U621為節(jié)點vi的屬性總數,U622為節(jié)點vj的屬性總數;

        U7為概念節(jié)點知識范圍因素,則U7所對應的下一級因素為U7={U71,U72,U73},U71為概念為同一領域知識,U72為相關領域知識,U73為不同領域知識。

        表1影響因素定義

        因素描述二級因素描述三級因素描述U1概念語義距離U11概念集合的總深度——————U12節(jié)點之間的最短距離U121vi節(jié)點位置U122vj節(jié)點位置U2節(jié)點密度U21節(jié)點層次——————U22節(jié)點總數——————U23節(jié)點差值U231vi節(jié)點數U232vj節(jié)點數U3節(jié)點深度U31概念集合總深度——————U32節(jié)點總數——————U33節(jié)點差值U331vi節(jié)點位置U332vj節(jié)點位置U34概念之間公共節(jié)點——————U4節(jié)點重要度U41集合的數據集大小——————U42在數據集中的頻率關系U421vi節(jié)點頻率U422vj節(jié)點頻率U5節(jié)點類型U51概念節(jié)點類型分布特征——————U52節(jié)點類型關系——————U6屬性容量U61節(jié)點之間的屬性總量——————U62節(jié)點之間的公共屬性U621vi屬性數U622vj屬性數U7知識范圍U71同一領域知識——————U72相關領域知識——————U73不同領域知識——————

        由于評價等級標準集為V={ V1,V2, V3, V4},根據隸屬函數[3]確定方法,可以計算所有的因素評價集合W的隸屬度,如表2所示。

        表2影響因素的評價集合

        影響因素二級影響因素V1V2V3V4U1U110.300.400.150.15U12U1210.240.220.310.23U1220.200.250.310.24U2U210.340.260.180.22U220.410.330.110.16U23U2310.220.130.370.28U2320.310.350.230.11U3U310.200.430.220.15U320.190.440.160.21U33U3310.320.330.250.10U3320.250.300.190.26U340.360.220.180.24

        續(xù)表2

        按照多級模糊綜合評價方法,從第三級到第一級的順序進行計算:

        1)計算第三級結果。表2中U12、U23、U33、U42、U62有第三級影響因素,通過專家評估,可以獲得其權向量A12、A23、A33、A42、A62都為[0.50.5],根據表2得到:

        R12=[0.200.250.310.24]

        由B12=A12×R12,可以得到:

        B12=A12×R12=[0.50.5]×[0.200.250.310.24]=[0.220.2350.310.235]

        同理可得:

        B23=A23×R23=[0.50.5]×[0.310.350.230.11]=[0.2650.240.300.195]

        B33=A33×R33=[0.50.5]×[0.250.300.190.26]=[0.2850.3150.220.18]

        B42=A42×R42=[0.50.5]×[0.300.220.250.23]=[0.3250.260.180.185]

        B62=A62×R62=[0.50.5]×[0.400.320.210.07]=[0.340.320.2050.135]

        結合表2,可以獲得U1、U2、U3、U4、U6的第二級模糊關系矩陣,分別為:

        2)計算第二級結果。據表2,繼續(xù)計算剩下幾個因子的模糊關系矩陣,分別為:

        根據專家評價每一個因素的下一級因素的權向量,可以獲得:

        A1=[0.400.60]

        A2=[0.320.300.38]

        A3=[0.200.200.300.30]

        A4=[0.400.60]

        A5=[0.500.50]

        A6=[0.400.60]

        A7=[0.330.340.33]

        由B1=A1×R1,可以得到:

        B1=[0.2520.3010.2460.201]

        B2=[0.2230.2620.2030.332]

        B3=[0.2460.2120.3010.241]

        B4=[0.3710.2560.1600.213]

        B5=[0.2150.2700.2650.200]

        B6=[0.3360.2760.2830.105]

        B7=[0.2170.3230.2340.226]

        由此可以獲得最高級的模糊矩陣:

        3)計算最高級結果。通過專家知識確定影響因子的權向量為:

        A=[0.30.20.10.10.10.10.1]

        根據前兩個步驟獲得的模糊矩陣R,可以計算影響因子的評價集合:

        B=A×RT=[0.4010.1010.1710.0710.0650.1400.052]

        3.3評價結果分析

        為了與實際結果進行比對,本文通過人工方法對算法因子的重要性進行描述,采用調查統(tǒng)計、數據實驗和專家經驗相結合的方法進行評價,根據相似置信區(qū)間,設計算法因子評價調查表,并通過調節(jié)算法轉換因子的參數,進行1∶5萬、1∶1萬地形圖數據之間的語義信息轉換結果對比實驗,獲得語義相似性算法因子的綜合評語,如表3。

        表3綜合評語

        因素V1V2V3V4U10.250.300.270.19U20.220.320.200.26U30.210.350.200.19U40.240.290.280.19U50.200.300.220.18U60.230.360.220.14U70.210.370.210.16

        可以得到模糊關系矩陣:

        影響因子的權向量為:

        A=[0.30.20.10.10.10.10.1]

        根據前兩個步驟獲得的模糊矩陣R,可以計算影響因子的評價集合:

        B′=A×R′T=[0.4680.1410.1340.0630.0600.1120.032]

        評價向量的偏移量ε=|B′-B|,結果如表4:

        表4評價向量偏移量

        序號向量B向量B'偏移量ε10.4010.4680.06720.1010.1410.04030.1710.1340.03740.0710.0630.00850.0650.0600.00560.1400.1120.02870.0520.0320.020

        通過計算結果可以發(fā)現,專家的綜合評語結果B′與模糊綜合評判結果B是相近的,同時也可以發(fā)現算法因子中,語義距離、節(jié)點密度、節(jié)點深度和屬性容量等因素對相似性算法結果的影響是不可忽略的。通過這種評價方式,選擇合適的語義相似性算法因子,可以適應語義轉換的實際情況,減少算法的計算量,從而提高模型算法的運算效率和準確度。

        4 結 論

        基于多級模糊評價的方法對于影響因素多級多層次的問題有很好的適用性,通過綜合考慮影響因素的復雜關系,盡量對不同級別的因素進行量化,減少主觀的人為判斷,從而使評價的結果科學合理,更加符合客觀實際。語義相似性算法因子對于算法結果的影響存在復雜性和不確定性,但是引入模糊數學思想,創(chuàng)新性地應用模糊綜合評價方法,對于算法因子影響效果的量化具有重要意義。

        但是,該方法還存在兩個問題。一是各級因素的權向量確定,通過專家知識來確定權向量,很顯然增加了人為的主觀因素,對計算結果不可避免地產生負面影響;二是評價等級的劃分,等級劃分的詳細程度對評價對象的評價結果有影響,劃分的越細,評價結果就越明確,但是通過人為主觀的劃分,也不可避免地對計算的結果產生負面的影響。

        [1]張晨或.基于語義度量的本體映射及語義查詢的研究[D].合肥:合肥工業(yè)大學,2005.

        [2]何娟,高志強,陸青健等.基于詞匯相似度的元素級本體匹配[J].計算機工程,2006,32(16):185~187.

        [3]熊順.語義相似性算法因子評價方法研究[J].測繪科學與工程,2014(3):68-72.

        [4]Dao-I Lin,Kedem Z M .Pincer-search,All Efficient Algorithm for Discovering the Maximum-equent set[C].London:Proceedings of the 6th European Conference on Extending Database Technology,1998.

        [5]LEACOCK C,CHODOROW M.Combining Local Context and Word-net Similarity for Word Sense Identification[M]. Cambridge:M1T Press,1998.

        [6]CROSS V.Fuzzy semantic distance measures between ontologicalconcepts[C]. Washington,DC:IEEE Annual Meeting of the Fuzzy Information, 2004.

        [7]戴維民.語義網信息組織技術與方法[M].上海:學林出版社,2008.

        [8]胡圣武.GIS質量評價與可靠性分析[M].北京:測繪出版社,2006.

        Evaluation Method of Semantic Conversion Influence Factors

        Xiong Shun1,2,3,Liu Pingzhi2,3,Zhang Weizhu2,3,Xu Daozhu1,2,3

        1. Institute of Geospatial Information, Information Engineering University, Zhengzhou 450052, China 2. Xi’an Research Institute of Surveying and Mapping, Xi’an 710054, China 3. State Key Laboratory of Geo-information Engineering, Xi’an 710054, China

        Many factors have influences on the semantic conversion model, and it is difficult to select proper ones due to their fuzziness and randomness. In this paper, the influence factors of the semantic similarity algorithm are analyzed and the fuzzy mathematics is introduced. A multi-level fuzzy comprehensive evaluation method is proposed for the algorithm factor. The algorithm factor evaluation provides an important basis for the similarity model algorithm factor selection, and will make important contribution to the efficiency and accuracy improvement of the model.

        semantic; similarity; multi-level fuzzy evaluation; semantic distance

        2015-12-09。

        熊順(1976—),男,工程師,主要從事地圖制圖學與地理信息研究。

        P231

        A

        猜你喜歡
        相似性語義概念
        一類上三角算子矩陣的相似性與酉相似性
        Birdie Cup Coffee豐盛里概念店
        現代裝飾(2022年1期)2022-04-19 13:47:32
        淺析當代中西方繪畫的相似性
        河北畫報(2020年8期)2020-10-27 02:54:20
        語言與語義
        幾樣概念店
        現代裝飾(2020年2期)2020-03-03 13:37:44
        學習集合概念『四步走』
        聚焦集合的概念及應用
        低滲透黏土中氯離子彌散作用離心模擬相似性
        “上”與“下”語義的不對稱性及其認知闡釋
        現代語文(2016年21期)2016-05-25 13:13:44
        認知范疇模糊與語義模糊
        无码AV高潮喷水无码专区线 | 午夜少妇高潮在线观看视频| 亚洲av天堂在线视频| 国产精品99久久久久久猫咪| 欧美日韩亚洲精品瑜伽裤| 免费人成视频欧美| 麻豆视频av在线观看| 国产熟妇与子伦hd| 精品无码中文视频在线观看| 亚洲男人天堂av在线| 深夜日韩在线观看视频| 大地资源在线影视播放| 亚洲熟伦熟女新五十路熟妇| 91青青草久久| 国产精品成人一区二区在线不卡 | 综合网在线视频| 蜜桃av区一区二区三| 中文字幕本久久精品一区| 99久久免费国产精品| 欧美日韩不卡中文字幕在线| 中文字幕成人乱码亚洲| 精品国产精品久久一区免费式 | 国产精品女老熟女一区二区久久夜| 小宝极品内射国产在线| 国产主播在线 | 中文| 日韩精品极品免费在线视频| 深夜爽爽动态图无遮无挡| 88国产精品视频一区二区三区| 2020国产精品久久久久| 免费视频亚洲一区二区三区| 性生交片免费无码看人| 亚洲天堂在线播放| 久草91这里只有精品| 日本精品视频二区三区| 国产丝袜在线精品丝袜| 欧美日韩国产亚洲一区二区三区| 邻居少妇张开腿让我爽视频| 欧美白人战黑吊| 欧洲熟妇色xxxx欧美老妇多毛网站| 狠狠色欧美亚洲综合色黑a| 亚洲一区亚洲二区视频在线|