亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于谷歌距離的漢英詞表概念映射研究

        2015-09-08 01:38:37張李義崔恒
        現(xiàn)代情報 2015年3期

        張李義 崔恒

        [摘要]本文對《漢語主題詞表》(工程技術(shù)版)概念與英文超級科技詞表概念的映射進行研究,建立優(yōu)化的漢對英有序映射模式,并采用基于谷歌距離的語義相似度算法進行實驗,計算英文詞之間的語義距離,導(dǎo)入原有漢英映射信息。通過實驗分析,獲得了按相似度排序的漢英映射模式,實現(xiàn)了多個英文詞匯與漢詞的對應(yīng)并由高到低排列出來。該方法獲得的排序結(jié)果基本滿足要求,部分詞語需要人工修正。

        [關(guān)鍵詞]語義相似度;漢語主題詞表;谷歌距離;概念映射

        DOI:10.3969/j.issn.1008-0821.2015.03.001

        [中圖分類號]TP391;G25 [文獻標識碼]A [文章編號]1008-0821(2015)03-0003-05

        詞表映射研究是研究和建設(shè)跨語言信息檢索(Cross Language Information Retrieval,CAJR)的基礎(chǔ),本文的目標是通過計算映射詞語的相同程度來解決跨語言搜索結(jié)果的有序排列問題,其關(guān)鍵在于獲取語義距離和改進現(xiàn)在的映射規(guī)則。研究雙語言或多語言的CLIR是一個熱門的話題,《漢語主題詞表》(工程技術(shù)版)(以下簡稱《漢表》)與英文超級科技詞表分別用于進行中外文科技文獻的知識組織,而兩者的相互映射正是為了實現(xiàn)對中外文文獻資源的跨語言檢索;考慮到兩個詞表知識體系的差異和語義映射的復(fù)雜性,本文不進行知識概念體系、詞間關(guān)系和范疇體系等方面的語義映射,主要研究基于概念的映射模型和方法。

        本文以《漢表》的概念作為源(Source)概念,英文超級科技詞表的概念作為目標(Target)概念,參考并修訂W3C的詞表映射規(guī)則,建立映射模型。《漢表》概念具有上下位、多層次關(guān)系,英文超級科技詞表概念也是網(wǎng)狀關(guān)系,在建立概念間映射關(guān)系時,只在距離最短、關(guān)系最近的概念間建立關(guān)系,沒有必要將等同的概念重復(fù)給定向上或向下匹配的關(guān)系,按照需要,將詞表的原詞間關(guān)系導(dǎo)入映射信息即可確定新的映射關(guān)系。本文以標準谷歌距離(Normalized Google Distance)作為語義距離的基本計算方法,并設(shè)計了映射流程,在已有漢英詞表的基礎(chǔ)上,對映射進行排序,能有效地解決檢索時漢英詞語的匹配問題。在檢索過程中,可以做到按相似度的高低呈現(xiàn)有序的檢索結(jié)果,從而給用戶更優(yōu)的檢索體驗。本文通過程序進行演算獲取實驗結(jié)果,根據(jù)語義相似度進行排序,建立新的有序映射。endprint

        国产极品美女高潮抽搐免费网站| 中文天堂国产最新| 丰满的人妻hd高清日本| 日本入室强伦姧bd在线观看| 精品免费看国产一区二区| 99久久精品国产成人综合| 五月激情婷婷丁香| 国产乱人视频在线播放| 国产精品污www一区二区三区| 亚洲免费不卡| 色青青女同性恋视频日本熟女| 亚洲精品国产av成拍色拍| 国产91久久麻豆黄片| 亚洲精品一区二区三区麻豆| 久久精品国产精品青草| 人妻去按摩店被黑人按中出 | 中文AV怡红院| 欧美综合自拍亚洲综合百度| 日本一区二区精品色超碰| 蜜桃夜夜爽天天爽三区麻豆av| 国产美女主播视频一二三区| 国产亚洲一区二区在线观看 | 国产精品久久久久久久久久影院| 日韩美女人妻一区二区三区| 亚洲熟女乱一区二区三区| 无码伊人66久久大杳蕉网站谷歌| 久久99热狠狠色精品一区| 欧美黑人又粗又大久久久| 日韩久久久久中文字幕人妻| 亚洲av黄片一区二区| av免费在线国语对白| 亚洲人成网77777色在线播放| 日本成本人三级在线观看| 国产欧美日韩专区| 国产成人精品免费视频大全| 亚洲成生人免费av毛片| 亚洲av综合色一区二区| 亚洲av乱码一区二区三区林ゆな| 日产精品久久久久久久性色| 国产精品第1页在线观看| 久久精品国产白丝爆白浆|