亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種語義信息網(wǎng)中構(gòu)建最大相關(guān)本體圖的新算法

        2015-12-02 06:07:58房健趙彥明
        關(guān)鍵詞:語義文本

        房健,趙彥明

        (河北民族師范學(xué)院數(shù)學(xué)與計(jì)算機(jī)系,河北承德067000)

        一種語義信息網(wǎng)中構(gòu)建最大相關(guān)本體圖的新算法

        房健,趙彥明

        (河北民族師范學(xué)院數(shù)學(xué)與計(jì)算機(jī)系,河北承德067000)

        表示和管理海量語義信息中所隱含領(lǐng)域知識(shí)的方法是制約數(shù)據(jù)挖掘技術(shù)發(fā)展和信息系統(tǒng)研發(fā)的核心問題。通過分析本體圖語義項(xiàng)特征和語義項(xiàng)之間的相關(guān)性對(duì)知識(shí)表示的影響,提出一種評(píng)價(jià)語義項(xiàng)重要度的新標(biāo)準(zhǔn),建立一套度量語義項(xiàng)之間相關(guān)性的新策略,進(jìn)而提出從語義信息網(wǎng)中構(gòu)建最大相關(guān)本體圖的新算法,運(yùn)用此算法生成的本體圖能夠更加準(zhǔn)確地表示領(lǐng)域知識(shí),并且最小化本體生成過程中的人為交互。

        語義項(xiàng);最大相關(guān)性;本體圖;算法

        1 引言

        使用本體(Ontology)[1]來學(xué)習(xí)語義網(wǎng)頁信息中隱含的領(lǐng)域知識(shí)起源于本世紀(jì)初。2001年,Karlsruhe大學(xué)的Maedche和Staab提出了一個(gè)構(gòu)建領(lǐng)域本體的半自動(dòng)框架構(gòu)想[2],此框架構(gòu)想在理論層面上描述了如何導(dǎo)入、提取、剪枝、提純、以及評(píng)價(jià)領(lǐng)域本體。在Maedche和Staab工作的指引下,三種具有代表性的領(lǐng)域本體生成引擎被相繼提出,它們分別是:Protégé[3],Nto-Edit[4]和Onto-Builder[5]。然而,這些本體生成過程中的人為交互給領(lǐng)域本體的生成帶來運(yùn)行時(shí)間過長(zhǎng)的問題。為此,香港理工大學(xué)James教授于2008年首次提出了采用歸納學(xué)習(xí)的方式自動(dòng)學(xué)習(xí)和構(gòu)建領(lǐng)域本體的觀點(diǎn),并且以文章本體(Article-ontology),話題本體(Topic-ontology),以及詞典本體(Lexicon-ontology)相結(jié)合的方式來表示領(lǐng)域知識(shí),最終所提取到的本體被視為是領(lǐng)域本體圖的雛形。2009年,James教授給出了領(lǐng)域本體圖的完整定義,較之已有的領(lǐng)域本體提取的方法,本體圖中的語義項(xiàng)是在通過對(duì)大量的語義網(wǎng)頁數(shù)據(jù)學(xué)習(xí)的基礎(chǔ)之上、采用統(tǒng)計(jì)詞頻的方法[6]提取到的,并且詳細(xì)地描述了兩兩語義項(xiàng)之間的相關(guān)程度以及相關(guān)的性質(zhì)。目前,James教授在其最新著作中,通過大量的仿真實(shí)驗(yàn)驗(yàn)證和證實(shí)了本體圖在語義網(wǎng)頁文本分類應(yīng)用中的優(yōu)良表現(xiàn),并詳細(xì)介紹了領(lǐng)域本體圖在商業(yè)應(yīng)用中所取得的巨大突破。然而,基于詞頻統(tǒng)計(jì)以及線性相關(guān)度量構(gòu)建的本體圖尚有改進(jìn)和更新的余地,即通過重要度進(jìn)行語義項(xiàng)提取以及采用更一般的相關(guān)度量標(biāo)準(zhǔn)衡量語義項(xiàng)之間的相關(guān),從而進(jìn)一步提高和增強(qiáng)領(lǐng)域本體圖的準(zhǔn)確度和應(yīng)用范圍。

        2 傳統(tǒng)本體圖生成過程中問題分析

        目前,通過本體圖來表示領(lǐng)域知識(shí)以及構(gòu)建信息系統(tǒng)是解決海量信息管理問題的重要途徑。對(duì)基于本體圖的知識(shí)信息系統(tǒng)的構(gòu)建主要采用通過詞頻統(tǒng)計(jì)的方法從語義網(wǎng)中提取高頻語義項(xiàng)(Semantic term)、利用線性相關(guān)度量標(biāo)準(zhǔn)來衡量語義項(xiàng)之間的相關(guān)程度,在領(lǐng)域本體抽取的過程中通常也是通過人為交互的方法來實(shí)現(xiàn)的。這類方法在某些領(lǐng)域內(nèi)有較好表示,但存在一定欠缺:(1)在傳統(tǒng)的本體圖生成策略中,主要通過計(jì)算各語義項(xiàng)在網(wǎng)頁文本信息中出現(xiàn)的頻率從而挑選出高頻語義項(xiàng)作為本體圖的頂點(diǎn),雖然依據(jù)此策略挑選的高頻語義項(xiàng)在知識(shí)表示時(shí)具有一定的代表性,然而,統(tǒng)計(jì)詞頻的方式卻忽略了各語義項(xiàng)與網(wǎng)頁文本信息主題(Topic)之間的關(guān)系。因此,網(wǎng)頁的類別有時(shí)往往由那些沒有被提取到的低頻語義項(xiàng)所決定;(2)傳統(tǒng)的本體圖生成過程僅采用線性相關(guān)度量?jī)蓚€(gè)語義項(xiàng)之間的相互關(guān)系,而事實(shí)上在眾多的實(shí)際應(yīng)用中,相關(guān)通常存在于多個(gè)語義項(xiàng)之間,并且它們之間的相關(guān)亦多為非線性的;(3)在領(lǐng)域本體圖生成的過程中,過多的人為交互需要大量的運(yùn)行時(shí)間,這意味著所生成的本體圖將不能夠準(zhǔn)確地表示領(lǐng)域知識(shí),并且構(gòu)建的知識(shí)信息系統(tǒng)也不能為用戶提供即時(shí)有效地在線服務(wù)。因此,如何利用本體圖準(zhǔn)確地表示語義信息中所隱含的領(lǐng)域知識(shí)、并有效地降低或減少本體圖生成過程中的人為交互勢(shì)必成為語義網(wǎng)頁數(shù)據(jù)挖掘領(lǐng)域的一項(xiàng)重要內(nèi)容。

        3 研究過程

        通過分析傳統(tǒng)本體圖生成過程中存在的問題,本研究試圖提出一種準(zhǔn)確且智能的本體圖提取和生成策略并解決本體圖生成過程中的出現(xiàn)的問題。研究步驟如下。

        3.1有針對(duì)性地收集語義網(wǎng)文本信息

        3.2定義提取語義項(xiàng)重要度

        3.3建立新的相關(guān)性度量標(biāo)準(zhǔn)衡量不同語義項(xiàng)之間的相關(guān)度

        其中,

        3.4建立一種構(gòu)建最大相關(guān)本體圖的啟發(fā)式算法

        4 結(jié)論

        綜上所述,此項(xiàng)實(shí)驗(yàn)研究提出了一種新的度量語義項(xiàng)重要度的標(biāo)準(zhǔn),通過使用重要度較高的語義項(xiàng)來構(gòu)建本體圖可以替代已有的高頻語義項(xiàng)的選取準(zhǔn)則,同時(shí)建立了新的語義項(xiàng)相關(guān)度量準(zhǔn)則,使其可以度量語義項(xiàng)之間的非線性相關(guān)以及多語義項(xiàng)之間的相關(guān),最終提出了一種最大相關(guān)本體圖生成的新算法,使頂點(diǎn)語義項(xiàng)與文本主題之間的相關(guān)最大化以及頂點(diǎn)語義項(xiàng)之間的連接能夠?qū)崿F(xiàn)最簡(jiǎn)化,能夠更加準(zhǔn)確地表示領(lǐng)域知識(shí),最小化本體生成過程中的人為交互。

        [1]Buitelaar et al.O ntology Learning and Population:Bridging the G ap Betw een Text and K now ledge[J].IO S Press,2008,V ol.10:70-71.

        [2]A edche et al.O ntology Learning for the Semantic W eb [J].IEEE Intelligent Systems,2001,V ol.16:72-79.

        [3]F.N oy etal.Creating SemanticW ebContentsw ith Protégé-2000[J].IEEE IntelligentSystems,2001, V ol.16:60-71,.

        [4]Y.Sureetal.G uidingO ntologyD evelopmentby M ethodology and Inference[J].Lecture N otes in Computer Science,2002,V ol.2519:1205-1222.

        [5]H.Roitman et al.O nto Builder:Fully A utomatic Extraction and Consolidation ofO ntologies from W eb Sources U sing Sequence Semantics[J].Lecture N otes in Computer Science,2006,V ol.4254:573-576.

        [6]Y.J.Li et al.TextClustering w ith Feature Selection by U sing Statistical D ata[J].IEEE Transaction on K now ledgeandD ataEngineering,2008,V ol.20:641-652.

        [7]黃曉斌.網(wǎng)絡(luò)信息挖掘[M].北京:電子工業(yè)出版社,2005.

        On New Algorithm in Building the Most Relevant Ontology Mapping in Semantic Web

        FANG Jian,ZHAO Yan-ming
        (Hebei Normal University for Nationalities,Chengde,Hebei 067000,China)

        The approach of presenting and managing the massive semantic information in implied domain knowledge is the main factor restricting the technical development of data mining and the research on information systems.By analyzing the features of ontology semantic items and the impact of the correlative semantic items on the knowledge representation,this paper puts forward a new standard of evaluating the importance of semantic items,establishes a new strategy of measuring the correlation between semantic items and proposes a new algorithm in building the most relevant ontology mapping in semantic web.The ontology created by this algorithm can represent domain knowledge more accurately and minimize the human interaction.

        semantic items;the largest correlation;ontology;algorithm

        TP63

        A

        2095-3763(2015)02-0087-03

        2014-10-18

        房?。?979-),女,遼寧臺(tái)安人,河北民族師范學(xué)院數(shù)學(xué)與計(jì)算機(jī)系講師,研究方向?yàn)橛?jì)算機(jī)教育與網(wǎng)絡(luò)技術(shù)。

        2014年度河北省教育廳資助科研項(xiàng)目(Z2014082);2013年度河北民族師范學(xué)院科研基金項(xiàng)目(201302)。

        猜你喜歡
        語義文本
        初中群文閱讀的文本選擇及組織
        甘肅教育(2020年8期)2020-06-11 06:10:02
        語言與語義
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        “上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        論《柳毅傳》對(duì)前代文本的繼承與轉(zhuǎn)化
        人間(2015年20期)2016-01-04 12:47:10
        認(rèn)知范疇模糊與語義模糊
        如何快速走進(jìn)文本
        “深+N季”組配的認(rèn)知語義分析
        成人综合亚洲国产成人| 一区二区三区四区午夜视频在线| 亚洲不卡av一区二区三区四区 | 国产亚洲欧美成人久久片| 欧美老熟妇又粗又大| 中日韩字幕中文字幕一区| 人妻经典中文字幕av| 日日摸天天摸97狠狠婷婷| 亚洲精品人成无码中文毛片| 偷拍网日本一区二区三区| 亚洲中文高清乱码av中文| 色综合天天综合网国产成人网| 中文日韩亚洲欧美制服| 国产精品久久久久电影网| 巨臀中文字幕一区二区| 亚洲五码av在线观看| 日本一本免费一二区| 性一乱一搞一交一伦一性| 日韩成人精品日本亚洲| 国产专区亚洲专区久久| 玩弄人妻少妇精品视频| 亚洲av无码一区二区乱子伦| 中文字幕久无码免费久久| 无码国产一区二区色欲| 日韩国产精品一区二区三区| 精品久久人妻av中文字幕| 84pao强力打造免费视频34| 国产一级片内射在线视频| 精品人妻一区二区三区在线观看| 亚洲精品国偷拍自产在线观看| 国产免费破外女真实出血视频| 精品免费看国产一区二区白浆| 一本一道久久综合久久| 国产色无码精品视频国产| 亚洲色成人WWW永久在线观看| 亚洲情久久久精品黄色| 亚洲欧洲成人精品香蕉网| 少妇高潮喷水正在播放| 国产女人高潮的av毛片| 国产视频激情在线观看| 两个人看的www免费视频中文|