亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于領(lǐng)域詞典的XML非結(jié)構(gòu)化信息模式識別方法

        2014-01-02 02:42:18
        科技視界 2014年33期
        關(guān)鍵詞:實(shí)值模式識別結(jié)構(gòu)化

        杜 巍

        (中國人民解放軍海軍艦艇學(xué)院,遼寧 大連116018)

        0 引言

        生產(chǎn)發(fā)展推動了社會分工,在效率關(guān)乎興亡的社會條件下,許多行業(yè)都開始通過以整合資源、系統(tǒng)運(yùn)作的方式增強(qiáng)競爭力。系統(tǒng)的日益龐大也造成了其外延的不斷擴(kuò)散,觸及的領(lǐng)域之多、范圍之廣已經(jīng)超過了人類個體的認(rèn)知范圍。另一方面,人類注意力的有限性使得他們在信息爆炸時代的海量“信息碎片”中難以取舍。準(zhǔn)確快捷的提供用戶所需要的信息,淡化的無關(guān)信息,就需要利用各種技術(shù)對環(huán)境和客體中各種龐雜的信息進(jìn)行采集并有效進(jìn)行模式識別。

        模式識別是一種計算機(jī)通過對信息依次進(jìn)行采集,預(yù)處理,特征或基元抽取,模式分類,以自動或者在人盡量少干預(yù)的情況下把待識別模式歸入相應(yīng)的模式類中去的技術(shù)傳統(tǒng)的模式識別方法,主要有統(tǒng)計模式識別法和結(jié)構(gòu)模式識別法。統(tǒng)計模式識別法是通過對待識別對象進(jìn)行特征提取,然后根據(jù)某種準(zhǔn)則所確定的決策函數(shù)進(jìn)行分類,即從信息特征空間映射到?jīng)Q策空間;結(jié)構(gòu)模式識別法,則是通過把一個模式描述成子模式的方式,形成一個樹形的描述結(jié)構(gòu)。

        在非結(jié)構(gòu)化信息面前,傳統(tǒng)的模式識別方法往往難以滿足計算量和復(fù)雜的信息描述方式。隨著模糊數(shù)學(xué)及人工智能的發(fā)展,人們開始了模糊模式識別和智能模式識別的研究,尤其是人工神經(jīng)網(wǎng)絡(luò)在模式識別中產(chǎn)生了較大的成就。然而經(jīng)驗(yàn)表明,在灰色領(lǐng)域,即信息數(shù)量龐大,結(jié)構(gòu)復(fù)雜,內(nèi)容零碎而情況下,運(yùn)用神經(jīng)網(wǎng)絡(luò)方法,效率并不盡人意。而基于統(tǒng)計的方法和確定演繹方法均有各自的局限性,如樣本持有量和計算量和使用范圍,需要加以綜合、改進(jìn)。本文嘗試一種分層的模式識別與信息分類系統(tǒng)結(jié)構(gòu),使之能夠滿足多范疇不完整的非結(jié)構(gòu)化信息進(jìn)行模式識別。

        1 非結(jié)構(gòu)化信息的概念與XML語言的特性

        現(xiàn)實(shí)情況下,受到信息來源,信息范疇和保存格式的影響,許多實(shí)際問題中,信息的內(nèi)部結(jié)構(gòu)、參數(shù)聚合特征一般不能全部被人們了解。即使事實(shí)上這些信息存在這大量聯(lián)系實(shí)際內(nèi)容重合,但由于呈現(xiàn)出的結(jié)構(gòu)各不相同,表面描述雜亂無序,內(nèi)容因采集方式的局限顯得殘缺不齊,難以通過傳統(tǒng)的方法進(jìn)行識別和分類,這樣的不完全信息都屬于非結(jié)構(gòu)化信息。不完全信息本身固有的語義包括:不完全信息是否有可用來取代該不完全信息的完全信息的值——實(shí)值,實(shí)值的個數(shù),實(shí)值的限定范圍[8]。根據(jù)這些語義信息,不完全信息可以分為三類:“不存在型不完全信息”,即某個關(guān)系的某一個元組在某一個屬性上不該具有任何實(shí)值;“存在性不完全信息就”,即某個關(guān)系的某一個元組在某一個屬性上本應(yīng)必然著幾個實(shí)值,但在當(dāng)前是未知的,需要未來確知這個實(shí)值,這個確知的過程稱之為完全化;“占位型不完全信息”,關(guān)系的某一個元組在某一屬性上尚不知是否存在某種實(shí)值,它可能是不存在性不完全信息,也可能是存在性不完全信息。當(dāng)作為數(shù)據(jù)源的傳感器、網(wǎng)絡(luò)端口數(shù)量龐大,種類繁多的情況下,統(tǒng)一的數(shù)據(jù)格式往往難以實(shí)現(xiàn),更多的是以非結(jié)構(gòu)化的形式出現(xiàn),為了促進(jìn)數(shù)據(jù)交換與操作,人們開發(fā)了各種語言標(biāo)準(zhǔn),目前比較常用的方法是采用可擴(kuò)展標(biāo)記語言XML(eXtensible Markup Language),這種標(biāo)記語言有這便于信息檢索、數(shù)據(jù)內(nèi)容與形式分離的好處,是信息載體的發(fā)展趨勢,也是模式識別的主要研究對象。

        2 基于分層領(lǐng)域詞典的非結(jié)構(gòu)化信息的模式識別方法

        零散信息源或未知信息源所傳遞的信息,識別工具僅能獲取表面標(biāo)識和大體結(jié)構(gòu),而對其攜帶的信息以及實(shí)際對應(yīng)的范疇難以確認(rèn),這種部分信息已知而部分信息未知的系統(tǒng),稱之為灰色系統(tǒng)。對灰色系統(tǒng)的認(rèn)知適合采用分層次的白化方法,即從大概念上的范疇逐步劃分為其下的子范疇,類似領(lǐng)域本體的層次劃分,呈現(xiàn)出一種樹形結(jié)構(gòu),劃分的子范疇具有更具體的領(lǐng)域特征和對應(yīng)的領(lǐng)域詞庫可以對待識別對象進(jìn)行進(jìn)一步匹配,這樣既可以降低計算量,增強(qiáng)了系統(tǒng)在低精度要求條件下的識別正確率的魯棒性。

        假設(shè)收到一組信息,先通過少量具有明顯可區(qū)別性特征的元素,如年齡信息、作者信息、具有明顯的特征性,其可能所屬領(lǐng)域范疇則顯著縮小,只需要傳遞致含有生物信息或文化產(chǎn)品信息的領(lǐng)域識別列表處,再通過運(yùn)用該領(lǐng)域的數(shù)據(jù)字典庫對目標(biāo)模式進(jìn)行比對,做出更細(xì)化的劃分,直到抵達(dá)葉子節(jié)點(diǎn)或需要達(dá)到的識別級別。

        這種方式有點(diǎn)像本體的概念的劃分,標(biāo)準(zhǔn)頂級本體概念下根據(jù)條件的細(xì)化從THING(事物)這樣的宏大概念,到GraphLoop(環(huán)形圖像)這樣的領(lǐng)域概念。如圖1。

        圖1 標(biāo)準(zhǔn)頂級本體概念樹

        識別過程:假定收到一組未知對象信息X,需要確認(rèn)其所屬模式ω,該模式屬于一個論域Ω,通過分析對象X的信息,可以獲知X包含了 n 個屬性,記 為 X={x1,x2,… ,xn},其中 xi(i=1,2,… ,n)是第 i個屬性,每個屬性x又包括屬性名和屬性值;某一待模式ω內(nèi)包含了m個屬性,記為 ω={ωa1、ωa2…ωam},其中 ωaj(j=1,2,…,m)是模式 ω 的第 j個屬性,考慮到信息的格式可能存在不規(guī)范特征,比如XML格式中屬性名字可以自己定義,不同名稱的屬性可能表示不同的概念,這就需要為每一個屬性名構(gòu)造一個近義詞匹配表,該表結(jié)構(gòu)如表1。

        表1

        這里設(shè)的權(quán)值ra是衡量的是該信息來源的匹配程度,即近義詞與規(guī)范名稱的貼近程度,注意的是因?yàn)椴煌拿绞脚c知識領(lǐng)域是相關(guān)的,不同的命名方式即使意義相同,也可能降低了屬于本領(lǐng)域的可能性。

        校正動作用于該屬性名對應(yīng)的屬性值,如例子中因?yàn)閱挝坏牟煌枰拚龑傩灾档拇笮?。v表示該屬性的值,f(v)表示校正后的值。

        以某領(lǐng)域距離單位名稱為例:

        同樣,對于某個領(lǐng)域下該屬性名的屬性值有一定分布規(guī)律,對匹配對象的屬性值分布可能性進(jìn)行權(quán)重確定和處理。

        模式ω與對象X的匹配度計算公式如下:

        一個待識別對象X與一個模式模式ω的匹配值決定了他們的匹配程度,可以根據(jù)需要選擇保留超過事先確定的閾值的若干模式,也可以取最大匹配值的模式作為結(jié)果。計算的結(jié)果可以根據(jù)需求進(jìn)行下一步處理或舍棄,如信息明顯不屬于用戶關(guān)注的領(lǐng)域,則可以忽視此信息,否則以該模式代表的領(lǐng)域,構(gòu)建新的論域,進(jìn)行下一級模式匹配。

        3 效果驗(yàn)證

        為了驗(yàn)證以上方案的有效性,構(gòu)造了一組簡單的不完全信息的案例作為仿真分析,假設(shè)某艦艇收到一組XML格式的信息,

        <目標(biāo)>

        <時間>XXX</時間>

        <經(jīng)度>121</經(jīng)度>

        <緯度>41</緯度>

        <高度></高度> //注:空標(biāo)識,屬于存在型不完全信息

        <反射面積>60</反射面積>

        <速度>40</速度>

        <方向>135</方向>

        </目標(biāo)>

        假設(shè)待匹配的模式有3種:模式1(飛機(jī)或?qū)?、模式2(艦船)、模式3(潛艇或水雷)。

        各自的模式特征屬性:(括號內(nèi)為該屬性的權(quán)重)

        模式 1:高度(0.6)、反射面積(0.2)、速度(0.3)

        模式 2:高度(0.3)、反射面積(0.2)、速度(0.3)、噪聲(0.2)

        模式 3:深度(0.6)、速度(0.1)、噪聲(0.3)

        需要注明的近義詞表有:

        表4 模式3

        各模式的屬性分布(只附上待識別目標(biāo)匹配的):

        表7 模式3

        計算結(jié)果為 P(X,ω1)=0.40

        從計算結(jié)果來看,待識別對象為艦船的可能性最大,潛艇的可能性最小,基本符合人的主觀認(rèn)知。

        4 結(jié)論

        這種模式識別方法具有計算簡單,對數(shù)據(jù)的結(jié)構(gòu)性和完整性要求十分寬松的特點(diǎn),適合知識總量可控的領(lǐng)域使用,如果以此進(jìn)行建立較大領(lǐng)域的模糊識別,需要得到較完善的領(lǐng)域知識和豐富的認(rèn)知詞典內(nèi)容的支持。

        [1]熊超.模式識別理論以其應(yīng)用綜述[J].中國科技信息,2006,6:171-173.

        [2]靳光俊,范學(xué)峰,郭文宏,金玉.基于灰色理論的整體模式匹配 [J].信息技術(shù),2008,11:41-45.

        [3]韓景倜,盧致杰,覃正.基于XML的復(fù)雜信息系統(tǒng)自動分類方法[J].系統(tǒng)工程理論方法應(yīng)用,2005,12:487-491.

        [4]王智君.粗糙集規(guī)則簡約的放蕩發(fā)在模式識別中的應(yīng)用[J].微計算機(jī)應(yīng)用,2009,5,30(5).

        猜你喜歡
        實(shí)值模式識別結(jié)構(gòu)化
        多粒度實(shí)值形式概念分析
        促進(jìn)知識結(jié)構(gòu)化的主題式復(fù)習(xí)初探
        結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
        實(shí)值多變量維數(shù)約簡:綜述
        淺談模式識別在圖像識別中的應(yīng)用
        電子測試(2017年23期)2017-04-04 05:06:50
        第四屆亞洲模式識別會議
        基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
        雙正交周期插值小波函數(shù)的實(shí)值對稱性
        第3屆亞洲模式識別會議
        可測函數(shù)序列的三種收斂及之間的關(guān)系
        国产成av人在线观看| 久久99国产亚洲高清观看韩国| 国产在亚洲线视频观看| 一区二区三区人妻在线| 免费久久99精品国产| 日日碰狠狠添天天爽| 亚洲人成亚洲人成在线观看| 亚洲av人片在线观看调教| 亚洲一区二区三区高清在线观看| 国产肉体xxxx裸体784大胆| 四虎影视在线观看2413| 国内精品九九久久精品小草| 99久久综合国产精品免费| 女同另类专区精品女同| 精品亚洲a∨无码一区二区三区| 在线精品一区二区三区| 亚洲—本道中文字幕久久66| 中文乱码字幕人妻熟女人妻| 无码日韩精品一区二区免费暖暖 | 国产女奸网站在线观看| 国产精品无套粉嫩白浆在线| 日本高清视频在线观看一区二区| 久久久久久久极品内射| 中国熟妇人妻xxxxx| 综合无码综合网站| 色综合久久精品中文字幕| 中文字幕亚洲综合久久| 中文字幕人妻丝袜美腿乱| 亚洲欧美日韩在线精品2021| 亚洲av高清不卡免费在线| 国产熟女内射oooo| 五月天激情综合网| av免费看网站在线观看| 职场出轨的人妻中文字幕| 99re热视频这里只精品| 久久久久久久尹人综合网亚洲 | 狼人狠狠干首页综合网| 成人日韩熟女高清视频一区| 国产在线精品一区二区| 国产亚洲精选美女久久久久| 成年人一区二区三区在线观看视频|