亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        影響圖的漸進式構(gòu)建方法

        2013-04-03 07:34:22劉惟一
        計算機工程與應(yīng)用 2013年11期
        關(guān)鍵詞:參數(shù)表漸進式原始數(shù)據(jù)

        馬 馮,劉惟一,楊 櫻

        MA Feng1,LIU Weiyi2,YANG Ying3

        1.云南財經(jīng)大學(xué) 信息學(xué)院,昆明 650221

        2.云南大學(xué) 信息學(xué)院,昆明 650091

        3.云南財經(jīng)大學(xué) 國際工商學(xué)院,昆明 650221

        1.School of Computer and Information,Yunnan University of Finance and Economics,Kunming 650221,China

        2.School of Information Science and Engineering,Yunnan University,Kunming 650091,China

        3.International Business School,Yunnan University of Finance and Economics,Kunming 650221,China

        1 引言

        影響圖[1]作為一種有效的決策工具得到了人們廣泛的關(guān)注,并在諸多領(lǐng)域[2-7]中應(yīng)用廣泛。然而,由于傳統(tǒng)的影響圖構(gòu)建方法[8]需要專家或領(lǐng)域知識來確定原始數(shù)據(jù)集中變量間的相互關(guān)系,因此如果原始數(shù)據(jù)集增長,那么原有與之對應(yīng)的影響圖可能就不再適用于新的數(shù)據(jù)集了。此時,如果用傳統(tǒng)的構(gòu)建方法為新數(shù)據(jù)集構(gòu)建影響圖,那么就需要再次引入專家或領(lǐng)域知識來確認新環(huán)境下,各個變量間的關(guān)系如何,并重新構(gòu)建一個適合新數(shù)據(jù)的影響圖。

        事實上,在大部分的實際應(yīng)用中,新增長的數(shù)據(jù)集與原始數(shù)據(jù)集相比,大部分的變量變化程度很小。因此,本文針對這種情況,提出了一種影響圖的漸進式構(gòu)建方法,即在已知原始數(shù)據(jù)集和與之對應(yīng)的影響圖時,如果原始數(shù)據(jù)集增長,此方法可以通過調(diào)整現(xiàn)有影響圖的結(jié)構(gòu)和參數(shù)而獲得一個適用于新數(shù)據(jù)集的新影響圖。

        這種方法的主要思想是,首先將與原始數(shù)據(jù)集對應(yīng)的影響圖轉(zhuǎn)換為相應(yīng)的簡化圖[9],然后對變化后的數(shù)據(jù)集,采用一個評分函數(shù)來判斷當(dāng)前的簡化圖是否適用于新數(shù)據(jù)。如果仍然適用,則僅需要調(diào)整各個變量的參數(shù)表即可。否則,需要先找出現(xiàn)有的簡化圖中差異度最大的地方。此處引入一個節(jié)點影響度的概念,用來判斷各個節(jié)點對新數(shù)據(jù)的不符合程度。找出現(xiàn)有的簡化圖中影響度最大的節(jié)點,然后依據(jù)新數(shù)據(jù)對其進行調(diào)整,再利用評分函數(shù)對調(diào)整后的整個簡化圖進行評分。如果評分的結(jié)果已到達事先設(shè)定的閾值,則算法結(jié)束,否則,繼續(xù)重復(fù)上述步驟,直至評分結(jié)果達到閾值為止。最后將獲得的新簡化圖轉(zhuǎn)換為影響圖即可。

        本文的主要貢獻可以歸結(jié)為以下兩點:

        (1)給定一個原始的數(shù)據(jù)集合對應(yīng)的影響圖,當(dāng)原始數(shù)據(jù)集增長時,影響圖的漸進式構(gòu)建方法可以在不需要增加專家或領(lǐng)域知識的前提下,構(gòu)建出一個新的符合要求的新影響圖。

        (2)影響圖的漸進式構(gòu)建方法在構(gòu)建新的影響圖時,只需要對原影響圖進行局部調(diào)整即可,從而避免了從頭開始重建一個影響圖的問題。

        2 背景知識

        影響圖是一種基于不確定性信息表示,用于處理復(fù)雜決策問題的圖模型[1]。它包含兩個部分:圖結(jié)構(gòu)和參數(shù)表。圖結(jié)構(gòu)表示數(shù)據(jù)集上變量間的依賴和時序關(guān)系,參數(shù)表體現(xiàn)了變量間的依賴程度。

        定義2.1[1]影響圖是一種有向無環(huán)圖,它包含三種類型的節(jié)點:自然節(jié)點,決策節(jié)點和效用節(jié)點。變量間的相互影響關(guān)系,用節(jié)點間的箭頭表示。

        貝葉斯網(wǎng),是一種可以用來表示變量間的相互影響關(guān)系的圖模型。它也可以被看成是一種有向無環(huán)圖,其中的節(jié)點表示隨機變量,而有向邊則表示變量間的相互關(guān)系。Pearl曾指出,貝葉斯網(wǎng)可以視為僅包含自然節(jié)點的影響圖[10]。

        定義2.2對于一個給定的影響圖G,如果忽略節(jié)點的類型并將所有的節(jié)點都視為自然節(jié)點,那么它就變成了一個貝葉斯網(wǎng),并且稱這種圖為影響圖G的簡化圖。

        然而貝葉斯網(wǎng)和影響圖之間,還是有差異的,具體可以總結(jié)為以下幾點[9]:

        (1)影響圖中的效用節(jié)點,不能有后繼節(jié)點;貝葉斯網(wǎng)中無此限制。

        (2)影響圖中決策節(jié)點的順序,必須要和現(xiàn)實世界中的實際情況一致。

        (3)影響圖中至少有一個決策節(jié)點和一個效用節(jié)點,并且決策節(jié)點應(yīng)該是效用節(jié)點的祖先。

        (4)影響圖中的所有效用節(jié)點都要有對應(yīng)的決策節(jié)點作為其祖先節(jié)點。

        因此,在將影響圖轉(zhuǎn)化為其對應(yīng)的簡化圖,即貝葉斯網(wǎng)時,或從貝葉斯網(wǎng)將其轉(zhuǎn)換為影響圖時,均需要遵循上述的幾點規(guī)則。

        3 影響圖的漸進式構(gòu)建方法

        在影響圖的漸進式構(gòu)建方法中,有兩個關(guān)鍵步驟:一個是構(gòu)建影響圖的圖結(jié)構(gòu),另一個是計算圖中各個變量的參數(shù)表。對于后一個步驟,劉惟一已經(jīng)在文獻[9]中給予了詳細的描述,因此本文在此就不再冗述。本文提出的方法將專注于如何將原有影響圖的結(jié)構(gòu)調(diào)整成適合新數(shù)據(jù)的新結(jié)構(gòu)。

        3.1 影響圖的漸進式構(gòu)建方法描述

        為了便于描述,假設(shè)Do是原始數(shù)據(jù)集,Dn是新數(shù)據(jù)集(原始數(shù)據(jù)增長以后的結(jié)果)。gido是原始數(shù)據(jù)集Do的影響圖,go是 gido的簡化圖。 gidn是新數(shù)據(jù)集Dn的影響圖,gn是 gidn的簡化圖。CH(go|Dn)是用來判斷 go和 Dn之間的相符程度的評分函數(shù),T表示事先設(shè)定的閾值。如果CH(go|Dn)的值小于T,則表示當(dāng)前的go仍不適用于Dn。在描述具體的方法前,先給出一些相關(guān)和定義和定理,以便能夠更加明確地說明方法執(zhí)行的具體過程。

        定義3.1.1如果xi是go的一個節(jié)點,那么xi的直接前驅(qū)節(jié)點就成為xi的父節(jié)點,記為Pa(xi)。

        定理3.1.1如果xi是go的一個節(jié)點,是xi參數(shù)表中的值集,并且是Pa(xi)參數(shù)表中的值集,那么評分函數(shù)

        可以用來表示go和Dn之間的符合程度。

        這個定理是Copper在文獻[11]中給出的,并予以了證明。其中,Γ()是一個伽馬函數(shù),當(dāng)n代表正整數(shù)時,Γ(n)=(n-1)!。Nijk代表Dn中符合并且條件的記錄個數(shù)。αijk代表等價樣本的個數(shù)。

        定義3.1.2如果xi是go的一個節(jié)點,那么xi相對父節(jié)點的條件概率變化程度,Δ(p(xi|Pa(xi)))就稱為節(jié)點xi對Dn的影響度。

        定理3.1.2如果U是一個概率參數(shù)集,ukj∈U表示xi=并且時的條件概率,那么節(jié)點x對D的影響in度 Δ(p(xi|Pa(xi)))可以寫成這里,“o”和“n”分別代表老的和新的訓(xùn)練數(shù)據(jù)集,并且r是U中概率參數(shù)的個數(shù)。

        綜上所述,影響圖的漸進式構(gòu)建方法(Incremental Building Method for Influence Diagram Structure,IBMIDS)的具體過程,可描述如下:

        Input:

        Do:原始數(shù)據(jù)集

        Dn:新數(shù)據(jù)集

        gido:原始數(shù)據(jù)的影響圖

        T:閾值

        Output:

        gidn:符合新數(shù)據(jù)集的影響圖

        Variables:

        go:gido的簡化圖

        gt:go的臨時調(diào)整結(jié)果

        gn:gidn的簡化圖

        CH(gt|Dn):評分函數(shù)

        xi:gt中的一個節(jié)點

        步驟:

        Begin

        步驟1將gido轉(zhuǎn)換為與其對應(yīng)的簡化圖go

        步驟2

        (1)將當(dāng)前的go記為臨時調(diào)整結(jié)果gt。

        (2)判斷當(dāng)前臨時調(diào)整結(jié)果的評分制CH(gt|Dn)是否能夠大于或等于閾值T。如果不滿足條件,則循環(huán)執(zhí)行下面幾步直至滿足條件為止。

        ①計算gt中每個節(jié)點xi的影響度,并找出影響度值最大的節(jié)點,記為xtag。

        ②在xtag的馬爾科夫覆蓋范圍內(nèi),嘗試著對邊進行反向,增加或刪除等操作對原圖進行調(diào)整,從而將gt變?yōu)橹虚g調(diào)整結(jié)果gt'。

        ③找出所有臨時調(diào)整的圖中,能夠使得CH(gt'|Dn)取到最大值的那個,記為gt'。

        ④將臨時調(diào)整結(jié)果gt調(diào)整成上一步找出的中間調(diào)整結(jié)果gt',并返回(2)的判斷條件。

        (3)將(2)中找出的最終 gt記錄為新影響圖的簡化圖gn。

        步驟3將新影響圖的簡化圖gn,按照第2部分中提到的方法轉(zhuǎn)換成最終的新影響圖gidn。

        End

        3.2 影響圖的漸進式構(gòu)建方法的有效性

        定理3.2.1影響圖的漸進式構(gòu)建方法得出的最終結(jié)果gidn是符合新數(shù)據(jù)集Dn的。

        證明 根據(jù)第2章中提到的影響圖定義,如果gidn的結(jié)構(gòu)能夠表示Dn中變量間的依賴和時序關(guān)系,參數(shù)表體現(xiàn)了變量間的依賴程度,那么可以說gidn是符合Dn的。由于在結(jié)構(gòu)上,gidn與gn是等價的,并且根據(jù)方法執(zhí)行的過程可知,作為一個貝葉斯網(wǎng),有CH(gn|Dn)≥T。因此,可以說明,gidn在結(jié)構(gòu)上是符合Dn的。又由于在將gn轉(zhuǎn)換為gidn的過程中,嚴格地遵守了第2章中提到的幾條規(guī)則,因此可以確保各個變量在gidn中的時序關(guān)系與之在Dn中是一致的。獲取各個變量參數(shù)表方法的有效性已經(jīng)在文獻[9]中被證明過了。因此,本文中提出的影響圖的漸進式構(gòu)建方法得出的最終結(jié)果gidn是符合新數(shù)據(jù)集Dn的。

        4 實驗和分析

        4.1 實驗

        為了便于分析實驗結(jié)果,實驗選取了兩個經(jīng)典的數(shù)據(jù)集Hepar II[13]和Alarm[14]。現(xiàn)先以Hepar II為例,說明具體的實驗過程。實驗中,選取其原數(shù)據(jù)集中的部分變量進行實驗,并將前100條記錄作為Do,構(gòu)建出的相應(yīng)影響圖為gido。

        將Hepar II中的全部數(shù)據(jù)視為Dn,閾值T設(shè)定為0.95。首先,將 gido轉(zhuǎn)換為 go,并得出CH(go|Dn)=0.83。由于CH(go|Dn)<T,因此下一步就是要找出影響度最大的節(jié)點。通過計算得知,是“Hepatic steatosis”這個節(jié)點。經(jīng)過計算后得知,在“Hepatic steatosis”的各種調(diào)整方法中,刪除“Hepatic steatosis”到“PBC”的邊可以使得評分函數(shù)的值達到當(dāng)前的最大值0.86。由于此時仍不滿足事先設(shè)定的閾值要求,因此需要重復(fù)上述步驟,直至找到符合條件的圖為止。最后,得到了一個合適的gn,使得CH(gn|Dn)=0.97。再將gn轉(zhuǎn)換為gidn,如圖1所示。

        圖1 IBMIDS構(gòu)造出的Hepar II影響圖

        同理,可以用IBMIDS方法構(gòu)建出Alarm數(shù)據(jù)集的影響圖,如圖2所示。

        4.2 分析

        文獻[13]中已經(jīng)給出了用傳統(tǒng)方法基于Hepar II數(shù)據(jù)集構(gòu)建的影響圖,如圖3所示。文獻[14]中已經(jīng)給出了用傳統(tǒng)方法基于Alarm數(shù)據(jù)集構(gòu)建的影響圖,如圖4所示。可以看出,圖1與圖3相比,圖2與圖4相比,兩者均是等價的。因此,可以表明影響圖的漸進式構(gòu)建方法對于這兩個經(jīng)典的數(shù)據(jù)集都是有效的。

        由于該方法的最終結(jié)果是由貝葉斯網(wǎng)轉(zhuǎn)換而來的,但是對于一個給定的數(shù)據(jù)集,其有效的貝葉斯網(wǎng)結(jié)構(gòu)并不唯一。因此,有時候影響圖的漸進式構(gòu)建方法得出的結(jié)果,并不一定與傳統(tǒng)方法構(gòu)建出的影響圖在結(jié)構(gòu)上完全一致,但這并不是說明該影響圖是無效的。根據(jù)之前的討論可知,它只是一個有效,但表現(xiàn)形式不同的影響圖。

        5 結(jié)束語

        本文提出了一種影響圖的漸進式構(gòu)建方法。對于一個給定的數(shù)據(jù)集和與之對應(yīng)的影響圖,如果原數(shù)據(jù)集增長,那么該方法可以通過調(diào)整原影響圖而得到一個適用于新數(shù)據(jù)集的新影響圖。與傳統(tǒng)方法相比,它可以有效減少影響圖在構(gòu)建過程中對專家或領(lǐng)域知識的依賴,避免了遇到新數(shù)據(jù)集時,需要重新構(gòu)建影響圖的情況。文中對該方法的有效性在理論上進行了證明,并用Hepar II數(shù)據(jù)集進行了實驗驗證。

        圖2 IBMIDS構(gòu)造出的Alarm影響圖

        圖3 用傳統(tǒng)方法構(gòu)建出的Hepar II影響圖

        圖4 用傳統(tǒng)方法構(gòu)建出的Alarm影響圖

        在經(jīng)過大量的實驗后發(fā)現(xiàn),如果新數(shù)據(jù)集與原始數(shù)據(jù)集相比,大部分的變量在其分布情況上都發(fā)生了重大的變化,那么這種方法的效率就會受到很大的影響。因為此時每個節(jié)點都會耗費很多時間在與之相關(guān)的邊調(diào)整上,以便于找到合適的新結(jié)構(gòu)。如何改進這個問題,將會是下一步工作的重點。通過研究發(fā)現(xiàn),現(xiàn)實應(yīng)用中的大部分情況,其新數(shù)據(jù)集與原始數(shù)據(jù)集相比,都屬于僅有小部分的變量在分布情況上有較大改變,其余大部分的變量變化很小的情況。因此,本文提出的方法在大部分的實際應(yīng)用中都可以得到較好的結(jié)果。

        [1]Howard R A,Matheson J E.Influence diagram[J].Decision Analysis,2005(3):127-143.

        [2]Pauker S G,Wong J B.The influence of influence diagrams in medicine[J].Decision Analysis,2005,2:238-244.

        [3]Meyer J,Phillips M H,Cho1 P S,et al.Application of influence diagrams to prostate intensity-modulated radiation therapy plan selection[J].Physics in Medicine and Biology,2004,49:1637-1653.

        [4]Fernández del Pozo J A,Bielza C,Gómez M.A list-based compact representation for large decision tables management[J].European Journal of Operational Research,2005,160:638-662.

        [5]Bielza C,F(xiàn)ernández del Pozo J A,Lucas P.Explaining clinical decisions by extracting regularity patterns[J].Decision Support Systems,2008,44:397-408.

        [6]Shachter R D.Efficient value of information computation[C]//Proceedings of the 15th Annual Conference on Uncertainty in Artificial Intelligence(UAI-99).San Francisco,CA:Morgan Kaufmann,1999:594-602.

        [7]Liao W H,Ji Q.Efficient non-myopic value-of-information computation for influence diagrams[J].International Journal of Approximate Reasoning,2008,49(2):436-450.

        [8]Chung T Y,Kim J K,Kim S H.Building an influence diagram in a knowledge-based decision system[J].Expert Systems with Applications,1992,4(1):33-44.

        [9]劉惟一,李維華,岳昆.智能數(shù)據(jù)分析[M].北京:科學(xué)出版社,2007:244-256.

        [10]Pearl J.Probabilistic reasoning in intelligent systems:networks of plausible inference[M].California:Morgen Daufmann Publishers,1998:116-131.

        [11]Cooper G,Herskovits E.A Bayesian method for the induction of probabilistic networks from data[J].Machine Learning,1992,9(4):309-347.

        [12]Russel S,Norvig P.Artificial intelligence:a modern approach[M].Beijing:Posts&Telecom Press,2002:320-354.

        [13]Li Oni_sko A,Druzdzel M J,Wasyluk H.Learning Bayesian network parameters from small data sets:application of Noisy-OR gates[J].International Journal of Approximate Reasoning,2001,27(2):165-182.

        [14]Beinlich I A,Suermondt H J,Chavez R M,et al.The ALARM monitoring system:a case study with two probabilistic inference techniques for belief networks[C]//Proceedings of the 2nd European Conference on Artificial Intelligence in Medical Care,1989:247-256.

        猜你喜歡
        參數(shù)表漸進式原始數(shù)據(jù)
        GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
        鋼結(jié)構(gòu)有限元參數(shù)化分析系統(tǒng)研究
        受特定變化趨勢限制的傳感器數(shù)據(jù)處理方法研究
        基本收入的理論構(gòu)想與漸進式實現(xiàn)路徑
        WPS在成形管生產(chǎn)過程中的運用
        EXCEL在調(diào)度自動化系統(tǒng)數(shù)據(jù)庫維護中的應(yīng)用
        全新Mentor DRS360 平臺借助集中式原始數(shù)據(jù)融合及直接實時傳感技術(shù)實現(xiàn)5 級自動駕駛
        汽車零部件(2017年4期)2017-07-12 17:05:53
        輕熟女“漸進式”省錢保養(yǎng)計劃
        Coco薇(2016年1期)2016-01-11 02:48:05
        漸進式教學(xué)在泌尿外科臨床教學(xué)中的應(yīng)用
        世界經(jīng)濟趨勢
        日韩高清在线观看永久| 亚洲福利二区三区四区| 亚洲中文字幕av天堂自拍| 国语对白做受xxxxx在线| 伊人99re| 久久麻豆精亚洲av品国产精品| 中文字幕一区韩国三级| 国内精品熟女一区二区| 久草视频在线手机免费看| 日本高清视频xxxxx| 国产乱视频| 亚洲一区二区三区乱码在线| 自拍偷拍 视频一区二区| 国产高清av首播原创麻豆| 秋霞影院亚洲国产精品| 国产三级三级精品久久| 日韩无码专区| 国产一女三男3p免费视频| 国产精品情侣露脸av在线播放| 日本女同av在线播放| 超碰色偷偷男人的天堂| 激情欧美日韩一区二区| 激,情四虎欧美视频图片| 给我看免费播放的视频在线观看| 久久久精品一区aaa片| 国产三级欧美| 中文字幕日本五十路熟女| 狠狠色丁香婷婷综合潮喷| 亚洲欧美日韩综合久久| 国产午夜亚洲精品不卡免下载| 中文字字幕在线中文乱码解| 极品少妇一区二区三区四区| 精品免费人伦一区二区三区蜜桃| 亚洲一区二区三区最新视频| 久久久久亚洲av无码专区首| 拍摄av现场失控高潮数次| 亚洲AV秘 无码一区二区在线| 久久96日本精品久久久| 日本三级片在线观看| 色老头在线一区二区三区| 免费人成在线观看播放国产|