亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        Inf-ProA信息活動(dòng)過程模型相似性度量方法

        2022-03-10 00:46:02鄒夢苑樊志強(qiáng)梁萬路
        關(guān)鍵詞:信息流相似性度量

        鄒夢苑,樊志強(qiáng),2,徐 珞,劉 潔,梁萬路

        (1.華北計(jì)算技術(shù)研究所創(chuàng)新中心,北京 100083; 2.軍事科學(xué)院,北京 100091; 3.中國電科智能科技研究院,北京 100005; 4.北京市信息技術(shù)研究所,北京 100036)

        0 引 言

        架構(gòu)開發(fā)對于一個(gè)大型信息系統(tǒng)/體系來說意義重大,其開發(fā)過程往往涉及多個(gè)利益相關(guān)者、各種復(fù)雜的活動(dòng)和多個(gè)開發(fā)階段。一個(gè)完善的架構(gòu)可以有效地滿足用戶的需求,并保持系統(tǒng)的強(qiáng)大生命力。大型信息系統(tǒng)/體系的架構(gòu)開發(fā)需要科學(xué)的方法論支撐,目前國內(nèi)外的主流架構(gòu)方法有美國的DoDAF[1]、英國的MoDAF[2]、北約的NAF[3]、開放組織體提出的ToGAF[4],以及國內(nèi)提出的信息主導(dǎo)的體系架構(gòu)框架(簡稱“Inf-ProA框架”)[5]。隨著全軍頂層設(shè)計(jì)工作的開展和推進(jìn),很多單位使用Inf-ProA框架及其配套的工具開展了軍事領(lǐng)域的架構(gòu)設(shè)計(jì)工作,并逐步積累形成了一定數(shù)量的架構(gòu)設(shè)計(jì)模型資產(chǎn)。在架構(gòu)師進(jìn)行模型設(shè)計(jì)時(shí),存在著廣泛的參考已有相似模型的需求。然而,現(xiàn)有的架構(gòu)方法和工具還無法對有參考價(jià)值的相似模型進(jìn)行度量和推薦。因此,本文研究一種基于架構(gòu)模型特征的相似性有效度量方法,在未來的架構(gòu)設(shè)計(jì)過程中十分必要。

        信息活動(dòng)過程模型是Inf-ProA框架的最核心的模型,因此,本文重點(diǎn)研究Inf-ProA信息活動(dòng)過程模型相似性度量方法。

        1 相關(guān)研究分析

        目前還沒有直接針對信息活動(dòng)過程模型相似性度量的相關(guān)研究,考慮信息活動(dòng)過程模型的設(shè)計(jì)要素(信息活動(dòng)、信息流、信息界面等)和存儲(chǔ)特征(XML格式存儲(chǔ)),可以參考對統(tǒng)一建模語言(Unified Modeling Language, UML)模型相似性和可擴(kuò)展標(biāo)記語言(Extensible Markup Language, XML)文檔相似性衡量的方法。近年來,有學(xué)者[6-8]提出了幾種測量UML模型之間相似性的方法,WebDiff[9]和MADMatch[10]即是這些方法的例子。軟件開發(fā)人員利用這些方法來度量UML模型的相似程度,甚至可以確定它們的共性和差異。它們允許開發(fā)人員處理與其相關(guān)的UML模型的特定部分。在合并所做的更改之前,需要測量并行創(chuàng)建的UML模型版本之間的相似性。從實(shí)證性研究[8-11]中可了解到,計(jì)算相似性仍然被認(rèn)為是一個(gè)高度容易出錯(cuò)和耗時(shí)間的任務(wù)。同時(shí),目前的相似性測量方法在精度和靈敏度方面通常達(dá)不到預(yù)期的效果[12-13]。因此,軟件開發(fā)人員最終使用了不精確的相似度測量的方法來找出快速變化的信息系統(tǒng)的設(shè)計(jì)模型的相似度。Gon?ales等[14]提出了UMLSim方法,這是一種測量UML模型之間相似性的混合方法。它通過使用多種標(biāo)準(zhǔn)來量化UML模型的相似性,包括語義、語法、結(jié)構(gòu)和設(shè)計(jì)標(biāo)準(zhǔn)。雖然UML模型與IAV-1a(信息活動(dòng)過程)模型間具有一定的相似性,但由于模型的定義和元模型仍存在較大的差異,故而UML模型相似性度量的方法并不能直接很好地運(yùn)用于信息活動(dòng)過程模型中。但是,UMLSim的多方面相似度量算子的構(gòu)造和思想值得借鑒和學(xué)習(xí)。Zhang等[15]從理論上嚴(yán)格證明了2個(gè)XML文檔間的距離可以通過計(jì)算它們的索引樹間的距離來測定。張力生等[16]提出了基于路徑特征的XML結(jié)構(gòu)相似度量方法SSPF(Similarity based on Sequence, Position and Frequency)。該方法充分利用提取的DOM樹路徑信息,對樹路徑間序列和位置的相似度計(jì)算進(jìn)行優(yōu)化,并考慮了路徑頻率對相似度的影響。雖然IAV-1a模型也是以XML文檔的形式存儲(chǔ),但并不能簡單地將IAV-1a模型相似性度量歸結(jié)為XML文檔相似性度量。因?yàn)镮AV-1a模型包含更多的設(shè)計(jì)要素在模型中,若轉(zhuǎn)換為XML文檔樹的結(jié)構(gòu)會(huì)丟失較多的信息,同時(shí)準(zhǔn)確度也不高。

        從實(shí)踐研究中發(fā)現(xiàn),IAV-1a模型的相似主要有以下的情況特征:

        1)存在多個(gè)相同或相似的信息活動(dòng)名稱和信息流名稱;

        2)相似模型間存在子圖或結(jié)構(gòu)相同的部分;

        3)存在相同的設(shè)計(jì)思路或設(shè)計(jì)趨勢。

        通過對這些相似特征進(jìn)行科學(xué)合理的衡量便可得到IAV-1a模型的相似性度量方法。本文提出的方法主要從以下3個(gè)方面來量化IAV-1a模型的相似性:

        1)內(nèi)容相似性度量,即信息活動(dòng)名稱和信息流名稱的相似性度量。

        2)結(jié)構(gòu)相似性度量,即判斷是否包含子圖或存在相同的結(jié)構(gòu),并以此作為模型的結(jié)構(gòu)相似性。

        3)設(shè)計(jì)趨勢相似性度量,即通過考慮輸入或輸出信息流與結(jié)構(gòu)的關(guān)系,對模型的設(shè)計(jì)趨勢進(jìn)行度量。

        基于以上的學(xué)習(xí)和探索,本文提出一種可用于衡量Inf-ProA信息活動(dòng)過程模型相似度的方法。

        2 Inf-ProA信息活動(dòng)過程模型介紹

        IAV-1a模型是信息活動(dòng)視角和信息架構(gòu)的核心模型之一,用于對信息的加工處理過程進(jìn)行描述,包括信息活動(dòng)、信息流、信息界面等設(shè)計(jì)要素。

        IAV-1a模型確定了支撐需求架構(gòu)的信息活動(dòng)流程,依據(jù)合理的信息加工處理需求來梳理和提取體系的信息活動(dòng)。該模型把活動(dòng)與過程合并成一個(gè)對象設(shè)計(jì),活動(dòng)由過程實(shí)現(xiàn),過程是活動(dòng)的集合,兩者是一個(gè)整體。信息活動(dòng)將輸入的信息進(jìn)行加工處理,并產(chǎn)生輸出信息,活動(dòng)之間通過信息流連接,信息流將一個(gè)信息活動(dòng)的輸出連接至另外一個(gè)信息活動(dòng)的輸入。IAV-1a采用如圖1所示的信息活動(dòng)過程模型進(jìn)行描述,由信息活動(dòng)(矩形)、輸入界面(活動(dòng)左側(cè)倒T字)、輸出界面(活動(dòng)右側(cè)倒T字)、信息流(有向線)和信息端(橢圓)組成。

        圖1 IAV-1a模型示例

        IAV-1a模型采用層次化的過程模型對體系的信息活動(dòng)過程進(jìn)行描述。要進(jìn)行信息架構(gòu)設(shè)計(jì),首先要把一個(gè)大的體系或系統(tǒng)分解成若干項(xiàng)信息活動(dòng),形成體系信息行為的整體架構(gòu),即構(gòu)建活動(dòng)模型。

        3 信息活動(dòng)過程模型相似性度量方法

        3.1 模型要素及度量內(nèi)容

        IAV-1a模型主要包含以下幾種架構(gòu)設(shè)計(jì)要素:

        1)信息活動(dòng):信息活動(dòng)是該模型的核心建模元素,是指完成與信息處理相關(guān)的任務(wù)所執(zhí)行的一項(xiàng)動(dòng)作。信息活動(dòng)的提取可依據(jù)業(yè)務(wù)流程中有信息輸入輸出的活動(dòng),將有相關(guān)信息輸入輸出的活動(dòng)分別單獨(dú)提取其信息活動(dòng),然后進(jìn)行整體考慮合并,也可以參考信息活動(dòng)生命周期模型中的活動(dòng)類別定義信息活動(dòng),如信息采集活動(dòng)、信息存儲(chǔ)活動(dòng)、信息發(fā)布活動(dòng)等。信息活動(dòng)的主要屬性包括:活動(dòng)名稱、活動(dòng)標(biāo)識(shí)、活動(dòng)說明。

        2)輸入界面:輸入界面是信息活動(dòng)接受其他活動(dòng)作用的界面,可以是行為動(dòng)作關(guān)系,也可以是技術(shù)接口關(guān)系等。

        3)輸出界面:輸出界面是信息活動(dòng)作用于其他活動(dòng)的界面,可以是行為動(dòng)作關(guān)系,也可以是技術(shù)接口關(guān)系。

        4)信息流:信息流用以鏈接信息活動(dòng),使一個(gè)信息活動(dòng)的信息輸出成為另一個(gè)信息活動(dòng)的輸入信息,兩者之間的連接表示了活動(dòng)間的信息流向,用有向線“→”表示,并用特殊標(biāo)識(shí)或短語對其命名,進(jìn)行唯一標(biāo)識(shí)。信息流上的信息標(biāo)示和名稱給出了信息活動(dòng)之間需要交換的信息,但并不需要說明如何實(shí)現(xiàn)信息交換。信息流和信息是多對多的關(guān)系,即一條信息流上可能傳遞多個(gè)信息,一個(gè)信息可能在多條信息流上傳遞。

        基于IAV-1a模型主要包含的架構(gòu)設(shè)計(jì)要素,本文提出的方法主要是對2個(gè)模型之間的內(nèi)容相似性、結(jié)構(gòu)相似性以及設(shè)計(jì)相似性3個(gè)方面進(jìn)行衡量。內(nèi)容相似性是指活動(dòng)名稱和信息流名稱上的相似性,即用模型中相同內(nèi)容所占總體元素內(nèi)容數(shù)量的比例來反映內(nèi)容上的相似性(詳見3.3節(jié));結(jié)構(gòu)相似性是指模型中信息活動(dòng)的輸入輸出流向結(jié)構(gòu)之間的相似性(詳見3.4節(jié));設(shè)計(jì)相似性是指在設(shè)計(jì)模型的過程中,接近最終設(shè)計(jì)結(jié)果的相似模型,故考慮將輸入輸出關(guān)系與結(jié)構(gòu)相結(jié)合的相似性作為模型的設(shè)計(jì)相似性,即基于模型的輸入和輸出界面,通過泛化的模型結(jié)構(gòu)計(jì)算出的設(shè)計(jì)相似性結(jié)果(詳見3.5節(jié))。

        3.2 模型相似性度量整體思路

        本文基于信息活動(dòng)模型的基本架構(gòu)設(shè)計(jì)要素,采用一種創(chuàng)新的方法,通過多個(gè)方面來量化信息活動(dòng)過程模型的相似性,包括內(nèi)容和結(jié)構(gòu)上相似性的衡量,以及考慮了接近模型最終設(shè)計(jì)結(jié)果上的設(shè)計(jì)相似性,使得到的相似性度量結(jié)果更具有合理性。信息活動(dòng)過程模型相似度計(jì)算的算法流程如圖2所示。

        圖2 IAV-1a模型相似性計(jì)算流程

        其中內(nèi)容相似性部分主要指通過對模型信息活動(dòng)名稱和信息流名稱提取,比較相同內(nèi)容元素所占總體內(nèi)容數(shù)量的比例,以此作為對模型內(nèi)容相似性的度量;結(jié)構(gòu)相似性部分主要是通過對模型間子圖或結(jié)構(gòu)相同部分的計(jì)算,得出模型結(jié)構(gòu)上的相似性[17];設(shè)計(jì)相似性部分是通過考慮輸入或輸出信息流與結(jié)構(gòu)的關(guān)系,將模型的有向圖結(jié)構(gòu)轉(zhuǎn)化為關(guān)聯(lián)圖和泛化圖[18]進(jìn)而得到模型的設(shè)計(jì)相似性。最后,通過對3個(gè)方面相似性的綜合便可以結(jié)算出模型間總體的相似性。

        設(shè)輸入的2個(gè)待衡量信息活動(dòng)過程模型A和B。通過這個(gè)過程進(jìn)行對輸入的模型MA與MB間相似性的計(jì)算。本文提出的Inf-ProA信息活動(dòng)過程模型相似性度量過程的步驟描述如下:

        步驟1 內(nèi)容相似性。旨在計(jì)算2個(gè)輸入模型MA與MB之間的內(nèi)容相似性,得出內(nèi)容相似矩陣,如圖3所示。其中a(行)和b(列)分別為MA與MB模型元素即信息活動(dòng)的數(shù)量。為此,需要對比模型中的主要內(nèi)容要素,包括信息活動(dòng)、信息流。由于信息活動(dòng)輸入、輸出接口不包含內(nèi)容信息,故不考慮。

        圖3 相似矩陣

        步驟2 結(jié)構(gòu)相似性。這一步試圖發(fā)現(xiàn)模型MA與MB之間的結(jié)構(gòu)是否相似。判斷依據(jù)主要是模型的圖結(jié)構(gòu)是否同構(gòu),關(guān)于子圖同構(gòu)的定義見定義1。

        定義1 子圖同構(gòu)。假設(shè)有2個(gè)圖H=(VH,EH)和圖G=(V,E)子圖同構(gòu),即從H到G存在著一個(gè)函數(shù)f:VH→V并且(u,v)∈EH使得(f(u),f(v))∈E同樣成立,f叫做子圖同構(gòu)的一個(gè)映射。

        步驟3 設(shè)計(jì)相似性。通過文本內(nèi)容和架構(gòu)模型結(jié)構(gòu)對比后,為了達(dá)到更準(zhǔn)確相似度,需要對正在設(shè)計(jì)模型的設(shè)計(jì)趨勢進(jìn)行量化。這一步主要是將模型轉(zhuǎn)化為有向圖的泛化圖和關(guān)聯(lián)圖后進(jìn)行對比,從而確定模型MA與MB之間的設(shè)計(jì)相似性。

        定義2 泛化圖與關(guān)聯(lián)圖。有向圖G=(V,E)可以表示面向?qū)ο笙到y(tǒng)的類圖,頂點(diǎn)集(V)對應(yīng)于系統(tǒng)中的所有類集合,邊集(E)對應(yīng)于這些類之間關(guān)系的集合,比如有向邊(p,q)∈E表示類p與q的關(guān)聯(lián)關(guān)系方向是從p到q。模型的輸入輸出關(guān)系(包括泛化、關(guān)聯(lián)、組合)都可以表示成有向圖,圖4是一個(gè)簡單的有向圖示例。

        圖4 有向圖圖示例

        圖5 有向圖的關(guān)聯(lián)圖和泛化圖表示

        步驟4 總體相似性。這一步負(fù)責(zé)匯集內(nèi)容、結(jié)構(gòu)和設(shè)計(jì)的相似性,以便可以計(jì)算出模型間總體的相似性。每一步相似計(jì)算的算子輸出一個(gè)相似度矩陣。它輸入了在原始步驟中產(chǎn)生的矩陣和權(quán)重。這一步完成后則生成了一個(gè)m×n的最終相似度矩陣,m(行)和n(列)分別是模型MA與模型MB元素的數(shù)量。該矩陣的元素由aij表示,它對應(yīng)于MA的一個(gè)i元素和MB的另一個(gè)j元素之間的相似性值。計(jì)算最后一個(gè)amn元素時(shí),相似矩陣則完整。

        以下更詳細(xì)地描述這4個(gè)步驟所采用的方法。

        3.3 內(nèi)容相似性

        信息活動(dòng)過程元模型規(guī)范闡明了信息活動(dòng)過程模型語法的定義?;旧?,信息活動(dòng)過程模型有一個(gè)具體的和抽象的語法。每個(gè)模型的元模型規(guī)范定義了它們各自的抽象語法。信息活動(dòng)過程模型的具體語法是指信息活動(dòng)的構(gòu)造、信息流的傳遞和表示方式。在內(nèi)容相似性的對比中,只對比內(nèi)容的相似性,不關(guān)注元模型的比較。具體內(nèi)容上的構(gòu)造和表示是指諸如信息活動(dòng)、信息流等元素。因此,內(nèi)容相似性是基于這些內(nèi)容之間的不同進(jìn)行的衡量。

        公式(1)展示了內(nèi)容運(yùn)算符如何計(jì)算各項(xiàng)之間屬性的相似性值。該方程式計(jì)算術(shù)語是否是同義詞。如果這些術(shù)語是同義詞,那么它們是完全相似的,若為其他表明并不相似。例如,對2個(gè)輸入模型MA與MB之間信息活動(dòng)和信息流的比較,公式(1)的結(jié)果為1,表明這些項(xiàng)是100%相似。這是因?yàn)檫@些術(shù)語與字典上的同義詞有關(guān)。圖3顯示了內(nèi)容相似度矩陣上的這個(gè)結(jié)果。此外,這種相似性表明,這2個(gè)模型元素在意義上都是相等的,即它們具有相同的目的。但是,這個(gè)運(yùn)算符不計(jì)算這2個(gè)類是否對它們的鄰域等價(jià),這可能會(huì)影響這2個(gè)模型的上下文相似性。為此,對結(jié)構(gòu)相似性的評估也很重要,特別是,模型的結(jié)構(gòu)圍繞著這2個(gè)元素。為此,下一節(jié)提供了一個(gè)結(jié)構(gòu)運(yùn)算符來評估圍繞這些模型的結(jié)構(gòu)的相似性。

        (1)

        3.4 結(jié)構(gòu)相似性

        3.3節(jié)僅限于計(jì)算模型內(nèi)容的相似之處,即信息活動(dòng)或信息流在內(nèi)容上是否相同。但是,若其具有相同的名稱,而上下文不同時(shí),就無法考慮它們的相似度值,也不能評估它們關(guān)于模型結(jié)構(gòu)的差異。解決這個(gè)問題的方法是評估結(jié)構(gòu)上的相似性。但是,它們在如何評估圖的結(jié)構(gòu)方面并不收斂。在本文提到的相似性度量的方法中,結(jié)構(gòu)相似性是為了評估子圖同構(gòu)的直接影響。

        子圖同構(gòu)算法是解決圖相關(guān)問題經(jīng)常要用到的一種方法,也是本文中分區(qū)過濾策略的一種基礎(chǔ)算法。Ullmann算法[19]是最早提出解決子圖同構(gòu)問題的算法,其處理過程相對簡單,主要利用枚舉的方式找到被匹配圖在查詢圖中的匹配子圖。該算法的思想雖然簡單,但是其時(shí)間復(fù)雜度卻與圖的頂點(diǎn)數(shù)的指數(shù)成正比。公認(rèn)比較好的子圖同構(gòu)算法還有VF2算法[20]。VF2算法既可以做圖同構(gòu)匹配也可以做子圖同構(gòu)匹配。該算法的高效之處在于有許多剪枝策略,提高了算法的效率。假定s為搜索過程中的一個(gè)中間狀態(tài)頂點(diǎn),M(s)表示中間狀態(tài)s代表的部分匹配,M1(s)代表搜索到該中間狀態(tài)頂點(diǎn)時(shí)圖g1中的頂點(diǎn),M2(s)代表搜索到該中間狀態(tài)頂點(diǎn)時(shí)圖g2中的頂點(diǎn),以下算法給出求2個(gè)圖g1、g2是否子圖同構(gòu)的關(guān)鍵代碼。算法具體描述如下:

        Matching(s)

        輸入:中間狀態(tài)s,初始狀態(tài)s0,M(s0)=φ

        輸出:匹配成功的映射頂點(diǎn)集M(s)

        Begin

        1.If |M(s)|=|Vg2| then

        2.returnM(s)

        3.else

        4.compute the set Cand(s) of the pairs candidate for inclusion inM(s);

        5.for each pairs in Cand(s) do

        6.if the feasibility rules succeed for the inclusion of pairs inM(s) then

        7.compute the states′ obtained by adding pairs toM(s);

        8.Matching(s′);

        9.for eachgin Ip such thatM[g] is not initialized do

        10.M[g]←false;

        End

        3.5 設(shè)計(jì)相似性

        設(shè)計(jì)相似性是一個(gè)較為抽象的概念,但可以理解為架構(gòu)師在設(shè)計(jì)模型時(shí)的參考設(shè)計(jì)相似性。若2個(gè)模型的設(shè)計(jì)相似性越大,則在設(shè)計(jì)時(shí)的參考價(jià)值越大。故而在衡量設(shè)計(jì)相似性時(shí)不能只局限于內(nèi)容和結(jié)構(gòu)的對比。首先可以采用引起兩圖結(jié)構(gòu)差異的最小編輯數(shù),即圖編輯距離[21],作為圖趨勢量化的具體標(biāo)準(zhǔn)。利用編輯距離來衡量2棵樹之間的相似度,其基本思想是將2棵樹之間的距離定義為利用編輯操作實(shí)現(xiàn)一棵樹到另一棵樹轉(zhuǎn)換所需要的代價(jià),其之間的距離越小,相似度越大,反之亦然。但是這樣的衡量方式在設(shè)計(jì)參考的場景下,對比的結(jié)果將不準(zhǔn)確。如圖6所示,基于輸入輸出關(guān)系可知在設(shè)計(jì)(C)時(shí),(A)的設(shè)計(jì)參考相似性比(B)更大,即(A)更接近(C)要設(shè)計(jì)的最終結(jié)果。但是就編輯距離和單計(jì)算結(jié)構(gòu)相似性會(huì)出現(xiàn)(B)對(C)的參考性最大。

        (A) (B) (C)

        由圖6可知,圖編輯距離和單進(jìn)行結(jié)構(gòu)相似性度量的方法并不適用于這種情況,甚至?xí)a(chǎn)生誤判。所以本文采用拆分為泛化圖和關(guān)聯(lián)圖的方法(以下分別簡稱g圖和a圖),計(jì)算圖鄰接矩陣的相似度,以此來衡量模型間的設(shè)計(jì)相似性。

        首先將圖6的模型圖按照a圖和g圖拆分開來,如圖7所示。

        圖7 拆分開的圖

        然后分別計(jì)算出它們的鄰接矩陣,得到泛化矩陣和關(guān)聯(lián)矩陣。之后將這個(gè)矩陣代入到公式(2)中(其中A和B分別為有向圖A和B的鄰接矩陣,Z0為元素都為1的NA×NB矩陣),分別迭代計(jì)算后,獲得2個(gè)片段的a/g圖相對于待比較模型(即有向圖C)的a/g圖的相似度。之后分別將每個(gè)片段的2個(gè)相似度矩陣進(jìn)行相加,并且進(jìn)行歸一化,可以得到最終的相似度矩陣。

        (2)

        最終就可以得到(A)的設(shè)計(jì)參考相似性比(B)更大,即(A)更接近(C)要設(shè)計(jì)的最終結(jié)果。

        4 實(shí)驗(yàn)與結(jié)果分析

        為了驗(yàn)證本文所提模型相似性度量方法的有效性,采用C++語言進(jìn)行編程實(shí)現(xiàn)。實(shí)驗(yàn)用的PC機(jī)配置為CPU 2.1 GHz,16 GB機(jī)帶RAM,Windows10操作系統(tǒng)。

        實(shí)驗(yàn)數(shù)據(jù)主要來自某項(xiàng)目中某軍多個(gè)指揮所的36套信息架構(gòu)設(shè)計(jì)模型。該數(shù)據(jù)主要描述了不同指揮所和作戰(zhàn)部位的信息架構(gòu),數(shù)據(jù)豐富且由于某些作戰(zhàn)部位功能相同而具有相似的架構(gòu)模型。故而,從中選取不同特征的相似模型用于對本文方法的實(shí)驗(yàn)與驗(yàn)證。選取其中信息活動(dòng)過程模型內(nèi)容相似度不高但結(jié)構(gòu)相似度高的模型數(shù)據(jù)為組1、內(nèi)容相似度與結(jié)構(gòu)相似度都較高的模型數(shù)據(jù)為組2、內(nèi)容相似度較高但結(jié)構(gòu)不同的數(shù)據(jù)為組3,以及設(shè)計(jì)參考相似性較高的數(shù)據(jù)為組4。最后,任意選取2組較難采用人工量化相似度的模型數(shù)據(jù)分別為組5和組6作為測試數(shù)據(jù),每組數(shù)據(jù)分別有20個(gè)IAV-1a模型。

        4.1 相似度比較

        好的相似度計(jì)算方法應(yīng)該是屬于同一類別文檔之間的相似度盡可能大,同時(shí)也能在一定程度上反映出同類型文檔間的細(xì)微差別的。為了驗(yàn)證本文所提相似度計(jì)算方法在度量模型相似性計(jì)算的效果,與文獻(xiàn)[16]的XML文檔比較法的SSPF進(jìn)行對比,相似度計(jì)算結(jié)果如表1所列,同時(shí)也將人工的衡量方法作為對比。表1中組1至組5分別對應(yīng)選取的不同特征類別的數(shù)據(jù)組。其中,每個(gè)類別下的相似度為該類別中所有文檔的相似度平均值。

        表1 相似度計(jì)算結(jié)果比較

        從表1中可以看出,對組1至組4這幾個(gè)類別,采用衡量XML文檔結(jié)構(gòu)的SSPF算法所得的相似度計(jì)算結(jié)果均不是很高,雖然也能反映出相似的差別,但是不太明顯。而本文提出的方法則可以辨別出相似度的大小,即相似的方面越多相似值越大。同時(shí),從組5和組6數(shù)據(jù)可以看出,SSPF算法對于無明顯相似結(jié)構(gòu)特征的數(shù)據(jù)則無法起到有效的相似度衡量,但本文的方法則可以顯示出模型的相似差異大小。XML文檔的比較方法更多地關(guān)注于結(jié)構(gòu)和內(nèi)容,存在相同或相似的路徑結(jié)構(gòu)則可衡量出相似性。由于本文提出的方法是基于信息活動(dòng)過程模型的特征進(jìn)行3個(gè)方面的衡量,因此使得相似度計(jì)算度計(jì)算結(jié)果更加真實(shí)地反映出實(shí)際的相似性。

        4.2 結(jié)果分析

        在相似度計(jì)算的基礎(chǔ)上,通過定量精度、召回率和F型度量值來評估該工具的精度[22]。公式(3)的結(jié)果在0和1之間變化,越接近1的值表示結(jié)果越精確,越接近0的值越不精確。在本文中,精度(公式(3))定義為正確分配為相似的類數(shù)除以應(yīng)等效的所有類的集。實(shí)驗(yàn)結(jié)果如表2所示。

        表2 所得結(jié)果的精度、召回率和F度量指標(biāo)比較

        特別說明的是,精確度的計(jì)算(公式(3))是預(yù)測結(jié)果為正(TP),即正確結(jié)果和假陽性結(jié)果。召回率(公式(4))表示是否獲得了所有可能的正確答案。為此,它考慮真實(shí)的正結(jié)果(TP),即正確匹配的數(shù)量和正確指出為錯(cuò)誤結(jié)果的預(yù)測結(jié)果為負(fù)(FN)。最后,本文還評估了比較工具的F-度量值(公式(5))。F-度量值是精確度和召回率之間的諧波平均值。為此,在這個(gè)方程中考慮了精確度和召回率的值。

        (3)

        (4)

        (5)

        其中,TP表示樣本為正,預(yù)測結(jié)果為正;FP表示樣本為負(fù),預(yù)測結(jié)果為正;FN表示樣本為正,預(yù)測結(jié)果為負(fù)。

        圖8和圖9分別描述了通過Kiviat圖表生成的當(dāng)前對比獲得的結(jié)果。圖中的每個(gè)軸對應(yīng)于一種比較場景中2個(gè)輸入模型MA和MB之間的比較。此外,3種不同的線型分別代表定量變量,短劃線代表精確度、圓點(diǎn)短劃線代表召回率,實(shí)線代表F-度量值。

        圖8 采取本文方法得到的結(jié)果

        圖9 采取XML比較法得到的結(jié)果

        總體而言,實(shí)驗(yàn)結(jié)果表明,所提出方法的精度在所有場景中均達(dá)到至少60%。第2組數(shù)據(jù)中的精度值也是最大的,其中精確度、召回率和F-度量值達(dá)到了100%。這表明所提出的方法的精確度在不同的場景下達(dá)到了相當(dāng)好的結(jié)果。存在的問題是,對于內(nèi)容、結(jié)構(gòu)或設(shè)計(jì)參考方面,若模型在其中一個(gè)方面顯示出相似性,則容易被判斷為相似,雖然無法通過本文的方法直接顯示出不同方面的相似性,但是在架構(gòu)師設(shè)計(jì)的過程中,判斷相似的指標(biāo)并無側(cè)重,故而也可使用該方法找出任何一個(gè)方面的相似,對后續(xù)架構(gòu)師的設(shè)計(jì)也有一定的參考意義。

        5 結(jié)束語

        隨著架構(gòu)設(shè)計(jì)工作的日益增多與推進(jìn),在架構(gòu)師進(jìn)行模型設(shè)計(jì)時(shí),存在著廣泛地參考已有相似模型的需求。然而,現(xiàn)有的架構(gòu)方法和工具還無法對有參考價(jià)值的相似模型進(jìn)行度量和推薦。因此,本文針對Inf-ProA框架的核心模型——信息活動(dòng)過程模型,提出了一種混合的方法和多標(biāo)準(zhǔn)的相似度量的方法。它由內(nèi)容、結(jié)構(gòu)和設(shè)計(jì)相似性算符組成。本文實(shí)驗(yàn)結(jié)果表明,該方法在不同的評估場景中表現(xiàn)良好,使用多次迭代法可以提高模型之間相似性的精確度和召回率。這個(gè)方法提高了架構(gòu)設(shè)計(jì)過程的高效性和架構(gòu)設(shè)計(jì)模型數(shù)據(jù)的利用率。對于架構(gòu)師來說,一種混合的方法是至關(guān)重要的,因?yàn)樗紤]了多重指標(biāo)和多個(gè)方面進(jìn)行相似性的判斷,這使得相似性更加精確,比較過程更適應(yīng)所使用的模型類型。

        架構(gòu)設(shè)計(jì)師在開展架構(gòu)設(shè)計(jì)時(shí),可通過本文的度量方法對接近最終設(shè)計(jì)成果的相似IAV-1a模型進(jìn)行推薦,從而達(dá)到對已有架構(gòu)設(shè)計(jì)模型利用的目的,并從整體上提升架構(gòu)設(shè)計(jì)的效率,以更高效的方式形成高質(zhì)量的架構(gòu)成果。

        最后,本文采用已有的IAV-1a模型進(jìn)行案例研究,通過5種評估場景將本文提出的方法與文獻(xiàn)[16]提出的基于XML文檔比較的SPFF方法進(jìn)行了對比。實(shí)驗(yàn)結(jié)果驗(yàn)證了該方法的有效性,并且其精確度、召回率和F-度量值指標(biāo)都優(yōu)于其他的方法。

        今后,筆者將繼續(xù)提高相似度衡量的精確度,對不同方面的相似度衡量進(jìn)行對比,得出“最相似”的結(jié)果,并進(jìn)行更多相關(guān)案例的研究及更詳細(xì)的分析。

        猜你喜歡
        信息流相似性度量
        有趣的度量
        一類上三角算子矩陣的相似性與酉相似性
        模糊度量空間的強(qiáng)嵌入
        淺析當(dāng)代中西方繪畫的相似性
        基于信息流的作戰(zhàn)體系網(wǎng)絡(luò)效能仿真與優(yōu)化
        迷向表示分為6個(gè)不可約直和的旗流形上不變愛因斯坦度量
        基于信息流的RBC系統(tǒng)外部通信網(wǎng)絡(luò)故障分析
        戰(zhàn)區(qū)聯(lián)合作戰(zhàn)指揮信息流評價(jià)模型
        低滲透黏土中氯離子彌散作用離心模擬相似性
        地質(zhì)異常的奇異性度量與隱伏源致礦異常識(shí)別
        日本妇人成熟免费2020| 久久久亚洲精品午夜福利| 黑人一区二区三区啪啪网站| 美女脱了内裤洗澡视频 | 久久2020精品免费网站| 一二三四区中文字幕在线| 波多野42部无码喷潮| 国产成人精品自在线无码 | 久久久久久久极品内射| 亚洲日韩乱码中文无码蜜桃臀| 男受被做哭激烈娇喘gv视频| 亚洲免费av电影一区二区三区| 中文字幕人妻少妇精品| 国产精品国产高清国产专区 | 国产亚洲人成a在线v网站| 色欲AV成人无码精品无码| 最好的99精品色视频大全在线 | 日产国产精品亚洲高清| 亚洲最大中文字幕在线| 国内精品视频在线播放不卡 | 亚洲欧美日韩国产精品网| 亚洲精品熟女av影院| 久久无码字幕中文久久无码| 无码人妻久久一区二区三区免费 | 五月激情在线视频观看| 亚洲精品无码久久久影院相关影片 | 欧美亚洲尤物久久综合精品| 国产一区二区三区的区| 亚洲丁香婷婷久久一区二区| 女女女女女裸体处开bbb| 免费人成黄页在线观看视频国产| 国产丝袜高跟美腿一区在线| 男女打扑克视频在线看| 亚洲人成国产精品无码果冻| 无限看片在线版免费视频大全| 国产av专区一区二区三区| 日韩精品人妻视频一区二区三区| 99久久精品国产一区二区| 中文字幕福利视频| 国产精品av免费网站| 人妻 丝袜美腿 中文字幕 |