亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于表示學(xué)習(xí)的業(yè)務(wù)過(guò)程模型匹配方法

        2021-10-11 13:10:00倪維健吉桂芳曾慶田
        關(guān)鍵詞:活動(dòng)信息方法

        倪維健,吉桂芳,曾慶田,劉 彤,段 華

        (山東科技大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,山東 青島 266510)

        0 引言

        過(guò)程感知信息系統(tǒng)作為一種基于過(guò)程模型的軟件系統(tǒng),能夠有效地支持各類(lèi)業(yè)務(wù)過(guò)程的管理和執(zhí)行,在各類(lèi)企事業(yè)單位中得到了極大的普及。過(guò)程感知信息系統(tǒng)的廣泛應(yīng)用積累了大量的業(yè)務(wù)過(guò)程模型,特別是由于商業(yè)環(huán)境的復(fù)雜性和動(dòng)態(tài)性,使得企事業(yè)單位往往需要管理數(shù)百甚至上千的業(yè)務(wù)過(guò)程模型,這為傳統(tǒng)的業(yè)務(wù)過(guò)程管理技術(shù)帶來(lái)了很大的挑戰(zhàn)。海量業(yè)務(wù)過(guò)程模型管理往往需要依賴(lài)一些過(guò)程模型分析技術(shù),如過(guò)程模型的合法性檢測(cè)、過(guò)程模型檢索、過(guò)程模型合并等。在很多過(guò)程模型分析任務(wù)中,過(guò)程模型匹配發(fā)揮著基礎(chǔ)性的作用,過(guò)程模型的準(zhǔn)確性對(duì)于各類(lèi)過(guò)程模型分析任務(wù)的實(shí)用效果具有重要影響。因此,過(guò)程模型匹配已成為業(yè)務(wù)過(guò)程管理領(lǐng)域中的一個(gè)研究熱點(diǎn)。

        過(guò)程模型匹配的目標(biāo)是自動(dòng)識(shí)別多個(gè)過(guò)程模型之間具有匹配關(guān)系的活動(dòng)對(duì)。近年來(lái),研究者已提出多種過(guò)程模型匹配方法[1-2],其中大多數(shù)方法主要關(guān)注過(guò)程模型中活動(dòng)的標(biāo)簽信息,通過(guò)從語(yǔ)法和語(yǔ)義角度計(jì)算活動(dòng)相似度來(lái)實(shí)現(xiàn)過(guò)程模型匹配;也有一些匹配方法除了考慮活動(dòng)標(biāo)簽信息之外,還考慮了一些過(guò)程模型相關(guān)的結(jié)構(gòu)特征信息,從一定程度上提高了匹配結(jié)果的正確性和完整性。

        整體而言,現(xiàn)有的過(guò)程模型匹配方法多是依靠活動(dòng)本身的局部信息,較少考慮活動(dòng)的上下文信息和活動(dòng)之間的關(guān)系信息,這使得匹配結(jié)果的準(zhǔn)確性大多依賴(lài)于活動(dòng)相關(guān)的描述信息。因此,當(dāng)相似的活動(dòng)用不同的方式描述時(shí),這些方法的匹配效果較差。針對(duì)上述問(wèn)題,本文提出一種基于表示學(xué)習(xí)的過(guò)程模型匹配方法。該方法將深度學(xué)習(xí)領(lǐng)域中的表示學(xué)習(xí)技術(shù)引入過(guò)程模型匹配任務(wù)中,將過(guò)程模型中的各個(gè)活動(dòng)表示為多維實(shí)數(shù)向量,以更好地反映活動(dòng)的上下文信息和關(guān)系信息;之后,將不同過(guò)程模型對(duì)應(yīng)的向量空間進(jìn)行映射,根據(jù)活動(dòng)向量之間的相似度實(shí)現(xiàn)過(guò)程模型的匹配。

        1 相關(guān)工作

        根據(jù)過(guò)程模型匹配所利用的信息不同,現(xiàn)有過(guò)程模型匹配方法可以粗略地被分為基于活動(dòng)標(biāo)簽的方法和基于過(guò)程模型結(jié)構(gòu)的方法兩類(lèi)。

        (1)基于活動(dòng)標(biāo)簽的過(guò)程模型匹配方法主要基于活動(dòng)的標(biāo)簽描述計(jì)算活動(dòng)之間的相似度,進(jìn)而實(shí)現(xiàn)活動(dòng)匹配。根據(jù)活動(dòng)標(biāo)簽相似度計(jì)算方式的不同,這類(lèi)方法又可以被進(jìn)一步分為語(yǔ)法相似度和語(yǔ)義相似度兩類(lèi)。語(yǔ)法相似度主要基于字符串匹配實(shí)現(xiàn),如Levenshtein距離計(jì)算將給定兩個(gè)標(biāo)簽l1和l2之間進(jìn)行轉(zhuǎn)換所需編輯操作(即插入,刪除和替換)的數(shù)量;Jaro-Winkler距離與Levenshtein距離相似,但是能夠產(chǎn)生介于0和1之間的距離值。一些語(yǔ)法相似度依賴(lài)于活動(dòng)標(biāo)簽構(gòu)成的詞袋模型,比如Jaccard系數(shù)和Dice系數(shù)[1],它們均基于共享和非共享單詞數(shù)量來(lái)計(jì)算兩個(gè)活動(dòng)標(biāo)簽之間的相似度。當(dāng)不同活動(dòng)使用相似的單詞進(jìn)行描述時(shí),能取得較好的匹配結(jié)果,但是當(dāng)使用不同的單詞描述時(shí),語(yǔ)法相似度的效果會(huì)比較差。語(yǔ)義相似度在活動(dòng)標(biāo)簽語(yǔ)法的基礎(chǔ)上進(jìn)一步考慮了單詞的含義,因此往往可以獲得更高的準(zhǔn)確性。通常,語(yǔ)義相似度借助WordNet來(lái)識(shí)別同義詞,進(jìn)而計(jì)算出活動(dòng)標(biāo)簽之間的相似度。代表性的語(yǔ)義相似度包括LIN[3]相似度、Wu&Palmer[1]相似度和Lesk[4]相似度。Lin[3]相似度在WordNet分類(lèi)法基礎(chǔ)上根據(jù)單詞的信息內(nèi)容來(lái)計(jì)算單詞之間語(yǔ)義相關(guān)性,往往與詞袋模型結(jié)合在一起使用;Wu&Palmer[1]相似度通過(guò)考慮WordNet分類(lèi)法中兩個(gè)單詞之間的路徑長(zhǎng)度來(lái)計(jì)算兩個(gè)單詞之間的相似度;Lesk[4]相似度通過(guò)比較兩個(gè)單詞在WordNet中的定義來(lái)計(jì)算兩個(gè)詞之間的相似度。最近一項(xiàng)研究評(píng)估了Resnik、Lin、Jiang、Leacock和Wu&Palme五種語(yǔ)義相似度度量方法[5],發(fā)現(xiàn)在過(guò)程模型匹配競(jìng)賽PMMC15提供的數(shù)據(jù)集上獲得的匹配效果并不理想。語(yǔ)義相似度度量方法雖然已被廣泛用于過(guò)程模型匹配,但是由于沒(méi)有考慮活動(dòng)的上下文信息,仍存在匹配準(zhǔn)確率較低的問(wèn)題。

        (2)基于過(guò)程模型結(jié)構(gòu)的方法在考慮標(biāo)簽語(yǔ)法和語(yǔ)義的基礎(chǔ)上增加了過(guò)程的結(jié)構(gòu)特征[6]或控制流信息[7],這類(lèi)方法能夠利用活動(dòng)所在過(guò)程模型中的結(jié)構(gòu)特征,在一定程度上減少匹配方法對(duì)活動(dòng)標(biāo)簽信息的依賴(lài)。此外,研究者也提出了一些方法,從過(guò)程模型的附加信息出發(fā),考慮更加豐富的語(yǔ)義信息,從而改善匹配效果,如:Sanchez-Ferreres等利用活動(dòng)基本信息和相關(guān)的模型特征信息來(lái)實(shí)現(xiàn)過(guò)程模型匹配[7-8],VAN DER AA[9]提取日志中的附加信息實(shí)現(xiàn)過(guò)程模型匹配??傮w而言,這類(lèi)方法的匹配效果受活動(dòng)描述信息的影響仍然較大,特別是使用不同的文本來(lái)描述不同活動(dòng)時(shí),現(xiàn)在模型匹配方法很難得到理想的結(jié)果。為了能綜合提升模型匹配效果,本文提出的方法不再局限于活動(dòng)的描述信息,而是利用整個(gè)過(guò)程模型學(xué)習(xí)活動(dòng)的向量表示,以實(shí)現(xiàn)過(guò)程模型匹配。本文方法受活動(dòng)描述信息的影響較小,能更好地識(shí)別出具有相同業(yè)務(wù)影響力的活動(dòng)之間的對(duì)應(yīng)關(guān)系。

        2 過(guò)程模型匹配任務(wù)描述

        為便于形象地展示過(guò)程模型匹配任務(wù),本文使用兩所大學(xué)的新生錄取流程來(lái)介紹過(guò)程模型匹配任務(wù)。如圖1所示為這兩所大學(xué)的新生錄取過(guò)程模型。可以看出,這兩所大學(xué)的錄取流程略有不同,如大學(xué)B將入學(xué)資格審查分兩步進(jìn)行,而大學(xué)A則是將所有的資格審查都集中在一步完成;大學(xué)B對(duì)學(xué)生成績(jī)進(jìn)行排名,并基于排名進(jìn)行錄取,而大學(xué)A在準(zhǔn)予學(xué)生入學(xué)之前不僅要進(jìn)行學(xué)生的成績(jī)排名,還對(duì)學(xué)生進(jìn)行面試排名。此外,大學(xué)A的第一項(xiàng)活動(dòng)與大學(xué)B的第一項(xiàng)活動(dòng)描述“獲取申請(qǐng)表格”完全相同,因此兩者是完全匹配的;而大學(xué)A的第二項(xiàng)活動(dòng)“提交申請(qǐng)”和與大學(xué)B中的第二項(xiàng)活動(dòng)“提交表格”有不同的標(biāo)簽描述,但是它們表示相同的業(yè)務(wù)內(nèi)容,因此兩者也是匹配的。過(guò)程模型匹配任務(wù)的目標(biāo)是不僅能夠識(shí)別出具有相同標(biāo)簽描述的活動(dòng)之間的匹配關(guān)系,還能夠識(shí)別具有相同業(yè)務(wù)內(nèi)容但標(biāo)簽描述不同的活動(dòng)之間的匹配關(guān)系。還需指出的是,過(guò)程模型匹配不僅需處理1:1匹配關(guān)系,還需處理1:n與m:n匹配關(guān)系。以圖1為例,大學(xué)A的一個(gè)活動(dòng)“審核文檔”與大學(xué)B的兩個(gè)活動(dòng)“審核申請(qǐng)材料完整性”和“審核本科學(xué)歷真實(shí)性”對(duì)應(yīng)。在過(guò)程模型匹配任務(wù)中,1:n與m:n匹配關(guān)系越多表明匹配任務(wù)越復(fù)雜。

        3 過(guò)程模型匹配方法

        基于表示學(xué)習(xí)的過(guò)程模型匹配方法總體框架如圖2所示,整體上可分為活動(dòng)向量表示模型和向量空間映射模型兩個(gè)主要部分。活動(dòng)向量表示模型以給定的兩個(gè)過(guò)程模型為輸入,為每個(gè)過(guò)程模型構(gòu)建向量表示空間,即得到各個(gè)活動(dòng)的向量表示;向量空間映射模型建立兩個(gè)過(guò)程模型的向量表示空間之間的映射關(guān)系,使得具有匹配關(guān)系的活動(dòng)向量在數(shù)值上更為接近,從而實(shí)現(xiàn)過(guò)程模型匹配。

        3.1 活動(dòng)向量表示模型

        由于業(yè)務(wù)過(guò)程模型以業(yè)務(wù)流程建模與標(biāo)注(Business Process Modeling Notation,BPMN)、Petri網(wǎng)等多種形式存在,為了能夠利用表示學(xué)習(xí)技術(shù)得到活動(dòng)向量表示,首先使用活動(dòng)關(guān)系三元組的形式表示過(guò)程模型中蘊(yùn)含的結(jié)構(gòu)信息,從而得到不同類(lèi)型過(guò)程模型的規(guī)范化表示,之后設(shè)計(jì)了活動(dòng)關(guān)系向量運(yùn)算規(guī)則,最后在此基礎(chǔ)上設(shè)計(jì)了活動(dòng)表示學(xué)習(xí)算法。

        3.1.1 過(guò)程模型活動(dòng)關(guān)系三元組抽取

        考慮到過(guò)程模型中存在多種類(lèi)型的節(jié)點(diǎn)(活動(dòng)節(jié)點(diǎn)、網(wǎng)關(guān)節(jié)點(diǎn)等)和并發(fā)、互斥等復(fù)雜關(guān)系,直接對(duì)之進(jìn)行規(guī)范化表示較為困難。為此,首先將過(guò)程模型轉(zhuǎn)化為過(guò)程結(jié)構(gòu)樹(shù)[10],將過(guò)程模型解析為具有單個(gè)入口節(jié)點(diǎn)和單個(gè)出口節(jié)點(diǎn)的片段層次結(jié)構(gòu),以便更為形式化地表達(dá)活動(dòng)之間的各類(lèi)關(guān)系。然而,語(yǔ)法結(jié)構(gòu)樹(shù)中可能在一個(gè)層次片段中存在兩個(gè)以上的活動(dòng)節(jié)點(diǎn)。因此,利用語(yǔ)法結(jié)構(gòu)樹(shù)抽取的關(guān)系元組可能包含兩個(gè)以上的活動(dòng)。為了更好地對(duì)活動(dòng)關(guān)系進(jìn)行規(guī)范化表示,本文進(jìn)一步將過(guò)程結(jié)構(gòu)樹(shù)轉(zhuǎn)化為二叉樹(shù),最后根據(jù)二叉樹(shù)得到過(guò)程模型對(duì)應(yīng)的活動(dòng)關(guān)系三元組集合。

        如圖3所示為一個(gè)具體的活動(dòng)關(guān)系三元組抽取實(shí)例,其中,圖3a是一個(gè)以BPMN形式表示的過(guò)程模型,圖3b是該過(guò)程模型對(duì)應(yīng)的過(guò)程結(jié)構(gòu)樹(shù),圖3c是進(jìn)一步得到的過(guò)程結(jié)構(gòu)二叉樹(shù)。在圖3b表示的過(guò)程結(jié)構(gòu)樹(shù)中,葉子節(jié)點(diǎn)都是活動(dòng)節(jié)點(diǎn),父節(jié)點(diǎn)是關(guān)系節(jié)點(diǎn),表示其子節(jié)點(diǎn)之間存在的關(guān)系??梢钥闯?,過(guò)程結(jié)構(gòu)樹(shù)中一個(gè)父節(jié)點(diǎn)可能包含任意個(gè)子節(jié)點(diǎn),而過(guò)程結(jié)構(gòu)二叉樹(shù)中每個(gè)父節(jié)點(diǎn)的子節(jié)點(diǎn)數(shù)量是固定的,其規(guī)范化程度更高,可以被完整地表示為活動(dòng)關(guān)系三元組。圖3c所示的過(guò)程結(jié)構(gòu)二叉樹(shù)對(duì)應(yīng)的活動(dòng)關(guān)系三元組集合為:T={T1,T2,T3,T4,T5,T6},其中:T1=(A,+,B);T2=(T1,→,C);T3=(E,→,G);T4=(D,×,F);T5=(T3,×,T4);T6=(T2,→,T5)。此處,→、+、×分別表示順序、并發(fā)、互斥關(guān)系,本文僅考慮這3種活動(dòng)之間的關(guān)系。

        3.1.2 活動(dòng)關(guān)系向量運(yùn)算規(guī)則

        對(duì)于表示學(xué)習(xí)模型,本文不僅需要對(duì)活動(dòng)和關(guān)系進(jìn)行向量表示,還需要得到三元組的向量表示。為此,針對(duì)順序、并發(fā)、互斥3種類(lèi)型的三元組,本文設(shè)計(jì)了相應(yīng)的向量運(yùn)算規(guī)則得到其向量表示。

        (1)順序關(guān)系三元組向量運(yùn)算規(guī)則

        對(duì)于順序關(guān)系三元組T=(S,→,O),即實(shí)體S和實(shí)體O之間存在順序關(guān)系,令eT、eS、eO分別表示T、S、O對(duì)應(yīng)的向量表示,向量運(yùn)算關(guān)系如下:

        eT=H1(S,→,O)=eo-es。

        (1)

        (2)并發(fā)關(guān)系三元組向量運(yùn)算規(guī)則

        對(duì)于并發(fā)關(guān)系三元組T=(S,+,O),即實(shí)體S和實(shí)體O之間存在并發(fā)關(guān)系,令eT、eS、eO分別表示T、S、O對(duì)應(yīng)的向量表示,向量運(yùn)算關(guān)系如下:

        eT=H2(S,+,O)=avg_pooling(es,eo)。

        (2)

        (3)互斥關(guān)系三元組向量運(yùn)算規(guī)則

        對(duì)于互斥關(guān)系三元組T=(S,×,O),即實(shí)體S和實(shí)體O之間存在互斥關(guān)系,令eT、eS、eO分別表示T、S、O對(duì)應(yīng)的向量表示,向量運(yùn)算關(guān)系如下:

        eT=H3(S,×,O)=max_pooling(es,eo)。

        (3)

        基于活動(dòng)向量與三元組向量,本文進(jìn)一步對(duì)活動(dòng)關(guān)系三元組的存在概率進(jìn)行量化表示??紤]到過(guò)程模型中的各種關(guān)系具有對(duì)稱(chēng)和非對(duì)稱(chēng)等多種特征,本文通過(guò)復(fù)數(shù)向量點(diǎn)乘的形式計(jì)算實(shí)體之間存在關(guān)系的概率。給定活動(dòng)關(guān)系三元組T=(S,r,O),其存在概率

        Pr(T)=Re(〈wr,eS,eO〉)

        =〈w′r,e′S,e′O〉+〈w′r,e″S,e″O〉+〈w″r,

        e′S,e″O〉-〈w″r,e″S,e′O〉。

        (4)

        (5)

        3.1.3 活動(dòng)表示學(xué)習(xí)算法

        根據(jù)給定的真實(shí)活動(dòng)關(guān)系三元組集合,本文生成用于活動(dòng)表示學(xué)習(xí)的訓(xùn)練數(shù)據(jù)集Ω={((S,r,O),ySrO)}。其中,若三元組(S,r,O)屬于真實(shí)的活動(dòng)關(guān)系三元組集合,則ySrO=1;為了讓訓(xùn)練過(guò)程具有區(qū)分能力,本文將真實(shí)的活動(dòng)關(guān)系三元組中的活動(dòng)S、O及關(guān)系r進(jìn)行隨機(jī)替換,得到一定數(shù)量的三元組負(fù)樣本,其對(duì)應(yīng)的ySrO=-1。訓(xùn)練過(guò)程使用式(6)所示的交叉熵?fù)p失函數(shù):

        (6)

        式中 Θ為模型參數(shù),具體包括每個(gè)活動(dòng)及關(guān)系的向量表示;λ為調(diào)節(jié)經(jīng)驗(yàn)誤差和正則項(xiàng)比重的參數(shù)。在具體訓(xùn)練過(guò)程中,每次迭代中從訓(xùn)練集中隨機(jī)抽取三元組并對(duì)選取的三元組進(jìn)行負(fù)采樣作為本次迭代的訓(xùn)練數(shù)據(jù),利用這批訓(xùn)練數(shù)據(jù)批量計(jì)算式(6)的梯度,根據(jù)梯度更新各個(gè)活動(dòng)的向量表示。

        3.2 向量空間映射模型

        活動(dòng)向量表示模型為每個(gè)過(guò)程模型中的活動(dòng)學(xué)習(xí)向量表示,換言之是為每個(gè)過(guò)程模型分別構(gòu)建一個(gè)向量空間,過(guò)程模型中的活動(dòng)對(duì)應(yīng)著向量空間中的點(diǎn)。由于不同過(guò)程模型對(duì)應(yīng)著不同的向量空間,無(wú)法直接將不同過(guò)程模型中的活動(dòng)進(jìn)行匹配。為此,本文進(jìn)一步構(gòu)建了一個(gè)向量空間映射模型,將兩個(gè)過(guò)程模型的向量空間進(jìn)行對(duì)齊。給定兩個(gè)過(guò)程模型的向量空間Λ1和Λ2,向量空間映射模型的損失函數(shù)如下:

        Lmap=∑(a,b)∈Λ1×Λ2f(ea,eb)。

        (7)

        式中:f(ea,eb)是活動(dòng)向量懲罰函數(shù),用以量化兩個(gè)活動(dòng)之間的匹配程度,其取值越大表示匹配程度越低。本文從向量直接距離、向量平移和向量線性變換3個(gè)角度,定義了如下3個(gè)匹配函數(shù):

        (1)基于向量直接距離的匹配函數(shù)

        該方法假設(shè)兩個(gè)過(guò)程模型具有相同的向量空間,因而可以直接使用向量距離來(lái)反映活動(dòng)匹配程度,具體計(jì)算方式如下:

        冰再多,也不能繁衍生命,我們更希望能夠發(fā)現(xiàn)液態(tài)水。于是,科學(xué)家在鳳凰號(hào)著陸器的著陸腿上,觀察到了冷凝的水滴——露珠。火星夏季的赤道地區(qū),在一些斜坡上,發(fā)現(xiàn)了一些奇怪的暗色條紋,可能是融化的液態(tài)水,但只是季節(jié)性出現(xiàn),這還不夠。要有生命,就要有穩(wěn)定的液態(tài)水體,但火星上一直沒(méi)有發(fā)現(xiàn)。

        (8)

        (2)基于向量平移的匹配函數(shù)

        不同過(guò)程模型的向量空間通常是不同的,因而基于向量直接距離的匹配函數(shù)的假設(shè)過(guò)強(qiáng)。為此,將向量空間假設(shè)放松,即假設(shè)兩個(gè)過(guò)程模型的向量空間具有平移關(guān)系。基于向量平移的匹配函數(shù)計(jì)算方式如下:

        (9)

        式中:vΛ1Λ2是向量空間Λ1和Λ2之間平移向量,作為模型訓(xùn)練的一個(gè)參數(shù)。式(9)表明向量空間Λ1中的活動(dòng)向量ea經(jīng)平移后(平移方式由vΛ1Λ2決定)與向量空間Λ2中的活動(dòng)向量eb之間的距離決定了兩者的匹配程度。

        (3)基于向量線性變換的匹配函數(shù)

        該方法進(jìn)一步放松關(guān)于過(guò)程模型向量空間的假設(shè),認(rèn)為兩者具有線性變換關(guān)系,具體計(jì)算方式如下:

        (10)

        式中:MΛ1Λ2是向量空間Λ1和Λ2之間線性變換矩陣,作為模型訓(xùn)練的一個(gè)參數(shù)。式(10)表明向量空間Λ1中的活動(dòng)向量ea經(jīng)線性變換后(線性變換方式由MΛ1Λ2決定)與向量空間Λ2中的活動(dòng)向量eb之間的距離決定了兩者的匹配程度。

        3.3 整體訓(xùn)練過(guò)程

        基于表示學(xué)習(xí)的過(guò)程模型匹配方法將活動(dòng)向量表示模型和向量空間映射模型放在一起進(jìn)行聯(lián)合訓(xùn)練,總體損失函數(shù)如下:

        L=Lvec+α·Lmap。

        (11)

        式中:Lvec和Lmap分別為式(6)和式(7)中的活動(dòng)向量表示模型損失函數(shù)和向量空間映射模型損失函數(shù);α為控制兩者重要程度的超參數(shù)。由于本文設(shè)計(jì)了3個(gè)活動(dòng)匹配函數(shù),本文提出的基于表示學(xué)習(xí)的過(guò)程模型匹配方法也具有3個(gè)變體。

        在具體訓(xùn)練過(guò)程中,本文并不直接優(yōu)化總體損失函數(shù),而是交替地優(yōu)化活動(dòng)向量表示模型損失函數(shù)和向量空間映射模型損失函數(shù),即將每輪迭代分為兩個(gè)環(huán)節(jié),分別計(jì)算如下梯度:

        (12)

        (13)

        根據(jù)上述梯度分別交替更新Θvec(包括各個(gè)過(guò)程模型中的活動(dòng)向量)和Θmap(包括各個(gè)過(guò)程模型中的活動(dòng)向量,以及過(guò)程模型之間的平移向量或線性變換向量)。模型訓(xùn)練結(jié)束之后,可以得到所有過(guò)程模型的活動(dòng)向量,根據(jù)向量可以計(jì)算活動(dòng)之間的相似度。對(duì)于指定的活動(dòng),選取top-k個(gè)最相似的活動(dòng)作為預(yù)測(cè)匹配結(jié)果。

        4 實(shí)驗(yàn)結(jié)果及分析

        本章將對(duì)所提出的過(guò)程模型匹配方法的實(shí)驗(yàn)內(nèi)容進(jìn)行詳細(xì)介紹。首先介紹實(shí)驗(yàn)使用的數(shù)據(jù)集,之后給出本文方法與傳統(tǒng)方法的對(duì)比結(jié)果,最后對(duì)本文方法進(jìn)行深入實(shí)驗(yàn)分析。

        4.1 實(shí)驗(yàn)數(shù)據(jù)

        本文實(shí)驗(yàn)使用的數(shù)據(jù)集是過(guò)程模型匹配競(jìng)賽PMMC15[注]https://ai.wu.ac.at/emisa2015/contest.php。提供的公開(kāi)數(shù)據(jù)集,具體包括UA(University Admission processes)和BR(Birth Registration processes)兩個(gè)數(shù)據(jù)集。其中,UA由36個(gè)模型對(duì)組成,這些模型對(duì)來(lái)自9個(gè)模型,代表9所大學(xué)碩士研究生的申請(qǐng)過(guò)程,模型形式是BPMN;BR由36個(gè)模型對(duì)組成,這些模型對(duì)同樣來(lái)自9個(gè)模型,代表德國(guó),俄羅斯,南非和荷蘭等9個(gè)嬰兒出生登記過(guò)程,模型形式是Petri網(wǎng)。表1給出了這兩個(gè)數(shù)據(jù)集的主要統(tǒng)計(jì)特征。

        表1 數(shù)據(jù)集統(tǒng)計(jì)特征

        4.2 對(duì)比實(shí)驗(yàn)

        4.2.1 對(duì)比方法

        本實(shí)驗(yàn)選擇代表性的利用活動(dòng)標(biāo)簽語(yǔ)法和語(yǔ)義,以及過(guò)程模型控制流結(jié)構(gòu)的過(guò)程模型匹配方法作為基準(zhǔn)方法,各方法描述如下:

        (1)ICoP[11]。利用活動(dòng)標(biāo)簽的語(yǔ)法信息,并采用啟發(fā)式搜索方法;

        (2)RMM/NHCM[1]。利用活動(dòng)標(biāo)簽的語(yǔ)義信息,并對(duì)活動(dòng)語(yǔ)義進(jìn)行聚類(lèi);

        (3)Triple-S[1]。綜合利用活動(dòng)標(biāo)簽的句法和語(yǔ)義信息,以及過(guò)程模型的結(jié)構(gòu)特征;

        (4)BOT[7]。綜合利用活動(dòng)標(biāo)簽的語(yǔ)法和語(yǔ)義信息,并考慮過(guò)程模型的控制流結(jié)構(gòu)。

        本文使用Pytorch1.1實(shí)現(xiàn)所提出的基于表示學(xué)習(xí)的過(guò)程模型匹配方法,并進(jìn)行了基本調(diào)參,調(diào)參范圍為:

        (1)活動(dòng)和關(guān)系向量的維度:{5,10,20};

        (2)映射模型損失的權(quán)重α:{1, 1.5,2, 2.5};

        (3)學(xué)習(xí)率:{0.01,0.001}。

        其他參數(shù)設(shè)置方式為:迭代次數(shù)為100輪,優(yōu)化算法為Adam。

        4.2.2 評(píng)價(jià)指標(biāo)

        本實(shí)驗(yàn)選擇經(jīng)典的評(píng)估指標(biāo)精確率(Precision)、召回率(Recall)和F1評(píng)價(jià)本文方法和各基準(zhǔn)方法,具體計(jì)算方式如下:

        其中:P為通過(guò)過(guò)程模型匹配方法得到的匹配活動(dòng)對(duì)集合,G為數(shù)據(jù)集中提供的真實(shí)匹配活動(dòng)對(duì)集合。

        4.2.3 對(duì)比實(shí)驗(yàn)結(jié)果

        本文方法與各基準(zhǔn)方法在兩個(gè)數(shù)據(jù)集上的各項(xiàng)評(píng)估指標(biāo)評(píng)測(cè)結(jié)果如表2所示。

        根據(jù)表2可得出以下結(jié)論:

        表2 對(duì)比實(shí)驗(yàn)結(jié)果

        (1)本文方法的各個(gè)變種在這兩個(gè)數(shù)據(jù)集上均優(yōu)于傳統(tǒng)的基于標(biāo)簽語(yǔ)法、語(yǔ)義以及過(guò)程模型結(jié)構(gòu)信息的方法,從而證實(shí)了表示學(xué)習(xí)方法在過(guò)程模型匹配任務(wù)中具有一定的優(yōu)勢(shì)。這是因?yàn)楸硎緦W(xué)習(xí)方法能夠利用整個(gè)過(guò)程模型構(gòu)建有效的活動(dòng)向量表示,可以同時(shí)考慮活動(dòng)在過(guò)程模型中的上下文信息和活動(dòng)之間的關(guān)系信息,并且該方法受活動(dòng)標(biāo)簽的影響較小,可以有效處理不規(guī)范的活動(dòng)標(biāo)簽形式,進(jìn)而能夠取得更好的匹配效果。

        (2)對(duì)比本文提出的基于向量直接距離、向量平移和向量線性變換3種向量空間映射方法。在規(guī)模較小的數(shù)據(jù)集UA上,由于事先給定的真實(shí)匹配活動(dòng)對(duì)數(shù)量較少,難以很好地學(xué)習(xí)到平移向量或線性變換向量,因此相對(duì)而言,基于向量直接距離的方法可以取得最好的效果。在規(guī)模較大的數(shù)據(jù)集BR上,基于向量線性變換的方法取得了最好的效果,其主要原因是該方法對(duì)向量空間的假設(shè)最為寬松,而且在事先給定真實(shí)匹配活動(dòng)對(duì)數(shù)量較多的情況下,有助于學(xué)習(xí)出參數(shù)更復(fù)雜的模型。另外需要注意的是,基于向量平移的方法這兩個(gè)數(shù)據(jù)集上效果較差,可能是因?yàn)樵摲椒▽?duì)向量空間平移性的假設(shè)并不符合真實(shí)情況。

        4.3 實(shí)驗(yàn)分析

        本節(jié)對(duì)本文方法中的主要參數(shù)進(jìn)行實(shí)驗(yàn)分析,主要包括損失函數(shù)中的權(quán)重參數(shù)和訓(xùn)練集比例參數(shù)。

        4.3.1 損失函數(shù)權(quán)重參數(shù)對(duì)匹配結(jié)果的影響

        如式(11)所示,本文方法使用的損失函數(shù)中包含了活動(dòng)向量表示損失和向量空間映射損失兩部分,彼此之間通過(guò)α控制兩者的權(quán)重。本實(shí)驗(yàn)中,在固定其他超參數(shù)的前提下,在{1,1.5, 2, 2.5}中令α分別取不同的值,觀察在UA和BR兩個(gè)數(shù)據(jù)集上F1值的變化,如圖4所示。

        從圖4中可以發(fā)現(xiàn),不同的α值會(huì)對(duì)模型匹配結(jié)果的F1值有一定的影響。當(dāng)α=1.5時(shí),得到的匹配效果最好,這意味著此時(shí)很好地平衡了活動(dòng)向量表示模型和向量空間映射模型對(duì)匹配結(jié)果的影響。當(dāng)α更大或更小時(shí),F(xiàn)1值均有所下降,說(shuō)明當(dāng)向量空間映射模型權(quán)重過(guò)大時(shí),會(huì)忽略模型中活動(dòng)之間的關(guān)系信息,從而不能很好地區(qū)分相鄰活動(dòng)之間的關(guān)系;而當(dāng)活動(dòng)向量表示模型權(quán)重過(guò)大時(shí),會(huì)忽略模型之間活動(dòng)的匹配信息,這將直接降低模型匹配的效果。總體而言,向量空間映射模型的權(quán)重略大,會(huì)取得最好的匹配效果。

        4.3.2 訓(xùn)練集比例對(duì)匹配結(jié)果的影響

        本實(shí)驗(yàn)針對(duì)兩個(gè)數(shù)據(jù)集分別選擇真實(shí)匹配活動(dòng)對(duì)的50%、60%、70%、80%和90%作為訓(xùn)練集,訓(xùn)練不同的匹配模型,并評(píng)估其Precision、Recall和F1值,如圖5所示??梢园l(fā)現(xiàn),隨著訓(xùn)練集的增加,本文方法的3個(gè)變體在各項(xiàng)評(píng)估指標(biāo)上均有不同程度的提升,這是因?yàn)楦蟮挠?xùn)練集蘊(yùn)含了更多的活動(dòng)匹配關(guān)系,從而使得向量空間映射模型能更好地實(shí)現(xiàn)過(guò)程模型之間不同活動(dòng)的匹配,進(jìn)而可以直接提升最終匹配效果。

        5 結(jié)束語(yǔ)

        本文提出了一種基于表示學(xué)習(xí)的過(guò)程模型匹配方法,該方法主要包括活動(dòng)向量表示模型和向量空間映射模型兩個(gè)主要部分。前者用于構(gòu)建過(guò)程模型中各個(gè)活動(dòng)的向量表示,后者用于實(shí)現(xiàn)不同過(guò)程模型的向量空間的映射,最終根據(jù)活動(dòng)向量之間的數(shù)值關(guān)系實(shí)現(xiàn)活動(dòng)之間的匹配。相比傳統(tǒng)的過(guò)程模型匹配方法,本文方法能夠更好地利用過(guò)程模型中活動(dòng)的上下文信息和活動(dòng)關(guān)系信息,從而提升了過(guò)程模型匹配的準(zhǔn)確性。在PMMC15提供的UA和BR兩個(gè)公開(kāi)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,本文方法相比于傳統(tǒng)的基于標(biāo)簽語(yǔ)法、語(yǔ)義以及過(guò)程模型結(jié)構(gòu)信息的方法具有明顯的優(yōu)勢(shì)。

        本文工作初步證實(shí)了深度學(xué)習(xí)領(lǐng)域中的表示學(xué)習(xí)技術(shù)在過(guò)程模型匹配任務(wù)中具有很強(qiáng)的應(yīng)用潛力,這一方向在未來(lái)還有許多值得進(jìn)一步探索的地方,如在已知真實(shí)的活動(dòng)匹配信息較少情況下,如何利用少量的訓(xùn)練數(shù)據(jù)獲得更好的匹配效果;如何在表示學(xué)習(xí)框架下考慮除順序、并發(fā)、互斥以外的其他復(fù)雜關(guān)系。

        猜你喜歡
        活動(dòng)信息方法
        “六小”活動(dòng)
        “活動(dòng)隨手拍”
        行動(dòng)不便者,也要多活動(dòng)
        中老年保健(2021年2期)2021-08-22 07:31:10
        三八節(jié),省婦聯(lián)推出十大系列活動(dòng)
        海峽姐妹(2018年3期)2018-05-09 08:20:40
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        可能是方法不對(duì)
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        捕魚(yú)
        展會(huì)信息
        一区二区三区视频亚洲| 婷婷色综合成人成人网小说| 国产主播一区二区在线观看| 天涯成人国产亚洲精品一区av| 国产裸体美女永久免费无遮挡| 使劲快高潮了国语对白在线 | 亚洲一区二区三区久久蜜桃| 久久午夜一区二区三区| 国语自产精品视频在线看| 人妻在线日韩免费视频| 人妻中出精品久久久一区二| 中文字幕中文字幕三区| 欧美成人猛片aaaaaaa| 中文字幕日本最新乱码视频| 午夜国产精品久久久久| 久久精见国产亚洲av高清热| 无码一区二区三区中文字幕| 精品熟女少妇av免费观看| 亚洲无码激情视频在线观看| 亚洲激情一区二区三区不卡| 狠狠色噜噜狠狠狠777米奇小说 | 亚洲 暴爽 AV人人爽日日碰| 国产av一啪一区二区| 蜜臀亚洲av无码精品国产午夜.| 乱码一二三入区口| 中文字幕色视频在线播放| 亚洲天堂精品一区入口| 一本一道av无码中文字幕﹣百度 | 美女在线国产| 国产精品黄色av网站| 内射中出日韩无国产剧情| 青草国产精品久久久久久| 国产福利小视频91| 91色老久久偷偷精品蜜臀懂色| 2021国产精品国产精华| 女高中生自慰污免费网站| 国产亚洲精品视频网站| 免费观看交性大片| 日韩视频第二页| 亚洲综合网中文字幕在线| 曰韩内射六十七十老熟女影视 |