亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        應(yīng)急預(yù)案響應(yīng)過程的BPMN模型自動(dòng)抽取方法及實(shí)現(xiàn)

        2022-11-07 04:27:14楊卿濤郭文艷倪維健曾慶田
        關(guān)鍵詞:短句網(wǎng)關(guān)應(yīng)急

        楊卿濤,郭文艷,倪維健,曾慶田

        (山東科技大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,山東 青島 266590)

        0 引言

        過程模型抽取(Process Model Extraction, PME)是從過程描述文本中自動(dòng)抽取過程信息,并通過形式化方式描述抽取結(jié)果,涉及自然語(yǔ)言處理和業(yè)務(wù)流程管理(Business Process Management, BPM)等技術(shù)手段[1]。隨著信息數(shù)據(jù)的爆炸式增長(zhǎng),作為信息載體的文本、圖片、視頻等媒體均可作為過程模型的抽取對(duì)象。突發(fā)事件應(yīng)急預(yù)案是政府部門為科學(xué)、有效和快速應(yīng)對(duì)突發(fā)事件,最大程度減少突發(fā)事件造成的損失而預(yù)先制定的工作方案[2]。非結(jié)構(gòu)化自然語(yǔ)言描述的應(yīng)急預(yù)案主要包括總則、組織體系、預(yù)警報(bào)告、應(yīng)急響應(yīng)、善后處置和保障措施6部分,其中應(yīng)急響應(yīng)部分蘊(yùn)含大量過程信息,包括應(yīng)急部門/人員、響應(yīng)任務(wù)、部門/人員與任務(wù)之間關(guān)系以及任務(wù)與任務(wù)之間關(guān)系等內(nèi)容,本文將應(yīng)急預(yù)案的應(yīng)急響應(yīng)部分稱為“響應(yīng)過程文本”,這是一種典型的過程描述文本。目前應(yīng)急響應(yīng)過程模型大多由應(yīng)急領(lǐng)域?qū)<遗c建模專家手動(dòng)完成,這種手工建模的方式需要耗費(fèi)大量時(shí)間和精力,而且建模效率無(wú)法保證。面對(duì)海量化的應(yīng)急預(yù)案文本,如何快速將非結(jié)構(gòu)化的應(yīng)急預(yù)案文本自動(dòng)轉(zhuǎn)化為形式化的過程模型,為專家建模提供參考,顯得尤為重要。

        針對(duì)當(dāng)前構(gòu)建應(yīng)急響應(yīng)過程模型極大消耗人力和物力資源的問題,本文提出一種從應(yīng)急預(yù)案響應(yīng)過程文本中自動(dòng)抽取應(yīng)急響應(yīng)過程業(yè)務(wù)流程建模標(biāo)注(Business Process Modeling Notation, BPMN)模型的方法。首先,對(duì)應(yīng)急預(yù)案文本進(jìn)行清洗、分句、分詞和標(biāo)注詞性,訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型識(shí)別響應(yīng)任務(wù)元素;其次,通過分析文本構(gòu)建任務(wù)關(guān)系特征向量,用機(jī)器學(xué)習(xí)的方法抽取任務(wù)關(guān)系;然后,將抽取的響應(yīng)任務(wù)和任務(wù)關(guān)系轉(zhuǎn)換為BPMN模型元素,并用Activiti工作流引擎構(gòu)建BPMN模型,通過BPMN-JS解析顯示;最后,對(duì)抽取功能進(jìn)行封裝,并開發(fā)應(yīng)急響應(yīng)過程BPMN模型自動(dòng)抽取原型系統(tǒng),用戶可以通過線上提交或手動(dòng)輸入應(yīng)急預(yù)案響應(yīng)過程文本,系統(tǒng)自動(dòng)生成應(yīng)急響應(yīng)過程BPMN模型。另外,本文還對(duì)抽取步驟中用到的方法進(jìn)行對(duì)比實(shí)驗(yàn),驗(yàn)證了所提自動(dòng)抽取方法的有效性。

        1 相關(guān)工作

        過程描述文本廣泛存于生產(chǎn)生活,承載著重要的過程信息,越來越多的學(xué)者通過各種方法從這些文本中抽取過程相關(guān)信息,并將抽取結(jié)果描述為不同形式的結(jié)構(gòu)化模型。由于特定領(lǐng)域規(guī)范化文本的句式比較完整,可以采用自然語(yǔ)言處理工具挖掘過程信息。FRIEDRICH等[3]提出一種用自然語(yǔ)言處理工具從文本描述中抽取業(yè)務(wù)過程模型的方法,其用StanfordParser得到句法樹和句子間的語(yǔ)法關(guān)系,用FrameNet和WordNet進(jìn)行語(yǔ)義分析,結(jié)合回指消解機(jī)制識(shí)別指代關(guān)系,得到更加準(zhǔn)確的活動(dòng)關(guān)系,進(jìn)而生成BPMN過程模型;EPURE等[4]提出一種從文本中自動(dòng)提取活動(dòng)日志和挖掘過程實(shí)例模型的方法,該方法用StanfordParser和自然語(yǔ)言處理工具包(Natural Language ToolKit, NLTK)組合生成語(yǔ)法樹,在WordNet和VerbNet數(shù)據(jù)庫(kù)中查找及物動(dòng)詞,將含有動(dòng)詞的語(yǔ)句作為活動(dòng)識(shí)別的重要條件,結(jié)合給定的規(guī)則逐句分析當(dāng)前活動(dòng)與前一步得到的活動(dòng)之間的關(guān)系,進(jìn)而生成過程實(shí)例模型;FERRERIA等[5]提出一種半自動(dòng)的方法識(shí)別自然語(yǔ)言文本中的過程元素,其用SpacyParser分析輸入文本的結(jié)構(gòu),通過過程元素在文本中的句法特點(diǎn)和語(yǔ)法類別以及詞組之間的關(guān)聯(lián)定義映射規(guī)則識(shí)別過程元素;HAN等[6]提出一種從自然語(yǔ)言文本中自動(dòng)提取聲明式過程模型的方法,該方法用StanfordParser分析約束描述中的語(yǔ)義成分和依賴關(guān)系,并識(shí)別和提取活動(dòng),結(jié)合已識(shí)別的活動(dòng)和其他語(yǔ)義信息生成約束;GUO等[7]提出一種從中國(guó)應(yīng)急預(yù)案中自動(dòng)抽取應(yīng)急響應(yīng)過程模型的方法,將文本表示為文本樹,采用規(guī)則的方法識(shí)別過程模型元素,然后結(jié)合文本樹和過程模型元素生成應(yīng)急響應(yīng)過程樹,得到BPMN過程模型;郭文艷[8]提出一種面向任務(wù)視圖和組織視圖的應(yīng)急響應(yīng)過程自動(dòng)建模方法,將深度學(xué)習(xí)與規(guī)則方法結(jié)合,自動(dòng)抽取多視圖模型。

        考慮到過程文本多樣性和靈活性的特點(diǎn),將過程模型抽取分為實(shí)體識(shí)別與關(guān)系抽取兩部分,并應(yīng)用統(tǒng)計(jì)學(xué)習(xí)方法得到更好的過程元素抽取效果;NIEKLE[9]采用支持向量機(jī)(Support Vector Machine, SVM)替代特定規(guī)則識(shí)別活動(dòng)關(guān)系。由于機(jī)器學(xué)習(xí)需要用大量標(biāo)注數(shù)據(jù)訓(xùn)練模型,倪維健等[10]提出一種半監(jiān)督學(xué)習(xí)的方法,通過為不同活動(dòng)關(guān)系設(shè)計(jì)識(shí)別規(guī)則,在同領(lǐng)域內(nèi)只有少量標(biāo)注數(shù)據(jù)的情況下,采用大量未標(biāo)注數(shù)據(jù)提升抽取效果。除了隱馬爾可夫模型(Hidden Markov Models, HMM)和條件隨機(jī)場(chǎng)[11](Conditional Random Fields, CRF)外,深度學(xué)習(xí)也常用于實(shí)體識(shí)別與關(guān)系抽取,相關(guān)工作主要對(duì)編碼層、語(yǔ)義編碼層和解碼層3部分進(jìn)行改進(jìn)。ZHANG等[12]為降低分詞錯(cuò)誤對(duì)模型整體效果的影響,通過LatticeLSTM方法將中文詞級(jí)別信息添加到基于字的長(zhǎng)短期記憶條件隨機(jī)場(chǎng)(Lang Short Term Memory CRF, LSTM-CRF)模型上;CHEN等[13]首先通過卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNNs)捕捉詞的局部上下文,然后通過門控關(guān)系網(wǎng)絡(luò)(Gated Relation Network, GRN)構(gòu)建詞與詞之間的關(guān)系,將局部特征映射到全局上下文特征中,實(shí)現(xiàn)了過程元素標(biāo)簽預(yù)測(cè);HUANG等[14]將雙向長(zhǎng)短期記憶(Bi-directional Long Short Term Memory, Bi-LSTM)網(wǎng)絡(luò)與CRF結(jié)合應(yīng)用于序列標(biāo)注問題,從而兼顧上下文信息,有效利用過去和未來的輸入特性,對(duì)詞嵌入的依賴性更低;RAMAMOORTHY等[15]在雙向長(zhǎng)短期記憶條件隨機(jī)場(chǎng)(Bi-directional Long Short Term Memory CRF, Bi-LSTM-CRF)的基礎(chǔ)上加入全局注意力機(jī)制(global attention),以增強(qiáng)關(guān)鍵特征在識(shí)別過程中的權(quán)重,進(jìn)一步提高識(shí)別效果;CHEN等[1]提出一種無(wú)需人工定義過程特征的分層神經(jīng)網(wǎng)絡(luò)用于建模和提取多粒度信息,將PME形式化為多粒度文本分類問題,通過從粗到細(xì)的學(xué)習(xí)機(jī)制訓(xùn)練層次神經(jīng)網(wǎng)絡(luò)實(shí)來抽取多粒度過程信息。

        總之,第一類方法憑借自然語(yǔ)言處理工具,適用于某一特定領(lǐng)域或條件下的信息抽取,適合處理句式簡(jiǎn)單固定、結(jié)構(gòu)完整的過程描述文本;第二類方法通過大量標(biāo)注數(shù)據(jù)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),其對(duì)過程元素的識(shí)別效果明顯優(yōu)于基于規(guī)則的方法,而且可以處理更加靈活多樣的自然語(yǔ)言文本。本文在Bi-LSTM-CRF網(wǎng)絡(luò)基礎(chǔ)上添加前饋?zhàn)⒁饬C(jī)制(feed-forward attention)[16],將抽取工作拆分為數(shù)據(jù)預(yù)處理及標(biāo)注、過程元素抽取和BPMN模型生成3個(gè)階段,漸進(jìn)地從響應(yīng)過程文本中抽取過程模型。

        2 相關(guān)定義

        為便于理解,下面給出本文重要概念的相關(guān)定義。

        定義1應(yīng)急預(yù)案響應(yīng)過程文本(RPT)。由多個(gè)長(zhǎng)句(LS)組成,記為RPT=∪1≤k≤MLSk,其中M為響應(yīng)過程文本中長(zhǎng)句的數(shù)量。長(zhǎng)句由一個(gè)短句(SS)或多個(gè)連續(xù)短句構(gòu)成,表示為L(zhǎng)S=∪1≤k≤LSSk,其中L為長(zhǎng)句包含的短句數(shù)量。短句由一個(gè)或多個(gè)連續(xù)詞組(w)組成,表示為SS=∪1≤k≤Nwk,其中N為短句中詞組的數(shù)量。

        定義2應(yīng)急響應(yīng)任務(wù)。表示為一個(gè)四元組TASK=ExeDep,TaskDes,IntType,IntDep,其中ExeDep為任務(wù)執(zhí)行部門;TaskDes為任務(wù)描述內(nèi)容;IntType為任務(wù)類型,包括普通任務(wù)、發(fā)送任務(wù)和接收任務(wù)3種類型;IntDep為交互部門。

        定義3任務(wù)關(guān)系。表示為一個(gè)三元組TR=TASK1,Relation,TASK2,其中TASK1為當(dāng)前應(yīng)急響應(yīng)任務(wù);TASK2為規(guī)定距離內(nèi)的響應(yīng)任務(wù);Relation為任務(wù)間的關(guān)系,包括并發(fā)、同步、選擇、順序和跳轉(zhuǎn)5種類型,具體定義如下:

        (1)并發(fā)關(guān)系,指TASK1和TASK2不存在嚴(yán)格的先后順序,兩者都完成才可執(zhí)行下一個(gè)任務(wù),記作TASK1,parallel,TASK2。

        (2)同步關(guān)系,指TASK1和TASK2的任務(wù)描述相同但執(zhí)行部門不同,記作TASK1,synchronous,TASK2。

        (3)選擇關(guān)系,指TASK1和TASK2同一時(shí)刻只能執(zhí)行一個(gè),記作TASK1,exclusive,TASK2。

        (4)順序關(guān)系,指兩個(gè)任務(wù)存在次序上的依賴關(guān)系,只有在TASK1執(zhí)行之后,TASK2才能執(zhí)行,記作TASK1,sequential,TASK2。

        (5)跳轉(zhuǎn)關(guān)系,指只有符合特定條件才執(zhí)行TASK1,否則跳過TASK1直接執(zhí)行后續(xù)任務(wù),記作TASK1,exclusive,τ,其中τ表示空任務(wù)。

        定義4應(yīng)急響應(yīng)過程BPMN模型。表示為一個(gè)多元組ERPM=Activities,Roles,Events,Gateways,Pools,N,F,ρ,π,其中:

        (1)Activities為活動(dòng)集合,記錄BPMN模型中所有的活動(dòng)(Activity)信息,由n個(gè)活動(dòng)組成,記作Activities={Activityi|0≤i≤n},活動(dòng)對(duì)應(yīng)響應(yīng)任務(wù)的任務(wù)描述。

        (2)Roles為角色集合,記錄BPMN模型中所有的角色(Role)信息,由m個(gè)角色組成,記作Roles={Rolei|0≤i≤m},角色對(duì)應(yīng)響應(yīng)任務(wù)的執(zhí)行人員。

        (3)Events為事件集合,包括一個(gè)開始事件和一個(gè)結(jié)束事件。

        (4)Gateways為網(wǎng)關(guān)集合,記錄BPMN模型中所有的網(wǎng)關(guān)(Gateway)信息,網(wǎng)關(guān)是連接活動(dòng)與活動(dòng)之間關(guān)系的橋接,具體分為排他網(wǎng)關(guān)(exclusive gateway)和并行網(wǎng)關(guān)(parallel gateway),其中并行網(wǎng)關(guān)表示同步關(guān)系和并發(fā)關(guān)系,排他網(wǎng)關(guān)表示選擇關(guān)系和跳轉(zhuǎn)關(guān)系。

        (5)Pools為池集合,池為應(yīng)急響應(yīng)任務(wù)的執(zhí)行部門。

        (6)N為所有節(jié)點(diǎn)集合,N=Activities∪Gateways∪Events。

        (7)F為順序流集合,F(xiàn)?N×N,?f∈F表示節(jié)點(diǎn)間的有向邊。

        (8)ρ:Activity→Role表示角色到活動(dòng)的映射關(guān)系,每一個(gè)應(yīng)急響應(yīng)任務(wù)都對(duì)應(yīng)一個(gè)角色。

        (9)π:Role→Pool表示角色到池的映射關(guān)系,所有角色都屬于各自對(duì)應(yīng)的部門。

        3 基本框架

        本文提出的應(yīng)急響應(yīng)過程BPMN模型自動(dòng)抽取方法的整體框架如圖1所示,具體包括數(shù)據(jù)預(yù)處理及標(biāo)注模塊、過程元素抽取模塊和BPMN模型生成模塊3部分。

        (1)數(shù)據(jù)預(yù)處理及標(biāo)注模塊 對(duì)應(yīng)急預(yù)案響應(yīng)過程文本進(jìn)行清洗、分句、分詞和詞性標(biāo)注,根據(jù)待抽取的響應(yīng)任務(wù)屬性對(duì)分詞結(jié)果進(jìn)行元素標(biāo)注,并為響應(yīng)任務(wù)對(duì)設(shè)置關(guān)系標(biāo)簽。

        (2)過程元素抽取模塊 首先構(gòu)建輸入特征向量,結(jié)合標(biāo)注數(shù)據(jù)訓(xùn)練Bi-LSTM-Attention-CRF網(wǎng)絡(luò)識(shí)別響應(yīng)任務(wù)屬性元素;然后基于屬性元素在短句中的組合關(guān)系,將識(shí)別后的元素拼接為響應(yīng)任務(wù);最后通過分析文本生成任務(wù)關(guān)系特征向量,結(jié)合標(biāo)注數(shù)據(jù)訓(xùn)練XGBoost[17]模型,完成對(duì)響應(yīng)任務(wù)關(guān)系的抽取。

        (3)BPMN模型生成模塊 首先補(bǔ)全無(wú)法直接識(shí)別的間接任務(wù)關(guān)系,然后拆解得到的響應(yīng)任務(wù)關(guān)系,根據(jù)網(wǎng)關(guān)與活動(dòng)的關(guān)系生成順序流;最后通過Activiti工具構(gòu)建BPMN文件,采用BPMN-JS解析文件實(shí)現(xiàn)BPMN模型的可視化。

        4 核心模塊與關(guān)鍵算法

        4.1 數(shù)據(jù)預(yù)處理及標(biāo)注模塊

        數(shù)據(jù)預(yù)處理及標(biāo)注模塊包括數(shù)據(jù)清洗、分句、分詞、詞性標(biāo)注、響應(yīng)任務(wù)屬性元素標(biāo)注和任務(wù)關(guān)系元素標(biāo)注。其中,數(shù)據(jù)清洗用于去除響應(yīng)過程文本中與過程描述不相關(guān)的信息,如去除“總則”、“組織體系”“預(yù)警報(bào)告”“善后處置和保障措施”等章節(jié)部分。在應(yīng)急預(yù)案文本中,長(zhǎng)句通常以句號(hào)和分號(hào)為分隔符,短句以逗號(hào)和冒號(hào)為分隔符,本文用jieba分詞和詞性標(biāo)注工具將文本字符串切割成詞組序列,并為每一個(gè)詞組分配合適的詞性標(biāo)記,以便后續(xù)元素識(shí)別等操作。

        響應(yīng)任務(wù)屬性元素標(biāo)注采用設(shè)計(jì)好的標(biāo)簽規(guī)則人工標(biāo)注詞組和BIO(begin,inside,outside)標(biāo)簽系統(tǒng),其中:D表示部門;R表示角色;T表示普通任務(wù)描述;S表示消息發(fā)送任務(wù)描述;E表示消息接受任務(wù)描述;B表示元素詞序列的開始;I表示元素詞序列剩下的成分;O表示與過程描述無(wú)關(guān)的詞組。

        表1所示為截取的應(yīng)急預(yù)案響應(yīng)過程文本的一個(gè)片段“省地質(zhì)災(zāi)害應(yīng)急指揮部派出指揮組”,第1行表示片段的分詞結(jié)果,第2行表示詞性標(biāo)注,第3行表示元素標(biāo)注結(jié)果,其中部門“省地質(zhì)災(zāi)害應(yīng)急指揮部”由1個(gè)“B-D”和3個(gè)“I-D”組成,普通任務(wù)“派出工作組”由1個(gè)“B-T”和1個(gè)“I-T”組成。共有順序、選擇、跳轉(zhuǎn)、并行和同步5種任務(wù)關(guān)系需要抽取,其標(biāo)簽表示為Y={順序:1,選擇:2,跳轉(zhuǎn):3,并行:4,同步:5,其他:-1}。例如句子“市減災(zāi)委向市政府、省民政廳報(bào)告”,經(jīng)過處理可以得到響應(yīng)任務(wù)T1和T2,分別為“市減災(zāi)委”,“報(bào)告”,發(fā)送任務(wù),“市政府”和“市減災(zāi)委”,“報(bào)告”,發(fā)送任務(wù),“省民政廳”。T1與T2的關(guān)系特征向量記作X1,其中T1與T2的并行關(guān)系作為特征X1的標(biāo)簽,表示為[X1:4]。

        表1 響應(yīng)任務(wù)屬性元素標(biāo)注示例

        4.2 過程元素抽取模塊

        (1)Bi-LSTM-Attention-CRF識(shí)別網(wǎng)絡(luò)

        本文在Bi-LSTM-CRF網(wǎng)絡(luò)基礎(chǔ)上添加前饋?zhàn)⒁饬C(jī)制來識(shí)別應(yīng)急響應(yīng)任務(wù)屬性元素。雖然Bi-LSTM可以對(duì)長(zhǎng)期序列建模,但是對(duì)詞序列靠前的時(shí)間步效果不理想,缺乏平等性,而注意力機(jī)制(attention)可以很好地捕捉長(zhǎng)距離依賴信息,Bi-LSTM還可以彌補(bǔ)注意力機(jī)制無(wú)法處理位置信息的缺點(diǎn)。

        (2)應(yīng)急響應(yīng)任務(wù)的生成

        短句的響應(yīng)任務(wù)屬性元素識(shí)別結(jié)果表示為s=DS,TDS,CDS,SDS,sens,其中:DS為部門列表;TDS為普通任務(wù)描述;CDS為接收任務(wù)描述;SDS為發(fā)送任務(wù)描述;sens為部門間的關(guān)系詞,如“向”“收到”等。算法1所示為響應(yīng)任務(wù)的生成過程,輸入為短句的響應(yīng)任務(wù)屬性元素識(shí)別結(jié)果集合S,輸出為響應(yīng)任務(wù)集合TASKs。將非空的任務(wù)描述記作taskInfo,寫入TASK.TaskDes,并根據(jù)taskInfo所屬任務(wù)描述類別確定任務(wù)類型taskType,寫入TASK.IntType(第2~3行)。如果部門列表有一個(gè)及以上部門,則將部門按照在部門間關(guān)系詞的前后分為任務(wù)執(zhí)行部門列表(forward_Ds)和交互部門列表(back_Ds),嵌套遍歷任務(wù)執(zhí)行部門列表和交互部門列表,寫入TASK.ExeDep和TASK.IntDep,將生成的TASK放入TASKs(第5~12行)。如果當(dāng)前部門列表為空,則向上檢索長(zhǎng)句的首個(gè)短句抽取出的響應(yīng)任務(wù)(iter),且其任務(wù)執(zhí)行部門不為空,用其ExeDep補(bǔ)全當(dāng)前響應(yīng)任務(wù),將生成的TASK放入TASKs(第13~16行)。本文規(guī)定缺失任務(wù)執(zhí)行部門時(shí),檢索當(dāng)前任務(wù)所在長(zhǎng)句的第1個(gè)短句抽取出的響應(yīng)任務(wù),以其任務(wù)執(zhí)行部門作為補(bǔ)全內(nèi)容,若長(zhǎng)句第1短句任務(wù)也缺失任務(wù)執(zhí)行部門,則繼續(xù)向上檢索,直到任務(wù)執(zhí)行部門不為空。例如短句“市委向省政府報(bào)告災(zāi)情,并開展搶險(xiǎn)救災(zāi)應(yīng)急處置工作”,生成的響應(yīng)任務(wù)為“市委”,“報(bào)告災(zāi)情”,“發(fā)送任務(wù)”,“省政府”,其中第2個(gè)短句缺失主語(yǔ),通過上述算法最終生成響應(yīng)任務(wù)“市委”,“開展搶險(xiǎn)救災(zāi)應(yīng)急處置工作”,“普通任務(wù)”,?。

        算法1響應(yīng)任務(wù)生成算法。

        輸入:響應(yīng)任務(wù)屬性元素識(shí)別結(jié)果集合S。

        輸出:響應(yīng)任務(wù)集合TASKs。

        1:For eachs∈S do

        2: If s.TDS≠? or s.CDS≠? or s.SDS≠? then

        3: TASK.TaskDes←taskInfo;TASK.IntType←taskType;

        4: End if

        5: If|s.DS|≥1 then

        7:For i=0 to|forward_Ds|do

        8: TASK.ExeDep←forward_Ds[i]

        9: For j=0 to |back_Ds|do

        10:TASK.IntDep←back_Ds[j]

        11: End for

        11: TASKs.appand(TASK)

        12: End for

        13:Else then

        14: TASK.ExeDep←iter.ExeDep

        15: TASKs.appand(TASK)

        16: End if

        17:End for

        18:return TASKs

        (3)任務(wù)關(guān)系特征表示及任務(wù)關(guān)系識(shí)別

        在生成應(yīng)急響應(yīng)任務(wù)后,根據(jù)任務(wù)關(guān)系在文本中的描述特征生成特征向量。本文通過分析響應(yīng)過程文本和過程信息抽取結(jié)果的特點(diǎn)選擇任務(wù)關(guān)系特征為X=id1,id2,P1,P2,LS,ALS,SS,ASS,TR,DR,SD,RD,ST,L,其中:id1為當(dāng)前任務(wù)ID;id2為對(duì)比任務(wù)id;P1為當(dāng)前任務(wù)屬性編號(hào);P2為對(duì)比任務(wù)屬性編號(hào);LS表示兩個(gè)任務(wù)是否從同一長(zhǎng)句抽取所得;ALS表示兩個(gè)任務(wù)是否從相鄰長(zhǎng)句抽取所得;SS表示兩個(gè)任務(wù)是否從同一短句抽取所得;ASS表示兩個(gè)任務(wù)是否從相鄰短句抽取所得;TR為任務(wù)的關(guān)系詞編號(hào);DR為部門的關(guān)系詞編號(hào);SD表示兩個(gè)任務(wù)是否包含同一發(fā)送部門;RD表示兩個(gè)任務(wù)是否包含同一接收部門;ST表示兩個(gè)任務(wù)的任務(wù)描述是否相同;L為兩個(gè)任務(wù)間的距離。

        在得到任務(wù)關(guān)系特征向量X后,將任務(wù)關(guān)系識(shí)別看作多分類問題。本文采用XGBoost模型識(shí)別任務(wù)關(guān)系,采用事先標(biāo)注的關(guān)系元素標(biāo)簽和特征集訓(xùn)練模型,保存訓(xùn)練效果最好的模型,并將其封裝為接口用于抽取任務(wù)關(guān)系。

        4.3 BPMN模型生成模塊

        (1)補(bǔ)全任務(wù)關(guān)系

        應(yīng)急預(yù)案響應(yīng)過程文本是一種自上而下描述應(yīng)急響應(yīng)活動(dòng)從開始到結(jié)束過程的文本,因此其本身具有任務(wù)發(fā)展順序性,且識(shí)別出的任務(wù)關(guān)系具有傳遞性。例如“指揮部啟動(dòng)應(yīng)急響應(yīng),市委、市政府開展搶險(xiǎn)救災(zāi)應(yīng)急處置工作”,生成3個(gè)響應(yīng)任務(wù)“指揮部啟動(dòng)應(yīng)急響應(yīng)”“市委開展搶險(xiǎn)救災(zāi)應(yīng)急處置工作”“市政府開展搶險(xiǎn)救災(zāi)應(yīng)急處置工作”,記為T1,T2,T3。通過上述任務(wù)關(guān)系識(shí)別可得T1,sequential,T2和T2,synchronous,T3,在此基礎(chǔ)上推理出T1與T3也存在順序關(guān)系,即T1,sequential,T3。對(duì)此類間接關(guān)系,需要對(duì)識(shí)別的任務(wù)關(guān)系進(jìn)行二次識(shí)別,重點(diǎn)在于拆解復(fù)雜任務(wù)關(guān)系和補(bǔ)全缺失成分的響應(yīng)任務(wù),采用簡(jiǎn)單順序任務(wù)關(guān)系表示所有復(fù)雜任務(wù)關(guān)系。

        算法2所示為任務(wù)關(guān)系的補(bǔ)全過程,輸入是通過關(guān)系識(shí)別得到的任務(wù)關(guān)系集合_TRs和響應(yīng)任務(wù)關(guān)系特征集合AI,輸出是關(guān)系補(bǔ)全后的完整的任務(wù)關(guān)系集合TRs。往前檢索得到與當(dāng)前任務(wù)為順序關(guān)系的_TRs下標(biāo)idx,以及并行、選擇或同步關(guān)系的_TRs下標(biāo)集合forward;往后檢索得到與當(dāng)前并行、選擇或同步關(guān)系的_TRs下標(biāo)集合back。首先遍歷back與idx,組成簡(jiǎn)單順序關(guān)系放入TRs,防止重復(fù)處理,故跳過back包含的任務(wù)(第2~4行)。將當(dāng)前任務(wù)關(guān)系放入TRs,若為跳轉(zhuǎn)關(guān)系,則獲取當(dāng)前任務(wù)所在長(zhǎng)句的最后一個(gè)任務(wù)下標(biāo)temp,將其與當(dāng)前任務(wù)組成簡(jiǎn)單順序關(guān)系放入TRs(第6~8行)。當(dāng)支線任務(wù)過多而其他分支任務(wù)過少時(shí),任務(wù)過少的分支會(huì)出現(xiàn)不連貫,即任務(wù)關(guān)系缺失成分TASK2,因此需要將所有支線的最后一個(gè)任務(wù)與后續(xù)任務(wù)組成簡(jiǎn)單順序關(guān)系放入TRs(第9~11行)。

        算法2補(bǔ)全任務(wù)關(guān)系。

        輸入:任務(wù)關(guān)系集合_TRs、響應(yīng)任務(wù)關(guān)系特征集合AI。

        輸出:完整的任務(wù)關(guān)系集合TRs。

        1:For i=0 to |_TRs| do

        2: If _TRs[i].Relation≠"順序" and _TRs[i].Relation≠"跳轉(zhuǎn)" then

        4: i←max(back)+1

        5: Else then

        7: If AI[temp][5]=1 and_TRs[i].Relation="跳轉(zhuǎn)" then

        9: Else if forward≠? and back=? then

        11: End if

        12: End if

        13:End for

        14:return TRs

        (2)生成順序流

        將任務(wù)關(guān)系補(bǔ)全后的響應(yīng)任務(wù)表示為BPMN中的活動(dòng),為生成BPMN模型,需要生成順序流,順序流表示為f=From,To,其中:From為開始節(jié)點(diǎn);To為結(jié)束節(jié)點(diǎn)。在生成活動(dòng)的基礎(chǔ)上,需要添加開始事件和結(jié)束事件,還需要添加網(wǎng)關(guān)例描述活動(dòng)關(guān)系,本文把將活動(dòng)與網(wǎng)關(guān)的關(guān)系分為3類,即活動(dòng)與活動(dòng)和網(wǎng)關(guān)與網(wǎng)關(guān)相連的一般關(guān)系、網(wǎng)關(guān)與多個(gè)活動(dòng)相連的發(fā)散關(guān)系,以及多個(gè)活動(dòng)與網(wǎng)關(guān)相連的收束關(guān)系。

        算法3所示為順序流的生成過程,其中輸入為任務(wù)關(guān)系集合_TRs和完整的任務(wù)關(guān)系集合TRs,輸出為順序流集合F。通過任務(wù)對(duì)照查找_TRs中任務(wù)原有的復(fù)雜關(guān)系來判斷網(wǎng)關(guān)類型gateway,向后檢索與當(dāng)前任務(wù)關(guān)系有相同TASK1的下標(biāo)列表back1,向前檢索與當(dāng)前任務(wù)關(guān)系有相同TASK1的下標(biāo)列表forward1和TASK2的下標(biāo)列表forward2。back1不為空表示存在發(fā)散關(guān)系,遍歷back1與事先判定的網(wǎng)關(guān)組成順序流,若順序流集合中最近添加的兩個(gè)順序流的結(jié)束節(jié)點(diǎn)相等且為網(wǎng)關(guān),則認(rèn)定為網(wǎng)關(guān)連接網(wǎng)關(guān)的情況,將網(wǎng)關(guān)與網(wǎng)關(guān)相連組成順序流,當(dāng)存在網(wǎng)關(guān)與活動(dòng)的收束關(guān)系時(shí),將網(wǎng)關(guān)與收束關(guān)系下的所有活動(dòng)組成順序流(第2~7行)。若back1和forward2均為空,則為一般關(guān)系,只需直接連接TASK1與TASK2組成順序流(第8~9行);若forward2不為空,則表示收束關(guān)系,將當(dāng)前任務(wù)和forward2列表中的任務(wù)與網(wǎng)關(guān)連接組成順序流(第10~13行)。

        算法3順序流生成。

        輸入:完整的任務(wù)關(guān)系集合TRs、任務(wù)關(guān)系集合_TRs。

        輸出:順序流集合F。

        1:For i=0 to |TRs| do

        2: If back1≠? then

        3: F.appand(TRs[back1].TASK1,gateway)

        4: If F[-1].To=F[-2].To and F[-1].To.type="網(wǎng)關(guān)" then

        5: F.appand(gateway, gateway*2);gateway←gateway*2;

        6: End if

        7: F.appand(gateway,TRs[forward1].TASK2)

        8: Else if back1=? and forward2=? then

        9: F.appand(TRs[i].TASK1,TRs[i].TASK2)

        10: Else if forward2≠? then

        11: F.appand(TRs[i].TASK1,gateway)

        12: F.appand(TRs[forward2].TASK1,gateway)

        13: End if

        14:End for

        15:return F

        (3)模型構(gòu)建及可視化

        本文采用Activiti工作流動(dòng)態(tài)生成BPMN文件,通過讀取所生成的順序流集合,生成BPMN模型。BPMN-JS是一個(gè)BPMN 2.0渲染工具包和Web建模器,其可以將圖表嵌入各類Web應(yīng)用程序并在瀏覽器中展示,本文在前端接收后端Activiti生成的BPMN模型,采用BPMN-JS解析加載模型文件并將其可視化。

        4.4 樣例分析

        以某應(yīng)急預(yù)案響應(yīng)過程文本中Ⅰ級(jí)響應(yīng)部分為例,給出應(yīng)急響應(yīng)過程BPMN模型的抽取過程。圖3所示為應(yīng)急預(yù)案響應(yīng)過程文本實(shí)例,圖中包括7個(gè)長(zhǎng)句和17個(gè)短句,其中15個(gè)短句與過程描述相關(guān),2個(gè)短句與過程描述無(wú)關(guān),共涉及10個(gè)不同主體部門。

        表2所示為響應(yīng)任務(wù)抽取結(jié)果,從文本中共抽取19個(gè)響應(yīng)任務(wù),包括12個(gè)普通任務(wù)和7個(gè)發(fā)送任務(wù)。表3所示為任務(wù)關(guān)系抽取結(jié)果,包括14個(gè)順序關(guān)系、3個(gè)同步關(guān)系、2個(gè)并行關(guān)系、1個(gè)選擇關(guān)系和1個(gè)跳轉(zhuǎn)關(guān)系。

        表2 響應(yīng)任務(wù)抽取結(jié)果

        表3 任務(wù)關(guān)系抽取結(jié)果

        根據(jù)抽取結(jié)果補(bǔ)全所有關(guān)系,將同步、并行、選擇、跳轉(zhuǎn)關(guān)系全部轉(zhuǎn)換為簡(jiǎn)單順序關(guān)系,例如并行關(guān)系T16,parallel,T17結(jié)合前面順序關(guān)系T15,sequential,T16得到T15,sequential,T16和T15,sequential,T17,插入網(wǎng)關(guān)得到T15,sequential,ParallelGateway,ParallelGateway,sequential,T16,ParallelGateway,sequential,T17,最終生成的應(yīng)急響應(yīng)過程BPMN模型如圖4所示。

        5 實(shí)驗(yàn)評(píng)價(jià)和工具展示

        本文使用的數(shù)據(jù)集是從各省市區(qū)的政務(wù)網(wǎng)站搜集整理的關(guān)于災(zāi)害的應(yīng)急預(yù)案文本,共計(jì)108個(gè)應(yīng)急預(yù)案,包括防汛抗災(zāi)、地質(zhì)災(zāi)害和自然災(zāi)害3種類型。每類應(yīng)急預(yù)案分為省級(jí)預(yù)案、市級(jí)預(yù)案和區(qū)級(jí)預(yù)案3個(gè)層次,各層的預(yù)案根據(jù)響應(yīng)級(jí)別分為一級(jí)響應(yīng)、二級(jí)響應(yīng)、三級(jí)響應(yīng)和四級(jí)響應(yīng)。將應(yīng)急預(yù)案按照響應(yīng)級(jí)別進(jìn)行拆分,得到96個(gè)防汛抗災(zāi)類的響應(yīng)過程子文本、144個(gè)地質(zhì)災(zāi)害類的響應(yīng)過程子文本和192個(gè)自然災(zāi)害類的響應(yīng)過程子文本。

        5.1 響應(yīng)任務(wù)元素識(shí)別實(shí)驗(yàn)評(píng)價(jià)

        訓(xùn)練Bi-LSTM-Attention-CRF網(wǎng)絡(luò)的環(huán)境配置為python3.6,tensorflow1.13.1。具體參數(shù)配置如表4所示,其中:emb_dim為詞向量維度;hidden_size為Bi-LSTM隱層維度;batch_size為批次大小;learning_rate為初始學(xué)習(xí)率;optimizer表示所選擇的優(yōu)化方法,本文采用隨機(jī)梯度下降法(Stochastic Gradient Descent, SGD);epoch為訓(xùn)練輪數(shù)。實(shí)驗(yàn)的訓(xùn)練集、驗(yàn)證集和測(cè)試集劃分比例為8∶1∶1。

        表4 過程元素識(shí)別網(wǎng)絡(luò)參數(shù)設(shè)置

        實(shí)驗(yàn)采用的評(píng)價(jià)標(biāo)準(zhǔn)為精確率、召回率和F1值。實(shí)驗(yàn)進(jìn)行3種對(duì)比,首先在詞向量表示中比較了隨機(jī)生成與FastText生成兩種方式,然后在構(gòu)建輸入特征向量中比較了隨機(jī)詞向量(random)、隨機(jī)詞向量與詞性編碼拼接(random+詞性)以及FastText詞向量與詞性編碼拼接(FastText+詞性)3種方式,最后在元素識(shí)別網(wǎng)絡(luò)中比較了Bi-LSTM-CRF,Bi-GRU-CRF,Bi-GRU-Attention-CRF和Bi-LSTM-Attention-CRF 4種神經(jīng)網(wǎng)絡(luò)的識(shí)別效果。表5所示為測(cè)試集中各標(biāo)簽的數(shù)量。

        表5 測(cè)試集各標(biāo)簽數(shù)量

        表6 過程元素識(shí)別精確率

        續(xù)表6

        表6所示為不同網(wǎng)絡(luò)下所有標(biāo)簽的識(shí)別精確率,可見詞向量與詞性拼接的向量特征明顯優(yōu)于詞向量,同時(shí)對(duì)比LSTM與門控循環(huán)單元(Gated Recurrent Unit, GRU)[20]算法可見兩者相差甚微,對(duì)比FastText生成詞向量與隨機(jī)生成詞向量可見FastText優(yōu)勢(shì)明顯。本文采用的Bi-LSTM-Attention-CRF網(wǎng)絡(luò)在大部分標(biāo)簽中的識(shí)別精確率較高,其中對(duì)標(biāo)簽B-E和I-E的識(shí)別結(jié)果異常,分析原因是標(biāo)簽數(shù)量過低導(dǎo)致。

        表7所示為過程元素識(shí)別的召回率,可見FastText與詞性編碼拼接作為輸入特征向量的Bi-LSTM-Attention-CRF網(wǎng)絡(luò)在大部分標(biāo)簽下的召回率均較好,與精確率類似。B-E和I-E的識(shí)別結(jié)果異常,其他過程元素識(shí)別召回率和精確率基本相同。

        表7 過程元素識(shí)別召回率

        表8所示為過程元素識(shí)別的F1值,其中普通任務(wù)描述(B-T和I-T)和部門(B-D和I-D)識(shí)別結(jié)果高于其他過程元素的識(shí)別結(jié)果,原因是這兩類元素在數(shù)據(jù)集中數(shù)量較多,有更多的數(shù)據(jù)用于訓(xùn)練模型。

        表8 過程元素識(shí)別F1值

        續(xù)表8

        5.2 任務(wù)關(guān)系識(shí)別實(shí)驗(yàn)評(píng)價(jià)

        任務(wù)關(guān)系識(shí)別采用的是XGBoost模型,具體參數(shù)如表9所示。表中:learning_rate為初始學(xué)習(xí)率;max_depth為樹的最大深度;n_estimator為最大迭代數(shù);objective表示學(xué)習(xí)目標(biāo)參數(shù)為多分類問題;num_class為類別個(gè)數(shù);eta為更新過程中的收縮步長(zhǎng),用于防止過擬合。實(shí)驗(yàn)訓(xùn)練集和測(cè)試集的劃分比例為7∶3。

        實(shí)驗(yàn)采用的評(píng)價(jià)標(biāo)準(zhǔn)為精確率、召回率和F1值,將XGBoost與隨機(jī)森林(random forest)和SVM模型進(jìn)行比較。由表10可知,XGBoost在5種標(biāo)簽下的效果均優(yōu)于其他兩種算法,其中跳轉(zhuǎn)關(guān)系的準(zhǔn)確率、召回率和F1值為1.0,分析原因?yàn)樘D(zhuǎn)關(guān)系界限明確且樣本過少,所以出現(xiàn)極端情況,僅憑關(guān)鍵詞即可判定其為跳轉(zhuǎn)關(guān)系。

        表9 任務(wù)關(guān)系識(shí)別參數(shù)設(shè)置

        表10 任務(wù)關(guān)系識(shí)別結(jié)果

        5.3 應(yīng)急響應(yīng)過程BPMN模型自動(dòng)抽取系統(tǒng)原型

        本文基于JavaWeb開發(fā)了應(yīng)急響應(yīng)過程BPMN模型自動(dòng)抽取原型系統(tǒng)。用戶在文本輸入位置選擇事先準(zhǔn)備好的應(yīng)急預(yù)案響應(yīng)過程文本或手動(dòng)輸入文本信息,點(diǎn)擊提交后端服務(wù)器,將有一個(gè)上傳成功或失敗的反饋。后端服務(wù)器對(duì)文本進(jìn)行解析,按系統(tǒng)框架圖的順序依次執(zhí)行,直至生成BPMN模型和響應(yīng)任務(wù)列表,然后反饋給前端并進(jìn)行展示。

        應(yīng)急響應(yīng)過程BPMN模型自動(dòng)抽取系統(tǒng)界面如圖5所示,分為3個(gè)展示模塊,左上角為文本輸入模塊,此處需要用戶上傳文件或者手動(dòng)輸入響應(yīng)過程文本。右上角為響應(yīng)任務(wù)抽取結(jié)果展示界面。下面是BPMN模型展示模塊,提供放大縮小功能,或者快捷鍵使用“Ctrl+”或“Ctrl-”控制模型大小,除此之外還提供模型下載和保存功能。

        6 結(jié)束語(yǔ)

        本文以應(yīng)急預(yù)案響應(yīng)過程文本為數(shù)據(jù)源,自動(dòng)抽取應(yīng)急響應(yīng)過程BPMN模型。詳細(xì)給出了響應(yīng)任務(wù)、任務(wù)關(guān)系和應(yīng)急響應(yīng)流程BPMN的定義,根據(jù)定義將抽取過程劃分為3個(gè)階段,通過提高每一階段的性能來提高整體抽取效果;在過程元素識(shí)別階段,采用深度學(xué)習(xí)和機(jī)器學(xué)習(xí)的方法降低對(duì)文本句式結(jié)構(gòu)的嚴(yán)重依賴,使其能夠適應(yīng)更加靈活的響應(yīng)過程文本;不但在過程元素抽取上提高抽取效率,而且基于抽取的響應(yīng)任務(wù)和任務(wù)關(guān)系,通過補(bǔ)全簡(jiǎn)單任務(wù)關(guān)系并生成網(wǎng)關(guān)和順序流等步驟,將抽取結(jié)果轉(zhuǎn)化為BPMN模型元素,并將完整的BPMN模型可視化。

        由于應(yīng)急預(yù)案文本數(shù)據(jù)種類繁多,導(dǎo)致其句子結(jié)構(gòu)多樣,句式不統(tǒng)一,并非所有文本都能清晰且明確地描述響應(yīng)過程的邏輯關(guān)系,對(duì)補(bǔ)全任務(wù)關(guān)系提出了挑戰(zhàn)。本文方法針對(duì)邏輯清晰的過程描述文本執(zhí)行抽取任務(wù),文本描述在內(nèi)容上具有明顯的過程性,部門間的分工協(xié)作明確,不存在歧義和表達(dá)不準(zhǔn)確的問題,結(jié)構(gòu)上各角色之間的指代關(guān)系明顯,而對(duì)于結(jié)構(gòu)復(fù)雜、指代關(guān)系不明確的文本,本文方法不能良好地適配。因此,下一步工作將針對(duì)句式復(fù)雜的文本制定關(guān)系抽取策略,以得到更加合理且符合認(rèn)知的任務(wù)關(guān)系。

        猜你喜歡
        短句網(wǎng)關(guān)應(yīng)急
        多維深入復(fù)盤 促進(jìn)應(yīng)急搶險(xiǎn)
        短句,讓表達(dá)更豐富
        十幾歲(2022年34期)2022-12-06 08:06:24
        基于改進(jìn)RPS技術(shù)的IPSEC VPN網(wǎng)關(guān)設(shè)計(jì)
        完善應(yīng)急指揮機(jī)制融嵌應(yīng)急準(zhǔn)備、響應(yīng)、處置全周期
        短句—副詞+謂語(yǔ)
        短句—謂語(yǔ)+賓語(yǔ)
        應(yīng)急管理部6個(gè)“怎么看”
        國(guó)際新應(yīng)急標(biāo)準(zhǔn)《核或輻射應(yīng)急的準(zhǔn)備與響應(yīng)》的釋疑
        LTE Small Cell網(wǎng)關(guān)及虛擬網(wǎng)關(guān)技術(shù)研究
        應(yīng)對(duì)氣候變化需要打通“網(wǎng)關(guān)”
        国产伦精品一区二区三区| 白白色最新福利视频二| 中国一级特黄真人片久久| 性高湖久久久久久久久| 国内免费AV网站在线观看| 色人阁第四色视频合集网| 久久精品中文字幕有码| 高h纯肉无码视频在线观看| 欧美老妇人与禽交| 国产女主播强伦视频网站| 护士人妻hd中文字幕| 人妻无码中文字幕| 久久久久久自慰出白浆| 精品人妻少妇一区二区三区不卡| 囯产精品无码一区二区三区| 国产一区二区在线观看av | 小雪好紧好滑好湿好爽视频| 亚洲午夜福利在线观看| 人体内射精一区二区三区| 最新永久免费AV网站| 99久久国产精品免费热| 国产综合在线观看| 首页动漫亚洲欧美日韩| 国产精品久久婷婷婷婷| 中文字幕日本在线乱码| 中文字幕人妻熟女人妻| 毛片免费全部无码播放| 精品日产一区2区三区| 亚洲最近中文字幕在线| 人人妻人人妻人人片av| 一个人免费观看在线视频播放| 日本女优久久精品观看| 亚洲女同一区二区| 国产亚洲日韩欧美久久一区二区| 色青青女同性恋视频日本熟女 | 亚洲精品一品区二品区三区| 成人久久久久久久久久久| 亚洲嫩模高清在线视频| 成人做爰黄片视频蘑菇视频| 人人超碰人人爱超碰国产| 制服丝袜人妻中文字幕在线|