亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        HAZOP知識(shí)圖譜構(gòu)建方法

        2021-08-21 07:34:20李芳國(guó)張貝克高東
        化工進(jìn)展 2021年8期
        關(guān)鍵詞:分析信息模型

        李芳國(guó),張貝克,高東

        (北京化工大學(xué)信息科學(xué)與技術(shù)學(xué)院,北京 100029)

        危險(xiǎn)與可操作性分析(HAZOP)是一種廣泛應(yīng)用于石油化工行業(yè)的危險(xiǎn)分析方法。該方法通過(guò)專(zhuān)家小組以“頭腦風(fēng)暴”形式,查明石油化工生產(chǎn)系統(tǒng)中潛在危險(xiǎn)的偏差,針對(duì)這些偏差,找出原因,分析后果,并提出相應(yīng)的解決方案與措施,最終將討論的結(jié)果記錄在HAZOP分析表中[1-2]。然而HAZOP分析是一個(gè)耗時(shí)、昂貴且以人為中心的分析過(guò)程,HAZOP分析過(guò)程本質(zhì)上是主觀的,依賴于專(zhuān)家小組的專(zhuān)業(yè)經(jīng)驗(yàn)與創(chuàng)造力。針對(duì)HAZOP分析方法存在耗時(shí)、昂貴、依賴專(zhuān)家經(jīng)驗(yàn)、完備性等問(wèn)題,國(guó)內(nèi)外學(xué)者先后開(kāi)展了自動(dòng)化與半自動(dòng)化HAZOP分析以及相關(guān)改進(jìn)HAZOP研究[3-4],借助計(jì)算機(jī)來(lái)輔助或代替人工進(jìn)行HAZOP分析。這些研究一定程度上提高了HAZOP分析的效率以及HAZOP分析結(jié)果的完備性與準(zhǔn)確性[5]。

        隨著HAZOP分析項(xiàng)目的開(kāi)展,大量HAZOP分析文檔以紙質(zhì)文件形式留存下來(lái),無(wú)論是人工HAZOP分析還是基于計(jì)算機(jī)的半自動(dòng)化或自動(dòng)化HAZOP分析方法都沒(méi)有將這些HAZOP信息進(jìn)行合理的利用,實(shí)現(xiàn)共享與復(fù)用。

        基于人工的HAZOP分析,在開(kāi)展不同HAZOP分析項(xiàng)目時(shí),不同分析團(tuán)隊(duì)會(huì)根據(jù)自己的專(zhuān)業(yè)經(jīng)驗(yàn)以及標(biāo)準(zhǔn)進(jìn)行HAZOP分析,最終形成具有各自標(biāo)準(zhǔn)的紙質(zhì)HAZOP分析文檔。基于人工的HAZOP分析過(guò)程并沒(méi)有借鑒或利用已有的HAZOP信息且以紙質(zhì)文檔的形式存儲(chǔ)HAZOP分析結(jié)果,不利于不同項(xiàng)目、不同團(tuán)隊(duì)在設(shè)計(jì)、施工、維護(hù)等各個(gè)階段的信息共享與復(fù)用。

        基于計(jì)算機(jī)的HAZOP分析方法,利用現(xiàn)有的HAZOP信息或者專(zhuān)家經(jīng)驗(yàn)等淺層知識(shí)建立專(zhuān)家知識(shí)庫(kù),從而減少HAZOP分析過(guò)程中的重復(fù)工作,以實(shí)現(xiàn)半自動(dòng)化或自動(dòng)化HAZOP分析,這種方法一定程度上利用了現(xiàn)有HAZOP信息,然而該方法形成的專(zhuān)家知識(shí)庫(kù)一般只是將HAZOP信息簡(jiǎn)單存儲(chǔ)在數(shù)據(jù)庫(kù)中,沒(méi)有建立起知識(shí)之間的聯(lián)系且采用的標(biāo)準(zhǔn)不一,難以在不同項(xiàng)目、不同團(tuán)隊(duì)中進(jìn)行復(fù)用。因此,如何按照現(xiàn)有標(biāo)準(zhǔn)表示現(xiàn)有HAZOP信息、實(shí)現(xiàn)HAZOP信息的共享與復(fù)用成為一個(gè)重要的研究課題。

        知識(shí)圖譜起源于20世紀(jì)60年代J.R.Quillian提出的的語(yǔ)義網(wǎng)絡(luò),90年代“知識(shí)本體”被引入用于知識(shí)表示[6-7]。隨著互聯(lián)網(wǎng)信息數(shù)據(jù)的增長(zhǎng),Google于2012年5月17日提出了知識(shí)圖譜的概念[8]。知識(shí)圖譜是一種揭示知識(shí)之間關(guān)系的語(yǔ)義網(wǎng)絡(luò),以結(jié)構(gòu)化的形式描述現(xiàn)實(shí)世界的概念、事物之間的關(guān)系[9],它將信息表達(dá)成更易于理解的形式,能夠更好地組織、管理和理解信息,使得知識(shí)更加易于共享與復(fù)用。

        知識(shí)圖譜語(yǔ)義表達(dá)能力豐富,采用實(shí)體-關(guān)系-實(shí)體的描述形式,使得不同來(lái)源、不同類(lèi)型的知識(shí)都能以統(tǒng)一的形式表達(dá)與融合,易于計(jì)算機(jī)解析處理。目前,知識(shí)圖譜主要分為通用知識(shí)圖譜和行業(yè)知識(shí)圖譜。在通用領(lǐng)域,德國(guó)萊比錫大學(xué)和曼海姆大學(xué)的科研人員從多種語(yǔ)言的維基百科中抽取結(jié)構(gòu)化信息,構(gòu)建了百科類(lèi)知識(shí)圖譜DBpedia[10]。復(fù)旦大學(xué)知識(shí)工廠實(shí)驗(yàn)室通過(guò)抽取、清洗、融合中文百科知識(shí)中的文本數(shù)據(jù),構(gòu)建了CN-DBpedia中文通用知識(shí)圖譜[11],供機(jī)器和人使用。除此之外,百度、阿里等國(guó)內(nèi)互聯(lián)網(wǎng)公司也紛紛構(gòu)建自己的通用知識(shí)圖譜,這些通用知識(shí)圖譜的出現(xiàn),提升了搜索引擎的搜索速度以及搜索質(zhì)量,并廣泛應(yīng)用于問(wèn)答和聊天機(jī)器人領(lǐng)域。在金融、醫(yī)療、制造業(yè)[12-14]等行業(yè)領(lǐng)域,各行各業(yè)基于本行業(yè)知識(shí)構(gòu)建了行業(yè)知識(shí)圖譜,提高了專(zhuān)業(yè)知識(shí)的利用能力,打破了行業(yè)內(nèi)信息共享與復(fù)用的壁壘。

        在化工安全領(lǐng)域,Mao等[15]將知識(shí)圖譜應(yīng)用于化工過(guò)程安全,提出了一個(gè)包括本體定義、數(shù)據(jù)采集、導(dǎo)入和存儲(chǔ)的綜合半自動(dòng)構(gòu)建框架,并以延遲焦化工藝為例,通過(guò)構(gòu)建知識(shí)圖譜有效提高了工藝安全。Zheng等[16]構(gòu)建了危險(xiǎn)化學(xué)品管理知識(shí)圖譜來(lái)克服分散數(shù)據(jù)庫(kù)之間的信息孤立問(wèn)題,從而改善危險(xiǎn)化學(xué)品管理問(wèn)題,便于企業(yè)掌握危險(xiǎn)化學(xué)品生產(chǎn)、運(yùn)輸、儲(chǔ)存等全生命周期問(wèn)題。知識(shí)圖譜的應(yīng)用有利于化工安全專(zhuān)業(yè)知識(shí)的共享與復(fù)用,為化工安全生產(chǎn)、管理提供了一定的助力。

        目前,在化工安全分析領(lǐng)域,對(duì)于HAZOP信息的共享與復(fù)用的相關(guān)研究主要集中于利用HAZOP信息建立專(zhuān)家知識(shí)庫(kù)來(lái)實(shí)現(xiàn)信息復(fù)用[17-18]以及基于ISO 15926標(biāo)準(zhǔn)的HAZOP信息標(biāo)準(zhǔn)化研究實(shí)現(xiàn)信息共享[19-21],基于規(guī)則的淺層知識(shí)專(zhuān)家數(shù)據(jù)庫(kù)沒(méi)有研究HAZOP信息之間的關(guān)系,同時(shí)專(zhuān)家數(shù)據(jù)庫(kù)一般只供特有的系統(tǒng)使用,不利于HAZOP信息的共享。基于ISO 15926標(biāo)準(zhǔn)的HAZOP信息標(biāo)準(zhǔn)化研究,其主要工作是基于ISO 15926標(biāo)準(zhǔn)定義HAZOP中的元素,如行為、事件、原因、后果等,從而建立HAZOP信息標(biāo)準(zhǔn)化模型實(shí)現(xiàn)HAZOP信息的共享,這種HAZOP信息標(biāo)準(zhǔn)化過(guò)程依賴手工建模,建模過(guò)程復(fù)雜,同時(shí)建立的標(biāo)準(zhǔn)化模型需結(jié)合圖形化工具才能應(yīng)用到實(shí)際HAZOP分析項(xiàng)目中,不利于HAZOP信息的復(fù)用。綜合來(lái)看,這兩種研究雖然都使得HAZOP信息能夠在一定程度上進(jìn)行共享與復(fù)用,但也各有一定的局限性。

        為了解決HAZOP信息難以共享、復(fù)用問(wèn)題,本文提出結(jié)合自頂向下和自底向上的HAZOP知識(shí)圖譜半自動(dòng)構(gòu)建方法,以結(jié)構(gòu)化的形式統(tǒng)一描述HAZOP信息以及信息之間的關(guān)系,便于計(jì)算機(jī)處理,并以圖形式存儲(chǔ)展示,從而實(shí)現(xiàn)HAZOP信息的有效共享與復(fù)用。本文介紹了HAZOP信息復(fù)用與共享存在的問(wèn)題以及當(dāng)前知識(shí)圖譜的發(fā)展?fàn)顩r,設(shè)計(jì)了HAZOP知識(shí)圖譜的構(gòu)建流程,分析了基于危險(xiǎn)事件的HAZOP信息的元素組成并完成了HAZOP知識(shí)圖譜模式層的構(gòu)建,然后介紹了知識(shí)圖譜數(shù)據(jù)層的構(gòu)建流程并完成HAZOP數(shù)據(jù)標(biāo)注,命名實(shí)體識(shí)別模型的構(gòu)建、訓(xùn)練以及HAZOP知識(shí)圖譜數(shù)據(jù)層的構(gòu)建,將構(gòu)建方法應(yīng)用于某煤炭間接液化項(xiàng)目油品合成裝置HAZOP分析報(bào)告,構(gòu)建了該項(xiàng)目知識(shí)圖譜,驗(yàn)證了方法的有效性,展示了知識(shí)圖譜的應(yīng)用效果。

        1 HAZOP知識(shí)圖譜的構(gòu)建流程

        1.1 HAZOP知識(shí)圖譜

        知識(shí)圖譜本質(zhì)上是由實(shí)體-關(guān)系-實(shí)體組成的語(yǔ)義知識(shí)庫(kù),通過(guò)有向圖的形式描述現(xiàn)實(shí)世界中的概念以及概念之間的關(guān)系。無(wú)論是人工HAZOP還是自動(dòng)化與半自動(dòng)化HAZOP方法,其實(shí)質(zhì)都是通過(guò)“偏差”來(lái)展開(kāi)分析,即通過(guò)找到系統(tǒng)中所有偏離正常狀態(tài)的異常狀態(tài),找到所有可能的導(dǎo)致其的原因以及這些異常狀態(tài)會(huì)導(dǎo)致的不利后果,并提出相應(yīng)防護(hù)措施與建議,最后記錄在HAZOP分析文檔中。HAZOP信息中包含了大量的由原因、偏差、后果、防護(hù)措施及建議組成的危險(xiǎn)事件描述。HAZOP知識(shí)圖譜以危險(xiǎn)事件的角度解析HAZOP信息,將HAZOP信息以實(shí)體-關(guān)系-實(shí)體的結(jié)構(gòu)連接成有向網(wǎng)絡(luò)圖,從而直觀有效地展示HAZOP信息之間的關(guān)系以及系統(tǒng)中潛在危險(xiǎn)的傳播路徑,便于HAZOP信息共享與復(fù)用。

        1.2 構(gòu)建流程

        通用知識(shí)圖譜由于其數(shù)據(jù)大多來(lái)源于網(wǎng)絡(luò)、百科全書(shū)等,數(shù)據(jù)量大,大多采用自底向上的方式構(gòu)建;行業(yè)知識(shí)圖譜由于其數(shù)據(jù)具有一定的領(lǐng)域性,容易被專(zhuān)家提取出來(lái),一般采用自頂向下的方式構(gòu)建。HAZOP信息中蘊(yùn)含大量化工安全領(lǐng)域的專(zhuān)業(yè)名詞,具有一定的領(lǐng)域性,然而由于標(biāo)準(zhǔn)不一,描述不統(tǒng)一,HAZOP信息中又有大量的不規(guī)范數(shù)據(jù)。因此,HAZOP知識(shí)圖譜采用自頂向下和自底向上相結(jié)合的構(gòu)建方法,具體流程如圖1所示。采用自頂向下的方法構(gòu)建知識(shí)圖譜的模式層,首先進(jìn)行本體體系劃分,搭建知識(shí)圖譜的框架,然后將劃分好的類(lèi)別體系進(jìn)行概念、類(lèi)屬關(guān)系定義,定義HAZOP信息中每個(gè)類(lèi)的屬性、結(jié)構(gòu)等,從而形成定義準(zhǔn)確、結(jié)構(gòu)清晰的HAZOP概念框架。自底向上構(gòu)建知識(shí)圖譜的數(shù)據(jù)層,針對(duì)已有的HAZOP分析文檔,設(shè)計(jì)數(shù)據(jù)標(biāo)注策略以滿足后續(xù)流程需求,基于深度學(xué)習(xí)構(gòu)建命名實(shí)體識(shí)別模型,利用已標(biāo)注數(shù)據(jù)完成模型的訓(xùn)練,進(jìn)而實(shí)現(xiàn)實(shí)體抽取,將抽取出來(lái)的實(shí)體映射到之前構(gòu)建好的HAZOP知識(shí)本體概念節(jié)點(diǎn)當(dāng)中,從而建立起實(shí)體之間關(guān)系關(guān)聯(lián),實(shí)現(xiàn)模式層與數(shù)據(jù)層之間的映射,最后利用圖數(shù)據(jù)庫(kù),將數(shù)據(jù)進(jìn)行存儲(chǔ),實(shí)現(xiàn)HAZOP知識(shí)圖譜的構(gòu)建。

        圖1 HAZOP知識(shí)圖譜構(gòu)建流程

        2 模式層構(gòu)建

        2.1 基于危險(xiǎn)事件的HAZOP元素解析

        HAZOP分析方法的主要目標(biāo)就是識(shí)別化工系統(tǒng)中的潛在危險(xiǎn)因素,即“偏差”,找出造成此偏差的原因以及后果,并提出相應(yīng)防護(hù)措施及建議,從而提高化工系統(tǒng)的安全性。因此,HAZOP信息就是由大量危險(xiǎn)事件構(gòu)成的,即危險(xiǎn)事件是構(gòu)成HAZOP信息的基本結(jié)構(gòu)。一般危險(xiǎn)事件的基本元素包括原因、中間事件、后果、防護(hù)措施、建議等。國(guó)際標(biāo)準(zhǔn)IEC 61882詳細(xì)規(guī)定了HAZOP分析的基本定義、基本原理、分析步驟、流程等[21]。由于HAZOP分析的特性,結(jié)合國(guó)際標(biāo)準(zhǔn)IEC 61882,HAZOP信息中危險(xiǎn)事件的元素包括偏差、初始原因、中間事件、后果、保護(hù)措施、建議。HAZOP信息中各元素的定義如下。

        (1)危險(xiǎn)事件 構(gòu)成HAZOP信息的基本結(jié)構(gòu),由偏差、初始原因、中間事件、后果、防護(hù)措施、建議等構(gòu)成。HAZOP信息由一個(gè)或者多個(gè)危險(xiǎn)事件構(gòu)成。

        (2)偏差 引導(dǎo)詞結(jié)合工藝參數(shù)構(gòu)成。國(guó)際標(biāo)準(zhǔn)IEC 61882規(guī)定了常見(jiàn)的引導(dǎo)詞如無(wú)、多、少、反向、早、晚等。工藝參數(shù)主要包括溫度、壓力、液位、流量、反應(yīng)速率等。偏差是識(shí)別危險(xiǎn)事件的起點(diǎn),HAZOP分析的出發(fā)點(diǎn)。

        (3)初始原因 引起偏差發(fā)生的原因。初始原因可以是容器失效、設(shè)備故障、人員失誤、外部事件、天氣變化、洪水、地震等。

        (4)中間事件 由偏差引起的系統(tǒng)或者設(shè)備的某些不正常變化。在一個(gè)危險(xiǎn)事件中,中間事件可以是一個(gè)或者多個(gè),也可能不存在。例如反應(yīng)器入口流量閥人工誤操作,閥門(mén)開(kāi)度減小,反應(yīng)器液位降低,反應(yīng)器溫度升高,反應(yīng)器爆炸。反應(yīng)器液位降低、溫度升高都是中間事件。

        (5)后果 偏差經(jīng)過(guò)中間事件后或直接導(dǎo)致的不利結(jié)果。如發(fā)生火災(zāi)、人員死亡、有害物質(zhì)釋放等。同一個(gè)偏差的不同原因可能導(dǎo)致不同的后果。

        (6)防護(hù)措施 現(xiàn)有的調(diào)節(jié)控制系統(tǒng)或設(shè)備,用以避免或減輕偏差發(fā)生時(shí)所造成的后果。如報(bào)警、聯(lián)鎖等。

        (7)建議 修改系統(tǒng)設(shè)計(jì)、操作規(guī)程或進(jìn)一步進(jìn)行分析研究的建議。如增加壓力報(bào)警等。

        2.2 HAZOP本體規(guī)則設(shè)計(jì)

        本體規(guī)則是構(gòu)建HAZOP知識(shí)圖譜模式層的核心工作。HAZOP本體的構(gòu)建主要有概念類(lèi)別層次定義、概念屬性關(guān)系定義等步驟。類(lèi)是本體的基本概念,由上述基于危險(xiǎn)事件的HAZOP元素分析可知,HAZOP本體H由一個(gè)或多個(gè)危險(xiǎn)事件類(lèi)E構(gòu)成,因此,HAZOP本體的構(gòu)建主要是針對(duì)危險(xiǎn)事件進(jìn)行類(lèi)別劃分及其相關(guān)屬性的定義。一個(gè)完整的危險(xiǎn)事件類(lèi)E包括初始原因類(lèi)R、偏差類(lèi)P、中間事件類(lèi)M、后果類(lèi)C、防護(hù)措施類(lèi)A、建議類(lèi)S六要素。

        2.2.1 概念類(lèi)別劃分與定義

        HAZOP本體概念類(lèi)別劃分主要是對(duì)危險(xiǎn)事件類(lèi)進(jìn)行類(lèi)別劃分與定義。危險(xiǎn)事件類(lèi)E是組成HAZOP本體H的基本單元,按照其內(nèi)部元素構(gòu)成可分為以下幾類(lèi)。

        (1)單串型危險(xiǎn)事件Ec這類(lèi)危險(xiǎn)事件構(gòu)成比較簡(jiǎn)單,由單個(gè)原因引發(fā),經(jīng)j個(gè)中間事件傳播,導(dǎo)致同一后果,其結(jié)構(gòu)信息可描述為式(1)。

        (2)反向樹(shù)型危險(xiǎn)事件Etr這類(lèi)危險(xiǎn)事件指由i個(gè)原因引發(fā),經(jīng)j個(gè)中間事件傳播,導(dǎo)致同一后果的危險(xiǎn)事件,其結(jié)構(gòu)信息可描述為式(2)。

        (3)正向樹(shù)型危險(xiǎn)事件Etl這類(lèi)危險(xiǎn)事件指由同一原因引發(fā),經(jīng)j個(gè)中間事件傳播,導(dǎo)致k個(gè)后果的危險(xiǎn)事件,其結(jié)構(gòu)信息可描述為式(3)。

        (4)領(lǐng)結(jié)樹(shù)型危險(xiǎn)事件Ebt這類(lèi)危險(xiǎn)事件構(gòu)成復(fù)雜,由i個(gè)原因引發(fā),經(jīng)j個(gè)中間事件傳播,導(dǎo)致k個(gè)后果,其結(jié)構(gòu)信息可描述為式(4)。

        HAZOP信息其實(shí)就是危險(xiǎn)事件的集合,其結(jié)構(gòu)信息可描述為式(5)。

        2.2.2 概念屬性關(guān)系定義

        概念屬性關(guān)系定義能夠使得本體更加細(xì)化,進(jìn)而形成具有良好結(jié)構(gòu)的分類(lèi)層次體系。每個(gè)危險(xiǎn)事件類(lèi)由初始原因類(lèi)、偏差類(lèi)、中間事件類(lèi)、后果類(lèi)、防護(hù)措施、建議構(gòu)成,而初始原因類(lèi)、偏差類(lèi)、中間事件類(lèi)、后果類(lèi)以及防護(hù)措施類(lèi)都能被抽象成單體+單體狀態(tài)形式描述,單體為本體概念中的某個(gè)實(shí)體,單體狀態(tài)為該實(shí)體的狀態(tài)。初始原因類(lèi):過(guò)濾器堵塞,可分為單體-過(guò)濾器,狀態(tài)-堵塞。偏差類(lèi):R-5611101液位過(guò)高,可分為單體-R-5611101,狀態(tài)-液位過(guò)高。中間事件類(lèi):反應(yīng)器超溫,可分為單體-反應(yīng)器,狀態(tài)-超溫。后果類(lèi):反應(yīng)器爆炸,可分為單體-反應(yīng)器,狀態(tài)-爆炸。防護(hù)措施類(lèi):TI0108-0113高報(bào)警,可分為單體-TI0108-0113,狀態(tài)-高報(bào)警。查詢HAZOP信息一般以原因類(lèi)、后果或者防護(hù)措施作為查詢起點(diǎn),建議類(lèi)沒(méi)必要進(jìn)行過(guò)分細(xì)化,因此沒(méi)有將建議類(lèi)進(jìn)行屬性劃分,直接將其歸為一個(gè)整體類(lèi)。

        經(jīng)過(guò)以上HAZOP概念類(lèi)別劃分以及屬性定義,最終HAZOP知識(shí)圖譜模式層如圖2所示。

        圖2 HAZOP知識(shí)圖譜模式層概念體系

        3 數(shù)據(jù)層構(gòu)建

        知識(shí)圖譜模式層構(gòu)建了HAZOP知識(shí)圖譜的骨架,數(shù)據(jù)層的構(gòu)建則是填充HAZOP知識(shí)圖譜的血肉。HAZOP知識(shí)圖譜的數(shù)據(jù)層由實(shí)體-關(guān)系-實(shí)體三元組知識(shí)構(gòu)成,首先對(duì)已有的HAZOP信息進(jìn)行數(shù)據(jù)標(biāo)注,然后通過(guò)構(gòu)建命名實(shí)體識(shí)別模型訓(xùn)練并識(shí)別出HAZOP信息中的關(guān)鍵實(shí)體以及實(shí)體狀態(tài)構(gòu)成三元組知識(shí),最后按照模式層定義好的概念框架,將三元組知識(shí)聯(lián)結(jié)起來(lái),并存儲(chǔ)到圖數(shù)據(jù)庫(kù)中,最終形成HAZOP知識(shí)圖譜。HAZOP知識(shí)圖譜數(shù)據(jù)層構(gòu)建的主要工作就是訓(xùn)練命名實(shí)體識(shí)別模型并將關(guān)鍵實(shí)體提取出來(lái),其主要步驟有:數(shù)據(jù)標(biāo)注,命名實(shí)體模型構(gòu)建、訓(xùn)練,模型評(píng)估,知識(shí)存儲(chǔ)等。

        3.1 數(shù)據(jù)獲取及數(shù)據(jù)標(biāo)注

        HAZOP知識(shí)圖譜的數(shù)據(jù)來(lái)源主要來(lái)自于已有的HAZOP分析文檔、領(lǐng)域行業(yè)網(wǎng)站等半結(jié)構(gòu)數(shù)據(jù),專(zhuān)業(yè)文獻(xiàn)資料等非結(jié)構(gòu)化數(shù)據(jù)。本文共提取了8655條HAZOP分析語(yǔ)句進(jìn)行命名實(shí)體識(shí)別模型訓(xùn)練,并將語(yǔ)料集以8∶1∶1的比例劃分成訓(xùn)練集、測(cè)試集和驗(yàn)證集。數(shù)據(jù)標(biāo)注是命名實(shí)體識(shí)別的基礎(chǔ),將數(shù)據(jù)標(biāo)記成模型能夠識(shí)別的格式,進(jìn)而開(kāi)展模型訓(xùn)練、評(píng)估等工作。命名實(shí)體識(shí)別任務(wù)中常采用BIO、BIEO、BISEO三種標(biāo)注方式,其中,B表示實(shí)體的第一個(gè)字,I表示實(shí)體的中間部分,S表示單個(gè)實(shí)體,E表示實(shí)體最后一個(gè)字,O表示非實(shí)體。一般來(lái)說(shuō),標(biāo)注得越精確,識(shí)別的效果就越好。結(jié)合HAZOP信息中實(shí)體的結(jié)構(gòu),本文采用BIO形式的標(biāo)注方式,即定義3種實(shí)體范圍標(biāo)簽。由HAZOP知識(shí)圖譜模式層可知,需要提取的實(shí)體有設(shè)備(EQU)、物料(MAT)、狀態(tài)(STA)三類(lèi)實(shí)體,具體的標(biāo)注策略見(jiàn)表1。

        表1 HAZOP信息實(shí)體標(biāo)注BIO標(biāo)簽

        3.2 BiLSTM-Attention-CRF命名實(shí)體識(shí)別模型

        HAZOP命名實(shí)體識(shí)別與提取是構(gòu)建HAZOP知識(shí)圖譜數(shù)據(jù)層的關(guān)鍵步驟之一。相對(duì)于英文命名實(shí)體識(shí)別任務(wù),中文命名實(shí)體識(shí)別的詞語(yǔ)界限劃分模糊?,F(xiàn)階段,中文命名實(shí)體識(shí)別研究一般采用BiLSTM-CRF模型,首先將中文字符經(jīng)過(guò)字符編碼得到字符級(jí)別的詞向量,然后利用BiLSTM(bi-directional long short-term memory)神經(jīng)網(wǎng)絡(luò)模型獲取具有上下文關(guān)系的表示向量,最后通過(guò)CRF層(conditional random fields)預(yù)測(cè)出命名實(shí)體分類(lèi)結(jié)果。HAZOP文本中的命名實(shí)體具有其獨(dú)有的領(lǐng)域命名規(guī)則,具有上下文敏感性,針對(duì)這些特點(diǎn),在命名實(shí)體識(shí)別任務(wù)中,本文提出了BiLSTMAttention-CRF命名實(shí)體識(shí)別模型,在BiLSTM-CRF模型的基礎(chǔ)上引入注意力機(jī)制,增強(qiáng)模型獲取上下文特征的能力,充分挖掘文本的特征,提高模型識(shí)別準(zhǔn)確率。該模型結(jié)構(gòu)如圖3所示。模型由Char Embedding層、BiLSTM網(wǎng)絡(luò)層、Attention層和CRF層四部分組成。Char Embedding層將輸入的句子轉(zhuǎn)化為向量的形式,BiLSTM網(wǎng)絡(luò)層從輸入的向量中學(xué)習(xí)獲取具有上下文特征的表示向量,Attention層利用注意力機(jī)制得到更加精準(zhǔn)的特征向量,最終通過(guò)CRF層輸出概率最大的標(biāo)簽序列,從而得到HAZOP命名實(shí)體。

        圖3 BiLSTM-Attention-CRF模型

        3.2.1 BiLSTM網(wǎng)絡(luò)層

        LSTM[22](long short-term memory)是RNN[23](recurrent neural network)的一種,指一類(lèi)具有記憶單元的循環(huán)神經(jīng)網(wǎng)絡(luò),由于其設(shè)計(jì)的特點(diǎn),非常適合用于對(duì)時(shí)序數(shù)據(jù)的建模。每個(gè)LSTM單元由當(dāng)前時(shí)刻的輸入詞、細(xì)胞狀態(tài)、臨時(shí)細(xì)胞狀態(tài)、隱層狀態(tài)、遺忘門(mén)、記憶門(mén)、輸出門(mén)組成。它通過(guò)遺忘門(mén)遺忘不需要的信息,利用記憶門(mén)需要記憶的信息,從而將有用的信息保留,無(wú)用的信息被丟棄。因此,LSTM可以很好地捕捉到較長(zhǎng)距離的依賴關(guān)系,然而LSTM只能編碼從前到后的信息,無(wú)法得到從后到前的信息。在序列標(biāo)注等任務(wù)中每個(gè)字的標(biāo)簽與上下文聯(lián)系都很緊密,因此本文采用BiLSTM模型進(jìn)一步提升模型利用上下文信息的能力。

        BiLSTM模型由Graves等提出,模型包括輸入層、前向LSTM層、后向LSTM層以及輸出層[24]。每一個(gè)訓(xùn)練序列通過(guò)雙向LSTM為輸出層提供訓(xùn)練序列中每一個(gè)點(diǎn)的過(guò)去與未來(lái)信息,其模型結(jié)構(gòu)如圖4所示。

        圖4 BiLSTM模型結(jié)構(gòu)

        在BiLSTM網(wǎng)絡(luò)層中,當(dāng)輸入為xt、輸出為yt時(shí)的概率用式(6)表示。

        3.2.2 Attention層

        當(dāng)HAZOP信息序列過(guò)長(zhǎng)時(shí),HAZOP信息會(huì)被弱化,信息可能被丟失。針對(duì)此問(wèn)題,本文引入注意力機(jī)制。Attention機(jī)制[25]就像人在看圖片時(shí)會(huì)快速定位關(guān)鍵信息,把握重要的信息,將有限的注意力集中在重點(diǎn)信息上從而防止信息丟失,快速獲得有效信息。注意力機(jī)制主要包含查詢(query)、鍵(key)、值(value)三要素,其本質(zhì)可描述為查詢(query)到一系列鍵值對(duì)(key-value)的映射。Self-Attention就是尋找序列內(nèi)部的聯(lián)系,也即Attention(X1,X2,X3),X1、X2、X3為輸入序列X的三部分。

        圖5 放縮點(diǎn)積注意力機(jī)制

        式中,Q、K、V均為向量形式,大小分別為n×dk、m×dk、m×dv。

        考慮到自建的HAZOP語(yǔ)料規(guī)模較少,使用一個(gè)Attention機(jī)制無(wú)法從多維度、多層次提取重要特征,特征提取效果弱。本文采用多頭自注意力機(jī)制(multi-head attention)進(jìn)行特征提取,以使得模型能夠提取更加豐富的表達(dá)向量。

        多頭注意力機(jī)制[26]相當(dāng)于多個(gè)不同的selfattention的集成,其在參數(shù)不共享的前提下,將Q、K、V分別經(jīng)過(guò)參數(shù)矩陣映射,進(jìn)行放縮點(diǎn)積注意力計(jì)算,最后將該過(guò)程重復(fù)h次后拼接,從而得到多維度、多層次的特征信息。其計(jì)算方式如圖6所示,計(jì)算公式如式(8)、式(9)。

        圖6 多頭注意力機(jī)制

        3.2.3 CRF層

        BiLSTM和Attention層關(guān)注更多的是求出每一個(gè)輸入對(duì)應(yīng)的最大概率標(biāo)簽,將每一個(gè)標(biāo)簽看成獨(dú)立的存在,沒(méi)有考慮標(biāo)簽之間的依賴關(guān)系,這樣有可能會(huì)導(dǎo)致不合理標(biāo)簽的出現(xiàn)。如命名實(shí)體開(kāi)始標(biāo)簽應(yīng)該為B,而識(shí)別出來(lái)以I開(kāi)頭的標(biāo)簽序列。為了避免類(lèi)似情況出現(xiàn),在Attention層后增加條件隨機(jī)場(chǎng)CRF層(conditional random field),CRF層能夠考慮到相鄰標(biāo)簽之間的關(guān)系,從而獲得全局最優(yōu)標(biāo)簽序列。

        CRF模型是Lafferty等[27]基于最大熵模型和隱馬爾科夫模型,提出的一種判別式概率無(wú)向圖學(xué)習(xí)模型。一般地,輸入序列X={x1,x2,…,xn}對(duì)應(yīng)的標(biāo)簽序列為Y={y1,y2,…,yn}的評(píng)分如式(10)。

        式中,A為轉(zhuǎn)移矩陣;n為序列長(zhǎng)度。

        在輸入序列x的條件下產(chǎn)生標(biāo)記序列y的概率如式(11)。

        訓(xùn)練過(guò)程中,p(y|x)的最大后驗(yàn)概率如式(12)。

        式中,YX為輸入序列X對(duì)應(yīng)的所有可能的標(biāo)簽序列。

        預(yù)測(cè)時(shí),一般使用維特比算法計(jì)算整體最大概率的一組標(biāo)簽序列,預(yù)測(cè)結(jié)果記為y*,如式(13)。

        3.2.4 模型評(píng)估與對(duì)比

        本文的試驗(yàn)環(huán)境為:Intel Core i7-4710MQ 2.5GHz處理器,8GB內(nèi)存,Python-3.6.2,Tensorflow-1.14.0, Keras-2.2.4。 BiLSTM-Multi-Head Attention-CRF模型主要參數(shù)設(shè)置如下:LSTM隱含層單元個(gè)數(shù)為128,層數(shù)為2,Self-attention中的dk為4,Multi-Head Attention中的num-heads為8,Dropout為0.5,優(yōu)化器采用Adam,學(xué)習(xí)率為0.001。試驗(yàn)采用的模型評(píng)價(jià)指標(biāo)有精確度P、召回率R和F1值,其計(jì)算如式(14)~式(16)。

        式中,TP(true positive)為模型識(shí)別正確的HAZOP實(shí)體個(gè)數(shù);FP(false positive)為模型識(shí)別到的不相關(guān)HAZOP實(shí)體個(gè)數(shù);FN(false negative)為未識(shí)別到相關(guān)HAZOP實(shí)體的個(gè)數(shù)。

        為了驗(yàn)證模型的有效性,本文進(jìn)行了4組對(duì)比試驗(yàn),使用的模型分別為CRF、BiLSTM-CRF、BiLSTM-Self-Attention-CRF、BiLSTM-Multi-Head Attention-CRF,其中BiLSTM-Self-Attention-CRF為引入自注意力機(jī)制的BiLSTM-CRF模型,BiLSTM-Multi-Head Attention-CRF為引入多頭自注意力機(jī)制的模型。

        各模型的命名實(shí)體識(shí)別結(jié)果見(jiàn)表2。由表可見(jiàn),BiLSTM可以很好地提取上下文特征,與基準(zhǔn)模型比較,F(xiàn)1提高了5.29%。模型引入Attention機(jī)制后,識(shí)別效果顯著提升,模型的精確率、召回率和F1值分別為88.7%、90.48%、89.58%。結(jié)果表明,BiLSTM-Multi-Head Attention-CRF模型可以很好地完成命名實(shí)體識(shí)別任務(wù)。

        表2 各個(gè)模型的命名實(shí)體識(shí)別結(jié)果

        3.3 知識(shí)存儲(chǔ)

        通過(guò)上述流程,將HAZOP信息轉(zhuǎn)化為結(jié)構(gòu)化的三元組數(shù)據(jù)。三元組數(shù)據(jù)可以很好地表示HAZOP信息,Neo4j圖數(shù)據(jù)庫(kù)可以將結(jié)構(gòu)化數(shù)據(jù)以圖的形式存儲(chǔ),更加直觀準(zhǔn)確地反映HAZOP信息之間的聯(lián)系,將實(shí)體-關(guān)系-實(shí)體、實(shí)體-屬性-屬性值的HAZOP三元組數(shù)據(jù)中的首尾數(shù)據(jù)存儲(chǔ)為Neo4j中的節(jié)點(diǎn)類(lèi)型,關(guān)系及屬性關(guān)系存儲(chǔ)為邊,從而完成HAZOP數(shù)據(jù)的存儲(chǔ)。同時(shí)利用圖查詢語(yǔ)言,可以快速查出需要的數(shù)據(jù),輔助人工HAZOP開(kāi)展,便于后續(xù)知識(shí)圖譜的應(yīng)用開(kāi)發(fā)。

        4 實(shí)例分析

        以某煤炭間接液化項(xiàng)目油品合成裝置HAZOP分析報(bào)告為例,分析了項(xiàng)目中的9個(gè)單元,共102個(gè)節(jié)點(diǎn)、834條分析記錄。按照本文提出的知識(shí)圖譜構(gòu)建方法,利用命名實(shí)體識(shí)別模型提取分析報(bào)告中的設(shè)備、物料、狀態(tài)等實(shí)體,再與模式層進(jìn)行映射,以實(shí)體和狀態(tài)為節(jié)點(diǎn)構(gòu)成危險(xiǎn)事件中的原因類(lèi),中間事件類(lèi),后果類(lèi)以及偏差并存儲(chǔ)與Neo4j中,最終完成HAZOP知識(shí)圖譜的構(gòu)建。該項(xiàng)目知識(shí)圖譜如圖7所示。

        圖7 某煤炭間接液化項(xiàng)目油品合成裝置HAZOP知識(shí)圖譜(部分)

        以HAZOP分析報(bào)告節(jié)點(diǎn)1為例,其具體分析記錄見(jiàn)表3。

        表3 HAZOP分析記錄

        利用命名實(shí)體識(shí)別模型,將HAZOP記錄表中的命名實(shí)體提取出來(lái),提取結(jié)果見(jiàn)表4。

        表4 HAZOP命名實(shí)體提取結(jié)果

        得到每一個(gè)危險(xiǎn)事件中對(duì)應(yīng)類(lèi)的組成之后,將提取出來(lái)的實(shí)體以節(jié)點(diǎn)形式存儲(chǔ),同時(shí)建立對(duì)應(yīng)關(guān)系。如表4中的序號(hào)4對(duì)應(yīng)的危險(xiǎn)事件,在節(jié)點(diǎn)“EQU:R-5611101”與節(jié)點(diǎn)“液位過(guò)低”之間建立偏差關(guān)系,節(jié)點(diǎn)“反應(yīng)器”與節(jié)點(diǎn)“超溫”之間建立中間事件關(guān)系,以此類(lèi)推建立后果、原因關(guān)系以及防護(hù)措施,從而完成危險(xiǎn)事件的偏差類(lèi)、中間事件類(lèi)、后果類(lèi)、原因類(lèi)、防護(hù)措施類(lèi)的構(gòu)建,建議類(lèi)則直接保存成節(jié)點(diǎn),并將建議的內(nèi)容以節(jié)點(diǎn)屬性保存起來(lái),由于每個(gè)危險(xiǎn)事件都是以偏差為起點(diǎn)分析得到,也就意味著每個(gè)偏差都是唯一的,通過(guò)將偏差關(guān)系設(shè)置為其他關(guān)系和對(duì)應(yīng)建議節(jié)點(diǎn)的原始關(guān)系,從而建立危險(xiǎn)事件中每一個(gè)類(lèi)之間的關(guān)系,最終完成知識(shí)圖譜的構(gòu)建。節(jié)點(diǎn)1的知識(shí)圖譜如圖8所示。

        如圖8所示,HAZOP知識(shí)圖譜以節(jié)點(diǎn)-關(guān)系-節(jié)點(diǎn)的形式存儲(chǔ)HAZOP分析記錄,可以直觀明了地展示出節(jié)點(diǎn)1的HAZOP分析記錄中的每一條記錄對(duì)應(yīng)的偏差、原因、中間事件、后果、防護(hù)措施以及建議等相關(guān)知識(shí),以圖譜的形式構(gòu)建HAZOP信息中的一個(gè)個(gè)危險(xiǎn)事件,圖形化展現(xiàn)了危險(xiǎn)事件中知識(shí)之間的關(guān)系。HAZOP知識(shí)圖譜可以以偏差、原因、中間事件、后果、防護(hù)措施等一個(gè)或多個(gè)組合作為搜索條件,提供已有的相關(guān)HAZOP記錄,從而實(shí)現(xiàn)輔助人工HAZOP以及為后續(xù)項(xiàng)目維護(hù)提供知識(shí)支持。如當(dāng)專(zhuān)家進(jìn)行HAZOP分析時(shí),分析“R-5611101壓力過(guò)高”這個(gè)偏差導(dǎo)致的危險(xiǎn)事件時(shí),通過(guò)HAZOP知識(shí)圖譜可以將已有的相似分析記錄如圖9(a)提供給專(zhuān)家作為參考,從而減少人工與時(shí)間成本,提高分析結(jié)果的完備性。在項(xiàng)目的后期維護(hù)中,當(dāng)出現(xiàn)某個(gè)報(bào)警器報(bào)警或者某個(gè)反應(yīng)器異常時(shí),HAZOP知識(shí)圖譜也能以此為條件,快速定位故障原因如圖9(b)、(c),從而解決問(wèn)題。

        圖8 節(jié)點(diǎn)1對(duì)應(yīng)的知識(shí)圖譜

        圖9 HAZOP知識(shí)圖譜以不同條件檢索的相關(guān)危險(xiǎn)事件

        5 結(jié)論

        針對(duì)大量現(xiàn)有的HAZOP信息以紙質(zhì)文檔為載體記錄,難以共享、復(fù)用等問(wèn)題,結(jié)合HAZOP分析數(shù)據(jù)的領(lǐng)域性以及描述標(biāo)準(zhǔn)不統(tǒng)一等特點(diǎn),提出了結(jié)合自頂向下和自底向上的半自動(dòng)構(gòu)建HAZOP知識(shí)圖譜方法。從危險(xiǎn)事件的角度剖析了HAZOP信息的元素組成,自頂向下構(gòu)建了HAZOP知識(shí)圖譜的模式層;在BiLSTM-CRF模型的基礎(chǔ)上引入多頭自注意力機(jī)制,提高了命名實(shí)體識(shí)別準(zhǔn)確度,實(shí)現(xiàn)了自動(dòng)提取HAZOP信息中的關(guān)鍵實(shí)體,自底向上構(gòu)建了知識(shí)圖譜的數(shù)據(jù)層。HAZOP知識(shí)圖譜以結(jié)構(gòu)化的形式統(tǒng)一描述HAZOP信息以及信息之間的關(guān)系,便于計(jì)算機(jī)理解,以圖譜的形式存儲(chǔ)展示HAZOP信息,便于信息的共享與復(fù)用。通過(guò)案例分析,驗(yàn)證了HAZOP知識(shí)圖譜構(gòu)建方法的有效性,同時(shí)表明以知識(shí)圖譜的形式表示HAZOP信息可以較為清晰、完整地表述出HAZOP信息以及知識(shí)之間的聯(lián)系,能夠快速提供HAZOP參考信息有效輔助人工HAZOP的開(kāi)展,提高HAZOP分析效率,也可以為后續(xù)項(xiàng)目的維護(hù)提供保障,為HAZOP信息的復(fù)用與共享提供了一種新的方法。

        總體來(lái)說(shuō),本研究為HAZOP信息的復(fù)用與共享提供了新的實(shí)現(xiàn)方法,為知識(shí)的表達(dá)提供了新的應(yīng)用視角。此外,本研究還有一些不足,如HAZOP數(shù)據(jù)不夠充足,這影響了HAZOP知識(shí)圖譜的完整度,在后續(xù)研究中,將擴(kuò)展數(shù)據(jù)來(lái)源,豐富HAZOP數(shù)據(jù),同時(shí)將研究HAZOP知識(shí)圖譜在搜索問(wèn)答領(lǐng)域的應(yīng)用。

        猜你喜歡
        分析信息模型
        一半模型
        隱蔽失效適航要求符合性驗(yàn)證分析
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
        3D打印中的模型分割與打包
        展會(huì)信息
        健康信息
        祝您健康(1987年3期)1987-12-30 09:52:32
        日本道精品一区二区三区| 国产我不卡在线观看免费| 国产午夜视频一区二区三区| 人妻少妇精品视频专区| 亚洲妓女综合网99| 漂亮人妻被中出中文字幕久久| 巨大欧美黑人xxxxbbbb| 日韩精品精品一区二区三区| 中文字幕久久人妻av| 美女下蹲露大唇无遮挡| 国产精品无码一本二本三本色| 亚洲一区二区在线| 18禁成人免费av大片一区| 亚洲国产精品久久久av| 亚洲处破女av日韩精品| 亚洲 欧美 唯美 国产 伦 综合| 无遮挡粉嫩小泬| 国产在线一区二区av| 亚洲精品无码精品mv在线观看| 国产女主播喷水视频在线观看| 国产精品国产三级国产专区5o| 国产91久久精品成人看网站| 永久天堂网av手机版| 亚洲av日韩av无码av| 五月婷网站| 国产精品一品二区三区| 亚洲精品国精品久久99热| 国产乱人伦av在线无码| AV教师一区高清| 亚洲发给我的在线视频| 射精区-区区三区| 天堂网在线最新版www中文网| 亚洲国产一区二区三区在观看| 极品一区二区在线视频| 老司机亚洲精品影院| 欧洲亚洲视频免费| 精品国产免费一区二区久久| 天堂а在线中文在线新版| 国产一级做a爱免费观看| 在线视频亚洲一区二区三区| 浓毛老太交欧美老妇热爱乱|