亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于規(guī)則模式的瓦斯爆炸事故信息抽取技術(shù)

        2023-03-27 02:38:50梁建軍雷咸銳蔡忠杰
        煤礦安全 2023年2期
        關(guān)鍵詞:物態(tài)瓦斯事故

        梁建軍,雷咸銳,吳 斌,蔡忠杰,栗 婧

        (1.山西潞安化工集團 能源事業(yè)部,山西 長治 046204;2.中國礦業(yè)大學(xué)(北京)應(yīng)急管理與安全工程學(xué)院,北京 100083)

        據(jù)統(tǒng)計2005—2020 年我國煤礦重大級別以上事故共發(fā)生253 起,傷亡5 125 人,其中瓦斯爆炸事故占各類重特大事故發(fā)生數(shù)的45%,傷亡人數(shù)的57%。對煤礦事故報告進行分析發(fā)現(xiàn)所有的事故皆為責(zé)任事故,且研究表明在引起事故發(fā)生的直接原因中,人的不安全行為約占80%。因此,開展行為安全研究,規(guī)范人作業(yè)過程中的行為,對于預(yù)防事故發(fā)生具有重要意義。事故案例致因分析是獲取行為原因的主要方法。目前,案例致因分析多由人工閱讀的方式對文本中描述的致因信息進行識別,但該方式費時費力,且獲取的結(jié)果會受人主觀因素影響。信息抽取是自然語言處理研究領(lǐng)域的重要組成部分,主要研究內(nèi)容為從文本中提取特定描述信息[1]?;诖?,希望借助信息抽取技術(shù),以事故致因理論為指導(dǎo),構(gòu)建適用于煤礦瓦斯爆炸事故致因信息抽取方法,以快速獲取事故文本中的致因信息,探索事故發(fā)生規(guī)律,為煤礦安全管理工作開展提供數(shù)據(jù)支撐。

        近年來,國內(nèi)外學(xué)者對信息抽取技術(shù)進行了研究:XU Hua 等[2]對MedLEE 醫(yī)療信息抽取系統(tǒng)進行改進,構(gòu)建了MedEx 醫(yī)療藥物信息抽取系統(tǒng),利用患者診療記錄對系統(tǒng)抽取結(jié)果的準(zhǔn)確性進行了驗證;SPASIC 等[3]為克服從醫(yī)療報告中獲取關(guān)于治療藥物詳細(xì)信息難的問題,設(shè)計了一種適用于臨床醫(yī)療數(shù)據(jù)信息的抽取系統(tǒng);原歡[4]為解決遠(yuǎn)洋運輸業(yè)人工處理業(yè)務(wù)郵件信息效率低下的問題,利用GATE 提供的文本工程體系框架,基于規(guī)則信息抽取技術(shù)構(gòu)建海洋貨運電子郵件關(guān)鍵信息抽取方法;孫水華[5]構(gòu)建基于規(guī)則模式的抽取算法模型,對中醫(yī)針對文檔中的數(shù)據(jù)進行了自動抽取;梁帥[6]、劉茜茜[7]為提升病理文本數(shù)據(jù)的利用率,以病理文本數(shù)據(jù)為研究對象,構(gòu)建了結(jié)構(gòu)化信息抽取系統(tǒng),該系統(tǒng)可實現(xiàn)病理文本數(shù)據(jù)信息自動化結(jié)構(gòu)抽取,輔助醫(yī)療人員進行疾病診斷。從上述文獻梳理可以看出,國內(nèi)外學(xué)者對信息抽取技術(shù)的應(yīng)用取得了很多成果。

        1 理論基礎(chǔ)

        1.1 事故模型選擇

        目前常用的事故致因模型有人因分析模型(HFACS)、STAMP 模型、事故致因“2-4”模型(24Model)、SCM 模型、AcciMap 模型。事故致因模型各有優(yōu)缺點,為選出最適用于煤礦領(lǐng)域的事故致因分析模型,將從事故模型的系統(tǒng)性、組成方面進行比較。SCM 模型[8]和HFACS 模型[9]屬于簡單鏈?zhǔn)绞鹿手乱蚰P?,事故原因的發(fā)生存在先后順序,原因之間邏輯關(guān)系清晰。24Model 模型[10]、AcciMap 模型[11]和STAMP 模型[12]均屬于網(wǎng)狀事故致因模型,從系統(tǒng)的角度,較為完整地描述了事故致因之間的相互作用關(guān)系,認(rèn)為事故原因之間既存在層級之間的正向和反饋作用,也存在因果之間的相互作用,更能夠準(zhǔn)確地反映現(xiàn)今復(fù)雜的社會-技術(shù)系統(tǒng)的真實情況。除STAMP 模型外,其他模型均為模塊化事故致因模型。模塊化適用于大量案例分析時進行原因統(tǒng)計分析,便于使用和從事故報告內(nèi)獲取原因進行分類。與其他致因模型相比,24Model 模型將事故原因模塊化,有利于對事故原因的歸類統(tǒng)計和定量分析;各模塊具有明確的定義和嚴(yán)格的界限,能夠保證事故原因彼此獨立;其多用于煤礦事故的分析,作為一個復(fù)雜網(wǎng)絡(luò)的事故致因模型,網(wǎng)絡(luò)中明確了事故原因之間的相互作用關(guān)系,基于24Model 模型的網(wǎng)狀特點,通過進行大量的事故分析,能夠識別出瓦斯爆炸事故中的關(guān)鍵原因。因此,選取24Model 模型作為研究開展煤礦瓦斯爆炸事故致因研究的理論基礎(chǔ)和分析工具。

        1.2 24Model 模型定義

        事故致因24Model 模型是在事故致因模型基礎(chǔ)上研究形成,至今先后經(jīng)歷了6 個理論發(fā)展階段[13]。24Model 模型認(rèn)為不安全行為和不安全物態(tài)是引起事故的直接原因;在對行為的發(fā)出者識別方面,認(rèn)為動作發(fā)出者應(yīng)涵蓋組織內(nèi)對事故發(fā)生影響的所有工作人員;在間接原因組成上,將間接原因歸結(jié)為個人能力不足導(dǎo)致,其影響因素包括知識、意識、習(xí)慣、心理和生理5 個方面。24Model 模型認(rèn)為引起事故的根源原因和根本原因是由組織層面導(dǎo)致,將根本原因歸結(jié)為安全管理體系缺失,事故發(fā)生的根源原因歸結(jié)為企業(yè)安全文化的缺失。

        以24Model 模型為理論框架,基于規(guī)則模式的方法對事故致因信息抽取,需明確致因因素各模塊的定義和識別方法,以使計算機在處理文本時能夠準(zhǔn)確抽取目標(biāo)信息。

        1)不安全行為。24Model 模型給出的不全行為定義為對當(dāng)次事故發(fā)生有重大影響或者引起激活當(dāng)次事故的行為。可依據(jù)規(guī)章、事故案例和風(fēng)險評估3種方法對其識別[10]。

        2)不安全物態(tài)。24Model 模型對不安全物態(tài)的定義為對事故發(fā)生有重大影響物態(tài),其識別的方法有3 種:違規(guī)的物態(tài);不違規(guī)引起事故的物態(tài);風(fēng)險評估后認(rèn)為存在高風(fēng)險的物態(tài)[10]。

        3)間接原因。24Model 模型認(rèn)為引起事故的間接原因包含知識、意識、習(xí)慣、心理和生理5 類因素[10]。安全知識對意識、習(xí)慣、行為、物態(tài)均具有較大程度的影響[14],安全知識影響路徑如圖1。從圖1 可以看出,知識對事故的影響存在3 條影響路徑,分別是因安全知識不足直接導(dǎo)致不安全行為和物態(tài)產(chǎn)生;安全知識不足引起安全意識降低或安全習(xí)慣不佳,通過安全意識或習(xí)慣對不安全行為和物態(tài)產(chǎn)生作用。在間接原因分析上,僅對24Model 中的安全知識不足進行抽取。

        圖1 安全知識影響路徑分析Fig.1 Safety knowledge influence path analysis

        1.3 信息抽取技術(shù)選擇

        基于機器學(xué)習(xí)的統(tǒng)計抽取、基于自然語言理解抽取、基于規(guī)則模式抽取[15]是從文本中實現(xiàn)信息抽取的3 類主要技術(shù)方法?;谧匀徽Z言理解的信息抽取方法技術(shù)復(fù)雜,不適合廣泛信息的抽取;基于機器學(xué)習(xí)的統(tǒng)計抽取方法常用于分類和預(yù)測研究,側(cè)重于研究文本關(guān)鍵詞的分布,抽取結(jié)果準(zhǔn)確性有待商榷;基于規(guī)則模式的信息抽取方法對所研究的文本語言,領(lǐng)域以及文本格式有著嚴(yán)重的依賴性,且可移植性弱,但針對同一類事故的抽取而言,其相對于機器學(xué)習(xí)的統(tǒng)計方法和自然語言理解方法抽取準(zhǔn)確率相對要好,可以更精準(zhǔn)地獲取待抽取文檔的主要特征信息。結(jié)合研究的內(nèi)容,選擇基于規(guī)則模式的文本抽取技術(shù)作為瓦斯爆炸事故文本致因信息抽取的方法。

        1.4 事故致因分析范圍確定

        事故是組織根據(jù)適用要求規(guī)定的、造成確定負(fù)效應(yīng)的1 個或者一系列意外事件,從事故定義可以看出,事故發(fā)生在組織之內(nèi)。以24Model 模型為事故致因理論依據(jù),研究對象為煤礦瓦斯爆炸事故,因此選取事故礦井作為分析的組織范圍,煤礦的上級單位、政府監(jiān)管單位等導(dǎo)致的事故致因因素不計入分析范圍。結(jié)合上文的闡述,確定事故致因分析范圍和識別的內(nèi)容。在原因方面主要識別內(nèi)容為不安全動作,不安全物態(tài)和安全知識不足。

        2 基于規(guī)則模式的致因信息抽取

        2.1 致因信息抽取步驟

        基于規(guī)則模式抽取算法,將煤礦瓦斯爆炸事故致因抽取分為預(yù)處理、事故文本關(guān)鍵信息抽取、分詞處理、信息匹配、間接信息抽取等5 步。

        1)預(yù)處理。將事故報告文本類型轉(zhuǎn)為txt 格式,根據(jù)事故報告的特點,將1 篇完整的報告分為:首段、礦井概況、事故經(jīng)過、事故原因和責(zé)任者的處理建議5 個部分,并將各部分內(nèi)容存儲至不同的列表中。

        2)事故文本關(guān)鍵信息抽取。利用通用“抽取規(guī)則+關(guān)鍵詞”對事故描述中關(guān)鍵語句進行抽取。

        3)分詞處理。對提取出的語句進行分詞處理。

        4)信息匹配。將語句分詞的結(jié)果與原因詞典中的信息進行匹配,凝練語句,獲取引起事故的不安全行為和物態(tài)。

        5)間接信息抽取。將不安全行為及物態(tài)結(jié)果分別與安全知識詞典的鍵進行匹配,推導(dǎo)出缺失的安全知識。

        2.2 規(guī)則模式抽取方法構(gòu)建

        事故致因抽取算法圖如圖2。

        圖2 事故致因抽取算法圖Fig.2 Algorithm diagram of accident causes extraction

        事故原因信息描述多樣、復(fù)雜多變且描述無規(guī)范格式,所以依靠固定的規(guī)則模式難以獲取。通過對2005—2020 年間的事故案例庫梳理發(fā)現(xiàn),事故原因信息描述中常含有固定的詞語搭配,比如因違章爆破而導(dǎo)致事故發(fā)生,在原因描述中會出現(xiàn)“爆破”、“炮”、“違章”等詞匯,所以若想通過信息抽取技術(shù)獲取導(dǎo)致事故發(fā)生的原因信息,可通過構(gòu)建原因“通用規(guī)則模式+關(guān)鍵詞”的形式對含有關(guān)鍵詞的句子進行提取,對抽取的關(guān)鍵語句進行分詞處理,將分詞結(jié)果與事故致因字典的鍵進行匹配獲取最終的事故原因描述。因此,構(gòu)建高質(zhì)量的關(guān)鍵詞庫和事故致因字典對信息抽取技術(shù)抽取的結(jié)果至關(guān)重要。

        研究所使用的事故致因字典和關(guān)鍵詞庫是通過文獻分析[16-17]、小組討論、煤礦現(xiàn)場調(diào)研等方法獲得。獲取的關(guān)鍵語句部分關(guān)鍵詞庫見表1。

        表1 關(guān)鍵詞詞庫Table 1 Keywords thesaurus

        事故致因字典有3 部分組成,分別是行為、物態(tài)、安全知識字典。行為字典的作用是對文本抽取出信息進行同義轉(zhuǎn)述,將文本中關(guān)于不安全行為的描述轉(zhuǎn)為簡短凝練的專業(yè)術(shù)語;物態(tài)字典同理;安全知識字典作用是根據(jù)獲取的原因信息識別出導(dǎo)致事故發(fā)生的安全知識不足和管理體系欠缺的方面信息。部分事故致因字典信息見表2,表2 中:鍵的作用是用于匹配關(guān)鍵語句分詞結(jié)果;值為輸出的原因信息描述。

        表2 事故致因字典Table 2 Accident cause dictionary

        2.3 事故致因抽取實現(xiàn)及可視化

        目前常用于科學(xué)信息分析的編程語言有Java、C++、Python、R 語言4 類。Python 是一種面向?qū)ο蟮哪_本語言,具有的豐富且強大的庫函數(shù)可供調(diào)用,如數(shù)據(jù)分析庫Pandas、自然語言和文本處理庫NLTK、Re 等。所構(gòu)建的事故致因信息抽取方法應(yīng)用研究,屬于自然語言處理領(lǐng)域,可選擇Python 作為抽取結(jié)果實現(xiàn)的編程語言。與C++、Java 等匯編語言相比,Python 具有大量的自然語言處理和數(shù)據(jù)分析相關(guān)的庫函數(shù);代碼可讀性強,簡單易學(xué)。

        目前比較常見的文本可視化工具見表3。

        表3 文本可視化工具Table 3 Text visualization tools

        從表中可以看出:從繪制圖類型的豐富度、是否支持中文和代碼量3 個方面比較,Pyecharts 均優(yōu)于其他4 類可視化工具。Pyecharts 基于Python 環(huán)境開發(fā)設(shè)計,可繪制的圖類型有柱狀圖、雷達圖、可視化地圖、樹狀圖等,且繪制圖形具有動態(tài)特征,可用于網(wǎng)頁的交互設(shè)計,事故致因結(jié)果展示選擇Pyecharts作為可視化工具。

        3 基于規(guī)則模式的事故分析驗證

        選取2007 年山西省臨汾市洪洞縣左木鄉(xiāng)瑞之源煤業(yè)公司重大瓦斯爆炸事故案例進行抽取展示,并將信息抽取結(jié)果分別以Html 文檔和Excel 文件保存,便于人工后續(xù)對結(jié)果的統(tǒng)計分析。

        3.1 事故致因結(jié)果抽取

        1)事故基本信息。2007 年12 月5 日左木鄉(xiāng)瑞之源煤業(yè)公司發(fā)生1 起瓦斯爆炸事故,共傷亡105人。5 日23:00,調(diào)度值班員聽到井下爆炸聲后向正副礦長匯報;副礦長在井口詢問情況后到通風(fēng)機房送電失敗,盲目組織人員下井施救,致使15 名施救人員CO 中毒死亡;6 日5:00 向安監(jiān)局報告事故。經(jīng)調(diào)查,事故發(fā)生地點處于無風(fēng)作業(yè)狀態(tài),造成瓦斯大量積聚超限,工人違章爆破產(chǎn)生火焰引爆瓦斯。事故直接原因:①該礦超層越界、亂采濫挖;②非法盜采的9#煤層以掘代采作業(yè)點(40 m 盲巷)無風(fēng)作業(yè),造成瓦斯積聚,達到爆炸界限;③違章放炮產(chǎn)生火焰,引起瓦斯爆炸;煤塵參與爆炸。事故間接原因:①該礦長期違法超層越界盜采9#煤層;②違規(guī)超能力;超定員組織生產(chǎn)。事故發(fā)生后,該礦未按規(guī)定及時上報,遲報近6 h;在施救人員沒有佩戴專業(yè)救護裝備的情況下,盲目組織施救,造成次生事故的發(fā)生;該礦在停產(chǎn)整頓期間嚴(yán)重超能力、超定員組織生產(chǎn);在盜采9#煤層時,沒有合理的通風(fēng)系統(tǒng),沒有安裝瓦斯檢測監(jiān)控系統(tǒng)。

        2)事故致因信息抽取。將處理為txt 文本類型格式的報告,讀入致因信息抽取腳本程序,首先對文本進行分塊預(yù)處理,并對事故原因描述段落進行打印。

        對事故致因信息進行抽取,加載事故致因詞典和關(guān)鍵詞庫至程序,對事故原因段落的關(guān)鍵語句進行抽取。調(diào)用Jieba 分詞工具,對關(guān)鍵語句進行分詞,在完成分詞工作后通過與事故致因詞典進行匹配,獲取引起本次事故致因分析結(jié)果。使用Pandas對結(jié)果進行封裝,形成Excel 文件;利用Pyecharts 對抽取所得的數(shù)據(jù)進行可視化處理,形成Html 文檔,將Excel 文件和Html 文檔導(dǎo)出保存。

        使用Google Chrome 瀏覽器打開導(dǎo)出Html 文檔,可查看事故致因可視化Tree 圖結(jié)果,事故致因信息可視化情況如圖3。

        圖3 事故致因信息可視化Tree 圖Fig.3 Visualization Tree of accident cause information

        3.2 事故致因信息人工分析

        24Model 模型事故原因分析圖如圖4。

        圖4 24Model 事故原因分析圖Fig.4 Accident cause analysis diagram of 24Model

        利用24Model 對本事故原因進行人工分析,主要內(nèi)容為一次性行為和物態(tài)。一次性行為是事故發(fā)生的直接原因,包括不安全行為和不安全物態(tài)2 個方面。分析事故報告可知以下問題:①不安全行為:放炮不使用水炮泥封孔、沒有合理的通風(fēng)系統(tǒng)、超能力生產(chǎn)、未執(zhí)行“一炮三檢”、采取作假圖紙進行生產(chǎn)、超層越界、亂采濫挖;②不安全物態(tài):工作面無風(fēng)、瓦斯超限、無瓦斯監(jiān)控系統(tǒng)。

        3.3 抽取結(jié)果驗證

        為驗證抽取結(jié)果的準(zhǔn)確性,簡單對構(gòu)造抽取方法獲取的直接原因統(tǒng)計結(jié)果與事故報告及人工分析進行對比,程序抽取與人工分析對比見表4。

        表4 程序抽取與人工分析對比Table 4 Comparison between program extraction and manual analysis

        由表4 可知:程序抽取所抽取的致因因素均包含在內(nèi),且更具有邏輯性,更具有事故預(yù)防的實用性;而人工分析事故報告中將原因簡單分為直接原因和間接原因,未將原因進行分類,難以根據(jù)原因結(jié)果提出預(yù)防對策;程序抽取與人工分析進行對比,可發(fā)現(xiàn)在準(zhǔn)確率方面,契合度較高,覆蓋人工分析所得結(jié)果的90%,由此證明了所構(gòu)建方法的可靠性和抽取結(jié)果的準(zhǔn)確性,能夠用于瓦斯爆炸事故的分析。

        4 結(jié) 語

        通過學(xué)科交叉的方式,構(gòu)建基于規(guī)則模式的煤礦瓦斯爆炸事故信息提取技術(shù)方法,對在非結(jié)構(gòu)化文本中快速提取瓦斯爆炸事故信息,基于大數(shù)據(jù)的安全生產(chǎn)態(tài)勢動態(tài)評估及指導(dǎo)安全生產(chǎn)進行精細(xì)化管理具有重要意義。針對專業(yè)性較強的案例致因提取,提出了基于規(guī)則模式的煤礦瓦斯爆炸事故信息抽取技術(shù)的方法和流程;在事故致因24Model 模型基礎(chǔ)上,構(gòu)建了煤礦瓦斯爆炸事故的關(guān)鍵詞庫和事故致因字典;將抽取結(jié)果與人工分析進行對比,抽取的致因結(jié)果覆蓋人工分析的90%,證明所構(gòu)建方法的可靠性和抽取結(jié)果的準(zhǔn)確性,能夠用于瓦斯爆炸事故的分析。

        猜你喜歡
        物態(tài)瓦斯事故
        “物態(tài)變化”知識延伸
        物態(tài)變化真奇妙 熔化凝固常見到
        “物態(tài)變化”知識拓展
        學(xué)中文
        11采區(qū)永久避難硐室控制瓦斯涌出、防止瓦斯積聚和煤層自燃措施
        廢棄泄漏事故
        小恍惚 大事故
        好日子(2018年9期)2018-10-12 09:57:28
        高瓦斯礦井防治瓦斯異常涌出措施的應(yīng)用
        第三章物態(tài)變化
        瓦斯探鉆鉆頭的一種改進
        影音先锋中文字幕无码资源站| av福利资源在线观看| 日韩一二三四区在线观看| 中文字幕免费在线观看动作大片| 亚洲av无码av制服另类专区| 久久这里只有精品9| 亚洲一本之道高清在线观看| 国产成年人毛片在线99| 欧洲vat一区二区三区| 毛片免费在线观看网址| 国产精品综合色区av| 老熟女老女人国产老太| 国产人妻久久精品二区三区老狼| 日日人人爽人人爽人人片av| 自拍视频在线观看成人| 人妻中文字幕在线中文字幕| 亚洲国产精品无码专区影院| 国产女精品| 国产99久久久国产精品免费| 国产av无码专区亚洲av果冻传媒 | 婷婷色香五月综合激激情| 亚洲另类国产综合第一| 日本女优在线观看一区二区三区| 人妻少妇久久中中文字幕| 黑人上司粗大拔不出来电影| 国产香蕉尹人综合在线观| 日韩精品成人一区二区三区| 久久人人爽人人爽人人片av高请| 久久久久久免费毛片精品| 日韩国产有码在线观看视频| 亚洲成人一区二区av| 四虎影视成人永久免费观看视频 | 欧美日韩国产高清| 深夜一区二区三区视频在线观看| 天堂中文最新版在线中文| 69精品免费视频| 在线观看免费的黄片小视频| 亚洲午夜av久久久精品影院色戒| 亚洲另类精品无码专区| 色琪琪一区二区三区亚洲区| 亚洲一区二区免费在线观看视频 |