亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于自然語言處理的故障應急事故報告自動生成研究

        2021-04-22 09:17:44張鋒明陳武軍陳明強
        浙江電力 2021年3期
        關鍵詞:報告故障方法

        錢 鋼,金 鑫,張鋒明,朱 峰,陳 楠,陳武軍,陳明強,汪 力

        (1.國網(wǎng)浙江省電力有限公司紹興供電公司,浙江 紹興 312000;2.寧波天靈信息科技有限公司,浙江 寧波 315000)

        0 引言

        為掌握故障應急事故發(fā)生情況,采取有效的防控方案,需對故障應急事故實施常規(guī)分析[1],各級故障應急事故管理單位需依據(jù)相關標準,結(jié)合當前監(jiān)測數(shù)據(jù)對故障應急事故實施分析并編寫報告[2]。由于故障應急事故報告中包含大量數(shù)據(jù),且需對這些數(shù)據(jù)進行多次統(tǒng)計分析,導致報告中容易出現(xiàn)大量重復內(nèi)容和錯誤數(shù)據(jù)[3]。同時由于檢測報告來源不同,其內(nèi)容與格式也有所差異,相關學者對此進行了研究,周啟等人[4]以大壩安全監(jiān)測資料分析報告自動生成系統(tǒng)為研究對象,以系統(tǒng)方案、實現(xiàn)技術、功能要求等為研究內(nèi)容,實現(xiàn)監(jiān)測資料整編分析報告生成的自動化、規(guī)范化和專業(yè)化,該系統(tǒng)科學高效,滿足水庫大壩安全管理需要;楊夢、周恩波[5]構建了一個基于專家系統(tǒng)的煤礦事故現(xiàn)場處置報告自動生成系統(tǒng),系統(tǒng)整合了應急預案、安全規(guī)章制度、領域?qū)<液褪鹿拾咐木仍幹梅椒ㄒ约敖?jīng)驗知識,在發(fā)生事故時可以根據(jù)事故現(xiàn)場實時信息,匹配規(guī)則進行推理,得到所需處置措施,指揮人員還可以輸入查詢信息,搜索符合查詢條件且與當前事故特征最相似的歷史事故案例,獲取真實歷史救援經(jīng)驗知識支持。但上述方法受時間與需求影響,應急報告內(nèi)容與格式會有所變化,因此需要提出一種更加有效的故障應急事故報告自動生成方法。

        作為計算機科學領域和人工智能領域的主要研究內(nèi)容之一,自然語言處理技術包含語言學、計算機科學等數(shù)門科學內(nèi)容,通過研究日常使用的自然語言,利用計算機正確處理人類自然語言,實現(xiàn)人與計算機間自然語言有效溝通[6]。因此,本文基于自然語言處理技術對故障應急事故報告自動生成方法進行了研究。

        1 故障應急事故報告自動生成方法

        1.1 故障應急事故報告自動生成方法結(jié)構設計

        基于自然語言處理的故障應急事故報告自動生成方法主要由數(shù)據(jù)來源、數(shù)據(jù)標準處理、資料分析、報告生成等環(huán)節(jié)組成,具體結(jié)構如圖1 所示。

        圖1 故障應急事故報告自動生成結(jié)構

        基于自然語言處理的故障應急事故報告自動生成方法中,數(shù)據(jù)來源由數(shù)據(jù)庫與模板庫共同組成[7],將所采集的監(jiān)測數(shù)據(jù)納入到數(shù)據(jù)庫內(nèi),同時依照相關標準定制可配置的模板庫,數(shù)據(jù)來源是故障應急事故報告自動生成的基礎[8]。

        數(shù)據(jù)標準處理是以數(shù)據(jù)來源為基礎,對相關數(shù)據(jù)進行數(shù)據(jù)查詢、管理與檢驗等操作,其中數(shù)據(jù)管理采用OLE(對象鏈接和嵌入)服務功能,利用該功能可將采集于不同應用程序的數(shù)據(jù)信息創(chuàng)建為復合文檔[9],適用于大部分類型數(shù)據(jù)。Visual C++完全支持OLE 自動化,通過Visual C++能夠有效編譯自動化控制器,控制Word 等文字處理應用程序,協(xié)同完成報告自動生成任務。采用這種方法,可在無須人工操作的條件下,令兩個應用程序自動相互作用。

        資料分析環(huán)節(jié)依照數(shù)據(jù)標準處理、模板格式與內(nèi)容要求,基于相關數(shù)據(jù)進行圖表繪制、模型構建與在線分析,考慮故障應急事故專業(yè)需求,可在部分有需要的條件下提供在線分析,完成專業(yè)數(shù)據(jù)分析。數(shù)據(jù)在線分析過程中采用自然語言處理技術,利用基于詞典與規(guī)則的語法分析算法,可令生成的故障應急事故報告具有更強的適應性[10]。

        報告生成環(huán)節(jié)依照資料分析結(jié)果與模板需求,自動進行監(jiān)測數(shù)據(jù)分析報告配置與生成,用戶可依照實際需求與自身習慣在Web 端設計模板報告樣式,在服務器終端自動生成報告并展示。

        1.2 數(shù)據(jù)檢驗

        由于數(shù)據(jù)庫內(nèi)的數(shù)據(jù)來源于不同應用程序,為保障生成報告內(nèi)數(shù)據(jù)的準確性與統(tǒng)一性,需要數(shù)據(jù)進行檢驗處理,利用得分匹配法對數(shù)據(jù)進行缺失值借補處理[11]。

        由于數(shù)據(jù)管理過程中不同變量間具有一定相關性,因此考慮故障應急事故統(tǒng)計數(shù)據(jù)的縱向數(shù)據(jù)集的變量特點,選取得分匹配法實施借補,即在包含完整數(shù)據(jù)的時間點記錄內(nèi),確定與缺失數(shù)據(jù)時點記錄內(nèi)未缺失變量取值得分匹配度最高的時點記錄,基于該完整時點記錄內(nèi)的對應變量值,結(jié)合實際變量完成數(shù)據(jù)借補,詳細過程如下。

        以Xit表示變量,其中,i=1,2,…,I 表示變量數(shù)量,t=1,2,…,T 表示變量取值的時點數(shù)量。在X11缺失的條件下,可在包含完成數(shù)據(jù)的記錄內(nèi)確定一個t 值,由此令匹配值k 為:

        其中,?i表示依照第i 個變量觀測數(shù)據(jù)確定的標準差。不同時點下變量的取值差異除以?i的主要目的是消除不同變量的量綱差別。

        基于式(1)得到借補值為:

        檢驗完成后,利用OLE 服務功能,將采集于不同應用程序的數(shù)據(jù)信息創(chuàng)建為復合文檔。

        1.3 自然語言處理技術

        利用計算機準確處理人類自然語言,分析并明確自然語言的含義是自然語言處理技術的主要目標[12]。基于上述創(chuàng)建的復合文檔,利用自然語言處理技術能夠提升故障應急事故報告的適應性。自然語言處理流程圖如圖2 所示。

        圖2 自然語言處理流程

        對復合文檔內(nèi)的句子進行自然語言處理的過程包括數(shù)據(jù)結(jié)構定義、詞性標注、句法分析、語義識別與數(shù)據(jù)提取等。

        1.3.1 數(shù)據(jù)結(jié)構定義與詞性標注

        數(shù)據(jù)結(jié)構定義是將復合文檔內(nèi)的數(shù)據(jù)信息劃分為單詞與句子兩個數(shù)據(jù)結(jié)構。

        單詞結(jié)構所體現(xiàn)的是單詞內(nèi)的文字、詞性與句子成分等屬性,并對單詞的基本操作實施定義。單詞詞性可通過單個字母代表,如表1 所示。詞性標注可依照故障應急事故報告的詳細要求進行對應的修正與擴展[13]。

        句子結(jié)構內(nèi)存在一個哈希表,其主要功能是存儲句子內(nèi)的全部單詞,并對句子的基本操作(如句子長度、附加單詞等)進行定義。

        表1 詞性分析

        1.3.2 句法分析

        可將一個給定的輸入句子確定句法分析樹的過程理解為是句法分析過程[14]。例如復合文檔的輸入語句為:“The machine is running”。其句法分析樹如圖3 所示。

        圖3 句法分析樹

        輸入語句由名詞短語和動詞短語共同組成,兩者分別由冠詞、名詞和動詞、形容詞組成。

        句法分析算法使用改進的圖句法分析算法,有n 個詞語的語句的圖由n+1 個頂點與數(shù)條連接頂點的邊組成,若一條邊與相鄰邊匹配,則可將其擴展后置入圖內(nèi),初始邊則定義為新邊的孩子邊。這樣,句法分析結(jié)束后,僅需確定由第一個節(jié)點至最后一個節(jié)點的邊,即可獲取一棵語法分析樹,利用這棵樹能夠?qū)崿F(xiàn)全部邊的遍歷。

        1.3.3 語義識別與數(shù)據(jù)提取

        由于報告中所用信息來源于不同應用程序,因此普遍存在信息重復的問題,考慮故障應急事故報告內(nèi)容清晰性與簡潔性要求,需要通過一致度比較算法確定一致度較高內(nèi)容,并清除多余內(nèi)容。一致度描述的是兩者間的共性與區(qū)別[15],兩者間的共性與一致度之間呈正比例相關;兩者間的區(qū)別與一致度之間呈反比例相關。

        一致度計算過程中采用基于向量空間模型的文本一致度算法,向量空間模型內(nèi),可將故障應急事故報告定義為由相互獨立詞條組(C1,C2,…,Cn)組成,統(tǒng)計單個詞條Ci的數(shù)量,確定Ci的詞頻,確定整個故障應急事故報告內(nèi)Ci詞條所占的權重,以Qi表示。由此可將故障應急事故報告文本間的一致度轉(zhuǎn)換成向量間夾角的余弦值,通過夾角描述一致度,兩者間呈反比例相關,即夾角越大,對應的一致度值(余弦值)越小,文本間一致度越低。以P1和P2分別表示兩份來源不同應用程序的信息文檔,則可通過式(3)描述P1和P2間的一致度:

        利用式(3)可確定兩份來源于不同應用程序的信息文檔的一致度,設定一致度閾值。當兩份文檔一致度計算結(jié)果低于設定閾值時,還需進行自然段落的一致度計算,具體計算流程如下:

        流程1:對P1和P2進行自然分段處理,針對自然分段后獲取的各段文檔實施分詞、去除停用詞等預處理,同時確定各段文檔內(nèi)詞的權重。

        流程2:設定一個閾值,利用式(3)計算P1文檔內(nèi)的自然段落P1i同P2內(nèi)全部自然段落的一致度S,對比S 與閾值,若前者大于后者,需記錄P2文檔內(nèi)的段落與對應的S 值,若前者小于后者,需進行流程。

        流程3:重復流程2,至P1文檔內(nèi)全部段落同P2文檔內(nèi)全部段落對比完成。

        流程4:確定所記錄的段落數(shù)量,進行標記,獲取一致度較高的自然段落。

        一致度計算具體流程如圖4 所示。

        2 實驗分析

        為驗證基于自然語言處理的故障應急事故報告自動生成方法的應用性能,以某發(fā)電廠為應用對象,在其中某項設備發(fā)生故障的條件下,采用所提方法自動生成故障應急事故報告測試,結(jié)果如下。

        2.1 數(shù)據(jù)采集精度

        對比所提方法中數(shù)據(jù)庫內(nèi)采集故障設備數(shù)據(jù)與故障設備原始數(shù)據(jù),所得結(jié)果如圖5 所示。

        圖4 一致度計算流程

        圖5 數(shù)據(jù)對比結(jié)果

        圖5 內(nèi)所提方法采集數(shù)據(jù)大體上與故障設備原始數(shù)據(jù)走勢相同,部分區(qū)域存在一定差距的原因主要是應用對象中的設備發(fā)生故障,導致監(jiān)測數(shù)據(jù)(即采集數(shù)據(jù))存在一定缺失現(xiàn)象。

        2.2 數(shù)據(jù)借補測試

        以基于水晶報表的報告自動生成方法和基于專家系統(tǒng)的報告自動生成方法為對比方法,采用所提方法和對比方法對上一實驗中缺失的數(shù)據(jù)進行借補處理,記錄任意時間點下不同方法借補處理后所得數(shù)據(jù)與實際數(shù)據(jù)間的絕對偏差,結(jié)果如表2 所示。

        分析表2 得到:隨著數(shù)據(jù)缺失比例的提升,不同方法對采集數(shù)據(jù)實施借補處理后,數(shù)據(jù)的絕對偏差也呈不同程度的上升趨勢。采用所提方法對采集數(shù)據(jù)進行借補處理后,不同時間點下數(shù)據(jù)的絕對偏差始終低于另外兩種對比方法,且不同時間點下與兩種對比方法相比差異達到50%以上,由此說明所提方法具有較高的數(shù)據(jù)借補精度。

        表2 數(shù)據(jù)借補測試結(jié)果

        2.3 詞性標注測試

        統(tǒng)計所提方法對故障應急事故報告內(nèi)信息的不同詞性實施標注后的查準率、查全率與準確度,結(jié)果如表3 所示。

        表3 詞性標注測試結(jié)果

        分析表3 得到,所提方法對報告信息的不同詞性進行標注后,不同詞性標注的查準率、查全率與準確度均值分別為95.67%,94.10%和94.47%,由此說明所提方法在詞性標注方面具有較高的精度,能夠令所提方法具有更好的性能。

        2.4 語義識別精度測試

        圖6 為所提方法在實際報告生成過程中的語義識別精度測試結(jié)果。

        圖6 語義識別精度測試結(jié)果

        分析圖6 可得到,所提方法對不同自然段落進行語義識別所得的一致度結(jié)果與實際一致度值大致相同,計算結(jié)果誤差控制在1.5%以內(nèi)。由此說明所提方法具有較高的語義識別精度。

        結(jié)合2.2 節(jié)、2.3 節(jié)和2.4 節(jié)實驗結(jié)果可知,所提方法對于自然語言處理具有較高的精度,可實現(xiàn)故障應急事故報告自動生成,規(guī)范報告編制內(nèi)容。

        2.5 實時能耗測試

        圖7 為所提方法實際報告生成過程中的實時能耗。

        圖7 實時能耗曲線

        分析圖7 得到,所提方法在實際報告生成過程中的實時能耗基本控制在0.01×10-4~0.06×10-4J/s,平均能耗約為0.032×10-4J/s。實驗數(shù)據(jù)表明所提方法在實際報告生成過程中具有較低的實時能耗。

        2.6 報告規(guī)范性驗證

        在上述驗證基礎上,對生成的報告規(guī)范性進行了測評,測評結(jié)果如表4 所示。

        表4 故障應急事故報告規(guī)范性評價

        如表4 所示,所生成的報告規(guī)范性滿意度較高,平均完全滿意度在98%以上,可以應用在實際中。

        3 結(jié)語

        研究基于自然語言處理的故障應急事故報告自動生成方法,根據(jù)所采集故障設備數(shù)據(jù),采用自然語言處理技術中的數(shù)據(jù)結(jié)構定義、詞性標注、句法分析、語義識別與數(shù)據(jù)提取等過程自動生成故障應急事故報告,實驗結(jié)果顯示所提方法中自然語言處理技術具有較高的精度。

        猜你喜歡
        報告故障方法
        故障一點通
        一圖看懂十九大報告
        報告
        南風窗(2016年26期)2016-12-24 21:48:09
        可能是方法不對
        奔馳R320車ABS、ESP故障燈異常點亮
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        報告
        南風窗(2015年22期)2015-09-10 07:22:44
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        捕魚
        故障一點通
        亚洲精品动漫免费二区| 国内精品久久人妻性色av| 国产人妖伦理视频在线观看| 新婚人妻不戴套国产精品| 久久综合九色综合欧美狠狠| 在线观看视频亚洲| 亚洲人妻有码中文字幕| 麻豆视频在线播放观看| 亚洲国产欧美日韩欧美特级 | 香蕉视频一级片| 激情视频在线观看国产中文| 中美日韩在线一区黄色大片| 亚洲av无码乱码国产精品| 熟妇人妻AV中文字幕老熟妇| 国产颜射视频在线播放| 日韩中文字幕素人水野一区| 久久99热狠狠色精品一区| 99久久精品国产一区二区蜜芽 | 一区二区视频在线观看地址| 国色天香精品一卡2卡3卡4| 这里只有久久精品| 亚洲中文字幕永久网站| 午夜被窝精品国产亚洲av香蕉| 亚洲高清乱码午夜电影网| 久久不见久久见免费视频7| 久国产精品久久精品国产四虎 | 国产农村妇女高潮大叫| 2021年性爱喷水视频| 日本熟妇中出高潮视频| 国产二级一片内射视频播放| 牛牛本精品99久久精品88m| 亚洲福利第一页在线观看| 国产av久久在线观看| 国产麻豆成人精品av| 欧美日韩免费一区中文字幕| 永久免费看黄网站性色| 艳妇臀荡乳欲伦69调教视频| 久久AV老司机精品网站导航| 自拍视频在线观看成人| 亚洲av丰满熟妇在线播放| 欧美老妇与zozoz0交|