亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于大數(shù)據(jù)的鐵路安全信息與技術(shù)規(guī)章協(xié)同分析系統(tǒng)

        2020-03-13 12:24:52孫玉明李福順
        關(guān)鍵詞:全文檢索規(guī)章條款

        劉 新,呂 峰,孫玉明,李福順

        (1.中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司 運(yùn)輸及經(jīng)濟(jì)研究所,北京 100081;2.中國(guó)國(guó)家鐵路集團(tuán)有限公司 安全監(jiān)督管理局,北京 100844;3.中國(guó)國(guó)家鐵路集團(tuán)有限公司 科技與信息化部,北京 100844;4.中國(guó)鐵路北京局集團(tuán)有限公司 豐臺(tái)機(jī)務(wù)段,北京 100070)

        安全是鐵路的生命線,但是鐵路作為一個(gè)復(fù)雜的巨型系統(tǒng),在某種程度上,鐵路交通事故是鐵路運(yùn)輸生產(chǎn)的必然附帶品。因此,當(dāng)事故發(fā)生時(shí),及時(shí)、準(zhǔn)確地對(duì)事故進(jìn)行分析和判斷,明確事故原因和責(zé)任,以便為事故預(yù)防提供決策支持,是一項(xiàng)重要的安全管理工作。其中,對(duì)于違章導(dǎo)致的事故,明確其違反的具體規(guī)章和條款是鐵路交通事故分析中的重要一環(huán),目前,這項(xiàng)工作主要由人工完成。由于技術(shù)規(guī)章繁多,并且涉及眾多不同的專業(yè),對(duì)事故調(diào)查人員及時(shí)、準(zhǔn)確地進(jìn)行分析判斷提出了不小的挑戰(zhàn)。

        近年來(lái),大數(shù)據(jù)、自然語(yǔ)言處理等技術(shù)在鐵路安全領(lǐng)域的研究和應(yīng)用越來(lái)越得到重視,王同軍[1]認(rèn)為安全大數(shù)據(jù)是鐵路大數(shù)據(jù)應(yīng)用的一個(gè)重要方面;鄒丹等人[2]、宋修德等人[3]探討了大數(shù)據(jù)平臺(tái)的設(shè)計(jì)和應(yīng)用;寧勇[4]研究了基于大數(shù)據(jù)的安全預(yù)警方法;楊連報(bào)等人[5]研究了利用文本大數(shù)據(jù)分析技術(shù)對(duì)事故報(bào)告進(jìn)行文本挖掘,并分析了幾個(gè)典型的應(yīng)用場(chǎng)景,但僅限于對(duì)事故報(bào)告文本所提取信息的分析。

        經(jīng)過(guò)多年的信息化建設(shè),我國(guó)已建成了相對(duì)比較完善的鐵路安全監(jiān)督管理信息系統(tǒng)和鐵路技術(shù)規(guī)章管理系統(tǒng),實(shí)現(xiàn)了全路交通事故和技術(shù)規(guī)章的電子化管理。因此,將鐵路安全信息與鐵路技術(shù)規(guī)章數(shù)據(jù)進(jìn)行融合應(yīng)用,借助于大數(shù)據(jù)、自然語(yǔ)言處理等先進(jìn)技術(shù),對(duì)事故概況等安全信息進(jìn)行智能化的自動(dòng)分析判斷,在人工輔助下提取相關(guān)技術(shù)規(guī)章條款,實(shí)現(xiàn)鐵路安全監(jiān)督管理信息系統(tǒng)與鐵路技術(shù)規(guī)章管理系統(tǒng)的有機(jī)融合,有助于提高事故分析的準(zhǔn)確性,推動(dòng)事故調(diào)查手段的智能化。

        1 業(yè)務(wù)需求分析和系統(tǒng)功能設(shè)計(jì)

        1.1 業(yè)務(wù)需求分析

        根據(jù)鐵路交通事故調(diào)查流程,有事故發(fā)生時(shí),列車(chē)調(diào)度員要在第一時(shí)間填寫(xiě)《鐵路交通事故(設(shè)備故障)概況表》(安監(jiān)報(bào)1)并提報(bào)事故發(fā)生地安全監(jiān)察值班人員;安全監(jiān)察值班人員接到安監(jiān)報(bào)1或現(xiàn)場(chǎng)事故報(bào)告后,要立即填寫(xiě)《鐵路交通事故基本情況表》(安監(jiān)報(bào)3),并向中國(guó)國(guó)家鐵路集團(tuán)有限公司(簡(jiǎn)稱:國(guó)鐵集團(tuán))安監(jiān)局值班人員報(bào)告[6]。根據(jù)事故等級(jí),由相應(yīng)部門(mén)或授權(quán)的相應(yīng)部門(mén)組織有關(guān)人員進(jìn)行事故調(diào)查,厘清事故原因,認(rèn)定事故責(zé)任,總結(jié)事故教訓(xùn);國(guó)鐵集團(tuán)安監(jiān)局和鐵路局集團(tuán)公司(簡(jiǎn)稱:鐵路局)安監(jiān)室需要定期對(duì)鐵路交通事故情況進(jìn)行統(tǒng)計(jì)分析。事故報(bào)告信息流程如圖1所示。

        在事故調(diào)查分析初期,事故概況是分析該事故違反的具體技術(shù)規(guī)章條款的主要依據(jù);但由于事故概況大多只是對(duì)事故現(xiàn)象的簡(jiǎn)單概括性描述,單從事故概況入手去分析和確定違反的規(guī)章條款,可能性微乎其微。通過(guò)對(duì)歷史事故報(bào)告的數(shù)據(jù)挖掘,可以獲取事故概況與違反的技術(shù)規(guī)章及條款之間的某種關(guān)聯(lián),借助于建立在大數(shù)據(jù)基礎(chǔ)上的這種關(guān)聯(lián)性,根據(jù)事故概況的文本描述,大概率能夠檢索到相關(guān)的規(guī)章條款,輔之以人工分析和確認(rèn),實(shí)現(xiàn)對(duì)鐵路交通事故進(jìn)行智能化分析的目標(biāo)[7]。

        1.2 系統(tǒng)功能設(shè)計(jì)

        在業(yè)務(wù)需求分析的基礎(chǔ)上,設(shè)計(jì)開(kāi)發(fā)鐵路安全信息與技術(shù)規(guī)章協(xié)同分析系統(tǒng),系統(tǒng)功能主要包括事故分析、智能檢索、統(tǒng)計(jì)分析及系統(tǒng)管理等。

        1.2.1 事故分析

        根據(jù)事故概況、基于大數(shù)據(jù)和自然語(yǔ)言處理技術(shù)構(gòu)建的鐵路專業(yè)關(guān)鍵詞庫(kù)可自動(dòng)提取事故特征,智能推薦事故可能違反的技術(shù)規(guī)章條款。同時(shí),用戶可以根據(jù)推薦結(jié)果進(jìn)行關(guān)鍵詞調(diào)整,或者縮小規(guī)章推薦范圍,以提高推薦準(zhǔn)確率。

        1.2.2 智能檢索

        用戶可輸入任意關(guān)鍵詞或詞組,對(duì)技術(shù)規(guī)章庫(kù)進(jìn)行全文檢索,并按與關(guān)鍵詞的關(guān)聯(lián)度對(duì)檢索結(jié)果進(jìn)行排序。系統(tǒng)支持在第一次檢索結(jié)果中進(jìn)行二次檢索,并可通過(guò)設(shè)置特定條件進(jìn)行高級(jí)檢索,提高規(guī)章檢索的準(zhǔn)確率。為提高檢索召回率,系統(tǒng)可利用中文分詞算法對(duì)用戶輸入的詞組進(jìn)行分詞處理后再進(jìn)行全文檢索。

        1.2.3 統(tǒng)計(jì)分析

        包括事故統(tǒng)計(jì)和關(guān)聯(lián)分析。事故統(tǒng)計(jì)以表格和圖形相結(jié)合的形式,從多個(gè)維度對(duì)事故發(fā)生情況進(jìn)行分類(lèi)展示;關(guān)聯(lián)分析功能則對(duì)違反某一規(guī)章或條款的事故數(shù)量進(jìn)行統(tǒng)計(jì),建立技術(shù)規(guī)章與事故之間的關(guān)聯(lián)關(guān)系,輔助技術(shù)規(guī)章管理人員對(duì)技術(shù)規(guī)章的應(yīng)用和適用情況進(jìn)行分析,以便為技術(shù)規(guī)章的編修、培訓(xùn)等工作提供決策支持。

        1.2.4 系統(tǒng)管理

        主要包括角色管理、用戶管理和操作日志等功能。系統(tǒng)將所有的功能模塊分解為相對(duì)獨(dú)立的子功能模塊,可根據(jù)用戶類(lèi)別的不同設(shè)定不同的角色,并可根據(jù)需要為每個(gè)角色賦予不同的權(quán)限(子功能模塊組合);而用戶則與角色綁定,系統(tǒng)管理員可以隨時(shí)根據(jù)需要對(duì)用戶的角色進(jìn)行調(diào)整[8]。

        2 技術(shù)路線及系統(tǒng)架構(gòu)設(shè)計(jì)

        2.1 技術(shù)路線

        (1)采用自然語(yǔ)言處理領(lǐng)域中前沿的機(jī)器學(xué)習(xí)模型對(duì)海量事故報(bào)告進(jìn)行智能分析,搭建機(jī)器學(xué)習(xí)模型,抽取能夠表征事故特征的關(guān)鍵詞并訓(xùn)練機(jī)器學(xué)習(xí)模型,以滿足系統(tǒng)自動(dòng)分析的要求。

        (2)搭建事故智能檢索平臺(tái),使用自然語(yǔ)言領(lǐng)域領(lǐng)先的智能語(yǔ)義分析和全文檢索技術(shù),從海量技術(shù)規(guī)章庫(kù)中根據(jù)關(guān)鍵詞,智能、快速、準(zhǔn)確、高效地檢索出目標(biāo)規(guī)章及條款。

        2.2 系統(tǒng)總體架構(gòu)

        鐵路安全信息與技術(shù)規(guī)章協(xié)同分析系統(tǒng)的總體架構(gòu)由數(shù)據(jù)接入、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析、數(shù)據(jù)資源管理和接入服務(wù)5層結(jié)構(gòu)組成,如圖2所示。

        (1)數(shù)據(jù)接入:系統(tǒng)接入的數(shù)據(jù)主要包括2部分,鐵路安全監(jiān)督管理信息系統(tǒng)的事故信息和鐵路技術(shù)規(guī)章管理系統(tǒng)的技術(shù)規(guī)章數(shù)據(jù)。

        (2)數(shù)據(jù)存儲(chǔ):根據(jù)數(shù)據(jù)量的大小、應(yīng)用方向的不同,將收集來(lái)的數(shù)據(jù)以不同的方式進(jìn)行存儲(chǔ)。例如,大量的離線計(jì)算數(shù)據(jù)存儲(chǔ)在HDFS里,緩存數(shù)據(jù)存儲(chǔ)在Redis里,關(guān)系型數(shù)據(jù)存儲(chǔ)在Oracle數(shù)據(jù)庫(kù)中[9]。

        (3)數(shù)據(jù)分析:對(duì)各種數(shù)據(jù)進(jìn)行預(yù)處理、清洗、加工、學(xué)習(xí)、計(jì)算、建模,輸出系統(tǒng)需要的數(shù)據(jù)類(lèi)型,以及各種模型和接口。

        (4)數(shù)據(jù)資源管理:對(duì)各種類(lèi)型的數(shù)據(jù)、計(jì)算模型和相應(yīng)的接口進(jìn)行管理,并生成相應(yīng)的平臺(tái)供最外層調(diào)用,包括各種資源的管理、應(yīng)用開(kāi)發(fā)、開(kāi)放平臺(tái)等。

        (5)接入服務(wù):提供相應(yīng)的接口和平臺(tái),供展示和第三方調(diào)用。

        3 系統(tǒng)關(guān)鍵技術(shù)研究

        3.1 事故智能分析

        (1)標(biāo)準(zhǔn)的鐵路交通事故報(bào)告通常包含事故概況、調(diào)查情況、原因分析、定性定責(zé)、整改措施等多個(gè)部分,根據(jù)對(duì)歷史事故報(bào)告文本的語(yǔ)義分析和數(shù)據(jù)挖掘,可以提取事故特征及事故違反的具體規(guī)章條款的特征,從而在事故特征與規(guī)章條款特征之間建立關(guān)聯(lián)關(guān)系。對(duì)全部歷史事故報(bào)告分析完成后,即可初步建立事故特征與規(guī)章條款特征關(guān)聯(lián)庫(kù)(簡(jiǎn)稱:事故-規(guī)章關(guān)聯(lián)庫(kù)),事故特征與規(guī)章條款特征

        通常是多對(duì)多的關(guān)系。

        (2)對(duì)于需要分析的事故,系統(tǒng)根據(jù)安監(jiān)報(bào)3中的事故概況自動(dòng)提取事故特征,并根據(jù)事故特征檢索事故-規(guī)章關(guān)聯(lián)庫(kù)。如果事故-規(guī)章關(guān)聯(lián)庫(kù)中存在與該事故特征相關(guān)聯(lián)的規(guī)章特征,則取回規(guī)章特征,在規(guī)章庫(kù)中進(jìn)行檢索,然后由用戶在檢索返回的規(guī)章條款中確定作為事故原因的1個(gè)或多個(gè)條款;如果事故-規(guī)章關(guān)聯(lián)庫(kù)中沒(méi)有與該事故特征相關(guān)聯(lián)的規(guī)章特征,則由用戶根據(jù)經(jīng)驗(yàn)和專業(yè)知識(shí)將事故特征轉(zhuǎn)換為規(guī)章特征并進(jìn)行規(guī)章檢索。用戶確認(rèn)后的規(guī)章特征將自動(dòng)添加到事故-規(guī)章庫(kù)中,通過(guò)這種方式不斷豐富事故-規(guī)章庫(kù),提高根據(jù)事故概況檢索規(guī)章條款的準(zhǔn)確性,事故智能分析流程如圖3所示。

        3.2 技術(shù)規(guī)章全文檢索

        技術(shù)規(guī)章全文檢索采用開(kāi)源的Elasticsearch搜索引擎。Elasticsearch是一個(gè)分布式、高擴(kuò)展、高實(shí)時(shí)的搜索與數(shù)據(jù)分析引擎,能夠?qū)崿F(xiàn)接近實(shí)時(shí)地存儲(chǔ)、搜索和分析海量數(shù)據(jù),對(duì)結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)都有著很好的支持,同時(shí),它還有良好的可擴(kuò)展性,既能夠在筆記本電腦上運(yùn)行,也可以在承載了 PB 級(jí)數(shù)據(jù)的成百上千臺(tái)服務(wù)器上運(yùn)行,能夠根據(jù)業(yè)務(wù)需要進(jìn)行靈活的部署[10]。技術(shù)規(guī)章的全文檢索可以分為分詞處理和全文檢索2個(gè)過(guò)程。

        (1)分詞處理:系統(tǒng)支持根據(jù)任意關(guān)鍵詞或短語(yǔ)進(jìn)行規(guī)章檢索,由于對(duì)用戶輸入內(nèi)容沒(méi)有嚴(yán)格的限制,因此輸入的關(guān)鍵詞或短語(yǔ)具有一定的隨意性,未必能夠在技術(shù)規(guī)章中檢索到匹配的條款。為提高檢索的召回率,在檢索開(kāi)始之前,先對(duì)用戶輸入的關(guān)鍵詞或短語(yǔ)進(jìn)行分詞處理[11-12],分詞的依據(jù)是開(kāi)源分詞工具附帶的通用中文詞庫(kù)和根據(jù)鐵路行業(yè)特點(diǎn)自定義的鐵路專業(yè)詞庫(kù)。經(jīng)過(guò)多年積累,通用中文詞庫(kù)已經(jīng)漸趨完善,提升空間有限;鐵路專業(yè)詞庫(kù)則對(duì)分詞結(jié)果是否理想起著更大的作用,而它的完善有賴于對(duì)大量專業(yè)語(yǔ)料的占有和長(zhǎng)期的機(jī)器學(xué)習(xí)。

        (2)全文檢索:Elasticsearch是面向文檔的(Document Oriented),Elasticsearch中的一條數(shù)據(jù)就是一個(gè)文檔,用JSON作為文檔序列化的格式,形式簡(jiǎn)潔、清晰易讀,系統(tǒng)默認(rèn)為其中的每個(gè)字段都建立一個(gè)倒排索引,因而能夠?qū)崿F(xiàn)對(duì)全文的快速檢索[13]。對(duì)于檢索結(jié)果,主要依據(jù)詞頻-逆向文檔頻率(TF-IDF)值、關(guān)鍵詞權(quán)重等因素綜合計(jì)算文檔與關(guān)鍵詞的相關(guān)性,并按其從高至低顯示。

        4 結(jié)束語(yǔ)

        本文從業(yè)務(wù)需求入手,按照優(yōu)化的業(yè)務(wù)流程進(jìn)行系統(tǒng)功能設(shè)計(jì),系統(tǒng)架構(gòu)采用分層設(shè)計(jì),開(kāi)發(fā)語(yǔ)言采用Java,全文檢索功能基于Elasticsearch實(shí)現(xiàn)。根據(jù)模擬數(shù)據(jù)測(cè)試,鐵路安全信息與技術(shù)規(guī)章協(xié)同分析系統(tǒng)能夠基于事故概況,快速、準(zhǔn)確地推薦事故違反的技術(shù)規(guī)章條款,輔助安監(jiān)人員進(jìn)行事故分析,具有較好的應(yīng)用前景。但要進(jìn)一步提高事故分析和規(guī)章檢索的精確度,則需要在搜集和積累大量相關(guān)語(yǔ)料及用戶使用行為的基礎(chǔ)上,對(duì)模型進(jìn)行深度優(yōu)化。

        猜你喜歡
        全文檢索規(guī)章條款
        性侵未成年人新修訂若干爭(zhēng)議條款的理解與適用
        過(guò)度限制地方政府規(guī)章重復(fù)立法之思考
        正確審視“紐約假期”條款
        地方政府規(guī)章備案審查:參與及控制
        法律方法(2019年1期)2019-05-21 01:04:10
        On Knock-for-Knock Principle:Analysis of SUPPLYTIME 2017 Clause 14(a)
        青海省人民政府關(guān)于修改和廢止部分省政府規(guī)章的決定
        統(tǒng)一招投標(biāo)法規(guī)——談法律與規(guī)章的修改
        Oracle數(shù)據(jù)庫(kù)全文檢索性能研究
        制定一般反濫用條款:達(dá)成平衡
        基于KySou的全文檢索系統(tǒng)的分析與優(yōu)化
        亚洲av无码一区二区乱子伦| 精品亚洲一区二区区别在线观看| 狠狠色丁香婷婷久久综合| 精品麻豆国产色欲色欲色欲www| 国产欧美久久久另类精品| 欧美成人免费高清视频| 日韩AV无码一区二区三不卡| 人妻少妇激情久久综合| 国产一区国产二区亚洲精品| 国产精品一区二区在线观看| 中文字幕在线码一区| 精品国产1区2区3区AV| 一区二区亚洲精品国产精| 蜜桃av噜噜一区二区三区9| 国产欧美va欧美va香蕉在| 国产午夜三级一区二区三| 国产chinese在线视频| av天堂一区二区三区| 日本成年一区久久综合| 亚洲精品久久久www小说| 在线视频一区色| 亚洲av色在线观看网站| 日本人妻伦理在线播放| 国产午夜无码片在线观看影院| 精品88久久久久88久久久| 亚洲国产精品免费一区| 亚洲综合第一页中文字幕| 丰满的人妻hd高清日本| 国产av一区二区三区日韩| 国产精品深夜福利免费观看| 精品国产a毛片久久久av| 又紧又大又爽精品一区二区| 亚洲熟女乱色综合亚洲图片| 91热久久免费精品99| 91国产熟女自拍视频| 成年站免费网站看v片在线| 国产精品免费大片| 国产一级淫片免费大片| 国产人妖视频一区二区| 国产成人亚洲精品无码av大片| 专区国产精品第一页|