亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于文本挖掘和復(fù)雜網(wǎng)絡(luò)的事故致因重要度評(píng)估方法*
        ——以房屋市政較大以上事故為例

        2022-05-19 05:37:24陳志遠(yuǎn)王鐵驪
        關(guān)鍵詞:關(guān)聯(lián)文本

        陳志遠(yuǎn),王鐵驪

        (南華大學(xué) 經(jīng)濟(jì)管理與法學(xué)學(xué)院,湖南 衡陽(yáng) 421001)

        0 引言

        項(xiàng)目施工,安全第一。工程項(xiàng)目施工參與方眾多,施工現(xiàn)場(chǎng)復(fù)雜多變,安全管理任務(wù)尤為艱巨,不僅關(guān)系到各責(zé)任主體單位的經(jīng)濟(jì)效益,還直接影響到人民群眾的生命財(cái)產(chǎn)安全。為明確安全管理工作的內(nèi)容,進(jìn)行事前風(fēng)險(xiǎn)管控,很多學(xué)者聚焦于尋找事故致因的研究,主要包括案例分析、統(tǒng)計(jì)分析和構(gòu)建事故致因模型3類(lèi)?;诎咐治?,Zhou等[1]引入事故網(wǎng)絡(luò)理論,詳細(xì)分析杭州地鐵重大基坑坍塌事故的經(jīng)過(guò),提取了11條主要事故致因。統(tǒng)計(jì)分析則運(yùn)用統(tǒng)計(jì)學(xué)的方法,分析大量有代表性的事故案例,能揭示事故發(fā)生的普遍規(guī)律[2]。鄭霞忠等[3]通過(guò)分析152起建筑工程高處墜落事故,揭示了人為失誤在高空墜落事故中的作用路徑。然而統(tǒng)計(jì)分析過(guò)程需要依賴(lài)專(zhuān)家的經(jīng)驗(yàn)判斷和歸納總結(jié),具有較強(qiáng)的主觀性。同時(shí)事故的發(fā)生具有復(fù)雜性,是人、物、環(huán)境、管理多因素耦合作用的結(jié)果。Suraji等[4]基于項(xiàng)目參與方的約束和響應(yīng)時(shí)間,構(gòu)建事故致因模型,揭示了風(fēng)險(xiǎn)因素之間潛在的復(fù)雜關(guān)系。構(gòu)建事故致因模型雖能系統(tǒng)地分析事故致因間耦合作用的機(jī)制,但構(gòu)建模型時(shí)需要依靠理論假設(shè),同時(shí)事故樣本數(shù)量也有局限性。

        近年,文本挖掘理論和技術(shù)快速發(fā)展,為分析大量文本數(shù)據(jù)提供了有力支撐。如Goh等[5]將文本挖掘與6種機(jī)器學(xué)習(xí)算法(LR,RF,KNN,DT,NB,SVM)結(jié)合,對(duì)美國(guó)1 000起工程建設(shè)事故進(jìn)行分類(lèi),總結(jié)了各類(lèi)事故的主要原因。Zhong等[6]在文檔分詞的基礎(chǔ)上,借助線性判別分析(LDA)將高維分詞結(jié)果劃分為34類(lèi),利用專(zhuān)家知識(shí),歸納了34個(gè)風(fēng)險(xiǎn)因素。借助專(zhuān)家知識(shí)雖能準(zhǔn)確地提取事故致因,但過(guò)度依賴(lài)專(zhuān)家的主觀判斷。多數(shù)研究還局限于提取事故致因,缺乏對(duì)風(fēng)險(xiǎn)因素的評(píng)估?;陉P(guān)聯(lián)規(guī)則(Apriori algorithm)的風(fēng)險(xiǎn)因素評(píng)估方法已運(yùn)用于交通安全領(lǐng)域[7-8],在工程建設(shè)領(lǐng)域,結(jié)合關(guān)聯(lián)規(guī)則的事故致因評(píng)估研究尚較為少見(jiàn)。

        因此,本文在已有研究的基礎(chǔ)上,把文本挖掘應(yīng)用到房屋市政較大以上事故的分析中,采用最小詞頻閾值文檔頻的信息增益評(píng)估函數(shù)(DFn-IG)對(duì)特征集降噪,借助詞頻分析提取安全事故的風(fēng)險(xiǎn)因素,引入復(fù)雜網(wǎng)絡(luò)評(píng)估事故致因因素的重要度。以達(dá)到充分挖掘事故調(diào)查報(bào)告中的有效信息,為安全管理工作提供參考的目的。

        1 文本挖掘方法與流程

        1.1文本挖掘流程

        文本挖掘流程包括文本數(shù)據(jù)收集、文本預(yù)處理、構(gòu)建自定義詞庫(kù)、文本特征抽取、數(shù)據(jù)分析、知識(shí)發(fā)現(xiàn)等步驟,其主要分析過(guò)程如圖1。

        圖1 基于文本挖掘的事故致因分析流程

        1)文本數(shù)據(jù)收集:根據(jù)2010—2019年國(guó)內(nèi)房屋市政較大以上生產(chǎn)安全事故的通報(bào)信息,收集對(duì)應(yīng)的事故調(diào)查報(bào)告文本。

        2)文本預(yù)處理:提取事故調(diào)查報(bào)告文本中闡述事故致因的部分,去除無(wú)價(jià)值、重復(fù)、缺陷的文本數(shù)據(jù)。

        3)構(gòu)建自定義詞庫(kù):添加目前已經(jīng)廣泛運(yùn)用到文本挖掘領(lǐng)域的成熟詞庫(kù),并在提取事故致因的基礎(chǔ)上,構(gòu)建添加與事故致因?qū)?yīng)的同義詞詞表。

        4)文本特征抽?。何谋厩蟹趾螅柚鶧Fn-IG評(píng)估函數(shù),對(duì)分詞結(jié)果降噪。利用特征項(xiàng)詞頻,篩選降噪結(jié)果,回溯特征項(xiàng)在調(diào)查報(bào)告中的具體表述,確定事故致因。

        5)數(shù)據(jù)分析:統(tǒng)計(jì)詞頻、文檔頻,并根據(jù)事故致因的互現(xiàn)情況,構(gòu)建無(wú)向加權(quán)復(fù)雜網(wǎng)絡(luò),改進(jìn)傳統(tǒng)的TF-IDF算法,綜合詞頻和事故致因因素的關(guān)聯(lián)特征評(píng)估其重要度。

        1.2 特征項(xiàng)降噪與致因提取

        事故調(diào)查報(bào)告是非結(jié)構(gòu)化的文本數(shù)據(jù),主要有2類(lèi)噪聲詞,第1類(lèi)詞頻繁出現(xiàn)在各調(diào)查報(bào)告中,但無(wú)助于分析事故致因,如“直接原因”、“事故”等;第2類(lèi)噪聲詞如地名、企業(yè)名稱(chēng)等,在各調(diào)查報(bào)告中有不同的內(nèi)容,且在每一份調(diào)查報(bào)告中出現(xiàn)的頻次較低。

        設(shè)置最低詞頻閾值可直接去除第2類(lèi)噪聲詞;陳曉云等[9]由信息增益(IG)、互信息(MI)、χ2統(tǒng)計(jì)(CHI)等方法的比較分析,得出在處理低頻特征集和高維特征集時(shí),信息增益法在查全率和查準(zhǔn)率上相對(duì)其他方法更具優(yōu)勢(shì),能有效去除第1類(lèi)噪聲詞。因此,本文結(jié)合DFn和IG評(píng)估函數(shù),處理噪聲詞。計(jì)算公式如式(1)所示:

        (1)

        利用DFn-IG評(píng)估函數(shù),對(duì)分詞結(jié)果降噪,然后根據(jù)調(diào)查報(bào)告中的語(yǔ)意,確定特征項(xiàng)代表的事故致因。在此基礎(chǔ)上,構(gòu)建與事故致因相對(duì)應(yīng)的同義詞詞表。

        1.3 事故致因的重要度評(píng)估

        在TF-IDF的基礎(chǔ)上,Xu等[10]引入信息熵對(duì)其進(jìn)行改進(jìn),綜合事故致因的頻次和分布,評(píng)估事故致因的重要度。改進(jìn)的TF-H算法雖然解釋了事故致因重要度與其文檔頻DF正相關(guān)的問(wèn)題,但在相同文檔頻下,事故致因的重要度與其頻次呈反比。此外,以上2種方法僅從事故致因的文檔分布特征來(lái)評(píng)價(jià)其重要度,缺乏對(duì)事故致因因素間關(guān)聯(lián)關(guān)系的考量。

        (2)

        式中:wij表征網(wǎng)絡(luò)節(jié)點(diǎn)i,j間的邊權(quán)值;aij*表征邊的關(guān)聯(lián)邊權(quán)值,以平均邊權(quán)值為基準(zhǔn),判定2事故致因因素間關(guān)聯(lián)關(guān)系的強(qiáng)弱。

        節(jié)點(diǎn)的關(guān)聯(lián)加權(quán)度為Ki*,以衡量與某1事故致因具有強(qiáng)關(guān)聯(lián)關(guān)系的事故致因因素的數(shù)量,計(jì)算公式如式(3)所示:

        (3)

        式中:N表征事故致因因素的總數(shù),Ki*用來(lái)衡量與某一事故致因具有強(qiáng)關(guān)聯(lián)關(guān)系的事故致因因素的數(shù)量。

        基于詞頻-關(guān)聯(lián)關(guān)系的TF-K*評(píng)估函數(shù)的計(jì)算公式如式(4)所示,TF-K*值越大,事故致因?qū)Π踩鹿实挠绊懺街匾?/p>

        (4)

        式中:i表征事故致因因素i;TF(i)表征事故致因因素i的詞頻。TF-K*(i)值越大,事故致因因素i對(duì)安全事故的影響越重要。

        2 數(shù)據(jù)收集與事故致因提取

        2.1 收集事故信息

        從住房與城鄉(xiāng)建設(shè)部官網(wǎng),抓取2010—2019年的生產(chǎn)安全事故信息,共計(jì)6 000起房屋市政類(lèi)生產(chǎn)安全事故,其中較大及以上生產(chǎn)安全事故共255起[11],歷年生產(chǎn)安全事故情況如圖2(a)所示。

        圖2 2010—2019年房屋市政工程生產(chǎn)安全事故分布

        2.2 收集調(diào)查報(bào)告

        針對(duì)較大以上事故的通報(bào)信息,從各地應(yīng)急管理部門(mén)官網(wǎng)、易安網(wǎng)、安全管理網(wǎng)和建筑企業(yè)官網(wǎng),搜集對(duì)應(yīng)的調(diào)查結(jié)果,最終獲得158份事故調(diào)查報(bào)告,事故類(lèi)型分布如圖2(b)所示。

        2.3 創(chuàng)建語(yǔ)料庫(kù)

        事故調(diào)查中包含大量與事故致因無(wú)關(guān)的內(nèi)容,如事故基本情況、責(zé)任人員和責(zé)任劃分等。因此,僅將事故發(fā)生經(jīng)過(guò)和原因分析2個(gè)部分的內(nèi)容,作為文本挖掘的語(yǔ)料庫(kù)。

        2.4 構(gòu)建分詞詞庫(kù)

        本文在Python3的環(huán)境下,使用PyCharm借助開(kāi)源的Jieba算法對(duì)文本進(jìn)行分詞,通過(guò)自建停用詞詞庫(kù)、分詞詞庫(kù)和同義詞詞庫(kù)的方式,以提升分析語(yǔ)料庫(kù)的能力。

        1)停用詞詞庫(kù):停用詞是文檔中經(jīng)常出現(xiàn),對(duì)文本分析無(wú)價(jià)值的一類(lèi)詞。如“派駐”、“廣場(chǎng)”、“臺(tái)階”等。結(jié)合目前常用的停用詞詞表:HIT和MIL-SCU等,構(gòu)建停用詞詞庫(kù)。

        2)分詞詞庫(kù):直接對(duì)調(diào)查報(bào)告進(jìn)行分詞,事故致因會(huì)丟失有價(jià)值的信息。如“安全意識(shí)淡薄”,經(jīng)切分后變成“安全”、“意識(shí)”、“淡薄”3個(gè)詞語(yǔ),失去了原本所表達(dá)的信息。結(jié)合搜狗細(xì)胞詞庫(kù)、百度詞庫(kù)中收納的大量土木建筑類(lèi)專(zhuān)業(yè)詞匯,構(gòu)建出基礎(chǔ)分詞詞庫(kù)。

        3)同義詞詞庫(kù):中文的表述中,不同的詞語(yǔ)可表達(dá)相同的含義。如“工人違章操作”在不同的事故調(diào)查報(bào)告中,有“工人違規(guī)作業(yè)”、“違章操作”等表述。因此,從158份報(bào)告中隨機(jī)抽取40份,分析統(tǒng)計(jì)同一事故致因的不同表述,形成文本挖掘的同義詞詞庫(kù)。

        2.5 文本分詞與特征項(xiàng)降噪

        對(duì)語(yǔ)料庫(kù)分詞,得到29 442個(gè)原始特征項(xiàng)。根據(jù)式(1),計(jì)算特征項(xiàng)的DFn-IG函數(shù)值。不同最小詞頻閾值下,特征集容量與單次噪聲去除量如圖3。隨著閾值增大,單次去除量逐漸減小,為防止關(guān)鍵詞被剔除,取新增幅度最低點(diǎn)n=8為分詞用最小詞頻閾值。

        圖3 不同閾值下降噪結(jié)果

        2.6 提取事故致因

        結(jié)合降噪后特征項(xiàng)在調(diào)查報(bào)告中的具體描述,提取40個(gè)主要事故致因,如表1所示。

        表1 房屋市政較大以上生產(chǎn)安全事故致因(部分)

        2.7 網(wǎng)絡(luò)構(gòu)建與數(shù)據(jù)分析

        根據(jù)事故致因在調(diào)查報(bào)告中的共現(xiàn)情況,計(jì)算風(fēng)險(xiǎn)因素的共現(xiàn)矩陣,利用Gephi軟件繪制事故致因共現(xiàn)網(wǎng)絡(luò),如圖4所示。為進(jìn)一步評(píng)估風(fēng)險(xiǎn)因素的重要度,計(jì)算評(píng)估函數(shù)值如表2所示。

        圖4 事故致因共現(xiàn)網(wǎng)絡(luò)

        3 結(jié)果分析

        3.1 事故致因因素分析

        從表2可以看出,事故安全風(fēng)險(xiǎn)因素主要包括5類(lèi):自然環(huán)境條件、項(xiàng)目安全管理、相關(guān)單位安全管理、現(xiàn)場(chǎng)人員和材料設(shè)備,涵蓋了張偉等[12]和Hoa等[13]研究中提及的施工安全事故致因。

        表2 安全風(fēng)險(xiǎn)因素及其特征指標(biāo)

        A32,A33反映項(xiàng)目實(shí)施過(guò)程中的自然環(huán)境,由于工程項(xiàng)目的開(kāi)展與施工環(huán)境密切相關(guān),出現(xiàn)極端的環(huán)境時(shí),現(xiàn)場(chǎng)組織和管理體系多難以應(yīng)對(duì),極易引發(fā)生產(chǎn)安全事故。

        A1,A6,A7,A8,A10,A15,A17,A20,A29,A37體現(xiàn)房屋市政工程依然存在安全管理體系不健全、規(guī)章制度執(zhí)行不到位的問(wèn)題。貫徹執(zhí)行合理的安全制度,可有效避免風(fēng)險(xiǎn)因素演變成事故。但在工程實(shí)踐中,貫徹實(shí)施安全措施需要投入大量時(shí)間和資源,建筑企業(yè)常會(huì)因?yàn)榻?jīng)濟(jì)上的壓力和人員短缺等問(wèn)題,縮減該方面的支出,帶來(lái)一系列安全生產(chǎn)風(fēng)險(xiǎn)隱患。

        A11,A14,A16,A30,A38,A39體現(xiàn)房屋市政工程中違法違規(guī)承發(fā)包項(xiàng)目的行為依然存在。由于工程項(xiàng)目建設(shè)具有專(zhuān)業(yè)性,不具備生產(chǎn)資質(zhì)的企業(yè)開(kāi)展生產(chǎn)活動(dòng),不僅違反相關(guān)法律規(guī)定,還存在大量的安全風(fēng)險(xiǎn)隱患,很容易引發(fā)生產(chǎn)安全事故。

        A5,A18,A21,A22,A23,A31,A34,A40體現(xiàn)建筑單位編制施工方案的工作依然存在短板,在編制實(shí)施具體的安全措施方面還有很多盲點(diǎn),這既是安全管理的短板,也是導(dǎo)致生產(chǎn)安全事故的高風(fēng)險(xiǎn)因素。

        A2,A3,A4,A26,A27,A28,A35,A36體現(xiàn)項(xiàng)目參與單位的安全管理工作存在短板,施工企業(yè)心存僥幸心理,監(jiān)理單位、政府部門(mén)等相關(guān)單位在工作中存在漏洞,風(fēng)險(xiǎn)管控工作還有很多不足。

        A9,A12,A13,A19,A24反映房屋市政工程的從業(yè)人員,存在安全意識(shí)不足,專(zhuān)業(yè)素質(zhì)不高,缺乏系統(tǒng)培訓(xùn)的問(wèn)題。Tam等[14]研究表明技術(shù)交底和定期的安全訓(xùn)練能夠提升工人的安全能力,但工程項(xiàng)目通常持續(xù)時(shí)間較短,工人流動(dòng)性大,建筑工人一般只在工程建設(shè)的初期接受短暫的安全培訓(xùn),這些培訓(xùn)并不能顯著提升他們的安全意識(shí)和專(zhuān)業(yè)水平。

        3.2 事故致因重要度分析

        由于TF7=TF8=116,DF8=DF14=45,因此選擇A7,A8,A14因素的數(shù)據(jù)進(jìn)行對(duì)比。盡管A7和A8的詞頻相同,但A7的文檔頻更高、關(guān)聯(lián)加權(quán)度更高,表明A7在調(diào)查報(bào)告中的分布更均勻,與其他致因因素的關(guān)聯(lián)更緊密,更容易引發(fā)事故,因此其重要度應(yīng)更高。表2中的數(shù)據(jù)顯示,TF-H值和TF-K*值判別結(jié)果均為A7>A8,與分析結(jié)果吻合。以上數(shù)據(jù)的比較,驗(yàn)證了相較于傳統(tǒng)的TF-IDF值,TF-K*值具備同TF-H值一致的判別能力。

        A8和A14具備相同的文檔頻,表明其在相同數(shù)量的事故中出現(xiàn),而二者的WD/K值僅相差0.08,表明二者與其他致因因素的關(guān)聯(lián)強(qiáng)度基本相同,但A8的詞頻更高,表明其被強(qiáng)調(diào)的次數(shù)更多,因此綜合詞頻、文檔頻和關(guān)聯(lián)加權(quán)度來(lái)看,認(rèn)為A8的重要度高于A14。表2的數(shù)據(jù)顯示,TF-K*值的判別結(jié)果與分析結(jié)論吻合。以上數(shù)據(jù)較好地驗(yàn)證了相較TF-H值,采用基于關(guān)聯(lián)加權(quán)度的TF-K*更能全面準(zhǔn)確地衡量事故致因的重要度。

        3.3 低頻致因因素分析

        Mitropoulos等[15]的研究顯示,事故的發(fā)生與施工作業(yè)的自然環(huán)境密切相關(guān),惡劣的自然環(huán)境會(huì)帶來(lái)更多的風(fēng)險(xiǎn)因素,但在事故報(bào)告中很少提及相關(guān)內(nèi)容,所有事故調(diào)查報(bào)告中僅14份提及惡劣天氣。因此,盡管自然環(huán)境相關(guān)的致因因素出現(xiàn)的頻次不高,但在項(xiàng)目安全管理過(guò)程中仍值得關(guān)注。Manu等[16]研究發(fā)現(xiàn),不合理的進(jìn)度目標(biāo),會(huì)給施工作業(yè)帶來(lái)工期壓力,出現(xiàn)材料積壓、交叉作業(yè)、忽視安全風(fēng)險(xiǎn)等問(wèn)題,極易引發(fā)生產(chǎn)安全事故。調(diào)查報(bào)告中很少提及工期設(shè)置不合理,所以其重要度評(píng)價(jià)靠后,但該因素的重要性仍不能忽視。

        4 結(jié)論

        1)基于DFn-IG評(píng)估函數(shù)對(duì)分詞結(jié)果降噪,在保留大部分關(guān)鍵信息的條件下剔除噪聲詞,避免了在提取事故致因時(shí)出現(xiàn)維數(shù)災(zāi)難。

        2)基于詞頻分析,從158份事故調(diào)查報(bào)告中提取40個(gè)事故致因因素,并構(gòu)建事故致因的同義詞詞庫(kù),完整抽取調(diào)查報(bào)告中有關(guān)事故致因的信息。

        3)引入復(fù)雜網(wǎng)絡(luò)表征事故致因因素間的關(guān)聯(lián)關(guān)系,提出基于詞頻—關(guān)聯(lián)加權(quán)度的重要度評(píng)估方法,經(jīng)數(shù)據(jù)驗(yàn)證,在比較相同文檔頻下的事故致因重要度時(shí),該方法更具優(yōu)勢(shì)。

        猜你喜歡
        關(guān)聯(lián)文本
        不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
        “苦”的關(guān)聯(lián)
        初中群文閱讀的文本選擇及組織
        甘肅教育(2020年8期)2020-06-11 06:10:02
        在808DA上文本顯示的改善
        “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        奇趣搭配
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        論《柳毅傳》對(duì)前代文本的繼承與轉(zhuǎn)化
        人間(2015年20期)2016-01-04 12:47:10
        亚洲国产av一区二区三区| 日本成人免费一区二区三区 | 中文字幕乱码熟妇五十中出| 欧美精品黑人粗大免费| 久久久久亚洲av片无码v| 日本又黄又爽gif动态图| 日韩av无码成人无码免费| 久青草国产视频| 麻豆国产乱人伦精品一区二区| 国产一区二区欧美丝袜| 国产高跟丝袜在线诱惑| 一本到亚洲av日韩av在线天堂| 日产一区日产2区日产| 亚洲av成人精品一区二区三区 | 少妇爆乳无码专区| 国产精品一区二区在线观看| 131美女爱做视频| 欧美精品一级| 午夜无码亚| 黄色三级国产在线观看| 国产精品毛片毛片av一区二区| 国产草逼视频免费观看| 久久久亚洲欧洲日产国码二区| s级爆乳玩具酱国产vip皮裤| 亚洲av无码一区二区三区网站| 亚洲国产一区在线二区三区| 综合人妻久久一区二区精品| 中国一级特黄真人片久久| 人人妻一区二区三区| 日日猛噜噜狠狠扒开双腿小说| 欧美高清国产在线播放| 国产9 9在线 | 免费| 99精品久久精品一区| 妺妺窝人体色777777| 97在线观看播放| 欧美成人一区二区三区在线观看 | 伊人婷婷色香五月综合缴激情 | 丰满少妇av一区二区三区| 一本色道久久88加勒比—综合| 国产农村妇女毛片精品久久| 无码h黄动漫在线播放网站|