榮 明, 陳英杰, 黃 超, 王大川, 原俊峰
(1. 新疆農(nóng)業(yè)大學(xué)水利與土木工程學(xué)院, 新疆 烏魯木齊 830052; 2. 新疆工程學(xué)院安全科學(xué)與工程學(xué)院,新疆 烏魯木齊 830052; 3. 新疆兵團(tuán)水利水電工程集團(tuán)有限公司, 新疆 烏魯木齊 830000)
隧道施工過程中,工作人員安全狀態(tài)預(yù)警以及報警是保證工程安全的重要環(huán)節(jié),近年來也成為了研究熱點。考慮到隧道工程的特殊性,部分研究建立了集智能監(jiān)控、綜合分析、協(xié)同管理和大數(shù)據(jù)應(yīng)用于一體的掘進(jìn)機(jī)隧道工程管理大數(shù)據(jù)平臺,從管理和技術(shù)方面為隧道施工領(lǐng)域的大數(shù)據(jù)平臺設(shè)計和開發(fā)提供參考,提高隧道掘進(jìn)機(jī)施工效率和智能化管理水平[1]。但是,該類大數(shù)據(jù)平臺依舊需要專業(yè)運維人員依靠工作經(jīng)驗來進(jìn)行人機(jī)交互,不利于自動化信息管控。為推動信息管理的智能化發(fā)展,陳艷茹[2]將遺傳算法和極限學(xué)習(xí)機(jī)進(jìn)行耦合,采用遺傳算法對基于極限學(xué)習(xí)機(jī)的初始權(quán)值和閾值進(jìn)行優(yōu)化,大大提高了預(yù)測精度,能夠較好地預(yù)測不同工況下的結(jié)果,這是智能算法在工程安全保障上的結(jié)合。
伴隨著理論研究的發(fā)展,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)在工程領(lǐng)域的各項工作中都得到廣泛應(yīng)用。機(jī)器學(xué)習(xí)方法中有許多可以進(jìn)行安全檢測的算法技術(shù),其中,單分類支持向量機(jī)(OCSVM,one-class support vector machine)具有分類能力強(qiáng)、模型原理簡單等特性。曹惠玲等[3]將單分類支持向量機(jī)應(yīng)用于航空發(fā)動機(jī)的故障檢測,其能準(zhǔn)確而快速地識別故障數(shù)據(jù),及時發(fā)現(xiàn)發(fā)動機(jī)運行狀態(tài)異常情況。王成等[4]使用2層決策邊界的雙閾值OCSVM算法進(jìn)行尾流檢測,試驗結(jié)果表明在不同信噪比下改進(jìn)算法的檢測準(zhǔn)確率均有提升。高玉峰[5]提出了一種基于單分類支持向量機(jī)的設(shè)備故障檢測方法,所建立的采煤工作面瓦斯涌出量預(yù)測模型的精度高于應(yīng)用BP神經(jīng)網(wǎng)絡(luò)的預(yù)測精度。鄭浩楠[6]通過基于單分類支持向量機(jī)的配電通信網(wǎng)流量異常檢測方法,極大地提高了異常狀態(tài)檢測效率。在深度學(xué)習(xí)領(lǐng)域,為有效解決我國傳統(tǒng)的施工現(xiàn)場安全生產(chǎn)管理問題,減少由于施工人員的個人疏忽(如不佩戴安全帽等)造成的重大人員傷亡,秦嘉等[7]提出了一種基于深度學(xué)習(xí)的安全帽佩戴檢測與跟蹤技術(shù)。這種技術(shù)是當(dāng)前工程建筑領(lǐng)域與深度學(xué)習(xí)技術(shù)相結(jié)合的一個發(fā)展趨勢[8],使用深度學(xué)習(xí)的算法,自動訓(xùn)練出一套目標(biāo)檢測模型,從而提高了工作效率。
目前,在施工現(xiàn)場人員定位、人員屬性及構(gòu)件識別的研究上,學(xué)術(shù)界已經(jīng)有了一系列科研成果。其中,SVM算法在隧道施工現(xiàn)場的安全管理中具有較好的可行性以及泛化能力。在隧道工程領(lǐng)域,基于機(jī)器學(xué)習(xí)的人員保障措施監(jiān)測方法已被廣泛應(yīng)用,但已有的研究主要集中于人員安全保護(hù)設(shè)備的佩戴、人員簡單行為、構(gòu)件破損度以及變形程度的識別等。這些應(yīng)用能夠解決特定的安全管理問題,例如: 安全帽佩戴、構(gòu)件裂縫檢測等,但隧道施工安全管理作為一個復(fù)雜的、系統(tǒng)性的工程,需要多方面進(jìn)行考量以滿足各種安全管理需求。因此,當(dāng)前的研究具有一定片面性,應(yīng)針對施工安全管理的特點進(jìn)行系統(tǒng)、深入研究。對于人員安全,結(jié)合隧道內(nèi)部環(huán)境特征,對人員體征進(jìn)行異常狀態(tài)預(yù)警更為直接、準(zhǔn)確。由于在機(jī)械工程、土木工程、航空工程等領(lǐng)域,SVM方法已經(jīng)有成熟的應(yīng)用,隧道人員安全檢測屬于一種典型的數(shù)據(jù)不平衡異常檢測問題,在正常數(shù)據(jù)的訓(xùn)練模型情況下異常數(shù)據(jù)會出現(xiàn)波動現(xiàn)象,而OCSVM模型可以有效解決數(shù)據(jù)不平衡問題并準(zhǔn)確預(yù)測出異常狀態(tài)。
本文建立了一套基于OCSVM算法的隧道施工人員安全狀態(tài)檢測及預(yù)警模型并在不同分布特征的數(shù)據(jù)集上印證模型的精度。同時,考慮異常數(shù)據(jù)比例對模型的精度影響,進(jìn)行消融對比試驗。通過橫向?qū)Ρ?種特征情況下的模型準(zhǔn)確率,綜合評估模型的性能。
隧道施工人員安全狀態(tài)的識別要求能夠快速、高效地檢測出人員生命體征,并對人員的異常健康狀態(tài)和所處位置信息及時反饋,從而在意外情況來臨時能夠高效、準(zhǔn)確獲得隧道內(nèi)部環(huán)境、人員體征狀態(tài)以及人員所處的位置信息,有利于項目管理者和救援工作者選取救援方案,保障有生力量。因此,文章以隧道施工人員體征影響因素和環(huán)境因素分析為切入點,結(jié)合OCSVM安全預(yù)警模型進(jìn)行智能安全管理,實現(xiàn)智慧工地安全的信息化管控。
單分類支持向量機(jī)是一種支持向量機(jī)模型[9],通過訓(xùn)練正常的數(shù)據(jù)樣本,在特征空間中建立一個最優(yōu)的超平面,按照間隔值最大化的原則來實現(xiàn)分離訓(xùn)練樣本和其原點,其算法如圖1所示。
圖1 支持向量分類機(jī)
s.t.ωφ(xi)≥ρ-ξi,ξi≥0。(2)
(3)
式中L為目標(biāo)函數(shù),算法便是對這個函數(shù)的優(yōu)化。通過對上述方程中的變量進(jìn)行偏微分,可以得到優(yōu)化問題的對偶形式[11]:
minααTHα;
(4)
(5)
式中:α=[α1,…,αN]T;H為由Hij構(gòu)成的核矩陣,Hij可表示為
Hij=K(xi,xj)=φ(xi)φ(xj)。
(6)
式中K(xi,xj)為核函數(shù),本文中的核函數(shù)為線性核函數(shù)和高斯核函數(shù)[12]。而對于RBF核函數(shù),僅有一個參數(shù)σ需調(diào)節(jié),該參數(shù)會直接影響到RBF核函數(shù)的寬幅,計算公式為:
(7)
通過求解上述二次規(guī)劃問題,即可解出α,于是ω和ρ可由式(8)—(9)分別算出[13]:
(8)
(9)
由解出的ω和ρ即可求得一個在特征空間里的決策性超平面。
F(zk)=sign[ωφ(zk)-ρ]。
(10)
通過計算測試樣本zk的決策函數(shù)F(zk)來判斷zk與決策超平面的位置關(guān)系。若F(zk)=+1時,zk落在決策超平面之內(nèi),被分類為正類,即可判斷為正常樣本;若F(zk)=-1時,zk落在決策超平面之外,被分類為負(fù)類,即可判斷為異常樣本[11]。算法流程如圖2所示。
圖2 OCSVM模型算法流程圖
基于OCSVM的作業(yè)人員安全狀態(tài)預(yù)測以及預(yù)警工作流程如圖3所示。主要分為數(shù)據(jù)收集、模型搭建、人員安全檢測3個模塊。
工作現(xiàn)場部署的相關(guān)傳感設(shè)備采集相關(guān)數(shù)據(jù)后,通過數(shù)據(jù)傳輸方式發(fā)送給上位端整理,流程如圖4所示。主要分為數(shù)據(jù)采集層、數(shù)據(jù)傳輸層以及數(shù)據(jù)應(yīng)用層,主要作用如下:
1)數(shù)據(jù)采集層。通過體溫心率傳感器、相對位置反饋裝置以及溫濕度傳感器獲取試驗所需的離散數(shù)據(jù),再經(jīng)過數(shù)據(jù)傳輸層完成傳輸。
2)數(shù)據(jù)傳輸層。主要由微處理器集成通信和數(shù)據(jù)傳輸裝置組成,前者優(yōu)勢在于集成度較高,能夠增加數(shù)據(jù)傳輸?shù)乃俾?,然后通過WiFi、Zigbee等方式將數(shù)據(jù)發(fā)送給上位機(jī)模型。
3)數(shù)據(jù)應(yīng)用層。OCSVM模型獲取了發(fā)送過來的數(shù)據(jù),并且進(jìn)行實時反饋,完成工作人員安全狀態(tài)的檢測以及預(yù)警功能;也可以通過傳輸過來的數(shù)據(jù)對模型進(jìn)行實時更新。
圖4 數(shù)據(jù)收集硬件框架
模型搭建步驟如表1所示。
表1 模型搭建步驟
人員安全狀態(tài)檢測基本流程如表2所示。
在本文所搭建的模型中,單類支持向量機(jī)的數(shù)據(jù)輸出種類分為2類,即正常情況與異常情況。其中,在輸出預(yù)警值方面,本文設(shè)定預(yù)警閾值為0.78(該閾值根據(jù)隧道施工監(jiān)測數(shù)據(jù)統(tǒng)計分析和相關(guān)專家經(jīng)驗設(shè)定,后續(xù)可根據(jù)實際情況進(jìn)一步優(yōu)化),輸出的精度值大小超過0.78時,表示出現(xiàn)了異常情況,且越接近于1,表示異常情況越明顯。即輸出值在0~0.78表示隧道內(nèi)情況正常,0.78~1表示隧道內(nèi)出現(xiàn)了異常情況。
表2 人員安全狀態(tài)檢測流程
由于隧道內(nèi)作業(yè)環(huán)境相對封閉,現(xiàn)場環(huán)境復(fù)雜,對不同位置、不同時期的洞內(nèi)溫、濕度進(jìn)行分析,篩選合適的特征數(shù)據(jù),以便后續(xù)搭建基于OCSVM的人員安全狀態(tài)識別模型,達(dá)到安全預(yù)警的效果。
1)在實際作業(yè)過程中,若出現(xiàn)了疲勞乏力、意識模糊等癥狀會對施工人員的安全造成威脅,其中體溫與心率能直接反映人員的體征狀態(tài)。對所有進(jìn)入施工現(xiàn)場的人員進(jìn)行體溫檢測,嚴(yán)格做好疫情防控工作,對體溫≥37.3 ℃人員,要及時送至隔離觀察宿舍進(jìn)一步隔離觀察。由于心率參數(shù)對溫度變化的感應(yīng)十分靈敏,所以容易進(jìn)行測量和計算,而且測量耗時較少。成人的正常心率為 60~100 次/min,在封閉空間的作業(yè)中,若工作人員的心率超出了正常值范圍,需馬上停止工作,防止工作人員的身體和機(jī)能發(fā)生障礙,從而造成嚴(yán)重的工作事故。
2)影響溫、濕度的因素十分復(fù)雜,如機(jī)械通風(fēng)、自然空氣、地下水、晝夜及季節(jié)變化、施工機(jī)械釋放的熱量、地?zé)?、氣壓、風(fēng)向及風(fēng)速變化等[17]。溫、濕度不僅可以反映工程施工人員的作業(yè)條件,也可以反映隧道結(jié)構(gòu)的安全性。當(dāng)洞內(nèi)溫度降低到一定范圍內(nèi)時,就會直接影響到人體的生理和精神狀態(tài)。低溫情況會使人體免疫力下降,引發(fā)一系列的疾病,如感冒、哮喘等。洞內(nèi)的濕度太大,空氣中水汽含量較多,人體排出的汗液不易蒸發(fā),體內(nèi)散熱不通暢,導(dǎo)致體感溫度升高。高濕環(huán)境的作用,使得我們身上的汗水和衣物之間的摩擦力增大。高溫、高濕對隧道內(nèi)作業(yè)人員造成了不利的影響,影響工作效率,甚至可能危及生命安全,增加安全事故的發(fā)生率[18]。
3)在隧道施工過程中,施工人員的相對位置對人員安全有著重要的影響,因為不同的施工位置可能會產(chǎn)生不同程度的危險,也有不同的搜救難度。隧道施工區(qū)域一般分為洞口區(qū)、二次襯砌施工完成區(qū)、二次襯砌施工區(qū)、防水施工區(qū)、仰拱/調(diào)平層施工區(qū)、開挖及初期支護(hù)區(qū)。每個區(qū)域都有施工人員在活動或者作業(yè),需掌握每個人員在隧道內(nèi)的位置。人員定位裝置安裝需要確定每個基站的坐標(biāo)。以洞口為起始點,通過人員在隧道內(nèi)的位置可以計算出施工人員與掌子面的距離。定位洞內(nèi)人員距洞口的距離,實時統(tǒng)計隧道內(nèi)的總?cè)藬?shù)、各個區(qū)域的人員分布等數(shù)據(jù)。當(dāng)出現(xiàn)危險時,能準(zhǔn)確確定人員距離洞口的位置,便于救援。
本文對相對位置的概念進(jìn)行形式化定義,對施工人員位置進(jìn)行區(qū)域化定位。距離洞口的距離認(rèn)定為絕對位置,而依據(jù)現(xiàn)場施工情況決定參考位置,本文定義參考位置大小為50 m,如圖5所示。所以相對位置數(shù)值=絕對位置/50,進(jìn)位取整數(shù),其相對位置規(guī)則如表3所示。
圖5 相對位置抽象示意圖(單位: m)
表3 相對位置規(guī)則
對相對位置進(jìn)行形式化定義以后,信息收集框架如圖6所示。
信息收集主要包括3個方面,分別是隧道內(nèi)部環(huán)境、位置信息以及施工人員體征。主要測量隧道內(nèi)部環(huán)境的溫、濕度情況,施工人員的人體溫度和心率,位置信息由上述的相對位置定義獲取。因此,評估參數(shù)分別是人體皮膚的溫度(包括胸部)、心率、洞內(nèi)環(huán)境溫度、環(huán)境濕度以及人體所處相對位置。本文數(shù)據(jù)來源于新疆奎屯河引水隧洞工程項目,該項目2標(biāo)、3標(biāo)、4標(biāo)引水隧洞工程全長8.195 km,于2020年10月28日開工,計劃于2023年7月1日完工。隧洞工程基本信息見表4。為便于后續(xù)試驗過程的描述,本文分別將表中2標(biāo)、3標(biāo)、4標(biāo)所表示的數(shù)據(jù)定義為數(shù)據(jù)集1、數(shù)據(jù)集2、數(shù)據(jù)集3。
圖6 施工人員信息收集示意
本小節(jié)主要對收集的數(shù)據(jù)進(jìn)行特征預(yù)處理。本文所研究的人員體征數(shù)據(jù)、隧道內(nèi)部環(huán)境數(shù)據(jù)及位置信息的描述如表5所示。
本文使用收集的3組工程數(shù)據(jù)進(jìn)行訓(xùn)練,得到隧道人員安全檢測報警模型。數(shù)據(jù)集特征統(tǒng)計如表6所示。
表4 隧洞工程基本信息
表5 人員安全檢測數(shù)據(jù)說明
在收集到的數(shù)據(jù)基礎(chǔ)上,判斷實際人員的安全狀態(tài),并進(jìn)行人工報警標(biāo)記,具體標(biāo)記為2類,即正常狀態(tài)
和報警狀態(tài)。由于標(biāo)記數(shù)據(jù)量較少,故需進(jìn)行數(shù)據(jù)增強(qiáng)處理,具體方法是在原始數(shù)據(jù)的基礎(chǔ)上進(jìn)行隨機(jī)標(biāo)記并進(jìn)行微調(diào),即對原始數(shù)據(jù)進(jìn)行隨機(jī)抖動而類標(biāo)簽不變化來實現(xiàn)。這樣一來既能保證數(shù)據(jù)的隨機(jī)性,也可以通過線性微調(diào)使數(shù)據(jù)更具真實性,從而增加模型的泛化性。為增加分類器的泛化性,可先沿著分布通過添加一些隨機(jī)分布的值來隨機(jī)化擾動點,使用增強(qiáng)數(shù)據(jù)集訓(xùn)練出來的模型,對于那些未包含在訓(xùn)練集中的樣本數(shù)據(jù)點更具有泛化性。如圖7所示,數(shù)據(jù)增強(qiáng)前正態(tài)分布曲線較平滑,而進(jìn)行數(shù)據(jù)增強(qiáng)處理后,部分出現(xiàn)了離散點,如圖8所示。
表6 數(shù)據(jù)集特征說明
圖7 數(shù)據(jù)增強(qiáng)前的正態(tài)分布曲線
1)對于人體體溫數(shù)據(jù),在每個數(shù)據(jù)集中選取7%~10%進(jìn)行異常值標(biāo)記,處理方式為在實際數(shù)據(jù)基礎(chǔ)上添加符合正態(tài)分布(-1~2)的增量值。
2)對于人體心率數(shù)據(jù),在每個數(shù)據(jù)集中選取6%~10%進(jìn)行異常值標(biāo)記,處理方式為實際數(shù)據(jù)上添加符合正態(tài)分布(-10~30)的增量。
3)對于洞內(nèi)環(huán)境溫度、濕度,選取數(shù)據(jù)集中7%~10%進(jìn)行異常值標(biāo)記。
4)相對位置信息蘊(yùn)含一定的預(yù)警標(biāo)準(zhǔn)意義,故無需構(gòu)造異常數(shù)據(jù)。
將所有的數(shù)據(jù)都進(jìn)行歸一化處理。數(shù)據(jù)歸一化處理是一種使用量綱為1的信號處理技術(shù),將具有波函數(shù)特征性質(zhì)的物理數(shù)值轉(zhuǎn)換成與其他波函數(shù)特征相互作用的某種相對值,并縮小與這些量值之間的落差[8]。本文選擇的歸一化計算方法為最值歸一化計算方法(mmn,min-max normalization)。最值歸一化計算方法也可簡稱為最高值線性歸一化或離差歸一化,就是對原始數(shù)據(jù)進(jìn)行線性變換,使得結(jié)果值可以映射在[0,1]或某個自定義數(shù)值之間。轉(zhuǎn)換函數(shù)為:
(11)
式中max與min分別是該特征數(shù)據(jù)集的最大值和最小值。歸一化處理之后的部分?jǐn)?shù)據(jù)如表7所示。
表7 數(shù)據(jù)歸一化
本文通過準(zhǔn)確率(accuracy)、精確率(precision)、召回率(recall)、F-score值對基于OCSVM的人員安全狀態(tài)識別模型的性能進(jìn)行評估[19],相關(guān)計算公式如下:
(12)
(13)
(14)
(15)
識別結(jié)果的混淆矩陣如表8所示。
表8 識別結(jié)果的混淆矩陣
為探究增強(qiáng)之后的數(shù)據(jù)對原數(shù)據(jù)的試驗結(jié)果是否有影響,本小節(jié)開展試驗探究。數(shù)據(jù)增強(qiáng)的主要目的是使得模型訓(xùn)練效果更好,因此原始數(shù)據(jù)可能過于平滑或者數(shù)據(jù)量較少的時候,都會采取合適的數(shù)據(jù)增強(qiáng)辦法。本文采取控制變量法設(shè)計驗證試驗。首先,分別將數(shù)據(jù)集1、2、3按照訓(xùn)練集和測試集劃分為8∶2,為驗證數(shù)據(jù)增強(qiáng)的效果,本文設(shè)計如下4個試驗:
1)對3個數(shù)據(jù)集不進(jìn)行處理,使用OCSVM模型進(jìn)行試驗測試。
2)對3個數(shù)據(jù)集的訓(xùn)練集部分進(jìn)行數(shù)據(jù)增強(qiáng)處理,保持測試集不變,使用OCSVM模型進(jìn)行訓(xùn)練和測試。
3)對3個數(shù)據(jù)集的測試集部分做數(shù)據(jù)增強(qiáng)處理,保持訓(xùn)練集不變,使用OCSVM模型進(jìn)行訓(xùn)練和測試。
4)對3個數(shù)據(jù)集的測試集和訓(xùn)練集均進(jìn)行數(shù)據(jù)增強(qiáng),使用OCSVM模型進(jìn)行訓(xùn)練和測試。
4個試驗OCSVM模型的精確率、召回率以及F-score如表9—12所示。
表9 試驗1
表10 試驗2
表11 試驗3
表12 試驗4
由表9—12可以看出試驗4的效果最好,即在訓(xùn)練集和測試集上都進(jìn)行數(shù)據(jù)增強(qiáng)以后,數(shù)據(jù)的泛化能力更強(qiáng),所訓(xùn)練出來的模型性能更好。同時,對比訓(xùn)練集和測試集結(jié)果,模型出現(xiàn)過擬合和欠擬合情況。未進(jìn)行數(shù)據(jù)增強(qiáng)的為試驗1,其余試驗2、3、4在結(jié)果分析上均保持與試驗1一樣的分析方法,模型在數(shù)據(jù)集1、2、3上性能均在90%左右,數(shù)據(jù)增強(qiáng)以后效果更優(yōu)。
本文主要探究3個不同分布特征的數(shù)據(jù)集對于模型性能的影響,分別使用人體特征、環(huán)境特征、人體-環(huán)境以及人體-環(huán)境-位置信息特征這4類數(shù)據(jù)進(jìn)行人員安全狀態(tài)預(yù)警試驗,并選擇線性核函數(shù)和RBF核函數(shù)進(jìn)行對比試驗。試驗過程中,人體特征數(shù)據(jù)由體溫和心率組成;環(huán)境特征數(shù)據(jù)由隧道內(nèi)部環(huán)境溫度和環(huán)境濕度組成,均是二維數(shù)據(jù);而人體-環(huán)境特征數(shù)據(jù)和人體-環(huán)境-位置特征數(shù)據(jù)為多維數(shù)據(jù)。試驗數(shù)據(jù)集中,訓(xùn)練集和測試集比例為8∶2。統(tǒng)計各類數(shù)據(jù)所訓(xùn)練的模型的支持向量個數(shù),計算測試集對應(yīng)的預(yù)測準(zhǔn)確率,試驗結(jié)果見表13和圖9—11。圖9—11中,a、b、c、d分別表示人體特征數(shù)據(jù)、環(huán)境特征數(shù)據(jù)、人體-環(huán)境特征數(shù)據(jù)以及人體-環(huán)境-位置信息特征數(shù)據(jù)。
經(jīng)過對比不同采集來源中不同統(tǒng)計分布特征的4類數(shù)據(jù)試驗結(jié)果,可以發(fā)現(xiàn)在各數(shù)據(jù)集合上,OCSVM模型的性能均表現(xiàn)出了良好的狀態(tài),模型準(zhǔn)確率均在95%左右。在核函數(shù)選擇上,RBF核函數(shù)的模型預(yù)測準(zhǔn)確率要略高于線性核函數(shù)的,但各數(shù)據(jù)集的模型中RBF核函數(shù)所產(chǎn)生的支持向量數(shù)大部分情況下要多于線性核函數(shù)。這說明選擇該核函數(shù)的計算復(fù)雜度較高,在數(shù)據(jù)較大時,可以選擇線性核函數(shù)進(jìn)行預(yù)處理,初步分類,再使用RBF方法進(jìn)行最終狀態(tài)的報警。
表13 人員安全預(yù)警模型試驗結(jié)果
圖9 數(shù)據(jù)集1試驗結(jié)果
圖10 數(shù)據(jù)集2試驗結(jié)果
圖11 數(shù)據(jù)集3試驗結(jié)果
本文探究數(shù)據(jù)為隧道施工人員實際數(shù)據(jù),其異常情況數(shù)據(jù)占總數(shù)據(jù)量比例較小。在實際工程問題研究中,數(shù)據(jù)占比直接影響了模型的精度與效率。據(jù)此,數(shù)據(jù)比例及均衡性對模型性能具有一定程度的影響。為探究這種影響關(guān)系,將報警狀態(tài)值進(jìn)行一定比例的設(shè)置,探究5%~50%比例的數(shù)據(jù)對模型的影響。試驗數(shù)據(jù)選取數(shù)據(jù)集1(新疆奎屯河引水隧洞工程2標(biāo)),核函數(shù)選擇σ=0.125的RBF核函數(shù),分別進(jìn)行上述4組不同特征數(shù)據(jù)情況下的試驗,統(tǒng)計測試集在不同比例時的準(zhǔn)確率大小,試驗結(jié)果如圖12所示。
對比不同預(yù)警狀態(tài)數(shù)據(jù)比例試驗,可以看出各類型數(shù)據(jù)在不同預(yù)警狀態(tài)比例時預(yù)測準(zhǔn)確度均在90%上下,異常數(shù)據(jù)占比在15%以下時,預(yù)測準(zhǔn)確率優(yōu)于其他比例。由圖12(d)可知,加入位置信息的OCSVM模型能更好地進(jìn)行隧道工作人員安全情況預(yù)警,并且準(zhǔn)確率均在90%以上。
接著,在同一個試驗條件下,對這4種特征信息進(jìn)行橫向?qū)Ρ?,設(shè)定異常數(shù)據(jù)比例為15%,核函數(shù)選擇σ=0.125,在數(shù)據(jù)集1上訓(xùn)練100個批次,橫向?qū)Ρ仍囼炐Ч鐖D13所示。
4種特征信息下的模型分類效果均呈現(xiàn)增長趨勢,其中,特征d的模型分類效果領(lǐng)先于其他3種。由此可見,在同一試驗條件下,特征信息越多,模型所表現(xiàn)的分類性能越好。
(a) 人體特征數(shù)據(jù)
(b) 環(huán)境特征數(shù)據(jù)
(c) 人體-環(huán)境特征數(shù)據(jù)
(d) 人體-環(huán)境-位置特征數(shù)據(jù)
1)本文提出了一種基于 OCSVM 的隧道施工人員安全狀態(tài)檢測方法,收集了3組隧洞施工人員體征與環(huán)境特征的數(shù)據(jù)。分別選擇每個數(shù)據(jù)集中的幾個變量建立對應(yīng)的OCSVM 安全預(yù)警模型,運用模型對測試集的人員安全信息進(jìn)行檢測。通過對不同特征分布的數(shù)據(jù)檢測結(jié)果進(jìn)行分析可知,其模型準(zhǔn)確率均在90%以上,驗證了OCSVM算法對隧道人員安全信息的預(yù)警具有良好的科學(xué)泛化能力以及可拓展性。
2)實際收集數(shù)據(jù)過程中,可能會因為設(shè)備和技術(shù)手段的原因?qū)е抡`差,需在硬件系統(tǒng)中加以改進(jìn)。
3)通過不同數(shù)據(jù)比例下的消融試驗可知,在不同預(yù)警狀態(tài)的數(shù)據(jù)中,即不同平衡度的數(shù)據(jù)試驗,模型表現(xiàn)出較好的性能,證明了模型的高效性、精準(zhǔn)性。因此,在隧道施工人員安全預(yù)警問題中,運用OCSVM可提高工程的自動化水平,節(jié)約成本,提高工程效率。
對于隧道人員安全預(yù)警問題的研究,下一步可考慮擴(kuò)充數(shù)據(jù)特征,多維度進(jìn)行分類預(yù)測。對于用于安全預(yù)警的OCSVM算法,下一步研究方向為擴(kuò)充數(shù)據(jù)量與數(shù)據(jù)維度進(jìn)行試驗,可以結(jié)合深度學(xué)習(xí)模型,完成數(shù)據(jù)無監(jiān)督訓(xùn)練,并與多種機(jī)器學(xué)習(xí)預(yù)測分類方法進(jìn)行比較,更好地服務(wù)于隧道工程安全監(jiān)測預(yù)警領(lǐng)域的研究工作。