亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機器學習的盾構螺旋輸送機轉速預測研究

        2022-12-03 07:42:10王鵬峰周奇才陳傳林
        起重運輸機械 2022年21期
        關鍵詞:分類特征模型

        趙 炯 王鵬峰 周奇才 張 恒 陳傳林

        1同濟大學機械與能源工程學院 上海 201804 2上海地鐵盾構設備工程有限公司 上海 200120

        0 引言

        隨著我國經濟社會的發(fā)展和城市化進程步伐的加快,地鐵盾構成為各個主要城市交通發(fā)展的方向,全世界生產的盾構機已累計超過1萬余臺[1],地鐵也在緩解地上交通的壓力、促進提升自然資源利用率等方面起到越來越重要的作用。由于地上交通資源日趨緊張,相比地上交通的出行方式,地鐵出行的出行時間相對穩(wěn)定,地鐵出行成為交通擁堵城市人們出行的重要選擇。地鐵的建設促進了我國社會的交通方式變革,也對我國的經濟社會發(fā)展起到了極大的促進作用[2]。

        自從2008年我國制造了中國第一臺具有自主知識產權的復合式土壓平衡盾構機——中國中鐵1號以來,我國地鐵盾構技術飛速發(fā)展[3]。但是,在當今時代的要求下,盾構技術需要結合信息化技術才能緊跟時代步伐,實現(xiàn)盾構信息化、數(shù)字化的發(fā)展是當今需要解決的時代問題。其中地鐵盾構中重要的一環(huán)就是螺旋機的控制,利用盾構施工參數(shù)和數(shù)據研究螺旋機的轉速控制機理對于實現(xiàn)盾構施工作業(yè)的數(shù)字化發(fā)展具有重要意義[4]。盾構施工的智能化和數(shù)字化對于未來城市的數(shù)字化建設和管理等進程也具有非常重要的促進作用。

        1 數(shù)據處理

        現(xiàn)代盾構機普遍采用PLC進行控制和參數(shù)監(jiān)測,同時盾構已經能夠實現(xiàn)遠程監(jiān)控盾構過程中的各種施工參數(shù),并將這些參數(shù)通過以太網傳送到遠程數(shù)據中心進行存儲。盾構歷史數(shù)據需要從盾構機的遠程數(shù)據庫中導出,具體可以通過遠程登錄連接傳輸或物理復制等手段取得。

        國內某地鐵盾構公司的盾構機施工數(shù)據采用每臺盾構機一張數(shù)據表的形式存儲,每一列存儲一種參數(shù),每一行存儲當前時刻采集到的各種參數(shù)的數(shù)據。不同廠家生產的盾構機型號有所差別,傳感器的安裝也不完全統(tǒng)一,不同的盾構機數(shù)據表會有差異,如參數(shù)順序不同、參數(shù)種類不同、參數(shù)命名方法不同、同一類別參數(shù)的個數(shù)不同等。此外,盾構數(shù)據在傳感器檢測采集、傳輸過程和存儲過程等各個環(huán)節(jié)都有可能出現(xiàn)疏漏,數(shù)據會有缺失和異常等各種情況,并且數(shù)據中存在很多無效數(shù)據,故數(shù)據處理是一項極其復雜和艱巨的任務。

        地鐵盾構的歷史數(shù)據被保存到MySQL數(shù)據庫中,原始數(shù)據結構如圖1所示。圖1舉例展示的盾構機的歷史原始數(shù)據共有64 035行,504列。

        圖1 原始數(shù)據

        本文采用Python語言開展相關問題研究,使用Python的一個開源發(fā)行版本Anaconda進行本文編程環(huán)境的構建,程序的運行和調試在Anaconda的Jupyter lab交互式開發(fā)環(huán)境中進行。本文全程采用Python進行數(shù)據處理,通過SQLyog軟件將數(shù)據導出為csv格式方便后續(xù)處理,研究的目標為利用機器學習算法對盾構螺旋輸送機轉速進行預測,其余數(shù)據為此研究目標的特征數(shù)據。

        數(shù)據處理的具體過程為:數(shù)據處理首先經過一次人工篩選,將如數(shù)據上傳時間、數(shù)據接收時間、PLC的通訊狀態(tài)等明顯與盾構螺旋輸送機轉速預測目標無關的特征刪除;本文所研究的是盾構螺旋輸送機轉速的預測,螺旋機轉速為零的樣本數(shù)據應被視為無效數(shù)據,故可刪除螺旋機轉速為零的無效樣本數(shù)據;獲得的數(shù)據中有很多空值,尤其是開關量D1-D200中有很多為空值,故可刪除這些全部為空值的開關量;刪除后只剩下2個開關量特征——D49和D129,經過查詢如圖2所示的盾構公司提供的盾構機參數(shù)資料,D49為膨潤土泵1變頻器故障,出現(xiàn)此故障時應停機檢修,故可刪除此特征;D129為外密封后腔計數(shù)不夠報警,只存在2個值為非缺失值(見圖3),且對整體的影響而言相對較小,故可刪除此特征。經過描述性統(tǒng)計發(fā)現(xiàn),很多特征的所有樣本的值都相同,故可利用方差過濾法將特征方差值為零的特征刪除。需要說明的是,此時不可通過方差過濾將方差小于閾值的特征刪除或根據方差的大小進行特征選擇,因為盾構掘進數(shù)據的量綱沒有統(tǒng)一,如果通過以上方差過濾法進行特征選擇,會將值本來就很小的有用特征篩選掉,對后續(xù)螺旋機轉速的預測可能產生不利影響;在進行完上述的數(shù)據處理過程之后,對數(shù)據進行描述性統(tǒng)計(見圖4),其中count表示數(shù)據集中該特征的有效數(shù)值個數(shù),即去除空值后的該特征數(shù)據個數(shù),mean為該特征的平均值,std表示該特征的標準差,min表示該特征的最小值,max表示該特征的最大值,其余的百分比數(shù)值表示將該特征的數(shù)值從小到大排列后對應的百分比位置的數(shù)值大小,利用描述性統(tǒng)計能夠找出數(shù)據異常的特征,經分析刪除了部分異常特征(如A16為底部土倉壓力,其值從小到大排列后只有10%的數(shù)值與其余數(shù)值不同,因此本文認為底部土倉壓力數(shù)值異常)。

        圖2 盾構機掘進參數(shù)

        圖3 缺失值統(tǒng)計

        圖4 描述性統(tǒng)計

        經過上述數(shù)據預處理過程,得到了可供算法分析的初始數(shù)據,數(shù)據集包含3 177個樣本和163個特征(見圖5)。在實際建模過程中,由于不同模型對于數(shù)據集的要求不同,還需要對數(shù)據集進行無量綱化處理,如標準化和歸一化等縮放處理,以求模型在數(shù)據集上能有更好的表現(xiàn)[5]。

        圖5 數(shù)據預處理

        2 模型建立

        本文采用機器學習算法對盾構數(shù)據進行研究,機器學習算法可以分為分類算法和回歸算法。盾構機施工數(shù)據由于機型的不同,螺旋輸送機的轉速值的記錄也有所不同,一部分采用整數(shù)值對螺旋輸送機的轉速進行記錄,而另一些則采用浮點數(shù)對轉速值進行記錄。本文研究的土壓平衡盾構機采用整數(shù)記錄螺旋輸送機的轉速,轉速值的范圍為0~14,并且分布不均衡。因此,采用Sklearn中的分類算法對盾構螺旋輸送機的轉速進行分析訓練和預測。Sklearn中的分類算法主要包含分類決策樹、分類隨機森林、邏輯回歸、支持向量機(Support Vector Machines,SVM)、樸素貝葉斯、極端梯度提升(eXtreme Gradient Boosting,XGBoost)和分類神經網絡等。本文主要采用決策樹、隨機森林、支持向量機和神經網絡4種算法對盾構螺旋輸送機轉速進行訓練和預測。

        2.1 決策樹

        作為一種有監(jiān)督學習的分類模型,決策樹能夠在包含標簽和數(shù)據特征的數(shù)據集中做出決策,其原理易于理解,并且能夠畫出決策樹的樹狀圖,能夠很直觀地體現(xiàn)決策過程,同時決策樹也能處理多分類問題,并且對于數(shù)據的規(guī)范化要求不是很嚴格,因此其在各行業(yè)中得到了廣泛應用。

        使用決策樹來對盾構螺旋輸送機轉速進行預測,需要對作為標簽數(shù)據的螺旋機轉速數(shù)據進行編碼處理,使其能夠被用來進行分類。本文采用Sklearn.Preprocessing庫中的LabelEncoder模塊對標簽進行編碼。本文基于的數(shù)據,其原始螺旋機轉速的值為整數(shù)數(shù)值。經過數(shù)據預處理的數(shù)據包含有162個特征,這對于具有過擬合性質的決策樹而言數(shù)據特征過多,故本文采用Sklearn.Feature_Selection庫中的Mutual_Info_Classif模塊互信息分類來篩選出30個最優(yōu)特征來作為數(shù)據集進行訓練。以決策樹的深度作為橫坐標,評估指標(即決策樹的準確度)作為縱坐標,得出的學習曲線如圖6所示。

        圖6 決策樹學習曲線圖

        2.2 隨機森林

        隨機森林屬于裝袋法的集成算法,是裝袋法的典型模型,裝袋法的核心思想是構建多個相互獨立的評估器,結果則根據對所有預測的輸出結果進行平均或按少數(shù)服從多數(shù)的原則得出。本文采用10折交叉驗證來探究隨機森林的樹的個數(shù)對于決策精確度的影響,得出的結果如圖7所示。

        圖7 決策樹個數(shù)對決策的影響曲線圖

        由圖7可以看出,對于螺旋機轉速的預測問題,使用隨機森林進行研究是非常不適合的,模型的準確度很差,得到的結果最高只有0.111 2的準確度。

        2.3 支持向量機

        支持向量機是機器學習最受關注的算法,可以進行有監(jiān)督學習、無監(jiān)督學習和半監(jiān)督學習,應用非常廣泛,并且在各種實用問題中(如手寫數(shù)字識別、人臉識別、分類文本和超文本、圖像分類與分割和蛋白質分類等)都表現(xiàn)得很優(yōu)秀。由于支持向量機對于數(shù)據的量綱具有很高的敏感性,故本文又在數(shù)據預處理的基礎上對原始數(shù)據進行了數(shù)據歸一化的處理。

        本文分別使用Linear、Poly、Rbf和Sigmoid核函數(shù)的支持向量機對螺旋機轉速預測進行了訓練和測試,結果表明線性核函數(shù)的效果不理想,多項式核函數(shù)只能在一次的情況下運行出結果并且效果不理想,Rbf核函數(shù)不能運行出結果,Sigmoid核函數(shù)運行得到的結果較差。綜上所述,表明支持向量機對于如此多標簽類別和特征的分類問題不擅長,支持向量機不能很好地對螺旋機轉速的預測進行分類判斷。

        2.4 神經網絡

        神經網絡借鑒了仿生學的思想,利用計算機技術來模仿人類大腦神經元的結構和功能,采用分布式并行信息處理的方式來對信息進行處理。神經網絡通過調節(jié)內部節(jié)點之間的隱藏參數(shù)來適應并處理信息,進而得出計算結果。隨著計算機技術的發(fā)展,計算機的軟硬件水平不斷提高,神經網絡的應用越來越廣泛,在機器學習尤其是深度學習領域得到廣泛應用。

        本文采用Sklearn的Neural_Network庫中的MLPClassifier模塊來對數(shù)據進行學習和預測。同樣地,需要先對數(shù)據進行標準化處理,由于特征數(shù)目太多導致模型對于數(shù)據的學習過于細致,導致模型過擬合,模型的泛化性差。因此本文通過互信息法選取特征,隨后用選取出來的特征進行神經網絡訓練,其中,神經網絡選取4層隱藏層,每層的隱藏神經元個數(shù)分別為80、80、80、60。模型的預測準確率與數(shù)據特征個數(shù)的關系如圖8所示。

        圖8 不同特征個數(shù)的準確率

        由于圖8繪制的曲線是在步長為10的基礎上進行訓練得到的結果,為了更加準確地得到學過最好的時候的特征個數(shù),繼續(xù)選取步長為1進行訓練并將得到如下結果(見圖9),平均絕對誤差(MAE)的結果如圖10所示。

        圖9 最佳特征個數(shù)

        圖10 MAE結果

        從結果看,神經網絡相比上述其余的模型對于螺旋機轉速的預測的準確率更好,準確率只有45%左右,但由于本文研究的是14分類問題,故此效果已經相對較好。平均絕對誤差的最理想結果是0,即預測與真實值毫無偏差,本文得出的結果與真實結果相差不到1,故效果可接受。但是,對于實際應用而言效果不完美,仍需進一步探索更為貼合轉速控制的模型。

        另外,由于本文所采用的數(shù)據完全是由函數(shù)篩選而來,未經人工進行特征篩選,可能是造成模型效果不佳的重要原因。由于人工進行盾構機控制時人對于施工狀況的反應的滯后性,所采集到的數(shù)據可能是盾構司機對于先前盾構狀況所做出的決策,故可認為盾構數(shù)據的缺陷也是導致模型效果不佳的重要原因。此外,由于盾構機的螺旋輸送機轉速值分布不均衡,存在樣本不均衡的問題暫時無法解決,本文認為螺旋輸送機的轉速樣本不均衡同樣是導致模型效果不完美的重要原因之一。需要指出的是,對于不同的盾構機,模型的效果也是不同的并且有較大差距,本文認為盾構機的型號和運行等因素也是影響預測偏差的重要成因。

        3 結論

        影響盾構螺旋輸送機轉速的因素眾多,機器學習方法運用于盾構螺旋輸送機轉速預測這一14分類問題取得的一定的效果。相較于決策樹、隨機森林和支持向量機等模型,神經網絡分類算法的預測準確度效果好,預測結果的平均絕對誤差在0.9左右。但由于盾構施工作業(yè)需要防范風險,提高控制系統(tǒng)的可靠性,并且出于對算法的運行速度的考慮,實際應用中仍需提高預測精度,保證盾構施工更加科學、高效和安全。

        猜你喜歡
        分類特征模型
        一半模型
        分類算一算
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        如何表達“特征”
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        分類討論求坐標
        數(shù)據分析中的分類討論
        教你一招:數(shù)的分類
        抓住特征巧觀察
        绿帽人妻被插出白浆免费观看| 少妇人妻陈艳和黑人教练| 国产免费久久精品99久久| 中文字幕天天躁日日躁狠狠躁免费| 538在线啪在线观看| 国产精品毛片无码久久| 依依成人影视国产精品| 日本激情一区二区三区| 亚洲av男人的天堂在线| 久久久久亚洲av成人人电影| 国产乱人偷精品人妻a片| 久久乐国产精品亚洲综合| 国产av一区二区三区丝袜| 亚洲免费无毛av一区二区三区| 国产白浆流出一区二区| 日本中文字幕婷婷在线| 亚洲国产精品久久久久久无码| 99精品国产在热久久无码| 国产成人精品综合在线观看| 国产欧美精品一区二区三区–老狼 | 一区二区三区四区中文字幕av| 午夜久久久久久禁播电影| 国产无人区码一码二码三mba| 日本手机在线| 日韩中文字幕无码av| 亚洲男人在线天堂av| 日韩精品综合一本久道在线视频| 国产午夜福利久久精品| 香蕉视频在线精品视频| 亚洲国产成人精品无码区在线观看| 日批视频免费在线观看| 色综合久久人妻精品日韩| 成人一区二区人妻少妇| 亚洲av无码一区二区三区网址| 久久精品国产亚洲av忘忧草18| 欧美成人www免费全部网站| 亚洲av五月天天堂网| 亚洲午夜精品一区二区麻豆av| 亚洲av无码专区亚洲av网站| 一本色道久久综合狠狠躁 | 三级网址在线|