Tom+Macaulay+Charles
這家工程公司通過對傳感器信息進(jìn)行監(jiān)測來發(fā)現(xiàn)故障前兆,提前進(jìn)行鐵路維護(hù).
西門子設(shè)計(jì)列車有近150年的歷史,包括1879年的第一臺(tái)電動(dòng)客運(yùn)機(jī)車。而它最近在軌道上的創(chuàng)新是由數(shù)據(jù)分析驅(qū)動(dòng)的。利用傳感器分析列車和軌道上的信息,有助于使鐵路維護(hù)方法從被動(dòng)變?yōu)橹鲃?dòng)。
通過診斷傳感器數(shù)據(jù),評估部件的狀態(tài),公司可以提前發(fā)現(xiàn)顯示什么時(shí)候會(huì)出現(xiàn)故障的模式。然后,通過實(shí)時(shí)監(jiān)測信息,西門子在故障導(dǎo)致服務(wù)中斷之前迅速做出反應(yīng)。如果檢測到異常,則發(fā)送部件進(jìn)行檢查。
這種方法的好處包括減少延誤、增加里程、降低勞動(dòng)力成本,并且提高了維護(hù)計(jì)劃的效率。這樣,西門子能夠?yàn)榭蛻籼峁└嗷谛阅芫S護(hù)的合同。
在軌道上應(yīng)用數(shù)據(jù)科學(xué)
幾年前,在德國的一家機(jī)車工廠,西門子召集了一批數(shù)據(jù)科學(xué)家和工程師來開發(fā)預(yù)測列車部件和鐵路基礎(chǔ)設(shè)施故障的算法。
西門子移動(dòng)數(shù)據(jù)服務(wù)主任Gerhard Kress向《英國計(jì)算機(jī)世界》解釋說:“這是因?yàn)楣I(yè)數(shù)據(jù)的表現(xiàn)與互聯(lián)網(wǎng)數(shù)據(jù)不同,我們使用的很多經(jīng)典分析模型在這種環(huán)境下效果不佳。另外,因?yàn)檫@些部件不會(huì)經(jīng)常性的出現(xiàn)故障,所以需要極高的預(yù)測精度,比我們之前見過的任何其他組件都高?!?/p>
僅在過去兩年中,這一團(tuán)隊(duì)已經(jīng)在新的數(shù)學(xué)方法上提交了30項(xiàng)不同的專利。
2013年,西門子轉(zhuǎn)向大數(shù)據(jù)供應(yīng)商Teradata,目的是讓這些模型具有先進(jìn)的數(shù)據(jù)分析功能。西門子部署了自己版本的Teradata統(tǒng)一數(shù)據(jù)架構(gòu)(UDA),包括數(shù)據(jù)倉庫、Aster發(fā)現(xiàn)分析工具和Hadoop應(yīng)用。
預(yù)測分析增強(qiáng)了檢測能力,使西門子在俄羅斯的高速列車的可用性提高到了99.96%,而泰國的地鐵機(jī)車可用性則達(dá)到了99.98%。
西門子還使用這個(gè)框架為英國很多地區(qū)的列車提供主動(dòng)維護(hù),包括倫敦的Thameslink鐵路系統(tǒng)。
列車上的傳感器設(shè)置
Kress把他的列車數(shù)據(jù)分析策略分成三個(gè)部分:了解不同部件的狀態(tài)來預(yù)測故障;利用天氣、平穩(wěn)的行駛和多功能衛(wèi)生間來提高乘客的體驗(yàn);最大限度地提高能源效率,降低運(yùn)行成本。
他說:“一輛列車在生命周期中消耗的能量比購買列車的成本高得多。如果做得好,很容易將能耗成本降低10%?!?/p>
一輛機(jī)車通常有150到200個(gè)傳感器,高速列車每節(jié)車廂有300到350個(gè)傳感器。這包括每個(gè)制動(dòng)器上的一些傳感器,它們分析制動(dòng)壓力和液壓油,以保證列車能及時(shí)制動(dòng)。它們測量部件的溫度和壓力,并將數(shù)據(jù)與數(shù)千份故障和修復(fù)報(bào)告記錄進(jìn)行比較。
Kress表示:“傳感器也存在故障風(fēng)險(xiǎn),如果安裝太多的傳感器,它們帶來的問題比其能解決的問題還要多。我們盡可能少地采用傳感器,因?yàn)榘惭b得越多,出故障的可能性就越大?!?/p>
電機(jī)、變速箱、軸承和車輪都是機(jī)械連接的,并不是都需要各自的傳感器。西門子可以使用一個(gè)虛擬傳感器,它通過算法評估來計(jì)算每個(gè)部分的誤差,例如傳熱率等。
還可以把不同部件的數(shù)據(jù)組合起來,這樣,列車和鐵軌上的傳感器互相監(jiān)測,從而減少了所需的檢查次數(shù)。
分析有什么好處?
西門子以前依靠應(yīng)急響應(yīng)和例行檢查保持列車正常運(yùn)行。這一過程需要技術(shù)人員打開列車查找故障原因,然后去取回備件和工具,再返回進(jìn)行維修。
結(jié)果對維修時(shí)間和延遲都有很大的影響。列車上一扇損壞的門會(huì)導(dǎo)致兩站之間的運(yùn)行時(shí)間增加10~15秒。經(jīng)過20站之后,列車已經(jīng)晚點(diǎn)五分鐘,當(dāng)天的整個(gè)行程都被推遲了。西門子現(xiàn)在監(jiān)測每列列車的車門,能夠在出現(xiàn)故障之前發(fā)現(xiàn)潛在的問題。
Kress說:“如果Thameslink的門有問題,在某些情況下,我們可以提前一個(gè)半星期發(fā)現(xiàn)這些問題。
然后技術(shù)人員可以去查看那個(gè)車廂右邊的五號(hào)門,他們走到那里,檢查一下,在那里放些潤滑油,然后再次啟動(dòng),不會(huì)再出現(xiàn)故障了?!?/p>
西門子還為歐洲之星列車提供維修服務(wù),這些列車傳統(tǒng)上使用的傳感器會(huì)發(fā)出故障警報(bào),并強(qiáng)制停車。然而,這些傳感器本身容易出現(xiàn)故障。
Kress回憶說:“幾年前出現(xiàn)過這種事,當(dāng)時(shí)我們部門還不存在,我們不得不撤離在軌道上工作的700人。
一年前也有過同樣的情況,看起來非常相似。我們首先意識(shí)到,這是一個(gè)傳感器問題?,F(xiàn)在我們有信心,在列車出現(xiàn)這一問題的一個(gè)半星期之前,我們就能發(fā)現(xiàn)它。我們可以對操作人員說,你應(yīng)該把車廂那邊軸承上的傳感器換了,他們就這樣做了,對操作沒有任何干擾?!?/p>
為什么是Teradata?
Kress說;“Teradata是市場上唯一一家知道這個(gè)世界不僅僅是一個(gè)數(shù)據(jù)倉庫的公司。Teradata有競爭,但鑒于我們的數(shù)據(jù)結(jié)構(gòu),我們需要一個(gè)能完成更多任務(wù)的系統(tǒng),所以UDA對我們來說是最主要的?!?/p>
西門子采用了組合框架,包括Apache Spark和TensorFlow,為每一項(xiàng)分析任務(wù)開發(fā)了具體的機(jī)器學(xué)習(xí)方法。鼓勵(lì)在單獨(dú)和安全的工作環(huán)境中使用這些模型進(jìn)行實(shí)驗(yàn)。
Kress說;“我們要?jiǎng)?chuàng)建的分析模型是一個(gè)沙箱,數(shù)據(jù)科學(xué)家可以使用這些數(shù)據(jù)來識(shí)別模型的結(jié)構(gòu)。一旦確定了結(jié)構(gòu),我們會(huì)把模型投入使用,那么我們就有了一個(gè)經(jīng)典的三層架構(gòu),即開發(fā)、測試和實(shí)施?!?/p>
這一連續(xù)的集成和部署過程使用了相同的底層數(shù)據(jù)湖,所以即使科學(xué)家在沙箱中,他們也可以看到存在的所有數(shù)據(jù),知道怎樣組合數(shù)據(jù)點(diǎn)以獲得他們所需的深度分析結(jié)果。這一創(chuàng)造性的過程產(chǎn)生了一種可以在鐵路監(jiān)測中連續(xù)實(shí)施的分析模型。
西門子在其鐵路服務(wù)中,每秒采集大約5萬多個(gè)數(shù)據(jù)點(diǎn),并且需要長時(shí)間存儲(chǔ)數(shù)據(jù)。在部署模型時(shí),由于西門子分析工作負(fù)載非常復(fù)雜而且多樣,因此,必須采用Teradata。
Kress說:“我必須平衡所有這些不同的工作負(fù)載,讓系統(tǒng)保持穩(wěn)定。如果我在Hadoop上這樣做,我的一名員工會(huì)提交很多工作負(fù)載,接下來的兩天客戶不會(huì)得到任何回應(yīng)。這是不能接受的?!?