董亮,李夢希
(1.中冶京誠工程技術(shù)有限公司;2.云南滇中新區(qū)嵩昆路建設(shè)指揮部)
【關(guān)鍵字】綜合管廊;機(jī)器視覺;目標(biāo)檢測;深度學(xué)習(xí)
在綜合管廊建設(shè)中,除需解決設(shè)計和施工難題,以及新工藝、新設(shè)備、新材料的應(yīng)用外,為保證綜合管廊的可靠運(yùn)行,需建立以智慧化平臺為核心,配套高標(biāo)準(zhǔn)的設(shè)備及標(biāo)準(zhǔn)化的運(yùn)營維護(hù)手段,以實(shí)現(xiàn)綜合管廊百年工程的安全、經(jīng)濟(jì)、高效的運(yùn)營。中冶京誠綜合管廊智慧管控平臺的建設(shè)充分吸收國內(nèi)外的先進(jìn)技術(shù)及運(yùn)維經(jīng)驗,采用可靠、穩(wěn)定的硬件設(shè)備和軟件程序,實(shí)現(xiàn)對管廊內(nèi)靜態(tài)設(shè)施和動態(tài)設(shè)備的管理以及移動生物的檢測,保障設(shè)備、管線、人員安全,達(dá)到維護(hù)綜合管廊的正常運(yùn)行和事故應(yīng)急處置等目標(biāo)。
如果把我們?nèi)祟惖难劬醋鲾z像頭,那么給一個5歲的嬰兒訓(xùn)練物品記憶,他可以識別出來這個獨(dú)立的物品并把它記住,當(dāng)你下次再給他時,他能告訴你那是什么。即使是在一個雜亂的屋子里他也可以在凌亂的物品堆里找到那個物品。相對于機(jī)器來說人類擁有立體視覺可以將圖像分層次遠(yuǎn)近的識別出來,同時擁有無限的記憶可能,機(jī)器是相通的,我們通過對機(jī)器的訓(xùn)練,使他可以在有限的空間里面發(fā)現(xiàn)對它有用的目標(biāo),例如維護(hù)工人的工具箱、擅自闖入的成年人、不慎墜入管廊的小動物等等。
為了模仿人類的視覺,科學(xué)家將視覺感知分為了四個不同的類型:
①分類,為圖像指定一個標(biāo)簽;
②定位,對特定的標(biāo)簽指定一個邊框;
③檢測,在圖像中找到所有物品并分別繪制邊框;
④分割,得到物體在圖像中的精確位置。
實(shí)際上物體檢測在管廊應(yīng)用中只要能夠在圖像中找到所有標(biāo)定的物體并對危險物體進(jìn)行報警就已經(jīng)足夠了,如果有需求可以將物體在邊框中單獨(dú)分割出來進(jìn)行它用。
物體檢測在管廊中解決了很多問題,這里概括說一下,本篇論文不包含功能實(shí)現(xiàn),僅提供方法。
1)入侵物體檢測
當(dāng)圖像中出現(xiàn)并不屬于本圖像中的物體時對它進(jìn)行識別,比如入侵者、動物、工具箱、梯子等并發(fā)出警告;
2)遺失物體檢測
當(dāng)本屬于圖像中的物體從本圖像中消失時發(fā)出警告信息,比如原本安裝在墻壁上的儀表不見了,這時候要發(fā)出警告;
3)物體位移檢測
當(dāng)圖像中某個位置的物體移動到了其它位置時發(fā)出警告信息,比如電話機(jī)的話筒本應(yīng)掛在電話機(jī)上的但是被粗心的工作人員放到橋架上并沒有掛斷,這時候發(fā)出警告;
計算物體數(shù)目,物體檢測是計算物體數(shù)目最有效的方法之一,在管廊中通過它計算進(jìn)入管廊的人數(shù)及管廊中現(xiàn)有人數(shù),也可應(yīng)用到倉庫管理中;
4)物體類型檢測
當(dāng)圖像中出現(xiàn)某些危險類型的物體時進(jìn)行報警,例如在燃?xì)馀摮霈F(xiàn)乙炔罐等可產(chǎn)生明火的物體;
5)物體尺寸檢測
通過攝像頭可以計算出物體的大小,例如不慎墜入管廊內(nèi)的小狗有多大,這些信息可供工作人員參考準(zhǔn)備工具,如果是只藏獒工作人員可以考慮報警;
物體相互作用,當(dāng)圖像中某兩個物體擠壓或碰撞在一起進(jìn)行警告,例如工作人員倚靠電纜橋架等危險接觸;
6)物體跟蹤監(jiān)測
獲取在不同時間所在的位置進(jìn)行跟蹤,并計算他的速度,例如巡檢機(jī)器人是否按既定路線進(jìn)行工作的。
目前在世界上有很多用于物體檢測的模型庫,每一個都有它的特點(diǎn),都非常的實(shí)用,經(jīng)過各種權(quán)衡我們采用了YOLO(You only look once),后面將介紹如何通過YOLO進(jìn)行可視化檢測。
深度學(xué)習(xí)的工作流程有6個基本步驟,分了三部分,分別是:收集訓(xùn)練集、訓(xùn)練模型、預(yù)測新圖像。
1)收集圖像
首先是收集物體圖像,雖然不是越多越好,但是也要盡量的多,為每個對象收集百張進(jìn)行訓(xùn)練不嫌多。對象的圖像要全面,不同的面不同的角度都要有,另外應(yīng)為是應(yīng)用于地下管廊的,因此這些對象的圖像最好盡量都是在管廊不同的環(huán)境下進(jìn)行捕獲的,未來在進(jìn)行識別的時候準(zhǔn)確性更高。
2)注釋
接下來需要在圖像上進(jìn)行繪制邊界的工作,這個工作比較耗時,可以通過labelImg等類似工具進(jìn)行注釋。
1)預(yù)訓(xùn)練
目前在互聯(lián)網(wǎng)上可以找到很多已經(jīng)訓(xùn)練好的模型,比如人、狗、貓等常見物體,以此來節(jié)省你的工作消耗。
2)在GPU上訓(xùn)練
可以在互聯(lián)網(wǎng)上找到一些模型訓(xùn)練的服務(wù)器,這樣會使訓(xùn)練更簡單。
1)通過攝像頭捕獲圖像
在管廊應(yīng)用中捕獲攝像頭圖像的方法有很多,這里就不在闡述了,無論是RTSP還是RTMP獲取圖像的方法都類似。
2)預(yù)測圖像
預(yù)測圖像有多種方式,簡單來說管廊應(yīng)用到以下方式:
單圖片檢測:./darknet detect cfg/yolo.cfg yolo.weights data/dog.jpg
多圖片檢測:./darknet detect cfg/yolo.cfg yolo.weights
如果想單獨(dú)對某個攝像頭進(jìn)行實(shí)時檢測,則需要借助opencv庫來實(shí)現(xiàn),這樣雖然可以對攝像頭每一幀的圖像都進(jìn)行識別,但是勢必會影像效率,所以如果需要可以考慮獲取攝像頭影像時進(jìn)行跳幀獲取,比如12FPS。
地下綜合管廊作為城市的生命線,它的安全至關(guān)重要!物體檢測只是眾多提高管廊安全手段中的一個,安全也涉及很多方面,對人的、對物、對本體結(jié)構(gòu)等等。