王敏 馮旭 譚旭洋
摘要:該文闡述了以樹莓派3b+為主控,利用單目測距方法,OpenCV計算機視覺庫,VGG網絡模型的非接觸物體尺寸形態(tài)測量系統(tǒng)的設計與實現。通過樹莓派3b+對引導標識的圖像識別捕獲處理得到平面目標顏色、形狀、尺寸、距離,以及球的種類,與球表面最近的距離。最終測試結果表明:該系統(tǒng)能夠正確識別目標形狀、類別、顏色,測距誤差及圖像處理時長能滿足系統(tǒng)要求。
關鍵詞:單目測距;OpenCV;VGG網絡模型;非接觸測量
中圖分類號:TP393? ? ?文獻標識碼:A
文章編號:1009-3044(2021)13-0246-03
1 引言
隨著流水線智能化、自動化水平的提高,要求機械手能自主識別流水線上的工件[1]。為了讓機械手能夠準確識別工件,并且處理時間短是十分有必要的。針對這一問題,本設計研究非接觸物體尺寸形態(tài)測量系統(tǒng),一鍵式啟動系統(tǒng)自動識別,能夠準確獲取物體尺寸形態(tài)信息。
2 系統(tǒng)方案總體設計
系統(tǒng)總體框圖如圖1所示:攝像頭作為數據采集器,獲取目標的圖像信息;通過按鍵獲取當前工作模式,進入相應工作狀態(tài)。樹莓派3b+對采集到的圖像數據進行分析,對舵機進行控制使攝像頭旋轉指向目標位置; HDMI顯示屏顯示處理結果。
3 理論分析與計算
3.1 識別平面目標形狀算法原理
本系統(tǒng)有三種測試平面目標形狀:正三角形,圓,正方形。若目標區(qū)域的左右頂點像素長與上下頂點像素長的差值大于設定閾值并且目標像素頂點在設定的閾值內存在重合點,則目標圖形為三角形。反之,則為圓形或者正方形。進一步判斷,作目標區(qū)域的外接矩形,設定上界線與下界線如圖2所示,其中上界線與下界線到外接矩形中心距離相等。若外接矩形減去四個三角形大于設定閾值并且在外接矩形中上界線與下界線所在行的目標像素點數目均大于設定閾值,則目標形狀為圓形。反之,為正方形。從而實現了平面目標形狀的識別。
3.2 測量平面目標尺寸算法原理
4 電路與程序設計
4.1 主控接口電路設計
主控接口電路設計如圖3所示,按鍵分別與GPIO28,GPIO29相接。舵機與主控芯片的GPIO25相接。LED提示燈與主控芯片的GPIO22相接。蜂鳴器與主控芯片的GPIO21相接。當測量完成后,LED點亮蜂鳴器打開維持2秒,隨后自動關閉。
4.2 系統(tǒng)軟件設計
系統(tǒng)上電后,初始化硬件設備,按下按鍵啟動本系統(tǒng),按鍵1對應平面目標識別工作模式,按鍵2對應球類識別工作模式。樹莓派3b+對圖像的預處理過程如圖4所示。①對采集到的圖像做彩色空間轉換的預處理②設定一定的閾值,采用閾值分割的方法二值化圖像,從而識別目標顏色,并提取出白色背景板及以內的所有像素點。③通過拉伸像素強度分布范圍來增強圖像對比度,均衡化圖像中像素強度分布。④使用均值濾波算法對圖像降噪。預處理后,依據上述理論分析與計算識別平面目標的形狀,尺寸,距離。
4.2.1彩色空間轉換設計
由于拍攝的照片是彩色圖像,直接處理耗時較長,考慮到系統(tǒng)的實時性要求,在處理圖像之前把彩色圖像轉換為灰色圖像,具體做法為RGB格式轉換為HSV格式。HSV分別是色相(Hue)、飽和度(Saturation)、亮度(Value)。RGB到HSV的轉換公式如公式11、12、13所示:
其中max等于r,g,b三者中的最大值,min等于r,g,b三者中的最小值。通過上述公式實現了彩色空間的轉換,避免色彩失真。由于圖像在生成和傳輸的過程中難免會受到噪聲的污染[2],所以本系統(tǒng)采用均值濾波算法對圖像進行降噪,以提高圖像信噪比。
4.2.2 閾值分割方法識別目標顏色設計
設定紅綠藍三種顏色的HSV標準區(qū)間值如表1所示,通過比較圖形中像素點的HSV值和標準值區(qū)間值,對像素點進行顏色歸類,該顏色值設為255,其余設為0。
4.2.3 判別球的種類程序設計
球類識別采用VGG網絡模型。VGG網絡是一種經典的卷積神經網絡, 卷積神經網絡是一種建立在傳統(tǒng)人工神經網絡的深度學習算法[3]。主要包含卷積層、池化層、全連接層、softmax分類器。
本系統(tǒng)有三種類型的球:籃球、排球、足球。
判別球的種類的算法操作流程如圖5所示,具體步驟為:
步驟1:拍攝籃球排球足球每個樣本200張圖片作為數據集。
步驟2:將圖片尺寸轉換為224×224×3,并將圖片數據歸一化,使圖片向量值壓縮至[0,1]區(qū)間內。
步驟3:基于VGG-16網絡框架,加入輸出為256的全連接層,用3標簽的softmax分類器替換原來的VGG-16分類器。
步驟4:使用VGG-16的模型參數,保持13個卷積層和池化層的參數不變,將VGG-16的最后一個池化層輸出連接自己的全連接層以及使用3標簽的softmax分類器作為本框架的分類器。
步驟5:凍結VGG-16的前13個卷積層和池化層參數,訓練一個全連接層和softmax分類器。
權重從而實現本系統(tǒng)的球類分類模型。
VGG模型訓練結果:迭代30次后模型衡量指標:訓練損失值loss等于7.5163e-04,訓練準確率acc等于1,預測損失值val_loss等于7.7697e-04,預測準確率val_acc等于1。
5 結論
本文先用彩色圖像轉灰色圖像方法以減少處理時長,再用均值濾波算法減少噪聲對圖片的干擾,基于單目測距方法測量目標的距離,采用VGG網絡模型識別球的種類。系統(tǒng)整體算法簡單,準確率高。
參考文獻:
[1] 郭天天,杜耀志.基于顏色輪廓的多邊形識別及FPGA實現[J].工業(yè)控制計算機,2020,33(9):86-88.
[2] 郜偉雪.淺析圖像降噪的算法研究[J].無線互聯科技,2016(21):121-122.
[3] 李源熠.基于深度學習的圖片匹配算法實現[D].北京:北京交通大學,2018.
【通聯編輯:梁書】