陳明輝 崔成 晁明浩 陳大偉 劉同岡
(中國礦業(yè)大學(xué) 江蘇徐州 221116)
隨著全球工業(yè)生產(chǎn)的蓬勃發(fā)展,工業(yè)機(jī)器人現(xiàn)已成為一種不可或缺的自動化設(shè)備[1]。機(jī)器視覺是一種新型科技技術(shù),它可以判斷物體與攝像機(jī)的法向距離和水平面上的位置精度[2]。而借助語音識別的新興技術(shù),已經(jīng)實(shí)現(xiàn)了人可與機(jī)器進(jìn)行語音交流。工業(yè)機(jī)器人、語音識別和機(jī)器視覺三者協(xié)同發(fā)展,將極大地改變傳統(tǒng)的生產(chǎn)模式[3]。
本次設(shè)計(jì)的目標(biāo)是智能分揀雜亂的工件,工件的外形特征和外觀顏色會被識別出來。考慮到現(xiàn)有條件即設(shè)計(jì)周期的要求,本文通過對實(shí)際場景進(jìn)行等比縮小,設(shè)計(jì)了一種小型智能臺式工業(yè)機(jī)械臂系統(tǒng)。并在此基礎(chǔ)上,將視覺識別與機(jī)械臂協(xié)作相結(jié)合,同時(shí)加入語音的控制方式,結(jié)合現(xiàn)有的傳送帶系統(tǒng),打造一臺更加智能的人機(jī)協(xié)作共同體。
分揀裝置主要由機(jī)械臂、傳送帶和光電傳感器組成。本設(shè)計(jì)采用的四自由度機(jī)械臂為越疆科技的Dobot機(jī)械臂,其腕部執(zhí)行結(jié)構(gòu)是一個(gè)負(fù)壓式吸盤。在抓取過程中,機(jī)械手首先移動到目標(biāo)工件的頂部,當(dāng)機(jī)械臂末端吸盤與工件接觸的時(shí)候,控制器下達(dá)指令到氣泵,這時(shí)會在吸盤中產(chǎn)生一定的負(fù)壓,工件會被緊緊吸附在吸盤上。傳送部分選用有較大的接觸面積的開口式平帶來完成工作。同時(shí)選用傳感器檢測類零件來判斷工件是否被取走。傳送帶是一個(gè)開環(huán)的系統(tǒng),不會因?yàn)楣ぜ拇嬖谂c否而停止傳送的工作,所以加入光電傳感器來輔助傳送帶工作。根據(jù)所設(shè)計(jì)的傳送帶的類型,采用E18-D80NK型紅外線式傳感器。以傳感器在電路系統(tǒng)中的信號為開關(guān)量,直接與單片機(jī)的接口進(jìn)行相連接。分揀裝置總體布局如圖1所示。
圖1 分揀裝置總體布局
為提高設(shè)計(jì)中的機(jī)械臂抓取的準(zhǔn)確性,機(jī)械臂需要判斷工件在傳送帶上的水平位置以及所需抓取工件的高度,以確定機(jī)械臂末端的運(yùn)動坐標(biāo)。因此,引入機(jī)器視覺來完成這些工作。視覺識別的目標(biāo)是工件的大小和深度[4]。通過CCD 傳感器的工業(yè)相機(jī),配合調(diào)試的Python程序進(jìn)行識別。識別后發(fā)送數(shù)據(jù)至控制板的串口緩沖區(qū),控制所設(shè)計(jì)的機(jī)械臂,從而完成抓取和分類的動作。攝像頭識別部分的流程圖如圖2所示。
圖2 水平方向流程圖
機(jī)器視覺的主要工作原理是攝像機(jī)采集圖像,處理器對圖像進(jìn)行運(yùn)算分析,將最終的結(jié)果反饋給控制器[5],最后系統(tǒng)控制機(jī)械臂對抓取操作進(jìn)行定位和控制。視覺識別模塊的硬件主要由工業(yè)相機(jī)、工業(yè)鏡頭和PC 機(jī)等組成。攝像機(jī)選用深圳深度視覺科技公司生產(chǎn)的工業(yè)相機(jī),其能夠在計(jì)算機(jī)屏幕上實(shí)時(shí)顯示環(huán)境的圖像。鏡頭選用深圳顯微精工直銷店出售的鏡頭,可手動變焦。
語音識別的目的是實(shí)現(xiàn)人與機(jī)器之間的語音通信,提高系統(tǒng)的智能化水平和工作能力[6]。根據(jù)任務(wù)要求和裝置工作環(huán)境,決定采用集成化的語音模塊LD3320語音識別芯片。芯片上集成了運(yùn)算處理器,具有非常高的精度,不需要網(wǎng)絡(luò)連接,可配合其他電子器件的外部電路。芯片上嵌有A/D 和D/A 轉(zhuǎn)換的部分,在編寫控制函數(shù)的過程中,可以非常方便、快捷地自定義識別目標(biāo)。芯片內(nèi)部電路邏輯圖如圖3所示。
圖3 芯片內(nèi)部邏輯圖
候選列表是LD3320 語音識別技術(shù)的核心。將候選內(nèi)容放入指定寄存器,通過將MIC 的音頻信號輸入芯片,進(jìn)行聲譜分析、特征提取和關(guān)鍵詞匹配,找出得分最高的關(guān)鍵詞,并輸出到MCU作為結(jié)果。其邏輯如圖4所示。
圖4 語音識別芯片工作原理
識別條件有以下兩種情況。第一種情況,語音數(shù)據(jù)的長度固定,可以理解為定時(shí)記錄。芯片只在規(guī)定的時(shí)間內(nèi)將語音發(fā)送到識別模塊進(jìn)行計(jì)算和分析。對定長的聲音數(shù)據(jù)進(jìn)行識別和處理,得到與實(shí)際輸入指令相符的結(jié)果[7]。第二種情況,操作者開始說出控制指令和說完的時(shí)間是規(guī)定好的。這樣一來,芯片只會對規(guī)定時(shí)間長度內(nèi)采集到的語音數(shù)據(jù)進(jìn)行分析。芯片會自行判斷語音開始和結(jié)束的時(shí)間節(jié)點(diǎn),會對采集到的聲音數(shù)據(jù)進(jìn)行處理,得到與實(shí)際輸入命令一致的結(jié)果。
通過設(shè)計(jì)Arduino控制板解決LD3320語音識別模塊不能直接與計(jì)算機(jī)進(jìn)行通信的問題,并且在控制板上集成完畢相對應(yīng)接口,用以接入LED、按鈕和搖桿等手動控制模塊。同時(shí),控制板布置在計(jì)算機(jī)和機(jī)械臂之間,提高信息傳輸?shù)男屎陀行?。控制電路整體原理結(jié)構(gòu)如圖5所示。
圖5 控制電路整體原理圖
語音模塊的供電直接來自于Arduino控制器,采用的是3.3V直流電壓,將各所需要的接口連接在控制器自定義的接口上,并對控制器進(jìn)行編程,來成功加載語音芯片并進(jìn)行使用[8]。當(dāng)操作者說出控制的話語時(shí),語音識別芯片采集到數(shù)據(jù),經(jīng)過處理運(yùn)算后將數(shù)據(jù)發(fā)送至控制器??刂破鬟M(jìn)一步將數(shù)據(jù)整合后發(fā)送給計(jì)算機(jī)或者機(jī)械臂來完成下一步的操作。其連接示意圖如圖6所示。
圖6 語音模塊連接示意圖
按鈕、LED 和搖桿模塊的供電是直接來自于Arduino 控制器,采用的是5V 直流電壓。將各個(gè)按鈕和LED 接入電源后,還需要接入觸發(fā)信號。自定義的線路與按鈕或者LED 進(jìn)行相連接后,就能夠采集按鈕的輸入開關(guān)量,并且輸出相關(guān)信號到LED 以示意。當(dāng)操作者按下按鈕時(shí),對應(yīng)的LED 指示燈亮起。同時(shí)搖桿模塊的接入可以更智能化地控制機(jī)械臂來進(jìn)行各個(gè)方位的空間移動。該模塊連接示意圖如圖7所示。
圖7 按鈕、LED 和搖桿模塊
將各個(gè)模塊與底層芯片的接口集成到一塊小型PCB 上。這塊PCB 底部有標(biāo)準(zhǔn)的針座,可以完全地插入Arduino mega 2560控制器的接口上。這種連接方式緊密,不漏電。同時(shí),上下兩層PCB均有對應(yīng)的螺絲孔位,易于進(jìn)一步固定和安裝。本文中設(shè)計(jì)的機(jī)械臂采用12V 直流電源,采用通信信號接口與機(jī)械臂相連。其布線如圖8所示。
圖8 PCB布線設(shè)計(jì)
將上層的PCB 加工好后,進(jìn)行零件焊接調(diào)試等工作,最終與底層的控制器進(jìn)行緊密相連,如圖9所示。
圖9 控制器裝配圖
將所有部件與控制模塊相連,其實(shí)物圖如圖10所示。
圖10 總實(shí)物圖
本系統(tǒng)實(shí)現(xiàn)了高度智能化,采用語音操控并且結(jié)合了機(jī)器視覺,可以根據(jù)工件的形狀和所處的空間位置自動調(diào)整機(jī)械臂的抓取位置。攝像頭模塊進(jìn)行程序識別,分析出工件的水平位置、垂直高度、形狀和高度,同時(shí)將信息輸入計(jì)算機(jī)控制面板。此外,設(shè)計(jì)中加入了語音識別模塊,增強(qiáng)整個(gè)系統(tǒng)的通用性和智能化,機(jī)器可以“理解”人的語言。語音識別功能可以識別多種語音指令。當(dāng)芯片檢測到觸發(fā)指令后,會進(jìn)行頻譜分析、提取特征、關(guān)鍵詞匹配等流程進(jìn)行判斷,進(jìn)而產(chǎn)生中斷指令將識別的結(jié)果發(fā)送至控制板,機(jī)械臂結(jié)合工件信息迅速響應(yīng)并完成工作。