鐘修皓,王曉虹,劉文壯,張 錫,張 彤
(遼寧石油化工大學(xué) 計(jì)算機(jī)與通信工程學(xué)院,遼寧 撫順 113001)
近年來隨著人工智能技術(shù)、計(jì)算機(jī)技術(shù)等相關(guān)技術(shù)的發(fā)展,對(duì)移動(dòng)機(jī)器人的研究越來越多。智能語音巡檢機(jī)器人可有效地應(yīng)用在石化、油田、核工業(yè)等行業(yè)中,尤其在管道、罐體塔體等人員不方便到達(dá)的區(qū)域,智能語音機(jī)器人可以發(fā)揮其優(yōu)勢(shì)。本系統(tǒng)可以通過語音來指揮現(xiàn)場的巡檢機(jī)器人進(jìn)行圖像采集、準(zhǔn)確的測試周圍環(huán)境相關(guān)參數(shù)、全方位查看容器內(nèi)部的損傷等情況,從而可以減少意外事故的發(fā)生。與常規(guī)的無損檢測設(shè)備相比,系統(tǒng)引入了多傳感器系統(tǒng)的智能語音機(jī)器人,在檢測靈活性和可靠性上有不可比擬的優(yōu)勢(shì)。而且,系統(tǒng)檢測的數(shù)據(jù)的準(zhǔn)確性非常高。經(jīng)過現(xiàn)場實(shí)驗(yàn)表明,該系統(tǒng)智能化程度高,運(yùn)動(dòng)穩(wěn)定可靠,本系統(tǒng)具有很高的推廣價(jià)值,有廣闊的應(yīng)用前景。目前,國內(nèi)外對(duì)環(huán)境、設(shè)備等的安全監(jiān)測問題一直是重要的研究方向。
本系統(tǒng)的基本功能是采用智能語音機(jī)器人對(duì)監(jiān)測介質(zhì)的指標(biāo)數(shù)據(jù)進(jìn)行監(jiān)測,通過USB攝像頭全方位采集對(duì)象的重要部位圖像,通過運(yùn)行客戶端、建立連接,由此不斷獲取服務(wù)器傳回的視頻信息,得到直觀的介質(zhì)實(shí)際情況。通過各種傳感器獲得當(dāng)前介質(zhì)的重要信息,并且通過這些重要信息對(duì)監(jiān)測對(duì)象進(jìn)行危險(xiǎn)系數(shù)評(píng)估,從而為監(jiān)測對(duì)象的安全運(yùn)行提供精確和有力的技術(shù)支撐。
智能語音機(jī)器人主要是通過語音識(shí)別進(jìn)行控制行走。機(jī)器人的控制主要是通過語音識(shí)別指令,機(jī)器人再根據(jù)指令執(zhí)行相應(yīng)的動(dòng)作,控制是通過附加在MCU上的語音模塊來實(shí)現(xiàn)??蛻舳吮O(jiān)控為用戶提供遠(yuǎn)程視頻監(jiān)控服務(wù),進(jìn)一步擴(kuò)展了視頻監(jiān)控的使用范圍。將PC機(jī)通過IP網(wǎng)絡(luò)與服務(wù)器相連,可以遠(yuǎn)程播放。
系統(tǒng)功能結(jié)構(gòu)圖如圖1所示,系統(tǒng)主要包括視頻采集模塊、指標(biāo)體系數(shù)據(jù)采集模塊、機(jī)器人控制模塊、中控端控制模塊、移動(dòng)終端控制模塊、數(shù)據(jù)處理模塊、語音識(shí)別模塊、通信模塊等。
系統(tǒng)的每個(gè)模塊都包含一個(gè)或多個(gè)線程,有些線程在系統(tǒng)運(yùn)行之初就開始運(yùn)行(如視頻采集線程);有些線程在一定的條件下才被啟動(dòng)。系統(tǒng)可以通過多線程函數(shù)在一定條件下實(shí)現(xiàn)相關(guān)線程的阻塞或喚醒,從而只運(yùn)行那些有用的線程,使系統(tǒng)的效率大大增加。
圖1 系統(tǒng)功能圖Fig.1 System function diagram
智能語音巡檢機(jī)器人系統(tǒng)采用的硬件平臺(tái)是基于ARM體系結(jié)構(gòu),采用Samsung S3c6410嵌入式微處理器。系統(tǒng)采用兩層架構(gòu),上層以S3C6410為核心,負(fù)責(zé)圖像采集等工作,并將圖像通過Wi-Fi方式發(fā)送給PC機(jī),通過語音模塊來完成語音的采集、識(shí)別、命令發(fā)送。下層以直流電機(jī)驅(qū)動(dòng)板為核心,控制機(jī)器人的運(yùn)動(dòng)以及傳感器數(shù)據(jù)處理。系統(tǒng)的硬件框圖如圖2所示,以ARM 6410處理器為核心,外圍連接各種傳感器模塊、語音模塊、直流電機(jī)模塊、視頻采集模塊、無線傳輸模塊等。
圖2 系統(tǒng)硬件結(jié)構(gòu)圖Fig.2 Hardware structure of the system
Video4Linux(簡稱V4L),是Linux中關(guān)于視頻設(shè)備的內(nèi)核驅(qū)動(dòng)[1-2]。Video4Linux是為市場現(xiàn)在常見的電視捕獲卡、并口及USB口的攝像頭提供統(tǒng)一的編程接口。同時(shí)也提供無線電通信和文字電視廣播解碼和垂直消隱的數(shù)據(jù)接口。攝像頭安裝在云臺(tái)上,通過程序可控制攝像頭的位置,進(jìn)而控制攝像的角度,采集到不同角度的圖片。根據(jù)Video4Linux標(biāo)準(zhǔn)接口編程,再對(duì)采集的圖像進(jìn)行閥值比較,判斷圖像是否變化,從而決定是否需要存入圖像緩沖區(qū)。
為了進(jìn)一步提高視頻數(shù)據(jù)的傳輸速度和實(shí)時(shí)性,采集視頻時(shí)利用視頻設(shè)備的雙緩沖達(dá)到邊傳輸邊采集的效果。同時(shí)設(shè)計(jì)一個(gè)內(nèi)存緩沖池,視頻采集圖像經(jīng)過JPEG壓縮后將數(shù)據(jù)保存到緩沖池中,視頻傳輸?shù)臄?shù)據(jù)從該緩沖中獲取。
系統(tǒng)安裝了各種傳感器(如溫濕度傳感器、氣體傳感器、紅外傳感器、煙霧傳感器等)來采集相應(yīng)的數(shù)據(jù)作為監(jiān)測被控對(duì)象的重要指標(biāo)。如溫濕度傳感器通過IIC總線與MCU相連,采取GPIO靜態(tài)驅(qū)動(dòng)方式,全量程校準(zhǔn),全靜態(tài)時(shí)序控制,測量結(jié)果精確。煙霧傳感器使用MCU的外部中斷,在驅(qū)動(dòng)需要預(yù)熱,當(dāng)檢測到有危險(xiǎn)氣體的,觸發(fā)外部中斷,開始報(bào)警。
本系統(tǒng)中的無限傳輸采用的是Wi-Fi技術(shù)。相比于其他無線通信技術(shù),Wi-Fi的覆蓋半徑則可達(dá)300英尺左右約合100 m,其覆蓋范圍比較廣。數(shù)Wi-Fi據(jù)傳輸速度快,可以達(dá)到11 mbps。這些都很適用于本系統(tǒng),特別是在報(bào)警的時(shí)候,可以及時(shí)將相關(guān)的重要數(shù)據(jù)傳回到中控端和移動(dòng)終端[3-4]。
2.4.1 語音模塊設(shè)計(jì)思路
在此系統(tǒng)中,將語音模塊直接接到ARM6410上,并通過此主板對(duì)機(jī)器人進(jìn)行語音控制,這樣,就能更便捷地控制機(jī)器人而不會(huì)像使用PC控制那么繁瑣。在實(shí)現(xiàn)中,會(huì)采用一種語音識(shí)別平臺(tái),通過該平臺(tái)對(duì)語音數(shù)據(jù)進(jìn)行識(shí)別,使用開發(fā)板的串口連接并且驅(qū)動(dòng)機(jī)器人。
2.4.2 語音模塊架構(gòu)
語音模塊作為本系統(tǒng)的主要特色,此處主要采用基于ARM11的語音識(shí)別技術(shù)[5-6]。由于本系統(tǒng)采用S3C6410作為MCU,其主頻達(dá)到667 MHz,并且具有豐富的接口。智能語音巡檢機(jī)器人主要由開發(fā)板的麥克風(fēng)接口對(duì)語音進(jìn)行采集,通過此處的語音模塊對(duì)采集的語音數(shù)據(jù)進(jìn)行處理,然后通過內(nèi)部編程由串口向機(jī)器人發(fā)送相關(guān)的指令來驅(qū)動(dòng)電機(jī),從而實(shí)現(xiàn)機(jī)器人的前進(jìn)、后退、左轉(zhuǎn)、右轉(zhuǎn)等語音控制。
2.4.3 實(shí)現(xiàn)流程
語音識(shí)別的過程是將人類的自然語言轉(zhuǎn)化數(shù)據(jù)信息的過程,語音識(shí)別技術(shù)也可以簡單描述為Voice-Instructions的識(shí)別。語音識(shí)別處理的過程為控制著通過麥克風(fēng)等輸入設(shè)備輸入語音信號(hào),然后語音模塊通過接收器接收語音信號(hào),然后將信號(hào)信息傳入語音識(shí)別平臺(tái),由該平臺(tái)將語音數(shù)據(jù)信息進(jìn)行相關(guān)的處理,從而實(shí)現(xiàn)對(duì)機(jī)器人的控制。實(shí)現(xiàn)流程如圖3所示。
移動(dòng)機(jī)器人上層采用語音控制,下層的硬件采用直流電機(jī)控制機(jī)器人的動(dòng)作。硬件驅(qū)動(dòng)板主要采用雙Ha橋直流電機(jī)驅(qū)動(dòng)芯片,它具有帶載能力強(qiáng)的特點(diǎn)。LKV-HM3.0雙H橋直流電機(jī)驅(qū)動(dòng)板采用ST公司的L298N典型雙H橋直流電機(jī)驅(qū)動(dòng)芯片,可用于驅(qū)動(dòng)直流電機(jī)或雙極性步進(jìn)電機(jī),此驅(qū)動(dòng)板的特點(diǎn)是體積小,重量輕,具有強(qiáng)大的驅(qū)動(dòng)能力。
移動(dòng)機(jī)器人下層控制主要由電機(jī)的開關(guān)控制、電機(jī)轉(zhuǎn)向控制、電機(jī)轉(zhuǎn)速控制組合起來的。通過PWD的調(diào)速來控制機(jī)器人的左轉(zhuǎn)、右轉(zhuǎn)、后退、前進(jìn)、轉(zhuǎn)彎等動(dòng)作。
圖3 語音識(shí)別流程Fig.3 Speech recognition process
文中研究設(shè)計(jì)了智能語音機(jī)器人系統(tǒng)。系統(tǒng)在以S3C6410為核心的嵌入式硬件平臺(tái)上構(gòu)建了一個(gè)適合本系統(tǒng)開發(fā)要求的嵌入式Linux系統(tǒng)軟件平臺(tái)。系統(tǒng)使用USB攝像頭進(jìn)行圖像采集;攝像頭帶云臺(tái),可控制攝像的角度;采用無線數(shù)據(jù)傳輸方式;主板采用S3C6410處理芯片,可以輕松應(yīng)對(duì)視頻采集,視頻處理,無線傳輸?shù)裙δ?。而且可擴(kuò)展能力強(qiáng),多種傳感器模塊,并支持傳感器擴(kuò)展,Linux操作系統(tǒng)支持。系統(tǒng)的適用性很強(qiáng),可隨時(shí)調(diào)整攝像頭的位置,拍攝不同角度的畫面,并且可隨時(shí)調(diào)節(jié)畫面的亮度和對(duì)比度,這使系統(tǒng)的使用更靈活。系統(tǒng)采用語音來控制機(jī)器人的行動(dòng),從而可靈活地顯示當(dāng)前監(jiān)測對(duì)象的現(xiàn)場情況,尤其是人工不易到達(dá)的區(qū)域,系統(tǒng)準(zhǔn)確性高,適用性強(qiáng)。但是語音識(shí)別模塊然目前還存在識(shí)別率不夠高的問題,還需要進(jìn)一步去設(shè)計(jì)和改進(jìn)。
[1]張永強(qiáng),趙永勇,李崇德.嵌入式遠(yuǎn)程視頻采集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代電子技術(shù),2006(4):75-77.ZHANG Yang-qiang,ZHAO Yong-yong,LI Chong-de.The design and implementation of embedded remote video acquisition system[J].The Modern Electronic Technology,2006(4):75-77.
[2]劉潔瑜,王黎明,錢培賢,等.基于MJPEG2000嵌入式網(wǎng)絡(luò)視頻采集壓縮系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].微電子學(xué)與計(jì)算機(jī),2004,21(12):168-173.LIU Jie-yu,WANG Li-ming,QIAN Pei-xian,et al.The design and implementation of embedded network video collection and compression system Based MJPEG2000[J].Microelectronics and Computer,2004,21(12):168-173.
[3]俞輝.嵌入式Linux程序設(shè)計(jì)案與實(shí)驗(yàn)教程[M].北京:機(jī)械工業(yè)出版社,2009.
[4]陳卓,王田,梁新元.嵌入式系統(tǒng)開發(fā)[M].北京:電子工業(yè)出版社,2009.
[5]蔚健,劉志勤.基于ARM11的智能語音識(shí)別機(jī)器人教學(xué)平臺(tái)設(shè)計(jì)[J].軟件導(dǎo)刊,2013,12(5):96-98.WEI Jian,LIU Zhi-qin.The design of intelligent speech recognition robot teaching platform based on ARM11[J].Software Tribune,2013,12(5):96-98.
[6]賈艷麗,楊明剛.景點(diǎn)智能語音導(dǎo)航器設(shè)計(jì)[J].微型機(jī)與應(yīng)用,2012,31(15):21-23.JIA Yan-li,YANG Ming-gang.The design attractions intelligent voice navigation device[J].Micro Computer and Application,2012,31(15):21-23.