郭小磊 辛平 陳廣大 程明 韓志偉
摘 要:針對(duì)盲人因視覺(jué)的缺失而導(dǎo)致的生活困難與精神空虛的難題,提出可與盲人交互并為其提供多種服務(wù)的導(dǎo)盲助手方案。采用STM32F407系列開發(fā)板與樹莓派為控制核心,運(yùn)用圖像處理與語(yǔ)音識(shí)別等技術(shù)為盲人的生活提供包括道路障礙檢測(cè)、環(huán)境語(yǔ)音提醒、熟人識(shí)別、文字識(shí)別、語(yǔ)音位置分享、危險(xiǎn)狀態(tài)檢測(cè)與報(bào)警、人機(jī)交互等多種功能。系統(tǒng)功能全面,使用方便,具有較高的實(shí)用價(jià)值。
關(guān)鍵詞:穿戴式;圖像處理;語(yǔ)音交互;功能全面
據(jù)統(tǒng)計(jì),中國(guó)現(xiàn)有超過(guò)1400萬(wàn)的盲人,因視力的缺失,他們的衣食住行都需要他人的幫助。
為了提高盲人的生活質(zhì)量,設(shè)計(jì)研究出了基于圖像處理的智能穿戴式導(dǎo)盲設(shè)備。用戶可以通過(guò)語(yǔ)音的方式向系統(tǒng)下達(dá)指令,獲得自己想要知道的相關(guān)信息,并且可以讓攝像頭成為自己的眼睛,進(jìn)行人臉識(shí)別與文字識(shí)別,以提升自主生活能力。整個(gè)系統(tǒng)功能全面,操作簡(jiǎn)單,性價(jià)比高,從輔助盲人生活的角度為盲人提供全方位的幫助。
一、智能導(dǎo)盲系統(tǒng)總體設(shè)計(jì)方案
本系統(tǒng)主要由可放置于腰部的設(shè)備主體和位于肩部與手腕部的傳感器組成,以STM32F407系列與Raspberry Pi為控制核心,包含攝像頭模塊、VS1053語(yǔ)音提示模塊、電機(jī)振動(dòng)提示模塊、GPS/GMS???、MPU6050危險(xiǎn)狀態(tài)檢測(cè)模塊。系統(tǒng)通過(guò)攝像頭對(duì)盲人前方的道路進(jìn)行檢測(cè)識(shí)別,當(dāng)發(fā)現(xiàn)障礙物時(shí),立即通過(guò)語(yǔ)音提示模塊與振動(dòng)電機(jī)模塊對(duì)盲人進(jìn)行提醒,伴隨著盲人和障礙物距離的拉近,振動(dòng)電機(jī)會(huì)通過(guò)逐漸加快振動(dòng)頻率的方式向盲人進(jìn)行反饋。當(dāng)盲人前方出現(xiàn)其熟人時(shí),開發(fā)板通過(guò)肩部攝像頭采集的信息進(jìn)行識(shí)別,再由語(yǔ)音模塊向盲人播報(bào)人員信息。當(dāng)盲人想要觀看前方的文字內(nèi)容時(shí),系統(tǒng)即可通過(guò)攝像頭對(duì)前方文字進(jìn)行識(shí)別,語(yǔ)音告知盲人文字信息,并且當(dāng)盲人行走過(guò)程中出現(xiàn)危險(xiǎn)倒地不起時(shí),MPU6050檢測(cè)后觸發(fā)危險(xiǎn)狀態(tài)報(bào)警模塊,由GSM通信模塊將此狀況和盲人的位置信息發(fā)送到其親人的手機(jī)上,為對(duì)盲人的快速救援提供幫助。
二、導(dǎo)盲系統(tǒng)硬件設(shè)計(jì)
(一)控制模塊設(shè)計(jì)
系統(tǒng)以STM32F4系列開發(fā)板與樹莓派為控制核心,使用OpenCV庫(kù)。主控制器負(fù)責(zé)處理攝像頭所捕獲的圖像信息,音頻輸入的語(yǔ)音數(shù)據(jù)處理以及處理服務(wù)器的信息等。這是實(shí)現(xiàn)系統(tǒng)人臉識(shí)別、文字識(shí)別、語(yǔ)音識(shí)別、語(yǔ)義分析與交互應(yīng)答的核心。
(二)圖像采集模塊設(shè)計(jì)
圖像采集傳感器采用CMOS攝像頭,使用標(biāo)準(zhǔn)的SCCB接口。圖像采集可采用不同分辨率的傳感器,高分辨率的傳感器細(xì)節(jié)較為清楚,但是對(duì)主控制器處理的壓力增大,將導(dǎo)致主控制器處理緩慢,產(chǎn)生延時(shí),占用內(nèi)存過(guò)多等問(wèn)題,因此系統(tǒng)選用200W像素?cái)z像頭作為圖像采集傳感器。
(三)語(yǔ)音模塊設(shè)計(jì)
系統(tǒng)采用VS1053模塊為語(yǔ)音數(shù)據(jù)采集模塊,是系統(tǒng)指令識(shí)別與語(yǔ)音應(yīng)答的基礎(chǔ),該模塊自帶有聲音拾取器,將聲音信號(hào)初步處理后變?yōu)殡妷盒盘?hào),經(jīng)過(guò)模擬數(shù)字轉(zhuǎn)換器轉(zhuǎn)換為數(shù)字信號(hào)。因系統(tǒng)對(duì)語(yǔ)言指令識(shí)別有較高的要求,故模塊直接將數(shù)據(jù)傳輸至主控制器,由主控制器解析處理,并產(chǎn)生應(yīng)答。
(四)基于級(jí)聯(lián)分類器的人臉識(shí)別
本系統(tǒng)主要應(yīng)用級(jí)聯(lián)分類器進(jìn)行人臉的識(shí)別。Haar特征使用檢測(cè)窗口中指定位置的相鄰矩形,計(jì)算每一個(gè)矩形的像素和并取其差值。然后用這些差值來(lái)對(duì)圖像的子區(qū)域進(jìn)行分類。在檢測(cè)窗口中可以放大或平移得到一系列子特征,他們的白黑區(qū)域面積比始終保持不變。
在本穿戴式智能導(dǎo)盲系統(tǒng)進(jìn)行人臉識(shí)別時(shí),先計(jì)算識(shí)別對(duì)象的第一個(gè)Haar特征的特征值,與第一個(gè)分類器閾值對(duì)比,當(dāng)Haar特征的特征值小于該閾值時(shí),進(jìn)入下個(gè)比較步驟;當(dāng)Haar特征的特征值大于該閾值時(shí),該弱分類器輸出右值并結(jié)束。然后計(jì)算第二個(gè)Haar特征值,與第二個(gè)弱分類器閾值對(duì)比,步驟同上。把多個(gè)這樣的分類器并聯(lián),即將輸出結(jié)果值相加,即可得到一個(gè)強(qiáng)分類器的輸出結(jié)果,該結(jié)果與設(shè)定閾值做對(duì)比,當(dāng)結(jié)果大于該閾值時(shí),認(rèn)為當(dāng)前檢查窗口通過(guò)了該強(qiáng)分類器,即認(rèn)為是盲人的朋友。
三、結(jié)語(yǔ)
本系統(tǒng)結(jié)構(gòu)主要由可放置于腰部的設(shè)備主體和位于肩部與手腕部的傳感器組成。已完成系統(tǒng)樣機(jī),經(jīng)測(cè)試可實(shí)現(xiàn)的功能有道路障礙檢測(cè)、環(huán)境語(yǔ)音提醒、熟人識(shí)別、文字識(shí)別、語(yǔ)音位置分享、危險(xiǎn)狀態(tài)檢測(cè)與報(bào)警、人機(jī)交互等多種功能,性能穩(wěn)定,識(shí)別率高,能夠幫助盲人應(yīng)對(duì)生活中遇到的多種困難,在保證其安全的同時(shí),提高其自主生活能力,減輕家庭負(fù)擔(dān)。
參考文獻(xiàn)
[1] 張玉欣,孫浩.基于D-S證據(jù)理論的多特征融合紙幣真?zhèn)巫R(shí)別方法研究[J].電腦知識(shí)與技術(shù),2018,14(21):226-229.
[2] 陳廣大,劉德君,李天旭,等.便攜式水果硬度測(cè)量?jī)x的設(shè)計(jì)[J].中國(guó)農(nóng)機(jī)化學(xué)報(bào),2016,37(7):85-88.
[3] 曲麗萍,王宏健,邊信黔.基于自適應(yīng)重采樣的同步定位與地圖構(gòu)建[J].探測(cè)與控制學(xué)報(bào),2012,34(3):76-81.