楊蘇娟 周非凡 南京郵電大學(xué)
人工智能環(huán)境感知技術(shù)是實(shí)現(xiàn)自主機(jī)器定位、導(dǎo)航的前提,通過(guò)對(duì)周?chē)h(huán)境進(jìn)行有效的感知,人工智能可以更好地進(jìn)行自主定位、環(huán)境探索與自主導(dǎo)航等基本任務(wù)的實(shí)施。環(huán)境感知技術(shù)是人工智能自主行為理論中的重要研究?jī)?nèi)容,具有十分重要的研究意義。
人工智能的環(huán)境感知技術(shù)的研究分為三個(gè)方面。1、環(huán)境信息的獲取。人工智能可以通過(guò)各種傳感器來(lái)獲取周?chē)h(huán)境的信息,在這次的項(xiàng)目中我們將利用視覺(jué)傳感器將景物的光信號(hào)轉(zhuǎn)換成電信號(hào)。2、環(huán)境信息的提取與處理。視覺(jué)傳感器可以直接對(duì)外界環(huán)境進(jìn)行拍攝,提取物體的顏色、邊界等特征信息,然后對(duì)特征進(jìn)行去噪、聚類(lèi)和匹配等處理,達(dá)到對(duì)環(huán)境進(jìn)行識(shí)別的目的。3、對(duì)外界環(huán)境特征進(jìn)行提取和處理后,在完全位未知的環(huán)境中,人工智能利用自身攜帶的傳感器,如激光測(cè)距儀、超聲傳感器、視覺(jué)攝像頭等感知環(huán)境,從得到的感知信息中提取出環(huán)境特征,構(gòu)建出環(huán)境地圖。
根據(jù)對(duì)說(shuō)話人說(shuō)話方式的要求,可以分為孤立字(詞)語(yǔ)音識(shí)別系統(tǒng),連接字語(yǔ)音識(shí)別系統(tǒng)以及連續(xù)語(yǔ)音識(shí)別系統(tǒng)。 根據(jù)對(duì)說(shuō)話人的依賴程度可以分為特定人和非特定人語(yǔ)音識(shí)別系統(tǒng)。語(yǔ)音識(shí)別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個(gè)方面。此外,還涉及到語(yǔ)音識(shí)別單元的選取。
(1)語(yǔ)音識(shí)別單元的選取
選擇識(shí)別單元是語(yǔ)音識(shí)別研究的第一步。語(yǔ)音識(shí)別單元有單詞(句)、音節(jié)和音素三種,具體選擇哪一種,由具體的研究任務(wù)決定。音節(jié)單元多見(jiàn)于漢語(yǔ)語(yǔ)音識(shí)別,主要因?yàn)闈h語(yǔ)是單音節(jié)結(jié)構(gòu)的語(yǔ)言,而英語(yǔ)是多音節(jié),并且漢語(yǔ)雖然有大約1300個(gè)音節(jié),但若不考慮聲調(diào),約有408個(gè)無(wú)調(diào)音節(jié),數(shù)量相對(duì)較少。因此,對(duì)于中、大詞匯量漢語(yǔ)語(yǔ)音識(shí)別系統(tǒng)來(lái)說(shuō),以音節(jié)為識(shí)別單元基本是可行的。
(2)特征參數(shù)提取技術(shù)
從信息論角度講,這是信息壓縮的過(guò)程。 線性預(yù)測(cè)(LP)分析技術(shù)是目前應(yīng)用廣泛的特征參數(shù)提取技術(shù),許多成功的應(yīng)用系統(tǒng)都采用基于LP技術(shù)提取的倒譜參數(shù)。
(3)模式匹配及模型訓(xùn)練技術(shù)
模型訓(xùn)練是指按照一定的準(zhǔn)則,從大量已知模式中獲取表征該模式本質(zhì)特征的模型參數(shù),而模式匹配則是根據(jù)一定準(zhǔn)則,使未知模式與模型庫(kù)中的某一個(gè)模型獲得最佳匹配。語(yǔ)音識(shí)別所應(yīng)用的模式匹配和模型訓(xùn)練技術(shù)主要有動(dòng)態(tài)時(shí)間歸正技術(shù)(DTW)、隱馬爾可夫模型(HMM)和人工神經(jīng)元網(wǎng)絡(luò)(ANN)。
DTW是較早的一種模式匹配和模型訓(xùn)練技術(shù),但因其不適合連續(xù)語(yǔ)音大詞匯量語(yǔ)音識(shí)別系統(tǒng),目前已被HMM模型和ANN替代。
HMM模型是語(yǔ)音信號(hào)時(shí)變特征的有參表示法。它由相互關(guān)聯(lián)的兩個(gè)隨機(jī)過(guò)程共同描述信號(hào)的統(tǒng)計(jì)特性。模型參數(shù)包括HMM拓?fù)浣Y(jié)構(gòu)、狀態(tài)轉(zhuǎn)移概率及描述觀察符號(hào)統(tǒng)計(jì)特性的一組隨機(jī)函數(shù)。
ANN本質(zhì)上是一個(gè)自適應(yīng)非線性動(dòng)力學(xué)系統(tǒng),模擬了人類(lèi)神經(jīng)元活動(dòng)的原理,具有自學(xué)、聯(lián)想、對(duì)比、推理和概括能力。
機(jī)器人路徑規(guī)劃技術(shù),就是機(jī)器人根據(jù)自身傳感器對(duì)環(huán)境的感知,自行規(guī)劃出一條安全的運(yùn)行路線,同時(shí)高效完成作業(yè)任務(wù)。移動(dòng)機(jī)器人路徑規(guī)劃主要解決3個(gè)問(wèn)題:(1) 使機(jī)器人能從初始點(diǎn)運(yùn)動(dòng)到目標(biāo)點(diǎn);(2) 用一定的算法使機(jī)器人能繞開(kāi)障礙物,并且經(jīng)過(guò)某些必須經(jīng)過(guò)的點(diǎn)完成相應(yīng)的作業(yè)任務(wù);(3) 在完成以上任務(wù)的前提下,盡量?jī)?yōu)化機(jī)器人運(yùn)行軌跡。按照策略分類(lèi),路徑規(guī)劃算法可以分為一下四類(lèi):模版匹配路徑規(guī)劃技術(shù)、人工勢(shì)場(chǎng)路徑規(guī)劃技術(shù)、地圖構(gòu)建路徑規(guī)劃技術(shù)和人工智能路徑規(guī)劃技術(shù)。其中人工勢(shì)場(chǎng)路徑規(guī)劃技術(shù)的優(yōu)點(diǎn)為算法簡(jiǎn)明,實(shí)時(shí)性良好,占用計(jì)算資源少,規(guī)劃路徑軌跡圓滑,非常適合移動(dòng)機(jī)器人領(lǐng)域,因此本課題采用人工勢(shì)場(chǎng)法路徑規(guī)劃技術(shù),結(jié)合超聲波傳感器,實(shí)現(xiàn)路徑規(guī)劃和避障。
兩個(gè)場(chǎng)景:主人回家的場(chǎng)景及需要搜尋物品的場(chǎng)景。
智能家居機(jī)器人與其他的機(jī)器人不同地方就在于它是陪伴型的機(jī)器人,而陪伴的過(guò)程中最直接的接觸就是交流,包括回到家打開(kāi)門(mén)就可以看見(jiàn)機(jī)器人是對(duì)感情很好的發(fā)展,也能使人對(duì)機(jī)器人產(chǎn)生感情和依賴。當(dāng)主人回到家,在門(mén)外喊開(kāi)門(mén)時(shí),機(jī)器人就會(huì)進(jìn)行語(yǔ)音識(shí)別,在確認(rèn)無(wú)誤后調(diào)用各種功能前進(jìn)至門(mén)口把將門(mén)打開(kāi),迎接主人歸家。
而搜尋物品的場(chǎng)景是當(dāng)主人當(dāng)即需要拿到某一件物品時(shí),它能夠準(zhǔn)確無(wú)誤地找到此物品并將其交與主人。這就解決了主人出門(mén)前手忙腳亂找不到鑰匙手機(jī)錢(qián)包等的困擾,也能在日常生活中解決常常遇到的冥思苦想無(wú)法想起過(guò)往的物件所放置的位置的問(wèn)題。總而言之,智能家居只是智能機(jī)器人的一個(gè)應(yīng)用方面,在這個(gè)方面它還有更廣大的空間可以不斷發(fā)展。
[1]DongCaiYu. Mobile robot autonomous navigation and positioning technology.