羅 偉
(武漢學(xué)院,武漢 430079)
隨著信息時代的到來和電腦、手機等多媒體終端的普及,多媒體為體育教學(xué)和運動員的訓(xùn)練提供了極大的便利,只有運用先進的技術(shù)手段對教學(xué)進行改革,才能達(dá)到體育教學(xué)的最優(yōu)效果。利用多媒體數(shù)據(jù)庫系統(tǒng)可以為學(xué)生提供更加生動形象的學(xué)習(xí)素材,從而提高學(xué)生的學(xué)習(xí)興趣,采用先進的多媒體系統(tǒng)還可以對多視頻進行實時分析,從而捕捉到優(yōu)秀運動員的一些標(biāo)準(zhǔn)和極限動作,為教學(xué)和運動員的訓(xùn)練提供素材。籃球運動捕捉系統(tǒng)具有較高的圖像特征提取能力,將其使用在采摘機器人的視覺系統(tǒng)的設(shè)計中,可有效提高系統(tǒng)的目標(biāo)識別能力,提高自動化作業(yè)水平。
多媒體數(shù)據(jù)庫系統(tǒng)在運動員訓(xùn)練和教學(xué)時具有很多優(yōu)勢,采用多媒體數(shù)據(jù)庫系統(tǒng)可以對籃球的動作進行實時的捕捉,通過對比賽視頻幀的處理,得到優(yōu)秀運動員在得分時的技巧動作。這種方式讓學(xué)習(xí)不再受地域的限制,可以全方位多層次的展開教學(xué)活動,使教學(xué)變得更加生動形象,使教與學(xué)都能達(dá)到最好的效果。以籃球動作捕捉系統(tǒng)為例,如圖1所示。
圖1 籃球動作捕捉系統(tǒng)Fig.1 The basketball action capturing system
利用該系統(tǒng)可以實時地對比賽視頻幀進行動作捕捉,并從動作特征中統(tǒng)計技術(shù)動作數(shù)據(jù),從而獲得籃球技術(shù)動作的多媒體數(shù)據(jù)支持。采摘機器人在自主作業(yè)時,其最主要的環(huán)節(jié)是自主定位果實目標(biāo),這就需要依靠機器人自身強大的視覺系統(tǒng)。根據(jù)籃球動作捕捉系統(tǒng)的原理,采摘機器人的視覺系統(tǒng)也可以采用特征捕捉技術(shù),對果實目標(biāo)進行定位,從而實現(xiàn)自主作業(yè),其設(shè)計流程如圖2所示。
在設(shè)計采摘機器人視覺系統(tǒng)時,可以依據(jù)籃球?qū)崟r視頻的動作提取技術(shù),對果實目標(biāo)特征進行提取,最終實現(xiàn)機器人的自主果實定位,實現(xiàn)自主作業(yè)。
圖2 基于籃球動作捕捉的采摘機器人視覺系統(tǒng)設(shè)計Fig.2 Design of picking robot vision system based on basketball motion capturing
在籃球動作捕捉過程中,動作捕捉的對象往往是比賽的視頻序列,該序列是由比賽現(xiàn)場的攝像機獲取的一組隨著時間變化的圖像,根據(jù)一定的時間間隔可以得到圖像隨時間的變化關(guān)系,其表達(dá)式可以寫成
{f(x,y,t0),f(x,y,t1),…,f(x,y,tN-1)}
(1)
其中,N為總的幀數(shù);t為采集圖像時對應(yīng)的實時時刻,時間間隔為ti-ti-1。在沒有特殊要求的情況下,兩幅圖像的時間間隔是相同的,對于動態(tài)圖像的捕捉,可以得到比靜態(tài)圖上更加豐富的信息。在圖像捕捉過程中,最重要的環(huán)節(jié)是圖像的邊緣檢測,通過圖像邊緣檢測可以使圖像隱含的信息發(fā)掘出來,其基本步驟為:
1)濾波。在傳感器實時采集過程中,由于籃球動作的速度較快,難免會存在較多的噪聲,通過濾波可以將噪聲的影響降低到最小。
2)增強。利用梯度算法的原理,通過改變圖像的梯度,使圖像局部模糊的部分清晰化,以找到明顯的圖像邊緣。
3)檢測。由于圖像局部邊緣模糊,通過圖像邊緣檢測很難找到圖像的邊緣點,而通過梯度的設(shè)定閾值,可以對邊緣進行判斷,從而檢測到邊緣。
4)定位。精確確定邊緣的位置。
通過圖像濾波、圖像平滑處理、邊緣增強、邊緣定位及閾值分割等,可以檢測出圖像的邊緣,為動作數(shù)據(jù)的捕捉提供數(shù)據(jù)支持,其具體流程如圖3所示。
圖3 邊緣檢測的流程圖Fig.3 The flow chart of edge detection
邊緣檢測算法的主要目標(biāo)是檢測到梯度變化的最大值,通過優(yōu)化梯度值,對噪聲進行抑制,從而有效地找到邊緣的位置。邊緣檢測算子有很多,本次選用Canny算法。
Canny邊緣檢測算法在實際使用時,首先會對圖像進行濾波操作,然后對圖像的最大梯度值進行檢測,從而確定圖像的邊緣位置。在進行檢測時,采用先對圖像進行平滑處理,后對圖像進行求導(dǎo),其二維高斯函數(shù)為
(1)
在某一方向n上是G(x,y)的一階方向?qū)?shù)為
(2)
(3)
(4)
其中,n為方向矢量;G為梯度矢量。將圖像f(x,y)與Gn作卷積,同時改變n的方向,當(dāng)Gn·f(x,y)得到最大值時,邊緣檢測的方向與n正交。則
(5)
(6)
(7)
(8)
其中,A(x,y)為捕捉實時圖像(x,y)點處的邊緣強度;θ為捕捉實時圖像(x,y)點處的法向矢量。為了得到準(zhǔn)確的圖像邊緣,需要提取局部梯度的最大值點,常用的方式是將G(x,y)使用一個閾值。
如圖4所示:為了對捕捉圖像進行邊緣檢測,需要得到圖像邊緣梯度的最大值,通過閾值的設(shè)定,保留高于閾值的點,將低于閾值的點全部設(shè)置為0,從而可有效地識別出圖像的邊緣,為果實目標(biāo)信息的獲取提供數(shù)據(jù)支持。
圖4 采摘機器人果實目標(biāo)邊緣檢測和識別流程
Fig.4 The target edge detection and recognition process of fruit picking robot
為了驗證籃球動作捕捉多媒體數(shù)據(jù)庫系統(tǒng)方案在采摘機器人視覺檢測系統(tǒng)中使用的可行性,利用機器人實驗測試的方法對方案進行驗證,首先對視覺系統(tǒng)的圖像處理進行測試,其測試場景如圖5所示。
圖5 采摘機器人視覺系統(tǒng)測試場景Fig.5 The test scenario of vision system of picking robot
為了驗證時間系統(tǒng)對復(fù)雜采摘環(huán)境的適應(yīng)性,選取了夜間作業(yè)環(huán)境作為研究對象,受夜間光線的影響,采集得到的圖像往往含有較多的噪聲,首先對圖像進行濾波和增強處理,得到了如圖6所示的結(jié)果。
圖6 圖像增強后結(jié)果Fig.6 The effect after image enhancement
采用圖片平滑和增強處理后,圖像的背景噪聲有了明顯的降低,相對于背景部分,果實圖像更加突出,然后采用邊緣檢測算法,可以得到更加清晰的果實圖像,如圖7所示。
圖7 邊緣檢測后結(jié)果圖像Fig.7 The result image after edge detection
對圖像進行邊緣檢測后,成功地提取到果實的特征圖像,將背景部分繼續(xù)弱化,為采摘機器人果實目標(biāo)的識別提供了較高質(zhì)量的圖像。為了進一步驗證采摘機器人對目標(biāo)識別的準(zhǔn)確率,設(shè)計了采摘機器人果實采摘試驗,如圖8所示。
通過測試可以得到圖像的準(zhǔn)確識別率和準(zhǔn)確定位率,對5次測試結(jié)果進行了統(tǒng)計,得到了如表1所示的結(jié)果。
測試結(jié)果表明:采用本次設(shè)計的視覺檢測系統(tǒng)對果實圖像的準(zhǔn)確識別率較高,且能夠準(zhǔn)確地定位到果實,可以滿足高精度采摘的需求,從而驗證了方案的可行性。
圖8 采摘機器人實驗Fig.8 The experiment of picking robot表1 采摘機器人采摘性能測試Table 1 The picking performance test of picking robot %
為了提高采摘機器人視覺系統(tǒng)的目標(biāo)識別精度,提高自動化程度,將籃球動作捕捉系統(tǒng)引入到視覺系統(tǒng)的設(shè)計過程中,參考捕捉系統(tǒng)的邊緣檢測和動作特征提取方法,對視覺系統(tǒng)進行了改進,得到了具有較高精度的目標(biāo)識別能力。對視覺系統(tǒng)的功能進行了驗證,結(jié)果表明:采用籃球動作捕捉技術(shù)對采摘機器人視覺系統(tǒng)進行改進后,其果實目標(biāo)的識別能力較強,可在復(fù)雜的夜間環(huán)境下成功的將果實目標(biāo)識別。對采摘機器人的果實識別率和準(zhǔn)確定位率進行了測試,結(jié)果表明:其成功識別果實的概率較高,準(zhǔn)確定位的能力較強,滿足了高精度采摘的需求。