盡管網(wǎng)上關(guān)于訓(xùn)練寵物狗的方法千千萬(wàn)萬(wàn),但不得不承認(rèn),一旦有了距離限制,再高效的訓(xùn)狗技巧也只是紙上談兵。近日,美國(guó)科羅拉多州立大學(xué)一組研究團(tuán)隊(duì)基于 AI 技術(shù)研發(fā)了一套智能訓(xùn)狗系統(tǒng),可在沒有人工協(xié)助的情況下教會(huì)狗狗遵守指定的口令。
據(jù)介紹,目前最有效的訓(xùn)狗方式都是基于獎(jiǎng)勵(lì)機(jī)制實(shí)現(xiàn)的,即狗服從命令時(shí)會(huì)受到食物、撫摸等獎(jiǎng)勵(lì),從而激發(fā)狗的積極性。研究人員便在獎(jiǎng)勵(lì)機(jī)制的基礎(chǔ)上,創(chuàng)建了一個(gè)人工智能計(jì)算機(jī)系統(tǒng),稱為 NVIDIA Jetson Nano。該系統(tǒng)具有專用于狗狗訓(xùn)練任務(wù)的硬件和軟件,包含 AI 軟件、攝像機(jī)、揚(yáng)聲器、食物分配器等組合而成。
目前,人類已經(jīng)掌握了通過(guò)食物或表?yè)P(yáng)等獎(jiǎng)勵(lì)馴服狗狗完成期望動(dòng)作的技巧。但在訓(xùn)練的早期階段,當(dāng)行為得不到及時(shí)獎(jiǎng)勵(lì)時(shí),狗狗的習(xí)得行為可能會(huì)有所減少。為了最大限度地提高學(xué)習(xí)效率,研究人員想到可以利用機(jī)器學(xué)習(xí)來(lái)模擬訓(xùn)犬師的動(dòng)作,以識(shí)別行為,并實(shí)時(shí)強(qiáng)化 “坐下”或 “躺下”等命令。
具體的步驟是利用 NVIDIA Jetson Nano 上的神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),該系統(tǒng)配有攝像頭和傳送食物等硬件機(jī)制。一旦系統(tǒng)檢測(cè)到狗狗存在,便會(huì)下達(dá)諸如躺下、站立或者坐下的指令;隨后攝像機(jī)會(huì)記錄狗狗對(duì)命令的反應(yīng),并通過(guò) AI 軟件分析狗狗的行為,系統(tǒng)還會(huì)將狗狗的實(shí)時(shí)圖像與訓(xùn)練數(shù)據(jù)進(jìn)行比較,并確定狗狗是否遵守命令,最后再根據(jù)結(jié)果判定是否給予獎(jiǎng)勵(lì)。
同時(shí),由于此前沒有專門犬類對(duì)應(yīng)動(dòng)作標(biāo)簽的數(shù)據(jù)集,研究團(tuán)隊(duì)決定采用斯坦福犬類數(shù)據(jù)庫(kù),并對(duì)一組四個(gè)動(dòng)作進(jìn)行手工標(biāo)注:站立、坐下、躺下和未定義,分別得到 4143、3038、7090 和 6307 個(gè)樣本。在 20578 個(gè)總樣本圖像中包含 120 個(gè)不同的犬類品種,及在不同的場(chǎng)景下的圖像信息。據(jù)悉,樣本的多樣性對(duì)于建立犬類行為分析數(shù)據(jù)庫(kù)非常重要。
從硬件外觀上來(lái)看,這個(gè)集成系統(tǒng)更像是一個(gè)寵物自動(dòng)投食機(jī)。研究人員介紹,這個(gè)投食機(jī)是一個(gè)長(zhǎng)寬高 5 × 5 × 8(單位英寸)的長(zhǎng)方形,裝置頂部安裝有攝像頭,側(cè)面包含一個(gè)用作儲(chǔ)存零食的傳輸裝置,當(dāng) AI 判定可以獎(jiǎng)勵(lì)狗狗時(shí),零食傳輸裝置底端的電機(jī)臂旋轉(zhuǎn)打開,食物就會(huì)自然流出來(lái)。
NVIDIA Jetson Nano、PCA9685 PWM I2C 驅(qū)動(dòng)器、180 度伺服電機(jī)、8MP IMX219 180 度攝像頭和零食輸送管,Jetson Nano 搭載了 128 個(gè) NVIDIA Maxwell GPU 內(nèi)核,4 GB RAM,并配備了 10W 可切換電源,以保障最佳性能。并且 Nano 具有 GPIO 接口,可與相機(jī)、電機(jī)和揚(yáng)聲器等外部設(shè)備配合使用。這些足夠保障實(shí)驗(yàn)中的設(shè)計(jì)模型與遷移學(xué)習(xí)模型的正常運(yùn)算。
狗的不同行為相對(duì)應(yīng)的數(shù)據(jù)集樣本
CompanionPro 犬類訓(xùn)練器
測(cè)試結(jié)果顯示,通過(guò)遷移學(xué)習(xí)訓(xùn)練的精準(zhǔn)率可達(dá)到 92.06%。
研究人員指出,他們建造的原型完全獨(dú)立于其他系統(tǒng),因此命令列表必須簡(jiǎn)短。同時(shí),他們提議建立一個(gè)更強(qiáng)大的系統(tǒng),可以依靠遠(yuǎn)程處理來(lái)擴(kuò)展命令的數(shù)量。他們還注意到,此項(xiàng)系統(tǒng)的商業(yè)化的落地,將會(huì)幫助人們?cè)诓辉诩业臅r(shí)候訓(xùn)練他們的寵物狗。
實(shí)際上,利用 AI 人工智能驅(qū)動(dòng)的訓(xùn)犬設(shè)備在 2020 年初就引發(fā)過(guò)一陣熱議。一家名為 Companion Labs 的公司研發(fā)出一款名為 CompanionPro 的犬類訓(xùn)練器,搭載了 Google Edge TPU AI 處理器、圖像傳感器、揚(yáng)聲器和投食設(shè)備。同時(shí)也選擇了 TensorFlow 作為深度學(xué)習(xí)平臺(tái),并在 GPU 上本地運(yùn)行生成模型,以確定狗狗的實(shí)時(shí)行為從而訓(xùn)練狗狗。
對(duì)此,NVIDIA Jetson Nano 研究團(tuán)隊(duì)表示,盡管此前通過(guò)人工智能技術(shù)對(duì)犬類觀察的研究很多,但這些研究更側(cè)重于捕捉狗的行為,比如通過(guò)可穿戴傳感器捕捉到狗的姿勢(shì),例如坐著、站著或吃東西。這些都是通過(guò)基于方差的閾值來(lái)劃分類別的算法進(jìn)行分類。但針對(duì)計(jì)算機(jī)視覺觀察或分析狗狗的行為研究,還有很大的空間可以挖掘。
“利用計(jì)算機(jī)視覺技術(shù)對(duì)單獨(dú)使用相機(jī)的場(chǎng)景進(jìn)行推斷,從而分離了對(duì)專用硬件的需求。使用計(jì)算機(jī)視覺識(shí)別行為的能力是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。如何為嵌入式設(shè)備上的應(yīng)用設(shè)計(jì)一個(gè)基于視覺識(shí)別的最佳的神經(jīng)網(wǎng)絡(luò),這是我們核心研究方向?!痹撗芯繄F(tuán)隊(duì)曾公開表示。
(摘自美《深科技》)(編輯/費(fèi)勒萌)