陳新龍
21世紀(jì)是一個(gè)充滿信息的時(shí)代,圖像作是人類獲取信息、表達(dá)信息和傳遞信息的重要手段。計(jì)算機(jī)視覺是人工智能領(lǐng)域最熱門的領(lǐng)域之一,其主旨在于利用計(jì)算機(jī)模擬生物視覺,讓人工智能能夠看到場(chǎng)景中的三維信息。
今天我們就來了解計(jì)算機(jī)視覺中最為基礎(chǔ)的技術(shù)——圖像識(shí)別。對(duì)圖像識(shí)別我們之前已經(jīng)介紹過,比如日常生活中的拍照識(shí)花、無人貨架等。本次實(shí)驗(yàn)使用Mind+軟件,目的是使用Mind+左下角擴(kuò)展中的網(wǎng)絡(luò)服務(wù)模塊-AI圖像識(shí)別。利用AI圖像可以識(shí)別生活中常見的物體,從代碼塊中我們可以看到圖像識(shí)別不僅可以截取畫面、識(shí)別對(duì)比,還可以通過大數(shù)據(jù)分析識(shí)別獲取人臉年齡,獲取圖像中的圖像主題、圖像文字等。
我們?cè)?jīng)用智能語音識(shí)別配合掌控板制作了垃圾分類的小工具,今天我們用視覺學(xué)習(xí)的方法來進(jìn)行垃圾分類:開啟攝像頭,識(shí)別圖像中截取到的畫面,通過大數(shù)據(jù)分析,分析出圖像中的物體,然后根據(jù)垃圾分類列表中的數(shù)據(jù)判斷物體屬于什么垃圾,如果圖像未能識(shí)別成功,系統(tǒng)會(huì)啟動(dòng)詢問模式,需要用戶手動(dòng)判斷屬于什么垃圾。
先開啟攝像頭,并且使用舞臺(tái)顯示攝像頭的畫面,當(dāng)按下鍵盤空格鍵時(shí),攝像頭開啟識(shí)別,從圖像中獲取畫面,系統(tǒng)會(huì)自動(dòng)分析出畫面中的圖像主題。攝像頭識(shí)別成功后便會(huì)在圖中顯示文字。
那么如何判斷識(shí)別的物體是什么垃圾呢?這里需要編寫垃圾識(shí)別模塊,為了容易調(diào)試我們?cè)O(shè)置了五個(gè)模塊單獨(dú)用來區(qū)分,四個(gè)模塊識(shí)別不同垃圾(干垃圾、濕垃圾、有害垃圾、可回收垃圾),最后一個(gè)模塊用于詢問,如果檢測(cè)不出是什么垃圾,請(qǐng)用戶自行判斷輸入。
如何判斷垃圾的種類呢?需要?jiǎng)?chuàng)建四個(gè)列表用于存放不同種類垃圾的細(xì)目,當(dāng)圖像識(shí)別成功后,如果物體名稱存在于列表中,系統(tǒng)就能判斷并說出物體是什么垃圾,并且結(jié)束當(dāng)前程序。
如果系統(tǒng)未能匹配到列表中的數(shù)據(jù),無法自動(dòng)識(shí)別垃圾種類,那么便跳轉(zhuǎn)到詢問模塊,由用戶人工判斷物體屬于什么垃圾,并按下數(shù)字鍵輸入垃圾種類(1干垃圾,2濕垃圾,3有害垃圾,4可回收物,5重新識(shí)別),輸入成功后,系統(tǒng)根據(jù)用戶輸入的內(nèi)容,學(xué)習(xí)并且更新列表,這也是這個(gè)程序具有的學(xué)習(xí)功能,這樣通過訓(xùn)練程序?qū)⒛芨玫刈鳛槔诸惖男」ぞ摺?/p>
Mind+和Scratch中已經(jīng)內(nèi)置了很多優(yōu)秀的功能模塊和網(wǎng)絡(luò)服務(wù),比如視頻偵測(cè)、TinyWebDB數(shù)據(jù)庫,利用這些功能可以做出很多功能超強(qiáng)的軟件。程序源代碼請(qǐng)關(guān)注“壹零社”公眾號(hào)下載。