摘 要:為解決人們對果蔬的識別和營養(yǎng)的搭配問題以及實現(xiàn)人們自己種植果蔬的愿望,設(shè)計開發(fā)了一款基于人工智能的果樹識別及種植指導(dǎo)的系統(tǒng)。通過神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)、非線性降維的圖像識別技術(shù)、YOLOv3 圖像目標(biāo)檢測算法和模式識別技術(shù)等實現(xiàn)的主要功能包括:獲取并發(fā)布前端所呈現(xiàn)的信息,包括熱門文章、飲食推薦及營養(yǎng)搭配等;并對需要發(fā)布在前端頁面的文章進行審核。前端功能模塊主要是為用戶提供果蔬識別、種植指導(dǎo)以及健康飲食推薦等功能,使用戶能夠及時獲得相應(yīng)的果蔬知識及健康的營養(yǎng)搭配方式,為人們的生活帶來方便。經(jīng)過多次調(diào)試和驗證,該系統(tǒng)的性能穩(wěn)定,功能實現(xiàn)效果較為良好。
關(guān)鍵詞:人工智能;卷積神經(jīng)網(wǎng)絡(luò);圖像識別技術(shù);非線性降維技術(shù);YOLOv3 模式識別;爬蟲
中圖分類號:TP393;TP27 文獻標(biāo)識碼:A 文章編號:2095-1302(2024)03-00-04
0 引 言
隨著果蔬產(chǎn)業(yè)發(fā)展迅速,果蔬逐漸成為全國人均消費量最大的食品,是種植業(yè)中對全國農(nóng)村居民人均可支配收入增長貢獻最大的。同時,伴隨著果蔬種類越來越多,果蔬識別以及營養(yǎng)搭配就成了一個至關(guān)重要的問題[1-3]。
本文研究的基于人工智能的果蔬識別及種植指導(dǎo)系統(tǒng)是集果蔬識別、種植指導(dǎo)、健康飲食于一體的多功能系統(tǒng)。該系統(tǒng)主要由后臺管理模塊及前端功能模塊兩大部分組成。后臺管理模塊主要是獲取并發(fā)布前端所呈現(xiàn)的信息,包括熱門文章、飲食推薦及營養(yǎng)搭配等,并對需要發(fā)布在前端頁面的文章進行審核。前端功能模塊主要是為用戶提供果蔬識別、種植指導(dǎo)以及健康飲食推薦等功能,使用戶能夠及時獲得相應(yīng)的果蔬知識及健康的營養(yǎng)搭配方式,方便人們生活。
1 系統(tǒng)需求分析
1.1 功能需求分析
本系統(tǒng)設(shè)計六個主要功能模塊,分別實現(xiàn)果蔬識別界面、特征檢測、特征識別、特征分類、識別結(jié)果、自動爬取文章等功能。
果蔬識別界面功能:用戶需要在果蔬識別界面選擇待識別的相應(yīng)果蔬特征圖片或相應(yīng)果蔬特征圖片文件夾路徑。果蔬識別界面將用戶選擇的數(shù)據(jù)進行發(fā)送,并且實時顯示返回的識別結(jié)果,數(shù)據(jù)庫端實時存儲并且云備份。
特征檢測功能:需要接收果蔬識別界面發(fā)送的相應(yīng)圖片數(shù)據(jù),使用有效的算法來檢測圖像中的特征區(qū)域,并能夠合理存儲檢測結(jié)果。
特征識別功能:由于特征沒有固定的邊界和長度,因此應(yīng)選擇合適的深度學(xué)習(xí)方法進行識別,同時合理存儲檢測結(jié)果。
特征分類功能:判斷識別到的特征是否是相應(yīng)果蔬特征,將二分類結(jié)果的數(shù)據(jù)文件保存在本地,將識別結(jié)果反饋回識別界面。
識別結(jié)果:在上一步將果蔬特征分類成功后,識別出圖片相應(yīng)的特征,通過算法計算出該圖片上的果蔬品種,把圖片存儲備份到訓(xùn)練集,在下一次調(diào)用時會自動在檢測集中添加使用。通過深度學(xué)習(xí)優(yōu)化算法,提升算法的精確度,減少損失函數(shù)帶來的誤差值。
自動爬取文章:識別出果蔬種類后,通過自動爬取系統(tǒng)的聚焦網(wǎng)絡(luò)爬蟲技術(shù)在之前審核好的特定網(wǎng)站爬取相應(yīng)的果蔬文章,有營養(yǎng)搭配、種植指導(dǎo)等相關(guān)果蔬的文章推薦。此外用戶也可以手動爬取,通過輸入關(guān)鍵詞搜索需求果蔬的文章進行閱讀。
1.2 非功能需求分析
(1)識別準(zhǔn)確率需求:通過深度學(xué)習(xí)算法來保證系統(tǒng)準(zhǔn)確率,系統(tǒng)對果蔬圖片的特征二分類準(zhǔn)確率需達92%。
(2)兼容性需求:系統(tǒng)支持多種瀏覽器訪問并識別果蔬圖片,需采用高兼容性的語言實現(xiàn)果蔬界面識別。
(3)安全性需求:用戶注冊所填寫的信息以及進行果蔬識別的記錄和瀏覽相應(yīng)文章的記錄僅用戶和管理員可見。
(4)易用性需求:在果蔬界面主要呈現(xiàn)三色態(tài),背景邊框為白綠色,文字為黑色,一眼望去,美觀舒適。首先是操作簡單,易于閱讀:登錄成功后,用戶可通過兩種方式進行果蔬識別,分別是本地圖片識別(又可分為本地圖片路徑識別和網(wǎng)址圖片識別)和拍照識別,其次是系統(tǒng)爬取的文章可以通過超鏈接的形式跳轉(zhuǎn)到其他頁面,對難以理解的專業(yè)術(shù)語或者詞語進行解釋,方便用戶理解閱讀。
2 系統(tǒng)的總體設(shè)計
基于人工智能的果蔬識別及種植指導(dǎo)系統(tǒng)整體設(shè)計主要分為四個層次:分別為圖像傳感器、圖像爬取、圖像預(yù)處理、圖像識別。該系統(tǒng)的總體框架如圖1所示,圖像傳感層次主要是對用戶傳入已保存的圖片或是攝像頭直接采集的圖片,經(jīng)過交互,再進行預(yù)處理,最后進行圖像問題篩查后,在云端備份返回預(yù)處理結(jié)果。同理可得,經(jīng)過圖像預(yù)處理后的圖像識別返回的結(jié)果同樣經(jīng)過此流程。在云端備份大量數(shù)據(jù),通過多層卷積神經(jīng)網(wǎng)絡(luò)進行深度學(xué)習(xí)后,不斷精確圖像的識別結(jié)果,達到圖像數(shù)據(jù)越多識別越準(zhǔn)確的目的。系統(tǒng)總體框架如圖1所示。
系統(tǒng)功能模塊如圖2所示。主要由后臺管理模塊及前端功能模塊兩大部分組成。后臺管理模塊主要是獲取并發(fā)布前端所呈現(xiàn)的信息,包括熱門文章、飲食推薦及營養(yǎng)搭配等,并對需要發(fā)布在前端頁面的文章進行審核。前端功能模塊主要是為用戶提供果蔬識別、種植指導(dǎo)以及健康飲食推薦等功能,使用戶能夠及時獲得相應(yīng)的果蔬知識及健康的營養(yǎng)搭配方式,給人們的生活帶來方便。其次分為管理員和用戶,兩者權(quán)限不一,相對于用戶,管理員具有對用戶信息和所爬取的文章信息進行增、刪、查、改和審核的權(quán)限,保證系統(tǒng)信息的安全性和可靠性。
3 系統(tǒng)關(guān)鍵技術(shù)與實現(xiàn)
系統(tǒng)實現(xiàn)了采集、圖象處理、標(biāo)定和分級等各程序模塊的集成化設(shè)計。系統(tǒng)的關(guān)鍵技術(shù)主要包括神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)、非線性降維的圖像識別技術(shù)、YOLOv3 圖像目標(biāo)檢測算法、模式識別和聚焦網(wǎng)絡(luò)爬蟲等[4-10]。
本文借鑒了DenseNet和Xception的全局池化計算出果蔬特征向量,通過全連接層保證足夠多的果蔬特征,然后加入BN層防止過擬合,最后再使用Softmax進行分類。
本系統(tǒng)的關(guān)鍵模塊有6個:果蔬識別界面、特征檢測、特征識別、特征分類、識別結(jié)果、自動爬取文章等模塊。
果蔬識別界面模塊:在Web界面,用戶可以通過果蔬識別界面選擇待識別圖片數(shù)據(jù)的存放位置或?qū)我粓D片數(shù)據(jù)進行識別;識別完成后,用戶可以看到檢測結(jié)果。
特征檢測模塊:采用基于深度學(xué)習(xí)的算法,利用常用的自然場景特征檢測網(wǎng)絡(luò)CTPN進行圖片區(qū)域的候選區(qū)域選取和連接。
特征識別模塊:負責(zé)對從上個模塊得到的圖像進行特征識別,利用訓(xùn)練好的CRNN 神經(jīng)網(wǎng)絡(luò)和連接時序分類模型CTC進行端到端的特征識別。
特征分類模塊:負責(zé)對特征識別模塊得到的特征進行相應(yīng)果蔬特征分類,本模塊采用了特征分類常用的FC-CNN神經(jīng)網(wǎng)絡(luò)。
識別結(jié)果模塊:負責(zé)對識別結(jié)果模塊得到的圖片進行相應(yīng)果蔬圖片分類存儲,訓(xùn)練集和檢測集備份等待使用;再對上一個模塊的特征區(qū)域進行檢測,保存的結(jié)果在識別結(jié)果模塊進行使用。
自動爬取文章模塊:使用常用的聚焦爬蟲,對識別的果蔬信息進行信息爬取,爬取過程中會根據(jù)用戶信息判斷爬取的文章內(nèi)容應(yīng)如何選擇。例如:文章用戶是老年人,會推薦對應(yīng)老年人保健區(qū)的營養(yǎng)搭配文章。以此類推,對中少年以及兒童如是。
本系統(tǒng)采用FC-CNN水果圖像分類算法的批量規(guī)范化(BN)處理過擬合問題,相對于Dropout,BN的訓(xùn)練速度更快,避免了梯度消失或爆炸的問題[11-13]。批量規(guī)范化顧名思義就是對每一層輸入數(shù)據(jù)的標(biāo)準(zhǔn)化處理,保持數(shù)據(jù)的分布相同,表達式如下:
(1)
式中:μx為xi的平均值;σx2為xi的方差;γ、β為輸出滿足標(biāo)準(zhǔn)高斯分布的正則項,平均值為0,方差值為1。
損失函數(shù)的設(shè)計:本文通過Softmax loss這種比較常用的損失函數(shù),將預(yù)測轉(zhuǎn)化為非負值,并將其標(biāo)準(zhǔn)化,從而得到類別的概率分布。這種概率預(yù)測用于計算多項Logistic loss,即:
(2)
為防止過擬合現(xiàn)象,本文又在損失函數(shù)中加入了L2 正則化,降低網(wǎng)絡(luò)中一些神經(jīng)元的權(quán)值抑制過擬合,公式為:
(3)
式中:λ是正則項系數(shù),文中λ=0.000 5。本文所使用的損失函數(shù)為Softmax loss,即:
(4)
3.1 神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)
神經(jīng)網(wǎng)絡(luò)圖像識別能夠使得計算機的行為和思維更接近于人類,提高圖像識別過程的穩(wěn)定性。
根據(jù)卷積神經(jīng)網(wǎng)絡(luò)的特點,專門設(shè)計一個處理圖像的網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)主要是對系統(tǒng)中水果、蔬菜的顏色、形狀及各項屬性進行識別。采集目標(biāo)圖片作為標(biāo)準(zhǔn)圖像,歸納出不同種類水果和蔬菜圖像的特征數(shù)據(jù)作為基礎(chǔ)模板;通過反復(fù)訓(xùn)練,最終實現(xiàn)具有圖形識別功能的果蔬識別分析系統(tǒng)。
3.2 非線性降維的圖像識別技術(shù)
圖像識別技術(shù)中非線性降維是比較常用的一種技術(shù)。對圖像進行降維的技術(shù)可以有效解決計算機處理復(fù)雜圖像存在的高成本、外在風(fēng)險影響識別效率的準(zhǔn)確性等問題。
由于果蔬識別系統(tǒng)中所需的空間維度通常很高,但在高維度空間中果蔬圖像的分布不均勻,非常不利于計算機對圖像的識別。而通過非線性的降維技術(shù)可以得到分布緊湊的果蔬圖像,從而提高果蔬識別技術(shù)的準(zhǔn)確性。
3.3 YOLOv3圖像目標(biāo)檢測算法
在圖像識別中利用YOLOv3圖像目標(biāo)檢測算法能夠提高圖像目標(biāo)檢測的準(zhǔn)度和速度,其主要是運用深度遞歸神經(jīng)網(wǎng)絡(luò)進行目標(biāo)檢測和目標(biāo)定位。本質(zhì)上,YOLOv3就是一個實現(xiàn)了回歸功能的深度卷積神經(jīng)網(wǎng)絡(luò)。
3.4 模式識別
模式識別在圖像識別方面的應(yīng)用效果非常顯著,是通過識別程序識別圖像的特征信息[14-15]。模式識別的系統(tǒng)框圖如圖3所示。
3.5 基于聚焦網(wǎng)絡(luò)爬蟲的信息抓取模式識別
種植指導(dǎo)與飲食推薦系統(tǒng)主要采用的是聚焦網(wǎng)絡(luò)爬蟲[16]。通過系統(tǒng)搜索界面輸入關(guān)鍵詞進行聚焦網(wǎng)絡(luò)爬蟲,從而聚焦于某一個相關(guān)主題范圍內(nèi)進行相關(guān)數(shù)據(jù)的爬取。圖4為本系統(tǒng)的聚焦網(wǎng)絡(luò)爬蟲的結(jié)構(gòu)體系。
4 實驗效果與展示
根據(jù)稀缺植物以及稀缺水果在不同條件下的多次實驗得出數(shù)據(jù)見表1所列。
由表1可以看出,該系統(tǒng)的識別準(zhǔn)確性與環(huán)境的明暗程度大致成正比,數(shù)據(jù)正確、安全。
圖5為系統(tǒng)首頁界面圖,圖6為水果識別效果圖,圖7為蔬菜識別效果圖。
5 結(jié) 語
本文的基于人工智能的果蔬識別及種植指導(dǎo)系統(tǒng)解決了人們無法辨識健康可食用的果蔬以及一些用戶想自己種植而缺少專業(yè)指導(dǎo)技術(shù)等問題;同時本文的種植指導(dǎo)系統(tǒng)具有提供專家經(jīng)驗以及專業(yè)知識的功能,為廣大群眾和種植戶帶來了極大的便利,為人們飲食方面的健康性、安全性提供了保障。新鮮的綠色果蔬已經(jīng)成為了大多數(shù)民眾的追求,綠色果蔬的營養(yǎng)搭配也隨之成為重中之重。本文設(shè)計的基于人工智能的果蔬識別及種植指導(dǎo)系統(tǒng)是集果蔬識別、種植指導(dǎo)、健康飲食于一體的多功能指導(dǎo)系統(tǒng),能夠?qū)G色果蔬進行智能、準(zhǔn)確、快速地識別。
參考文獻
[1]覃麗萍.易腐果蔬動態(tài)保質(zhì)期評估和庫存管理策略探討—基于集成射頻識別技術(shù)[J].技術(shù)與市場,2022,29(8):83-86.
[2]蘇偉鵬. 基于深度學(xué)習(xí)的果蔬圖像識別的研究與應(yīng)用[D].南昌:南昌大學(xué),2021.
[3]簡欽,張雨墨,簡獻忠. FC-CNN:基于卷積神經(jīng)網(wǎng)絡(luò)的水果圖像分類算法[J].農(nóng)業(yè)裝備與車輛工程,2021,59(1):67-71.
[4]劉亞平.計算機圖像處理與識別技術(shù)應(yīng)用[J].電子質(zhì)量,2022,43(10):94-97.
[5]王子睿. 基于異構(gòu)計算的廣告圖片識別系統(tǒng)設(shè)計與實現(xiàn)[D].北京:北京郵電大學(xué),2020.
[6]張世豪,冼麗英,高敏,等.基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)智能圖像識別技術(shù)應(yīng)用于宮頸鱗狀上皮內(nèi)病變細胞學(xué)篩查的可行性研究[J].中國臨床新醫(yī)學(xué),2019,12(3):282-285.
[7]孟廣仕.圖像識別技術(shù)在人工智能中的應(yīng)用[J].信息與電腦(理論版),2018,12(12):152-153.
[8]季秀怡.淺析人工智能中的圖像識別技術(shù)[J].電腦知識與技術(shù),2016,12(14):147-148.
[9]趙一舟,歐瑤,李江嵐,等.基于圖像識別的家蠶蛹體形數(shù)據(jù)庫構(gòu)建和初步分析[J].蠶學(xué)通訊,2016,36(2):14-17.
[10]劉偉,鄒偉紅,盧彥杰,等.基于遷移學(xué)習(xí)和模型融合的中藥材圖像識別研究[J].湖南中醫(yī)藥大學(xué)學(xué)報,2022,42(5):809-814.
[11]施強.基于BP神經(jīng)網(wǎng)絡(luò)的計算機圖像智能識別方法[J].電腦編程技巧與維護,2022,29(10):134-137.
[12]徐自遠.面向人工智能算法下圖像識別技術(shù)分析[J].數(shù)字技術(shù)與應(yīng)用,2021,39(10):4-6.
[13]汪勇.人工智能算法下圖像識別技術(shù)的應(yīng)用[J].電子技術(shù)與軟件工程,2022,11(21):180-183.
[14]唐廠,蔣良孝,陳云亮.基于華為“智能基座”的模式識別課程案例庫建設(shè)與實踐[J].軟件導(dǎo)刊,2023,22(6):48-52.
[15]漆顥,胡敏,王艷.基于物聯(lián)網(wǎng)技術(shù)的智慧病房系統(tǒng)的總體設(shè)計[J].物聯(lián)網(wǎng)技術(shù),2021,11(11):79-80.
[16]孫立偉,何國輝,吳禮發(fā).網(wǎng)絡(luò)爬蟲技術(shù)的研究[J].電腦知識與技術(shù),2010,6(15):4112-4115.