作者簡(jiǎn)介:于婉婷(2000—),女,本科, 研究方向?yàn)橛?jì)算機(jī)。
基金項(xiàng)目:國(guó)家自然科學(xué)基金(項(xiàng)目編號(hào):U1504623)。
摘要:社會(huì)快速發(fā)展對(duì)水資源需求越來越大和水資源的相對(duì)短缺,使水資源保護(hù)已成為一個(gè)重要的時(shí)代課題。傳統(tǒng)飲水設(shè)備的使用不僅會(huì)由于開關(guān)不及時(shí)等原因造成水資源浪費(fèi),也經(jīng)常給人體帶來燙傷的危險(xiǎn)。人工智能技術(shù)的快速發(fā)展,使圖像檢測(cè)應(yīng)用于解決生活中的問題更加有效。采用基于Faster R-CNN構(gòu)建水位檢測(cè)模型,對(duì)水杯中的水位進(jìn)行檢測(cè),并取得了較好的檢測(cè)效果,訓(xùn)練效果的平均精確度高達(dá)100%,測(cè)試效果的置信度均在93%以上。實(shí)驗(yàn)結(jié)果表明:基于圖像檢測(cè)設(shè)計(jì)的智能節(jié)水系統(tǒng)可實(shí)現(xiàn)對(duì)出水量的精確控制,對(duì)減少水資源浪費(fèi)有重要的意義。
關(guān)鍵詞:圖像檢測(cè) 節(jié)水智能控制系統(tǒng) 人工智能 Faster R-CNN
中圖分類號(hào):TP273.5
Abstract: With the increasing demand for water resources and the relative shortage of water resources due to the rapid development of society, water resource protection has become an important issue of the times. The use of traditional drinking water equipment will not only cause the waste of water resources due to untimely switching and other reasons, but also often bring the risk of burns to the human body. The rapid development of artificial intelligence technology makes the application of image detection to solve problems in life more effective. In this paper, a water level detection model is built based on Faster R-CNN to detect water levels in water cups, and good detection results are achieved, with the average accuracy of the training effect being as high as 100% and the confidence of the test effect being above 93%. Experimental results show that the designed intelligent water-saving system based on image detection can realize the accurate control of water output, which is of great significance to reduce the waste of water resources.
Key Words: Image detection; Water-saving intelligent control system; Artificial intelligence; Faster R-CNN
飲水機(jī)是辦公室、學(xué)校、商場(chǎng)等公眾場(chǎng)所最常用到的生活必備設(shè)施。通過觀察發(fā)現(xiàn),飲水機(jī)的進(jìn)出水控制開關(guān)通過人為來操控經(jīng)常會(huì)浪費(fèi)很多水,甚至在接熱水時(shí)經(jīng)常會(huì)由于關(guān)閉控制不夠及時(shí)或開關(guān)不夠靈敏等原因燙傷用戶。這種現(xiàn)象不僅會(huì)造成資源的浪費(fèi),還對(duì)人們生活造成一定的影響。在國(guó)家發(fā)展過程中,國(guó)家經(jīng)濟(jì)體量的增長(zhǎng)使各種污染物的排放量不斷增加,加劇了水資源的短缺,因此水資源的保護(hù)問題變得越來越重要[1]。近年來,隨著以計(jì)算機(jī)技術(shù)為基礎(chǔ)的各項(xiàng)智能技術(shù)不斷發(fā)展和廣泛使用[2],可使用圖像檢測(cè)來對(duì)水杯中的水量進(jìn)行檢測(cè)并實(shí)現(xiàn)對(duì)水位的控制,以更好地解決上述問題。
本文使用Faster R-CNN網(wǎng)絡(luò)進(jìn)行模型的構(gòu)建,首先對(duì)圖像中的特征進(jìn)行提取,即整理出便于后面階段使用的數(shù);然后在提取出的特征框架上運(yùn)用RPN在輸入圖像上滑動(dòng)一個(gè)小窗口來生成一系列候選框,對(duì)于每一個(gè)候選框,使用RoI Pooling層對(duì)其進(jìn)行特征池化操作;將池化后的特征輸入到全連接層中進(jìn)行分類和回歸,最后經(jīng)過NMS處理,去除重復(fù)檢測(cè)結(jié)果,得到最終的物體檢測(cè)結(jié)果。將構(gòu)建好的模型應(yīng)用于實(shí)現(xiàn)節(jié)水[3]智能控制系統(tǒng)。
1 基于Faster R - CNN的模型構(gòu)建
構(gòu)建基于Faster R-CNN[4]的水位檢測(cè)模型,保證在輸入為盛有一定量水的水杯圖像時(shí),能夠輸出結(jié)果表示水位是否達(dá)到規(guī)定的最高標(biāo)準(zhǔn)。
構(gòu)建模型過程中,各個(gè)層所完成的工作任務(wù)為:用卷積神經(jīng)網(wǎng)絡(luò)提取圖像的特征能夠提取出不同層次的特征,以更好的滿足圖像檢測(cè)的任務(wù)需求;RPN生成候選框的速度比傳統(tǒng)方法生成候選框的速度快[5];RoI Pooling層能夠減輕模型的運(yùn)算負(fù)擔(dān),提高運(yùn)行速度;非極大值抑制處理用來提高檢測(cè)的精度。該模型能夠在保持較高的檢測(cè)準(zhǔn)確度的基礎(chǔ)上,加快檢測(cè)速度?;贔aster R-CNN構(gòu)建模型的具體實(shí)現(xiàn)流程如圖1所示。
首先使用卷積神經(jīng)網(wǎng)絡(luò)來提取圖像中的特征。該網(wǎng)絡(luò)包括13個(gè)conv層、13個(gè)relu、4個(gè)pooling。由計(jì)算公式(1)可知,每個(gè)conv層和relu層處理之后,F(xiàn)eature map的大小都不變;pooling層處理之后,F(xiàn)eature map的寬和高變?yōu)檩斎朐搶忧暗囊话?,輸入feature map的大小可由計(jì)算公式(2)得出。其中,kernel_size為卷積核大小,卷積層通過卷積核對(duì)輸入的特征圖進(jìn)行滑動(dòng)卷積。Padding起填充作用,卷積操作后特征圖的尺寸會(huì)發(fā)生變化,padding用來指定在輸入的特征圖四個(gè)邊緣如何進(jìn)行填充操作,以保證輸出的特征圖大小合適。stride為步長(zhǎng),stride指定卷積核每次在輸入特征圖上滑動(dòng)的步長(zhǎng),即滑動(dòng)的行數(shù)和列數(shù)。當(dāng)stride越大時(shí),計(jì)算速度越快,但卷積層的參數(shù)更新次數(shù)也會(huì)減少,對(duì)于較大的輸入矩陣,容易帶來信息丟失問題[6]。
在提取出的特征框架上運(yùn)用區(qū)域提議網(wǎng)絡(luò)(RPN)在輸入圖像上滑動(dòng)一個(gè)小窗口來生成一系列候選框(anchors),這些候選框是圖像檢測(cè)的初步結(jié)果,相比傳統(tǒng)生成候選框的辦法,使用RPN極大提高了生成候選框的速度。RPN訓(xùn)練過程中,softmax分類器[7]用于提取positive anchors,positive anchors是與真實(shí)框重合度較高的候選框;bbox regression回歸positive anchors生成偏移量,回歸即通過不斷訓(xùn)練使anchors與真實(shí)框越來越接近,最后生成Proposals。Reshape先對(duì)Feature Map進(jìn)行維度變換,以便于Softmax進(jìn)行處理,經(jīng)過Softmax處理之后再Reshape將維度復(fù)原。RPN的具體結(jié)構(gòu)如圖2所示。
對(duì)于每一個(gè)候選框,使用RoI Pooling層對(duì)其進(jìn)行特征池化操作,將其形狀規(guī)范化為固定大小,方便后續(xù)處理。將池化后的特征輸入到全連接層中進(jìn)行分類和回歸,用以判斷物體的類別和精確位置。
最后,經(jīng)過非極大值抑制(NMS)處理[8],去除重復(fù)檢測(cè)的結(jié)果,得到最終的物體檢測(cè)結(jié)果。分類器網(wǎng)絡(luò)將RPN生成的結(jié)果輸入,訓(xùn)練網(wǎng)絡(luò)將杯子分類為1/5、2/5、3/5、4/5,這4個(gè)類別。網(wǎng)絡(luò)輸出分類得分和杯子周圍的邊界框。
2 數(shù)據(jù)集建立
為了使用戶有更加多樣化地選擇,在數(shù)據(jù)集中,包含水容量為五分之一、五分之二、五分之三、五分之四的圖像集用來進(jìn)行訓(xùn)練。通過規(guī)定水位達(dá)到五分之四即為水位的最高標(biāo)準(zhǔn)由此來實(shí)現(xiàn)智能節(jié)水,用戶還可以根據(jù)實(shí)際所需選擇用水量。對(duì)數(shù)據(jù)集中每個(gè)圖像進(jìn)行標(biāo)注處理的動(dòng)作包括,標(biāo)出水杯的位置和水的容量,對(duì)圖像進(jìn)行標(biāo)注處理的示例如圖3所示。部分實(shí)驗(yàn)數(shù)據(jù)如圖4所示。
3 智能節(jié)水系統(tǒng)工作流程
采用圖像檢測(cè)[9]方法對(duì)水位進(jìn)行自動(dòng)檢測(cè),需要對(duì)輸入圖像中水杯位置進(jìn)行準(zhǔn)確識(shí)別并檢測(cè)其水位高度。將杯子放置在出水口下方,系統(tǒng)自動(dòng)識(shí)別水杯并檢測(cè)水位高度。為減少水資源浪費(fèi)以及防止用戶燙傷等問題,通過系統(tǒng)設(shè)置當(dāng)水位達(dá)到水杯容量的五分之四即為水位最高標(biāo)準(zhǔn)。如果水位過低,系統(tǒng)會(huì)自動(dòng)加水,水位達(dá)到水杯容量的五分之四,系統(tǒng)會(huì)自動(dòng)停止加水。在模型的訓(xùn)練過程中,包含了水容量為五分之一、五分之二、五分之三、五分之四的標(biāo)簽,使用戶也可以根據(jù)實(shí)際情況選擇所需飲水量,滿足用戶多樣化的需求。系統(tǒng)默認(rèn)化設(shè)置為水容量達(dá)到五分之四即系統(tǒng)停止出水。
在實(shí)現(xiàn)過程中,在飲水機(jī)上安裝一個(gè)攝像頭,以捕捉杯子中水位情況的圖像。然后,對(duì)圖像進(jìn)行分析以確定杯子中水位高度。如果分析結(jié)果為未超過系統(tǒng)規(guī)定的水位最高標(biāo)準(zhǔn),則系統(tǒng)繼續(xù)出水;如果分析結(jié)果為超過系統(tǒng)規(guī)定的水位最高標(biāo)準(zhǔn),則系統(tǒng)停止出水,以實(shí)現(xiàn)節(jié)水及對(duì)用戶進(jìn)行安全保護(hù)的作用;如果在水位未達(dá)到系統(tǒng)規(guī)定的水位最高標(biāo)準(zhǔn)之前手動(dòng)關(guān)閉開關(guān),也能夠?qū)崿F(xiàn)停止出水。由此實(shí)現(xiàn)系統(tǒng)自動(dòng)控制水量和應(yīng)用需求的多樣化。
該模型可以根據(jù)不同類型的杯子和容器進(jìn)行訓(xùn)練,以適應(yīng)不同形狀和大小的杯子。智能節(jié)水系統(tǒng)實(shí)現(xiàn)流程如圖5所示。
4 實(shí)驗(yàn)結(jié)果與分析
通過Faster R-CNN網(wǎng)絡(luò)實(shí)現(xiàn)水位檢測(cè)模型的構(gòu)建,水位檢測(cè)模型訓(xùn)練效果的數(shù)據(jù)測(cè)試統(tǒng)計(jì)如圖6所示。通過實(shí)驗(yàn)結(jié)果數(shù)據(jù)統(tǒng)計(jì)可知,每個(gè)標(biāo)簽訓(xùn)練效果的平均精確度高達(dá)100%,訓(xùn)練效果較好。
F1-Score被定義為精確率和召回率的調(diào)和平均數(shù)[10]。精確率(precision)為模型預(yù)測(cè)的正樣本中真正正樣本所占的比例,計(jì)算公式如公式(3);召回率(recall)為模型預(yù)測(cè)出真正正樣本占實(shí)際正樣本的比例,計(jì)算公式如公式(4)。 F1-Score的數(shù)據(jù)取值計(jì)算公式如公式(5)所示。F1-Score是一種用來衡量模型精確度的一種指標(biāo),數(shù)據(jù)的取值在0和1之間,F(xiàn)1-Score的值越高模型的精確度越高。在不同閾值下,F(xiàn)1-Score的表現(xiàn)如圖7所示。由圖可知,閾值的取值大小與F1-Score之間不是簡(jiǎn)單的正比關(guān)系,當(dāng)閾值的取值為0.8時(shí), F1-Score取值為1,模型精確度最高;當(dāng)閾值再增加,F(xiàn)1-Score的取值將減小,即模型的精確度下降。
其中,TP(True Positive)表示真正正樣本數(shù)量,F(xiàn)P(False Positive)表示錯(cuò)誤地將負(fù)樣本預(yù)測(cè)為正樣本的數(shù)量。TP與FP之和即為模型預(yù)測(cè)的正樣本數(shù)量。
其中,TP(True Positive)表示真正正樣本數(shù)量,F(xiàn)N(False Negative)表示錯(cuò)誤地將正樣本預(yù)測(cè)為負(fù)樣本的數(shù)量。TP與FN之和即為實(shí)際正樣本的數(shù)量。
其中,F(xiàn)1-Score表示模型的精確度,取值范圍為0~1。
為了檢驗(yàn)?zāi)P偷挠?xùn)練效果,選擇測(cè)試集圖片進(jìn)行測(cè)試,將閾值置為0.8。分別選取大量的水容量為五分之一、五分之二、五分之三、五分之四的圖像集用來進(jìn)行測(cè)試測(cè)試效果如圖8所示,測(cè)試輸出結(jié)果準(zhǔn)確標(biāo)注出了水杯的位置、標(biāo)簽名稱以及置信度。
通過測(cè)試結(jié)果可知,模型能夠準(zhǔn)確識(shí)別標(biāo)注輸入圖像中杯子的位置,并且能夠?qū)Ρ又械乃贿M(jìn)行準(zhǔn)確檢測(cè),標(biāo)簽名稱為五分之一、五分之二、五分之三、五分之四的置信度分別為97.06%,98.23%,93.32%,97.59%,即置信度均在93%以上模型訓(xùn)練效果較好。可以滿足系統(tǒng)所需的功能。
5 結(jié)語
本文對(duì)基于圖像檢測(cè)并實(shí)現(xiàn)節(jié)水智能控制這一系統(tǒng)設(shè)計(jì)進(jìn)行了詳細(xì)介紹。該系統(tǒng)使用Faster R-CNN對(duì)水位檢測(cè)模型進(jìn)行訓(xùn)練,其中RPN網(wǎng)絡(luò)生成候選框比傳統(tǒng)獲取候選框的方法速度快,使用該算法進(jìn)行訓(xùn)練取得較好的訓(xùn)練結(jié)果。從對(duì)訓(xùn)練結(jié)果的分析來看,檢測(cè)的效果較好。該系統(tǒng)設(shè)計(jì)可以實(shí)現(xiàn)水杯中水位的檢測(cè),并且通過對(duì)不同水位進(jìn)行訓(xùn)練可以滿足用戶的不同需求,具有一定的實(shí)際應(yīng)用價(jià)值。將該設(shè)計(jì)應(yīng)用于實(shí)現(xiàn)智能節(jié)水控制的實(shí)際場(chǎng)景中,能夠在實(shí)現(xiàn)節(jié)水的同時(shí),為人們的生活化應(yīng)用提供便利。這對(duì)國(guó)家推進(jìn)可持續(xù)發(fā)展和構(gòu)建美好社會(huì)生活具有重要的現(xiàn)實(shí)意義。
參考文獻(xiàn)
[1] 陳杰,許朗.基于面板三階段DEA-Malmquist模型的中國(guó)農(nóng)業(yè)綠色水資源利用效率研究[J].地理科學(xué),2023,43(4):709-718.
[2] 房媛,王美航,趙秀巖,等.面向新文科的Python課程項(xiàng)目式學(xué)習(xí)教學(xué)研究[J/OL].軟件導(dǎo)刊:1-5[2023-07-05].http://kns.cnki.net/kcms/detail/42.1671.TP.20230526.1111.050.html.
[3] 丁育林,汪俊瑛.南京市六合區(qū)大廠街道居民生活用水現(xiàn)狀及節(jié)水對(duì)策[J].科技資訊,2018,16(20):103-104.
[4] 李殷昊,李瑩,王凱彬,等.基于改進(jìn)Faster-RCNN的煙標(biāo)缺陷檢測(cè)[J].軟件導(dǎo)刊,2023,22(3):179-183.
[5] 曹磊,王強(qiáng),史潤(rùn)佳,等.基于改進(jìn)RPN的Faster-RCNN網(wǎng)絡(luò)SAR圖像車輛目標(biāo)檢測(cè)方法[J]. 東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,51(1):87-91.
[6] 管文白,房笑宇,夏彬.基于深度強(qiáng)化學(xué)習(xí)的故障硬盤預(yù)測(cè)與處理方法[J].軟件導(dǎo)刊,2023,22(3):18-26.
[7] 殷芙萍,江秋語.基于神經(jīng)網(wǎng)絡(luò)的大數(shù)據(jù)分析方法[J]. 軟件導(dǎo)刊,2020,19(9):39-42.
[8] 趙文清,嚴(yán)海,邵緒強(qiáng).改進(jìn)的非極大值抑制算法的目標(biāo)檢測(cè)[J]. 中國(guó)圖象圖形學(xué)報(bào),2018,23(11):1676-1685.
[9] 張慧敏.基于圖像智能分析的全天候危巖崩塌災(zāi)害實(shí)時(shí)監(jiān)測(cè)設(shè)備研究[J].科技資訊,2020,18(27):44-46,9.
[10] 高美靜,李時(shí)雨,劉澤昊,等. 基于改進(jìn)Faster R-CNN的水母檢測(cè)與識(shí)別算法[J].計(jì)量學(xué)報(bào),2023,44(1):54-61.