曾銘杰
摘要:從二維圖像自動生成三維模型是產(chǎn)品建模的重要方法,依據(jù)圖像準(zhǔn)確識別產(chǎn)品類型,利用產(chǎn)品類型特征快速建模有助于提高建模的準(zhǔn)確率。本文針對各種陶瓷器皿,引用 keras 模型來提取陶瓷茶杯、瓷盤、花瓶和茶壺的訓(xùn)練特征,進(jìn)一步學(xué)習(xí)并分類,從而訓(xùn)練出高精度的陶瓷茶杯、瓷盤、花瓶和茶壺分類模型,為準(zhǔn)確建立陶瓷產(chǎn)品三維建模奠定基礎(chǔ)。
關(guān)鍵詞:圖像分類;陶瓷;深度學(xué)習(xí)
中圖分類號:TP311? ? ?文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2021)13-0174-02
應(yīng)用新一代信息技術(shù)改造提升傳統(tǒng)產(chǎn)業(yè)是陶瓷產(chǎn)業(yè)發(fā)展的必經(jīng)之路。陶瓷產(chǎn)品數(shù)字化設(shè)計和自動化建模是陶瓷工業(yè)數(shù)字化轉(zhuǎn)型的基礎(chǔ)。本文嘗試通過對平面圖像中陶瓷器型特征的提取進(jìn)行分類,并依據(jù)器型特征快速建立三維模型,為陶瓷產(chǎn)品的數(shù)字化設(shè)計與數(shù)字化制造奠定基礎(chǔ)。
依據(jù)陶瓷平面圖像進(jìn)行產(chǎn)品分類的主要難點(diǎn)是表面特征相互交錯,不能簡單通過它是否存在某一特征來判斷其類型。對于陶瓷這種相互交錯的特征采用深度學(xué)習(xí)算法,自主學(xué)習(xí)提取圖片特征,進(jìn)而根據(jù)產(chǎn)品器型進(jìn)行準(zhǔn)確分類,為下一步三維建模提供支撐。
1圖片采集和處理
1.1 圖片采集
擁有完整并且豐富的圖像數(shù)據(jù)是基于深度學(xué)習(xí)的圖像識別算法的一個重要部分[1]。為了使卷積神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率更高,需要收集的陶瓷器型圖片訓(xùn)練樣本,應(yīng)該盡量多樣化。為此,通過爬蟲技術(shù)對搜狗圖片進(jìn)行爬取,在搜狗的搜索引擎中輸入關(guān)鍵字“陶瓷杯子”“陶瓷盤子”“陶瓷花瓶”和“陶瓷壺”,獲取大量陶瓷器型圖片,再經(jīng)過篩選,剔除分類錯誤和格式錯誤的圖片,形成訓(xùn)練樣本。
1.2圖片處理
為了使模型能應(yīng)用更多的場景和增加分類的準(zhǔn)確率,將之前收集好的圖片進(jìn)行一定的預(yù)處理[2]。首先進(jìn)行亮度的調(diào)整和旋轉(zhuǎn)等操作,處理出有效樣本10823張,再將全部圖片進(jìn)行歸一化處理,讓每張圖片的大小均為150*150像素,以使其滿足卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練需要。最后將所有圖片打上標(biāo)簽再隨機(jī)排序并且將80%作為數(shù)據(jù)的訓(xùn)練集,剩下的20%作為數(shù)據(jù)的測試集。并將訓(xùn)練準(zhǔn)確率最好的一個模型保存。
2 keras模型
keras模型具有簡單的API、使用簡單和更好的擴(kuò)展性,從而吸引了更多的初學(xué)者進(jìn)行深度學(xué)習(xí)[3]。本文使用Sequential的卷積網(wǎng)絡(luò)結(jié)構(gòu)如表1所示,將輸入大小為150*150*3的圖片經(jīng)過四次的卷積和四次的池化轉(zhuǎn)化為7*7*128,再由三個全連接層輸出4個結(jié)果分別對應(yīng)“茶杯”“瓷盤”“花瓶”和“茶壺”。從而卷積網(wǎng)絡(luò)通過一層一層地映射和大量數(shù)據(jù)的輸入,使得輸入和輸出關(guān)系不需要具體的數(shù)學(xué)公式來表達(dá),只需要通過設(shè)定好的模式和編輯好的卷積網(wǎng)絡(luò)訓(xùn)練。并且CNN是一種輸出權(quán)值越來越大的倒三角形態(tài),這樣就可以很好地避免在神經(jīng)網(wǎng)絡(luò)中反向傳播時梯度過快。
卷積核內(nèi)容如下:
3結(jié)果分析
將圖片經(jīng)過上述的操作和處理后,再對圖片進(jìn)行隨機(jī)分成兩份,兩者比例大約為80%和20%,用80%的圖片數(shù)據(jù)作為訓(xùn)練集使用能為模型提供更多的信息以便模型能更加準(zhǔn)確,而用剩下的20%作為測試集更能直接反映出準(zhǔn)確率的高低。本文選擇步長為128,經(jīng)過40次的迭代訓(xùn)練。
最終得出損失值val_loss: 0.4515 和準(zhǔn)確率 val_accuracy: 0.9509,但因第35次迭代時準(zhǔn)確率最高,所以選擇準(zhǔn)確率最高的進(jìn)行模型保存(損失值val_loss: 0.4287 和準(zhǔn)確率 val_accuracy: 0.9524)。
4調(diào)用模型預(yù)測實(shí)例
本實(shí)例為了增加干擾信號,選擇采用一張盤子上印有杯子的圖片進(jìn)行預(yù)測。預(yù)測結(jié)果如圖4所示,預(yù)測約91%為“瓷盤”,表示預(yù)測結(jié)果良好且準(zhǔn)確。
5結(jié)論
隨著陶瓷行業(yè)的發(fā)展,實(shí)現(xiàn)數(shù)字化制造是必由之路。通過對平面圖像的識別進(jìn)行三維快速建模,將極大提升陶瓷產(chǎn)品設(shè)計效率,推進(jìn)陶瓷產(chǎn)業(yè)的數(shù)字化設(shè)計和數(shù)字化制造,進(jìn)而促進(jìn)整個陶瓷產(chǎn)業(yè)的發(fā)展。
參考文獻(xiàn):
[1]戴冰燕,鄭志碩.基于遷移學(xué)習(xí)的可回收垃圾識別分類研究[J].中國科技信息,2021(5):86-88.
[2]付安安. 基于深度學(xué)習(xí)的食用水果圖像識別應(yīng)用研究[D].南昌:南昌大學(xué),2020.
[3]王恒濤.基于TensorFlow、Keras與OpenCV的圖像識別集成系統(tǒng)[J].電子測試,2020(24):53-54,124.
【通聯(lián)編輯:李雅琪】