傅駿 吳高靜 李 強 藺虹賓 趙曉露 顧詩藝
關(guān)鍵詞:人工智能;鑄造;EasyDL;Tkinter
為引導鑄造企業(yè)規(guī)范發(fā)展,促進行業(yè)產(chǎn)業(yè)結(jié)構(gòu)調(diào)整、優(yōu)化和轉(zhuǎn)型升級,2019年9月,中國鑄造協(xié)會頒布了團體標準《鑄造企業(yè)規(guī)范條件》,從2020年1月1日起開始施行。該標準對鑄造企業(yè)的建設(shè)條件與布局、企業(yè)規(guī)模、生產(chǎn)工藝、生產(chǎn)裝備、質(zhì)量管控、能源消耗、環(huán)境保護、安全生產(chǎn)及職業(yè)健康和監(jiān)督管理、員工素質(zhì)等提出了規(guī)范條件,提升新入職員工培養(yǎng)和老員工復訓質(zhì)量、在鑄造生產(chǎn)環(huán)節(jié)引入智能技術(shù)手段已經(jīng)迫在眉睫,采用人工智能技術(shù)將引領(lǐng)鑄造業(yè)開始新一輪變革。
目前,很多工作依賴人工的大量、繁復勞動,需要曠日持久的經(jīng)驗訓練,比如醫(yī)生判斷病情、家具行業(yè)缺陷檢測、人工監(jiān)控生產(chǎn)區(qū)域安全狀況,借助人工智能可以有效避免人的心理、生理因素波動和經(jīng)驗欠缺造成的結(jié)果不確定、不穩(wěn)定。
本項目團隊利用開源人工智能平臺開發(fā)了一系列鑄造用軟件,助力行業(yè)技術(shù)提升與員工培訓,將鑄造員工從繁雜的體力勞動中解放出來。
1 系統(tǒng)開發(fā)
深度學習是機器學習領(lǐng)域的一個研究方向。深度學習是通過大量的樣本訓練,計算機自動學習樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,最終達到能像人一樣具有分析學習能力的目的。深度學習在搜索技術(shù)、數(shù)據(jù)挖掘、機器學習、機器翻譯、自然語言處理、多媒體學習、語音、推薦、個性化技術(shù)以及其他領(lǐng)域都取得了較多成果,與傳統(tǒng)的利用人工設(shè)計特征提取算法相比,基于深度學習的網(wǎng)絡(luò)模型具有自動抽取海量數(shù)據(jù)高維特征的能力。深度卷積網(wǎng)絡(luò)通過從輸入層到輸出層的多層非線性映射和網(wǎng)絡(luò)的反向傳播完成層次特征的提取和學習?;诰矸e神經(jīng)網(wǎng)絡(luò)的深度學習算法,通過多層卷積和池化操作,能自動提取圖像特征,可顯著提高圖像識別的準確率,無需人工干預,快速且準確率高達95%[1]。
1.1 開源人工智能技術(shù)開發(fā)平臺
百度公司提供了百度大腦以及一系列人工智能開放功能和開放平臺,不要求用戶掌握高深的深度學習理論。其中,EasyDL人工智能技術(shù)開發(fā)平臺集成了深度學習功能,用戶只需輸入素材(圖片、聲音、文本等),平臺就可以自動進行訓練,提供軟件開發(fā)工具包(Software Development Kit,SDK),具有圖像分類、物體檢測、文本分類、聲音分類和視頻分類五大功能,低成本、高精度的EasyDL正在眾多實際應(yīng)用中為各行企業(yè)賦能[2]。
1.2 使用流程
百度EasyDL平臺的主要使用流程包括素材準備、訓練、發(fā)布3個環(huán)節(jié)。
1.2.1 素材準備
深度學習最重要的工作是分類、收集素材和分類整理。針對擬開發(fā)的模塊,收集照片并分類存放。EasyDL平臺要求每張圖片都歸屬于一個分類,一個模型最多支持1 000個分類。分類名由數(shù)字、中英文、中/下劃線組成,長度上限為256字符。
在收集素材時,要保證權(quán)威性和準確性。一般選擇每個類別的90%左右生成zip壓縮包作為訓練用,其余10%左右的圖片用作測試。
1.2.2 訓練
每個類型訓練基本可在1 h內(nèi)完成,短的15 min左右。在訓練時,可以離開頁面、可以關(guān)機,由后臺自動訓練。訓練完成后,消息發(fā)送到手機。采用測試集圖片測試效果。正確率偏低,可以用測試集糾正或者上傳更多照片重新訓練,確保每一類正確率不低于95%,方可投入使用。
1.2.3 發(fā)布
訓練完成后,根據(jù)需要,分別發(fā)布公有云、設(shè)備SDK、私有服務(wù)器、軟硬件一體化4種類型。其中,對于公有云,訓練完成后,在“體驗H5”中設(shè)置相關(guān)信息,用手機掃描二維碼后即可使用。用戶上傳手機中的照片或現(xiàn)場拍攝,系統(tǒng)自動給出識別結(jié)果。對于設(shè)備SDK,百度AI開放平臺使用OAuth2.0授權(quán)調(diào)用開放API,推薦使用POST方法。對訓練獲得的庫通過http請求獲得結(jié)果,關(guān)鍵代碼:
http=urllib3.PoolManager()
img = base64.b64encode(pic.read())
encoded_data = json.dumps(params).encode('utf-8')
request=http.request('POST', url,body,headers)
1.3 設(shè)備SDK的GUI界面開發(fā)
對設(shè)備SDK方式獲得的代碼進行了基于Tkinter的二次開發(fā)。其中,選擇圖片文件,并在圖形用戶界面(GraphicalUser Interface,GUI)的標簽上顯示關(guān)鍵代碼:
pilImage = Image.open(filename)
hh=int(pilImage.height)
ww=int(pilImage.width)
tkImage = ImageTk.PhotoImage(image=pilImage)
labe1 =Label(root,image=tkImage)
labe1 .place(x=0,y=0)
1.4 “金相識別”系統(tǒng)
四川航檢科技公司和北京航空材料研究院合作,面向西南片區(qū)的航空航天企業(yè)開展高溫合金等材料的物理性能檢測。目前在評定晶粒度時,采用劃分表格、對比標準圖片進行評定,對檢測人員的水平和經(jīng)驗依賴性較高,工作強度大,引入人工智能技術(shù)勢在必行。
項目組開發(fā)了“金相識別”系統(tǒng)。其中,在創(chuàng)建數(shù)據(jù)集時,將所有收集來的50 μm金相分為5個等級,分別是7.5級、8.0級、8.5級、9.0級、9.5級。文件夾和圖片名一一對應(yīng),將收集的300余張圖片通過裁剪的方式分成10張圖片,共獲得3 000余張圖片,放入對應(yīng)的文件夾。
使用者可以利用手機App或者網(wǎng)頁、單機PC版等方式,將金相圖片導入系統(tǒng),系統(tǒng)將快速識別出該金相的晶粒度等級?!敖鹣嘧R別”的電腦版如圖1所示。
1.5“青銅器識別”系統(tǒng)
目前,已出土的青銅器數(shù)量眾多,讓人們感受到我國傳統(tǒng)文化的悠久歷史和深厚沉淀,其博大精深的思想內(nèi)涵已構(gòu)成我國的民族之魂。但數(shù)量和種類繁多的青銅器也給人們準確識別年代、形制、銘文造成了困擾。目前,傳統(tǒng)的青銅器識別方法主要為專家判斷,當青銅器種類較多時,需要大量專家參與,不僅工作量極大,同時結(jié)果也容易受專家主觀因素的影響[3]。
項目組為宣揚青銅器,幫助更多的人認識古代鑄造文化,設(shè)計了“青銅器識別”系統(tǒng),將需要識別的青銅器分為5個類別,并進行上傳和訓練。人們可以就此識別青銅器形制、紋飾和銘文,并學習青銅器和我國傳統(tǒng)文化相關(guān)知識。圖2為“青銅器識別”手機系統(tǒng)界面,用百度或微信App掃描二維碼,在手機端體驗模型效果。
2 結(jié)語
隨著人工智能技術(shù)的進一步研究,鑄造水平不斷提高,人工智能在鑄造中的應(yīng)用前景更加廣闊。但就目前的情況來看,在現(xiàn)有基礎(chǔ)上拓寬應(yīng)用的范圍和提高應(yīng)用的效果,主要還需在人工智能技術(shù)上作進一步研究。鑄造生產(chǎn)的多變復雜性及操作的人工經(jīng)驗性,使人工智能的應(yīng)用受到限制。此外,一些工藝參數(shù)的定量化實現(xiàn)也不容易,可通過提高鑄造生產(chǎn)的自動化水平、減少人為干預進行解決。隨著技術(shù)的飛速發(fā)展,人工智能技術(shù)也在進一步完善,如多種方法混合技術(shù)、多專家系統(tǒng)技術(shù)、機器學習方法、并行分布處理技術(shù)等目前已引人注目,有效的新型人工智能技術(shù)指日可待,鑄造業(yè)也會有更廣闊的發(fā)展前景。