李琨 董瑋 馮聯(lián)會 馮聯(lián)會 陳浩然
摘 要:本文研究了圖紙擰緊信息識別技術(shù)在工業(yè)制造中的應(yīng)用,旨在通過對圖紙擰緊工藝信息的提取和識別,實現(xiàn)對擰緊工藝參數(shù)的自動化錄入。本文首先介紹了擰緊信息識別技術(shù)的背景和意義,然后闡述了擰緊信息提取和識別的原理和方法,包括圖像處理、特征提取、模式識別等。最后,通過實驗驗證了該技術(shù)的可行性和優(yōu)越性,并對同類技術(shù)進行了比較分析,為工業(yè)制造領(lǐng)域提供有益的參考和指導(dǎo)。
關(guān)鍵詞:圖紙 擰緊 信息識別 自動化錄入
0 引言
在工業(yè)制造領(lǐng)域,擰緊工藝是確保產(chǎn)品質(zhì)量和穩(wěn)定性的關(guān)鍵環(huán)節(jié)。隨著工業(yè)4.0和智能制造的快速發(fā)展,對于擰緊工藝的質(zhì)量和效率要求越來越高。然而,傳統(tǒng)的人工對照圖紙和手動錄入擰緊信息的方式不僅效率低下,而且容易出錯,已經(jīng)無法滿足現(xiàn)代工業(yè)制造的需求。
為了解決這一問題,本研究將探討圖紙擰緊信息識別技術(shù)的應(yīng)用。該技術(shù)利用圖像處理和模式識別技術(shù),能夠自動提取和識別擰緊工藝信息,從而實現(xiàn)擰緊工藝的自動化錄入。該技術(shù)不僅可以提高編制擰緊工藝文件的效率和準確性,還可以降低人工成本,提高準確率和可靠性。希望本研究能夠為工業(yè)制造領(lǐng)域的智能化發(fā)展提供有益的參考和啟示。
1 圖紙擰緊信息識別技術(shù)
圖紙信息識別可以使用幾種方法來實現(xiàn),包括基于圖像處理的技術(shù)、基于深度學(xué)習的技術(shù)等,下面將對幾種常用的圖紙信息提取和識別技術(shù)進行探討。
1.1 基于圖像處理的技術(shù)
基于圖像處理的技術(shù)是圖紙信息提取和識別最早采用的方法之一。該技術(shù)利用計算機對圖像進行分析、處理,從而提取出圖像中的特征信息[1]。其主要流程包括圖像預(yù)處理、特征提取和模式識別三個階段。
1.1.1 圖像預(yù)處理
圖像預(yù)處理是圖像處理技術(shù)的關(guān)鍵環(huán)節(jié)之一,其目的是去除圖像中的干擾因素,突出擰緊信息的特征[2]。預(yù)處理方法包括灰度化、去噪、二值化和平滑化等。
圖1 圖紙中的擰緊信息數(shù)據(jù)塊
(1)灰度化是將彩色圖像轉(zhuǎn)換為黑白圖像的過程。在圖紙信息識別中,灰度化可以將彩色信息簡化為黑白二值,減少處理復(fù)雜度,同時突出圖像中的線條和形狀等特征。常用的灰度化方法有平均值法、最大值法和加權(quán)平均法等。
(2)去噪是去除圖像中的噪聲,提高圖像質(zhì)量的處理過程。在圖紙信息識別中,由于圖像可能受到拍攝、傳輸?shù)榷喾N因素的影響,會產(chǎn)生噪聲,影響后續(xù)處理的準確性。常用的去噪方法有中值濾波、高斯濾波等。
(3)二值化是將灰度圖像轉(zhuǎn)換為黑白二值圖像的過程。通過設(shè)定閾值,將灰度圖像中的像素點分為黑白兩種狀態(tài),突出圖像中的線條和形狀等特征。常用的二值化方法有全局閾值法和局部閾值法等。
(4)平滑化則是通過濾波等技術(shù)去除圖像中的高頻噪聲,同時保留重要的邊緣和細節(jié)信息。平滑化處理可以采用均值濾波、高斯濾波和中值濾波等。
均值濾波通過將每個像素的值替換為其鄰近像素值的平均值來實現(xiàn)平滑效果。均值濾波對于去除椒鹽噪聲特別有效,但在平滑圖像的同時,可能會導(dǎo)致圖像的邊緣和細節(jié)變得模糊。常用的均值濾波算法包括均值濾波器、高斯濾波器和中值濾波器等。
高斯濾波是一種基于高斯函數(shù)的平滑方法,通過將每個像素的值替換為其周圍像素值的加權(quán)平均值來實現(xiàn)平滑效果。高斯濾波器對于去除椒鹽噪聲和減少圖像中的細節(jié)噪聲非常有效,并且在平滑圖像的同時能夠較好地保留圖像的邊緣和細節(jié)信息。
中值濾波是一種非線性平滑方法,通過將每個像素的值替換為其周圍像素值的中值來實現(xiàn)平滑效果。中值濾波對于去除椒鹽噪聲和去除由異常值引起的噪聲非常有效。與均值濾波相比,中值濾波在平滑圖像的同時能夠更好地保留邊緣和細節(jié)信息,并且在處理隨機噪聲時效果較好。
這些處理方法可以有效地提高圖像的質(zhì)量,減少干擾因素,提高后續(xù)特征提取和模式識別的準確性。
1.1.2 特征提取
特征提取是是整個識別過程中的關(guān)鍵環(huán)節(jié),其目的是從預(yù)處理后的圖像中提取出具有代表性的特征。這些特征可以包括線條的寬度、長度、方向,圖形的形狀、大小等[3-5]。通過提取這些特征,可以將圖紙中的信息轉(zhuǎn)化為計算機能夠理解和處理的數(shù)據(jù),包括螺絲型號、擰緊工具類型、擰緊順序等。特征提取的方法有邊緣檢測、形態(tài)學(xué)處理等。
(1)線條是圖紙中最基本的構(gòu)成元素之一,常用的線條特征提取方法包括Hough變換和輪廓跟蹤等。Hough變換是一種廣泛用于直線和圓檢測的方法,通過將圖像空間轉(zhuǎn)化為參數(shù)空間,實現(xiàn)線條的檢測和提取。輪廓跟蹤是一種基于圖像邊緣的方法,通過跟蹤圖像中的邊緣點,形成線條特征。
(2)形狀特征是圖紙中重要的視覺特征之一,常用的形狀特征提取方法包括矩特征和形狀上下文等。矩特征是一種基于圖像幾何矩的特征描述方法,可以描述圖形的形狀和方向等特征。形狀上下文是一種基于形狀邊界點的特征描述方法,可以用于描述圖形的外觀和結(jié)構(gòu)等特征。
(3)紋理特征是描述圖像中像素點排列方式和分布規(guī)律的特征之一,對于識別圖紙中的材料和質(zhì)感具有重要意義。常用的紋理特征提取方法包括灰度共生矩陣和傅里葉變換等?;叶裙采仃囀且环N基于像素點灰度值的排列和分布的特征描述方法,可以用于描述圖形的紋理特征。傅里葉變換是一種將時域信號轉(zhuǎn)換為頻域信號的方法,可以用于分析圖形的紋理結(jié)構(gòu)和頻率等特征。
這些方法可以有效地提取出圖像中的特征信息,為后續(xù)的模式識別提供可靠的依據(jù)。
1.1.3 模式識別
模式識別是利用提取的特征進行分類和識別的過程。常用的模式識別算法包括支持向量機(SVM)、神經(jīng)網(wǎng)絡(luò)等。這些算法通過訓(xùn)練和學(xué)習,可以將提取的特征與擰緊工藝參數(shù)進行關(guān)聯(lián),從而實現(xiàn)自動識別[6]。模式識別階段的準確性和可靠性取決于特征提取和選擇的方法,以及算法的訓(xùn)練和調(diào)整。
(1)在模式識別階段,首先需要將提取的特征與已知的模式進行匹配。這一過程通常采用相似度匹配的方法,計算提取的特征與已知模式之間的相似度,根據(jù)相似度的大小進行分類和識別。常用的相似度匹配方法包括歐氏距離、余弦相似度等。
(2)分類器是用于分類和識別的算法或模型,需要根據(jù)具體的問題和數(shù)據(jù)來設(shè)計和選擇合適的分類器。常見的分類器包括決策樹、支持向量機、神經(jīng)網(wǎng)絡(luò)等。分類器設(shè)計的好壞直接影響到分類和識別的效果,因此需要仔細選擇和調(diào)整分類器的參數(shù)。
(3)在分類器設(shè)計完成后,需要使用標注的數(shù)據(jù)進行訓(xùn)練和測試,以評估分類器的性能和準確率。訓(xùn)練數(shù)據(jù)用于訓(xùn)練分類器,使其學(xué)會從特征中提取有用的信息并進行分類。測試數(shù)據(jù)用于評估分類器的性能,常用的評估指標包括準確率、召回率、F1值等。
(4)在分類器訓(xùn)練完成后,可能還需要對分類器進行優(yōu)化和調(diào)整,以進一步提高分類和識別的準確率。優(yōu)化和調(diào)整的方法包括參數(shù)調(diào)整、特征選擇、集成學(xué)習等。此外,還可以采用在線學(xué)習或增量學(xué)習的方法,以適應(yīng)不斷變化的圖像數(shù)據(jù)和場景。
1.2 基于深度學(xué)習的技術(shù)
基于深度學(xué)習的技術(shù)是近年來在圖像識別領(lǐng)域取得重大進展的一種方法。深度學(xué)習通過構(gòu)建多層神經(jīng)網(wǎng)絡(luò)來自動學(xué)習圖像中的特征表示,從而避免了手動設(shè)計特征的繁瑣過程。在圖紙信息提取和識別方面,深度學(xué)習技術(shù)可以自動從大量數(shù)據(jù)中學(xué)習擰緊信息的特征表示,提高識別準確率。
1.2.1 卷積神經(jīng)網(wǎng)絡(luò)(CNN)
卷積神經(jīng)網(wǎng)絡(luò)是一種常用的深度學(xué)習模型,適用于圖像處理和識別任務(wù)。CNN通過多個卷積層、池化層和全連接層來自動學(xué)習圖像中的特征表示。在圖紙信息提取和識別中,CNN可以自動提取擰緊信息的相關(guān)特征,并進行分類和識別。CNN具有較強的魯棒性和泛化能力,可以在大量的圖像數(shù)據(jù)中進行訓(xùn)練和學(xué)習,實現(xiàn)高準確率的識別效果[7]。
1.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)
循環(huán)神經(jīng)網(wǎng)絡(luò)是一種適用于序列數(shù)據(jù)處理的深度學(xué)習模型。在圖紙信息提取和識別中,RNN可以用于處理按順序排列的擰緊信息。例如,可以使用RNN對擰緊過程中的時間序列數(shù)據(jù)進行建模和分析,從而提取出擰緊速度、扭矩等關(guān)鍵參數(shù)。RNN通過記憶單元來捕捉序列數(shù)據(jù)中的長期依賴關(guān)系,從而實現(xiàn)準確的識別和預(yù)測。但是,對于一些復(fù)雜的擰緊信息序列,RNN可能會面臨訓(xùn)練難度和過擬合等問題。
1.2.3 遷移學(xué)習
遷移學(xué)習是一種將預(yù)訓(xùn)練模型應(yīng)用于新任務(wù)的深度學(xué)習技術(shù)。在圖紙信息提取和識別中,可以利用遷移學(xué)習將已有的模型應(yīng)用于新的擰緊信息數(shù)據(jù)集上,從而節(jié)省訓(xùn)練時間和計算資源。此外,通過遷移學(xué)習可以將已有的知識遷移到新的應(yīng)用場景中,提高模型的泛化能力。遷移學(xué)習可以利用大規(guī)模的預(yù)訓(xùn)練模型來快速適應(yīng)新任務(wù)的需求,從而實現(xiàn)高效的識別和分類。
2 圖紙擰緊信息識別技術(shù)驗證
我們以工藝文件編制過程中產(chǎn)品圖紙解析場景為實踐。
首先批量上傳圖紙,并在后臺進程中依次進行圖紙預(yù)處理,目的是在不耽誤工藝人員工作時間先一步對圖紙進行解析識別。然后再解析過程中,初篩標注使用的標注線進行初次定位。再根據(jù)標準件的規(guī)范命名規(guī)則,對標注線周圍標準件號進行檢索。
識別到標準件后,對坐標中一定范圍內(nèi)的關(guān)鍵字檢索力矩、角度、監(jiān)控力矩等信息。將標準件號與力矩等信息根據(jù)統(tǒng)一格式進行儲存,等待使用。實現(xiàn)了軟件批量識別圖紙信息,將無規(guī)范格式的數(shù)據(jù)塊統(tǒng)一規(guī)范格式,最后將圖紙識別到的擰緊信息錄入工藝文件制作處理。
3 結(jié)論與未來研究方向
基于圖像處理技術(shù)的優(yōu)點在于其對圖像的形狀、大小、顏色等特征具有較強的適應(yīng)性,可以處理各種類型的圖紙。但是,該技術(shù)的識別準確率受到圖像質(zhì)量、特征提取方法和分類器設(shè)計等因素的影響,需要進行細致的調(diào)整和優(yōu)化。此外,對于一些復(fù)雜的擰緊信息,可能需要手動干預(yù)進行標注和分類,增加了工作量和成本。
基于深度學(xué)習的技術(shù)優(yōu)點在于其可以自動提取高層次的特征,提高識別準確率。此外,深度學(xué)習模型具有較強的泛化能力,可以適應(yīng)各種類型的圖紙和擰緊工藝。但是,深度學(xué)習需要大量的數(shù)據(jù)來進行訓(xùn)練和學(xué)習,對于一些數(shù)據(jù)量較小的場景可能無法達到理想的識別效果。此外,深度學(xué)習模型的訓(xùn)練和調(diào)整需要大量的計算資源和時間成本較高。
結(jié)合多種技術(shù)的優(yōu)勢,可以開發(fā)更加高效、準確的圖紙信息提取和識別方法。例如,可以利用深度學(xué)習技術(shù)來自動提取擰緊信息的特征表示,再利用圖像處理技術(shù)進行分類和識別。加強對于數(shù)據(jù)量較小的場景的研究,探索更加適應(yīng)小樣本學(xué)習的算法和技術(shù),提高深度學(xué)習在圖紙信息提取和識別中的性能。隨著人工智能技術(shù)的發(fā)展,我們需要探索更多的智能算法和模型,將圖紙信息提取和識別技術(shù)推向更高層次的應(yīng)用。
參考文獻
[1]劉孫.面向PDM的工程圖紙離線式識別提取表格信息的研究[D].合肥:合肥工業(yè)大學(xué),2008.
[2]朱建新.工程圖紙的自動輸入和信息處理[J].中國機械工程,1993(4):2.
[3]董玉德.面向工程圖紙離線式表格信息提取與識別方法研究[J].工程圖學(xué)學(xué)報,2009:1.
[4]竹夢圓.通信行業(yè)工程圖紙智能識別與重構(gòu)[J].郵電設(shè)計技術(shù),2023:7.
[5]伊國棟.工程圖紙中標題欄單元信息提取與識別技術(shù)研究[J].中國機械工程,2003:1.
[6]宋曉宇.基于拓撲結(jié)構(gòu)的工程圖紙識別方法[J].沈陽建筑大學(xué)學(xué)報(自然科學(xué)版),2011(27):4.
[7]宋小鴻.工程圖紙的關(guān)鍵信息智能提取技術(shù)[D].北京:北京交通大學(xué),2019.