文|高天
隨著鋼結(jié)構(gòu)制造企業(yè)的發(fā)展和數(shù)字化轉(zhuǎn)型的不斷深入,大量的圖紙和工程文檔成為企業(yè)管理中不可或缺的一部分。然而,傳統(tǒng)的工程圖紙管理和識(shí)別過(guò)程通常需要耗費(fèi)大量的人力和時(shí)間,且容易出現(xiàn)錯(cuò)誤。因此本文基于OCR識(shí)別技術(shù)將工程圖紙等工程文檔轉(zhuǎn)化為可編輯文本,提供了一種處理大量圖紙的自動(dòng)化技術(shù)方式,從而實(shí)現(xiàn)企業(yè)精細(xì)化管理,提高管理和工作效率。
鋼結(jié)構(gòu)制造企業(yè)在設(shè)計(jì)階段涉及大量的信息處理,這些信息涵蓋了從項(xiàng)目規(guī)劃到產(chǎn)品制造的各個(gè)方面,其中國(guó)內(nèi)鋼結(jié)構(gòu)制造企業(yè)對(duì)于信息處理仍大量采用人工處理方式,尤其在鋼結(jié)構(gòu)定額信息化管理方面的研究仍處于起步階段。通過(guò)調(diào)研發(fā)現(xiàn)現(xiàn)有鋼結(jié)構(gòu)定額過(guò)程中,材料表的提取是定額計(jì)算的基礎(chǔ),目前主要采用人工統(tǒng)計(jì)完成,存在效率慢、易出錯(cuò)的特點(diǎn)。
雖然諸多學(xué)者都對(duì)表單的快速提取做了大量研究,但仍有許多關(guān)鍵問(wèn)題亟須解決,如多張材料單的匯總、材料單的正確率提高、材料單解析并發(fā)量的滿足、文檔解析可視化等問(wèn)題。南開(kāi)大學(xué)的尚子峰提出利用OCR技術(shù)實(shí)現(xiàn)基于模板的通用表單處理系統(tǒng),該系統(tǒng)模板以XML文檔形式存放。首先該模型不滿足Excel文檔格式的存儲(chǔ);其次該模型提取表單的正確率較低,約為88%,且不能實(shí)現(xiàn)解析結(jié)果的可視化。國(guó)防科技大學(xué)任通、程江華等人提出基于OCR技術(shù)的電子掃描表格圖像的自動(dòng)識(shí)別算法,提高了識(shí)別的準(zhǔn)確率,但是該方法僅停留在試驗(yàn)環(huán)境,沒(méi)有并發(fā)量的考慮。
目前鋼結(jié)構(gòu)市場(chǎng)面臨極大的競(jìng)爭(zhēng),精益化管理成了行業(yè)共同關(guān)注的主題,如何快速精準(zhǔn)提取大量工程圖紙中的材料表,提高板材的利用率,提高計(jì)算效率和降低生產(chǎn)成本,是迫切需要解決的問(wèn)題。
OCR技術(shù)是一種將圖像中的文字轉(zhuǎn)換為可編輯、可搜索的電子文本形式的技術(shù)。該技術(shù)在銀行、保險(xiǎn)業(yè)和人工智能領(lǐng)域中得到了廣泛應(yīng)用。銀行和保險(xiǎn)公司利用OCR技術(shù)對(duì)用戶的身份證、銀行卡等證件進(jìn)行識(shí)別并完成相關(guān)操作,提高了業(yè)務(wù)辦理效率和準(zhǔn)確率。在人工智能領(lǐng)域中,OCR技術(shù)能夠提高數(shù)據(jù)的準(zhǔn)確性和處理效率,為機(jī)器學(xué)習(xí)和人工智能提供有力支持。因此利用OCR機(jī)器識(shí)別技術(shù)在鋼結(jié)構(gòu)制造企業(yè)也完全可行,利用OCR機(jī)器學(xué)習(xí)技術(shù)、計(jì)算機(jī)視覺(jué)技術(shù)搭建數(shù)據(jù)解析模型,實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)到結(jié)構(gòu)化功能關(guān)系的建立,完成從數(shù)據(jù)的識(shí)別、解析、抽取、校驗(yàn)、管理等基礎(chǔ)功能組建的材料表智能提取系統(tǒng)。
通過(guò)采用智能解析算法,運(yùn)用OCR機(jī)器學(xué)習(xí)技術(shù)、機(jī)器視覺(jué)技術(shù)實(shí)現(xiàn)PDF文件、圖片、掃描件等非結(jié)構(gòu)化數(shù)據(jù)的批量解析和提取,實(shí)現(xiàn)表單解析可視化,實(shí)現(xiàn)解析結(jié)果的可追溯性。主要研究方法如下:
圖像處理和分割:對(duì)于圖紙中的材料表,首先需要對(duì)圖紙進(jìn)行圖像處理和分割,將材料表從圖紙中提取出來(lái)。
區(qū)域檢測(cè)和定位:一旦材料表被提取出來(lái),需要確定表格在圖像中的位置和邊界。
文字識(shí)別:可以使用OCR技術(shù),將表格中的文字內(nèi)容轉(zhuǎn)化為可編輯的電子文本。表格中可能有不同的字體、符號(hào)、大小和顏色,需要考慮多樣性。
模型訓(xùn)練與優(yōu)化:基于機(jī)器學(xué)習(xí)的方法,可以構(gòu)建模型來(lái)識(shí)別和提取材料表信息。使用標(biāo)注好的數(shù)據(jù)來(lái)訓(xùn)練模型,不斷優(yōu)化模型的性能。
規(guī)則引擎:在一些情況下,可以基于規(guī)則引擎來(lái)設(shè)計(jì)規(guī)則,例如識(shí)別特定格式的單元格,以支持特定類型的材料信息提取。
驗(yàn)證與評(píng)估:在開(kāi)發(fā)好的方法和模型中,使用一些真實(shí)的圖紙數(shù)據(jù),評(píng)估方法的準(zhǔn)確性和效率。
該系統(tǒng)主要由非結(jié)構(gòu)化數(shù)據(jù)(PDF文件、圖片)、提取信息系統(tǒng)編程接口、智能解析算法、可視化界面,應(yīng)用功能服務(wù)幾個(gè)部分構(gòu)成,如圖1所示。
圖1 智能提取材料清單系統(tǒng)構(gòu)成
針對(duì)存在的多種非結(jié)構(gòu)化數(shù)據(jù)例如自PDF文件、圖片、掃描件等,運(yùn)用OCR機(jī)器學(xué)習(xí)技術(shù)、智能解析算法實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)的批量解析和提取,提取形式見(jiàn)表1。
表1 非結(jié)構(gòu)化數(shù)據(jù)的抽取形式
本文旨在提高使用OCR技術(shù)識(shí)別鋼板材料表計(jì)算效率和準(zhǔn)確率,實(shí)現(xiàn)鋼結(jié)構(gòu)的成本精細(xì)化管理。基于深度學(xué)習(xí)的OCR算法,實(shí)現(xiàn)材料表自動(dòng)提取的同時(shí),要根據(jù)材料表文件的不同清晰度,實(shí)現(xiàn)不同范圍的識(shí)別準(zhǔn)確度,確保準(zhǔn)確率,但是考慮到不同設(shè)計(jì)圖的命名規(guī)范問(wèn)題,不能將主要特征作為判定的唯一條件。
鋼結(jié)構(gòu)制造企業(yè)數(shù)據(jù)主要來(lái)自PDF/JPG等不同格式材料文件,這些設(shè)計(jì)文檔還包括大量其他信息,其中所需要定額的材料表,一般都存在設(shè)計(jì)圖紙中,提供的形式通常為兩種形式:PDF或者紙質(zhì)藍(lán)圖。其中PDF根據(jù)清晰度可以分為三類:AutoCAD直接打印的PDF文件、根據(jù)紙質(zhì)藍(lán)圖掃描成的PDF文件和圖片。
為了滿足生產(chǎn)需求,根據(jù)所提供的設(shè)計(jì)文檔,需要提取的圖表主要為材料表,材料表的主要特征為:一是材料表的表格名稱(以下簡(jiǎn)稱表名)主要特征:“XXX材料表”“XXX數(shù)量表”等關(guān)鍵字;二是表格的列字段(以下稱為表頭)包含編號(hào)、規(guī)格、單重、數(shù)量等字段。
因此,材料表需要提取的內(nèi)容有表格名稱、表格內(nèi)容、規(guī)格列中特殊符號(hào)對(duì)應(yīng)的鋼材類型、頁(yè)碼、梁段名稱等。還要根據(jù)材料表中的小計(jì)、合計(jì)、總重等字段,結(jié)合合并行單元格的特性來(lái)判定匯總數(shù)據(jù)所在的行數(shù),便于進(jìn)行快速核對(duì)。
目前鋼結(jié)構(gòu)制造企業(yè)提取制造數(shù)據(jù)從工程圖紙定位所需要的材料,整理多種轉(zhuǎn)化后的工程圖紙數(shù)字樣式和不同規(guī)格列表格式,因此每次核對(duì)文件通常要上傳成百上千張圖紙。該系統(tǒng)以項(xiàng)目為基礎(chǔ),不同工程圖紙按照項(xiàng)目整合,進(jìn)行OCR集中識(shí)別。系統(tǒng)呈現(xiàn)界面顯示從源文檔中切割的圖片和識(shí)別后結(jié)果的界面,通過(guò)鼠標(biāo)懸浮在指定區(qū)域,進(jìn)行高亮處理,幫助工作人員進(jìn)行線上差錯(cuò)處理,節(jié)約核對(duì)時(shí)間。識(shí)別結(jié)果均為可編輯文檔,包括在線編輯和下載后編輯,經(jīng)測(cè)試該系統(tǒng)識(shí)別準(zhǔn)確率高達(dá)95%以上。圖紙識(shí)別后界面如圖2所示。
圖2 圖紙識(shí)別后界面
不同的材料表按照識(shí)別出頁(yè)碼在平臺(tái)內(nèi)進(jìn)行展示,便于工作人員的核對(duì)、計(jì)算、統(tǒng)計(jì)等后續(xù)工作。不同工程圖紙分別保存在各個(gè)項(xiàng)目菜單中,材料信息保存到數(shù)據(jù)庫(kù),按照索引方式進(jìn)行收集,方便員工查閱和追溯。隨著系統(tǒng)數(shù)據(jù)的大量積累,為后續(xù)數(shù)據(jù)分析提供有力支撐,為公司精細(xì)化管理提供路徑。
基于OCR的工程圖紙識(shí)別定額系統(tǒng)主要通過(guò)工作人員進(jìn)行線上數(shù)據(jù)統(tǒng)計(jì),包括材料表提取、核對(duì)和導(dǎo)出,顯著提升了管理水平,主要體現(xiàn)在以下方面:①在自動(dòng)化圖紙?zhí)幚矸矫妫到y(tǒng)可以自動(dòng)完成很多繁瑣的識(shí)別和錄入工作,提高圖紙?zhí)幚淼淖詣?dòng)化水平,節(jié)約時(shí)間和人力資源;②在圖紙版本控制方面,對(duì)圖紙上的版本號(hào)、日期等信息進(jìn)行自動(dòng)識(shí)別,確保使用最新的圖紙版本,避免錯(cuò)誤和混淆;③在快速搜索與檢索方面,將識(shí)別后的圖紙信息存儲(chǔ)到數(shù)據(jù)庫(kù)中,可以實(shí)現(xiàn)快速的文本搜索和檢索功能,使管理團(tuán)隊(duì)能夠迅速找到需要的圖紙和信息。
通過(guò)進(jìn)一步對(duì)OCR技術(shù)進(jìn)行剖析,發(fā)現(xiàn)企業(yè)精細(xì)化管理可更進(jìn)一步。在數(shù)字化檔案管理方面,通過(guò)OCR技術(shù),圖紙可以從紙質(zhì)文檔轉(zhuǎn)換為電子文本,并且可編輯、可搜索。在減少錯(cuò)誤和質(zhì)量控制方面,可減少手工輸入錯(cuò)誤,提高圖紙?zhí)幚淼臏?zhǔn)確性和質(zhì)量控制水平,有助于預(yù)防錯(cuò)誤和避免潛在風(fēng)險(xiǎn)。通過(guò)將圖紙信息數(shù)字化,可以更好地進(jìn)行知識(shí)管理和傳承,新加入項(xiàng)目員工可以更容易地訪問(wèn)和理解過(guò)去的項(xiàng)目信息,快速融入項(xiàng)目團(tuán)隊(duì)。
隨著人工智能和計(jì)算機(jī)視覺(jué)技術(shù)的不斷發(fā)展,未來(lái)的OCR技術(shù)可以拓展到更多應(yīng)用場(chǎng)景,制造企業(yè)可以積極探索和應(yīng)用OCR技術(shù)在不同領(lǐng)域的潛力。OCR技術(shù)可以提供更高的集成性,能夠無(wú)縫連接到企業(yè)的信息系統(tǒng)和生產(chǎn)系統(tǒng)中,這將有助于實(shí)現(xiàn)信息的實(shí)時(shí)共享和協(xié)作,推動(dòng)企業(yè)數(shù)字化轉(zhuǎn)型和智能化發(fā)展。OCR技術(shù)作用于數(shù)據(jù)分析與決策支持層面,通過(guò)線上收集這些數(shù)據(jù)可以用于進(jìn)行數(shù)據(jù)分析和挖掘,為決策提供科學(xué)依據(jù)。制造企業(yè)通常有自己獨(dú)特的業(yè)務(wù)需求,可考慮開(kāi)發(fā)定制化OCR應(yīng)用,以滿足特定場(chǎng)景的生產(chǎn)和管理需求。