亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        OCR識(shí)別技術(shù)在鋼結(jié)構(gòu)制造企業(yè)精細(xì)化管理的應(yīng)用

        2023-12-15 07:39:06高天
        中國(guó)信息化 2023年11期
        關(guān)鍵詞:工程圖紙文檔鋼結(jié)構(gòu)

        文|高天

        隨著鋼結(jié)構(gòu)制造企業(yè)的發(fā)展和數(shù)字化轉(zhuǎn)型的不斷深入,大量的圖紙和工程文檔成為企業(yè)管理中不可或缺的一部分。然而,傳統(tǒng)的工程圖紙管理和識(shí)別過(guò)程通常需要耗費(fèi)大量的人力和時(shí)間,且容易出現(xiàn)錯(cuò)誤。因此本文基于OCR識(shí)別技術(shù)將工程圖紙等工程文檔轉(zhuǎn)化為可編輯文本,提供了一種處理大量圖紙的自動(dòng)化技術(shù)方式,從而實(shí)現(xiàn)企業(yè)精細(xì)化管理,提高管理和工作效率。

        一、引言

        (一)鋼結(jié)構(gòu)制造企業(yè)設(shè)計(jì)階段中的信息處理現(xiàn)狀

        鋼結(jié)構(gòu)制造企業(yè)在設(shè)計(jì)階段涉及大量的信息處理,這些信息涵蓋了從項(xiàng)目規(guī)劃到產(chǎn)品制造的各個(gè)方面,其中國(guó)內(nèi)鋼結(jié)構(gòu)制造企業(yè)對(duì)于信息處理仍大量采用人工處理方式,尤其在鋼結(jié)構(gòu)定額信息化管理方面的研究仍處于起步階段。通過(guò)調(diào)研發(fā)現(xiàn)現(xiàn)有鋼結(jié)構(gòu)定額過(guò)程中,材料表的提取是定額計(jì)算的基礎(chǔ),目前主要采用人工統(tǒng)計(jì)完成,存在效率慢、易出錯(cuò)的特點(diǎn)。

        雖然諸多學(xué)者都對(duì)表單的快速提取做了大量研究,但仍有許多關(guān)鍵問(wèn)題亟須解決,如多張材料單的匯總、材料單的正確率提高、材料單解析并發(fā)量的滿足、文檔解析可視化等問(wèn)題。南開(kāi)大學(xué)的尚子峰提出利用OCR技術(shù)實(shí)現(xiàn)基于模板的通用表單處理系統(tǒng),該系統(tǒng)模板以XML文檔形式存放。首先該模型不滿足Excel文檔格式的存儲(chǔ);其次該模型提取表單的正確率較低,約為88%,且不能實(shí)現(xiàn)解析結(jié)果的可視化。國(guó)防科技大學(xué)任通、程江華等人提出基于OCR技術(shù)的電子掃描表格圖像的自動(dòng)識(shí)別算法,提高了識(shí)別的準(zhǔn)確率,但是該方法僅停留在試驗(yàn)環(huán)境,沒(méi)有并發(fā)量的考慮。

        目前鋼結(jié)構(gòu)市場(chǎng)面臨極大的競(jìng)爭(zhēng),精益化管理成了行業(yè)共同關(guān)注的主題,如何快速精準(zhǔn)提取大量工程圖紙中的材料表,提高板材的利用率,提高計(jì)算效率和降低生產(chǎn)成本,是迫切需要解決的問(wèn)題。

        (二)OCR識(shí)別技術(shù)概況及應(yīng)用前景

        OCR技術(shù)是一種將圖像中的文字轉(zhuǎn)換為可編輯、可搜索的電子文本形式的技術(shù)。該技術(shù)在銀行、保險(xiǎn)業(yè)和人工智能領(lǐng)域中得到了廣泛應(yīng)用。銀行和保險(xiǎn)公司利用OCR技術(shù)對(duì)用戶的身份證、銀行卡等證件進(jìn)行識(shí)別并完成相關(guān)操作,提高了業(yè)務(wù)辦理效率和準(zhǔn)確率。在人工智能領(lǐng)域中,OCR技術(shù)能夠提高數(shù)據(jù)的準(zhǔn)確性和處理效率,為機(jī)器學(xué)習(xí)和人工智能提供有力支持。因此利用OCR機(jī)器識(shí)別技術(shù)在鋼結(jié)構(gòu)制造企業(yè)也完全可行,利用OCR機(jī)器學(xué)習(xí)技術(shù)、計(jì)算機(jī)視覺(jué)技術(shù)搭建數(shù)據(jù)解析模型,實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)到結(jié)構(gòu)化功能關(guān)系的建立,完成從數(shù)據(jù)的識(shí)別、解析、抽取、校驗(yàn)、管理等基礎(chǔ)功能組建的材料表智能提取系統(tǒng)。

        二、智能提取材料表系統(tǒng)設(shè)計(jì)

        (一)提取材料表的研究方法

        通過(guò)采用智能解析算法,運(yùn)用OCR機(jī)器學(xué)習(xí)技術(shù)、機(jī)器視覺(jué)技術(shù)實(shí)現(xiàn)PDF文件、圖片、掃描件等非結(jié)構(gòu)化數(shù)據(jù)的批量解析和提取,實(shí)現(xiàn)表單解析可視化,實(shí)現(xiàn)解析結(jié)果的可追溯性。主要研究方法如下:

        圖像處理和分割:對(duì)于圖紙中的材料表,首先需要對(duì)圖紙進(jìn)行圖像處理和分割,將材料表從圖紙中提取出來(lái)。

        區(qū)域檢測(cè)和定位:一旦材料表被提取出來(lái),需要確定表格在圖像中的位置和邊界。

        文字識(shí)別:可以使用OCR技術(shù),將表格中的文字內(nèi)容轉(zhuǎn)化為可編輯的電子文本。表格中可能有不同的字體、符號(hào)、大小和顏色,需要考慮多樣性。

        模型訓(xùn)練與優(yōu)化:基于機(jī)器學(xué)習(xí)的方法,可以構(gòu)建模型來(lái)識(shí)別和提取材料表信息。使用標(biāo)注好的數(shù)據(jù)來(lái)訓(xùn)練模型,不斷優(yōu)化模型的性能。

        規(guī)則引擎:在一些情況下,可以基于規(guī)則引擎來(lái)設(shè)計(jì)規(guī)則,例如識(shí)別特定格式的單元格,以支持特定類型的材料信息提取。

        驗(yàn)證與評(píng)估:在開(kāi)發(fā)好的方法和模型中,使用一些真實(shí)的圖紙數(shù)據(jù),評(píng)估方法的準(zhǔn)確性和效率。

        (二)構(gòu)建智能提取材料清單系統(tǒng)

        該系統(tǒng)主要由非結(jié)構(gòu)化數(shù)據(jù)(PDF文件、圖片)、提取信息系統(tǒng)編程接口、智能解析算法、可視化界面,應(yīng)用功能服務(wù)幾個(gè)部分構(gòu)成,如圖1所示。

        圖1 智能提取材料清單系統(tǒng)構(gòu)成

        針對(duì)存在的多種非結(jié)構(gòu)化數(shù)據(jù)例如自PDF文件、圖片、掃描件等,運(yùn)用OCR機(jī)器學(xué)習(xí)技術(shù)、智能解析算法實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)的批量解析和提取,提取形式見(jiàn)表1。

        表1 非結(jié)構(gòu)化數(shù)據(jù)的抽取形式

        三、OCR識(shí)別技術(shù)在制造企業(yè)圖紙識(shí)別中的應(yīng)用

        (一)鋼橋梁制造企業(yè)OCR技術(shù)訓(xùn)練模型集

        本文旨在提高使用OCR技術(shù)識(shí)別鋼板材料表計(jì)算效率和準(zhǔn)確率,實(shí)現(xiàn)鋼結(jié)構(gòu)的成本精細(xì)化管理。基于深度學(xué)習(xí)的OCR算法,實(shí)現(xiàn)材料表自動(dòng)提取的同時(shí),要根據(jù)材料表文件的不同清晰度,實(shí)現(xiàn)不同范圍的識(shí)別準(zhǔn)確度,確保準(zhǔn)確率,但是考慮到不同設(shè)計(jì)圖的命名規(guī)范問(wèn)題,不能將主要特征作為判定的唯一條件。

        鋼結(jié)構(gòu)制造企業(yè)數(shù)據(jù)主要來(lái)自PDF/JPG等不同格式材料文件,這些設(shè)計(jì)文檔還包括大量其他信息,其中所需要定額的材料表,一般都存在設(shè)計(jì)圖紙中,提供的形式通常為兩種形式:PDF或者紙質(zhì)藍(lán)圖。其中PDF根據(jù)清晰度可以分為三類:AutoCAD直接打印的PDF文件、根據(jù)紙質(zhì)藍(lán)圖掃描成的PDF文件和圖片。

        (二)提取材料表的特征

        為了滿足生產(chǎn)需求,根據(jù)所提供的設(shè)計(jì)文檔,需要提取的圖表主要為材料表,材料表的主要特征為:一是材料表的表格名稱(以下簡(jiǎn)稱表名)主要特征:“XXX材料表”“XXX數(shù)量表”等關(guān)鍵字;二是表格的列字段(以下稱為表頭)包含編號(hào)、規(guī)格、單重、數(shù)量等字段。

        因此,材料表需要提取的內(nèi)容有表格名稱、表格內(nèi)容、規(guī)格列中特殊符號(hào)對(duì)應(yīng)的鋼材類型、頁(yè)碼、梁段名稱等。還要根據(jù)材料表中的小計(jì)、合計(jì)、總重等字段,結(jié)合合并行單元格的特性來(lái)判定匯總數(shù)據(jù)所在的行數(shù),便于進(jìn)行快速核對(duì)。

        (三)實(shí)際應(yīng)用場(chǎng)景

        目前鋼結(jié)構(gòu)制造企業(yè)提取制造數(shù)據(jù)從工程圖紙定位所需要的材料,整理多種轉(zhuǎn)化后的工程圖紙數(shù)字樣式和不同規(guī)格列表格式,因此每次核對(duì)文件通常要上傳成百上千張圖紙。該系統(tǒng)以項(xiàng)目為基礎(chǔ),不同工程圖紙按照項(xiàng)目整合,進(jìn)行OCR集中識(shí)別。系統(tǒng)呈現(xiàn)界面顯示從源文檔中切割的圖片和識(shí)別后結(jié)果的界面,通過(guò)鼠標(biāo)懸浮在指定區(qū)域,進(jìn)行高亮處理,幫助工作人員進(jìn)行線上差錯(cuò)處理,節(jié)約核對(duì)時(shí)間。識(shí)別結(jié)果均為可編輯文檔,包括在線編輯和下載后編輯,經(jīng)測(cè)試該系統(tǒng)識(shí)別準(zhǔn)確率高達(dá)95%以上。圖紙識(shí)別后界面如圖2所示。

        圖2 圖紙識(shí)別后界面

        不同的材料表按照識(shí)別出頁(yè)碼在平臺(tái)內(nèi)進(jìn)行展示,便于工作人員的核對(duì)、計(jì)算、統(tǒng)計(jì)等后續(xù)工作。不同工程圖紙分別保存在各個(gè)項(xiàng)目菜單中,材料信息保存到數(shù)據(jù)庫(kù),按照索引方式進(jìn)行收集,方便員工查閱和追溯。隨著系統(tǒng)數(shù)據(jù)的大量積累,為后續(xù)數(shù)據(jù)分析提供有力支撐,為公司精細(xì)化管理提供路徑。

        (四)提升企業(yè)管理水平

        基于OCR的工程圖紙識(shí)別定額系統(tǒng)主要通過(guò)工作人員進(jìn)行線上數(shù)據(jù)統(tǒng)計(jì),包括材料表提取、核對(duì)和導(dǎo)出,顯著提升了管理水平,主要體現(xiàn)在以下方面:①在自動(dòng)化圖紙?zhí)幚矸矫妫到y(tǒng)可以自動(dòng)完成很多繁瑣的識(shí)別和錄入工作,提高圖紙?zhí)幚淼淖詣?dòng)化水平,節(jié)約時(shí)間和人力資源;②在圖紙版本控制方面,對(duì)圖紙上的版本號(hào)、日期等信息進(jìn)行自動(dòng)識(shí)別,確保使用最新的圖紙版本,避免錯(cuò)誤和混淆;③在快速搜索與檢索方面,將識(shí)別后的圖紙信息存儲(chǔ)到數(shù)據(jù)庫(kù)中,可以實(shí)現(xiàn)快速的文本搜索和檢索功能,使管理團(tuán)隊(duì)能夠迅速找到需要的圖紙和信息。

        四、對(duì)企業(yè)精細(xì)化管理的思考與展望

        (一)對(duì)制造企業(yè)精細(xì)化管理的思考

        通過(guò)進(jìn)一步對(duì)OCR技術(shù)進(jìn)行剖析,發(fā)現(xiàn)企業(yè)精細(xì)化管理可更進(jìn)一步。在數(shù)字化檔案管理方面,通過(guò)OCR技術(shù),圖紙可以從紙質(zhì)文檔轉(zhuǎn)換為電子文本,并且可編輯、可搜索。在減少錯(cuò)誤和質(zhì)量控制方面,可減少手工輸入錯(cuò)誤,提高圖紙?zhí)幚淼臏?zhǔn)確性和質(zhì)量控制水平,有助于預(yù)防錯(cuò)誤和避免潛在風(fēng)險(xiǎn)。通過(guò)將圖紙信息數(shù)字化,可以更好地進(jìn)行知識(shí)管理和傳承,新加入項(xiàng)目員工可以更容易地訪問(wèn)和理解過(guò)去的項(xiàng)目信息,快速融入項(xiàng)目團(tuán)隊(duì)。

        (二)對(duì)制造企業(yè)應(yīng)用的展望

        隨著人工智能和計(jì)算機(jī)視覺(jué)技術(shù)的不斷發(fā)展,未來(lái)的OCR技術(shù)可以拓展到更多應(yīng)用場(chǎng)景,制造企業(yè)可以積極探索和應(yīng)用OCR技術(shù)在不同領(lǐng)域的潛力。OCR技術(shù)可以提供更高的集成性,能夠無(wú)縫連接到企業(yè)的信息系統(tǒng)和生產(chǎn)系統(tǒng)中,這將有助于實(shí)現(xiàn)信息的實(shí)時(shí)共享和協(xié)作,推動(dòng)企業(yè)數(shù)字化轉(zhuǎn)型和智能化發(fā)展。OCR技術(shù)作用于數(shù)據(jù)分析與決策支持層面,通過(guò)線上收集這些數(shù)據(jù)可以用于進(jìn)行數(shù)據(jù)分析和挖掘,為決策提供科學(xué)依據(jù)。制造企業(yè)通常有自己獨(dú)特的業(yè)務(wù)需求,可考慮開(kāi)發(fā)定制化OCR應(yīng)用,以滿足特定場(chǎng)景的生產(chǎn)和管理需求。

        猜你喜歡
        工程圖紙文檔鋼結(jié)構(gòu)
        基于注意力機(jī)制結(jié)合改進(jìn)動(dòng)態(tài)ReLU的輸變電工程圖紙智能評(píng)審方法
        頂推滑移法在鋼結(jié)構(gòu)橋梁施工中的應(yīng)用
        鋼結(jié)構(gòu)防火設(shè)計(jì)規(guī)范及要點(diǎn)探討
        首件鋼結(jié)構(gòu)構(gòu)件確認(rèn)機(jī)制在鋼結(jié)構(gòu)施工中的應(yīng)用
        山東冶金(2022年1期)2022-04-19 13:40:48
        有人一聲不吭向你扔了個(gè)文檔
        一種計(jì)算機(jī)聯(lián)鎖機(jī)柜工程圖紙的自動(dòng)化生成方法
        基于RI碼計(jì)算的Word復(fù)制文檔鑒別
        Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
        建筑工程節(jié)約型施工現(xiàn)場(chǎng)管理體系的應(yīng)用探微
        不讓他人隨意下載Google文檔
        電腦迷(2012年4期)2012-04-29 06:12:13
        国产高潮刺激叫喊视频| 精品国产群3p在线观看| 亚洲Va欧美va国产综合| 91视频88av| 亚洲伊人免费综合网站| 91麻豆精品一区二区三区| 国产麻豆极品高清另类| 久久精品免费中文字幕| 亚洲成在人网站av天堂| 国产精品麻豆成人av电影艾秋| 无码人妻一区二区三区免费| 国产成人亚洲欧美三区综合| 亚洲av中文字字幕乱码软件 | 就国产av一区二区三区天堂| 国产av天堂亚洲国产av麻豆| 日本一区二区三区在线视频观看| 一区二区精品天堂亚洲av| 亚洲精品有码日本久久久| 美女露出粉嫩小奶头在视频18禁| 亚洲国产欧美在线观看| 美女av一区二区三区| 国产一区二区三区在线观看免费| 亚色中文字幕| 久久亚洲精品一区二区三区| 欧美成人午夜免费影院手机在线看| 国产啪精品视频网站| 国产精品成人嫩妇| 国产精品又黄又爽又色| 成人自慰女黄网站免费大全| 亚洲av无码乱码在线观看裸奔| 色一情一乱一伦一区二区三欧美| 亚洲一二三四五区中文字幕| 成年人干逼视频水好多| 少妇人妻中文字幕hd| 国产主播一区二区三区在线观看 | 亚洲国产日韩综合天堂| 风流老太婆大bbwbbwhd视频| 亚洲中文久久精品无码| 亚洲av无码成人精品区天堂| 国产综合久久久久影院| 国产91久久精品成人看网站|