亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于OCR 深度學習的自動化站點審核方法

        2022-01-06 10:53:52蔡金青
        廣東通信技術 2021年12期
        關鍵詞:關鍵圖紙深度

        [蔡金青]

        1 引言

        隨著通信工程勘察設計數(shù)智化的發(fā)展,勘察設計審核過程逐步引入平臺化流轉(zhuǎn)模式,但是仍舊存在圖紙審核過程為人工審核,人工記錄設計圖紙中的關鍵工程參數(shù)、站點信息。且多以辦公軟件或者小型數(shù)據(jù)庫形式記錄,并與后期勘察設計庫中的信息進行校驗,校驗方法采用辦公軟件公式方法解決。人工審核存在效率低下、工作強度大、易錯等缺點。在后期二階段工程參數(shù)、站點信息數(shù)據(jù)庫過程中也多以數(shù)據(jù)庫校驗方式判斷綜合資管平臺數(shù)據(jù)庫是否存在入庫錯誤等問題。

        本方法通過OCR 深度學習方式提取圖紙關鍵信息,并與平臺勘察設計模塊中人工錄入數(shù)據(jù)、綜合資管平臺數(shù)據(jù)進行自動校驗,大幅提升省端站點信息數(shù)據(jù)審核效率、正確率。

        2 原理概述

        本方法實現(xiàn)原理主要包括圖紙關鍵字識別、OCR(Optical Character Recognition,光學字符識別)深度學習及關鍵字入庫校驗3 個部分。

        圖紙關鍵字識別部分首先將可能在文字的區(qū)域檢測出來,然后再進行識別。本質(zhì)是識別圖片中的文字,即在復雜的圖片背景下對所需目標文字進行識別提取。

        OCR 深度學習針對基站設計圖紙,采用基于AI 訓練的圖片文字識別模型,對識別的文本框坐標進行檢測。該算法結(jié)合了CNN(卷積神經(jīng)網(wǎng)絡)和LSTM(循環(huán)神經(jīng)網(wǎng)絡)的技術,通過CNN 提取深度特征,LSTM 用于序列的特征識別?;贏I 訓練的OCR 模型與調(diào)用在線OCR 接口相結(jié)合處理模式。平臺具體架構如圖1 所示。

        圖1 OCR 深度學習的自動化站點審核平臺架構

        本方法采用對DXF(圖紙格式)的OCR 深度學習,最終自動采集圖紙信息,采用DXF 文件相較于原始DWG文件的好處在于:DXF 是Autodesk 公司開發(fā)的用于AutoCAD 與其它軟件之間進行CAD 數(shù)據(jù)交換的CAD 數(shù)據(jù)文件格式。DXF 是一種開放的矢量數(shù)據(jù)格式,可以分為兩類:ASCII 格式和二進制格式;ASCII 具有可讀性好,但占有空間較大;二進制格式占有空間小、讀取速度快。由于AutoCAD 現(xiàn)在是最流行的CAD 系統(tǒng),DXF 也被廣泛使用,成為事實上的標準。DWG 的來繪圖更直觀(DXF圖紙中線條的相交處都會有個小圓),而用于數(shù)控加工的圖紙則必須是DXF 文件(操作者必須把DWG 轉(zhuǎn)換成DXF 后才可加工)。DXF 是工業(yè)標準格式的一種。

        關鍵字抓取入庫將識別出的工程參數(shù)、站點信息數(shù)據(jù)與平臺存儲的值進行校驗,校驗的結(jié)果會在勘察設計小區(qū)列表中呈現(xiàn)。如果信息不一致,可通過系統(tǒng)查看出不一致字段。其中牽涉到工程參數(shù)、站點信息一次校驗、二次校驗流程。具體流程如圖2 所示。

        圖2 OCR 深度學習的自動化站點審核平臺流程

        在時效方面,基于OCR 深度學習的自動化站點審核方法將原有站點審核校驗回填時間由10 min 縮短至20 s(以單站實驗結(jié)果),效率提升97%。隨著站點數(shù)的增加(OCR 圖紙深度學習模塊以多線程并行服務運行,暫時開啟8 線程并行服務),效率值會更進一步提升。

        3 圖紙關鍵字識別

        OCR 深度學習是檢測、識別的基礎。首先將文字的區(qū)域檢測出來,然后再進行識別。本質(zhì)是識別圖片中的文字,即在復雜的圖片背景下對所需目標文字進行識別提取。

        文字識別可應用于許多領域,如閱讀、翻譯、文獻資料的檢索、信件和包裹的分揀、稿件的編輯和校對、大量統(tǒng)計報表和卡片的匯總與分析、銀行支票的處理、商品發(fā)票的統(tǒng)計匯總、商品編碼的識別、商品倉庫的管理,以及水、電、煤氣、房租、人身保險等費用的征收業(yè)務中的大量信用卡片的自動處理和辦公室打字員工作的局部自動化等。以及文檔檢索,各類證件識別,方便用戶快速錄入信息,提高各行各業(yè)的工作效率。

        3.1 文字識別基礎步驟

        (1)文字區(qū)域:檢測存在文字的區(qū)域。

        (2)文字檢測:識別區(qū)域中的文字。

        3.2 文字區(qū)域

        對文字存在區(qū)域的檢測方法,與目標檢測領域的常用檢測方法相當,分為一步和二步二種方法,后續(xù)也可以考慮使用無標記方法對文字區(qū)域進行檢測。

        (1)在文字識別領域,常用的二步方法為快速RCNN,單階段方法。相比之下,前者的精度更好,后者速度更快。

        (2)在文字識別領域,與傳統(tǒng)目標檢測的不同還在于文字的方向、扭曲程度等。

        對于水平文字的檢測。水平文字文本框是規(guī)則的四邊形(4 個自由度),類似于物體檢測。水平文字檢測效果較好的算法為CTPN。

        文本框是不規(guī)則的四邊形,擁有8 個自由度,傾斜文字檢測較好的算法由cvpr2017 提出。一般的檢測套路為:檢測文本框,采用拉東變換、霍夫變換等方法進行文本矯正,通過投影直方圖分割單行文本圖片,對單行文本進行OCR。

        3.3 文字檢測

        文字采用分類模式,可以對字符進行分割后單獨識別,也可以進行序列識別,顯然易見的是,序列識別才是真正有意義的。

        (1)定長文字:各個字符之間是獨立的,需事先選定可預測的序列的最大長度,比較適用于門牌檢測或車牌號碼檢測。

        (2)不定長文字:可以產(chǎn)生任意長度的文字。

        將文字檢測和識別放在一個網(wǎng)絡中進行聯(lián)合訓練,目前主流的兩種模型。

        ①CNN 與RNN/LSTM/GRU 與CTC:卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)與遞歸神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)/長短期記憶神經(jīng)網(wǎng)絡(Long Short-Term Memory,LSTM)/門控循環(huán)單元神經(jīng)網(wǎng)絡(Gated Recurrent Unit,GRU)與時序類分類(Connectionist Temporal Classification,CTC)。

        ②引入注意力機制(CNN+RNN+Attention):其中注意力機制可以分為硬模式和軟模式。其中硬模式能夠直接給出硬定位,通常是直觀展現(xiàn)文字區(qū)域的位置。軟模式通常采用RNN/LSTM/GRU。

        4 OCR 深度學習提取

        將設計圖紙文字提取出來后,拼接為整個文本串,再從文本串中識別提取關鍵字如掛高、天線方位角、電調(diào)下傾角、機械下傾角、經(jīng)緯度等,最后從關鍵字前后識別非中文字符得到對應的關鍵數(shù)據(jù)。并通過文字識別校驗,實現(xiàn)工程參數(shù)、站點信息關鍵核驗功能。

        部分代碼如圖3 所示。

        圖3 文字識別部分關鍵代碼

        具體技術原理及步驟包括3 步。

        (1)設計人員將CAD 圖紙的存儲為更易識別的DXF 格式(DXF 是一種開放的矢量數(shù)據(jù)格式,易解析),并上傳至規(guī)劃審核平臺的勘察設計模塊。

        (2)勘察設計模塊上傳CAD 圖紙的同時,系統(tǒng)會同時啟動OCR 深度學習模塊提取關鍵信息功能,將圖紙中所需的工程參數(shù)、站點信息數(shù)據(jù)自動識別(調(diào)用DXFparser 模塊模糊找出DXF 中需要讀取標記的字段,存儲在內(nèi)存中),并且與勘察設計中人工錄入的參數(shù)信息進行校驗。

        (3)將識別出的工程參數(shù)、站點信息數(shù)據(jù)與平臺存儲的值進行校驗,校驗的結(jié)果會在勘察設計小區(qū)列表中呈現(xiàn)。如果信息不一致,可通過系統(tǒng)查看出不一致字段。

        圖紙中關鍵工程參數(shù)、站點信息如圖4 所示。

        圖4 關鍵工程參數(shù)、站點信息提取

        5 關鍵字入庫校驗

        勘察設計模塊上傳CAD 圖紙的同時,系統(tǒng)會同時啟動啟動OCR 深度學習模塊提取關鍵信息功能,將圖紙中所需的工程參數(shù)、站點信息數(shù)據(jù)自動識別抓取入庫與勘察信息庫進行關鍵信息校驗。具體校驗如圖5 所示。

        圖5 關鍵工程參數(shù)、站點信息入庫

        將識別出的工程參數(shù)、站點信息數(shù)據(jù)與勘察信息庫的值進行校驗,校驗的結(jié)果會在勘察設計小區(qū)列表中呈現(xiàn)。如果信息不一致,可通過系統(tǒng)查看出不一致字段。具體比對如圖6 所示。

        圖6 關鍵工程參數(shù)、站點信息校驗比對

        后期待施工完成入網(wǎng)后,再將關鍵信息與綜合資管平臺進行二次校驗,并保證站點信息全平臺準確唯一。

        6 總結(jié)

        一種基于OCR 深度學習的自動化站點審核方法,該方法通過數(shù)智化手段針對站點圖紙通過OCR 深度學習的方法提取設計圖紙中的關鍵工程參數(shù)、站點信息(掛高、天線方位角、電調(diào)下傾角、機械下傾角、經(jīng)緯度、區(qū)域位置、環(huán)境描述等)入庫。將從圖紙中提取出的站點關鍵工程參數(shù)、站點信息與勘察設計庫中的信息比對以校驗審核設計階段出現(xiàn)的工程參數(shù)、站點信息錯誤,以及后期資管平臺關鍵信息錯誤。

        猜你喜歡
        關鍵圖紙深度
        高考考好是關鍵
        深度理解一元一次方程
        淺談汽車線束產(chǎn)品圖紙管理
        看圖紙
        當代工人(2019年20期)2019-12-13 08:26:11
        深度觀察
        深度觀察
        深度觀察
        獲勝關鍵
        NBA特刊(2014年7期)2014-04-29 00:44:03
        酒店室內(nèi)裝修圖紙深化設計淺析
        河南科技(2014年12期)2014-02-27 14:10:44
        生意無大小,關鍵是怎么做?
        中國商人(2013年1期)2013-12-04 08:52:52
        国产毛片A啊久久久久| 国产精品成人观看视频| 亚洲一区av无码少妇电影| 尤物无码一区| 国产91成人自拍视频| 亚洲 欧美 偷自乱 图片| 久久久久人妻一区精品色欧美 | 久久成人免费电影| 少妇一区二区三区乱码| 一区二区国产av网站| 国产又色又爽又高潮免费视频麻豆| 欧洲熟妇乱xxxxx大屁股7| 精品丝袜国产在线播放| 激情五月天在线观看视频| 国产精品精品自在线拍| 99久久久无码国产aaa精品| 日韩久久无码免费看A| 美女露出奶头扒开内裤的视频| 五月天国产成人av免费观看| 九九热在线视频观看这里只有精品| 亚洲欧洲无码精品ⅤA| 国产黑丝美女办公室激情啪啪 | 97午夜理论片影院在线播放| 亚洲国产18成人中文字幕久久久久无码av | 国产乱子伦一区二区三区| 亚洲网站免费看| 国产精品综合女同人妖| 少妇粉嫩小泬喷水视频| 99精品电影一区二区免费看| 国产精品国产三级国产一地 | 国产中文字幕乱码在线| av一区二区在线免费观看| 久久精品国产只有精品96| 亚洲av乱码中文一区二区三区| 国产免费激情小视频在线观看| 中文字幕一区二区精品视频| 麻豆果冻传媒在线观看| 亚洲AV无码久久精品成人| 丝袜美腿亚洲综合第一页| 日本午夜精品一区二区三区电影| 久久精品国波多野结衣|