章喻龍
(中國電力工程顧問集團中南電力設計院有限公司,湖北 武漢 430070)
研究顯示,新的工程圖紙中有超過80%的設計可以通過重用或者修改過去的設計來實現(xiàn)[1]。然而事實上,作為企業(yè)知識財富核心的圖紙卻只會有極少部分被再次利用。其主要原因在于設計人員通常只能通過同事間的口耳相傳以及在檔案館對圖紙逐一查詢的方式來獲取圖紙信息,在短時間內獲取所需圖紙的可能性較低。因而如何提升成品圖紙的利用率進而提升設計企業(yè)生產效率成為一個亟待解決的關鍵問題。文章提出可以通過分三步走的方式來提升圖紙利用效率。首先搭建多維度的圖紙搜索平臺;然后使用機器學習算法將圖紙中非結構化數(shù)據(jù)轉化為結構化數(shù)據(jù)存儲,用于提升圖紙搜索質量;最后搭建圖紙輔助和自動化設計平臺變被動搜索為主動推薦,進一步提升繪圖效率和質量。
根據(jù)公司信息化建設水平,設計企業(yè)可以依次搭建數(shù)字檔案館、項目門戶和電子成品檔案借閱3個模塊,從多個維度對圖紙進行展示和利用。
數(shù)字檔案館模塊通過結構化數(shù)據(jù)的形式記錄所有歸檔圖紙的整編信息,例如歸檔時間、所屬項目、繪制專業(yè)和設計人等,進而提供對已歸檔圖紙基于項目基礎信息的檢索和借閱功能。
項目門戶模塊如圖1所示,以項目地圖的形式對項目進行展示。通過選擇項目是屬于境內還是境外、其所屬省份、工程類別(如火電、新能源、電網(wǎng))以及項目類型(如總承包、設計、勘測)等信息,設計人員可以找到需要的項目的名稱和其詳細信息,點擊項目詳情還可以進一步的關聯(lián)到項目的流程、參與人員名單、涉及專業(yè)、差錯統(tǒng)計情況以及校審意見等信息,并從上述維度查詢到對應圖紙。
圖1 項目地圖
項目門戶模塊的數(shù)據(jù)主要來源于項目從登記開始到立項、啟動、WBS分解、卷冊任務書下達、成品校審、成品出版最后到歸檔的全套流程,是對數(shù)字檔案館模塊的補充。
電子成品檔案借閱模塊[2]如圖2所示,是一個基于Lucene索引技術的圖紙搜索引擎。該模塊提供了圖紙全文檢索和標簽檢索的功能,方便設計人員對圖紙進行借閱和查詢。
圖2 電子成品檔案借閱界面圖
圖紙的全文檢索功能通過三個步驟實現(xiàn):首先通過一個在AutoCAD上二次開發(fā)的文字提取軟件提取DWG上的所有文字信息;然后利用爬蟲軟件搜集這些信息并發(fā)送到索引服務器;最后索引服務器利用分詞工具包對文字進行分詞并制作索引。
標簽式檢索功能則是首先從流程中獲取圖紙的設計階段、所屬專業(yè)以及工程類別等信息;然后通過索引服務器把相關信息制作為圖紙標簽;最后通過流程引擎的標簽選擇界面實現(xiàn)圖紙按照標簽進行查詢的能力。
提升圖紙搜索能力,首先需要挖掘圖紙中的潛在信息。近年來人工智能技術高速發(fā)展,利用深度學習算法實現(xiàn)的文字和圖像識別算法可以有效的提取圖紙信息,提升搜索質量。
2.1.1 文字識別
文字識別是指對包含文字的圖像文件進行分析處理從而獲取文本的過程。該過程一般包括圖像輸入,圖像預處理、文字檢測和文本識別四個步驟[3-4]。
基于開源的通用文本識別工具對于機打、位置相對固定的文字的識別率很高,然而卻存在不善于處理特殊字符識以及不定方向文字的問題[3],因而無法直接應用于實際的生產環(huán)境。因此需要首先利用包含標注了定位信息的圖紙對文字檢測程序進行訓練,提升文字檢測程序的準確度和識別效率;然后再將定位的文本進行分割后發(fā)送給文本識別算法進行轉換,從而實現(xiàn)對圖紙中文字的識別功能。
文字識別算法可以用于識別圖簽關鍵信息、圖紙標注以及對全部文字進行識別。其中圖簽關鍵信息包括圖簽中填寫的項目名稱、項目編號、卷冊編號、圖紙名稱、圖紙編號、設計時間、比例、版本、設計人員姓名、校審人員姓名等信息。圖紙標注信息包括圖元的標注信息(如門窗的大小、型號等)以及其他圖紙內容的說明。全文字識別是指對圖紙當中所有文本進行識別的技術,識別后信息通常用于PDF圖紙的全文檢索。
2.1.2 圖像識別
較為常見的圖像識別技術有圖像分類、目標檢測和實例分割等。近年來,開源的基于深度學習的圖像識別算法例如VGG16、Faster RCNN,YOLO等,因為其易得性、高正確率和近乎實時的識別效率而被較為廣泛的應用在各個生產系統(tǒng)當中[5-6]。
深度學習的算法實現(xiàn)的圖像識別功能的主要難點在于需要大量被標記的圖紙。獲取被標記的圖紙可以通過利用圖紙和項目信息中的結構化數(shù)據(jù)的關聯(lián)關系,使用計算機程序自動化標注的方法實現(xiàn)。例如可以通過數(shù)據(jù)庫中圖紙和設計人員關聯(lián),設計人員又和其所屬專業(yè)關聯(lián)的特性,將圖紙和其專業(yè)進行關聯(lián),從而實現(xiàn)對圖紙所屬專業(yè)的自動化標注工作。還有部分訓練數(shù)據(jù)可以通過開源項目獲得,例如DICE項目[7]就提供了2000個CAD圖元的3D和2D模型,可以用于對圖紙中圖元的識別。
圖像識別算法可以被應用在圖紙分類、圖標識別以及圖元識別等方面。其中圖紙分類是指對圖紙按照其所屬專業(yè)、大小、繪制內容進行分類。圖標識別是指識別圖紙當中參與單位標識等特殊標識。圖元識別是指識別圖像當中有意義的圖紙元素,如墻、窗、梁、柱、樓梯、避雷針等。
在圖紙經過了文字和圖像的識別以后,會挖掘出一系列結構化信息,這些信息將被用來補全缺省以及促進圖紙搜索質量的改進。
2.2.1 補全缺省信息
前文提到數(shù)字檔案館模塊由于開發(fā)時間早,其中有大量圖紙只存在紙質版本,現(xiàn)在需要工作人員對這些圖紙進行掃描,實現(xiàn)其電子版本的二次歸檔。然而二次歸檔,不僅需要掃描圖紙電子版本,還要人工將紙質版本和其電子版本進行關聯(lián)。整個過程費時費力還容易出錯。文字識別,作為檔案工作中的關鍵技術,可以被用來開發(fā)“掃描即歸檔”的功能從而解決這個問題。
實現(xiàn)方法一是批量的對圖紙進行掃描,將其轉化為PDF和JPG格式的文件;二是提交JPG格式的文件,利用訓練好的文字識別工具識別出圖紙當中的項目名稱、圖紙名稱、卷冊編號、設校審批人姓名等基本信息填寫入待歸檔的清單;三是根據(jù)卷冊編號和項目名稱反向查詢出數(shù)字檔案中原始文件的歸檔編號、存放位置等歸檔信息填入清單;四是根據(jù)JPG和PDF的對應關系把PDF文件歸檔到所屬目錄。
2.2.2 提升搜索質量
前文提到過電子成品檔案借閱模塊提供了對所有圖紙的全文檢索功能,但它存在以下幾點不足:一是對于PDF格式圖紙的全文檢索能力缺失;二是圖紙標簽式檢索的維度過少;三是搜索停留在字面檢索的范疇,造成當搜索目標模糊時,無法提供一個較為有效的搜索結果。
PDF格式圖紙不能全文檢索是指部分老圖紙只有PDF格式,無法通過搜索引擎進行索引和查詢。解決該問題,需要四個步驟:將PDF文件轉換為JPG格式,以方便后續(xù)處理;通過文字識別功能讀取圖紙中所有文字信息;通過爬蟲技術將讀取的文字發(fā)送給搜索引擎建立索引。最后搜索引擎使用關鍵詞抽取技術[8-9]進行分析并建立索引。標簽式檢索維度少的問題是指搜索引擎目前只能按照專業(yè)、階段、工程類別三個維度進行查詢。這樣查找到的圖紙范圍太廣,往往還需要針對關鍵字進行二次查找。解決該問題,一方面要整合補全缺省信息后的數(shù)字檔案館模塊和項目門戶模塊中的圖紙標簽,將它們和圖紙通過搜索引擎進行關聯(lián),補充到標簽維度當中;另一方面也可利用已經訓練好的文字和圖像識別功能對圖紙進行數(shù)據(jù)挖掘,進一步提取隱含信息作為關鍵字,進而提升搜索效率。提取隱含信息的方式如下:①利用文字識別功能識別圖紙標注,建立圖紙尺寸大小標簽;②通過圖像識別功能對圖紙圖元進行識別分類,建立圖紙繪制內容標簽;③通過圖標識別功能識別設計單位和圖集標識信息,建立設計單位和圖集標識標簽。
針對搜索目標模糊的情況,一方面需要提供更多的搜索標簽,以便于縮小搜索范圍;另一方面需要利用深度學習和圖紙數(shù)據(jù)庫建立圖紙推薦算法從而實現(xiàn)以圖搜圖。圖紙推薦算法包含特征提取、特征索引、特征分析和特征比對[10-11]四個步驟。其中特征提取是神經網(wǎng)絡對所有圖紙?zhí)崛√卣鲾?shù)據(jù)的過程。特征數(shù)據(jù)可以是結構化的,如工程名稱或者設計單位;也可以是非結構化的,如一個卷積網(wǎng)絡提取出來的表示圖紙?zhí)卣鞯亩嗑S張量。特征索引是將圖紙?zhí)卣鬟M行存儲的過程。特征分析是對輸入圖紙進行分析,提取搜索要素的過程。搜索要素一般會包含如圖紙名稱這樣的圖紙基礎信息,也會包含如卷積特征張量這樣的隱藏信息。有時候,搜索要素還會包含搜索人的專業(yè)或者搜索歷史記錄這樣的極具個人特色的數(shù)據(jù)。特征比對是指通過最近鄰算法或實例推理[12]等手段,將特征分析結果和數(shù)據(jù)庫中圖紙的特征信息進行比對的過程。特征比對時通常會首先使用文字比對,縮小搜索范圍;然后再通過比對圖紙細節(jié)特征,鎖定要搜索的圖紙內容。
在補全缺損信息及完成圖紙推薦算法后,可以實現(xiàn)輔助設計和自動化設計的功能,進一步的提升設計企業(yè)的生產效率。
輔助設計功能是指在繪制圖紙的過程中,根據(jù)圖紙正在繪制的內容,實時進行提示的功能。提示信息可以包含設計的各個方面,如對當前繪制圖元自動的補全;對當前卷冊提供相關專業(yè)類似設計圖紙參考;對設計中存在錯誤的分析等。這些功能實際上雖然只是對圖紙信息和相關應用的整合,但對算法的實時性和準確性提出了更高的要求。
自動化設計是指在需求較為明確的情況下,軟件自動實現(xiàn)對圖紙的設計和繪制的過程。自動化設計功能目前主要應用在建筑的功能性設計[13]領域,實現(xiàn)了在提供房間圖紙的情況下自動化擺放家具到合理位置的功能。其實現(xiàn)方法主要還是通過深度學習算法:首先將設計好的圖紙使用矩形框標注出房間功能以及家具的位置和類型;然后把房間以及房間的門和窗的位置作為輸入,功能性家具的位置和種類作為輸出對圖形分割算法的神經網(wǎng)絡進行訓練;最后利用訓練好的算法對初始房間圖形進行布置。
雖然目前自動化設計功能的應用領域尚較為狹窄,然而因其響應速度快,人工消耗少,智能程度高的特點,將越來越多的被應用在投標招標及工程實施階的各個階段。
本文以本院為例,對圖紙利用方法進行了研究,提出了首先直接利用已有數(shù)據(jù)幫助設計人員在更大范圍、更多維度查找圖紙內容,促進圖紙的再利用;然后利用深度學習算法挖掘圖紙潛在價值,補全缺省信息,提升搜索質量;最后綜合所有數(shù)據(jù)和應用實現(xiàn)輔助化和自動化的設計策略。該策略可以顯著提升設計企業(yè)生產效率,在行業(yè)內極具推廣價值。