(北京航空航天大學(xué)機械工程及自動化學(xué)院,北京 100191)
在飛機裝配場景中,安裝的復(fù)雜產(chǎn)品多、工藝信息復(fù)雜、可靠性要求高,大部分的飛機系統(tǒng)件采用人工裝配,而人工飛機裝配作業(yè)需要作業(yè)人員記憶大量操作指令[1]。以大型民航客機的航空線纜安裝為例,當前線纜的安裝檢測工作依靠人工識別導(dǎo)線的編碼,每次安裝需要使用計算機在數(shù)據(jù)庫中查詢導(dǎo)線對應(yīng)的連接器孔位,而導(dǎo)線編碼具有字符小、編碼長、數(shù)量多的特點。使用人工識別導(dǎo)線的編碼效率低,而線纜數(shù)量巨大,其裝配效率直接影響整個飛機裝配的效率[2]。
增強現(xiàn)實(Augmented Reality,AR)技術(shù)是將計算機渲染的虛擬信息疊加到現(xiàn)實環(huán)境展現(xiàn)給用戶的一種技術(shù),形成虛實結(jié)合場景的效果。增強現(xiàn)實技術(shù)讓裝配過程的指令可視化,其虛實交互技術(shù)可以將信息疊加在現(xiàn)實場景,簡化工人記憶大量操作指令的過程,工人只需要根據(jù)增強現(xiàn)實設(shè)備上的可視化指令執(zhí)行操作,在狹窄的裝配空間中,可以使用輕便的AR 眼鏡等設(shè)備作為前端,復(fù)雜操作指令將由后端的服務(wù)器生成,使用網(wǎng)絡(luò)連接為增強現(xiàn)實設(shè)備提供智能,自動的可視化輔助裝配。
針對增強現(xiàn)實輔助飛機裝配,世界各國的航空制造公司都進行了嘗試和驗證,美國波音公司的CAUDELL 和MIZELL 首次將AR技術(shù)應(yīng)用到線纜的實際裝配中,在布線系統(tǒng)中將線纜的路徑走向與文字注釋信息等內(nèi)容疊加到布線工人的視野中,以輔助操作工人完成布線任務(wù)[3]。上海交大使用機器視覺的方法,提取航天連接器的特征用于分類識別以提供裝配指導(dǎo)[4]。波音公司通過試驗驗證了使用AR 眼鏡作為輔助可以減輕敷設(shè)線纜工人的操作負擔[5],實時的虛實融合技術(shù)在裝配作業(yè)的訓(xùn)練中也可應(yīng)用[6]。中國商飛上飛公司在支線飛機上試驗了AR輔助線纜裝配[7]。
使用AR 設(shè)備可以解決操作指令可視化的問題,在AR 設(shè)備中手動輸入導(dǎo)線編碼查詢線纜信息較慢,可以使用OCR(光學(xué)字符識別)技術(shù)自動輸入線纜編號。增強現(xiàn)實技術(shù)與OCR 技術(shù)都是感知圖像信息的方法,前者理解圖像中的環(huán)境信息,以將虛擬信息正確疊加在場景圖像中,而OCR 技術(shù)更注重得到圖像中的文字內(nèi)容。光學(xué)字符識別包括兩個過程,即文本探測與文本識別。目前的識別應(yīng)用場景包括圖形文本、場景文本識別兩種,前者在印刷物、視頻字幕應(yīng)用較多,在掃描文本的識別準確率可達99%;后者應(yīng)用于自然場景內(nèi)的文字識別,像路標文本識別、衣服標志識別等[8]。當前的場景光學(xué)字符識別算法往往使用深度卷積神經(jīng)網(wǎng)絡(luò)的方法,而航空線纜中的字符較小,且存在扭曲、印刷模糊的問題,這導(dǎo)致識別結(jié)果準確率不高。
針對使用OCR 準確率不高的情況,可以在3 個方向上提高準確度,使用前處理軟件來提高輸入圖片的質(zhì)量;提高OCR 算法精度;使用后處理方法,將得到的錯誤結(jié)果進行推理糾錯。本文使用后處理方式在線纜編碼識別中以充分利用編碼規(guī)則,建立后處理模型,相對其他方式更加穩(wěn)定,魯棒性更強。
后處理方法是一個輸入序列及必要外部信息以進行推理糾錯得到正確序列的過程,不僅在OCR 后處理[9]有所應(yīng)用,在拼寫糾錯[10]、語音識別[11]、DNA 匹配領(lǐng)域中都有類似的應(yīng)用,在后處理方案中,有基于貝葉斯的噪聲通道方法、基于上下文語義推斷[12],以及機器學(xué)習[13–14]、有限狀態(tài)轉(zhuǎn)換機等方法[15]。當前的后處理技術(shù)主要應(yīng)用于通用文檔數(shù)字化場景[16–18]、日常語音識別中,其使用了語料中的文本關(guān)系,直接用于構(gòu)建線纜編碼糾錯模型難以實現(xiàn)較高的準確率。
線纜編碼糾錯中將輸入的導(dǎo)線編碼轉(zhuǎn)化為正確導(dǎo)線碼的過程,傳統(tǒng)方案使用字符串相似度來進行模糊查找,但是沒有利用編碼數(shù)據(jù)的關(guān)系,準確度不高。使用基于貝葉斯的噪聲通道模型在文本OCR 后處理[19]糾錯中效果顯著,本文中介紹了一種航空線纜編碼糾錯方法,以基于貝葉斯糾錯的噪聲通道模型為基礎(chǔ),為OCR 訓(xùn)練建立不同的字符混淆矩陣作為糾錯排序概率的一部分,同時利用航空線纜的編碼規(guī)則,建立了導(dǎo)線編碼數(shù)據(jù)糾錯流程,與基于云服務(wù)的AR 輔助裝配體系融合,提高系統(tǒng)整體的糾錯準確率。
線纜裝配是一項復(fù)雜且時間較長的工作,裝配過程工人每次安裝線纜都需要查詢當前裝配的線纜對應(yīng)的工藝信息。裝配流程較多,需要滿足各環(huán)節(jié)的基本要求,如布局設(shè)計、敷設(shè)工藝、維修以及檢測等[20]。如果使用增強現(xiàn)實技術(shù)可以將虛擬場景中的裝配信息實時疊加到真實的裝配環(huán)境中,工人無需再進行復(fù)雜的培訓(xùn),比對裝配狀態(tài)更為簡單,提高飛機裝配的數(shù)字化程度,更便于線纜檢查。
本文涉及的線纜裝配主要流程見圖1,通過AR 設(shè)備輔助裝配工人節(jié)約了反復(fù)查詢導(dǎo)線編碼的時間,只需要AR 設(shè)備進行拍照和按照眼前AR 設(shè)備上的信息將導(dǎo)線安裝至正確的孔中。
使用上述AR 輔助裝配流程減少了工作量,將輸入導(dǎo)線編碼的工作轉(zhuǎn)化為拍攝線纜圖片進行OCR 輸入導(dǎo)線編號。但是場景文字識別的準確度并不高,以街景標志識別為例,在法國街道標志文字識別數(shù)據(jù)集上,最高的OCR 識別率為84.2%[21]。由于裝配現(xiàn)場背景復(fù)雜,光照不平衡,線纜文字還會存在隨線纜扭曲,而且印刷模糊等因素都會導(dǎo)致識別準確度不高。圖2顯示了使用愛普生AR 眼鏡BT–350 拍攝的航空線纜使用OCR 引擎識別線纜文字的結(jié)果。
由于導(dǎo)線的字體較小,且會隨導(dǎo)線發(fā)生一定的變形,當前OCR 識別算法往往使用基于深度學(xué)習的方法,而訓(xùn)練樣本圖片中很少有線纜的圖片,算法對線纜編碼的識別并不足夠穩(wěn)定。由圖2可以發(fā)現(xiàn),使用OCR識別導(dǎo)線會產(chǎn)生編碼識別錯誤的情況,但并不是完全錯誤,往往是存在部分錯誤,例如圖2(b)的導(dǎo)線編碼為W6077–27012,但是使用OCR 識別的結(jié)果 為“W607?–247/012”,將“7”識別成為“?”,同時增加了不存在的字符“4”和“/”。這樣的結(jié)果在導(dǎo)線數(shù)據(jù)集合中并不存在,無法得到正確信息,而簡單使用字符串相似度來進行選擇最相似的導(dǎo)線編碼并不能更加智能地選擇最有可能的編碼結(jié)果。例如圖2(c)中的識別結(jié)果為W2208–44009,在當前的數(shù)據(jù)集合中搜索最相似的字符串時會得到W2208–44008 或者W2207–44009這樣的結(jié)果,但是正確的結(jié)果為W2208–34009,所以為了解決AR 輔助線纜裝配中導(dǎo)線編碼識別不準確的問題,需要對識別的結(jié)果進行糾錯,保證裝配較高效率的同時保障準確度。
圖1 AR輔助線纜裝配流程Fig.1 Flow of augmented reality assistant cable assembly
在OCR 后處理過程中,基于貝葉斯的糾錯器是應(yīng)用范圍較為廣泛的一種方法,其利用了貝葉斯概率,通過計算概率最大的字符串候選來得到相對更加準確的推理結(jié)果,具有較好的魯棒性,可擴展性。使用基于貝葉斯的后處理糾錯器可以用在OCR 識別的后處理糾錯,提高準確度,在語音識別的糾錯中也可以應(yīng)用,是一種較為廣泛使用的數(shù)據(jù)糾錯方法。
貝葉斯糾錯方法最初應(yīng)用于貝葉斯拼寫糾錯器,拼寫糾錯器可以對輸入的單詞自動檢查是否存在拼寫錯誤,并對存在錯誤的結(jié)果進行糾正。
貝葉斯拼寫糾錯器利用貝葉斯公式(式(1))計算正確可能性最大的正確的單詞結(jié)果。P(wc|wi)表示在輸入單詞(wi)的情況下經(jīng)過糾正后的單詞(wc)的概率,求出正確拼寫單詞的過程即求最大P(wc|wi)對應(yīng)的wc。由于輸入單詞的概率相同,式(1)可以轉(zhuǎn)化為求P(wi|wc)·P(wc),P(wc)是指該正確的單詞出現(xiàn)概率,往往由輸入的字典經(jīng)過統(tǒng)計得到;P(wi|wc)表示該正確的單詞wc會是輸入單詞為wi的糾錯對象的概率,該概率的計算往往是整個模型的難點。
傳統(tǒng)的貝葉斯糾錯過程中主要有生成候選集合和依照概率排序兩個流程。
(1)生成候選集合。
為了進行數(shù)據(jù)糾錯,首先需要生成可能為正確結(jié)果的候選集,不同的候選集的生成往往有按照編輯距離生成[22]、狀態(tài)轉(zhuǎn)換機方法[23]。由于輸入單詞的結(jié)果存在不同錯誤,可以按照字符編輯距離來生成不同的單詞,字符編輯距離(Levenshtein Distance)是指兩個字符串至少需要多少次編輯才能將一個字符串變成另一個字符串,例如(school,schopl)兩個單詞的轉(zhuǎn)換只需要一次字符替換,字符編輯長度為1。每次字符編輯距離為1 的候選集合中存在替換、刪除、增加3 種生成方式,而編輯長度越大表示兩個字符串相似度越低。狀態(tài)轉(zhuǎn)換機方法是將每一個單詞中的字符都當作一個狀態(tài)機,詞典中所有的單詞都作為有限狀態(tài)機的一條分支,生成候選的過程是在狀態(tài)機中查找序列可能的分支過程。
(2)依照概率排序。
圖2 OCR識別線纜Fig.2 Cable numbers by optical character recognition
在完成候選集合的生成后就需要計算對應(yīng)的概率來得到最佳的匹配結(jié)果,按照編輯距離來生成候選集合,只需要計算每個候選詞的概率,而且由于候選集合是按照不同字符編輯距離生成的,所以在處理中的排序可以先設(shè)定不同編輯距離的權(quán)重,再進行排序。在有限狀態(tài)機的方法中,每一個字符都認為是狀態(tài)圖中的一個節(jié)點,而構(gòu)建有限狀態(tài)機中需要嵌入相應(yīng)的概率作為圖中邊的權(quán)值,排序過程即尋找該有限無環(huán)圖(DAG)中的最小路徑。
兩種方法[22–23]均在OCR 后處理的過程中有應(yīng)用,使用字符編輯距離生成更易于擴展,但是伴隨字符距離的增加,需要計算的候選詞數(shù)量是指數(shù)增長的;使用狀態(tài)機生成候選集合,具有較好的計算效率,且可以處理詞典中不存在的單詞,但是前期需要構(gòu)建有限狀態(tài)轉(zhuǎn)換機,占用大量的存儲,同時還需要設(shè)計較為復(fù)雜的合并分支算法??紤]到航空裝配的高可靠性、線纜編碼的復(fù)雜性,以及處理航空線纜編碼的字符長度并不長,采用字符邊編輯距離方法來生成糾錯器的候選集。
貝葉斯糾錯器噪聲通道模型主要流程見圖3,首先輸入需要修正的字符串,以及存儲所有正確字符串的總詞典,按照不同編輯距離結(jié)果生成可能出現(xiàn)的單詞;再刪除不存在詞典中的字符串,按照概率排序。傳統(tǒng)的貝葉斯糾錯器的概率公式按式(1)計算,即求出最佳匹配項轉(zhuǎn)化為求arg max lgP(wc|wi),不同的字符編輯長度對應(yīng)的概率表示先驗概率P(wi|wc),字符串在數(shù)據(jù)集合中出現(xiàn)頻率作為語言模型概率P(wc)。
上述貝葉斯糾錯模型中僅使用不同字符編輯長度作為先驗概率,無法體現(xiàn)OCR 識別錯誤中的字符相似度,可以使用噪聲通道模型進行OCR 的線纜數(shù)據(jù)糾錯。噪聲通道模型在后處理過程中加入字符錯誤混淆矩陣,錯誤混淆矩陣存儲正確字符識別為錯誤字符概率。在本文中使用帶有不同字符的航空線纜圖片進行識別,可以統(tǒng)計得到字符錯誤的數(shù)量,與錯誤識別的結(jié)果,例如(a →e)字符“a”可能識別為“e”。將錯誤字符結(jié)果頻率與正確字符的頻率一一對應(yīng)可以得到字符混淆矩陣。
式(3)是加入字符混淆矩陣后新的計算公式,P(wi,j|wc,j)為實際字符wc,j是字符wi,j作為輸入的概率;len 為字符的編輯長度,對概率求對數(shù)將相乘轉(zhuǎn)化為相加,便于計算機計算。加入字符錯誤混淆矩陣是為了讓模型對不同的情況自適應(yīng)地調(diào)整權(quán)重,避免相同編輯距離情況下的概率相等問題。在不改變基礎(chǔ)糾錯流程的情況下,只需要更換混淆矩陣的權(quán)重文件就可以實現(xiàn)OCR的數(shù)據(jù)糾錯。
本文采用糾錯算法流程(圖4),以O(shè)CR 的后處理為例,首先輸入導(dǎo)線編碼識別結(jié)果,與存儲導(dǎo)線編碼對應(yīng)所有數(shù)據(jù)集;將OCR 識別結(jié)果在數(shù)據(jù)集中查找,若存在即認為識別結(jié)果可能正確,作為糾正選項的第一位;如果對錯誤結(jié)果生成不同編輯長度的候選集合,對每個集合中的元素查找是否存在數(shù)據(jù)集中,刪除不存在的結(jié)果,算法首先按照字符編輯長度進行分級,再按照字符的錯誤類型給與一定權(quán)重,最后依照式(4)排序??紤]到計算復(fù)雜度,按照不同線號數(shù)據(jù)集中的字母表,提取只包含當前數(shù)據(jù)集中出現(xiàn)的字母(不超過36個),并對每個序列號、線束號最高只進行3 個字符編輯長度內(nèi)的計算,高于3 個認為置信度過低,需要重新進行識別。
圖3 噪聲通道模型主要流程Fig.3 Baseline of the noise channel model
圖4 糾錯流程Fig.4 Error correction process
使用上述流程可以完成大部分的糾錯工作,但是字符編輯距離相同的糾錯結(jié)果概率相近。OCR 識別錯誤存在一些規(guī)律,Nguyen 等[24]試驗了不同語料庫中的OCR 試驗錯誤,發(fā)現(xiàn)77%的OCR 錯誤是編輯距離為1 的錯誤,其中主要的錯誤為字符的替換,即將正確的字符識別為錯誤字符,這與后續(xù)試驗中的錯誤類型相似。在本文構(gòu)建的糾錯模型中,相對應(yīng)的在相同字符編輯距離的候選集合中,優(yōu)先考慮字符替換的情況,其次考慮錯誤類型為缺失的情況。
使用上述糾錯模型可以實現(xiàn)OCR 的后處理糾錯功能,但是考慮到計算復(fù)雜性,只能計算編輯距離在3 以內(nèi)的結(jié)果,且無法解決OCR 識別的錯誤結(jié)果在數(shù)據(jù)集合中存在的“Real-Word”問題。例如識別結(jié)果為W6077–27024,而在需安裝的線纜數(shù)據(jù)庫恰好存在該編碼,但可能是將編碼為W6077–27022 的線纜最后一位數(shù)字2 識別成為4,這種偶然性錯誤是無法避免的,但是可以通過引入上下文關(guān)系,或減少數(shù)據(jù)集合等方式來降低概率。
航空線纜裝配過程中需要安裝大量的導(dǎo)線,為了使航空線纜編碼帶有標識信息,導(dǎo)線上的編碼存在一定的規(guī)律,裝配線纜的過程中,大量導(dǎo)線往往會先綁在一個線束上,一個線束被固定在支架上。圖5顯示了導(dǎo)線編碼往往由3 個部分組成,線束號、線規(guī)號、序列號。線束號表示該導(dǎo)線所在的線束的識別編號,序列號表示線束中的標識號,而線規(guī)號表示線纜的規(guī)格和顏色。
在一個安裝航空連接器導(dǎo)線的流程中,對應(yīng)導(dǎo)線編碼數(shù)據(jù)集合里線束號往往很少,該連接器往往是使用幾個線束中的不同導(dǎo)線,而導(dǎo)線的序列號才是區(qū)分同一線束不同導(dǎo)線的標志。由于線規(guī)號往往用于區(qū)分一線多芯情況下一根航空線纜中不同顏色或規(guī)格的線芯,在實際的線纜編碼中可能會出現(xiàn)省略線規(guī)號的情況。
圖5 傳統(tǒng)飛機線纜編碼規(guī)則Fig.5 Traditional airplane cable coding rules
基于上述規(guī)則,可以先對出現(xiàn)次數(shù)較多的線束號進行糾錯,保證線束號的正確后再對線規(guī)號糾錯,完成后對兩者的集合取交集,得到數(shù)據(jù)集合縮小的序列號糾錯集合,使用較少的數(shù)據(jù)集合可以提高相對的準確率,最后推理得到全部的線纜編碼。圖6展示了線纜數(shù)據(jù)糾錯后處理中的整體流程,完成該線纜的安裝后,更新待安裝的數(shù)據(jù)集合。
圖6 線纜數(shù)據(jù)糾錯后處理流程圖Fig.6 Post-processing flow of cable data error correction
由于在整個系統(tǒng)中,使用改進的糾錯模型后仍舊無法避免“Real-Word”問題,本文在AR 輔助裝配系統(tǒng)級別上,增加了減少“Real-Word”問題的人工矯正環(huán)節(jié),在所有的糾錯候選集合排序完成后,如果概率最高的結(jié)果與概率次高的概率相近,還需要使用識別的圖片,讓裝配工人確認最優(yōu)結(jié)果,保障導(dǎo)線的信息正確,并為后期線纜檢查提供一定的依據(jù)。完成一次線纜裝配后,待安裝的導(dǎo)線數(shù)據(jù)集合相應(yīng)減少一根,伴隨安裝過程進行,最后得到的線纜編碼準確度也會更高。
AR 輔助裝配系統(tǒng)使用增強現(xiàn)實的技術(shù)手段,將裝配大量工裝指令可視化地添加在真實場景,以實現(xiàn)提高裝配效率和數(shù)字化裝配的程度。上海交大提出了一套AR 引導(dǎo)訓(xùn)練系統(tǒng)[6],成飛構(gòu)建了基于AR 的液壓裝配智能引導(dǎo)系統(tǒng)[1]??紤]到本系統(tǒng)需要使用不同的智能算法,結(jié)合云服務(wù)的概率,將AR 設(shè)備、數(shù)據(jù)管控服務(wù)器、不同的智能算法服務(wù)作為終端交互層、數(shù)據(jù)邏輯層、服務(wù)層,三者集成一體化為飛機裝配提供智能指導(dǎo),以減少裝配工人的工作量,提高裝配效率。
面向AR 輔助裝配場景的云服務(wù)技術(shù),集成數(shù)據(jù)管控和智能計算、信息化制造技術(shù),為AR 終端提供服務(wù)加速裝配過程。云服務(wù)的提出讓復(fù)雜系統(tǒng)解耦,弱化了不同設(shè)備的區(qū)別,不同的系統(tǒng)只負責相應(yīng)的服務(wù),降低了集成難度,增加大型制造系統(tǒng)的協(xié)同程度。伴隨5G 技術(shù)的逐漸發(fā)展,云服務(wù)將飛機制造的信息虛擬化、數(shù)字化,各部門通過企業(yè)網(wǎng)絡(luò)可隨時隨地按需獲取云制造系統(tǒng)中的各類設(shè)計和生產(chǎn)服務(wù)資源,實現(xiàn)基于流程的跨階段協(xié)同裝配[25]。
利用云服務(wù)的AR 輔助裝配體系結(jié)構(gòu)見圖7,使用AR 眼鏡作為虛實結(jié)合的設(shè)備,也可利用網(wǎng)頁跨平臺地可視化裝配過程;虛擬的場景中的工藝信息由管控數(shù)據(jù)與邏輯的服務(wù)器GrapServer 提供并分發(fā)至不同設(shè)備;而該數(shù)據(jù)管控中心需要利用不同的深度學(xué)習服務(wù)來實現(xiàn)智能感知,與不同的負責深度學(xué)習計算的服務(wù)器相連,負責發(fā)送請求與管控結(jié)果數(shù)據(jù)。
裝配AO 中包含部分裝配信息,如導(dǎo)線的材質(zhì)、顏色、型號、導(dǎo)線和插孔的對應(yīng)關(guān)系。從裝配AO 提取單個連接器需安裝的每根導(dǎo)線對應(yīng)的插孔,以及插孔在連接器型譜圖中的位置,由數(shù)據(jù)管控中心發(fā)送給客戶端。以一根線纜安裝為例,通過服務(wù)器返回的糾錯后的編碼,可以查找到該導(dǎo)線安裝的孔號和對應(yīng)孔號的連接器上的位置,并顯示在AR眼鏡上。
本文采用EPSON 的BT350 眼鏡作為增強現(xiàn)實設(shè)備。EPSON 的AR 眼鏡具有質(zhì)量輕、功能強大、傳感器多的特點,AR 眼鏡端軟件利用Unity3D 軟件作為開發(fā)平臺。Unity3D 可以發(fā)布成眼鏡使用的Android 平臺的軟件,Unity3D內(nèi)部使用C#語言進行開發(fā)。本文的飛機線纜裝配試驗中,使用百度OCR云服務(wù)作為圖像識別的引擎,目前百度OCR 服務(wù)搭載在外網(wǎng)上,但百度可提供私有云部署服務(wù)。數(shù)據(jù)糾錯系統(tǒng)搭載在本地Linux 服務(wù)器上提供數(shù)據(jù)糾錯云服務(wù)。
圖7 基于云服務(wù)的AR輔助系統(tǒng)架構(gòu)圖Fig.7 Cloud-based AR assisted assembly system architecture
為了驗證使用OCR 技術(shù)識別導(dǎo)線加速AR 裝配的準確率,本文構(gòu)造了100 根航空線纜用于線纜編碼識別(圖8),并在Linux 服務(wù)器上搭載數(shù)據(jù)糾錯算法,計算時間約為每條10ms,使用百度OCR 引擎作為字符識別算法。
在試驗中對每一根導(dǎo)線的都拍攝相應(yīng)的RGB 圖片,服務(wù)器接收設(shè)備圖片之后,將設(shè)備圖片轉(zhuǎn)發(fā)到OCR 服務(wù)商處,目前本系統(tǒng)使用的是百度OCR,服務(wù)器先將圖片轉(zhuǎn)發(fā)到百度服務(wù)器處。百度接收圖片后,返回JSON 格式的識別結(jié)果,服務(wù)器端接收識別結(jié)果后解析JSON文件,將文件中的結(jié)果項轉(zhuǎn)發(fā)給AR 眼鏡端,完成編號的識別。試驗結(jié)果顯示100 根導(dǎo)線的安裝過程中,12 根導(dǎo)線發(fā)生OCR 識別錯誤,每根導(dǎo)線的OCR 識別時間為1s 左右,糾錯算法的時間為10ms 左右。在經(jīng)過數(shù)據(jù)糾錯算法后,錯誤的導(dǎo)線下降為兩根,將線纜識別的準確度從88% 提高到了98%。圖9展示試驗中識別錯誤的12 根導(dǎo)線錯誤類型與糾錯后的結(jié)果,可以發(fā)現(xiàn)大部分結(jié)果的編輯長度在2 以內(nèi)。
圖10展示了佩戴AR 眼鏡可以正確識別線纜上的編碼,在AR眼鏡界面中可以實時顯示不同顏色的線纜在連接器上的待安裝線纜的孔號與位置(圖10(b))。
由于OCR 識別的精度已經(jīng)達到88%,為了檢測復(fù)雜輸入錯誤類型時算法結(jié)果,針對不同的錯誤類型建立了不同的OCR 識別輸入情況。表1中對編號為W6077–27038–24BL建立了7 種錯誤類型,并檢測了試驗效果。
圖8 線纜試驗樣本Fig.8 Experimental cable samples
圖9 OCR識別錯誤的結(jié)果與糾錯后的結(jié)果Fig.9 OCR recognition error results and corrected results
圖10 AR輔助裝配飛機線纜Fig.10 AR assistant assembly of aircraft cables
表1 不同輸入情況下的測試結(jié)果Table 1 Test results under different input conditions
試驗結(jié)果顯示,在不同錯誤類型的線纜編碼輸入,大部分可以正確得到概率最大的推理結(jié)果,算法具有一定的魯棒性。
針對大型飛機線纜安裝中裝配現(xiàn)場、線纜安裝指令復(fù)雜、手工輸入線纜編碼效率較低的情況,提出了一套基于云服務(wù)的AR 輔助線纜裝配系統(tǒng),使用OCR 技術(shù)來代替手工輸入導(dǎo)線編號,智能提供線纜裝配可視化指導(dǎo)。為了解決識別精度不高的問題,利用航空線纜編碼規(guī)則建立了基于貝葉斯原理的噪聲通道模型并用于航空線纜糾錯后處理。在AR輔助裝配系統(tǒng)下的線纜識別試驗中,該后處理算法將OCR 識別線纜的準確率由88%提高到98%。該算法不僅可以用于OCR 后處理,同時也可用于語音識別糾錯后的推理糾錯、文檔檢查等場景中。與傳統(tǒng)的工藝對比,基于云服務(wù)的AR 輔助裝配可以有效提高線纜裝配的數(shù)字化可視化水平,云服務(wù)的特點使整個系統(tǒng)便于集成,采用智能的識別導(dǎo)線編碼減輕了裝配的工作強度,縮短了裝配時間,提高了識別的準確率,為航空裝配提供了數(shù)字化的通用技術(shù)方法。