李 震 陳義軍 劉慎洋 張繼堯
(1.軍械工程學院裝備指揮與管理系 石家莊 050003) (2.空軍勤務學院航空彈藥系 徐州 221000)(3.空軍勤務學院航空四站系 徐州 221000)
?
某型測試設(shè)備參數(shù)采集系統(tǒng)設(shè)計與實現(xiàn)*
李震1陳義軍2劉慎洋3張繼堯
(1.軍械工程學院裝備指揮與管理系石家莊050003) (2.空軍勤務學院航空彈藥系徐州221000)(3.空軍勤務學院航空四站系徐州221000)
針對某型引進綜合檢測設(shè)備只輸出檢測結(jié)果,無法記錄檢測參數(shù)具體數(shù)值的問題,綜合采用圖像二值化處理技術(shù)、圖像切分技術(shù)、特征圖像提取技術(shù)等,研制了一套實時識別與記錄檢測參數(shù)的采集識別系統(tǒng),為更好地進行制導彈藥數(shù)質(zhì)量控制提供了技術(shù)基礎(chǔ)。
OCR; 二值化; 特征圖像
Class NumberTP274
隨著我軍制導彈藥種類和數(shù)量的不斷增多,傳統(tǒng)的粗放式航空彈藥管理方法逐漸暴露出不足,對這類性能更先進的彈藥進行精確化、數(shù)字化和信息化管理,能有效提高制導彈藥的質(zhì)量管理水平,成為當前亟待解決的一項重要課題。
某型引進制導彈藥綜合檢測設(shè)備是一套以486工業(yè)計算機為核心的綜合測試系統(tǒng),具有檢測準確率高、自身故障少、采用模塊化設(shè)計便于修理維護等特點,在一線測試崗位廣受歡迎。但該綜合檢測設(shè)備計算機存在軟硬件系統(tǒng)老舊,檢測參數(shù)只能顯示不能儲存,無法完成檢測參數(shù)的收集與整理,對制導彈藥測試關(guān)鍵信息的保留造成障礙。為了解決這一問題,設(shè)計了一套通過VGA視頻特征截取的方式獲取并識別計算機屏幕檢測參數(shù)具體數(shù)值的方法,對利用才檢測設(shè)備獲取相關(guān)檢測參數(shù),深入研究制導彈藥的技術(shù)戰(zhàn)術(shù)狀態(tài)具有十分重要的意義。
2.1OCR技術(shù)流程
光學字符識別(Optical Character Recognition,OCR)的概念是德國科學家Tausheck最先提出來的,其基本含義是將光學文字圖像信息轉(zhuǎn)化為可供計算機識別和處理的文本信息[1]。OCR技術(shù)作為識別領(lǐng)域的一個重要分支,涉及模式識別、圖像處理、數(shù)字信號處理等眾多領(lǐng)域,一般的OCR系統(tǒng)流程如圖1所示。
2.2OCR技術(shù)的不足
經(jīng)過多年的研究和實踐,在高質(zhì)量文本圖像的識別上OCR能取得令人滿意的效果,但在低質(zhì)量文本圖像上OCR還存在較多不足[2],主要表現(xiàn)在:
圖1 OCR技術(shù)流程圖
1) 灰度圖像信息丟失
采用OCR技術(shù)進行文本圖像處理時,首先要對灰度圖像進行二值化轉(zhuǎn)換,而目前的二值化方法對于低質(zhì)量文本圖像難以得到令人滿意的效果,處理過程中難以分辨有效信息和噪音信息,從而造成有效信息的丟失,從而對后續(xù)文本識別造成干擾。
2) 文本區(qū)域切分錯誤
實際識別圖像的文本區(qū)域可能非常不規(guī)整,常用的OCR切分技術(shù)難以對行列傾斜、間距小、字符錯位、重疊字等非常規(guī)文本進行正確的劃分,降低切分的錯誤率,能有效提高整個OCR系統(tǒng)的性能。
3) 特征數(shù)據(jù)提取效率低
由于圖像二值化操作容易造成字符的信息斷裂,同時對噪音信息缺乏有效的抑制手段,使得OCR技術(shù)對有效特征數(shù)據(jù)提取的效率低下,對整體識別造成不利的影響。
3.1系統(tǒng)設(shè)計思路
(5)上級政府管理監(jiān)督與考核。浙江省是我國最早推行“河長制”的發(fā)源地,在落實水污染治理管理責任、開展績效考核方面做了大量有益的探索,積累了寶貴經(jīng)驗。
某型制導彈藥綜合檢測設(shè)備的主要功能是完成制導彈藥技術(shù)性能的檢測,并輸出和打印檢測結(jié)果,采集參數(shù)的研制主要是解決其受計算機性能的限制,不能存儲檢測參數(shù)具體數(shù)值的問題,將數(shù)量較大的檢測參數(shù)實際數(shù)值準確的采集、識別和存儲到指定的數(shù)據(jù)庫結(jié)構(gòu)中。為達到此目的,通過對該彈藥綜合檢測設(shè)備的外觀狀態(tài)和檢測過程進行分析,設(shè)計了一套以圖像采集、圖像序列化處理、特征參數(shù)識別、檢測參數(shù)分析與整理、數(shù)據(jù)標準化存儲等步驟為主體,既不影響和干擾原設(shè)備配置和工作狀態(tài),又能針對性的補充所需要的關(guān)鍵參數(shù)資料,便于制導彈藥技術(shù)檢測人員綜合分析、評估和判斷彈藥的各項性能,更好地做好制導彈藥的數(shù)質(zhì)量控制。
基于OCR識別的綜合檢測設(shè)備參數(shù)采集系統(tǒng)總體設(shè)計思路如圖2所示。
圖2 某型測試設(shè)備參數(shù)采集系統(tǒng)總體設(shè)計思路
圖2中,分屏模塊接收來自原綜合檢測設(shè)備的VGA信號,經(jīng)過無損處理后,輸出兩路VGA信號:一路用于圖像采集模塊采集使用,經(jīng)過OCR數(shù)據(jù)識別模塊識別和整理后,最終形成原始圖像疊加輸出數(shù)據(jù)后輸出到顯示器,另一路為原始視頻信號的復制版,可以無損輸出到顯示器,從而確保了對原有綜合檢測設(shè)備的自身性能與工作狀態(tài)不造成干擾和破壞。
3.2系統(tǒng)組成與交聯(lián)關(guān)系
為了達到對原有綜合檢測設(shè)備的自身性能與工作狀態(tài)不造成干擾和破壞的目的。系統(tǒng)將原有綜合檢測設(shè)備與新添加的采集轉(zhuǎn)錄設(shè)備從設(shè)計上分隔開,在硬件方面,主要增加了分屏模塊、采集插件、采集處理軟件平臺、開關(guān)機設(shè)備等;在軟件方面,主要增加了鍵盤協(xié)議轉(zhuǎn)換模塊、OCR數(shù)據(jù)識別模塊、存儲數(shù)據(jù)庫模塊等。系統(tǒng)軟硬件組成及交聯(lián)關(guān)系如圖3所示。
圖3中,采集處理平臺是系統(tǒng)交聯(lián)的核心,其本身就是一臺簡易計算機系統(tǒng),同時通過外部接口整合了分屏模塊、采集插件、存儲數(shù)據(jù)庫等。開關(guān)機模塊能夠開/關(guān)原設(shè)備電源并采集原設(shè)備運行狀態(tài),如電源指示,硬盤指示等。采集處理平臺采用232接口,通過鍵盤協(xié)議轉(zhuǎn)換模塊與原綜合檢測設(shè)備相連,從而實現(xiàn)了系統(tǒng)整體的互聯(lián)互通與整體控制。
圖3 參數(shù)采集系統(tǒng)與原綜合檢測設(shè)備交聯(lián)關(guān)系
3.3檢測數(shù)據(jù)庫的建立
針對某型制導彈藥綜合檢測設(shè)備輸出數(shù)據(jù)格式,開發(fā)相應的數(shù)據(jù)庫管理模塊,利用數(shù)據(jù)庫系統(tǒng)對識別數(shù)據(jù)進行分類存儲。通過對某型制導彈藥綜合檢測設(shè)備對各類彈藥的檢測數(shù)據(jù)進行分析,確定采集的實時檢測參數(shù)主要存儲以下七個字段:檢測階段、檢測參數(shù)、參數(shù)數(shù)值、參數(shù)上限、參數(shù)下限、參數(shù)單位、參數(shù)物理意義等。
如圖4所示。不同檢測階段、不同檢測參數(shù)的數(shù)值狀態(tài),參數(shù)特征和參數(shù)單位都有所不同,所開發(fā)的數(shù)據(jù)庫管理單元要具有充分的數(shù)值適應性,避免檢測數(shù)據(jù)在存儲過程中因數(shù)據(jù)格式的特異而發(fā)生意外丟失。
圖4 檢測參數(shù)數(shù)據(jù)庫內(nèi)容設(shè)計
某型制導彈藥綜合檢測設(shè)備采用的是微軟公司早期的DOS操作系統(tǒng),檢測過程中既存在英文字符,也包含俄文字符,由于采用的是測試軟件自身特有的字體,這些字符的顯示與普通字體具有顯著的區(qū)別;部分英文與俄文、數(shù)字在該字體下難以辨別,比如英文中的字符“O”,與俄文字符“О”十分相似,與阿拉伯字符“0”也比較雷同,再如英文中的字符“E”,與俄文字符“Е”也大同小異;同時一些提示信息、錯誤信息和告警信息采用的是彈出式顯示方式,該彈出區(qū)域重疊在原有部分圖像之上。這些特征都屬于典型的低文本圖像識別,因此,基于OCR識別的彈藥檢測信息提取必須解決低文本圖像識別存在的不足。
針對OCR低文本圖像識別效率低下的問題,采用高速圖像采集卡實時采集圖像,并針對圖像顯示特征選取較小區(qū)域圖像進行預識別,能有效降低圖像識別的工作量,使圖像采集與識別達到30幀/秒的速度;針對部分相似字符難以辨別的問題,采用“相關(guān)識別法”,給予該字符一個相關(guān)識別標記,即遇到給定的幾個易混淆字符時,同時對其前后字符標記進行判讀,其類型與前后字符相同,此時雖然理論上仍然存在誤識別的可能性,但實際識別過程中能有效避免誤識別的發(fā)生。
4.1采用圖像二值化處理壓縮數(shù)據(jù)
二值化屬于圖像處理中的圖像分割技術(shù),二值圖像具有存儲空間小、便于數(shù)據(jù)壓縮、易于處理等優(yōu)點,圖像二值化處理就是將灰度圖像轉(zhuǎn)化為只有黑和白兩值顏色圖像的過程[3]。進行彈藥綜合檢測設(shè)備的檢測參數(shù)采集,首先要將32位真彩色圖像轉(zhuǎn)換成灰度圖像,然后再對該灰度圖像進行二值化處理,以降低圖像數(shù)據(jù)量,提高OCR識別的效率。
針對某型制導彈藥綜合檢測設(shè)備背景圖像噪音大,邊緣干擾多的特點,可以采用閾值和邊緣檢測相結(jié)合的二值化處理方法。閾值是二值化處理時區(qū)分前景與背景的門閾值,圖像背景和大多數(shù)的噪音信息都可以通過給定閾值的方式消除,采用閾值進行二值化處理時需要根據(jù)檢測設(shè)備采集圖像的具體信息進行多次實驗,確保在不影響有效信息的情況下最大化消除噪音信息。
圖5采集圖像的二值化處理步驟
4.2采用圖像切分提取數(shù)據(jù)
圖像切分就是根據(jù)圖像中字符所占區(qū)域、大小等分割提取出單個字符圖像的過程[4],合理的圖像切分能降低二值化處理的工作量,提高識別效率。某型制導彈藥綜合檢測設(shè)備測試軟件包含的主要是英文字符與俄文字符,英文字符的圖像切分較規(guī)律,采用圖像切分中的“標準切分方法”,給定寬、高和基線位置,能較好地進行OCR識別。俄文字符中由于存在一些較寬的特殊字符(在彈藥檢測軟件中顯示較寬),如“Ж”、“Ы”、“Ю”,標準切分方法已不能滿足需求,根據(jù)彈藥檢測常見字符組合及特征,可以采用“基于識別的圖像切分方法”,首先僅根據(jù)基線和高度生成多個非確定的切分假設(shè),然后識別是否含有這些特殊字符,如果不包含這些特殊字符,則繼續(xù)采用標準切分方法,高效完成采集圖像的劃分;如果通過識別判斷到這些特殊字符,則對該切分假設(shè)進行置信度修正,實際上由于特殊字符較少,且寬度基本相同,置信度修正的工作量也較小,對整體圖形切分的效率影響較小。
由于檢測圖像中檢測參數(shù)及相關(guān)指示性變量都在指定區(qū)域顯示,在進行圖像切分識別匹配時,可以只對參數(shù)及變量顯示區(qū)域進行OCR識別,對其它不需要識別區(qū)域則進行摒棄處理,可以減少70%左右的計算量。對于如何判斷圖像顯示的較大改變,則可以通過特征圖像提取技術(shù)來實現(xiàn)。
4.3采用特征圖像識別技術(shù)定位數(shù)據(jù)
通過對某型制導彈藥綜合檢測設(shè)備檢測圖像進行分析,發(fā)現(xiàn)檢測圖像雖然在不斷變化,但總體限制在幾類畫面之間,同一類畫面也僅大約30%的區(qū)域?qū)儆诳赡茏兓瘏^(qū)域(對判斷和識別檢測參數(shù)有效的區(qū)域)。特征圖像提取技術(shù)就是針對此特點,研究檢測圖像的特征信息,并以此為依據(jù)劃分圖像的有效區(qū)域進行圖像二值化處理和切分處理。
圖6 特征圖像識別示意圖
如圖6所示,具有識別特征1的圖像其識別區(qū)域限制在左邊中部,具有識別特征2的圖像其識別區(qū)域限制在右邊中部,具有識別特征3的圖像其識別區(qū)域限制在中間下部。通過特征圖像識別技術(shù),從檢測畫面中選取具有識別特征標識能力的關(guān)鍵區(qū)域,進行圖像二值化處理和圖像切分,并與預先存儲的模板進行快速匹配,在根據(jù)匹配結(jié)果選擇需識別區(qū)域進行進一步的二值化處理和圖像切分,能減少70%左右的圖像識別任務,有效提高圖像識別的效率。
制導彈藥的數(shù)質(zhì)量控制是當前我軍十分關(guān)注的問題,某型制導彈藥綜合檢測設(shè)備參數(shù)采集系統(tǒng)的研制歷時一年,通過數(shù)據(jù)優(yōu)化識別、特殊字符識別,建立具有指示意義的檢測參數(shù)數(shù)據(jù)庫等技術(shù)改進,為制導彈藥的數(shù)質(zhì)量控制提供了技術(shù)基礎(chǔ),具有十分重要的推廣價值。
[1] 鐘輝,高曉石,牛志成.灰度文檔圖像字符切分方法[J].沈陽建筑大學學報(自然科學版),2006,22(3):483-486.
ZHONG Hui, GAO Xiaoshi, NIU Zhicheng. Character Segmentation Method for Gray Document Image[J]. Journal of Shenyang Jianzhu University(Natural Science),2006,22(3):483-486.
[2] 郭曉宇,平西建,周林.基于連通區(qū)域矩陣的文本圖像識別方法[J].信息工程大學學報,2012,13(3):229-333.
GUO Xiaoyu, PING Xijian, ZHOU Lin. Text Image Recognition Method Based on Connected Area Matrix[J]. Journal of Information Engineering University,2012,13(3):229-333.
[3] 夏開建,夏瑜.基于稀疏表達的圖像文檔二值化技術(shù)仿真研究[J].2013,30(9):221-224.
XIA Kaijian, XIA Yu. Simulation Research of Image Document Two Value Based on Sparse Representation[J].2013,30(9):221-224.
[4] 趙紅燕,劉鵬,李茹,等.多特征文本蘊含識別研究[J].中文信息學報,2014,28(2):109-115.ZHAO Hongyan, LIU Peng, LI Ru, et al. Research on the Identification of Multi Feature Text[J]. Journal of Chinese Information Processing,2014,28(2):109-115.
Design and Implementation of Parameter Collection System for Testing Equipment
LI Zhen1CHEN Yijun2LIU Shenyang3ZHANG Jiyao2
(1. Department of Equipment Command and Management,Ordnance Engineering College, Shijiazhuang050003) (2. Department of Aviation Ammunition, Air Force Logistics College, Xuzhou221000) (3. Department of Aviation Four Station, Air Force Logistics College, Xuzhou221000)
To resolve the problem that import equipment cannot achieve inspect parameters but only the results,the paper develops a collection facility based on binary recognition,image segmentation,feature extraction. All the works provides a better technology foundation for the quantity-quality control of guided ammunition
OCR, binary recognition, feature Image
2016年4月8日,
2016年5月24日
李震,男,講師,研究方向:裝備保障理論與應用。
TP274
10.3969/j.issn.1672-9722.2016.10.050