李冰+毛布+許然
摘 要: 當前設(shè)計的圖像數(shù)據(jù)檢測系統(tǒng)大都依據(jù)特定關(guān)鍵詞完成數(shù)據(jù)檢測,對海量弱關(guān)聯(lián)圖像數(shù)據(jù)的檢測效率和精度較低。為了解決這些問題,設(shè)計基于PMML規(guī)范的海量弱關(guān)聯(lián)圖像數(shù)據(jù)檢測系統(tǒng),其將數(shù)據(jù)檢測算法同PMML標準融合,由表示層、應用服務層和數(shù)據(jù)資源層構(gòu)成。其中應用服務層中的數(shù)據(jù)檢測模塊將形成的檢測模型通過PMML文檔輸出,模型應用模塊通過PMML模型采用自定義的數(shù)據(jù)檢測查詢語言CMQL完成語言檢索,實現(xiàn)海量弱關(guān)聯(lián)圖像數(shù)據(jù)的有效檢測。系統(tǒng)實現(xiàn)部分給出了PMML模型的創(chuàng)建和應用過程。實驗結(jié)果表明,所設(shè)計檢測系統(tǒng)具有較高的檢測性能和較低的虛警率。
關(guān)鍵詞: 海量弱關(guān)聯(lián)圖像數(shù)據(jù); PMML; CMQL; 數(shù)據(jù)檢測系統(tǒng)
中圖分類號: TN911.73?34; TN453 文獻標識碼: A 文章編號: 1004?373X(2017)08?0114?03
Design and implementation of massive weak?correlation image data detection system
LI Bing1, MAO Bu2, XU Ran3
(1. Department of Information Technology, Sichuan Business Vocational College, Chengdu 610091, China;
2. Zigong Radio & TV University, Zigong 643000, China; 3. Zhejiang Sci?Tech University, Hangzhou 310018, China)
Abstract: The currently?designed image data detection systems detect the data mostly according to the specific keywords, and have low detection efficiency and precision for the massive weak?correlation image data. In order to solve these problems, a massive weak?correlation image data detection system based on PMML standard was designed, which fused the data detection algorithm with the PMML standard. The system is composed of the presentation layer, application service layer and data resource layer. The data detection module of the application service layer outputs the formed detection model through the PMML document. The model application module uses the self?defined data to detect the query language CMQL through PMML model for language retrieval, so as to detect the massive weak?correlation image data effectively. The creation and application process of the PMML model is given in the fourth part of this paper. The experimental results indicate that the detection system has high detection performance and low false alarm rate.
Keywords: massive weak?correlation image data; PMML; CMQL; data detection system
隨著現(xiàn)代制造工業(yè)的高速發(fā)展,圖像檢測技術(shù)也快速發(fā)展。圖像檢測技術(shù)在醫(yī)療、軍事、農(nóng)業(yè)等領(lǐng)域具有廣泛的應用價值。但是傳統(tǒng)圖像數(shù)據(jù)檢測方法在較多領(lǐng)域已無法滿足現(xiàn)代制造業(yè)的需求[1?3]。并且以往的圖像數(shù)據(jù)檢測系統(tǒng)大都依據(jù)特定關(guān)鍵詞完成數(shù)據(jù)檢測,對海量弱關(guān)聯(lián)圖像數(shù)據(jù)的檢測效率和精度較低。因此,尋求有效的海量弱關(guān)聯(lián)圖像數(shù)據(jù)檢測方法,具有重要應用意義。
1 海量弱關(guān)聯(lián)圖像數(shù)據(jù)檢測系統(tǒng)
1.1 系統(tǒng)總體結(jié)構(gòu)設(shè)計
本文設(shè)計的基于PMML規(guī)范的海量弱關(guān)聯(lián)圖像數(shù)據(jù)檢測系統(tǒng)[4?6],其將數(shù)據(jù)檢測算法同PMML標準融合,通過組件技術(shù),增強系統(tǒng)的擴展性。該系統(tǒng)使用PMML語言規(guī)范,PMML模型是系統(tǒng)中各模塊間和系統(tǒng)同其他檢測系統(tǒng)間溝通的紐帶。數(shù)據(jù)檢測模塊將形成的檢測模型通過PMML文檔輸出,模型應用模塊通過PMML模型完成語言檢索。系統(tǒng)采用三層架構(gòu),如圖1所示。
1.2 系統(tǒng)基本模塊設(shè)計
(1) 預處理模塊獲取DICOM文件信息以及圖像特征,同時形成數(shù)據(jù)表信息,并對圖像數(shù)據(jù)進行離散化處理。
(2) CTM文件轉(zhuǎn)換部件進行數(shù)據(jù)檢測的數(shù)據(jù)源格式具有多樣化特征,該部件解決了不同數(shù)源格式的差異性,確保為數(shù)據(jù)檢測算法提供統(tǒng)一的數(shù)據(jù)格式。CTM文件轉(zhuǎn)換部件將用戶庫中有價值的數(shù)據(jù)表變換成檢測系統(tǒng)可分析的CTM格式。
(3) CMQL語法解析部件用于對數(shù)據(jù)檢測任務進行設(shè)置。系統(tǒng)中的用戶采用圖形用戶界面GUI表明待檢測的對象,系統(tǒng)則可自主將檢測任務變換成CMQL語句,同時傳遞給CMQL語法解釋部件。該部件對檢測任務中的待檢測對象也就是CTM文件或圖像數(shù)據(jù)表是否存在、檢測算法是否存在和待檢測對象是否滿足檢測算法的需求等進行檢測。如果發(fā)現(xiàn)異常,則將錯誤信息傳輸給用戶。如果檢測對象滿足檢測需求,則將該語句解析成數(shù)據(jù)檢測模塊可分析的參數(shù),并且將參數(shù)反饋給數(shù)據(jù)檢測模塊。
(4) 數(shù)據(jù)檢測模塊是系統(tǒng)的關(guān)鍵模塊,可運行相應的圖像數(shù)據(jù)檢測任務。該模塊采集CMQL語法解析部件反饋的不同檢測參數(shù),再按照檢測參數(shù)選擇合理的檢測算法。也就是檢測算法模塊檢索用戶選擇的檢測算法對應的aass文件或JAR包。如果檢索成功,則將檢索參數(shù)反饋給檢測算法模塊中相關(guān)的類文件。
(5) 數(shù)據(jù)檢測算法模塊,通過哈希映射對圖像數(shù)據(jù)檢測算法進行控制。
2 PMML模型應用框架設(shè)計
2.1 PMML模型的塑造
PMML模型的塑造流程如圖2所示,詳細過程為:
(l) 用戶采用客戶端程序獲取塑造PMML模型需要的數(shù)據(jù)表,采用CTM變換其將數(shù)據(jù)表轉(zhuǎn)換成.cttn文件。
(2) 采集有價值的數(shù)據(jù)集,同時對其進行預操作。
(3) 選擇合理的圖像數(shù)據(jù)檢測算法并設(shè)置其中的參數(shù),并自主產(chǎn)生對應的CMQL語句。
(4) 分析CMQL語句,對弱關(guān)聯(lián)圖像數(shù)據(jù)檢測任務進行分析,同時將檢測任務以及對應的參數(shù)反饋給數(shù)據(jù)檢測模塊。
(5) 完成海量弱關(guān)聯(lián)圖像數(shù)據(jù)的檢測后,將檢測結(jié)果反饋給用戶,同時將系統(tǒng)檢測模型反饋給PMML模塊。
(6) PMML模塊進行模型變換,將檢測模型變換成PMML模型并輸出。
2.2 PMML模型的應用
PMML模型的應用流程如圖3所示,其具體描述如下:
(1) 用戶在客戶端應用程序設(shè)置塑造PMML模型需要的數(shù)據(jù)表,采用CTM變換部件將數(shù)據(jù)表變換成.Ctln文件。
(2) 選擇需要進行預測的數(shù)據(jù)集,同時對數(shù)據(jù)集進行預操作。
(3) 選擇進行海量弱關(guān)聯(lián)圖像數(shù)據(jù)檢測需要的PMML模型。
(4) 系統(tǒng)自主產(chǎn)生相關(guān)的CMQL語句。
(5) 分析CMQL語句,檢測對應的PMML模型能否生成海量弱關(guān)聯(lián)圖像數(shù)據(jù)的檢測任務。
(6) 數(shù)據(jù)檢測模塊將PMML模型作用在用戶選取的數(shù)據(jù)集,同時將弱關(guān)聯(lián)圖像數(shù)據(jù)反饋給用戶,而將模型的應用結(jié)果反饋給數(shù)據(jù)源。
3 實驗分析
為了驗證本文設(shè)計的海量弱關(guān)聯(lián)圖像數(shù)據(jù)檢測系統(tǒng)的有效性,采用實際的AVIRIS高光譜數(shù)據(jù)源進行實驗分析。AVIRIS是通過推掃成像方式的成像光譜儀,在0.3~2.23腳的波長區(qū)間采集224個波長處的空間圖像信息,波長的間隔是8 nm。實驗采用的圖像是某地區(qū)機場的局部區(qū)域,使用的實驗圖像大小是100×100,其中含有30個需要檢測的圖像數(shù)據(jù)。實驗采用的目標圖像如圖4所示。
實驗分別采用本文方法和基于正交子空間的圖像數(shù)據(jù)檢測方法對實驗圖像進行檢測,檢測結(jié)果分別如圖5和圖6所示。
對比分析圖5和圖6的檢測結(jié)果可得,本文方法的檢測性能優(yōu)于基于正交子空間的圖像數(shù)據(jù)檢測方法。因為基于正交子空間的圖像數(shù)據(jù)檢測方法未考慮不同圖像數(shù)據(jù)間的關(guān)聯(lián)性,形成較多的虛警。而本文方法的檢測結(jié)果較為清晰、準確。為了進一步驗證本文方法的優(yōu)越性,將圖像數(shù)據(jù)檢測方法檢測到的目標數(shù)量、目標占據(jù)的像素數(shù)、虛警占據(jù)的像素數(shù)和運算時間四個指標,當成評估本文方法和基于正交子空間的圖像數(shù)據(jù)檢測方法性能的指標。具體的結(jié)果如表1所示。從表1可以看出,本文方法具有較高的目標檢測率和較低的虛警率,比基于正交子空間的圖像數(shù)據(jù)檢測方法的優(yōu)越性好。
系統(tǒng)的圖像數(shù)據(jù)接收特性可以反映不同環(huán)境下的檢測概率和虛警概率間的波動關(guān)系,可對檢測系統(tǒng)進行定量分析。檢測概率為檢測到的實際目標圖像數(shù)據(jù)數(shù)量同地面實際目標圖像數(shù)據(jù)量的比值;虛警概率為檢測到的虛警圖像數(shù)據(jù)量同總體圖像數(shù)據(jù)量的比值。分析檢測到的圖像數(shù)據(jù)是否落入實際目標排列區(qū)域能夠判斷到檢測到的是實際目標還是虛警。本文方法和基于正交子空間的圖像數(shù)據(jù)檢測方法的接收特性曲線如圖7所示。從圖7中能夠看出本文方法的檢測性能和虛警率都優(yōu)于基于正交子空間的圖像數(shù)據(jù)檢測方法,較好地約束了混合圖像像素中背景數(shù)據(jù)對圖像數(shù)據(jù)檢測的干擾。
4 結(jié) 論
為了解決以往的圖像數(shù)據(jù)檢測系統(tǒng)對海量弱關(guān)聯(lián)圖像數(shù)據(jù)存在的檢測效率和精度較低問題。本文設(shè)計基于PMML規(guī)范的海量弱關(guān)聯(lián)圖像數(shù)據(jù)檢測系統(tǒng),其將數(shù)據(jù)檢測算法同PMML標準融合,由表示層、應用服務層和數(shù)據(jù)資源層構(gòu)成。其中應用服務層中的數(shù)據(jù)檢測模塊將形成的檢測模型通過PMML文檔輸出,模型應用模塊通過PMML模型采用自定義的數(shù)據(jù)檢測查詢語言CMQL完成語言檢索,實現(xiàn)海量弱關(guān)聯(lián)圖像數(shù)據(jù)的有效檢測。
參考文獻
[1] 馬亞楠,黃敏,李艷華,等.基于能量信息的毛豆豆莢螟高光譜圖像檢測[J].食品工業(yè)科技,2014,35(14):59?63.
[2] 陳健沛,朱煒湛,蔡志崗.紅外監(jiān)控圖像紅眼檢測與消除[J].現(xiàn)代電子技術(shù),2015,38(17):65?67.
[3] 韓先平.光電經(jīng)緯儀圖像數(shù)據(jù)內(nèi)同步動態(tài)檢測方法[J].自動化技術(shù)與應用,2016,35(2):96?99.
[4] 劉綏美,李鵬飛,張蕾,等.基于稀疏編碼字典學習的疵點檢測[J].西安工程大學學報,2015,29(5):594?599.
[5] 唐天翼,朱長仁,趙和鵬.基于色彩空間變換與異常檢測的多光譜艦船感興趣區(qū)域檢測[J].現(xiàn)代電子技術(shù),2015,38(21):28?31.
[6] 張軍,王勇,郝萬兵.面部彩色圖像特征檢測方法研究[J].軟件導刊,2015,14(9):166?168.