李志榮
摘 ?要: 為解決分類爬蟲對激光圖像數(shù)據(jù)爬取能力有限的問題,設(shè)計基于圖像邊緣形態(tài)的激光打印機自動分類系統(tǒng)。利用分布式自動圖像編程框架,規(guī)范劃分打印機激光電源電路、圖像打印分類模塊的作用范圍,完成自動分類系統(tǒng)的硬件運行環(huán)境搭建。在此基礎(chǔ)上,以激光打印圖像邊緣二值形態(tài)作為約束標(biāo)準(zhǔn),處理打印機自動分類程序的中斷請求,并對邊緣圖像節(jié)點進行通信連接,完成自動分類系統(tǒng)的軟件運行環(huán)境搭建,兩項結(jié)合,實現(xiàn)基于圖像邊緣形態(tài)激光打印機自動分類系統(tǒng)的順利應(yīng)用。模擬運行環(huán)境,設(shè)計對比實驗結(jié)果表明,與普通打印機分類系統(tǒng)相比,應(yīng)用新型自動分類系統(tǒng)后,分類爬蟲對激光圖像數(shù)據(jù)的覆蓋面積超過80%,最短分類響應(yīng)時間縮短至1.8 ms,基礎(chǔ)爬取能力得到有效提升。
關(guān)鍵詞: 邊緣形態(tài); 激光打印機; 自動分類; 編程框架; 電源電路; 二值形態(tài); 程序中斷; 通信連接
中圖分類號: TN02?34; TP391 ? ? ? ? ? ? ? ? ? ?文獻標(biāo)識碼: A ? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)07?0048?04
Laser printer automatic classification system based on image edge morphology
LI Zhirong
(Department of Document Examination Technology, Criminal InvestigationPolice University of China, Shenyang 110035,China)
Abstract:Since the crawler has limited ability to crawl laser image data, a laser printer automatic classification system based on image edge morphology is designed. The function scope of laser power circuit and image printing classification module of printer is standardized and divided by the framework of distributed automatic image programming to build the hardware operation environment of automatic classification system. On this basis, the binary morphologyofthe laser printed image edge is taken as the constraint standard to process the interruption request of the printer automatic classification program, and the communication connection is implemented on the edge image nodes to build the software operation environment of the automatic classification system. The combination of the two realizes the successfulapplication of the automatic classification system of the laser printer based on the image edge morphology. A comparative experiment is designed to simulate the operation environment. The experimental results show that, in comparison with the general printer classification system, after the application of the new automatic classification system, the coverage area of the classification crawler to laser image data exceeds 80% and the shortest classification response time is reduced to about 1.8 ms. The basic crawling ability is effectively improved.
Keywords: edge morphology; laser printer; automatic classification; programming framework; power circuit; binary morphology; program interruption; communication connection
0 ?引 ?言
分類系統(tǒng)是一種常見的具備概念屬性的系統(tǒng)類型,可以按照個體首要特征的不同,將其歸入較為適宜的范疇領(lǐng)域。這種系統(tǒng)操作形式不僅能夠充分挖掘不同個體間的相似性條件,并將其歸入同質(zhì)屬性的群體之中,也可以通過非相似性判定的方式,將區(qū)別個體剔除至群體組織之外[1]。通常情況下,類目劃分是構(gòu)建分類系統(tǒng)最基礎(chǔ)的操作,在劃分過程中所遵守的標(biāo)準(zhǔn)或原則就是待分類體系具備性質(zhì)功能條件。這種類別區(qū)分方式不會造成內(nèi)涵數(shù)據(jù)的交叉重疊,且在面對圖像等抽象數(shù)據(jù)時,也能夠保持較強的劃分準(zhǔn)確性。
近年來,激光圖像打印在網(wǎng)絡(luò)環(huán)境構(gòu)建、結(jié)構(gòu)建筑施工等多個領(lǐng)域都得到了廣泛應(yīng)用。然而普通分類系統(tǒng)只能依靠云平臺統(tǒng)計邊緣節(jié)點的形態(tài)結(jié)構(gòu),并利用Hadoop分布式平臺發(fā)布核心計算機對于激光打印機的輸出需求。但隨著科學(xué)技術(shù)手段的進步,分類爬蟲對于激光圖像數(shù)據(jù)的爬取水平始終不能達到預(yù)期標(biāo)準(zhǔn)。為解決上述問題,在二值形態(tài)、編程框架等軟硬件設(shè)備的支持下,建立一種基于圖像邊緣形態(tài)的新型激光打印機自動分類系統(tǒng),并通過比對實驗的方式,突出該系統(tǒng)的應(yīng)用優(yōu)勢所在。
1 ?激光打印機自動分類系統(tǒng)硬件運行環(huán)境搭建
通過分布式自動圖像編程框架、打印機激光電源電路、圖像打印分類模塊三個設(shè)計環(huán)節(jié),完成新型分類系統(tǒng)的硬件運行環(huán)境搭建。其具體操作流程如下。
1.1 ?分布式自動圖像編程框架設(shè)計
激光打印機自動分類系統(tǒng)的分布式圖像編程框架以Google開發(fā)技術(shù)作為搭建基礎(chǔ),可在大規(guī)模數(shù)據(jù)集并發(fā)的條件下,對待打印的圖像數(shù)據(jù)進行并行處理運算,并將處理結(jié)果以文件包的形式存儲于數(shù)據(jù)庫中,整個框架結(jié)構(gòu)包含Map,Reduce兩個主要組成部分,如圖1所示。分布式圖像編程框架的Map單元具備邊緣節(jié)點讀取輸入功能,可以將待打印的圖像數(shù)據(jù)分成多個小型數(shù)據(jù)塊,以便于后續(xù)硬件執(zhí)行結(jié)構(gòu)的快速檢測連接[2?3]。
分布式圖像編程框架的Reduce單元受到核心計算機與數(shù)據(jù)源CPU的雙重影響,既要配合電源電路的電子輸出要求,也要將待打印圖像的邊緣形態(tài)信息以節(jié)點形式反饋給核心處理結(jié)構(gòu),以保證系統(tǒng)具備良好的執(zhí)行連接速度。
1.2 ?打印機激光電源電路設(shè)計
打印機激光電源電路作為分布式自動圖像編程框架Reduce單元的重要附屬結(jié)構(gòu),以ARM Cortex?M3單片機作為核心搭建設(shè)備。從物理功能角度考慮,打印機激光電源電路降低了圖像邊緣形態(tài)數(shù)據(jù)的回波損耗量,在穩(wěn)定電壓駐波比的前提下,防止分類模塊阻抗電流的快速增長。從執(zhí)行功能角度考慮,打印機激光電源電路采取IC邏輯控制的搭建形式,依靠電機驅(qū)動裝置來滿足ARM Cortex?M3單片機的耗電需求,并通過傳感器首尾相連的方式達到拓撲電路結(jié)構(gòu)的目的[4]。U101,L101,Q101是三個必須的電路傳感器,在打印機激光電源保持1 A額定電流的輸出現(xiàn)狀時,這三個傳感器并聯(lián)的連接方式可使電源轉(zhuǎn)化效率達到95%以上,為網(wǎng)絡(luò)爬蟲爬取激光圖像數(shù)據(jù)提供了有力條件。完整的打印機激光電源電路結(jié)構(gòu)如圖2所示。
1.3 ?圖像打印分類模塊設(shè)計
圖像打印分類模塊主要用于邊緣形態(tài)數(shù)據(jù)模擬,并進行對數(shù)據(jù)打印前的解析與重構(gòu)等多項預(yù)處理工作,為最終信息文本特征輸出做準(zhǔn)備。該模塊搭建主要遵循圖像獲取、信息解析、數(shù)據(jù)標(biāo)記、打印重構(gòu)四個原則。其中,圖像獲取的主要目的是為分類爬蟲提供足量的數(shù)據(jù)源支持,以保證激光打印機能夠從數(shù)據(jù)庫中調(diào)取到適量的本地存儲文件[5?6]。
信息解析利用分類爬蟲對爬取到的圖像邊緣形態(tài)數(shù)據(jù)進行深度判斷,并過濾出激光打印機分類所必須的內(nèi)容文本。數(shù)據(jù)標(biāo)記是系統(tǒng)分類操作中的關(guān)鍵環(huán)節(jié),可以根據(jù)待打印信息的登記請求,對其進行分層處理,以保證后續(xù)自動分類流程的順利完成[7?8]。
打印重構(gòu)是自動分類系統(tǒng)輸出文本建立的末尾環(huán)節(jié),可根據(jù)爬蟲的爬取規(guī)則,模擬出多樣化的圖像邊緣行為信息,并以此滿足系統(tǒng)的自動分類操作需求。具體圖像打印分類模塊的搭建原理如圖3所示。
2 ?激光打印機自動分類系統(tǒng)軟件運行環(huán)境搭建
在硬件運行環(huán)境的支持下,按照計算邊緣二值形態(tài)、程序中斷處理、通信連接的操作流程,完成軟件運行環(huán)境搭建,實現(xiàn)基于圖像邊緣形態(tài)激光打印機自動分類系統(tǒng)的順利運行。
2.1 ?激光打印圖像的邊緣二值形態(tài)計算
邊緣二值形態(tài)系數(shù)是激光打印圖像分類處理的重要參照標(biāo)準(zhǔn),可以為程序中斷處理提供一定的參考依據(jù),也能作為物理條件,直接影響圖像節(jié)點的通信連接質(zhì)量。在硬件分類環(huán)境保持穩(wěn)定運行的前提下,依附于分布式編程框架而存在的打印機激光電源電路和圖像打印分類模塊,會向系統(tǒng)中心計算機傳輸多個波長、頻率均相同的待分類信號,其中不僅包含了系統(tǒng)中現(xiàn)行數(shù)據(jù)的具體數(shù)量,也對相關(guān)單元設(shè)備的連接參數(shù)進行了明確規(guī)定[9]。
設(shè)待分類信號的波長為[λ],頻率為[μ],系統(tǒng)中現(xiàn)行數(shù)據(jù)可達的最高上限數(shù)值為[w],聯(lián)立[λ],[μ],[w],可將中心計算機的處理條件表示為:
[p=1λμ(w-e)2+y(q-t)] (1)
式中:[e]代表系統(tǒng)達到現(xiàn)行數(shù)據(jù)額度時的最小分類誤差量;[y]代表激光打印機的輸出條件;[q],[t]分別代表最大和最小的圖像邊緣信息統(tǒng)計量。
在式(1)的基礎(chǔ)上,設(shè)[u]代表二值形態(tài)系數(shù)的上限邊緣數(shù)值,[i]代表二值形態(tài)系數(shù)的下限邊緣數(shù)值,則激光打印圖像邊緣二值形態(tài)的完整計算過程如下所示:
[d=pf?-∞ujk χ-δdi] (2)
式中:[f]代表邊緣分類條件在原始圖像信息狀態(tài)下的綜合變化量;[j]代表系統(tǒng)自動統(tǒng)計系數(shù);[k]代表標(biāo)準(zhǔn)分類權(quán)限參量;[χ]代表理想邊緣二值的冪次項存在向量;[δ]代表邊緣二值冪次項的最小誤差向量。
2.2 ?打印機自動分類程序的中斷處理
打印機自動分類程序包含串口接收、定時接收兩種主要存在方式。其中,串口接收類型的自動分類程序以打印分類模塊作為輸出單元,以存儲數(shù)據(jù)庫作為結(jié)束單元,在運行過程中,實現(xiàn)了對所有圖像邊緣形態(tài)節(jié)點的定向連接。定時接收類型的自動分類程序以系統(tǒng)核心計算機作為輸出單元,以分類防火墻作為結(jié)束單元,在運行過程中,按照預(yù)定時間設(shè)置條件,開啟激光打印機的執(zhí)行功能[10?11]。按照屬性條件的不同,兩種自動分類程序具備不完全相關(guān)的兩種終端處理流程。
串口接收類型自動分類程序具備兩層中斷節(jié)點:第一層輸出所有已完成分類處理的圖像邊緣形態(tài)數(shù)據(jù);第二層整合剩余數(shù)據(jù)進行完整循環(huán)運行。定時接收類型自動分類程序只具備一層中斷節(jié)點,不論圖像邊緣形態(tài)數(shù)據(jù)是否已完成分類處理,都必須進入完全輸出狀態(tài),以保證后續(xù)節(jié)點通信的順利連接。
完整的分類程序中斷處理流程如圖4所示。
2.3 ?邊緣圖像節(jié)點的通信連接
邊緣圖像節(jié)點通信連接實現(xiàn)了硬件設(shè)備上機位串行接口的初始化操作,為系統(tǒng)分類操作的順利執(zhí)行,提供了有利的物理支持。在初始情況下,打印機激光電源電路、圖像打印分類模塊等硬件設(shè)備只能依附于分布式編程框架,且框架組織會為相關(guān)分類運行組織分配數(shù)量合理的邊緣節(jié)點[12?13]。但隨著系統(tǒng)運行時間的增加,圖像邊緣形態(tài)數(shù)據(jù)總量不斷累積,預(yù)留框架節(jié)點不足以支撐系統(tǒng)的分類需求。
在此情況下,邊緣圖像節(jié)點作為連接補充組織,會在滿足打印機自動分類程序中斷處理需求的前提下,建立物理通信連接,并通過數(shù)據(jù)交互運輸?shù)姆绞剑勾幚淼膱D像邊緣形態(tài)信息得到良性運輸,最終達到激光打印機對系統(tǒng)運行數(shù)據(jù)的自動分類運行需求,詳細通信連接原理如圖5所示。
至此,實現(xiàn)系統(tǒng)軟件運行環(huán)境搭建,結(jié)合硬件設(shè)備運行要求完成基于圖像邊緣形態(tài)的激光打印機自動分類系統(tǒng)搭建。
3 ?實驗結(jié)果與討論
為全面探求基于圖像邊緣形態(tài)激光打印機自動分類系統(tǒng)的應(yīng)用優(yōu)勢,在SWsoft虛擬機環(huán)境下進行對比實驗。將兩臺VM主機的IBM系數(shù)均調(diào)至HOST狀態(tài),其中,實驗組主機為新型自動分類系統(tǒng),對照組主機為普通打印機分類系統(tǒng)。確保其他影響系數(shù)均保持穩(wěn)定,分別記錄實驗組、對照組主機相關(guān)實驗數(shù)據(jù)的變化情況。
3.1 ?實驗參數(shù)設(shè)置
實驗環(huán)境參量及相關(guān)實驗參數(shù)設(shè)置情況如表1所示。
為充分體現(xiàn)實驗的公平性,實驗組、對照組所有環(huán)節(jié)參量及參數(shù)條件始終保持一致。
3.2 ?分類爬蟲對激光圖像數(shù)據(jù)覆蓋面積對比
為得到真實的實驗結(jié)果,本次實驗?zāi)J(rèn)系統(tǒng)內(nèi)數(shù)據(jù)的連接方式為順向連接。在爬蟲爬取因子為0.28的條件下,以100 ms作為實驗時間,分別記錄在該段時間內(nèi),應(yīng)用實驗組、對照組系統(tǒng)后,分類爬蟲對激光圖像數(shù)據(jù)覆蓋面積的變化情況。詳細實驗結(jié)果如圖6所示。
分析圖6可知,在整個實驗過程中,實驗組分類爬蟲對激光圖像數(shù)據(jù)覆蓋面積有3次超過理想極值的機會,在實驗時間接近10 ms時,達到最大值82.36%。對照組分類爬蟲對激光圖像數(shù)據(jù)覆蓋面積沒有超過理想極值的機會,整個實驗過程中的最大值僅能達到58.79%,遠低于實驗組,與理想極值相比下降了16.21%。綜上可知,在爬蟲爬取因子為0.28的條件下,應(yīng)用基于圖像邊緣形態(tài)的激光打印機自動分類系統(tǒng),可在一定程度上促進分類爬蟲覆蓋面積的不斷提升。
3.3 ?分類響應(yīng)時間對比
在打印機響應(yīng)參數(shù)為0.19的條件下,以100 ms作為實驗時間,分別記錄在該段時間內(nèi),應(yīng)用實驗組、對照組系統(tǒng)后分類響應(yīng)時間的變化情況。詳細實驗結(jié)果如表2所示。
分析表2可知,實驗組分類響應(yīng)時間每隔20 ms會出現(xiàn)一次明顯的下降趨勢,但持續(xù)兩次之后逐漸穩(wěn)定為1.8 ms,末尾數(shù)值與初始數(shù)值相比下降了3.7 ms,最大值與理想極值5.5 ms相比下降了2.02 ms。對照組分類響應(yīng)時間在持續(xù)穩(wěn)定后,先不斷下降再開始不斷上升,直至末尾值等于初始值,整個實驗過程中的最大值與理想極值5.5 ms相比,僅僅下降了0.88 ms,但其分類響應(yīng)時間依然遠高于實驗組。綜上可知,在打印機響應(yīng)參數(shù)為0.19的條件下,應(yīng)用基于圖像邊緣形態(tài)的激光打印機自動分類系統(tǒng),可達到降低分類響應(yīng)時間的目的。
4 ?結(jié) ?語
總結(jié)過往使用經(jīng)驗可知,普通打印機分類系統(tǒng)存在分類響應(yīng)時間過長、爬蟲數(shù)據(jù)覆蓋面積有限等弊端。而基于圖像邊緣形態(tài)的激光打印機自動分類系統(tǒng)立足于此類問題,在分布編程框架、通信節(jié)點等軟硬件設(shè)備的支持下,將系統(tǒng)調(diào)節(jié)至最佳運行狀態(tài)。從實用效果來看,新型系統(tǒng)不僅解決了普通系統(tǒng)的遺留問題,也對圖像邊緣形態(tài)二值條件等物理參量進行了統(tǒng)一規(guī)定,具備極強的應(yīng)用價值。
參考文獻
[1] 程魯玉,孟小艷,達新民.關(guān)于果林中果害蟲圖像特征高效分類識別仿真[J].計算機仿真,2018,35(2):425?428.
[2] 王振國,陳宏宇,徐文明.利用DCNN融合特征對遙感圖像進行場景分類[J].電子設(shè)計工程,2018,26(1):189?193.
[3] 吳詩婳,吳一全,周建江.基于NSST和改進數(shù)學(xué)形態(tài)學(xué)的遙感圖像目標(biāo)邊緣提取[J].圖學(xué)學(xué)報,2017,38(4):523?530.
[4] 吳朔媚,韓明,王敬濤.基于多尺度多方向結(jié)構(gòu)元素的形態(tài)學(xué)圖像邊緣檢測算法[J].量子電子學(xué)報,2017,34(3):278?285.
[5] 朱妍妍,左建華,盧繼平,等.基于圖像處理的膠管缺陷在線檢測系統(tǒng)開發(fā)[J].北京理工大學(xué)學(xué)報,2017,37(9):937?941.
[6] 顧雨迪,梁久禎,吳秦,等.基于覆蓋分割和活動輪廓模型的圖像邊緣提取算法[J].數(shù)據(jù)采集與處理,2017,32(5):100?109.
[7] 黃步添,劉琦,何欽銘,等.基于語義嵌入模型與交易信息的智能合約自動分類系統(tǒng)[J].自動化學(xué)報,2017,43(9):1532?1543.
[8] 彭瑩瓊,廖牧鑫,張永紅,等.基于BP神經(jīng)網(wǎng)絡(luò)模型的果實蠅自動分類系統(tǒng)[J].江西農(nóng)業(yè)大學(xué)學(xué)報,2016,38(6):1205?1210.
[9] 段青玲,魏芳芳,張磊,等.基于Web數(shù)據(jù)的農(nóng)業(yè)網(wǎng)絡(luò)信息自動采集與分類系統(tǒng)[J].農(nóng)業(yè)工程學(xué)報,2016,32(12):172?178.
[10] 李建波,房宗啟,紀(jì)全菊,等.基于WPF的三角圖自動識別系統(tǒng)構(gòu)建方法:以土壤質(zhì)地分類系統(tǒng)為例[J].排灌機械工程學(xué)報,2016,34(4):339?345.
[11] 鐘旭東,黃章進,顧乃杰,等.Web文本分類中的標(biāo)簽權(quán)重自動優(yōu)化研究[J].小型微型計算機系統(tǒng),2016,37(5):890?894.
[12] 王繼東,龐文杰.Fisher判別分類法在光伏并網(wǎng)系統(tǒng)穩(wěn)態(tài)電能質(zhì)量評估中的應(yīng)用[J].電力自動化設(shè)備,2017,37(3):50?54.
[13] 馬躍,余騁遠,于碧輝.基于資源簽名與遺傳算法的Hadoop參數(shù)自動調(diào)優(yōu)系統(tǒng)[J].計算機應(yīng)用研究,2017,34(11):3219?3222.