鄭春君
(福建省產(chǎn)品質(zhì)量檢驗(yàn)研究院,福建福州,350001)
隨著文檔電子化以及無(wú)紙辦公等理念的深入人心,越來(lái)越多的企業(yè)開(kāi)始將檔案、資料、圖文、票據(jù)、等文檔經(jīng)過(guò)數(shù)字化處理后保存至計(jì)算機(jī)或存儲(chǔ)設(shè)備,此舉不僅解決了大量文檔的歸類、保存和使用問(wèn)題,也更加便于信息共享與流通,大大提高了商務(wù)領(lǐng)域的辦公和服務(wù)效率。然而傳統(tǒng)的低端文檔影像采集設(shè)備存在著速度慢、能耗高、體積龐大、易出現(xiàn)機(jī)械故障等原因,無(wú)法真正提高工作效率,嚴(yán)重影響了文檔數(shù)字化的進(jìn)程。文檔拍攝儀以其專業(yè)的文檔管理、自動(dòng)調(diào)焦拍攝、自適應(yīng)工作環(huán)境光線等特性迎合了追求高效便捷的現(xiàn)代辦公應(yīng)用需求,還相較于傳統(tǒng)的掃描儀展示出了領(lǐng)先的技術(shù)和創(chuàng)新能力。
現(xiàn)如今,文檔拍攝儀企業(yè)如雨后春筍般涌出,國(guó)家已加強(qiáng)了對(duì)文檔拍攝儀的規(guī)范管理,于2019年實(shí)施了GB/T 36473-2018《 信息技術(shù) 文檔拍攝儀通用規(guī)范》。但目前實(shí)驗(yàn)室現(xiàn)有手工儀器操作自動(dòng)化程度仍然不高,工作效率低下。目前實(shí)驗(yàn)室在進(jìn)行文檔拍攝儀性能測(cè)試時(shí)僅能通過(guò)人工控制標(biāo)準(zhǔn)反射光源、標(biāo)準(zhǔn)透射式燈箱、各種符合標(biāo)準(zhǔn)的圖像測(cè)試卡等配件來(lái)進(jìn)行相關(guān)試驗(yàn)參數(shù)的設(shè)定,從而影響了測(cè)試的復(fù)現(xiàn)性和效率。而計(jì)算機(jī)控制軟件可同時(shí)采集色溫、照度等實(shí)時(shí)數(shù)據(jù),存儲(chǔ)空間大,參數(shù)設(shè)置靈活,內(nèi)置的測(cè)試流程將大大優(yōu)化現(xiàn)有的人工手動(dòng)測(cè)試過(guò)程,可大幅減少測(cè)試時(shí)間,同時(shí)增加測(cè)試精度。因此,通過(guò)系統(tǒng)集成改造現(xiàn)有設(shè)備,并引進(jìn)先進(jìn)的自動(dòng)化控制技術(shù),既提高了工作效率,又節(jié)省了設(shè)備升級(jí)的成本,本項(xiàng)目的開(kāi)發(fā)對(duì)同行具有重要的參考價(jià)值。
本項(xiàng)目采用了美國(guó)Imatest公司提供的解決方案。Imatest是一家在圖像質(zhì)量測(cè)試行業(yè)處于全球領(lǐng)導(dǎo)者地位的公司,其提供的軟件和測(cè)試卡為本項(xiàng)目提供了多種測(cè)試模塊,可以通過(guò)使用Visual Studio的MFC工具便捷迅速進(jìn)行界面的編寫(xiě)和模塊的敏捷調(diào)用,從而實(shí)現(xiàn)文檔拍攝儀視覺(jué)性能指標(biāo)的自動(dòng)化測(cè)試。
以往在舊標(biāo)準(zhǔn)中測(cè)試攝像機(jī)基本是采用燈箱加透射式測(cè)試圖的形式。但是這種方法有很多的弊端,例如燈源面積很小,對(duì)于一些攝像機(jī)當(dāng)圖像充滿全屏?xí)r所拍攝的燈箱不在攝像機(jī)井深的范圍內(nèi)。另外透射式燈源色彩無(wú)法模擬真實(shí)的場(chǎng)景。因此本項(xiàng)目中針對(duì)文檔拍攝儀的測(cè)試采用與國(guó)際攝像機(jī)測(cè)試標(biāo)準(zhǔn)接軌的方式,采用反射式的燈源和圖卡,其測(cè)試布置如圖1所示。
圖1 采用反射式燈源的測(cè)試系統(tǒng)
Imatest公司的軟件Imatest IT(工業(yè)測(cè)試)是一組應(yīng)用程序編程接口(API),允許開(kāi)發(fā)人員在自己的定制應(yīng)用程序中訪問(wèn)Imatest圖像質(zhì)量分析工具。Imatest IT包含了16個(gè)可以單獨(dú)調(diào)用的模塊:
圖2 Imatest IT包含了16個(gè)可以單獨(dú)調(diào)用的模塊
文檔拍攝儀的應(yīng)用場(chǎng)景最常見(jiàn)的就是文件檔案等資料翻拍/掃描,比如說(shuō)銀行行業(yè)(可將臨柜的合同、憑證、身份證件寄合同等翻拍進(jìn)行存儲(chǔ)驗(yàn)證)、政務(wù)行業(yè)(可將各類機(jī)關(guān)公文行文以及歷史資料進(jìn)行歸檔存案)、醫(yī)療行業(yè)(可將重要病歷、處方、醫(yī)囑等進(jìn)行翻拍留存)、比如說(shuō)文化行業(yè)(看輕松將裝訂好的期刊雜志、古籍文獻(xiàn)等翻拍保存)。文檔拍攝儀利用了機(jī)器視覺(jué)客服傳統(tǒng)掃描設(shè)備掃描速度慢、不易處理裝訂文件等的缺點(diǎn),還可以利用OCR(Optical Character Recognition,光學(xué)字符識(shí)別)技術(shù)直接將紙質(zhì)文件中的字符從圖像自動(dòng)識(shí)別到字符型式得以保存,代替了人工的手動(dòng)輸入,其識(shí)別速度快而且精度很高。但由于拍攝設(shè)備成像環(huán)境有一定的不確定性,因此拍攝出的文檔圖像的以下幾個(gè)性能項(xiàng)目會(huì)給機(jī)器視覺(jué)的識(shí)別帶來(lái)一定的挑戰(zhàn),也將是本項(xiàng)目重點(diǎn)解決的對(duì)象。
(1)分辨力測(cè)試
分辨力測(cè)試使用燈箱及分辨力測(cè)試卡??刂拼郎y(cè)文檔拍攝儀拍攝分辨力圖像卡,并且使分辨力圖四周的定位點(diǎn)充滿整個(gè)顯示屏屏幕,在顯示器上用目視法讀出線數(shù)。
(2)噪點(diǎn)(信噪比)測(cè)試
圖像亮度的噪聲是由電子線路的干擾所產(chǎn)生的隨機(jī)現(xiàn)象,表現(xiàn)為隨機(jī)變化的圖像明暗度。每幅圖像都是由有限點(diǎn)的像素組成,每個(gè)像素點(diǎn)都帶有亮度信息。圖像的噪聲定義為像素亮度值的標(biāo)準(zhǔn)差,圖像亮度信號(hào)信噪比則定義為圖像平均亮度值與噪聲值之比,以dB表示。
12階不同明暗程度的亮塊、暗塊組成,亮度信噪比的計(jì)算公式為:
其中SWHITE和SBLACK是白色色塊和黑色色塊亮度信號(hào)值,通過(guò)如下公式計(jì)算:
其中m、n為每個(gè)塊的長(zhǎng)度像素?cái)?shù)、寬度像素?cái)?shù),g(x,y)為塊亮度值。
其中iN為中性灰度塊的噪聲。Imatest軟件中的stepchart模塊集成了該算法。
(3)幾何失真
幾何失真主要是由于成像系統(tǒng)的非線性、鏡頭不同區(qū)域?qū)庹凵洳煌纫蛩禺a(chǎn)生的,可以分為桶形失真和枕形失真。格子圖案或者棋盤(pán)格信號(hào)都能用來(lái)測(cè)試幾何失真。
圖4 信噪比測(cè)試卡
圖5 幾何失真的分類
幾何失真的定義為:
Imatest軟件中的Distortion模塊提供了幾何失真的算法。
(4)色彩還原誤差
色彩還原誤差考察的是文檔拍攝儀對(duì)真實(shí)色彩的還原能力,測(cè)試一般采用圖3所示的色彩還原測(cè)試圖。測(cè)試原理是將拍攝圖像的各個(gè)塊轉(zhuǎn)換到CIE L*a*b*的色彩空間,并且和圖像真實(shí)的L*、a*、b*值進(jìn)行比較。其中L*是代表色塊的明度值,a*代表紅綠范圍的色度(a*正值代表紅色,負(fù)值代表綠色),b*代表黃、藍(lán)范圍的色度。用來(lái)衡量色彩還原誤差的指標(biāo)為平均色彩還原誤差ΔE,定義為L(zhǎng)*、a*、b*三者差值平方和的均方根值:
圖3 分辨力測(cè)試卡
圖6 幾何失真的定義
圖7 色彩還原性測(cè)試卡
其中L*、a*、b*的下角標(biāo)1和2分別代表實(shí)際測(cè)試的明度、色度與標(biāo)準(zhǔn)色卡中的標(biāo)準(zhǔn)值。將所有色塊的 ΔEab*進(jìn)行平均,就得到平均色彩還原誤差ΔE。Imatest軟件中的Colourcheck模塊就集成了此種色彩還原誤差的算法。
(5)灰階
灰階測(cè)試使用反射光源及灰階測(cè)試卡??刂拼郎y(cè)文檔拍攝儀拍攝灰階圖像卡,并且使灰階圖四周的定位點(diǎn)充滿整個(gè)顯示屏屏幕,在顯示器上用目視法讀可分辨的最大灰階數(shù)。
圖8 灰階測(cè)試卡
針對(duì)以上指標(biāo),本項(xiàng)目利用Imatest IT進(jìn)行二次開(kāi)發(fā)后實(shí)現(xiàn)自動(dòng)測(cè)試大致分為四個(gè)步驟:
圖9 測(cè)試流程圖
第一步:準(zhǔn)備好燈箱、光源和需要拍攝的圖卡,燈箱的照度必須設(shè)置到標(biāo)準(zhǔn)規(guī)定值,使用照度計(jì)來(lái)確定照度值。將測(cè)試圖卡充滿文檔拍攝儀的取景器(連接到對(duì)應(yīng)的電腦)后進(jìn)行拍攝。
第二步:生成配置的INI文件。INI文件是由Imatest Master生成的配置文件,包含了Imatest模塊用于描述輸入圖像的設(shè)置(例如ROI(需要測(cè)試的區(qū)域)、照度值、測(cè)試距離、測(cè)試所使用的標(biāo)準(zhǔn)、坐標(biāo)軸使用的坐標(biāo)單位、如何計(jì)算分析、結(jié)果保存路徑等等)。在設(shè)置好后,可以使用Imatest 軟件設(shè)置窗口中的“Save ini file for”按鈕來(lái)保存僅包含所需部分的INI文件。
第三步:集成和調(diào)用所需要分析的函數(shù)模塊。
第四步:測(cè)試結(jié)果和測(cè)試數(shù)據(jù)處理。
由于本項(xiàng)目的程序需要使用Imatest IT庫(kù)文件,所以必須將庫(kù)文件解壓縮到臨時(shí)目錄。在每次使用庫(kù)文件時(shí),都需要重復(fù)解壓縮,這樣大大減緩了計(jì)算速度,因此需要設(shè)置兩個(gè)環(huán)境變量MCR_CACHE_ROOT和MCR_CACHE_SIZE。MCR_CACHE_ROOT變量提供了Imatest IT庫(kù)文件的路徑,將其設(shè)置為對(duì)所有用戶具有寫(xiě)訪問(wèn)權(quán)限可使操作系統(tǒng)在清除臨時(shí)文件時(shí)不會(huì)刪除此緩存。MCR_CACHE_SIZE變量的大小文檔建議至少設(shè)置為900000000,因此我們將此變量值設(shè)置為900000000。
表1
其次還更改Windows環(huán)境變量需要管理員訪問(wèn)權(quán)限,詳見(jiàn)圖10。
圖10 環(huán)境變量的設(shè)置
圖11 測(cè)試系統(tǒng)界面截圖
為了使編寫(xiě)的程序能夠調(diào)用Imatest IT提供的動(dòng)態(tài)庫(kù)文件,使用Visual Studio添加Post-Build事件可以自動(dòng)執(zhí)行此過(guò)程。在Solution Explorer中,右鍵單擊項(xiàng)目并選擇Properties。
在“Configuration Properties”和“Build Events”下,選擇“Post-Build Event”。然后imatest_library.dll文件將自動(dòng)復(fù)制到項(xiàng)目的目標(biāo)目錄中,應(yīng)用程序便可以加載這些庫(kù)文件。
使用Imatest Master生成需要的INI文件。INI文件可以用Imatest Master軟件設(shè)置好后直接生成,里面包含了測(cè)試的配置信息。調(diào)用IT模塊,把Imatest IT和Matlab MCR庫(kù)的目錄加入Visual Studio的項(xiàng)目文件里。
上面用到的Imatest IT C++庫(kù)參數(shù)意義如表2所示。
表2
Imatest IT C++庫(kù)接收和返回?cái)?shù)據(jù)通過(guò)mwArray事件。C++庫(kù)的mwArray類是面向?qū)ο蟮模⑶疫€負(fù)責(zé)自動(dòng)分配和解除分配。無(wú)需人為注銷mwArray事件。
表3
本文分析文檔拍攝儀的最讓人關(guān)注的視覺(jué)性能指標(biāo)的算法:分辨力、信噪比、幾何失真、色彩還原誤差及灰階,并介紹了如何使用Imatest相關(guān)軟件實(shí)現(xiàn)起自動(dòng)化測(cè)試,在實(shí)現(xiàn)GB/T 36473-2018標(biāo)準(zhǔn)中的相關(guān)指標(biāo)測(cè)試具有實(shí)用性,為文檔拍攝儀生產(chǎn)企業(yè)提供了更加強(qiáng)大的技術(shù)支持,為供應(yīng)商進(jìn)行產(chǎn)品出廠診斷、改進(jìn)產(chǎn)品設(shè)計(jì)、提高產(chǎn)品質(zhì)量提供了有力的技術(shù)保障。