羅奕凱
(中國(guó)鐵路南寧局集團(tuán)有限公司 貨運(yùn)服務(wù)中心,廣西 南寧 530029)
鐵路貨車裝載狀態(tài)圖像是貨檢人員對(duì)貨物裝載狀態(tài)的復(fù)現(xiàn),可以直觀地展現(xiàn)貨物在運(yùn)輸過(guò)程中的情況,在現(xiàn)代化的鐵路貨檢中,往往會(huì)采用先進(jìn)的技術(shù)手段來(lái)生成高精度的貨車裝載狀態(tài)圖像。在鐵路貨車裝載狀態(tài)圖像采集系統(tǒng)建成驗(yàn)收、維護(hù)驗(yàn)收中,圖像質(zhì)量評(píng)價(jià)是非常重要的,能夠直接影響到后續(xù)運(yùn)行情況的判斷和決策。當(dāng)前鐵路領(lǐng)域尚未開(kāi)展圖像質(zhì)量評(píng)價(jià)的定量研究,尚未形成一種有效、客觀、權(quán)威的圖像質(zhì)量評(píng)價(jià)方法,在評(píng)估設(shè)備性能的過(guò)程中,容易出現(xiàn)評(píng)估結(jié)果與實(shí)際表現(xiàn)不符的情況,影響鐵路貨車裝載狀態(tài)圖像采集系統(tǒng)的運(yùn)行效率和運(yùn)行安全。因此,建立標(biāo)準(zhǔn)圖像質(zhì)量客觀評(píng)價(jià)機(jī)制,要求設(shè)備新建、更改后通過(guò)評(píng)價(jià)指標(biāo)要求,是非常值得研究探討的方向。
圖像質(zhì)量是比較圖像處理算法性能及優(yōu)化機(jī)器視覺(jué)應(yīng)用系統(tǒng)參數(shù)的重要指標(biāo),圖像質(zhì)量評(píng)價(jià)就是量化機(jī)器視覺(jué)應(yīng)用系統(tǒng)生成圖像質(zhì)量的優(yōu)劣程度,在不同場(chǎng)景下存在著不同的評(píng)價(jià)指標(biāo)和評(píng)價(jià)標(biāo)準(zhǔn)。鐵路貨車裝載狀態(tài)圖像采集系統(tǒng)通過(guò)采集運(yùn)行中貨物列車的圖像信息,供鐵路工作人員對(duì)貨車裝載加固安全狀態(tài)進(jìn)行細(xì)致檢查,屬于機(jī)器視覺(jué)檢測(cè)應(yīng)用,因此鐵路貨車裝載狀態(tài)圖像質(zhì)量的優(yōu)劣,取決于該圖像是否能夠較好地呈現(xiàn)局部細(xì)節(jié)。
圖像質(zhì)量的評(píng)價(jià)方法主要可以歸納為主觀評(píng)價(jià)與客觀評(píng)價(jià)2 類[1]。主觀評(píng)價(jià)方法是從人類的主觀感知角度對(duì)圖像質(zhì)量進(jìn)行評(píng)判,然而這一評(píng)價(jià)過(guò)程不僅耗時(shí)且成本較高,在缺乏圖像評(píng)價(jià)領(lǐng)域權(quán)威專家參與的情況下,其說(shuō)服力也相對(duì)較弱??陀^評(píng)價(jià)方法則采用數(shù)學(xué)模型對(duì)圖像質(zhì)量進(jìn)行量化評(píng)估,受人為因素影響較小,通過(guò)結(jié)合圖像特征并應(yīng)用相適宜的數(shù)學(xué)模型,可以在一定程度上較好地實(shí)現(xiàn)預(yù)期效果。從客觀評(píng)價(jià)方法所需參考圖像信息的依賴程度來(lái)看,又可以劃分為全參考型、部分參考型和無(wú)參考型3 類[2]。全參考型方法需要原始圖像以及經(jīng)過(guò)處理的圖像進(jìn)行比較,部分參考型方法僅需要原始圖像的部分信息,而無(wú)參考型方法則無(wú)需任何參考圖像。
在鐵路貨車裝載狀態(tài)圖像質(zhì)量評(píng)價(jià)場(chǎng)景下,采集到的圖像是列車階段狀態(tài)性的圖像,無(wú)法獲得原始圖像信息作為參考,因而研究主要集中于無(wú)參考型客觀評(píng)價(jià)方法,在保證鐵路貨車裝載狀態(tài)圖像質(zhì)量評(píng)價(jià)結(jié)果更具客觀性的同時(shí),也能提高評(píng)價(jià)效率,降低評(píng)價(jià)成本。
根據(jù)《鐵路貨車裝載狀態(tài)標(biāo)準(zhǔn)圖像設(shè)備暫行技術(shù)條件》(TJ/KH 040—2022),鐵路貨車裝載狀態(tài)標(biāo)準(zhǔn)圖像是指“能夠完整、準(zhǔn)確反映鐵路貨車車體、貨物、貨物裝載加固狀態(tài)的無(wú)明顯變形、噪點(diǎn)、模糊的高清圖像”,同時(shí)還要求“圖像明亮清晰、亮度均勻”??梢?jiàn)清晰度、畸變度和亮度對(duì)圖像細(xì)節(jié)信息的展示產(chǎn)生重要影響。其中,清晰度是指圖像中物體輪廓的清晰度和邊緣的銳利程度,一張清晰的圖像能夠呈現(xiàn)出更多的細(xì)節(jié)和紋理,提高圖像的可視性和辨別度,讓人們更容易識(shí)別圖像中的目標(biāo)物體;畸變度是指圖像中物體形狀和大小與實(shí)際物體的偏差程度,畸變度高的圖像可能會(huì)失真或變形,從而影響人們對(duì)圖像中物體的識(shí)別和分析;亮度是指圖像的明暗程度,過(guò)高或過(guò)低的亮度會(huì)使圖像出現(xiàn)過(guò)曝或欠曝的情況,從而降低圖像的可視性和細(xì)節(jié)表現(xiàn)能力。綜上,研究將以鐵路貨車裝載狀態(tài)圖像為基礎(chǔ),從清晰度、畸變度和亮度3 個(gè)方面研究圖像質(zhì)量客觀評(píng)價(jià)方法。
再模糊理論方法是一種專門針對(duì)圖像清晰度評(píng)價(jià)的方法,其思想是將待評(píng)價(jià)圖像通過(guò)濾波形式進(jìn)行再模糊,構(gòu)造一張模糊程度更大的參考圖像,然后運(yùn)用全參考型評(píng)價(jià)方法,比較參考圖像與待評(píng)價(jià)圖像間的信息損失程度。信息損失程度可以作為圖像清晰度的評(píng)價(jià)指標(biāo),信息損失越大,代表圖像越清晰;信息損失越小,則圖像越模糊[3]。分析基于再模糊理論的無(wú)參考結(jié)構(gòu)清晰度評(píng)價(jià)方法[4](NRSS)、結(jié)構(gòu)相似性方法[5](SSIM),研究適用于貨車裝載狀態(tài)圖像的清晰度評(píng)價(jià)方法,計(jì)算步驟如下。
(1)將原圖進(jìn)行灰度化處理,作為待評(píng)價(jià)圖像。通過(guò)灰度化處理,可以使得圖像中的彩色信息轉(zhuǎn)化為亮度信息,為后續(xù)進(jìn)一步處理提供所需信息的同時(shí),能夠顯著降低處理的復(fù)雜性和計(jì)算量。研究使用加權(quán)平均法進(jìn)行彩色圖像灰度化處理,將紅色、綠色、藍(lán)色分量的權(quán)值設(shè)置為0.30,0.59,0.11,以模擬人眼對(duì)于顏色的亮度感知,其表達(dá)式為
式中:g為輸出的灰度化圖像;r,g,b分別為輸入彩色圖像的紅、綠、藍(lán)3 個(gè)通道子圖像;(x,y)為圖像的像素坐標(biāo)。
(2)對(duì)待評(píng)價(jià)圖像進(jìn)行平滑處理,作為參考圖像。參照NRSS 算法,采用7×7 大小、標(biāo)準(zhǔn)差平方σ2為6 的高斯濾波器進(jìn)行平滑處理,則高斯卷積核G為
對(duì)待評(píng)價(jià)圖像進(jìn)行高斯平滑處理的表達(dá)式為
式中:Ir為參考圖像;I為待評(píng)價(jià)圖像;?為圖像的卷積運(yùn)算。
(3)提取圖像待評(píng)價(jià)圖像I、參考圖像Ir的梯度圖像,分別記為X,Y?;贑anny 算子能在噪聲干擾的條件下較好地提取出目標(biāo)邊緣[6],研究采用Canny 算子提取梯度圖像,在生成梯度圖像時(shí)應(yīng)盡量濾除噪點(diǎn),避免過(guò)多噪點(diǎn)被當(dāng)做邊緣信息參與信息損失程度的計(jì)算。并采取Otsu 閾值分割法確定Canny算子的雙閾值[7],設(shè)L為輸入圖像灰度級(jí),有正整數(shù)t∈(0,L-1),可以將輸入圖像像素值分為[0,t]和[t+1,L-1]2個(gè)集合,則有
式中:μ1,μ2分別為2 個(gè)集合的平均灰度值;Pi為各灰度值的出現(xiàn)概率。
設(shè)f2(t)為上述2個(gè)集合的間類方差,則有
對(duì)t進(jìn)行遍歷,使得f2(t)取得最大值時(shí),對(duì)應(yīng)的t則作為閾值上限,閾值下限取閾值上限的0.5倍。
(4)計(jì)算圖像X,Y的結(jié)構(gòu)相似度SSIM(X,Y)。SSIM(X,Y)是處于0 至1 之間的數(shù),用于衡量X,Y2幅圖像相似度的指標(biāo)。SSIM(X,Y)越大,2幅圖像的差異越小,說(shuō)明模糊化處理后的信息損失越小,代表圖像越模糊。其表達(dá)式為
式中:μX,μY分別為圖像X,Y的像素均值;σX,σY分別為圖像X,Y的像素方差;σXY為圖像X,Y的像素協(xié)方差;C1,C2為常數(shù),是為了避免分母為0 的情況,在計(jì)算時(shí),通常取C1=(K1×L)2,C2=(K2×L)2,其中K1,K2為遠(yuǎn)小于1 的正數(shù),L為灰度等級(jí),一般取K1=0.01,K2=0.03。
(5)計(jì)算鐵路貨車裝載狀態(tài)圖像清晰度指標(biāo)S。S值處于0 至1 之間,越接近于1,則清晰度評(píng)價(jià)指標(biāo)越好。清晰度指標(biāo)計(jì)算公式為
在不采用參考圖像的前提下,對(duì)特定圖像畸變度的評(píng)價(jià)主要是通過(guò)獲取圖像特征物輪廓的長(zhǎng)寬比,再與實(shí)際物的長(zhǎng)寬比進(jìn)行比較,求出待評(píng)價(jià)圖像的形變率,因而計(jì)算前提為特征物的選取及其輪廓的提取方式。
在特征物選取上,考慮到鐵路貨車車型繁多且各異,而主流車型如棚車、敞車、平車、保溫車和雙層運(yùn)輸汽車專用車等均標(biāo)記有鐵道車輛用路徽。同時(shí),路徽的繪制須遵循1987 年鐵道部印制的《鐵道車輛用路徽標(biāo)記》(TB/T 1838—1987),即標(biāo)準(zhǔn)路徽標(biāo)記的底長(zhǎng)與邊長(zhǎng)的比值應(yīng)為20:23,鐵道車輛用路徽標(biāo)準(zhǔn)規(guī)格如圖1 所示。因此研究選擇路徽作為目標(biāo)特征物,具有覆蓋車型廣、特征明顯和標(biāo)準(zhǔn)可靠的優(yōu)點(diǎn)。
圖1 鐵道車輛用路徽標(biāo)準(zhǔn)規(guī)格Fig.1 Standard emblem for railway vehicles
在特征物輪廓提取方式上,鑒于YOLO算法檢測(cè)效率高、耗費(fèi)資源少等優(yōu)點(diǎn)[8],研究采用基于YOLOv8 的目標(biāo)檢測(cè)模型,自動(dòng)提取圖像特征物定位框坐標(biāo)信息,以此來(lái)代表特征物的輪廓信息。
考慮到列車運(yùn)行時(shí)車輛在垂直方向的運(yùn)動(dòng)幅度不大,可以認(rèn)為線陣相機(jī)的成像中,拍攝物體在高度上基本不會(huì)發(fā)生畸變,僅在水平方向可能發(fā)生壓縮或拉伸[9]。在此基礎(chǔ)上,在將路徽?qǐng)D像縮放至邊長(zhǎng)與實(shí)際路徽的邊長(zhǎng)相等時(shí),用圖像中路徽的底長(zhǎng)與實(shí)際路徽的底長(zhǎng)進(jìn)行比較,以此計(jì)算畸變率,計(jì)算步驟如下。
(1)訓(xùn)練最優(yōu)檢測(cè)模型。從新豐鎮(zhèn)站、南寧南站鐵路貨車裝載狀態(tài)圖像采集系統(tǒng)歷史過(guò)車圖像中選取樣本圖像195 張,按照800 像素×800 像素大小依次剪裁包含路徽的子圖像,避免訓(xùn)練時(shí)壓縮幅度過(guò)大。劃分訓(xùn)練集圖像180張,驗(yàn)證集15張,采取預(yù)訓(xùn)練模型YOLOv8 Nano 進(jìn)行訓(xùn)練,控制壓縮后的輸入圖像大小為640 像素×640 像素,設(shè)置BATCHS_SIZE 為4,epoch 為100,初始學(xué)習(xí)率為0.000 1,得出最優(yōu)檢測(cè)模型,用于檢測(cè)待評(píng)價(jià)圖像中路徽定位框的坐標(biāo)信息。
(2)使用訓(xùn)練得到的最優(yōu)模型,預(yù)測(cè)輸入的待評(píng)價(jià)圖像,獲取路徽定位框左上角及右下角的坐標(biāo),并用坐標(biāo)差值來(lái)代表圖像中路徽的底長(zhǎng)和邊長(zhǎng)的數(shù)值,表達(dá)式為
式中:Ax,Ay分別為圖像中路徽的底長(zhǎng)和邊長(zhǎng)的數(shù)值;(x1,y1),(x2,y2)分別為路徽定位框在圖像中的左上角和右下角的坐標(biāo)值。
以某幅貨車裝載視頻狀態(tài)圖像為例,在預(yù)測(cè)圖像上繪制定位框和坐標(biāo)信息并保存后,最優(yōu)模型驗(yàn)證預(yù)測(cè)結(jié)果和信息展示如圖2 所示??梢?jiàn)定位框左上角坐標(biāo)值為(245,319),右下角坐標(biāo)值為(376,458),則底長(zhǎng)為376-245=131,邊長(zhǎng)為458-319=139。
圖2 最優(yōu)模型驗(yàn)證預(yù)測(cè)結(jié)果和信息展示Fig.2 Prediction results validated by optimal model and information presentation
(3)將圖像中路徽縮放至邊長(zhǎng)與實(shí)際路徽的邊長(zhǎng)相等,用圖像中路徽的底長(zhǎng)與實(shí)際路徽的底長(zhǎng)的相對(duì)誤差來(lái)代表畸變度評(píng)價(jià)值D。D值處于0 至1 之間,越接近于1,代表圖像中車輛的長(zhǎng)寬比越接近于實(shí)際車輛的長(zhǎng)寬比,則畸變度評(píng)價(jià)指標(biāo)越好。其表達(dá)式為
式中:M為縮放倍率;Bx,By分別為實(shí)際路徽的底長(zhǎng)和邊長(zhǎng)。
在統(tǒng)計(jì)分析圖像中的像素灰度值時(shí),所產(chǎn)生的直方圖被稱為圖像直方圖,圖像直方圖不僅能夠用于評(píng)估圖像亮度,也可以用于分析場(chǎng)景目標(biāo)[10]?;趫D像直方圖與亮度信息的關(guān)系,研究通過(guò)圖像直方圖的方式評(píng)價(jià)亮度,主要思路就是計(jì)算直方圖的峰值距離中心點(diǎn)的偏離程度,偏離程度越高,其亮度評(píng)價(jià)值越低。計(jì)算步驟如下。
(1)獲取直方圖信息,圖像的直方圖可以用以下離散函數(shù)hist(rk)表示為
式中:rk為第k級(jí)的灰度值;nk為灰度值為rk的像素個(gè)數(shù)。
(2)進(jìn)行歸一化計(jì)算,歸一化后的直方圖可以表示為
式中:R(rk)為灰度值為rk的像素在圖像中出現(xiàn)的概率,所有灰度值出現(xiàn)概率之和等于1;M×N為圖像的分辨率。
(3)以像素灰度值出現(xiàn)概率為權(quán)重,計(jì)算每個(gè)灰度值偏離中心點(diǎn)的程度值dk,表達(dá)式為
(4)以每個(gè)像素灰度值的加權(quán)偏離程度值為基礎(chǔ),綜合計(jì)算圖像亮度評(píng)價(jià)值B。B值處于0 至1 之間,越接近于1,代表圖像各像素點(diǎn)灰度值越接近于直方圖的中心,則亮度評(píng)價(jià)指標(biāo)越好。其表達(dá)式為
基于清晰度、畸變度、亮度3項(xiàng)評(píng)價(jià)指標(biāo),可以融合得到一個(gè)綜合的貨車裝載狀態(tài)圖像質(zhì)量評(píng)價(jià)指標(biāo)E。E的值處于0至1之間,越接近于1,代表圖像質(zhì)量評(píng)價(jià)結(jié)果越好。其表達(dá)式為
式中:a,b,c為參數(shù),a>0,b>0,c>0,且a+b+c=1,用于調(diào)整3項(xiàng)評(píng)價(jià)指標(biāo)的權(quán)重值。
為了驗(yàn)證圖像質(zhì)量評(píng)價(jià)算法,篩選5 張質(zhì)量差異較大的鐵路貨車裝載狀態(tài)圖像作為本次評(píng)估的試驗(yàn)數(shù)據(jù),分別用Pic1 至Pic5 來(lái)代表,并使用剪裁的方法對(duì)前景圖像進(jìn)行提取,避免背景圖像的影響。測(cè)試圖像集如圖3所示。
圖3 測(cè)試圖像集Fig.3 Test image collection
清晰度、畸變度、亮度3 項(xiàng)指標(biāo)都對(duì)貨車裝載狀態(tài)圖像質(zhì)量產(chǎn)生影響,根據(jù)實(shí)際工作經(jīng)驗(yàn),隨著應(yīng)用的不同,其重要程度也不同。例如,在人眼識(shí)別情況下,過(guò)低的清晰度和亮度會(huì)給人眼觀察帶來(lái)困難,并且會(huì)產(chǎn)生疲勞感,對(duì)圖像的辨識(shí)影響較大。相反,在智能識(shí)別情況下,機(jī)器對(duì)清晰度和亮度的適應(yīng)能力更強(qiáng),而對(duì)畸變的圖片則很可能將關(guān)鍵信息識(shí)別錯(cuò)誤。目前全路大部分貨檢站采取人檢為主、機(jī)檢為輔的作業(yè)模式,少部分貨檢站運(yùn)用了圖像智能識(shí)別模塊,正在向“到達(dá)作業(yè)機(jī)檢為主、人檢為輔,出發(fā)作業(yè)人檢為主、人機(jī)結(jié)合”的作業(yè)模式轉(zhuǎn)換,并且運(yùn)用圖像智能識(shí)別推動(dòng)少人化作業(yè)是發(fā)展趨勢(shì)。因此,在權(quán)重系數(shù)的設(shè)置上,應(yīng)根據(jù)不同測(cè)點(diǎn)的應(yīng)用情況,以及圖像智能識(shí)別應(yīng)用的推廣程度進(jìn)一步研究確定。研究暫設(shè)置a=b=c,即3項(xiàng)指標(biāo)同等重要來(lái)進(jìn)行驗(yàn)證。
以測(cè)試圖像為例,運(yùn)用研究提供的方法對(duì)5 張鐵路貨車裝載狀態(tài)圖像質(zhì)量進(jìn)行整體評(píng)價(jià),整體評(píng)價(jià)值計(jì)算結(jié)果如表1 所示。由表1 可知,清晰度評(píng)價(jià)結(jié)果為Pic2>Pic3>Pic4>Pic5>Pic1,畸變度評(píng)價(jià)結(jié)果為Pic1>Pic2>Pic4>Pic5>Pic3,亮度評(píng)價(jià)結(jié)果為Pic4>Pic3>Pic2>Pic5>Pic1,綜合評(píng)價(jià)結(jié)果為Pic2>Pic4>Pic3>Pic5>Pic1。
表1 整體評(píng)價(jià)值計(jì)算結(jié)果Tab.1 Calculation results of overall evaluation value
以圖像的局部細(xì)節(jié)是否可以較好地呈現(xiàn)作為圖像質(zhì)量評(píng)價(jià)依據(jù),從人眼主觀感受對(duì)5 張測(cè)試圖像進(jìn)行觀察,顯然Pic1 基本無(wú)法通過(guò)人眼判斷貨車裝載狀態(tài),需要安排人員現(xiàn)場(chǎng)復(fù)檢,因而判定質(zhì)量最差;Pic5 可以明顯感受到模糊,給人眼判斷帶來(lái)困難,因而判定質(zhì)量?jī)H較Pic1 稍好;Pic2,Pic3 和Pic4 可以從單項(xiàng)指標(biāo)辨清區(qū)別,但各有優(yōu)劣勢(shì),難以通過(guò)主觀感受來(lái)評(píng)判整體圖像質(zhì)量,因而綜合評(píng)價(jià)值差異并不大,需要從人檢、機(jī)檢2 個(gè)方面,結(jié)合工作實(shí)際合理調(diào)節(jié)單項(xiàng)指標(biāo)的權(quán)重值,進(jìn)一步提高綜合評(píng)價(jià)值的準(zhǔn)確性。
從測(cè)試圖像的驗(yàn)證結(jié)果上看,研究提出的評(píng)價(jià)方法與人眼主觀感受實(shí)現(xiàn)了較好的一致性。從清晰度、畸變度和亮度3 個(gè)方面建立鐵路貨車裝載狀態(tài)圖像整體評(píng)價(jià)指標(biāo),對(duì)鐵路貨車裝載狀態(tài)圖像采集系統(tǒng)的性能表現(xiàn)進(jìn)行科學(xué)、客觀的評(píng)價(jià)判斷,有助于為設(shè)備管理部門提供決策依據(jù),找準(zhǔn)后續(xù)補(bǔ)強(qiáng)方向。同時(shí),也為鐵路各系統(tǒng)健全圖像質(zhì)量評(píng)價(jià)機(jī)制提供理論基礎(chǔ),通過(guò)對(duì)圖像采集設(shè)備進(jìn)行客觀的評(píng)估,要求設(shè)備符合硬性指標(biāo)條件,提高成像質(zhì)量,以保證設(shè)備具有良好的可靠性,幫助鐵路企業(yè)管理部門通過(guò)檢測(cè)圖像及時(shí)發(fā)現(xiàn)問(wèn)題、分析問(wèn)題和解決問(wèn)題。