陳聰梅,都 政,井革新,趙曉惠,靳紹巍,陳遠(yuǎn)磊,饒青雷,鄔 鴻
(國(guó)家超級(jí)計(jì)算深圳中心(深圳云計(jì)算中心),廣東 深圳 518055)
超級(jí)計(jì)算機(jī)的圖像結(jié)構(gòu)相似度并行處理方法
陳聰梅,都 政,井革新,趙曉惠,靳紹巍,陳遠(yuǎn)磊,饒青雷,鄔 鴻
(國(guó)家超級(jí)計(jì)算深圳中心(深圳云計(jì)算中心),廣東 深圳 518055)
隨著圖像信息量呈指數(shù)級(jí)的增長(zhǎng),圖像處理面臨效率低與質(zhì)量差的雙重挑戰(zhàn),圖像結(jié)構(gòu)相似度作為圖像質(zhì)量評(píng)價(jià)領(lǐng)域常用的一種方法也面臨著同樣的問題。為此,提出了一種基于超級(jí)計(jì)算機(jī)的數(shù)字圖像結(jié)構(gòu)相似度并行處理方法?;诔阒行牡母咝阅苡?jì)算平臺(tái)實(shí)現(xiàn)圖像結(jié)構(gòu)相似度的并行處理,采用分塊并行計(jì)算圖像的三種信息,通過與單機(jī)計(jì)算比較來(lái)評(píng)價(jià)并行處理的性能。實(shí)驗(yàn)結(jié)果表明,針對(duì)數(shù)據(jù)量大的圖像,采用所提出的并行處理方案的耗時(shí)遠(yuǎn)低于單機(jī)計(jì)算所耗費(fèi)的時(shí)間,可獲得較大的加速比,并有效地提高計(jì)算效率。可見,所提出的基于超級(jí)計(jì)算機(jī)的圖像結(jié)構(gòu)相似度并行處理方法有效可行,為實(shí)現(xiàn)圖像實(shí)時(shí)處理提供了可能性。
數(shù)字圖像;超級(jí)計(jì)算機(jī);結(jié)構(gòu)相似度;加速比
圖像是人類獲取和交換信息的主要來(lái)源,隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展及廣泛應(yīng)用,數(shù)字圖像作為承載信息的載體在社會(huì)生活中扮演著重要角色。然而,隨著應(yīng)用需求的不斷擴(kuò)大,數(shù)字圖像處理面臨著復(fù)雜化和實(shí)時(shí)性的重大挑戰(zhàn)。由于人們對(duì)圖像質(zhì)量的要求不斷提高,從圖像中獲得的信息越來(lái)越多,相應(yīng)的計(jì)算量也越來(lái)越大。圖像質(zhì)量評(píng)價(jià)也成為圖像處理的重要環(huán)節(jié),圖像質(zhì)量評(píng)價(jià)方法主要包括主觀評(píng)價(jià)和客觀評(píng)價(jià)[1-2]。主觀評(píng)價(jià)方法取決于評(píng)價(jià)者,難有統(tǒng)一的標(biāo)準(zhǔn),通常不適用于數(shù)字圖像處理領(lǐng)域??陀^評(píng)價(jià)方法通過采用一個(gè)或多個(gè)評(píng)價(jià)指標(biāo)來(lái)評(píng)價(jià)圖像質(zhì)量。
隨著圖像的數(shù)據(jù)量越來(lái)越大,對(duì)圖像的任何處理都需要計(jì)算機(jī)具有強(qiáng)大的計(jì)算性能。普通單處理機(jī)對(duì)圖像處理的效率已遠(yuǎn)不能滿足生產(chǎn)對(duì)于圖像實(shí)時(shí)處理的要求。由于單機(jī)速度提升受制于設(shè)備物理的極限,很難滿足大數(shù)據(jù)量的圖像處理計(jì)算,隨著高性能并行處理系統(tǒng)的發(fā)展,基于高性能計(jì)算的圖像并行處理技術(shù)在提高圖像處理速度上提供了可能性[3-4]。高性能計(jì)算機(jī)是指運(yùn)行速度非??斓挠?jì)算機(jī),也稱為超級(jí)計(jì)算機(jī)。
為驗(yàn)證圖像大規(guī)模并行處理的可行性,將國(guó)家超級(jí)計(jì)算深圳中心的曙光6000超級(jí)計(jì)算機(jī)作為圖像結(jié)構(gòu)相似度并行處理的試驗(yàn)研究平臺(tái),提出了基于結(jié)構(gòu)相似度的超級(jí)計(jì)算機(jī)圖像并行處理方法,為建立基于高性能計(jì)算與云計(jì)算的數(shù)字圖像處理平臺(tái)提供指導(dǎo)性意見與寶貴參考。
1.1圖像并行處理
數(shù)字圖像處理是計(jì)算機(jī)應(yīng)用領(lǐng)域中一個(gè)重要及廣泛的分支,隨著計(jì)算機(jī)和集成電路等技術(shù)的發(fā)展,圖像處理無(wú)論在算法上、系統(tǒng)結(jié)構(gòu)上還是應(yīng)用上均取得了長(zhǎng)足進(jìn)步。
圖像是連續(xù)圖像f(x,y)的一種近似表示,由采樣值組成矩陣表示,每一個(gè)采樣單元為一個(gè)像素。并行算法的設(shè)計(jì)是在有限的空間和時(shí)間上處理更多的圖像數(shù)據(jù),從而提高了圖像處理速度。由于圖像處理過程中的數(shù)據(jù)量巨大,且各種算法中包含大量的矩陣乘法運(yùn)算和卷積運(yùn)算,為圖像處理的并行計(jì)算算法設(shè)計(jì)提供了可能。
圖像處理的并行計(jì)算的基本思路是借助多個(gè)節(jié)點(diǎn)協(xié)同解決算法問題,把算法分解成各個(gè)并行部分,每個(gè)并行部分由單獨(dú)的節(jié)點(diǎn)進(jìn)行計(jì)算。對(duì)于超級(jí)計(jì)算機(jī)集群計(jì)算,一個(gè)重要的原則是減少計(jì)算過程中節(jié)點(diǎn)間的通信,加大計(jì)算時(shí)間。
1.2圖像結(jié)構(gòu)相似度算法
在圖像質(zhì)量評(píng)價(jià)領(lǐng)域,往往需要采用客觀的評(píng)價(jià)方法來(lái)量化圖像質(zhì)量。傳統(tǒng)的圖像質(zhì)量客觀評(píng)價(jià)方法主要有峰值信噪比(Peak Signal to Noise Rate,PSNR)和均方誤差(Mean Squared Error,MSE)[5]。這兩種方法在很多情況下與人的主觀感受不符合。因?yàn)閳D像信息高度結(jié)構(gòu)化,并具有紋理特征,圖像像素點(diǎn)之間存在很大的關(guān)聯(lián)性,人眼在觀察圖像時(shí)會(huì)特別注意圖像內(nèi)容和結(jié)構(gòu)的合理性,因此Wang Zhou等提出了圖像結(jié)構(gòu)相似度(Structural SIMilarity,SSIM)[6]。SSIM方法通過比較待評(píng)價(jià)圖像與原圖像在亮度、對(duì)比度及結(jié)構(gòu)信息的差異,得到評(píng)價(jià)圖像質(zhì)量的綜合指標(biāo)。
SSIM評(píng)價(jià)模型圖如圖1所示。
圖1 SSIM評(píng)價(jià)模型圖
假設(shè)x為原圖像信息,y表示待評(píng)價(jià)圖像信息。提取兩幅圖像的亮度信息l、對(duì)比度信息c和結(jié)構(gòu)信息s,最后綜合三者信息得到圖像SSIM。
(1)亮度信息定義為:
(1)
其中,ux和uy分別表示參考圖像和待評(píng)價(jià)圖像的均值,計(jì)算公式為:
(2)
(3)
其中,N為圖像x的像素?cái)?shù);xi為圖像x第i個(gè)像素點(diǎn)的像素值;yi為圖像y第i個(gè)像素點(diǎn)的像素值。
(2)對(duì)比度信息定義為:
(4)
其中,σx、σy分別表示圖像x和圖像y的亮度標(biāo)準(zhǔn)差,計(jì)算公式為:
(5)
(6)
(3)結(jié)構(gòu)信息定義為:
(7)
其中,σxy為圖像的協(xié)方差,計(jì)算公式為:
(8)
為避免分母出現(xiàn)等于零的情況,引入三個(gè)常量C1、C2、C3。C1=(K1L)2,C2=(K2L)2,C3=C2/2。綜合式(1)、式(4)和式(7),圖像的結(jié)構(gòu)相似度定義為:
SSIM_map(x,y)=[l(x,y)]α*[c(x,y)]β* [s(x,y)]γ
(9)
其中,α、β和γ表示三者的權(quán)重,通常情況下α=β=γ=1。
1.3超級(jí)計(jì)算機(jī)基礎(chǔ)知識(shí)
超級(jí)計(jì)算機(jī)并行系統(tǒng)軟件包括超級(jí)計(jì)算機(jī)系統(tǒng)里的高速通信系統(tǒng)、并行程序運(yùn)行支持系統(tǒng)、資源管理系統(tǒng)、并行文件系統(tǒng)等,是硬件系統(tǒng)與應(yīng)用軟件對(duì)接的橋梁。國(guó)家超級(jí)計(jì)算深圳中心(深圳云計(jì)算中心)部署了由中科院和曙光公司聯(lián)合研制的曙光6000超級(jí)計(jì)算系統(tǒng),該系統(tǒng)整體計(jì)算能力實(shí)測(cè)峰值為1.271千萬(wàn)億次浮點(diǎn)運(yùn)算;操作系統(tǒng)為64位SuSe Linux Enterprise Server 11SP1,采用IBM Platform LSF作業(yè)管理調(diào)度系統(tǒng);節(jié)點(diǎn)間采用InfiniBand網(wǎng)絡(luò)進(jìn)行通信。
深圳超算中心部署的超級(jí)計(jì)算機(jī)已為廣大科研院校及機(jī)構(gòu)提供了便捷的計(jì)算平臺(tái),可節(jié)約科學(xué)研究成本40%以上,縮短研發(fā)周期一半以上,囊括化學(xué)計(jì)算、生物計(jì)算、材料模擬、電磁學(xué)、流體力學(xué)計(jì)算、氣象預(yù)報(bào)等多個(gè)專業(yè)領(lǐng)域。在圖像處理領(lǐng)域,為提高圖像處理速度,有些研究者從事于并行圖像處理算法的設(shè)計(jì)與實(shí)驗(yàn)研究,實(shí)驗(yàn)表明通過搭建的集群系統(tǒng)設(shè)計(jì)圖像的并行處理算法可提高處理速度[7-10]。目前還沒有在超算平臺(tái)進(jìn)行數(shù)字圖像處理的應(yīng)用研究。為此,進(jìn)行了相關(guān)探索,為后續(xù)在超算中心建立圖像處理云平臺(tái)打下基礎(chǔ)。
實(shí)現(xiàn)并行計(jì)算的原理是把一個(gè)大計(jì)算量的作業(yè)分解成多個(gè)子任務(wù),分配到各個(gè)節(jié)點(diǎn)進(jìn)行并行計(jì)算[11-12]。結(jié)構(gòu)相似度算法主要針對(duì)兩幅圖像的圖像信息進(jìn)行計(jì)算,在對(duì)大數(shù)據(jù)量的遙感圖像或紅外圖像進(jìn)行質(zhì)量評(píng)價(jià)時(shí),采用并行計(jì)算,可以極大降低算法運(yùn)行時(shí)間。
2.1算法并行原理與實(shí)現(xiàn)
根據(jù)Wang Zhou等提出的SSIM評(píng)價(jià)方法,考慮到圖像上不同區(qū)域的亮度信息、對(duì)比度信息和結(jié)構(gòu)信息會(huì)隨著區(qū)域紋理的變化有所區(qū)別,因此對(duì)圖像進(jìn)行分塊后在局部窗口求取SSIM的效果優(yōu)于直接計(jì)算整幅圖像的SSIM。分塊計(jì)算圖像的亮度、對(duì)比度和結(jié)構(gòu)信息是結(jié)構(gòu)相似度算法中計(jì)算量最大的部分,涉及到對(duì)圖像像素的多項(xiàng)計(jì)算,對(duì)于數(shù)據(jù)量大的圖像需要耗費(fèi)過長(zhǎng)時(shí)間。SSIM算法并行計(jì)算的原理是把計(jì)算圖像三種信息的任務(wù)分解到多個(gè)計(jì)算節(jié)點(diǎn)上并行執(zhí)行。實(shí)現(xiàn)過程為:?jiǎn)?dòng)節(jié)點(diǎn)讀取參考圖像與待評(píng)價(jià)圖像,設(shè)置參與計(jì)算的節(jié)點(diǎn)數(shù)為3的倍數(shù),分別在每個(gè)計(jì)算節(jié)點(diǎn)求取8×8局部窗口的均值、標(biāo)準(zhǔn)差和協(xié)方差;然后根據(jù)式(1)、式(4)和式(7)計(jì)算亮度、對(duì)比度和結(jié)構(gòu)信息,得到最終的圖像平均結(jié)構(gòu)相似度。
2.2并行處理性能評(píng)價(jià)標(biāo)準(zhǔn)
評(píng)價(jià)并行算法性能的指標(biāo)有多種,主要選用運(yùn)行時(shí)間、加速比,并行效率來(lái)說明并行處理的有效性[13],并用實(shí)驗(yàn)數(shù)據(jù)加以驗(yàn)證。
運(yùn)行時(shí)間是指算法在超級(jí)計(jì)算并行機(jī)上從執(zhí)行到結(jié)束的時(shí)間。加速比定義為[14]:
Sp=Ts/Tp
(10)
其中,Tp為在p個(gè)節(jié)點(diǎn)上的計(jì)算耗時(shí);Ts為單機(jī)運(yùn)算耗時(shí)。
并行效率是指在一個(gè)系統(tǒng)上的加速比與該系統(tǒng)上的進(jìn)程數(shù)之比,并行效率定義為[12]:
Ep=Sp/P
(11)
其中,P為進(jìn)程數(shù);0 2.3并行計(jì)算結(jié)果與分析 單機(jī)測(cè)試環(huán)境為Intel Core i5-2450M 2.5 GHz CPU,4G內(nèi)存;并行測(cè)試環(huán)境為曙光6000超級(jí)計(jì)算機(jī)。 選取圖像像素為256×256、2 048×2 048及5 184×3 456進(jìn)行實(shí)驗(yàn),分別在單機(jī)電腦以及超算平臺(tái)進(jìn)行計(jì)算,節(jié)點(diǎn)數(shù)分別為3、6、9。表1為實(shí)驗(yàn)得到的測(cè)試結(jié)果數(shù)據(jù)。 表1 實(shí)驗(yàn)數(shù)據(jù) 如表1所示,針對(duì)實(shí)驗(yàn)選取的不同尺寸圖像,采用并行處理的加速比有明顯的優(yōu)勢(shì),驗(yàn)證了圖像結(jié)構(gòu)相似度算法采用并行計(jì)算的有效性。從加速比和效率可看出,當(dāng)選用的節(jié)點(diǎn)數(shù)增加,加速比數(shù)值越來(lái)越大,效率隨節(jié)點(diǎn)數(shù)的增加呈上升趨勢(shì),但并非無(wú)限上升,當(dāng)節(jié)點(diǎn)數(shù)為6時(shí)達(dá)到最大值。為更直觀地描述并行處理與單機(jī)處理的時(shí)間對(duì)比,給出3種不同像素尺寸的圖像運(yùn)行時(shí)間對(duì)比曲線,如圖2所示。 圖2 單機(jī)與多節(jié)點(diǎn)并行處理時(shí)間對(duì)比圖 結(jié)合表1的數(shù)據(jù),從圖2中可知,對(duì)數(shù)據(jù)量256×256的圖像,并行計(jì)算的時(shí)間與單機(jī)比沒有太大優(yōu)勢(shì);而對(duì)于大數(shù)據(jù)量5 184×3 456圖像的運(yùn)行時(shí)間隨著并行節(jié)點(diǎn)增加急劇減小,并逐漸趨于平緩。由此可得出,對(duì)于大數(shù)據(jù)量的圖像,SSIM算法并行計(jì)算具有很大優(yōu)勢(shì),并行計(jì)算的時(shí)間明顯低于單機(jī)處理所用時(shí)間。 圖3為并行處理加速比的對(duì)比圖。 圖3 并行處理加速比對(duì)比圖 從圖中可看出,隨著數(shù)據(jù)量的增加,加速比隨之增加,表明并行處理速度有所提升,加速比曲線的上升趨勢(shì)逐漸趨于平緩表明隨著并行節(jié)點(diǎn)數(shù)的提升,處理時(shí)間不能無(wú)限制上升,當(dāng)多節(jié)點(diǎn)間通訊時(shí)間增長(zhǎng)到大于圖像實(shí)際處理時(shí)間時(shí),并行效率就無(wú)法提升。 圖4為并行效率對(duì)比圖 圖4 并行效率對(duì)比圖 由圖4可直觀看出,隨著圖像數(shù)據(jù)規(guī)模的增大,效率逐漸增大。當(dāng)數(shù)據(jù)量較小時(shí),如256×256,使用3節(jié)點(diǎn)效率高于更多節(jié)點(diǎn)的計(jì)算效率;但當(dāng)數(shù)據(jù)量越大,多節(jié)點(diǎn)并行效率提高,當(dāng)并行節(jié)點(diǎn)為6時(shí),效率達(dá)到最大。從而進(jìn)一步說明,并行處理并非采用節(jié)點(diǎn)數(shù)越多,并行效率就越高,需要考慮到圖像數(shù)據(jù)在節(jié)點(diǎn)間的通信及負(fù)載的均衡等。 為在超級(jí)計(jì)算平臺(tái)實(shí)現(xiàn)大數(shù)據(jù)容量圖像并行處理并提升運(yùn)行速度和效率,提出了一種基于超級(jí)計(jì)算機(jī)的圖像結(jié)構(gòu)相似度并行處理方法。該方法采用分塊并行計(jì)算圖像的三種信息,通過與單機(jī)計(jì)算比較來(lái)評(píng)價(jià)并行處理的性能。實(shí)驗(yàn)結(jié)果表明,該算法適用于并行處理,對(duì)于處理大數(shù)據(jù)容量的圖像,可以有效降低時(shí)間消耗,同時(shí)合適的并行節(jié)點(diǎn)可有效提高圖像處理的計(jì)算效率。由分析可知,所設(shè)計(jì)的SSIM并行處理方法在6節(jié)點(diǎn)計(jì)算中具有較好的運(yùn)算效率,且能夠隨著圖像數(shù)據(jù)量的增大通過增加節(jié)點(diǎn)數(shù)來(lái)提升運(yùn)算速率;該方法可有效縮短運(yùn)算時(shí)間,為實(shí)現(xiàn)圖像實(shí)時(shí)處理提供了可能性,為今后建立基于高性能計(jì)算與云計(jì)算的數(shù)字圖像處理平臺(tái)提供了指導(dǎo)性意見與寶貴參考。 [1] 龐璐璐,李從利,羅 軍.數(shù)字圖像質(zhì)量評(píng)價(jià)技術(shù)綜述[J].航空電子技術(shù),2011,42(2):31-35. [2] Xiong Xinghua.Digital image quality assessment[J].Science of Surveying and Mapping,2004,29(1):68-71. [3] 陳國(guó)良,毛 睿,蔡 曄.高性能計(jì)算及其相關(guān)新興計(jì)算技術(shù)[J].深圳大學(xué)學(xué)報(bào):理工版,2015,32(1):25-31. [4] 唐少宇.高性能計(jì)算機(jī)體系結(jié)構(gòu)綜述[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2010(15):51-52. [5] 李 航,路 羊,崔慧娟,等.基于頻域的結(jié)構(gòu)相似度的圖像質(zhì)量評(píng)價(jià)方法[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,2009,49(4):559-562. [6] Wang Zhou,Bovik A C,Sheikh H R,et al.Image quality assessment:from error visibility to structural similarity[J].IEEE Transactions on Image Processing,2004,13(4):600-612. [7] 李金龍.高性能計(jì)算在圖像匹配中的應(yīng)用研究[D].西安:西安建筑科技大學(xué),2012. [8] 蔣利順,劉定生.遙感圖像K-Means并行算法研究[J].遙感信息,2008(1):27-30. [9] Klimeck G,McAuley M,Deen R,et al.Near real-time parallel image processing using cluster computers[C]//International conference on space mission challenges for information technology.Pasadena,CA:[s.n.],2003:13-16. [10] 林 鵬.基于集群系統(tǒng)的并行圖像處理算法的設(shè)計(jì)與實(shí)現(xiàn)[D].青島:中國(guó)海洋大學(xué),2006. [11] 史鳳麗.基于集群計(jì)算機(jī)的圖像并行處理[D].西安:西安科技大學(xué),2010. [12] Cwik T,Klimeck G,McAuley M,et al.Applications on high performance cluster computers production of mars panoramic mosaic images[C]//Proceedings of the 2001 AMOS technical conference.[s.l.]:[s.n.],2001. [13] 周益民.圖像處理并行算法的研究[D].成都:電子科技大學(xué),2006. [14] 金 偉.基于云計(jì)算的數(shù)字圖像處理平臺(tái)[D].杭州:浙江大學(xué),2011. Research on Image SSIM Paralleling Algorithm with Super Computer CHEN Cong-mei,DU Zheng,JING Ge-xin,ZHAO Xiao-hui,JIN Shao-wei,CHEN Yuan-lei,RAO Qing-lei,WU Hong (National Supercomputing Center in Shenzhen (Shenzhen Cloud Computing Center),Shenzhen 518055,China) With the exponential growth of image information,image processing is faced with the dual challenge of low inefficiencies and poor quality.Image Structural Similarity (SSIM),taken as a common method in the field of image quality assessment,is also faced with the identical problem.Therefore,a method of image SSIM parallel processing based on supercomputers is proposed.The image SSIM parallel processing is implemented based on High Performance Supercomputer Center with computing resources.The three kinds of image information are in the parallel calculation by blocking.The performance of the parallel processing is simulated compared with the serial calculation.The experimental results indicate that in allusion to massive image data,it is far lower in the operation time than serial calculation with larger accelerating ratio and higher efficiency,which is effective and feasible,and makes the real-time processing of image possible. digital image;supercomputing;SSIM;accelerating ratio 2016-10-28 :2017-02-17 < class="emphasis_bold">網(wǎng)絡(luò)出版時(shí)間 時(shí)間:2017-07-11 國(guó)家重點(diǎn)研發(fā)計(jì)劃(2016YFB0201401) 陳聰梅(1989-),女,助理工程師,碩士,研究方向?yàn)閳D形圖像高性能計(jì)算處理;都 政,雙高級(jí)工程師,通訊作者,研究方向?yàn)槌?jí)計(jì)算機(jī)、高性能計(jì)算、云計(jì)算與大數(shù)據(jù)。 http://kns.cnki.net/kcms/detail/61.1450.TP.20170711.1457.082.html TP312 :A :1673-629X(2017)09-0022-04 10.3969/j.issn.1673-629X.2017.09.0053 結(jié)束語(yǔ)