陳加玲, 葉少珍, 2
(1. 福州大學數(shù)學與計算機科學學院, 福建 福州 350108; 2. 福州大學智能制造仿真研究院, 福建 福州 350108)
隨著經濟與科學技術的發(fā)展, 數(shù)字電子設備普及千家萬戶, 同一尺寸圖像在不同屏幕比例的數(shù)字電子設備上普遍存在顯示差異, 于是如何處理圖像與屏幕尺寸不適配問題成為新的研究熱點. 針對這個問題, 傳統(tǒng)圖像縮放技術一般有三種方法, 均勻縮放、 居中裁剪和黑邊填充. 均勻縮放是通過幾何變換方式對圖像像素進行映射填充, 會對圖像的水平及豎直方向上造成擠壓或拉伸形變; 居中裁剪是按顯示屏寬高比盡可能大的范圍裁剪圖像中間區(qū)域, 雖然圖像整體沒有發(fā)生扭曲, 但是圖像信息部分丟失了; 黑邊填充是對圖像進行等比縮放加上邊緣黑色填充, 雖沒有整體扭曲和內容丟失, 但屏幕周圍填充的黑邊, 沒有充分利用屏幕空間特性. 這些傳統(tǒng)技術都采用統(tǒng)一處理方式, 無差別地處理所有結構和內容相差異的圖像, 往往達不到用戶滿意的結果.
與傳統(tǒng)方法不同, 內容感知的重定向方法通過自動識別不同內容區(qū)域的重要程度, 并保持高重要性的主體區(qū)域不變或均勻縮放, 同時允許重要性低且分布均勻的背景區(qū)域盡可能調整和適當變形. 當前內容感知的圖像重定向方法主要有以下幾種: 智能裁剪方法[1-3]、 形變方法[4]、 多操作符方法[5]和Seam Carving方法[6-8]. 智能裁剪方法一般分為基于注意力的和美學導向, 二者統(tǒng)一目標都是基于上下文感知的圖像進行裁剪, 但又有區(qū)別. 基于注意力的方法側重于在裁剪或者調整大小過程中保留視覺重要區(qū)域, 如自動保留注意力百分比方法[3]尋找到注意力和裁剪區(qū)域之間的平衡點; 后者側重于在眾多任意裁剪的子圖中通過圖像質量評估遴選最具視覺吸引力的候選子圖, 如使用貝葉斯網絡作為質量選擇標準, 以流形嵌入算法核心指導圖像裁剪[2], 和選擇寬高比下最大尺寸且最大顯著性得分的子圖的內容保留裁剪(content-persistent thumbnail cropping)方法[1]. 基于形變的方法一般使用一個三角形或四邊形網格對圖像進行分區(qū), 通過調整翹曲圖頂點坐標來實現(xiàn)重定圖像. 如使用貝爾特拉米表示(Beltrami representation)作為翹曲圖[4]維持形變過程的幾何形狀, 然后利用雙射翹曲將翹曲圖映射到重定向目標. 多操作符方法重定向效果往往比單一操作更好, 如結合縫刻、 裁剪、 形變和縮放四種重定向算子, 使用尺度不變特征變換(SIFT)流和結構相似度(SSIM)進行原始圖像和重定向圖像的對應密集和相似度估計, 利用視覺顯著性加權相似度估計結果確定迭代算子[5]. Seam Carving(下稱“SC”)圖像調整技術或稱接縫雕刻[6], 其算法比前面提到的方法都簡單且具有不錯的重定向性能. 這類方法一般通過原圖啟發(fā)式得到代表像素重要程度的能量圖, 根據(jù)能量圖進行反復裁剪水平或者豎直方向能量最小細縫. 但由于能量圖僅檢測到圖像的邊緣信息, 裁剪的細縫不可避免穿過重要主體對象. 近年來不斷有其他研究者提出改進, 如使用原始的梯度圖融合GBVS模型(graph-based visual saliency, GBVS)產生的顯著度圖[7], 通過線性加權和相乘兩種方式得到兩種不同功能的能量圖; 更有利用融合了顯著性和HVS邊緣映射[8], 將平面圖像重定向擴展到立體圖像重定向也取得不錯的效果.
綜上所述, 關于SC算法, 如何得到包含邊緣和保護主體的重定向成為一個共同關注的問題, 本研究提出對應于上述研究問題的雙向接縫剪裁的重定向方法. 首先, 使用融合梯度和顯著圖提出一種新型能量圖; 其次, 提出了SC裁剪策略的改進方法; 最后, 進行多組多方法對比實驗并采用SIFT Flow指標對其質量進行分析和評價.
SC是一種非均勻的圖像大小調整方法, 也是一種內容感知的圖像重定向方法. 根據(jù)能量圖檢測出原圖中不重要區(qū)域, 然后在某一維度貪心的刪除或插入能量最小的細縫. 算法定義能量圖為表示像素重要程度的梯度圖, 定義裁剪縫為圖像中的一條縱向或橫向連續(xù)路徑, 自頂向下的路徑每一行只經過一個像素點, 從左到右的路徑每一列只經過一個像素點. 以搜索最小能量縱向裁剪縫為例, 從第一行開始, 向左下、 正下、 右下方尋找路徑并累計能量. 這樣利用動態(tài)規(guī)劃搜索出能量圖的最小代價路徑稱為“細縫”.
而后注意到細縫移除時會伴隨新的能量插入, 即當前像素及其左上、 正上和右上像素分別作為細縫像素移除后, 周邊像素由不相鄰變?yōu)橄噜彛?則新相鄰像素之間的差值作為額外的移除代價, 如下式所示:
(1)
于是進一步提出向前能量法則的改進, 改進了能量函數(shù)為能量值e(i,j)、 能量累計值C(i,j)、 移除代價公式(1)三方面總和的最小值, 表示為以下公式:
(2)
圖1 算法框架流程圖
雖然SC在重定向方面具有不錯的效果, 但仍存在兩方面問題: 1) 使用梯度能量圖僅僅檢測到圖像的邊緣信息, 容易造成圖像中顯著物體形狀結構被破壞和重要內容缺失的現(xiàn)象. 2) 圖像縮放比率較大且分布均勻的信息在裁剪方向上消耗完時, 裁剪的細縫不僅會穿過感興趣區(qū)域(region of interest, ROI)使圖像發(fā)生扭曲, 而且ROI區(qū)域與全局之間的布局關系受到破壞.
本研究以SC算法為研究對象, 針對以上兩個問題, 首先提出了融合邊緣梯度和內容顯著性的能量圖, 其次基于能量圖又提出了雙向裁剪方法重定向方法. 框架流程如圖1所示, 首先使用原圖自適應生成梯度圖和顯著圖, 二者線性融合得到能量圖; 然后, 使用動態(tài)規(guī)劃方法對能量圖進行水平和豎直兩個方向上搜索最小能量細縫, 根據(jù)原圖和目標圖之間的尺寸關系, 交替插入/刪除豎直/水平細縫; 最后, 得到微調的圖像, 以之取代原圖, 反復迭代前面操作達到目標尺寸.
近年視覺性、 顯著性逐漸受到許多國內外研究者的關注, 通常圖像在沒有給出其他注意力信息的情況下, 人類視覺水平的顯著性作為重要圖的依據(jù)具有重要意義. SC的梯度圖認為圖像邊緣部分是相對比較重要的, 但對于一些多紋理為背景的圖像中, 這種方法常常會喪失前景主體的重要保留. 本研究方法認可傳統(tǒng)方法邊緣檢測的必要性, 但同時額外融合了表征重要對象邊界和主體的顯著圖, 希望通過產生新能量圖對SC算法效果起到較好的提升.
文獻[9]提出的全分辨率頻率調制算法(稱FT法), 能夠高效簡潔地檢測顯著性對象清晰邊界. 文獻[10]提出的快速光柵掃描顯著性檢測算法(稱MB法), 這是一種近似最小障礙距離變換的算法, 對圖像像素波動具有很好的魯棒性, 且能夠捕獲圖像邊界關聯(lián)線索從而保留重要內容. 通過線性融合FT顯著圖、 MB顯著圖及梯度圖并歸一化進而構造出一種新型能量圖.
梯度法定義為表示圖像像素的能量值為x方向和y方向上的梯度絕對值的和, 即下式中e(i,j)對應的是圖像中(i,j)位置像素的能量值. 圖像對應的高能量像素點, 說明該像素點是需要保留的高能量像素值, 對圖像重要性越大, 反之低能量像素值, 保留的意義較弱, 對圖像重要性越小.
(3)
FT顯著性檢測是在顏色空間(lab color space, LAB)下, 利用顏色特征的中央-周邊算子來得到顯著圖, 此算法簡單、 高效而且可以生成全分辨率高質量的顯著圖. 首先, 將輸入圖像I經過高斯濾波得到Ihc, 并將圖像由RGB顏色空間轉換為LAB顏色空間, 取其三通道均值為Iave(lm, am, bm); 然后, 利用均值Iave(lm, am, bm)對圖Ihc每個像素計算歐式距離得到S(x,y)(見下式); 最后, 對S進行最大值歸一化, 即得FT顯著圖.
S(x,y)=|Iave-Ihc(x,y)|
(4)
MB顯著性檢測以最小障礙距離路徑代價計算像素顏色距離, 然后利用快速光柵掃描的迭代方式獲得顯著圖. 首先, 采用Minimum Barrier Distance(MBD)作為路徑代價函數(shù), 選取圖像的邊界像素作為背景種子; 然后, 通過FastMBD計算圖像每個顏色通道的各個像素和背景種子像素的MBD距離圖; 最后, 所有通道累加, 再進行最大值歸一化, 即得MB顯著圖.
如圖2所示, 使用256階灰度圖作為能量圖. 256階灰度圖最亮為255, 最暗為0, 將最亮與最暗之間的亮度變化劃分為256份. 像素灰階是0~255中任意數(shù)值, 表示對應像素的重要性, 像素能量越高, 像素灰階數(shù)值越大, 對應能量圖越亮. 使用圖2(a)梯度法檢測出了表征邊緣重要度的梯度圖Sgrad, 圖2(b)中FT算法檢測出了表示重要對象邊界的顯著圖Sft, 圖2(c)中MB算法檢測出了表示重要對象內容的顯著圖Smb, 對這三種重要性圖使用下式進行線性融合, 然后歸一化得到一種新的能量圖Senery(見圖2(d)). 通過實驗表明, 線性融合的參數(shù)α,β,θ分別控制在0.9~1.1, 0~0.3, 0~0.2之間生成的能量圖重定向效果性能較好. 本研究第三部分實驗采用的參數(shù)為α=1,β=0.25,θ=0.16.
Senery=αSgrad+βSft+θSmb
(5)
(a) 梯度圖
本研究提出結合了裁剪和擴增的雙向接縫裁剪方法, 根據(jù)圖像重定向的目標比例采取適當?shù)牟呗詫λ胶拓Q直兩個方向進行裁剪和插入像素. 具體做法: 使用上面介紹新型能量圖, 根據(jù)能量圖動態(tài)規(guī)劃搜索水平和垂直兩個方向的最小能量細縫, 對于寬高比縮小的一邊使用細縫裁剪, 對于寬高比擴張的一邊使用進行細縫插入, 目的是使得圖像重定向取得較好效果的同時盡可能保留重要內容的布局.
2.2.1結合鄰近相似的像素擴增法
圖3 結合鄰近相似的像素擴增法
重定向方法涉及到圖像擴增插入細縫, 除了找出插入位置還要選取合適的插入像素值, 然后再移動像素, 基于以上因素提出了結合鄰近相似的像素擴增法. 以插入豎直細縫為例(見圖3), 圖左側是能量圖使用動態(tài)規(guī)劃查找最小路徑細縫后, 進行圖像邊緣相似填充; 圖中間是細縫像素a0為中心的3×3的區(qū)域, 選擇周邊8個像素與之最相似的像素作為擴增像素值a8(見下式); 圖右側是擴增像素pi(a8=pi)在細縫像素p2(a0=p2)右側進行插入, 其余像素依次向右移動一個像素單位.
(6)
另外, 對于圖像的非重要邊緣, 如大面積的天空、 草地、 海洋, 這類同質性紋理具有一般重復性, 本文提出使用對稱仿制對同質背景進行像素擴增, 以避免過度細縫剪裁的問題及大幅實失真的現(xiàn)象. 即取原圖四周N行/列像素作為仿制原子, 增加的N列行像素與仿制原子互為對稱.
2.2.2改進算法的設計與整合
實驗使用MIT RetargetMe數(shù)據(jù)集, 采用五種方法與本研究方法進行實驗對比: 人工剪裁(CR)、 均勻縮放(SCL)、 Multi Operator(MULTIOP)[11]、 Scale and Stretch(SNS)[12]、 Seam Carving(SC)[6]. 同時, 設定了4∶3、 2∶1、 3∶4、 1∶2四種不同寬度的縮放比例實驗, 通過分別進行這四種比例的五種方法圖像重定向的對比實驗來驗證本研究提出方法有效性.
為了對重定向方法的性能進行客觀的檢測, 采用SIFT Flow[13]作為本研究提出的重定向方法效果的衡量指標. SIFT Flow質量評價標準能有效地衡量重定向圖像較原始圖像的形狀信息的變化, 在兩幅圖中進行稠密的特征采樣, 找到所有像素點相似處的位移差; 位移差越大, 兩個圖像重要物體之間的形變距離越大, 重定向圖像中的顯著物體較原圖扭曲失真越嚴重. 隨機選取幾組對比實驗進行SIFT Flow質量測評, 從表1的質量評價數(shù)據(jù)來看, 相對于其他的重定向方法, 本研究方法較其他方法在客觀指標上均取得最小值, 也就是圖像重定向前后形狀信息變化和扭曲失真程度都比其他方法小.
表1 SIFT Flow評價指標下其他重定向方法與本研究方法的對比
(a) Original (b) CR (c) SCL (d) MULTIOP (e) SNS (f) SC (g) Ours
(a) Original (b) CR (c) SCL (d) MULTIOP (e) SNS (f) SC (g) Ours
前面兩組都是對于圖像寬度縮小的情況, 后面兩組是圖像寬度擴增. 如圖6所示, 第三組是重定向目標寬為原來的4/3倍(圖6(a)), 第四組是重定向目標為原來的2倍(圖6(b)). 觀察第三、 四組圖像的威尼斯小船和天婦羅碗碟, 對比其他重定向方法的結果及結合前面幾組對比實驗, 可以得出本研究方法都較好地維持原本形狀及主體對象在圖像中的布局.
(a) Original (b) CR (c) SCL (d) MULTIOP (e) SNS (f) SC (g) Ours
本研究提出一種雙向接縫裁剪的圖像重定向改進方法, 結合梯度圖和顯著圖構造了一種新型能量圖, 基于提出的新能量圖, 又對傳統(tǒng)的方法單向過度裁剪造成的問題提出了雙向裁剪接縫的改進. 在當前廣泛使用于重定向領域的公開數(shù)據(jù)集MIT RetargetMe中, 進行了多組多種方法對比實驗, 實驗結果表明該方法相對具有優(yōu)越性. 所提的改進方法適應于不同比例尺寸圖像重定向, 符合人眼視覺中心原則, 在突出重要對象主體和保護重要邊緣信息的同時, 調整了重要內容在圖像整體中的布局.