朱文瀚 翟廣濤 陶梅霞 楊小康 張文軍
摘要:針對(duì)多媒體行業(yè)對(duì)超高清內(nèi)容清晰度用戶(hù)體驗(yàn)評(píng)價(jià)的迫切需求,提出了一種有效的無(wú)參考質(zhì)量評(píng)價(jià)算法,以預(yù)測(cè)目標(biāo)內(nèi)容的用戶(hù)感知體驗(yàn),并區(qū)分原始4K和偽4K內(nèi)容。通過(guò)對(duì)目標(biāo)內(nèi)容進(jìn)行分割,利用局部方差選擇了3個(gè)代表性子塊代替全局來(lái)提高計(jì)算效率。針對(duì)超高清內(nèi)容的特性,提取了復(fù)雜度特征、頻域特征和像素統(tǒng)計(jì)特征。采用支持向量回歸的方法將這些提取的特征融合為一個(gè)質(zhì)量指標(biāo),以預(yù)測(cè)目標(biāo)內(nèi)容的質(zhì)量分?jǐn)?shù)。實(shí)驗(yàn)結(jié)果表明,本模型可以有效地評(píng)估用戶(hù)感知體驗(yàn),并具有良好的辨別真假4K內(nèi)容的能力。
關(guān)鍵詞:用戶(hù)體驗(yàn)質(zhì)量;無(wú)參考質(zhì)量評(píng)價(jià);超高清;自由能原理;頻域分析;自然圖像統(tǒng)計(jì)
Abstract: In response to the urgent demand for assessing the quality of experience of ultrahigh definition content in multimedia industries, a non-reference quality assessment model is proposed to predict the perceptual quality of the target content and distinguish pristine 4K and pseudo 4K contents. Our model segments the image and chooses three representative patches by local variances to improve computing efficiency. According to the characteristics of ultra-high definition content, complexity features, frequency domain features and pixel statistics features are extracted from the representative patches. The support vector regressor is employed to aggregate these extracted features as an overall quality metric to predict the quality score of the target image. The experimental results demonstrate that the proposed method can effectively evaluate quality of user experience and is capable of distinguishing true and pseudo 4K contents.
Keywords: quality of experience; non-reference quality assessment; ultra-high definition; free-energy principle; frequency domain analysis; natural scene statistics
隨著數(shù)字電視與多媒體行業(yè)的高速發(fā)展,超高清內(nèi)容已經(jīng)成為新一代電視、電腦顯示器甚至手機(jī)屏幕的流行配置。由于超高清圖像和視頻在改善用戶(hù)體驗(yàn)方面有著很強(qiáng)的作用,在適當(dāng)?shù)挠^看距離下,4K視頻有生動(dòng)的細(xì)節(jié)呈現(xiàn),清晰度高,能顯著增強(qiáng)視覺(jué)體驗(yàn),因此,超高清內(nèi)容成了時(shí)下最火熱的話(huà)題之一。2012年,國(guó)際電信聯(lián)盟(ITU)發(fā)布超高清電視的國(guó)際標(biāo)準(zhǔn)——ITU-R BT.2020建議書(shū)[1]。該標(biāo)準(zhǔn)正式規(guī)范了4K分辨率為3 840×2 160像素,寬高比為16∶9。此后,各國(guó)制定了相應(yīng)的超高清圖像和視頻標(biāo)準(zhǔn),以更加規(guī)范該行業(yè)[2]。例如,中國(guó)國(guó)家廣播電影電視總局發(fā)布了用于生產(chǎn)和節(jié)目交換的超高清電視系統(tǒng)的參數(shù)值(GY/T 307—2017)和針對(duì)超高清電視圖像質(zhì)量的主觀評(píng)估方法(T/ CSMPTE 3—2018)。在消費(fèi)市場(chǎng)上,各種電子設(shè)備制造商以4K為賣(mài)點(diǎn),宣稱(chēng)其數(shù)字設(shè)備支持超高清內(nèi)容。許多網(wǎng)絡(luò)視頻運(yùn)營(yíng)商還推出了超高清節(jié)目源,例如,Netflix、YouTube、樂(lè)視網(wǎng)、優(yōu)酷和百視通都有4K視頻直播服務(wù)。此外,智能手機(jī)行業(yè)將其注意力轉(zhuǎn)向4K,越來(lái)越多的高端智能手機(jī)以可以拍攝和生成4K圖像和視頻為賣(mài)點(diǎn)。
然而,超高清行業(yè)的發(fā)展同樣會(huì)帶來(lái)一些問(wèn)題。根據(jù)Akamai最近的統(tǒng)計(jì)數(shù)據(jù),只有21%的美國(guó)家庭網(wǎng)速在15 Mbit/s以上,這一傳輸速率被認(rèn)為是有效播放4K視頻的最低門(mén)檻。一些調(diào)查顯示,雖然中國(guó)消費(fèi)了全球約80%的4K電視,但是大部分視頻信號(hào)仍是高清水平。此外,為了推廣4K這一新興賣(mài)點(diǎn),一些內(nèi)容提供商或個(gè)人在網(wǎng)絡(luò)上傳播大量虛假4K視頻。盡管這些“高端”的“4K”視頻具有與自然4K內(nèi)容相同的分辨率,但其往往模糊且缺乏細(xì)節(jié),無(wú)法滿(mǎn)足消費(fèi)者的需求。這些虛假的4K視頻在存儲(chǔ)和傳輸過(guò)程中占用了大量的內(nèi)存和帶寬資源,但卻無(wú)法為用戶(hù)提供相應(yīng)的高質(zhì)量體驗(yàn)。因此,如何將這些偽超高清內(nèi)容從真實(shí)的超高清內(nèi)容中辨識(shí)出來(lái)顯得尤為重要。
圖像質(zhì)量評(píng)價(jià)作為一種預(yù)測(cè)圖像的感知質(zhì)量的方法,在過(guò)去的20年中得到了廣泛研究[3]。一般而言,圖像質(zhì)量評(píng)價(jià)可以分為主觀圖像質(zhì)量評(píng)價(jià)和客觀圖像質(zhì)量評(píng)價(jià)[4]。其中,主觀質(zhì)量評(píng)價(jià)被認(rèn)為是判斷圖像感知質(zhì)量的最準(zhǔn)確方法。研究者們通過(guò)建立許多主觀的圖像質(zhì)量數(shù)據(jù)庫(kù)來(lái)提供各種質(zhì)量和相應(yīng)的真實(shí)質(zhì)量分?jǐn)?shù)的圖像,以促進(jìn)客觀模型的發(fā)展。與主觀評(píng)價(jià)相比,客觀評(píng)價(jià)可以自動(dòng)、高效地預(yù)測(cè)失真圖像的感知質(zhì)量,具有可重復(fù)性高、速度快的特點(diǎn),是質(zhì)量評(píng)價(jià)領(lǐng)域的研究重點(diǎn)。根據(jù)參考圖像的可用信息,客觀的質(zhì)量評(píng)價(jià)算法通??梢苑譃槿珔⒖?、半?yún)⒖己蜔o(wú)參考算法。其中,全參考質(zhì)量評(píng)價(jià)模型可以利用參考圖像的全部信息。均方誤差(MSE)、峰值信噪比(PSNR)和結(jié)構(gòu)相似性算法(SSIM)[5]是全參考領(lǐng)域的3種最經(jīng)典的算法。半?yún)⒖假|(zhì)量評(píng)價(jià)模型則只能使用一部分參考圖像的信息,例如參考圖像的幾個(gè)特征值,但仍可以大大減少傳輸參考圖像時(shí)的信息量[6]。此外,在大多數(shù)的現(xiàn)實(shí)場(chǎng)景中,由于參考圖像并不存在,無(wú)參考圖像質(zhì)量評(píng)價(jià)則可以發(fā)揮出作用,這是因?yàn)樗恍枰獏⒖紙D像就可以準(zhǔn)確地評(píng)估失真圖像的感知質(zhì)量。根據(jù)方法論的不同,無(wú)參考質(zhì)量評(píng)價(jià)模型大致可以分為3大類(lèi):基于自然圖像統(tǒng)計(jì)的模型[7]、基于機(jī)器學(xué)習(xí)的模型[8]和基于人眼視覺(jué)系統(tǒng)的模型[9]。
目前,大多數(shù)圖像質(zhì)量評(píng)價(jià)方法都針對(duì)普通的低分辨率圖像或人為制作的失真圖像。與這類(lèi)圖像不同,超高清圖像具有非常高的分辨率,而人眼很難區(qū)分真實(shí)的超高清圖像和通過(guò)插值算法得到的偽4K圖像。據(jù)我們所知,目前還沒(méi)有專(zhuān)門(mén)針對(duì)這項(xiàng)任務(wù)而設(shè)計(jì)的算法。因此,預(yù)測(cè)超高清圖像的質(zhì)量、區(qū)分真?zhèn)纬咔鍒D像是一個(gè)全新的挑戰(zhàn)。這值得我們?nèi)パ芯楷F(xiàn)有的無(wú)參考質(zhì)量評(píng)價(jià)模型是否可以勝任此任務(wù),同時(shí)值得我們?nèi)パ芯酷槍?duì)超高清圖像質(zhì)量的新算法。
1算法設(shè)計(jì)
1.1圖像分解預(yù)處理
超高清圖像的分辨率比一般的圖像大很多,這會(huì)顯著增加算法的計(jì)算量,造成算法運(yùn)算時(shí)間過(guò)長(zhǎng),不利于算法的實(shí)際應(yīng)用。因此,我們首先嘗試將一個(gè)輸入圖像切成多個(gè)子圖像,以獲得最具代表性的一個(gè)或幾個(gè)子圖像來(lái)代表整個(gè)輸入圖像,然后在這些選定的子圖像上執(zhí)行后續(xù)的特征提取,以減少算法的計(jì)算量。
在給定一個(gè)4K圖像I的條件下,我們首先將I劃分為16×9個(gè)子圖像Ii,j,其中i∈{1,2,...,16},j∈{1,2,...,9}。這使得子圖像Ii,j的寬度像素和高度像素均為240,在隨后的計(jì)算過(guò)程中具有良好的屬性。由于人類(lèi)的拍攝習(xí)慣和節(jié)目拍攝技巧,最重要和最具吸引力的內(nèi)容往往集中在圖像的中心而不是邊緣。因此,為了避免代表性的子圖像出現(xiàn)在圖像的邊緣,例如帶有電視臺(tái)徽標(biāo)、電視節(jié)目名稱(chēng)、字幕和人們不太關(guān)注的圖像內(nèi)容的子圖像,我們縮小了選擇范圍:從左側(cè)的第三列到右側(cè)的第三列,以及從頂部的第二行到底部的第二行。
1.2復(fù)雜度特征提取
在基于人類(lèi)視覺(jué)系統(tǒng)建模的無(wú)參考圖像質(zhì)量評(píng)價(jià)研究中,很多學(xué)者研究自由能原理,并取得了良好的研究成果。自由能原理是在腦神經(jīng)科學(xué)領(lǐng)域里被提出的,用于量化人腦的感知、行為和學(xué)習(xí)的過(guò)程[10]。在圖像處理領(lǐng)域中,自由能被證明可以很好地表征圖像復(fù)雜度特征,并且和圖像質(zhì)量高度相關(guān)[9]。因此,本文中,我們嘗試使用自由能原理模型來(lái)模擬人腦預(yù)測(cè)圖像的過(guò)程,并提取圖像復(fù)雜度特征。
基于自由能的大腦原理的一個(gè)基本前提是,認(rèn)知過(guò)程受人腦內(nèi)部生成模型的控制。當(dāng)人的大腦收到一個(gè)“驚喜”時(shí),大腦會(huì)在其內(nèi)部生成模型,主動(dòng)預(yù)測(cè)有意義的信息并消除殘留的不確定性,以生成一個(gè)預(yù)測(cè)結(jié)果,來(lái)解釋大腦的感知。
通過(guò)大量的實(shí)驗(yàn),我們發(fā)現(xiàn)了真?zhèn)?K圖像能量譜和累積能量譜上的特征。圖1給出了一對(duì)真?zhèn)?K圖像標(biāo)準(zhǔn)化后的能量譜和累積能量譜的示意圖。在圖1(a)中,黑色曲線(xiàn)P1表示真4K圖像,紅色曲線(xiàn)P2表示偽4K圖像,它們都是從低分辨(例如2K、1 080p、720p等)的圖像上采樣得到的。藍(lán)色實(shí)線(xiàn)P3是一條輔助線(xiàn),經(jīng)過(guò)點(diǎn)P1與P2的交點(diǎn)P。px和py分別為交點(diǎn)P的橫坐標(biāo)和縱坐標(biāo)。藍(lán)色虛線(xiàn)P4表示一個(gè)輔助圖像,在整個(gè)頻率上具有相同的能量,且能量高于或低于py。圖1(b)中,Ei為Pi的累積能量譜(i = 1,2,3,4)。由于是標(biāo)準(zhǔn)化后的累積能量譜,P3和P4為相同斜率的一條過(guò)原點(diǎn)的線(xiàn)段。
由頻域能量譜與累積能量譜的關(guān)系可知:
通過(guò)大量的實(shí)驗(yàn)統(tǒng)計(jì),我們對(duì)原始分辨率為4K的圖像,以及從2K、1 080p、720p 3種分辨率插值得到的偽4K圖像的累計(jì)能量譜進(jìn)行了擬合,發(fā)現(xiàn)在這4種情況下,它們的特性均近似滿(mǎn)足:Ei(ω)≈aiωbi。由于Ei的二階導(dǎo)數(shù)小于零,所以它們都是凹函數(shù)。因此,我們可以發(fā)現(xiàn)曲線(xiàn)上的單點(diǎn)具有和E4相同的斜率,如黑色曲線(xiàn)上的點(diǎn)b,紅色曲線(xiàn)上的點(diǎn)e。綠色的虛線(xiàn)是與藍(lán)線(xiàn)平行的輔助線(xiàn)。點(diǎn)b和點(diǎn)e分別為累積能量譜曲線(xiàn)E1和E2與綠色虛線(xiàn)的交點(diǎn),如圖1(b)所示。這些單點(diǎn)在Ei(i = 1,2)和E4之間的最大距離記為L(zhǎng)1和L2。我們利用這些距離作為算法的頻域特征。
綜上所述,我們所提取的頻域成分的特征,可以有效地描述4K圖像的真假,敏感于超高清圖像的質(zhì)量。因此,在本文中,我們將其定義為本算法的頻域特征。
1.4像素統(tǒng)計(jì)特征提取
作為一種對(duì)圖像質(zhì)量很敏感的信息,自然圖像統(tǒng)計(jì)特征在圖像質(zhì)量評(píng)價(jià)領(lǐng)域被廣泛應(yīng)用。因此,本算法在像素層面上,也考慮了統(tǒng)計(jì)信息特征來(lái)提升算法的性能。我們使用了局部的均值去除對(duì)比度歸一化方法來(lái)表征超高清圖像的質(zhì)量變化。
1.5特征融合和模型表示
為了聚合上述提取的與超高清圖像質(zhì)量相關(guān)的特征,并生成質(zhì)量評(píng)價(jià)模型以預(yù)測(cè)目標(biāo)圖像的質(zhì)量分?jǐn)?shù),在綜合考慮了回歸器的有效性和模型的計(jì)算速度后,我們利用支持向量回歸(SVR)方法聚合提出的特征,并采用LIBSVM軟件包來(lái)學(xué)習(xí)有徑向基函數(shù)(RBF)內(nèi)核的模型[13]。
2實(shí)驗(yàn)過(guò)程和分析
2.1實(shí)驗(yàn)數(shù)據(jù)構(gòu)成
為了測(cè)試算法的有效性,我們首先構(gòu)建了真?zhèn)纬咔鍒D像的數(shù)據(jù)庫(kù),并從幾個(gè)現(xiàn)有的超高清視頻序列庫(kù)中獲得了50多段視頻序列。然后,我們從這些具有不同圖像內(nèi)容的視頻序列中提取總共350張真實(shí)4K圖像,得到了真實(shí)4K內(nèi)容數(shù)據(jù)集。這些素材內(nèi)容非常廣泛,包括室外場(chǎng)景、室內(nèi)場(chǎng)景、建筑物、角色、動(dòng)物、靜物、夜景、運(yùn)動(dòng)場(chǎng)景、電影和電視劇片段。接著,我們將真實(shí)的4K圖像下采樣為具有2K、1 080p和720p 3種分辨率的圖像。接著,我們通過(guò)14種不同的插值方法將它們都上采樣到4K分辨率??偣灿? 802個(gè)偽4K圖像構(gòu)成了偽4K內(nèi)容數(shù)據(jù)集。
2.2實(shí)驗(yàn)方案
根據(jù)質(zhì)量評(píng)價(jià)領(lǐng)域的傳統(tǒng)評(píng)估方法,我們使用4個(gè)通用評(píng)估標(biāo)準(zhǔn)來(lái)衡量所有比較的無(wú)參考質(zhì)量評(píng)價(jià)模型的性能,它們分別是斯皮爾曼等級(jí)相關(guān)系數(shù)(SRCC)、肯德?tīng)柕燃?jí)相關(guān)系數(shù)(KRCC)、皮爾遜線(xiàn)性相關(guān)系數(shù)(PLCC)和均方根誤差(RMSE)。此外,我們還計(jì)算了3個(gè)準(zhǔn)確性指標(biāo):精確率(Precision)、召回率(Recall)和準(zhǔn)確率(Accuracy),以比較算法的性能和判斷4K圖像的真實(shí)性。
為了對(duì)所提出的模型進(jìn)行訓(xùn)練,我們將測(cè)試材料隨機(jī)分為兩組:訓(xùn)練集和測(cè)試集,它們分別包含80%和20%的圖像。我們使用訓(xùn)練集訓(xùn)練提出的模型,并使用測(cè)試集測(cè)試其性能。為了保證模型的魯棒性,我們將此過(guò)程重復(fù)了1 000次。這1 000次重復(fù)的中值結(jié)果被認(rèn)為是最終性能。
2.3實(shí)驗(yàn)結(jié)果和分析
表1給出了所有算法的性能結(jié)果。其中,Precision_T和Precision_F分別表示真4K圖像和偽4K圖像素材組的精確率,而Recall_T和Re? call_F分別表示真4K圖像和偽4K圖像素材組的召回率。由表1可知,在傳統(tǒng)指標(biāo)中,與傳統(tǒng)圖像質(zhì)量評(píng)價(jià)數(shù)據(jù)庫(kù)中的性能結(jié)果相比,所有算法的性能均不算出色。例如,這些指標(biāo)中SRCC和PLCC值均不超過(guò)0.9,而通常這些指標(biāo)在傳統(tǒng)的質(zhì)量評(píng)價(jià)數(shù)據(jù)庫(kù)上會(huì)超過(guò)0.9。造成這種現(xiàn)象的主要原因是真實(shí)的4K圖像與其對(duì)應(yīng)的偽4K圖像之間的差距很小,肉眼難以分辨。對(duì)于傳統(tǒng)的人為失真來(lái)說(shuō),這項(xiàng)任務(wù)中的差異微乎其微,甚至很多偽4K圖像的質(zhì)量都要優(yōu)于傳統(tǒng)質(zhì)量評(píng)價(jià)數(shù)據(jù)庫(kù)里的參考圖像。從結(jié)果上看,我們算法的性能明顯優(yōu)于其他主流的無(wú)參考質(zhì)量評(píng)價(jià)模型。我們提出的方法的SRCC值超過(guò)0.8, PLCC值接近0.85,而其他算法的SRCC值大都低于0.7,PLCC值低于0.8。
通過(guò)分析分類(lèi)算法中常用的指標(biāo)精確率、召回率和準(zhǔn)確率的結(jié)果,我們還可以得出這樣的結(jié)論:每個(gè)模型都具有較強(qiáng)的判斷能力,而偽4K圖像的判斷準(zhǔn)確度要優(yōu)于真4K圖像。此外,我們提出的算法具有最佳的性能,綜合判斷精度超過(guò)97%。因此,我們的算法具有優(yōu)秀的區(qū)分真實(shí)和偽4K圖像的能力,并且這種能力與主觀感知分?jǐn)?shù)呈正相關(guān)關(guān)系。
3結(jié)束語(yǔ)
本文中,我們?cè)O(shè)計(jì)了一種新的無(wú)參考質(zhì)量評(píng)價(jià)模型來(lái)評(píng)價(jià)超高清內(nèi)容清晰度的用戶(hù)體驗(yàn)質(zhì)量?;诔咔鍍?nèi)容的特性,我們?cè)谀繕?biāo)內(nèi)容上分別提取復(fù)雜度特征、頻率特征和像素統(tǒng)計(jì)特征,采用具有最高局部方差的3個(gè)子圖代替完整的目標(biāo)圖像以改善計(jì)算效率。支持向量回歸的方法被用于回歸這些特征到一個(gè)整體質(zhì)量指標(biāo)上。實(shí)驗(yàn)表明,在預(yù)測(cè)超高清內(nèi)容清晰度的用戶(hù)體驗(yàn)質(zhì)量方面,本方法優(yōu)于其他最新的無(wú)參考質(zhì)量評(píng)價(jià)模型,并且具有良好的區(qū)分原始和偽超高清圖像的能力。本算法的研究將會(huì)對(duì)超高清內(nèi)容清晰度用戶(hù)體驗(yàn)評(píng)估領(lǐng)域的發(fā)展起到積極的促進(jìn)作用。
參考文獻(xiàn)
[1] ITU. Parameter values for ultra-high definition television systems for production and international programme exchange: ITU-R BT.2020 [S]. 2012
[2] SUGAWARA M, CHOI S Y, WOOD D. Ultrahigh-definition television (rec. ITU-R BT.2020): a generational leap in the evolution of television standards in a nutshell [J]. IEEE signal processing magazine, 2014, 31(3): 170-174. DOI: 10.1109/msp.2014.2302331
[3] ZHAI G T, MIN X K. Perceptual image quality assessment: a survey [J]. Science China information sciences, 2020, 63(11): 211301. DOI: 10.1007/s11432-019-2757-1
[4] ZHU W H, ZHAI G T, MIN X K, et al. Multichannel decomposition in tandem with freeenergy principle for reduced-reference image quality assessment [J]. IEEE transactions on multimedia, 2019, 21(9): 2334-2346. DOI: 10.1109/tmm.2019.2902484
[5] WANG Z, BOVIK A C, SHEIKH H R, et al. Image quality assessment: from error visibility to structural similarity [J]. IEEE transactions on image processing, 2004, 13(4): 600-612. DOI: 10.1109/tip.2003.819861
[6] SOUNDARARAJAN R, BOVIK A C. RRED indices: reduced reference entropic differencing for image quality assessment [J]. IEEE transactions on image processing, 2012, 21(2): 517-526. DOI:10.1109/tip.2011.2166082
[7] MITTAL A, SOUNDARARAJAN R, BOVIK A C. Making a“completely blind”image quality analyzer [J]. IEEE signal processing letters, 2013,20(3):209-212.DOI:10.1109/ lsp.2012.2227726
[8] XU J T, YE P, LI Q H, et al. Blind image quality assessment based on high order statistics aggregation [J]. IEEE transactions on image processing, 2016, 25(9): 4444-4457. DOI: 10.1109/tip.2016.2585880
[9] ZHAI G, WU X, YANG X, et al. A psychovisual quality metric in free-energy principle [J]. IEEE transactions on image processing, 2012, 21(1): 41-52. DOI:10.1109/tip.2011.2161092
[10] KARL F. The free-energy principle: a unified brain theory? [J]. Nature reviews neuroscience, 2010, 11(2): 127-138. DOI: 10.1038/ nrn2787
[11] LIU Y T, ZHAI G T, GU K, et al. Reducedreference image quality assessment in freeenergy principle and sparse representation [J]. IEEE transactions on multimedia, 2018, 20(2): 379-391. DOI:10.1109/tmm.2017.2729020
[12] RUDERMAN D L. The statistics of natural images [J]. Network: computation in neural systems, 1994, 5(4): 517-548. DOI:10.1088/ 0954-898X_5_4_006
[13] SCH?LKOPF B, SMOLA A J, WILLIAMSON R C, et al. New support vector algorithms [J]. Neural computation, 2000, 12(5): 1207-1245. DOI:10.1162/089976600300015565
[14] XUE W F, ZHANG L, MOU X Q. Learning without human scores for blind image quality assessment[C]//2013 IEEE Conference on Computer Vision and Pattern Recognition. Portland, OR, USA: IEEE, 2013: 995-1002. DOI:10.1109/cvpr.2013.133
[15] LIN ZHANG, LEI ZHANG, BOVIK A C. A feature-enriched completely blind image quality evaluator [J]. IEEE transactions on image processing, 2015, 24(8): 2579-2591. DOI: 10.1109/tip.2015.2426416
[16] WU Q B, WANG Z, LI H L. A highly efficient method for blind image quality assessment[C]//2015 IEEE International Conference on Image Processing (ICIP). Quebec City, QC, Canada: IEEE, 2015: 339-343. DOI:10.1109/ icip.2015.7350816
[17] MITTAL A, MOORTHY A K, BOVIK A C. Noreference image quality assessment in the spatial domain [J]. IEEE transactions on image processing, 2012, 21(12): 4695-4708. DOI: 10.1109/tip.2012.2214050
[18] MIN X K, GU K, ZHAI G T, et al. Blind quality assessmentbasedonpseudo-reference image [J]. IEEE transactions on multimedia, 2018,20(8):2049-2062.DOI: 10.1109/ tmm.2017.2788206
[19] MIN X K, ZHAI G T, GU K, et al. Blind image quality estimation via distortion aggravation [J]. IEEE transactions on broadcasting, 2018, 64(2): 508-517. DOI:10.1109/tbc.2018.2816783
[20] NARVEKAR N D, KARAM L J. A no-reference perceptual image sharpness metric based on a cumulative probability of blur detection [C]// 2009 International Workshop on Quality of Multimedia Experience. San Diego, CA, USA: IEEE,2009:87-91.DOI:10.1109/qomex.2009.5246972
[21] XUE W, MOU X, ZHANG L, et al. Blind image quality assessment using joint statistics of gradient magnitude and Laplacian features [J]. IEEE transactions on image processing, 2014, 23(11):4850-4862.DOI:10.1109/ tip.2014.2355716
作者簡(jiǎn)介
朱文瀚,上海交通大學(xué)電子信息與電氣工程學(xué)院、人工智能研究院、教育部人工智能重點(diǎn)實(shí)驗(yàn)室在讀博士研究生;研究領(lǐng)域包含圖像感知質(zhì)量評(píng)價(jià)、圖像視頻信號(hào)處理;發(fā)表國(guó)際學(xué)術(shù)論文17篇。
翟廣濤,上海交通大學(xué)電子信息與電氣工程學(xué)院院長(zhǎng)助理、教授、博士生導(dǎo)師,《Displays》主編,《中國(guó)科學(xué):信息科學(xué)》編委,IEEE電路與系統(tǒng)分會(huì)視覺(jué)信號(hào)處理與通信技術(shù)委員會(huì)(CAS VSPC)成員、多媒體系統(tǒng)及應(yīng)用技術(shù)委員會(huì)(MSA)成員,中國(guó)電子學(xué)會(huì)青年科學(xué)家俱樂(lè)部副主席,上海市圖象圖形學(xué)學(xué)會(huì)副理事長(zhǎng);研究方向?yàn)槎嗝襟w信號(hào)處理等;發(fā)表國(guó)際期刊論文100余篇。
陶梅霞,上海交通大學(xué)電子信息與電氣工程學(xué)院教授、博士生導(dǎo)師,IEEE Fellow,中國(guó)電子學(xué)會(huì)信息論分會(huì)副主任委員,曾任《IEEE Transactions on Wireless Communications》《IEEE Transactions on Communications》《IEEE Journal of Selected Areas in Communications》等期刊的編委或客座編委;獲2019年IEEE通信學(xué)會(huì)馬可尼論文獎(jiǎng)、2013年IEEE通信學(xué)會(huì)海因里希赫茲論文獎(jiǎng);主要從事無(wú)線(xiàn)通信與網(wǎng)絡(luò)基礎(chǔ)研究,包括無(wú)線(xiàn)緩存、邊緣計(jì)算及5G關(guān)鍵技術(shù)等;發(fā)表國(guó)際期刊論文80余篇、國(guó)際會(huì)議論文100余篇。
楊小康,上海交通大學(xué)人工智能研究院常務(wù)副院長(zhǎng)、人工智能教育部重點(diǎn)實(shí)驗(yàn)室主任、教育部“長(zhǎng)江學(xué)者”特聘教授、國(guó)家杰出青年科學(xué)基金獲得者、國(guó)家“萬(wàn)人計(jì)劃”創(chuàng)新領(lǐng)軍人才、IEEEFellow,《IEEE Transactions on Multimedia》《IEEE Signal Processing Letters》編委;研究領(lǐng)域?yàn)閳D像處理與機(jī)器學(xué)習(xí);主持國(guó)家重點(diǎn)研發(fā)專(zhuān)項(xiàng)、“973”項(xiàng)目、國(guó)家自然科學(xué)基金項(xiàng)目等10余項(xiàng),獲國(guó)家科技進(jìn)步二等獎(jiǎng)、中國(guó)電子學(xué)會(huì)自然科學(xué)一等獎(jiǎng)、上海市科技進(jìn)步一等獎(jiǎng)等多個(gè)獎(jiǎng)項(xiàng);發(fā)表國(guó)際學(xué)術(shù)論文200余篇,申請(qǐng)發(fā)明專(zhuān)利50余項(xiàng)。
張文軍,上海交通大學(xué)教授、教育部“長(zhǎng)江學(xué)者”特聘教授、國(guó)家杰出青年科學(xué)基金獲得者、“973”項(xiàng)目首席科學(xué)家、國(guó)家自然科學(xué)基金委創(chuàng)新群體學(xué)術(shù)帶頭人、IEEE Fellow,曾任國(guó)家高清晰度電視功能樣機(jī)系統(tǒng)研發(fā)項(xiàng)目總體組組長(zhǎng)、數(shù)字電視國(guó)家工程研究中心首席科學(xué)家、教育部未來(lái)媒體網(wǎng)絡(luò)協(xié)同創(chuàng)新中心主任,國(guó)際未來(lái)廣播電視合作研究計(jì)劃技術(shù)委員會(huì)主席;主要從事圖像通信與數(shù)字電視、寬帶無(wú)線(xiàn)傳輸、系統(tǒng)芯片設(shè)計(jì)等研究工作,獲國(guó)家科技進(jìn)步二等獎(jiǎng)(2項(xiàng))、何梁何利基金科學(xué)與技術(shù)進(jìn)步獎(jiǎng)、上海市科技進(jìn)步一等獎(jiǎng)(4項(xiàng))、上海市科技功臣獎(jiǎng)。