袁小艷
(四川文理學(xué)院智能制造學(xué)院,四川達(dá)州 635000)
巴文化是我國古代西南地區(qū)在其長達(dá)千余年的歷史和演進(jìn)中,形成的一支重要地域性文化,其在當(dāng)時具有“巴人故里”之稱的達(dá)州更是深入人心,廣為流傳。隨著互聯(lián)網(wǎng)的普及和發(fā)展,巴文化遺產(chǎn)的數(shù)字化保護(hù)也逐步進(jìn)入大家的視線,在巴文化遺產(chǎn)的數(shù)字化保護(hù)過程中,各種陶器、青銅器、圖騰、服裝等大量涌現(xiàn),這些數(shù)以萬計的圖像和信息需要采用先進(jìn)的數(shù)字技術(shù)作為輔助的手段來對其進(jìn)行圖像識別和類型劃分,從而為巴文化遺產(chǎn)的后續(xù)三維展示、虛擬化傳播等工作提供分析和支撐基礎(chǔ),以推動巴國文化遺產(chǎn)的數(shù)字化保護(hù)。
圖像顯著性檢測作為圖像識別的重要組成部分,可以讓人們通過顏色、紋理、形狀、空間等關(guān)系快速、準(zhǔn)確地定位目標(biāo),即顯著性區(qū)域,它在巴文化圖像數(shù)據(jù)的解讀、圖像數(shù)據(jù)的分析和巴文化圖像數(shù)據(jù)的應(yīng)用方面有著十分廣泛的應(yīng)用前景。文中對巴文化圖像的顯著性檢測進(jìn)行了研究。
在面對某個場景時,人們會自動地對感興趣區(qū)域進(jìn)行處理,卻選擇性地忽略不感興趣的區(qū)域,這些感興趣的區(qū)域被稱作顯著性區(qū)域[1]。圖像的顯著性檢測,就是通過智能化的算法來模擬一個人的視覺特點(diǎn),提取出圖像的顯著性區(qū)域[2]。由于人的視覺系統(tǒng)就是從不同的角度反映所接收的信息,所以在視覺中所觀察得到的每一種特征都是不同角度的體現(xiàn)。因此在顯著性檢測過程中,可以從事物的不同特征等方面進(jìn)行檢測,如顏色、紋理、形狀等。
視覺心理學(xué)的許多研究成果表明,顏色是視覺注意階段的基本特征。圖像分析的基礎(chǔ)是就是利用顏色空間進(jìn)行顏色的選擇,常用的顏色空間有HSV、CIEXYZ、CIELuv 和CIELab 等。不同的顏色空間在顏色特征分析時需要進(jìn)行相互轉(zhuǎn)換,大多工作都偏向于使用CIELab 顏色模型。紋理通常認(rèn)為是物體表面某種顏色改變或某種分布運(yùn)動規(guī)律的變化,比如斑馬或者老虎身上的條紋,這種規(guī)律具有一定的重復(fù)特征、均勻特征和方向特征。物體與圖像背景區(qū)域邊界的相互結(jié)合處稱為物體輪廓,而這種輪廓特征是一個物體除了色彩特征外較為重要的一種特征,還有一種說法認(rèn)為這是物體的形狀特征。在顯著性檢測技術(shù)的研究發(fā)展過程中,為了更好地準(zhǔn)確描述物體的輪廓特點(diǎn),研究者們還通過計算面積、矩形度、圓角度、不變量矩等特征來準(zhǔn)確地表現(xiàn)物體的輪廓。近年來,出現(xiàn)了許多用于檢測物體輪廓的方法,如Sobel 算子、Robert 算子、Canny 算子等。
對于川東地區(qū)而言,特別是達(dá)州市,巴文化本身就是最佳的歷史文化產(chǎn)業(yè)和品牌,它極大地豐富了達(dá)州這座城市的文化內(nèi)涵,使其逐步發(fā)展成為一個擁有豐厚歷史和深沉文化底蘊(yùn)的城市。巴文化早已在達(dá)州深入人心,廣泛傳播,其已經(jīng)逐漸發(fā)展成為了達(dá)州市的一種文化符號和象征[3]。達(dá)州發(fā)展巴文化,圖像數(shù)據(jù)不可或缺,當(dāng)然對巴文化圖像顯著性檢測的研究更需要加大力度。
為了深入探究達(dá)州市巴文化圖像顯著性檢測的現(xiàn)狀,對被調(diào)查人員采取了一種不記名的隨機(jī)調(diào)查模式,在充分保證被調(diào)查人員有正常認(rèn)知和理解能力的前提下,不再限制被調(diào)查人員的年齡、性別及職業(yè)。調(diào)研工作全過程做到實(shí)事求是,確保了調(diào)研內(nèi)容的準(zhǔn)確和真實(shí)。這次主題問卷調(diào)查共向廣大市民朋友發(fā)放了1 000 份有效的調(diào)查問卷(612 份紙質(zhì)版,388 份電子版),經(jīng)過嚴(yán)格篩選,有效調(diào)查問卷共982份,其中紙質(zhì)版602 份,電子版380 份,回收率為98.2%,具體見表1 所示。
表1 調(diào)查問卷的發(fā)放和回收情況
1)巴文化圖像內(nèi)容及獲取途徑。調(diào)查結(jié)果顯示,眾多受調(diào)查者日常生活中常常見到的巴文化內(nèi)容有巴文化石刻、陶器和圖騰、符號等,如表2 所示。
表2 日常關(guān)注的巴文化圖像內(nèi)容情況
另外,從調(diào)查的資料數(shù)據(jù)中也可以清楚地得出,博物館和巴文化景觀已經(jīng)逐步發(fā)展為人們收集和獲取巴文化資源信息最主要的途徑,遠(yuǎn)遠(yuǎn)超出了我國電視、廣播和報紙、刊物等其他的傳統(tǒng)媒體,如表3所示。
表3 獲取巴文化圖像的途徑情況
2)對巴文化圖像的認(rèn)知情況。從被調(diào)查人員對巴文化圖像認(rèn)知情況的問卷調(diào)查分析結(jié)果來看,65.2%的被調(diào)查人員對巴文化圖像基本有所了解,不太了解的人數(shù)次之,占25.8%,完全不了解的占5.7%,非常了解并熟悉的人數(shù)最少,只有3.3%。由此可以清晰地看出,雖然巴文化在達(dá)州廣為流傳,但是并沒有引起太多研究人員的關(guān)注和深入研究,大部分也只是停留在對巴文化表面的認(rèn)知和理解而已,具體數(shù)據(jù)見表4。
表4 對巴文化圖像的了解情況
3)對圖像顯著性檢測的認(rèn)知情況。自從顯著性檢測引入到圖像中以來,廣大研究者都進(jìn)入到該領(lǐng)域進(jìn)行研究,這些研究支撐著圖像分割、圖像拼接及圖像識別。但是,在調(diào)查過程中發(fā)現(xiàn),96.6%的受調(diào)查者不了解顯著性檢測,只有0.5%的人是了解的,具體數(shù)據(jù)見表5。
表5 對圖像顯著性檢測的認(rèn)知情況
從這次調(diào)查的結(jié)果中可以清晰地看到,被調(diào)查人員對圖像顯著性檢測的專業(yè)性和認(rèn)知情況堪憂,究其原因,一方面是顯著性檢測的專業(yè)性較強(qiáng),一般人都對它不甚了解;另一方面,廣大人民群眾只是了解圖像,但卻不知道圖像間是如何聯(lián)系、如何檢測的。
4)對數(shù)字化保護(hù)的了解和認(rèn)知情況。從被調(diào)查人員對數(shù)字化保護(hù)認(rèn)知狀況的調(diào)查結(jié)果及分析來看,78.2%的被調(diào)查人員完全不了解數(shù)字化保護(hù),只有4.6%的人認(rèn)為自己是了解的,具體數(shù)據(jù)見表6。
表6 對數(shù)字化保護(hù)的了解情況
5)對巴文化數(shù)字化保護(hù)的認(rèn)知情況。在調(diào)查過程中發(fā)現(xiàn),83.7%的受調(diào)查者不了解巴文化數(shù)字化保護(hù),只有2.6%的人是了解的,具體數(shù)據(jù)見表7。
表7 對巴文化數(shù)字化保護(hù)的認(rèn)知情況
從調(diào)查結(jié)果可以分析出,受調(diào)查者對數(shù)字化保護(hù)有一定的認(rèn)知,但對巴文化數(shù)字化保護(hù)的認(rèn)知不足,說明達(dá)州市對巴文化的宣傳力度是不夠的,對巴文化的數(shù)字化保護(hù)也不到位。
巴文化遺產(chǎn)的數(shù)字化保護(hù)與開發(fā)主要是對巴文化資源的各種數(shù)字化保存、數(shù)字處理分析和數(shù)字化挖掘及應(yīng)用,即如何充分挖掘和合理利用古老而充滿生機(jī)的巴文化遺產(chǎn)資源,為今天的達(dá)州、巴中等市的發(fā)展發(fā)揮積極的推動作用[3]。巴文化資源有巴文化符號、巴文化圖騰、巴文化石刻、巴文化陶器、巴文化服飾、巴文化建筑、巴渝舞等,這些資源均有大量的圖像資料,研究各種巴文化資源的特征,并能根據(jù)這些特征快速定位圖像的顯著區(qū)域,進(jìn)而為巴文化各類型圖像的分割、識別、語義標(biāo)注提供依據(jù),達(dá)到圖像資料保護(hù)的目的,這便是該文的核心內(nèi)容。
到目前為止,圖像顯著性特征多種多樣,如顏色、形狀、紋理、空間、邊框、HOG、Focusness、Objectness等。巴文化圖像有符號、圖騰、石刻、陶器、服飾、建筑、舞蹈等,其特點(diǎn)是“粗獷”,符號比較簡單,顏色不豐富,形狀較清晰,紋理較細(xì)膩,沒有復(fù)雜背景,又由于顯著性檢測是巴文化圖像其他技術(shù)的基礎(chǔ),因此其不適用于太復(fù)雜的特征,僅僅只需要簡單、快速的特征即可。巴文化圖像的特征可以分為3 類,適合符號、陶器的顏色、形狀特征,即側(cè)重于形狀;適合于圖騰、石刻、建筑的形狀、紋理特征,即側(cè)重于紋理;適合于服飾、舞蹈的顏色、紋理特征,即側(cè)重于顏色。
圖像顯著性的檢測算法多種多樣,如Itti、FT、HFT、DHFT、HC、HOG、HDCT、LBP、OUF、RBD 等。其中FT、HFT、DHFT 算法是將圖像變換到頻域,在頻域采用濾波器的方法來獲取顯著性信息,HFT 采用不同尺度的高斯核函數(shù)進(jìn)行濾波處理,然后基于熵準(zhǔn)則的優(yōu)選方法選擇最優(yōu)顯著圖。其中Itti、HC、HOG、LBP、OUF、RBD 等算法工作于空域。Itti 算法被認(rèn)為是最早的基于人體生物學(xué)原理的顯著性檢測算法[4],其計算圖像中心-環(huán)繞區(qū)域的顏色、亮度、方向的差異;HC 是采用顏色直方圖的對比度來計算顯著性的,去掉了低頻的顏色,加快了速度,并且可以進(jìn)行全局統(tǒng)計;HOG、梯度直方圖計算圖像中每個單位像素的梯度,并統(tǒng)計每個單元的梯度值,然后進(jìn)行累加,它對于圖像的幾何和光學(xué)的形變都能夠保持良好的不變性,從而直接獲得圖像的形狀和紋理特征;LBP 算法主要用于分析和提取圖像中各個局部的紋理特征,具有灰度不變性和旋轉(zhuǎn)不變性兩大主要優(yōu)點(diǎn),其中直方圖算法就是根據(jù)圖像局部塊的LBP 值統(tǒng)計得到的;OUF 算法主要用于計算Objectness、Uniqueness、Focusness 等高級特征;RBD算法則是通過計算背景特征來獲得顯著圖。頻域算法相對于空域算法來說,可調(diào)參數(shù)少、計算速度快??沼蛩惴ǖ男畔⒏S富,但也更復(fù)雜。
巴文化圖像的特點(diǎn)是符號簡單、紋理豐富、顏色單一、形狀清晰、輪廓分明,因此選擇顯著性檢測算法時可以不計算較復(fù)雜的特征,只需要計算形狀、紋理、顏色等特征即可。不同類型的巴文化圖像,算法也是不一樣的。符號、陶器側(cè)重于形狀特征,可以使用HOG 算法,并加入RGB 顏色特征;圖騰、石刻、建筑側(cè)重于紋理特征,可以使用LBP 算法,適度加入HOG 形狀特征;服飾、舞蹈色彩鮮麗,側(cè)重于顏色,可以使用HC 算法,加入Gabor 濾波器來獲取紋理特征。以上3 種算法都可以加入頻域的HFT 算法,這樣會更精確。
圖像顯著性的評估方法有3 種。PR 曲線用于評估實(shí)驗(yàn)的精準(zhǔn)率P和召回率R,精準(zhǔn)率指的是顯著像素正確檢測的比率[5],召回率指的是檢測出來的顯著像素與真值圖中顯著像素的比率[5]。F-measure 是圖像顯著性檢測算法常用的方法之一,是其精準(zhǔn)率和召回率的平均值。MAE 直方圖方法是檢測平均絕對誤差,用于檢測非顯著區(qū)域[5]。
巴文化圖像的背景區(qū)域較簡單,前景顯著圖也清晰,所以用PR 曲線評估算法即可。
作為“巴人故里”的達(dá)州,其相關(guān)圖像眾多,當(dāng)前需要采用數(shù)字化手段對其進(jìn)行采集、保存、處理、修復(fù)、展示和傳播。對巴文化圖像進(jìn)行修復(fù)、展示、傳播需要對圖像進(jìn)行識別、分割、拼接,這些必須以圖像顯著性檢測為基礎(chǔ)。目前達(dá)州巴文化保護(hù)和開發(fā)主要體現(xiàn)在3個地方:達(dá)州市博物館、宣漢羅家壩遺址、達(dá)州巴人文化廣場,這3 個地方僅僅只是把巴文化遺址出土的文物進(jìn)行了展示,將“巴人、巴國、巴魂”進(jìn)行了簡單的復(fù)制,完全沒有采用數(shù)字化技術(shù)保護(hù)和開發(fā)巴文化,也沒有對巴文化進(jìn)行宣傳,更沒有將巴文化融入產(chǎn)業(yè)中,因此也未涉及圖像的顯著性檢測。
文中主要對巴文化圖像進(jìn)行了顯著性檢測,如圖1 所示。巴文化圖像首先按照兩種方式進(jìn)行分割:多尺度分割和超像素分割。多尺度分割后得到多尺度圖像,采用HFT 頻域算法得到多尺度顯著圖,并根據(jù)熵選擇最優(yōu)顯著圖;超像素分割后,根據(jù)不同類型巴文化圖像分別提取顏色、紋理和形狀特征,形成相應(yīng)的顯著圖,然后進(jìn)行線性融合;最后將兩個顯著圖進(jìn)行貝葉斯融合。
圖1 巴文化圖像顯著性檢測算法
文中以四川省達(dá)州市博物館內(nèi)的巴文化圖像為例,進(jìn)行顯著性檢測研究。其主要技術(shù)包括多尺度圖像生成、超像素分割、特征提取、多尺度顯著圖選擇和顯著圖融合等5 個環(huán)節(jié)。多尺度分割就是在頻域上對各種不同帶寬的高斯核函數(shù)信號進(jìn)行濾波和處理,以便于得到各種尺度的顯著目標(biāo)[6];超像素分割技術(shù)主要是將一張圖像劃分為多個相關(guān)的子區(qū)域,即多個像素的集合,也可以稱之為超像素[7];特征提?。何闹胁捎肏C 方法直接提取圖像中的顏色特征,采用HOG 算法提取圖像的形狀特征,采用LBP算法提取圖像的紋理特征,各種特征各自形成相應(yīng)的顯著圖;不同尺度的特征圖所表達(dá)信息的重要性是完全不一樣的,所以在頻域上多尺度顯著圖科研使用信息熵最小的方法進(jìn)行選擇;顏色、紋理、形狀顯著圖的融合則采用線性融合的策略,即通過加、乘、取對數(shù)等方法進(jìn)行融合,這種方法被認(rèn)為是迄今為止最簡單、效率最高的一種融合方法;空域和頻域顯著圖使用了貝葉斯方法進(jìn)行融合,用概率表示所有顯著圖的可靠性和不確定性,利用樣本對象的先驗(yàn)概率來計算其后驗(yàn)概率,即該對象是否屬于某一個類別的概率。選擇一個具有最大后驗(yàn)概率的類別作為該對象的所屬類,也就是說,貝葉斯分類器實(shí)際上是最小錯誤率意義上的優(yōu)化。
巴文化的研究已經(jīng)起步多年,達(dá)州市的巴文化研究早在2011 年就已經(jīng)開始,2018 年就明確了巴文化高地建設(shè)的“12359”戰(zhàn)略。在數(shù)字化技術(shù)飛速發(fā)展的今天,將數(shù)字化技術(shù)運(yùn)用到巴文化遺產(chǎn)的研究保護(hù)與挖掘開發(fā)中,能夠充分地挖掘和利用巴文化遺產(chǎn)中文化元素資源潛在的社會價值。在現(xiàn)代數(shù)字化信息技術(shù)中,圖像作為信息數(shù)據(jù)資源最有應(yīng)用價值。圖像的處理無時無刻都離不開對圖像顯著性檢測的分析和研究,例如巴文化符號的識別和跟蹤的原理是由于目標(biāo)的某種顯著性特征可以被識別;巴文化圖像的檢索中,根據(jù)圖像的顏色、紋理、形狀以及像素構(gòu)成快速地搜索目標(biāo)圖像的信息,與此同時,還可以實(shí)現(xiàn)感興趣區(qū)域圖像的精確壓縮存儲,從而優(yōu)化存儲的性能,節(jié)約存儲的空間。文中對巴文化圖像的顯著性檢測研究僅僅只是開始,未來還需要進(jìn)一步發(fā)展相關(guān)研究。