劉南鋒
摘 ?要:針對(duì)傳統(tǒng)K-Means聚類算法對(duì)圖像分割時(shí)受初始聚類數(shù)目設(shè)定對(duì)像素點(diǎn)進(jìn)行分類存在聚類不準(zhǔn)確、對(duì)聚類中心依賴性較強(qiáng)的問題和無法區(qū)分感興趣區(qū)域(Region of Interest,ROI)和非感興趣區(qū)域(Non Region of Interest,NROI)的弊端,提出一種基于改進(jìn)K-Means聚類的視頻感興趣區(qū)域提取算法。首先,該算法根據(jù)視覺關(guān)注機(jī)制分別確定當(dāng)前幀視頻圖像中運(yùn)動(dòng)劇烈區(qū)域的最小紋理復(fù)雜度和信息熵與運(yùn)動(dòng)平緩區(qū)域的最大紋理復(fù)雜度和信息熵;然后基于K-Means聚類思想隨機(jī)選取k個(gè)初始聚類中心,并采用設(shè)計(jì)的聚類規(guī)則對(duì)像素點(diǎn)進(jìn)行迭代分類,最后對(duì)分類后的各個(gè)聚類集合根據(jù)運(yùn)動(dòng)劇烈區(qū)域與運(yùn)動(dòng)平緩區(qū)域的紋理復(fù)雜度和信息熵進(jìn)行區(qū)域分類,最終確定該視頻幀的感興趣區(qū)域和非感興趣區(qū)域,完成視頻感興趣區(qū)域的提取。消除傳統(tǒng)K-Means聚類算法對(duì)圖像分割時(shí)分類不準(zhǔn)確和魯棒性弱的問題,并提取出視頻的感興趣區(qū)域。
關(guān)鍵詞:K-Means聚類;感興趣區(qū)域;非感興趣區(qū)域;紋理復(fù)雜度;信息熵
0引言
隨著計(jì)算機(jī)視覺領(lǐng)域的發(fā)展,圖像處理在醫(yī)療、軍事、電力等行業(yè)迅猛發(fā)展,而圖像分割作為圖像處理的基礎(chǔ)手段在計(jì)算機(jī)視覺中發(fā)揮著重要作用[1]。人眼視覺關(guān)注機(jī)制表明[2],人眼對(duì)于視頻幀不同區(qū)域具有不同的關(guān)注度,對(duì)于運(yùn)動(dòng)劇烈的區(qū)域,即感興趣區(qū)域更易引起人眼關(guān)注;而對(duì)于運(yùn)動(dòng)平緩區(qū)域,即非感興趣區(qū)域關(guān)注度較低;目前針對(duì)視頻幀的分割目的在于區(qū)別視頻幀中不同運(yùn)動(dòng)劇烈程度的區(qū)域,而忽略了基于人眼視覺關(guān)注機(jī)制對(duì)于圖像的分割。因此,基于人眼視覺關(guān)注機(jī)制對(duì)視頻幀進(jìn)行分割將成為圖像分割領(lǐng)域研究的熱點(diǎn)問題[3]。
為適應(yīng)技術(shù)發(fā)展的要求,國(guó)內(nèi)外學(xué)者提出很多圖像分割算法,傳統(tǒng)圖像分割算法主要包括基于閾值的分割方法[4]、基于區(qū)域的分割方法、基于特定理論的分割方法和基于聚類的分割方法。
1 算法分析
1.1 K-Means聚類算法
K-Means聚類算法是聚類分割領(lǐng)域的經(jīng)典算法,該類算法是一種迭代求解的聚類分析方法,算法是將抽象對(duì)象的集合根據(jù)相似特征分類為多個(gè)類的過程,其目的是最小化對(duì)數(shù)據(jù)點(diǎn)和簇中心之間的緊密性及逆行采樣的目標(biāo)函數(shù)。算法具體步驟為:
(1)初始隨機(jī)選擇k個(gè)對(duì)象像素點(diǎn),每個(gè)對(duì)象代表一個(gè)簇的中心,這里需要提前知道預(yù)知類的數(shù)量,即簇的數(shù)目。
(2)計(jì)算每個(gè)像素點(diǎn)距離簇中心的距離,并將距離簇中心距離近的像素點(diǎn)歸類到該簇中。
(3)經(jīng)過步驟(2)得到每個(gè)簇的初始聚類結(jié)果,對(duì)每個(gè)簇計(jì)算所有像素點(diǎn)距離中心點(diǎn)距離的均值,以該均值點(diǎn)作為該簇的中心點(diǎn),繼續(xù)執(zhí)行步驟(2)
(4)重復(fù)步驟(2)和步驟(3),直到滿足迭代次數(shù)或每個(gè)簇的中心點(diǎn)滿足給定閾值內(nèi)變化,完成算法迭代,實(shí)現(xiàn)像素點(diǎn)的聚類。
從上述步驟可看出該算法易實(shí)現(xiàn),且算法效率較高;但該算法受初始聚類數(shù)目和聚類中心選定的影響,會(huì)影響聚類結(jié)果的精度。
2 基于改進(jìn)K-Means聚類的視頻感興趣區(qū)域提取
針對(duì)K-Means聚類算法受初始聚類數(shù)目和聚類中心影響導(dǎo)致聚類結(jié)果不精確的問題,本文基于視覺關(guān)注機(jī)制對(duì)K-Means聚類算法進(jìn)行優(yōu)化并采用提出的聚類規(guī)則對(duì)視頻進(jìn)行聚類分割,提取出視頻感興趣區(qū)域。算法實(shí)現(xiàn)步驟如下:
(1)人眼視覺關(guān)注機(jī)制表明,均值絕對(duì)偏差( )可很好表征圖像的紋理復(fù)雜度,本文采用 作為衡量圖像紋理特性的依據(jù);同時(shí)信息熵可很好表征數(shù)據(jù)的混亂程度,這里采用信息熵 作為衡量圖像運(yùn)動(dòng)劇烈程度的依據(jù);對(duì)于紋理復(fù)雜度高的區(qū)域,圖像運(yùn)動(dòng)劇烈程度較大,則圖像中像素點(diǎn)的運(yùn)動(dòng)方向混亂程度較高,則該區(qū)域的信息熵較大;而對(duì)于運(yùn)動(dòng)平緩區(qū)域,該區(qū)域像素點(diǎn)運(yùn)動(dòng)方向呈規(guī)律性變化,則該區(qū)域的信息熵較小。基于此,本文選取 和 作為像素劇烈的判斷依據(jù)。首先計(jì)算當(dāng)前視頻處理幀運(yùn)動(dòng)劇烈區(qū)域的最小紋理復(fù)雜度 和最小信息熵 ,運(yùn)動(dòng)平緩區(qū)域的最大紋理復(fù)雜度 和最小信息熵 。
(2)這里隨機(jī)選取k個(gè)聚類中心,將不受原K-Means聚類算法對(duì)類數(shù)目的限制,并對(duì)每個(gè)類以類中心為圓心,1像素為半徑步長(zhǎng)向外擴(kuò)張,每次擴(kuò)張前將計(jì)算當(dāng)前聚類中心圓的 ,同時(shí),將計(jì)算連續(xù)三次聚類時(shí)的 值,并采用如下設(shè)計(jì)聚類規(guī)則進(jìn)行聚類分析:
式中: 表示當(dāng)前類和下一次聚類得到的 差值; 表示運(yùn)動(dòng)劇烈區(qū)域差值的最小值; 表示當(dāng)前類和下一次類的信息熵的差值; 表示連續(xù)兩次迭代信息熵的差值; 表示當(dāng)前點(diǎn)為運(yùn)動(dòng)劇烈區(qū)域和運(yùn)動(dòng)平緩區(qū)域邊界點(diǎn); 表示當(dāng)前點(diǎn)位于運(yùn)動(dòng)平緩區(qū)域; 表示當(dāng)前點(diǎn)位于運(yùn)動(dòng)劇烈區(qū)域; 表示當(dāng)前類不在向外擴(kuò)張; 表示當(dāng)前類繼續(xù)向外擴(kuò)張; 表示連續(xù)三次聚類的相鄰兩次 差值均處于增加狀態(tài),其他三種符號(hào)以此類推; 表示以當(dāng)前類為中心的圓結(jié)束擴(kuò)張。
(3)重復(fù)步驟(2),直至遍歷所有像素點(diǎn),完成所有像素的遍歷。
(4)根據(jù)公式(2)進(jìn)行ROI和NROI的劃分。
式中: 表示當(dāng)前類的 。綜上,即可完成視頻幀ROI和NROI的劃分,實(shí)現(xiàn)視頻感興趣區(qū)域的提取。
3實(shí)驗(yàn)結(jié)果分析
3.1實(shí)驗(yàn)參數(shù)與評(píng)價(jià)指標(biāo)
為驗(yàn)證本文算法的有效性,在硬件配置為:Inter(R) Core(TM) i7-10510U,主頻為2.3GHz,內(nèi)存為16GB;軟件配置為:Microsoft Visual Studio 2010和OPENCV2.4.10的實(shí)驗(yàn)平臺(tái)進(jìn)行實(shí)驗(yàn)仿真。
3.2 實(shí)驗(yàn)結(jié)果分析
本文基于改進(jìn)K-Means聚類進(jìn)行視頻感興趣區(qū)域提取算法相較于傳統(tǒng)基于閾值分割算法、基于區(qū)域分割算法和基于特定理論分割算法可提取精度更高的分割區(qū)域;同時(shí),本文設(shè)計(jì)的聚類規(guī)則可克服傳統(tǒng)K-Means聚類算法依賴初始聚類數(shù)目和聚類中心的影響,對(duì)不同圖像的魯棒性更高,并分割出效果更佳的圖像區(qū)域。同時(shí)本文算法基于視覺關(guān)注機(jī)制采用均值絕對(duì)偏差和信息熵作為提取視頻感興趣區(qū)域的判定依據(jù),可使輸出視頻幀更符合人眼視覺關(guān)注機(jī)制。綜上,本文基于改進(jìn)K-Means聚類進(jìn)行視頻感興趣區(qū)域提取算法可在克服原有K-Means聚類算法不足的基礎(chǔ)上基于視覺關(guān)注機(jī)制提取更符合人眼視覺關(guān)注機(jī)制的視頻感興趣區(qū)域。
本文算法目的時(shí)消除現(xiàn)有K-Means聚類算法的不足,并基于K-Means聚類算法提出一種視頻感興趣區(qū)域提取算法。
4 結(jié)論
本文提出一種基于改進(jìn)K-Means聚類的視頻感興趣區(qū)域提取算法,該算法首先基于視覺關(guān)注機(jī)制分別確定當(dāng)前處理幀的運(yùn)動(dòng)劇烈區(qū)域最小紋理復(fù)雜度和信息熵與運(yùn)動(dòng)平緩區(qū)域的最大紋理復(fù)雜度和信息熵;然后,采用設(shè)計(jì)的聚類規(guī)則對(duì)當(dāng)前視頻幀進(jìn)行聚類,得到最后的聚類集合;最后,基于運(yùn)動(dòng)劇烈和運(yùn)動(dòng)平緩區(qū)域的紋理復(fù)雜度和信息熵的關(guān)系確定當(dāng)前視頻幀的感興趣區(qū)域和非感興趣區(qū)域,最終提取視頻感興趣區(qū)域。本文算法可很好克服現(xiàn)有K-Means聚類算法的不足,并獲得精度更高,更符合人眼視覺關(guān)注機(jī)制的視頻感興趣區(qū)域。
參考文獻(xiàn):
[1]楊宇,崔陶.基于深度學(xué)習(xí)和水平集的彩色圖像分割方法(英文)[J/OL].四川大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,4(4):1-12.
[2]危水根,王程偉,陳震,張聰炫,張曉雨.基于視覺注意機(jī)制的紅外弱小目標(biāo)檢測(cè)[J].光子學(xué)報(bào),2021,50(01):181-195..
[3]劉俠,余鴻波,李冰,王波.基于改進(jìn)U-Net模型下的椎骨CT圖像分割方法[J/OL].哈爾濱理工大學(xué)學(xué)報(bào),2021,4(03):58-64.
[4]余博文.數(shù)字圖像閾值分割研究與應(yīng)用[J].科學(xué)技術(shù)創(chuàng)新,2021,4(19):91-92.