亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于注視興趣區(qū)域聚類和轉(zhuǎn)移的群體掃視路徑生成

        2021-01-21 03:23:14劉楠博張文雷李旺鑫
        計算機(jī)應(yīng)用 2021年1期
        關(guān)鍵詞:注視點觀察者聚類

        劉楠博,肖 芬,張文雷,李旺鑫,翁 尊

        (智能計算與信息處理教育部重點實驗室(湘潭大學(xué)),湖南湘潭 411105)

        0 引言

        人類通過視覺這一重要感官捕獲到日常生活中的海量信息。在人類視覺系統(tǒng)(Human Visual System,HVS)選擇注意機(jī)制的引導(dǎo)下,人們將視覺注意集中于海量信息的感興趣區(qū)域(Region Of Interest,ROI),摒棄了其中的大量冗余,使人腦實時、高效地完成視覺信息處理[1]。挖掘、研究人類視覺系統(tǒng)的選擇注意機(jī)制,賦予機(jī)器類人的視覺信息處理能力,對于人工智能和機(jī)器視覺領(lǐng)域的發(fā)展具有重要意義[2]。

        目前,人們利用眼動追蹤技術(shù)記錄的眼動數(shù)據(jù)研究視覺注意的分布和轉(zhuǎn)移。原始的眼動數(shù)據(jù)是通過紅外設(shè)備以一定頻率采集的視線位置樣本點,經(jīng)后處理操作可以得到注視點數(shù)據(jù)和掃視路徑數(shù)據(jù)。長期以來,多數(shù)工作利用計算建模的方法挖掘群體觀察者的注視點數(shù)據(jù)研究人類的視覺注意機(jī)制,通過生成靜態(tài)顯著圖直接、整體地反映人類對圖像場景的視覺注意程度[3-6]。然而人類觀察圖像是一個動態(tài)的視覺注意轉(zhuǎn)移過程,靜態(tài)顯著圖無法反映群體觀察者整體的視覺注意轉(zhuǎn)移模式。相較于注視點數(shù)據(jù),掃視路徑數(shù)據(jù)額外記錄了注視點的轉(zhuǎn)移信息,可以反映視覺注意的動態(tài)變化,具有更高的研究價值。

        在相同的觀看條件下,群體觀察者的掃視路徑雖然復(fù)雜多變,但是個體掃視路徑間具有相似但不等同的潛在特性[7]。例如,通過分析閱讀場景下的群體觀察者的掃視路徑數(shù)據(jù)探索中文閱讀中的詞切分,研究人類的閱讀認(rèn)知行為[8];通過研究廣告與網(wǎng)頁等刺激樣本下的群體掃視路徑設(shè)計,可以設(shè)計并優(yōu)化網(wǎng)頁排版[9-14];自然場景下通過歸結(jié)表征群體的掃視路徑,不僅能為基于深度學(xué)習(xí)的掃視路徑預(yù)測模型提供監(jiān)督信息,而且有助于計算機(jī)優(yōu)先定位、處理人類的感興趣區(qū)域信息,提升智能圖像處理模型的速度和精度[15-16]。挖掘群體觀察者的掃視路徑數(shù)據(jù),歸結(jié)一條包含共有注視信息和注視轉(zhuǎn)移模式的群體掃視路徑,不僅能夠表征刺激樣本和刺激內(nèi)容對人類的吸引程度,更重要的是,可以建模人類的動態(tài)視覺注意,對于探究人類的認(rèn)知行為、精準(zhǔn)改善視覺效果、提升計算機(jī)視覺的智能性都具有重要理論意義。

        1 相關(guān)工作

        近年來,群體掃視路徑研究相對較少,現(xiàn)有的生成方法主要基于三種思路。其一,將群體觀察者的掃視路徑映射為字符串序列,利用序列模式挖掘進(jìn)行群體注視模式歸結(jié)。2006年West 等[17]開發(fā)了eyePatterns 工具,該工具通過統(tǒng)計單個序列中所有子序列模式及出現(xiàn)頻率,提取出現(xiàn)次數(shù)或涵蓋人數(shù)最多的序列模式生成群體掃視路徑;同年,Hembrooke 等[18]提出多序列對齊方法,通過迭代過程將某一序列與其他所有序列逐一進(jìn)行對齊操作,提取共有、對齊的子序列和序列元素生成群體掃視路徑;2010 年Goldberg 等[19]提出Dotplot 對齊算法,可用于提取兩個序列的共有、最長序列模式,在此基礎(chǔ)上Eraslan 等[9]提出eMine 方法,通過迭代過程提取所有序列的共有、最長序列模式;2012 年,Hejmady 等[20]提出序列模式挖掘算法(Sequential Pattern Mining Algorithm,SPAM),通過提取所有序列的頻繁子序列生成群體掃視路徑。此類方法可以挖掘有代表性的子序列和序列元素,但當(dāng)個體注視行為差異較大,沒有共同子序列或共同子序列過短時都會影響生成路徑質(zhì)量。其二,確定群體觀察者的共同視覺元素,歸結(jié)其轉(zhuǎn)移模式。2010 年Tsang 等[21]開發(fā)了eSeeTrack 工具,按照時間軸生成群體觀察者視覺元素間轉(zhuǎn)移概率的可視化樹,并分析群體的注視轉(zhuǎn)移模式;2014 年Chuk 等[22]及2015 年Kang 等[23]構(gòu)建視覺元素間的馬爾可夫轉(zhuǎn)移概率矩陣,研究群體的注視轉(zhuǎn)移模式。采用這些策略依據(jù)視覺元素間的轉(zhuǎn)移概率生成群體路徑時,常常存在重復(fù)、循環(huán)某一轉(zhuǎn)移模式的現(xiàn)象,為防止生成路徑過長需要預(yù)設(shè)長度閾值。2016 年Eraslan 等[11]提出掃視路徑趨勢分析(Scanpath Trend Analysis,STA)方法,該方法對網(wǎng)頁進(jìn)行分割,將所有觀察者觀看的區(qū)域視作共同視覺元素,定義優(yōu)先度排序共同視覺元素,最終生成群體掃視路徑。其三,將群體觀察者的掃視路徑表征為多個多維向量,尋找或生成表征群體的掃視路徑向量。2017 年Li 等[15]提出基于候選約束的動態(tài)時間規(guī)整質(zhì)心平均方法(Candidate-constrained Dynamic time warping Barycenter Averaging method,CDBA),通過動態(tài)時間規(guī)整策略找出與其他個體掃視路徑動態(tài)時間規(guī)整距離最小的一條個體掃視路徑,使用親和力傳播聚類算法生成的聚類區(qū)域調(diào)整該個體路徑中的注視點,最終生成群體掃視路徑。2018 年Li 等[16]提出Heuristic 方法,該方法在CDBA框架的基礎(chǔ)上加入注視時間分析模塊,生成包含注視時間的群體掃視路徑。此方法中動態(tài)時間規(guī)整策略找出的個體掃視路徑往往較短,直接受該個體路徑影響,生成的群體掃視路徑包含的注視興趣區(qū)域數(shù)目較少、路徑長度較短。

        值得注意的是,目前掃視路徑的研究主要針對的是網(wǎng)頁場景[9-14,17-18,20,22-23]、自然場景的掃視路徑研究較少[15-16]。究其原因,本文認(rèn)為網(wǎng)頁排版較為固定,注視區(qū)域基本呈現(xiàn)F 型,所以掃視路徑相對有規(guī)律,生成較簡單;而自然圖像中由于場景的多樣性、目標(biāo)的復(fù)雜性,導(dǎo)致注視區(qū)域復(fù)雜多變,因此群體掃視路徑研究相對困難,生成方法十分欠缺。本文借鑒自然場景中聚類注視點生成注視區(qū)域的思想以及網(wǎng)頁場景中注視區(qū)域的轉(zhuǎn)移策略,考慮不同類型的注視行為,提出了一種針對自然場景的群體路徑生成方法。圖1 展示了所提生成方法的模型框架。

        圖1 群體掃視路徑生成模型的框架Fig.1 Framework of group scanpath generation model

        2 基于注視興趣區(qū)域轉(zhuǎn)移的群體掃視路徑生成方法

        2.1 注視興趣區(qū)域提取

        眾所周知,人類在觀察、獲取圖像信息時,圖像對人類的視覺吸引源于場景中的某個區(qū)域而非某個具體像素。即使觀察者們注視了場景中的同一區(qū)域,由于高度的觀察自由度,注視點著落的像素位置不盡相同。本文通過親和力傳播(Affinity Propagation,AP)聚類算法[24]對位置相關(guān)的觀察者注視點進(jìn)行聚類,確定注視興趣區(qū)域。

        AP 算法適用于高維、多類型數(shù)據(jù)的快速聚類。該算法無需事先設(shè)定生成聚類的數(shù)目,將所有數(shù)據(jù)點都視作潛在意義上的聚類中心,通過數(shù)據(jù)點間的通信,找出最適合作聚類中心的數(shù)據(jù)點。算法輸入節(jié)點間相似度矩陣S,s(i,j)表示節(jié)點i和j之間的相似度;定義節(jié)點間的吸引度矩陣R和歸屬度矩陣A,并通過如式(1)~(3)更新矩陣(R0,A0均為零矩陣),直至聚類結(jié)果穩(wěn)定或算法執(zhí)行超過設(shè)定的迭代次數(shù)(1 000次),結(jié)束算法,輸出聚類結(jié)果。

        其中:rt+1(i,j)表示t+1時刻節(jié)點j作i聚類中心的適合程度,at+1(i,j)表示t+1時刻節(jié)點i對j作其聚類中心的認(rèn)可程度。

        對自然場景圖像,本文將所有p名觀察者注視點位置的負(fù)歐氏距離作為相似度矩陣S,執(zhí)行AP 算法生成n個聚類注視點的集合Θ1,Θ2,…,Θk,…,Θn,將每個集合作為一個注視興趣區(qū)域,其邊界由集合中注視點的位置確定。

        2.2 注視興趣區(qū)域篩選

        每個注視興趣區(qū)域包含了不同的圖像內(nèi)容,對群體觀察者具有不同的視覺吸引程度。為獲取能夠吸引群體視覺注意的興趣區(qū)域,本節(jié)提出如下迭代篩選策略。

        給定一組興趣區(qū)域Θ1,Θ2,…,Θk,…,Θm,分別統(tǒng)計每個興趣區(qū)域Θk的觀察者數(shù)目ok、觀看頻次fk和觀看時長tk,對各區(qū)域指標(biāo)進(jìn)行歸一化后形成3個m元向量:O、F和T。定義興趣區(qū)域注視強度Φ=(φ1,φ2,…,φk,…,φm)以及注視強度差E=(ε1,ε2,…,εk,…,εm),其中:

        εmin_index表示向量E中的最小分量。通過迭代過程不斷刪去min_index 對應(yīng)的注視強度最低的興趣區(qū)域,更新O、F、T、Φ和E,直至min(E) <mean(E) -std(E)或者size(E) ≥m/2終止迭代。對聚類的n個興趣區(qū)域執(zhí)行以上過程,最終篩得n′個具有較高注視強度的興趣區(qū)域。

        2.3 注視興趣區(qū)域轉(zhuǎn)移

        實驗發(fā)現(xiàn),注視興趣區(qū)域的內(nèi)容、空間位置及關(guān)聯(lián)程度均會影響群體觀察者的注視順序。為生成群體路徑,本文考慮每個興趣區(qū)域中注視點在個體掃視路徑中的注視順序,在此基礎(chǔ)上統(tǒng)計興趣區(qū)域的注視優(yōu)先度以及轉(zhuǎn)移模式。

        假設(shè)興趣區(qū)域Θk有來自不同觀察者的l個注視點,Θk={θk,1,θk,2,…,θk,l},定義其注視優(yōu)先度為ζk:

        其中:Sp(θk,i) 表示獲取θk,i所在的個體掃視路徑,index(θk,i,Sp(θk,i))表示θk,i在Sp(θk,i)中的順序索引,|Sp(θk,i)|是個體掃視路徑長度。

        考慮到生成路徑的表征性能,本文僅統(tǒng)計篩選后的興趣區(qū)域的注視優(yōu)先度和轉(zhuǎn)移模式,通過式(6)得到注視優(yōu)先度向量Z=(ζ1,ζ2,…,ζk,…,ζn′)。分量ζk值越高,其對應(yīng)的興趣區(qū)域被優(yōu)先注視的可能性越大,降序排列Z的分量得到興趣區(qū)域轉(zhuǎn)移模式。

        2.4 群體掃視路徑生成方法SCA

        本節(jié)提出基于注視興趣區(qū)域提取、篩選和轉(zhuǎn)移的群體掃視路徑生成方法(Sorting Clusters Approach,SCA)。算法1 展示了SCA方法的具體流程。

        算法1 群體掃視路徑生成方法SCA。

        輸入 所有觀察者的掃視路徑矩陣AllScanpathMat。

        輸出 群體掃視路徑GroupScanpath。

        3 基于注視行為的群體掃視路徑生成方法

        在SCA 的基礎(chǔ)上,本章通過定義4 種注視行為對興趣區(qū)域作進(jìn)一步細(xì)分,結(jié)合興趣子區(qū)域的轉(zhuǎn)移模式,研究基于注視行為的群體掃視路徑生成方法。

        3.1 注視興趣子區(qū)域提取

        實際觀看過程中,內(nèi)涵豐富、相互關(guān)聯(lián)的興趣區(qū)域往往會吸引觀察者產(chǎn)生多次、反復(fù)的注視行為。如圖2 所示,圖像中存在3 個興趣區(qū)域Θ1、Θ2和Θ3,scanpath_1 是一條個體掃視路徑。觀察可知,Θ1區(qū)域可能包含豐富的圖像內(nèi)容,引起scanpath_1 觀察者產(chǎn)生θ1,1,θ1,2,θ1,3,θ1,4,θ1,5共5 個注視點。這些注視點在位置、時間、順序上存在一定差別,為了獲取群體觀察者不同時刻、不同順序關(guān)注的不同局部信息,本文定義了興趣區(qū)域Θk的首視注視點、首視連續(xù)注視點、回視注視點和回視連續(xù)注視點,將Θk劃分為4 個獨立的注視點集Ffixk、FSfixk、Bfixk和BSfixk。

        定義1首視注視點:x∈Θk并且x是對應(yīng)個體掃視路徑Sp(x) 中第一個落于興趣區(qū)域Θk的注視點,如圖2 中θ1,1∈Ffix1。

        定義2首視連續(xù)注視點:x∈Θk,其個體掃視路徑Sp(x)中x的前序注視點是興趣區(qū)域Θk的首視注視點或x的多個前序注視點同屬于興趣區(qū)域Θk且包含首視注視點,如圖2 中{θ1,2,θ1,3}?FSfix1。

        定義3回視注視點:x∈Θk,其個體掃視路徑Sp(x)中前序注視點不屬于興趣區(qū)域Θk,但x非首視注視點,如圖2 中θ1,4∈Bfix1。

        定義4回視連續(xù)注視點:x∈Θk,其個體掃視路徑Sp(x)中x的前序注視點是興趣區(qū)域Θk的回視注視點或x的多個前序注視點同屬于興趣區(qū)域Θk且包含回視注視點,如圖2 中θ1,5∈BSfix1。

        圖2 注視興趣區(qū)域與個體掃視路徑示意圖Fig.2 Schematic diagram of fixation region of interest and individual scanpath

        將Ffixk、FSfixk、Bfixk和BSfixk作為興趣區(qū)域Θk的興趣子區(qū)域,分別表示群體觀察者首次、首次連續(xù)、回視、回視連續(xù)注視關(guān)注的興趣區(qū)域局部,其邊界由各點集中注視點的位置確定。若Θk中某注視行為的注視點集為空集,則該興趣區(qū)域不存在相應(yīng)興趣子區(qū)域。

        3.2 注視興趣子區(qū)域篩選和轉(zhuǎn)移

        實驗發(fā)現(xiàn),觀看不同圖像時,觀察者產(chǎn)生各類注視行為的次數(shù)有所差別。為保證生成路徑符合實際、表征群體,本節(jié)統(tǒng)計觀各圖像中所有觀察者產(chǎn)生各類注視行為的平均次數(shù),提出如下篩選策略。

        對迭代篩選后的興趣區(qū)域,本文考慮所有這些區(qū)域的首視興趣子區(qū)域,篩選閾值記為len1,len1=n′。首視連續(xù)興趣子區(qū)域的篩選閾值記為len2:

        其中:size(FSfixi)表示FSfixi區(qū)域首視連續(xù)注視點的數(shù)目,p為觀察者數(shù)目。在FSfix1,F(xiàn)Sfix2,…,F(xiàn)Sfixn′中篩選出觀察者數(shù)目最多的len2 個子區(qū)域?;匾暋⒒匾曔B續(xù)興趣子區(qū)域的篩選過程與首視連續(xù)興趣子區(qū)域一致。通過式(7)得到len3 和len4,最終篩得(len1+len2 +len3+len4)個興趣子區(qū)域。

        通過式(6)計算首次、回視興趣子區(qū)域的注視優(yōu)先度向量Z′=(ζ1′,ζ2′,…,ζlen1+len2′),降序排序Z′中的分量生成首視、回視興趣子區(qū)域的轉(zhuǎn)移模式。將篩得的(len3+len4)個連續(xù)注視興趣子區(qū)域插入相應(yīng)的首視、回視興趣子區(qū)域之后,得出最終的興趣子區(qū)域轉(zhuǎn)移模式。

        3.3 群體掃視路徑生成方法DFS

        本節(jié)提出基于劃分、篩選、轉(zhuǎn)移興趣區(qū)域的群體掃視路徑生成方法(Devide,F(xiàn)ilter,Sort Clusters Approach;DFS)。算法2展示了DFS方法的具體流程。

        算法2 群體掃視路徑生成方法DFS。

        輸入AllScanpathMat,迭代篩選的興趣區(qū)域結(jié)構(gòu)體NewThetaStruct。

        輸出GroupScanpath。

        第一階段 興趣子區(qū)域劃分、篩選。

        第二階段 興趣子區(qū)域轉(zhuǎn)移。

        第三階段 生成群體路徑

        4 實驗與結(jié)果

        為驗證所提方法的有效性,本文在MIT1003[25]和OSIE[26]兩個公共數(shù)據(jù)集進(jìn)行相關(guān)實驗,并與現(xiàn)有方法進(jìn)行對比。

        4.1 實驗數(shù)據(jù)集

        MIT1003 數(shù)據(jù)集包含1 003 幅多個類別、尺寸不一的自然場景圖像,對每張刺激樣本采集15 名觀察者3 s 觀察時長的眼動數(shù)據(jù)。OSIE 數(shù)據(jù)集包含700 幅多個類別、尺寸相同的自然場景圖像,圖像尺寸統(tǒng)一為800×600 像素,每張刺激樣本收集15名觀察者3 s觀察時長的眼動數(shù)據(jù)。

        本文統(tǒng)計了兩個數(shù)據(jù)集中每張刺激樣本的平均注視點數(shù)和平均興趣區(qū)域數(shù),如表1 所示。通過對比兩數(shù)據(jù)集的刺激樣本和眼動數(shù)據(jù),本文發(fā)現(xiàn)OSIE 中多數(shù)圖像擁有較為明顯的物體,觀察者產(chǎn)生的注視點相對較多,注視區(qū)域分布較為集中;而MIT1003 中圖像較為復(fù)雜,觀察者產(chǎn)生的注視行為較少,注視點分布較為分散,因此MIT1003數(shù)據(jù)集的群體掃視路徑生成更為困難。

        表1 數(shù)據(jù)集對比Tab.1 Dataset comparison

        4.2 定性分析

        本節(jié)將提取的興趣區(qū)域、篩選的興趣區(qū)域、SCA 和DFS方法生成的群體掃視路徑進(jìn)行可視化處理,依據(jù)可視化結(jié)果作出定性分析。

        圖3展示了聚類注視興趣區(qū)域的可視化結(jié)果。

        圖3 注視興趣區(qū)域可視化Fig.3 Visualization of fixation regions of interest

        圖3(a)是未經(jīng)篩選的興趣區(qū)域,圖3(b)是篩選后的興趣區(qū)域,圖像樣本1、2 取自MIT1003 數(shù)據(jù)集,圖像樣本3、4 取自O(shè)SIE數(shù)據(jù)集。通過對比可以發(fā)現(xiàn),對圖像樣本1~4,經(jīng)篩選步驟,圖3(a)中注視點數(shù)目較少、注視強度相對較低的興趣區(qū)域能夠被適當(dāng)剔除,注視點數(shù)目較多、注視強度相對較高的興趣區(qū)域可以被有效保留。

        圖4展示了群體掃視路徑可視化結(jié)果,圖像樣本1、2取自MIT1003 數(shù)據(jù)集,圖像樣本3、4 取自O(shè)SIE 數(shù)據(jù)集。通過對比可以發(fā)現(xiàn),對圖像樣本1~4,所提兩種方法的群體掃視路徑(b)、(c)能夠涵蓋群體觀察者真實掃視路徑(a)中的注視興趣區(qū)域,可以表征群體的注視轉(zhuǎn)移趨勢。另外,DFS方法的群體掃視路徑(c)包含了高注視強度興趣區(qū)域的連續(xù)注視和回視,更加貼合真實的掃視路徑。

        圖4 群體掃視路徑可視化Fig.4 Visualization of group scanpaths

        4.3 定量評價

        目前常用的定量評價策略是將生成的群體掃視路徑與每一條真實記錄的個體掃視路徑作相似度比較,以相似度的均值定量衡量其表征能力。

        4.3.1 評價指標(biāo)

        比較眼動數(shù)據(jù)相似度的方法[27-29]有很多,它們不盡相同,各有側(cè)重。本文采用了兩種較常應(yīng)用的針對掃視路徑的評價指標(biāo)MultiMatch[28]和ScanMatch[29],從時間和空間角度比較群體掃視路徑與個體掃視路徑的相似度。

        MultiMatch 指標(biāo)將掃視路徑視作注視點排列形成的掃視向量,利用Dijkstra 算法[30]生成兩掃視向量的對齊矩陣,從掃視向量形狀、長度、方向和注視點位置、時間5 個維度量化計算對齊部分子向量的相似度,求取對齊子向量相似度的均值衡量兩掃視路徑的相似度。通過計算群體路徑與每條個體路徑五項相似度指標(biāo)的均值,衡量群體路徑與所有個體路徑的相似性,指標(biāo)越高,表明群體路徑的表征效果越好。實驗中MultiMatch 中的參數(shù)設(shè)置為:global Threshold=Diagonal/10,direction Threshold=45,duration Threshold=inf。

        ScanMatch 指標(biāo)對圖像作隔柵劃分將掃視路徑映射為字符串序列,利用Needleman-Wunsch 算法[31]計算兩掃視字符串序列的最佳對齊分?jǐn)?shù),對齊分?jǐn)?shù)越高,兩掃視路徑的整體相似性越高。通過計算群體路徑與每條個體路徑的對齊分?jǐn)?shù)均值,衡量群體路徑與所有個體路徑的相似性,指標(biāo)越高,表明群體路徑的表征效果越好。另外,通過設(shè)置TempBin參數(shù)該指標(biāo)可以考慮時間因素對兩路徑對齊的影響,假設(shè)格柵Grid1中存在一個300 ms 的注視點,TempBin=0 時,映射出的字符串序列為(Grid1),TempBin=100 時,映射出的字符串序列為(Grid1,Grid1,Grid1)。實驗中ScanMatch 的參數(shù)設(shè)置為:Xbin=24,Ybin=18,Threshold=3.5,GapValue=0,TempBin=100(不考慮時間因素時TempBin=0)。

        4.3.2 對比實驗及分析

        文獻(xiàn)[16]中,Li 等將所提的自然場景群體掃視路徑生成方法CDBA[15]、Heuristic[16]應(yīng)用于MIT1003 和OSIE 兩個公共的自然場景數(shù)據(jù)集,利用MultiMatch 和ScanMatch 指標(biāo),與網(wǎng)頁場景的生成方法eMine[9]、STA[11]、SPAM[20]進(jìn)行比較,取得了全面超越的效果[16]。為了衡量所提生成方法SCA和DFS有效性以及與現(xiàn)有方法的差距,本文使用相同的數(shù)據(jù)集、評價指標(biāo)分別進(jìn)行了生成實驗、定量評價,并與文獻(xiàn)[16]中現(xiàn)有方法的評價結(jié)果進(jìn)行比較。由于MultiMatch 指標(biāo)中參數(shù)durationThreshold=inf,對比過程對子路徑進(jìn)行了簡化,導(dǎo)致SCA 方法在MIT1003 數(shù)據(jù)集中1 張圖像和OSIE 數(shù)據(jù)集中11幅圖像上簡化后的路徑過短,無法與真實路徑對比,因此,SCA 的MultiMatch 評價結(jié)果中未計入這12 幅圖像。表2 展示了不同生成方法的指標(biāo)結(jié)果。

        表2 利用MultiMatch↑和ScanMatch↑評估群體路徑算法Tab.2 Evaluation of group scanpath algorithms by MultiMatch ↑and ScanMatch ↑

        首先,對比SCA和DFS方法可以發(fā)現(xiàn),通過注視優(yōu)先度排序注視興趣區(qū)域的SCA能夠生成一條與真實路徑具有一定相似度的群體掃視路徑。對SCA進(jìn)行改進(jìn)的獨立處理不同注視興趣子區(qū)域的DFS 方法,在MultiMatch 的掃視路徑形狀、方向、長度和注視點位置指標(biāo)上,以及ScanMatch 的兩項指標(biāo)上都取得了一定的提升,實驗數(shù)據(jù)驗證了考慮注視興趣區(qū)域的不同注視行為,生成的群體掃視路徑會更加貼合真實掃視路徑。

        其次,將SCA、DFS 方法與網(wǎng)頁場景方法eMine[9]、STA[11]、SPAM[20]對比可以發(fā)現(xiàn),網(wǎng)頁場景的生成方法不適用于自然場景的復(fù)雜情況,需要研究針對自然場景情形的方法。

        最后,將SCA、DFS 方法與自然場景方法CDBA[15]、Heuristic[16]對比。由相關(guān)工作及評價指標(biāo)的介紹可知,CDBA[15]、Heuristic[16]是基于篩選最佳對齊向量的生成方法,MultiMatch 是僅衡量對齊部分子向量平均相似度的指標(biāo),理論上這兩種方法的MultiMatch 指標(biāo)應(yīng)該最優(yōu)。通過觀察可以發(fā)現(xiàn),SCA 和DFS 方法在興趣區(qū)域眾多、圖像較復(fù)雜的MIT1003 數(shù)據(jù)集上表現(xiàn)優(yōu)于其他方法,初步判斷原因在于本文聚類獲取的注視興趣區(qū)域結(jié)果較好,本文生成路徑考慮的興趣區(qū)域更全面、轉(zhuǎn)移模式更詳細(xì),生成路徑與真實個體路徑達(dá)到了較好的對齊效果,得到了較高的對齊子路徑平均相似度。ScanMatch 指標(biāo)上,不考慮時間因素時,DFS 方法的生成路徑可以取得與真實路徑較高的對齊分?jǐn)?shù),說明生成路徑的注視區(qū)域和注視順序與真實路徑相似;考慮時間因素時,對齊分?jǐn)?shù)有所降低,是因為DFS 方法將篩得所有興趣子區(qū)域的時長直接疊加,生成路徑總時長超過了真實觀察時長,導(dǎo)致生成路徑未能與真實路徑較好對齊,影響了最終的評價結(jié)果。DFS生成方法的時間策略有欠合理,有待繼續(xù)改進(jìn)。

        5 結(jié)語

        本文研究自然場景中人類的注視注意,通過分析同一刺激樣本下多名觀察者的眼動數(shù)據(jù),提出了基于注視興趣區(qū)域聚類和轉(zhuǎn)移的群體掃視路徑生成方法??梢暬爸笜?biāo)結(jié)果表明所提方法的生成路徑能夠貼合群體觀察者的實際的眼動行為且具有一定的表征能力。今后的工作中,會繼續(xù)改進(jìn)生成方法使之更好地適用于不同的數(shù)據(jù)集,提升模型的魯棒性;繼續(xù)研究合理的時間生成策略使之更好地貼近真實視覺注視和轉(zhuǎn)移,提升模型的精確性;研究針對掃視路徑的評價指標(biāo),探索新的評價方法。

        猜你喜歡
        注視點觀察者聚類
        觀察者
        揚子江(2024年3期)2024-05-10 06:59:24
        眼動儀技術(shù)在里院建筑特色分析中的應(yīng)用
        基于超復(fù)數(shù)小波和圖像空域的卷積網(wǎng)絡(luò)融合注視點預(yù)測算法
        冷靜而又理性的觀察者——德國華人作家劉瑛訪談
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        射擊運動員的反向眼跳研究
        體育時空(2017年6期)2017-07-14 09:24:48
        基于中央凹圖像顯著性和掃視傾向的注視點轉(zhuǎn)移預(yù)測模型
        基于改進(jìn)的遺傳算法的模糊聚類算法
        一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
        自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
        人妻体内射精一区二区三区| 亚洲乱色视频在线观看| 人妻露脸国语对白字幕| 国产网站一区二区三区| 国产精品你懂的在线播放| 国产真实露脸4p视频| 亚洲黄色一插一抽动态图在线看| 亚洲一区二区三区精品| 国产日产欧产精品精品| 97se在线观看| 青青草视频原手机在线观看| 国产成人高清在线观看视频| 97在线观看播放| 精品2021露脸国产偷人在视频| 亚洲综合久久久中文字幕| 亚洲中文字幕在线一区| 女人被男人躁得好爽免费视频| 亚洲A∨无码国产精品久久网| 成人激情视频一区二区三区| 最近免费中文字幕中文高清6 | 久久精品国产黄片一区| 国产毛多水多高潮高清| 97久久精品人人做人人爽| 亚洲熟妇av日韩熟妇av| 亚洲毛片免费观看视频| 任我爽精品视频在线播放| 亚洲一区二区在线| 麻豆激情视频在线观看| 熟女体下毛荫荫黑森林| 亚洲色欲色欲www在线播放| 欧洲AV秘 无码一区二区三| 日本一级二级三级不卡| 米奇7777狠狠狠狠视频影院| 久久精品国波多野结衣| 日本精品熟妇一区二区三区| 亚洲av福利天堂一区二区三 | 自拍偷自拍亚洲精品播放| 一本久道久久综合狠狠操| 日韩熟女系列中文字幕| 中文字幕精品一二三四五六七八 | 日韩人妻精品视频一区二区三区|