劉力
蘇州大學計算機科學與技術學院,蘇州 215301
自然界中的大部分現(xiàn)象例如燃燒、洋流、颶風和地震等本質上都是在空間上隨時間流逝不斷發(fā)展變化的物理或化學過程,對各種物理和化學過程的動力學研究在很大程度上推動著自然科學的進步。這些物理和化學過程可以表述為含有時間變量的微分方程。求解這樣的微分方程,會產(chǎn)生含有時間變量的數(shù)據(jù)場,這些數(shù)據(jù)場稱為3維時變數(shù)據(jù)或者時變體數(shù)據(jù)(time-varying volume data)。隨著科學計算技術、計算機仿真技術以及現(xiàn)代觀測技術的飛速發(fā)展,科學家們能夠以前所未有的精度對自然現(xiàn)象進行仿真或者觀測,但同時也面臨分析海量時變體數(shù)據(jù)的難題。時變體數(shù)據(jù)往往具有體積大(百萬甚至上億個體元)、時間長(成百上千個時間片)和變量數(shù)目多的特點。如何有效地顯示時變體數(shù)據(jù)并挖掘數(shù)據(jù)中的關鍵信息越來越成為許多科學研究工作面臨的一項挑戰(zhàn),為針對時變體數(shù)據(jù)的可視化研究提供了強勁動力,并且提出了許多針對時變體數(shù)據(jù)可視化的方法。這些方法大體可以分為時間獨立算法和時間依賴算法兩類。時間獨立算法單獨處理時變體數(shù)據(jù)的每一個時間片并通常以動畫的形式演示數(shù)據(jù)的時間片序列。通常包括降低數(shù)據(jù)的存儲容量從而使數(shù)據(jù)更容易管理(例如時域亞采樣、數(shù)據(jù)壓縮和提取輪廓)、為直接體繪制預先設定傳遞函數(shù)以及基于硬件加速的體繪制。時間獨立算法的優(yōu)點是通用性比較強,往往不依賴于數(shù)據(jù)和專家知識(Ma,2003),然而這些算法通常無法突出數(shù)據(jù)中對科學研究重要的信息也沒有考慮數(shù)據(jù)的時變和運動特性。與時間獨立算法不同,時間依賴算法 (也稱基于特征的可視化或特征可視化算法)著眼于數(shù)據(jù)的特征,并充分利用這些特征在相鄰時間片之間運動和相互影響的連貫性跟蹤它們的變化規(guī)律。在這里,特征(feature)具有兩方面的含義,一方面可以表示原始數(shù)據(jù)集中能夠提取出的有意義的部分,如形狀、結構、變化和現(xiàn)象等;另一方面表示原始數(shù)據(jù)集中用戶感興趣的某些子集。特征可視化用基于圖像處理和數(shù)學形態(tài)學的方法從數(shù)據(jù)的標量場或者矢量場中提取不定形區(qū)域,按一定匹配準則在相鄰時間步之間建立特征對應關系,在不丟失重要信息的前提下減少了可視化映射的數(shù)據(jù)量,使用戶忽略掉大部分冗余的、不重要或不感興趣的內(nèi)容,將注意力集中在數(shù)據(jù)集中特征的運動上,從而成為研究時空變化過程的最有效的可視化技術。
對時變體數(shù)據(jù)進行特征可視化一直是數(shù)據(jù)可視化領域的研究熱點,研究的主要方向涉及以下方面:1)從數(shù)據(jù)中提取與量化特征(Hazarika等,2018;Kraus等,2020);2)從時間和空間中跟蹤特征(Saikia和Weinkauf,2017;Schnorr等,2019);3)對特征的形狀結構、變量、變化和運動過程進行有效的可視化(Hsu等,2009;Liu等,2020);4)對具體實例進行可視化以解決實際的科學問題(Joshi等,2009;Liu等,2021)。
本文提出一種面向時變體數(shù)據(jù)的特征可視化方法,用于探索時變體數(shù)據(jù)中感興趣區(qū)域的特點與變化,方法流程如圖1所示。輸入的時變體數(shù)據(jù)首先經(jīng)過一個包含3個步驟(特征提取、特征跟蹤和運動檢測)的數(shù)據(jù)處理轉換為特征元數(shù)據(jù),然后通過一個數(shù)據(jù)瀏覽器將特征元數(shù)據(jù)轉換為一系列的多邊形網(wǎng)格,最后利用網(wǎng)絡瀏覽器自帶的WebGL (Web Graphics Library)應用程序編程接口和計算機中的GPU(graphics processing unit)將可視化結果呈現(xiàn)在網(wǎng)絡瀏覽器中。本文的貢獻主要體現(xiàn)在以下3個方面:1)通過將特征提取、特征跟蹤、運動檢測和基于WebGL技術的可視交互技術置于同一個方法框架之中,提供一種從時間域、空間域和參數(shù)空間觀察、探索時變體數(shù)據(jù)的一站式解決方案;2)在可視化中突出時變體數(shù)據(jù)的動力學特性,從而更好地理解數(shù)據(jù)中感興趣事件的發(fā)生和演化;3)開發(fā)的交互式可視化工具在網(wǎng)絡瀏覽器上運行,可以適應任何操作系統(tǒng)并且不需要安裝客戶端,從而降低了使用門檻,有助于促進不同科研之間的合作。
圖1 本文方法的流程圖Fig.1 A flowchart of the proposed method
本文的研究主要涉及數(shù)據(jù)的特征可視化和3維數(shù)據(jù)可視化工具兩個方面。
時變體數(shù)據(jù)的特征可視化通常包含4個方面的內(nèi)容:1)根據(jù)領域知識或者研究需要定義數(shù)據(jù)集的特征;2)從數(shù)據(jù)中提取與量化特征;3)逐時間片地跟蹤提取的特征;4)對特征進行等值面繪制或者直接體繪制(Zabusky和Silver,1992)。針對不同的數(shù)據(jù)集,特征的定義是不同的,比如標量場中用標量的大小而矢量場中用拓撲結構表達特征,醫(yī)學可視化中更注重不同器官、組織結構之間的區(qū)別。有效而清晰地表達出特征是特征提取和跟蹤的基礎。對特征進行定義的方法包括傳統(tǒng)的設定一個固定的閾值或者取值范圍將標量數(shù)據(jù)場二值化(Samtaney等,1994)、利用數(shù)據(jù)密度的一階導數(shù)和二階方向導數(shù)(Ma等,1996;Schnorr等,2019)、通過邏輯表達式選取滿足條件的網(wǎng)格點(Van Walsum等,1996;El-Shehaly等,2015;Kraus等,2020)、用數(shù)據(jù)的高斯混合分布(Dutta和Shen,2016;Guo等,2016;Hazarika等,2018)和利用機器學習的方法對專家標注的數(shù)據(jù)進行學習(Athawale等,2016;Bernard等,2018;Kumpf等,2018)。根據(jù)特征的定義,特征提取通過遍歷時變體數(shù)據(jù)的一個時間片,將符合特征定義的部分有效提取出來并作為單獨的個體,并對提取的特征進行量化分析。特征跟蹤是對提取出的特征在不同時間片上進行配對,找出特征的變化規(guī)律,揭示特征隨時間演變過程產(chǎn)生、消失和變化等一系列現(xiàn)象。當前主流的特征跟蹤算法主要包括局部匹配方法和基于全局優(yōu)化的方法。局部匹配方法包括體積重疊(volume overlap)法和相似屬性標準(similar attribute criteria)法兩種。體積重疊法利用特征在相鄰時間片的體積重疊,定義一個損失函數(shù)實現(xiàn)最佳匹配(Silver 和Wang,1997;Ji等,2003)。相似屬性標準法通過計算一組特征的屬性集合(aggregate attributes),例如質心、體積、方向和形狀衡量相鄰時刻特征的相似性(Reinders 等,2001;Schnorr等,2019)。全局優(yōu)化法對相鄰的兩個時間片或者數(shù)據(jù)中所有時間片中的特征及組合進行分析,通過距離函數(shù),例如測地線距離(Earth mover’s distance)(Ji和Shen,2006)、時間運動曲線(time activity curve)的距離場(Lee和Shen,2009)和合并樹(merger tree)(Saikia和Weinkauf,2017)找出最佳的特征匹配。
在3維數(shù)據(jù)可視化工具領域,當前主流的商用可視化工具,例如ParaView、VolView、VisIt和EnSight都能提供對時變體數(shù)據(jù)的交互式可視化。這些軟件通常采用時間獨立算法并將數(shù)據(jù)的時間片序列以動畫的形式顯示,然后用時間軸滑動條或者翻頁的形式逐時間片瀏覽(Liu等,2020)。對于每一個時間片,這些可視化工具通常提供如下可視交互方式:平移、縮小/放大、選擇數(shù)據(jù)中的變量、過濾、切割和改變顏色方案。雖然當前的商用可視化工具具有通用性和不受數(shù)據(jù)定義的限制等優(yōu)點,但往往無法反映數(shù)據(jù)特定區(qū)域的情況以及在不同時間片之間的聯(lián)系,且都需要從客戶端安裝并且對軟件運行環(huán)境(例如操作系統(tǒng)和OpenGL的版本)有一定的要求。
根據(jù)數(shù)據(jù)特征可視化技術、時變體數(shù)據(jù)的時空特性以及觀察數(shù)據(jù)中感興趣事件的發(fā)生和演化的研究需要,本文方法通過特征提取、特征跟蹤和運動檢測對時變體數(shù)據(jù)進行處理,采用一個可視化工具包(Uisualization Toolkit,VTK)支持下的C/C++程序實現(xiàn),如圖1所示。
特征分割算法遍歷一個數(shù)據(jù)幀中的每個體元,根據(jù)用戶設定的閾值將數(shù)據(jù)的所有體元分為前景和背景兩類,對于含有多個變量的數(shù)據(jù),閾值由用戶選擇的一個主要變量的標量場確定。利用區(qū)域生長法將連貫的前景體元從數(shù)據(jù)中提取出來作為特征。對每個特征的幾何特征(體積、質心和邊界等)都計算和保存。為了降低可視映射的數(shù)據(jù)量,本文采用移動立方體(marching cube)算法(Lorensen和Cline,1987)計算特征的等值面。對每個數(shù)據(jù)幀,特征分割算法生成兩個文件:特征點坐標元數(shù)據(jù)和特征等值面元數(shù)據(jù)。特征點坐標元數(shù)據(jù)記錄了每個特征點的坐標值以及變量(一個或者多個)在這個點上的值;而特征等值面元數(shù)據(jù)記錄等值面上的點坐標、連接點的多邊形和每個特征的幾何特征。
利用特征提取得到的特征點坐標元數(shù)據(jù),依次比較相鄰時間片中的特征,并用一種基于體積重疊的方法以確定各自的關聯(lián)關系(Silver和Wang,1997)。對相鄰時刻i和i+ 1中有體積重疊的任意兩個特征A和B,其匹配程度R為
依次計算不同特征組合的R值,并找到使R值最大化的特征對。根據(jù)特征匹配的映射關系(例如一對一、一對多、多對一等),一個特征在演變過程中可能經(jīng)歷5個狀態(tài):誕生、延續(xù)、合并、分裂和消失。特征跟蹤的結果以特征演化歷史的形式記錄在一個特征關聯(lián)表格中。
盡管特征跟蹤技術在很大程度上對時變體數(shù)據(jù)的分析提供了便利,但是從海量的特征中觀察某一個特征,追蹤這個特征在多個時間片上的演化,并且進一步地從跟蹤結果中總結出某一類型的運動仍然是非常困難的,尤其是這些運動過程往往持續(xù)多個時間片而且在時空上重疊(Ullah等,2019)。為了解決這個難題,采用佩特里網(wǎng)(Petri net)表示對一個運動過程的描述(Ozer等,2014)。一個佩特里網(wǎng)由運動狀態(tài)、狀態(tài)轉移、連接以及代表特征的令牌構成。運動檢測算法先用令牌表示第1個時間片中的特征,然后根據(jù)特征跟蹤得到的特征關聯(lián)表格在每個時間片將令牌在不同狀態(tài)之間轉移,當令牌到達佩特里網(wǎng)的最終狀態(tài)時,一個運動過程結束,令牌注銷。根據(jù)檢測的結果,將每個運動過程涉及的特征從各個數(shù)據(jù)幀中分離出來單獨存儲為一個“運動過程元數(shù)據(jù)”。
圖2展示了一個佩特里網(wǎng)用于模擬和檢測數(shù)據(jù)中的“特征先合并再分裂”運動。圖中P1、P2、P3分別表示誕生、合并、結束3種運動狀態(tài),T1、T2、T3表示運動狀態(tài)之間的轉移條件,帶顏色的實心小圓點是數(shù)據(jù)中特征的令牌,帶箭頭的線條指示令牌移動的方向。圖2(b)是一個數(shù)據(jù)幀及其包含的特征,當前活躍的特征以不透明的顏色表示,與圖2(a)中的令牌相對應。數(shù)據(jù)幀中沒有參與運動的特征以透明顏色表示。
圖2 一個佩特里網(wǎng)用于模擬和檢測數(shù)據(jù)中的“特征先合并再分裂”運動Fig.2 A Petri net is used to model the event “features merge then split”((a)the Petri net;(b)a data frame and the included features)
針對時變體數(shù)據(jù)的交換可視化,一些研究對常見的任務進行了分類和歸納。Wehrend和Lewis(1990)通過對300多個可視化的分析,歸納出定位、識別、分辨、分類、聚類、排序、比較、關聯(lián)和相關等一系列通用可視交互任務。Robertson(1990)按任務的范圍將數(shù)據(jù)的可視交互任務分為點狀任務、局部任務和全局任務。Haimes和Darmofal(1991)根據(jù)這3個范圍進一步將用戶的可視交互任務分為探究一個具體位置、在數(shù)據(jù)中定位特征以及掃描整個數(shù)據(jù)。根據(jù)這些任務的分類和時變體數(shù)據(jù)特征可視化的特點,本文確立了以下6個可視交互任務:1)可視化單個目標特征的幾何與物理性質;2)可視化一個數(shù)據(jù)幀中所有的特征;3)可視化一個特征的運動演化過程;4)多層次的可視化設計并能通過可視交互在不同視圖之間切換;5)提供數(shù)據(jù)中多個特征運動演化過程的概覽視圖(overview)用于歸納數(shù)據(jù)的動力學特性;6)允許用戶設定某些條件過濾或者選擇可視化中的特征。針對這些可視交互任務,提出了3種特征可視化,即數(shù)據(jù)幀特征可視化、單個運動過程特征可視化和空間多運動過程特征可視化。
為實現(xiàn)上述可視化,開發(fā)了一個在網(wǎng)絡瀏覽器上運行的時變體數(shù)據(jù)瀏覽器(time-varying volume data viewer,TVDV)。TVDV使用JavaScript語言以及基于JavaScript語言的Three.js庫函數(shù)開發(fā)而成。在TVDV的用戶界面上,本文提出的可視化方法以單獨的網(wǎng)頁顯示。網(wǎng)頁包含一個控制面板用于操作文件輸入輸出、變量選擇和基本信息查看等。用戶可以通過鼠標或者鍵盤放大/縮小、平移、旋轉和選擇可視化視圖中的物體。TVDV可以適應任何操作系統(tǒng)并且不需要安裝客戶端,降低了使用門檻。
研究使用4組時變體數(shù)據(jù)演示提出的方法,各組實驗數(shù)據(jù)的基本信息如表1所示。
表1 實驗數(shù)據(jù)的基本信息Table 1 Basic information of the experimental datasets
1)數(shù)據(jù)集1:湍流漩渦。這組數(shù)據(jù)是對連續(xù)湍流漩渦結構的擬譜仿真(pseudo-spectral simulation),包含100個反映漩渦強度的數(shù)據(jù)幀(維度128×128×128)(Silver和Wang,1997),具有周期性的運動和不規(guī)則的邊界。待觀察的運動是特征先合并、延續(xù)若干時間,然后分裂。
2)數(shù)據(jù)集2:龍卷風Isabel。這組數(shù)據(jù)是對龍卷風Isabel的計算機仿真(http://vis.computer.org/vis2004contest/),包含48個仿真間隔1 h的數(shù)據(jù)幀(維度500 × 500 × 100)。每個數(shù)據(jù)幀以浮點數(shù)的形式存儲并包含13個時變變量,例如沉淀混合比(precipitation mixing ratio)、氣壓、溫度、風速在3個坐標軸方向的分量。待觀察的運動是龍卷風的增強過程。
4)數(shù)據(jù)集4:海底熱液柱。這組數(shù)據(jù)包含479個位于胡安德??ㄑ笾屑?Juan de Fuca ridge)的海底熱液柱超聲掃描文件(Bemis等,2015)。在維度161 × 121 × 181的每個超聲掃描文件(數(shù)據(jù)幀)中,數(shù)據(jù)值的大小反映了熱液柱中金屬硫化物和溫度變化的背向散射強度(backscatter intensity)。待觀察的運動是熱液柱在定期漲落的洋流以及其他偶發(fā)擾動推動下的周期性擺動(Liu等,2021)。
通過數(shù)據(jù)幀特征可視化,可以觀察一個數(shù)據(jù)幀內(nèi)所有特征的分布、大小和形狀,以及從中選擇一個特征并對其進一步探索。通過界面左上角的控制面板可以將一個數(shù)據(jù)幀的特征等值面元數(shù)據(jù)導入。這個數(shù)據(jù)幀中所有的特征以列表的形式排列在網(wǎng)頁右側,并在網(wǎng)頁中間的可視化視圖中顯示。對于單變量數(shù)據(jù),由于唯一的變量已經(jīng)在特征提取階段二值化,所以特征的等值面以單一顏色渲染;而對于多變量數(shù)據(jù),特征的等值面以顏色圖表達變量在特征表面不同位置的大小和變化。
圖3展示的是湍流漩渦(數(shù)據(jù)集1)中一個數(shù)據(jù)幀特征可視化,所有特征都以透明的淺黃色渲染,連同一個與數(shù)據(jù)幀維度一致的邊界框顯示在網(wǎng)頁中央。選中的一個特征(該數(shù)據(jù)幀中第14個特征)以不透明的紅色渲染,該特征同時在網(wǎng)頁右邊的特征列表中選中,該特征的基本信息(坐標、體積和長度等)顯示在控制面板中。
圖3 湍流漩渦(數(shù)據(jù)集1)中一個數(shù)據(jù)幀特征可視化Fig.3 A feature visualization of data frame in dataset 1
圖4是海洋仿真(數(shù)據(jù)集3)中一個數(shù)據(jù)幀的特征可視化,所有的特征均顯示在圖4(a)中的邊界框中。選中的一個特征(該數(shù)據(jù)幀中第24個特征)以不透明的紅色渲染。在圖4(b)中,選中的特征以Dawnrgb顏色圖顯示溫度在表面的變化情況,網(wǎng)頁上端是一個表示變化范圍的顏色條。用戶還可以在控制面板中選擇其他變量并改變可視化的結果。
圖4 海洋仿真(數(shù)據(jù)集3)數(shù)據(jù)幀特征可視化Fig.4 A feature visualization of data frame in dataset 3((a)all features of a data frame;(b)a feature is selected and visualized individually to show the variance of temperature on the surface)
通過單個運動過程特征可視化,可以觀察一個特征在時間和空間上演化所經(jīng)歷的時間片、從演化過程中選擇一個時間片以及進一步探索特征在所選擇時間片中的狀況。這個可視化功能與數(shù)據(jù)幀特征可視化類似,通過控制面板將一個運動過程元數(shù)據(jù)導入,這個特征在運動過程中的所有時間片以列表的形式排列在網(wǎng)頁右側,用于強調(diào)特征的運動方向以及運動的連續(xù)性。為了避免視覺堵塞,各個時間片之間的距離可以按用戶要求放大一個倍數(shù)。
圖5展示了龍卷風Isabel(數(shù)據(jù)集2)中一個龍卷風增強過程的特征可視化。龍卷風在運動過程中的氣壓變化通過一個顏色圖以表意可視化形式進行可視化編碼,時間片上方的方向線用于強調(diào)龍卷風的運動方向以及運動的連續(xù)性。在這個過程中,龍卷風在風眼處會出現(xiàn)風速增大和氣壓減小現(xiàn)象。用戶可以觀察氣壓、風速和降雨3個變量在龍卷風表面變化的情況。圖5(a)用Parula顏色圖對龍卷風在運動過程中的氣壓變化進行可視化編碼??梢暬敳康念伾珗D表達了氣壓在當前運動過程中的變化范圍。圖5(b)是從圖5(a)選中的一個時間片(紅色)的多邊形線框圖,可以看出,氣壓從龍卷風的外部到內(nèi)部逐漸減小,從而在風眼周圍形成了一個低壓區(qū)(圖中藍色區(qū)域)。此外,可以發(fā)現(xiàn)在可視化中風眼處的氣壓會隨著龍卷風的增強而降低(表現(xiàn)為顏色加深)。
圖5 龍卷風Isabel(數(shù)據(jù)集2)中的單個運動過程特征可視化Fig.5 A feature visualization of an individual event in dataset 2 ((a)a feature visualization of an individual event;(b)a hurricane feature is selected and visualized individually to show the variance of air pressure on the surface)
圖6 海洋仿真(數(shù)據(jù)集3)中的一個海洋渦流在生命周期內(nèi)的運動過程的特征可視化Fig.6 A feature visualization of the motion of an ocean eddy within its life cycle in ocean simulation (dataset 3)((a)a feature visualization of an individual event;(b)an eddy feature is selected and visualized individually to show the variance of temperature on the surface)
空間中多運動過程特征可視化用于歸納數(shù)據(jù)中的多個或者全部運動過程,尤其適用于地理空間數(shù)據(jù)。在可視化中,運動過程的元數(shù)據(jù)加載到一個3D地形圖上幫助觀察數(shù)據(jù)中各個特征的運動位置、大小和相互作用等。圖7的可視化歸納了海洋仿真(數(shù)據(jù)集3)數(shù)據(jù)中2005—2007年所有延續(xù)時間超過30天的海洋渦流運動過程,每個渦流特征以骨架視圖(每個渦流以一個長度等于其深度的圓柱體表示)的形式加載到美國東海岸以及西北大西洋的3D地形圖中??梢暬凶仙c黃色分別表示氣旋(cy-clonic)和反氣旋(anti-cyclonic)的渦流。在網(wǎng)頁右上角的控制面板中,可以用兩個滑動條通過改變渦流的深度(或長度)和持續(xù)時間改變可視化中顯示的圓柱體(也即渦流)數(shù)量??梢钥闯?,氣旋渦流更多出現(xiàn)在海灣的南方而反氣旋渦流大部分聚集在北方。此外,可以發(fā)現(xiàn)大部分渦流的深度小于2 000 m(海底深度最大值為5 500 m)。
圖7 歸納了數(shù)據(jù)集3中延續(xù)時間超過30天的海洋渦流運動過程的可視化Fig.7 A visualization that summarizes all the eddy activity processes that last at least 30 days in dataset 3
圖8使用圖7的3D地形圖,并將圖7中的圓柱替換為渦流等值面以提供更多的信息,例如渦流的移動距離以及不同渦流過程之間的關系。在每個渦流運動過程的最后一個時間片上放置一個紅色小球,用于指示渦流運動的方向和標識該過程的結束。如圖8(a)所示,氣旋渦流(紫色)傾向于向西移動,而反氣旋渦流(黃色)則可能向各個方向移動。用戶可以從這個可視化中選擇一個運動過程并進入 “單個運動過程的特征可視化”。圖8(b)是從圖8(a)選中的兩個海洋渦流運動過程。
圖8 將圖7中的圓柱替換為渦流等值面的可視化Fig.8 A visualization created by replacing the cylinders in Fig.7 by authentic eddy features((a)multiple eddy activity processes from dataset 3 are placed in the background of ocean;(b)two selected eddy activity processes)
圖9展示的是海底熱液柱(數(shù)據(jù)集4)中海底熱液柱的周期性擺動可視化。在每一個周期內(nèi),海底熱液柱都要穿過中垂線(笛卡兒坐標系的Z軸)兩次。圖9(a)將一個周期內(nèi)所有時間片中的海底熱液柱都加載到了海底的背景之中。在圖9(b)中,這些時間片進一步以表意可視化的方式顯示,以更好地表達海底熱液柱在每個時間片的彎曲角度以及在各個時間片之間的相對距離??梢钥闯觯5谉嵋褐闹芷谛詳[動并不是在一個假設的理想平面上。此外,熱液柱的擺動有往左傾的趨勢,這預示了洋流的運動方向。
圖9 海底熱液柱周期性擺動的可視化Fig.9 The visualization of a periodic bending event of the hydrothermal plume((a)the plume is placed in the background of seabed;(b)an illustrative visualization of (a))
對本文方法的計算性能以及時間成本進行評估,分別衡量各組實驗數(shù)據(jù)在特征提取(包括數(shù)據(jù)讀取、預處理以及其他相關開銷)、特征跟蹤、運動檢測和3個特征可視化任務的消耗時間。每個可視化任務所需時間等于從數(shù)據(jù)導入到可視化渲染完成之間的間隔。數(shù)據(jù)處理和可視化實驗在一臺戴爾XPS臺式機上運行,軟硬件配置為Ubuntu 20.04 LTS操作系統(tǒng)、火狐網(wǎng)絡瀏覽器,英特爾Core i7-4770 CPU(3.40 GHz×8)、16 GB DDR內(nèi)存、Nvidia GTX 760顯卡(2 GB顯存)、3 TB機械硬盤。各組實驗數(shù)據(jù)在不同部分的時間消耗如表2所示,其中Vis1代表數(shù)據(jù)幀特征可視化;Vis2代表單個運動過程特征可視化;Vis3代表空間中多運動過程特征可視化。
從表2可見,不同數(shù)據(jù)在實驗中的消耗時間與數(shù)據(jù)的物理大小與持續(xù)時間呈正相關??梢暬蝿盏臅r間消耗都在10 s以內(nèi),最多的是海洋仿真數(shù)據(jù)(數(shù)據(jù)集3)在“空間中多運動過程特征可視化”耗時9 s。數(shù)據(jù)處理的時間消耗較多,4組數(shù)據(jù)的耗時從1 h到7 h不等。
表2 4組數(shù)據(jù)實驗時間分解Table 2 Breakdown of the elapsed time on the four datasets
時變體數(shù)據(jù)可視化是一種研究自然現(xiàn)象演化過程的有效方法。對數(shù)據(jù)中感興趣區(qū)域的運動進行追蹤與可視化并減少可視化映射的數(shù)據(jù)量是該領域的一個關鍵問題。針對此關鍵問題,本文提出一種基于特征可視化的可視交互方法,用于探索時變體數(shù)據(jù)中感興趣區(qū)域的特點與變化。通過將特征提取、特征跟蹤、運動檢測和本文提出的3種特征可視化方法(數(shù)據(jù)幀特征可視化、單個運動過程特征可視化和空間多運動過程特征可視化)置于同一個框架之中,提供一種從時間域、空間域和參數(shù)空間觀察、探索時變體數(shù)據(jù)的一站式解決方案,并突出時變體數(shù)據(jù)的動力學特性。本文方法的可用性和有效性在4組不同時變體數(shù)據(jù)的可視化應用上得到了驗證。
盡管本文方法實現(xiàn)了設計目標和預想的結果,但至少還存在兩個不足:1)在數(shù)據(jù)處理部分,基于體積重疊的特征追蹤法雖然高效,但是對快速移動或者體積細小的特征的跟蹤效果較差;2)在特征可視化部分缺乏對數(shù)據(jù)中某種特性(比如某個變量)的歸納總結。對于不足1),考慮將其他的特征跟蹤算法(比如基于濾波器預測)與基于體積重疊的方法相結合,提高對“快、細、小”特征的跟蹤效果。對于不足2),考慮從統(tǒng)計模型的角度探索更多種類的方法(例如高斯混合模型)用于歸納和總結數(shù)據(jù)。最后,計劃采用客戶端—服務器的架構將數(shù)據(jù)處理的任務交給數(shù)據(jù)的存儲端—遠程服務器,從而免除在客戶端的數(shù)據(jù)下載和繁重的數(shù)據(jù)計算任務。
致 謝感謝美國羅格斯大學海洋與沿海系提供的數(shù)據(jù)和其他支持;感謝美國羅格斯大學Deborah Silver教授、Karen Bemis博士、Enrique Curchitser教授和康杜鵑教授對本文提出的寶貴意見。