李易臻
摘 要:信息可視化為人們的生活帶來了便利。地圖可視化輸入地理數(shù)據(jù)并以地圖的形式輸出,適用于顯示餐飲店的位置信息。本文應(yīng)用交互散點圖來可視化美國紐約市的餐館地理數(shù)據(jù)。地址、名稱、類別、評級、評論數(shù)量和價格通過交互式地圖功能(如懸停,工具提示和點擊鏈接打開圖表)顯示在地圖上。
關(guān)鍵詞:信息可視化;散點地圖;可交互式
今天的人們比人類歷史上任何時候都擁有更多的信息。隨著大數(shù)據(jù)和互聯(lián)網(wǎng)的發(fā)展,信息超載的問題將更加嚴(yán)重。信息可視化設(shè)計的目標(biāo)是將不可見的信息或難以直接顯示的數(shù)據(jù)轉(zhuǎn)化為可感知的視覺元素,其意義在于通過提高信息或數(shù)據(jù)的可讀性、可用性和美觀性。其中,地理信息數(shù)據(jù)常常被應(yīng)用于信息可視化方法的研究。以餐飲業(yè)為例,用戶可以通過谷歌地圖、餐廳網(wǎng)站或流行的評級平臺搜索和查找餐廳,這些信息包括餐廳的位置、等級等信息。但就谷歌地圖而言,如果用戶輸入某類餐廳的名稱,谷歌地圖目前仍存在無法生成所有相關(guān)餐廳的缺點。因此,本文將在現(xiàn)有餐廳數(shù)據(jù)可視化方法的基礎(chǔ)上,針對上述不足或漏洞,基于 Tableau對紐約餐廳數(shù)據(jù)進(jìn)行聚合、分類和整合的可視化分析設(shè)計。
在回顧觀察研究時,本文將評估和比較現(xiàn)有的幾種可視化方法,如散點圖、密度圖等。這些可視化方法有的基于地理空間數(shù)據(jù),主要使用點繪圖來顯示信息,有的則基于文本數(shù)據(jù),以圖像大小的形式來顯示定量分布。四川大學(xué)華西醫(yī)院的研究人員劉桂娜等 (劉桂娜, 2020)利用Tableau地圖分析技術(shù),對中國區(qū)域醫(yī)療中心結(jié)直腸癌的地理流行病學(xué)特征進(jìn)行了可視化分析。研究人員選取了分布熱動態(tài)地圖和擴(kuò)散趨勢散點圖來直觀展示四川省結(jié)腸癌的歷年變化和地理分布特征。在北京師范大學(xué),研究人員王崢 (王崢, 2022)等人利用時空Moran散點圖應(yīng)用研究了中國干旱時空聚集區(qū)的可視化信息展示圖片。在不同年份,投影在平面上的位置所對應(yīng)的數(shù)據(jù)顏色可以顯示中國不同地區(qū)的干旱情況,而不同高度的數(shù)據(jù)值分布則代表了不同月份的干旱嚴(yán)重程度。
一、擬議的可視化方法
經(jīng)過對所選可視化方法的分析,本研究初步設(shè)計使用Tableau和經(jīng)過篩選和清洗的16833條紐約餐廳數(shù)據(jù)集創(chuàng)建基于地圖的二維重疊分布散點圖,并通過鼠標(biāo)懸停互動來顯示信息。某個區(qū)域內(nèi)的餐廳分布越多,或者疊加的比例尺越小,散點圖就會使用不同的顏色顯示某個區(qū)域內(nèi)餐廳的聚集情況。分布散點圖可以具體顯示餐廳在紐約不同區(qū)域的分布狀況,通過鼠標(biāo)點擊或懸停可以顯示餐廳的名稱和基本信息。同時,為了增加餐廳的具體信息,鼠標(biāo)點擊后可以結(jié)合顯示的具體餐廳信息了解這家餐廳的詳細(xì)信息。
二、可視化方法原型構(gòu)建
(一)設(shè)計新的可視化模型
對于美國紐約的一個大型餐館數(shù)據(jù)集來說,其中包含了餐館名稱、類型、價格、位置、經(jīng)緯度等復(fù)雜信息的摘要,僅靠一種可視化方法無法完整詳細(xì)地展示這些數(shù)據(jù),可視化方法也無法滿足包含上述評價屬性的標(biāo)準(zhǔn)。因此,本文計劃生成一種使用不同顏色散點的可視化方式,并將用不同顏色顯示的評分分?jǐn)?shù)和餐廳排名結(jié)合起來。最后,通過交互式懸停信息顯示,餐廳的詳細(xì)信息將作為參考告知用戶。
下圖1是使用Microsoft可視化工具Power Bi創(chuàng)建的初始散點圖,作為初步參考。首先,在簡單地導(dǎo)入了地址和標(biāo)題屬性中包含的數(shù)據(jù)集后,使用 Tableau 中的地圖功能簡單地生成了美國紐約餐館的散點圖分布??梢钥吹?,16833條數(shù)據(jù)可視化非常密集,所以用不同的可視化顏色來表示不同的餐廳種類,以區(qū)分不同的餐廳類型。但此時的顏色分類為Power Bi自動生成,仍然缺少顏色選擇和優(yōu)化。
為了優(yōu)化上述模型存在的問題,仍然使用地址和標(biāo)題屬性下的數(shù)據(jù)集作為可視化嘗試,但不同的是將地圖制作工具改為使用 Power Bi 中的 Arc GIS 地圖來制作不同的地圖。現(xiàn)在生成的圖表2中兩張地圖可以更清楚地區(qū)分不同的餐廳及其具體的行位置。不過,這種方法仍需優(yōu)化和改進(jìn)。
最后,除了簡單的散點圖,為了給用戶提供更豐富、更直觀的視覺信息,本文嘗試?yán)貌煌臄?shù)據(jù)創(chuàng)建不同類型的可視化圖。對于圖表3,選擇州屬和街道屬兩個數(shù)據(jù)集作為展示,然后使用創(chuàng)建填充地圖的方法來分析數(shù)據(jù),并用顏色突出顯示這些餐廳位置所覆蓋的區(qū)域。這樣做的好處是,用戶可以通過色塊快速直觀地看到自己所在的位置是否在餐館附近,還可以通過顏色的深淺來區(qū)分特定街區(qū)的餐館數(shù)量。但在后來的模型優(yōu)化當(dāng)中,這一方法與散點圖疊加使用會使散點的展示模糊不清,且提供有效信息的能力較差,因此放棄使用不同可視化方法疊加的情況。
(二)進(jìn)行驗證測試以驗證設(shè)計(無差錯設(shè)計)
空間:在空間上,上述每種可視化方法生成的圖形都允許用戶通過鼠標(biāo)滾動放大或縮小來改變可視化本身的空間,從而輕松獲得餐廳的準(zhǔn)確位置和詳細(xì)的定位信息。
交互性:用戶可以通過放大并懸停在某個餐廳散點上來選擇該餐廳,從而顯示該餐廳的具體信息。在上面的示例中,只使用了標(biāo)題和地址來創(chuàng)建模型,將鼠標(biāo)懸停在上面后,用戶可以清楚地看到每個點的詳細(xì)文字信息。
可區(qū)分性:用不同的顏色代表不同的餐廳,雖然有些雜亂,但可以大致分辨出不同地點不同名稱的餐廳的零散信息。
準(zhǔn)確性:本文利用授課老師提供的數(shù)據(jù)集,通過添加更多信息和創(chuàng)建更多圖形,將大大提高可視化的準(zhǔn)確性。可視化數(shù)據(jù)可顯示餐廳全名。地圖點的散點大小也可以通過手動操作自動改變。地理信息的定位也很準(zhǔn)確.
三、結(jié)果與分析
(一)改進(jìn)后的可視化方法
雖然上述可視化原型在一定程度上提供了有關(guān)紐約餐館的詳細(xì)信息,但這種可視化對用戶來說并不清晰。用戶無法根據(jù)自己的喜好篩選想要了解的餐館信息,也無法根據(jù)圖形的顏色和大小直觀地判斷出更有價值的信息。同時,用戶只能獲得餐廳的名稱和地址,而無法獲得其他有價值的信息。
因此,基于上述可視化方法的缺點,本文使用Tableau生成了一種更有效的可視化方法。這就是根據(jù)類別名稱字段生成不同顏色的散點圖,用戶可以從圖表右側(cè)的過濾器中選擇自己想要的餐廳類型。其次,根據(jù)不同餐廳的標(biāo)價將散點圖的點設(shè)置為不同的大小。點越大,表示餐廳的價格越高。用戶可以根據(jù)點的大小,直觀地篩選出心儀的價格范圍內(nèi)的餐廳。最后,將每家餐廳的標(biāo)題設(shè)置為標(biāo)簽,當(dāng)用戶放大或縮小地圖時,可以看到點下方顯示的餐廳名稱。
除此之外,增加交互式地圖的功能,使用戶可以與散點地圖進(jìn)行互動。當(dāng)用戶將鼠標(biāo)懸停在某個點上時,該餐廳的更多詳細(xì)信息將被展示在地圖界面上。這些信息包括餐廳名稱、類型描述、詳細(xì)地址、標(biāo)價、評分分布和營業(yè)時間。
最后,創(chuàng)建兩個新的工作表,分別使用數(shù)字格式的"評論數(shù)"和 "排名"數(shù)據(jù)來顯示每家餐廳的瀏覽次數(shù)和排名。這兩個表格被插入地圖工作表的工作提示中。用戶可以在鼠標(biāo)懸停時看到每家餐廳的瀏覽次數(shù)和排名。并在地圖工作表中添加兩個操作,即當(dāng)點擊一個特定的散點時,會出現(xiàn)兩個按鈕功能,讓用戶可以點擊進(jìn)入兩個詳細(xì)的評論數(shù)和排名工作表。
(二)修正后的可視化構(gòu)建
該可視化模型包含一個散點實時圖、一個點圖和一個柱形圖。在這張地圖上,一張街道性質(zhì)的背景地圖被用來顯示紐約的詳細(xì)街道地址。上面不同顏色的散點代表了不同類型的餐館,而點的大小則代表了餐館評級的價格檔次。接下來,圖表4右側(cè)的篩選器可以幫助用戶根據(jù)自己的需求選擇餐廳。例如,如果用戶想選擇一家美國餐廳,那么可以手動勾選所有美國餐廳篩選器,以顯示所有符合條件的餐廳。此外,用戶還可以根據(jù)價格過濾器篩選出不同價位的餐廳。
將鼠標(biāo)懸停在點上,可以看到與這三個點相對應(yīng)的餐廳的詳細(xì)信息。其中包括餐廳名稱、詳細(xì)地址、價格范圍、類別描述、評級和營業(yè)時間。這些詳細(xì)的文本信息,可以供用戶查閱以了解不同餐廳的大概情況。餐廳名稱也會作為標(biāo)簽顯示在地圖上散點的正下方。
創(chuàng)建兩個新的工作表,分別用于展示詳細(xì)的創(chuàng)建評論數(shù)和排名的條形圖和點圖。同樣在散點圖主要工作表中,這兩個工作表被插入到工作提示列中。圖表6中可以看到每個散點就擁有了相應(yīng)的 "評論計數(shù) "和 "排名 "的數(shù)據(jù)展示,用戶可以直接通過散點懸停功能直接了解到散點相對應(yīng)的排名和評論數(shù)量。同時使用條形圖和點圖來顯示不同的數(shù)據(jù)。在點擊懸停信息上的藍(lán)色鏈接后,用戶可以直接從散點圖轉(zhuǎn)向詳細(xì)的兩個分工作表,如圖表7所示。圖表8所示的兩張工作表中,不同的顏色被用來表示不同級別的排名和查看次數(shù)。其中綠色代表最好的排名,紅色代表最差的排名。
四、評估可視化方法及其意義
數(shù)據(jù)展示和可視化類型:評估Tableau的數(shù)據(jù)呈現(xiàn)可視化方法和所選擇的可視化類型。本可視化使用了三種信息可視化形式:地圖散點圖、條形圖和虛線圖。信息的可讀性和傳達(dá):對可視化方法的可讀性和信息傳達(dá)進(jìn)行評估,關(guān)注圖表的清晰度、標(biāo)簽的可讀性、顏色的選擇和對比度。這種可視化方法使用不同顏色的散點表示不同類型的餐館,而散點的大小則代表餐館的價格。
交互性和探索性:Tableau提供豐富的交互功能,允許用戶探索數(shù)據(jù)并獲得更深入的見解。對可視化方法進(jìn)行評估,看它是否充分利用了 Tableau 的交互功能,如篩選器、參數(shù)、工具提示等,以提供更具探索性和交互性的數(shù)據(jù)體驗。因此,這種可視化方法結(jié)合了各種工具提示、標(biāo)簽顯示、顏色表示和篩選器的使用,所有這些都能滿足用戶的互動需求。
數(shù)據(jù)準(zhǔn)備和清理:考慮為Tableau可視化方法準(zhǔn)備和清理數(shù)據(jù)的過程,這樣可以對數(shù)據(jù)進(jìn)行整理和轉(zhuǎn)換。本次練習(xí)的數(shù)據(jù)來自16800條詳細(xì)的紐約餐館數(shù)據(jù),這些數(shù)據(jù)數(shù)量充足、涵蓋主題廣泛,并且設(shè)計了詳細(xì)的屬性。這種可視化方法的意義在于它能夠以一種視覺上吸引人的互動方式展示紐約餐館的數(shù)據(jù)。通過利用Tableau的功能,包括餐廳名稱標(biāo)簽、顏色分類、價格范圍表示、懸停細(xì)節(jié)、條形圖和散點圖,以及詳細(xì)視圖的交互式按鈕,這種可視化方法使用戶能夠獲得有價值的見解,做出明智的決策,并探索紐約餐飲業(yè)的復(fù)雜景觀。
總之,新提出的使用Tableau創(chuàng)建的紐約餐廳數(shù)據(jù)散點圖可視化為探索和分析數(shù)據(jù)集提供了一個強(qiáng)大而直觀的工具。通過餐廳名稱標(biāo)簽、彩色編碼的散點圖標(biāo)記、顯示價格帶的標(biāo)記大小、懸停細(xì)節(jié)、條形圖和用于詳細(xì)查看的交互式按鈕等各種功能,該可視化工具為用戶提供了紐約市餐廳景觀的全面視圖。盡管還存在缺陷和不足,但迄今為止在短時間內(nèi)生成的可視化方法在一定程度上為餐廳用戶提供了幫助。
參考文獻(xiàn):
[1] 劉桂娜,曾渝,劉健博,李立 & 汪曉東.(2020).數(shù)據(jù)庫輔助研究:區(qū)域醫(yī)療中心的結(jié)直腸癌地理散發(fā)特征——結(jié)合Tableau地圖分析技術(shù)的真實世界數(shù)據(jù)報道.中國普外基礎(chǔ)與臨床雜志(01),88-96.
[2] 王崢,程昌秀 & 李暢.(2022).時空Moran散點圖及其在中國干旱時空聚集區(qū)識別中的應(yīng)用.地球信息科學(xué)學(xué)報(07),1301-1311.