馮逸文,秦 雨*,張向鈺
(1. 廣東省地圖院,廣東 廣州 510075;2. 武漢大學(xué)信息管理學(xué)院,湖北 武漢 430079)
隨著第三次工業(yè)革命的興起和發(fā)展,目前正在進(jìn)入計(jì)算無所不在、軟件定義一切、數(shù)據(jù)驅(qū)動(dòng)發(fā)展的智能時(shí)代[1]。隨著智慧城市、無人駕駛、數(shù)字孿生等領(lǐng)域的進(jìn)一步發(fā)展,高精度空間地理信息數(shù)據(jù)庫作為其支撐也得到了長足進(jìn)步,與之配套的數(shù)據(jù)可視化技術(shù)再次成為研究熱點(diǎn)[2-3]。專題地圖作為內(nèi)容專題化、形式差異化、用途專門化的地圖,在表達(dá)空間分布相關(guān)信息時(shí)具有高度概括、直觀易讀、高效傳輸?shù)奶匦訹4],因而在時(shí)空大數(shù)據(jù)可視化中得到了廣泛應(yīng)用。在智能時(shí)代背景下,專題制圖領(lǐng)域也面臨著新的挑戰(zhàn),對(duì)制圖者提出了更高的要求。本文主要探究智能時(shí)代下專題數(shù)據(jù)可視化與傳統(tǒng)專題數(shù)據(jù)可視化的區(qū)別,并據(jù)此提供一些數(shù)據(jù)可視化的新思路。
1)數(shù)據(jù)驅(qū)動(dòng)。智能時(shí)代的重要特征之一就是海量數(shù)據(jù),制圖者能夠收集到多種類、全方位、序列化的數(shù)據(jù),而這些數(shù)據(jù)又對(duì)制圖者提出了新的要求。傳統(tǒng)制圖中,專題地圖制作依賴于制圖者對(duì)專題的主觀認(rèn)知和其對(duì)于專題的處理抽象[5],即由制圖者驅(qū)動(dòng);但在智能時(shí)代,制圖者更應(yīng)關(guān)注數(shù)據(jù)本身,數(shù)據(jù)與專題的內(nèi)在聯(lián)系、數(shù)據(jù)獲取、數(shù)據(jù)清洗處理等過程,根據(jù)數(shù)據(jù)本身的特征制定針對(duì)性的可視化措施,即由數(shù)據(jù)驅(qū)動(dòng),而將對(duì)專題數(shù)據(jù)的認(rèn)知和重構(gòu)[6]則更多地留給讀圖者完成。當(dāng)然,純粹的數(shù)據(jù)驅(qū)動(dòng)也會(huì)導(dǎo)致因果關(guān)系的不可解釋、機(jī)理的不透明等問題[7]。數(shù)據(jù)驅(qū)動(dòng)并不是要減少制圖者在制圖過程中的主觀能動(dòng)性,而是將制圖者的工作重心提前,將精力更多地分配在使用數(shù)據(jù)解釋專題這一部分。
2)計(jì)算決定。智能時(shí)代的另一個(gè)重要特征是算力的極大增長。隨著個(gè)人設(shè)備算力的不斷提升,專用信息服務(wù)器、并行機(jī)群、超級(jí)計(jì)算機(jī)、分布式計(jì)算、云計(jì)算等技術(shù)的發(fā)展[8],制圖者能對(duì)空間大數(shù)據(jù)進(jìn)行分析處理,但這些數(shù)據(jù)體量大、更新快、模態(tài)多樣、真?zhèn)坞y辨、個(gè)體價(jià)值低[9],對(duì)制圖者的分析處理能力提出了更高的要求。制圖者要敏銳察覺數(shù)據(jù)與專題間的聯(lián)系,并通過有效的計(jì)算方法,提取整合海量數(shù)據(jù)中有價(jià)值的信息,才能形成有意義的專題指標(biāo)體系。其中,能否計(jì)算處理數(shù)據(jù)、數(shù)據(jù)的計(jì)算處理方法都將極大影響甚至決定制圖數(shù)據(jù)指標(biāo)價(jià)值的高低。
3)粒度影響。在智能時(shí)代,制圖者擁有更多的手段獲取和處理精細(xì)粒度的數(shù)據(jù);但粒度并非越精細(xì)越好,隨著觀測(cè)尺度、分類層級(jí)、知識(shí)體系和描述維度的變化,所觀測(cè)到的對(duì)象的空間形態(tài)、組成結(jié)構(gòu)、級(jí)別屬性、關(guān)聯(lián)關(guān)系等特征可能不同[10],過于精細(xì)的粒度可能反而會(huì)導(dǎo)致特征丟失、性能下降、辨識(shí)度差的問題[11]。因此,智能時(shí)代下的制圖者要深刻認(rèn)識(shí)到粒度對(duì)于專題數(shù)據(jù)可視化的影響,選擇或?qū)?shù)據(jù)處理為合適粒度的數(shù)據(jù),保證專題的信息傳輸效率。
圖表形式是影響數(shù)據(jù)可視化最重要的因素。絕大部分圖表都可歸類為柱狀圖、餅圖、散點(diǎn)圖(折線圖)3 種形式;但在智能時(shí)代的專題制圖中,基本圖表已無法很好適應(yīng)愈發(fā)復(fù)雜的數(shù)據(jù)表達(dá)需要,因此衍生出了種類繁多的變種圖表,通過對(duì)基本圖表的形式、結(jié)構(gòu)、維度等進(jìn)行部分重構(gòu)以達(dá)到凸顯要點(diǎn)、引起注意、提升數(shù)據(jù)易讀性、提高讀者認(rèn)知率[12]的目的,極大地提高了圖表的豐富性和信息傳遞效率。通常習(xí)慣采用柱狀圖表示總量信息指標(biāo),餅圖表示比例信息指標(biāo),折線圖突出變化類信息指標(biāo)。圖表的變種思路大體與之一致,但側(cè)重有所不同,具體見圖1。
圖1 基本圖表及其常見變種
不同圖表的特征也可以組合使用,如堆疊極坐標(biāo)扇圖、柱狀雷達(dá)圖等。制圖者可根據(jù)數(shù)據(jù)表達(dá)和圖面配置的需要靈活組合,在突出數(shù)據(jù)特征的同時(shí)做到排布合理。此外,圖表的變種中還有瀑布圖、箱型圖、小提琴圖、?;鶊D等,由于篇幅和個(gè)人能力所限,本文僅介紹在專題地圖中較常見的圖表變種類型。
在制圖中,制圖者需要將指標(biāo)的數(shù)據(jù)值轉(zhuǎn)化為長度、角度、半徑、面積等可視化指標(biāo),從而傳遞信息,該過程可視為從源數(shù)據(jù)到可視化指標(biāo)的一種函數(shù)映射。在智能時(shí)代,隨著數(shù)據(jù)極值差異的日益增加,傳統(tǒng)的分級(jí)量化和線性量化思路已無法滿足部分?jǐn)?shù)據(jù)表達(dá)的需要,非線性量化的使用日漸增多。本文以源數(shù)據(jù)y到柱狀圖長度L的映射函數(shù)L( )y為例,探討專題數(shù)據(jù)值在量化過程中的策略,具體見圖2。量化的目的是為了更高效地傳遞信息,實(shí)際使用時(shí)應(yīng)保證數(shù)據(jù)間的區(qū)分度,必要時(shí)突出數(shù)據(jù)的變化情況(增量)即可。
圖2 專題制圖中常見量化策略
上述智能時(shí)代下專題數(shù)據(jù)可視化的新特征與新思路在《廣東省地圖集》[13]中均有體現(xiàn),作為智能時(shí)代下新編的地圖集,其在編制思路上與傳統(tǒng)地圖集產(chǎn)品有一定的差異。
1)數(shù)據(jù)驅(qū)動(dòng)制圖?!稄V東省地圖集》在編制過程中,更多地由數(shù)據(jù)驅(qū)動(dòng)制圖而非由制圖者驅(qū)動(dòng)制圖。在專題地圖編制過程中,制圖者更多關(guān)心專題數(shù)據(jù)的收集、數(shù)據(jù)與專題的聯(lián)系以及數(shù)據(jù)的清洗處理,因此筆者與專題相應(yīng)主管單位、相關(guān)企事業(yè)單位進(jìn)行了卓有成效的溝通,收集了龐大的專題數(shù)據(jù)庫,并以此為基礎(chǔ)進(jìn)行了專題圖編制設(shè)計(jì)的有關(guān)工作。
2)計(jì)算決定能否成圖?!稄V東省地圖集》在編制過程中,得益于廣東省良好的基礎(chǔ)測(cè)繪建設(shè),收集了許多精細(xì)粒度的空間數(shù)據(jù)庫,如廣東省地理國情監(jiān)測(cè)數(shù)據(jù)庫、廣東省林地地類普查庫、廣東省地名地址普查庫等,這些數(shù)據(jù)庫由數(shù)百萬多邊形或點(diǎn)構(gòu)成。算力的極大提升使得能在可接受的時(shí)間范圍內(nèi)完成上述數(shù)據(jù)的統(tǒng)計(jì)、關(guān)聯(lián)和符號(hào)化工作,并最終完成土地利用現(xiàn)狀、林地地類、常住人口分布3幅對(duì)應(yīng)專題中的核心地圖。
3)粒度影響地圖可視化效果。在《廣東省地圖集》的人口專題中,收集了以行政村為單位的常住人口分布數(shù)據(jù),并通過將其鏈接至地名普查數(shù)據(jù)庫獲得了一組廣東省常住人口分布的精細(xì)粒度數(shù)據(jù);但在可視化時(shí)發(fā)現(xiàn),若在單個(gè)點(diǎn)符號(hào)可辨認(rèn)的基礎(chǔ)上對(duì)全部行政村人口點(diǎn)進(jìn)行表示,其點(diǎn)密度過高導(dǎo)致完全無法區(qū)分人口密度中等和人口密度高的區(qū)域,且會(huì)遮擋分級(jí)底色,因此最終決定僅表示5 000 人及以上的行政村,剔除一部分精細(xì)粒度數(shù)據(jù),最終得到了較好的可視化結(jié)果。
1)圖表形式?!稄V東省地圖集》大膽結(jié)合多種類型的圖表,根據(jù)數(shù)據(jù)表達(dá)和版面排列的需要,靈活選擇圖表樣式,輔以象形符號(hào)或繪制圖案等方式,提升信息表達(dá)的維度,極大地提高了信息傳遞效率(圖3)。
圖3 《廣東省地圖集》部分圖表
2)量化策略。《廣東省地圖集》根據(jù)數(shù)據(jù)特點(diǎn),靈活運(yùn)用分級(jí)量化、線性量化、指數(shù)量化等方式,在確保數(shù)據(jù)準(zhǔn)確量化的基礎(chǔ)上,突出數(shù)據(jù)特征、表現(xiàn)數(shù)據(jù)差異與變化情況。例如,在區(qū)域經(jīng)濟(jì)專題下的第二產(chǎn)業(yè)增加值專題圖中,采用了非線性量化的思路,在保證視覺平衡的前提下,同時(shí)突出數(shù)據(jù)的增長情況。
本文通過對(duì)比傳統(tǒng)專題制圖與智能時(shí)代下專題制圖的聯(lián)系與區(qū)別,提出了數(shù)據(jù)驅(qū)動(dòng)、計(jì)算決定、粒度影響3 個(gè)智能時(shí)代下專題數(shù)據(jù)可視化的新特征,并在此基礎(chǔ)上總結(jié)了智能時(shí)代下專題數(shù)據(jù)可視化的新思路,即拓展圖表形式、靈活使用量化策略。本文以《廣東省地圖集》為例,印證了所述觀點(diǎn)。研究成果可為今后的專題制圖工作提供參考,為專題數(shù)據(jù)的可視化提供多種思路;但對(duì)于智能時(shí)代下專題數(shù)據(jù)可視化特征與方法的總結(jié)仍不夠系統(tǒng),在全面性上仍有提升的空間。