陳超,吳亞?wèn)|,付朝帥,童興,李攀,褚琦凱,王雪楠
1. 四川輕化工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,四川 自貢 643000;2. 四川省大數(shù)據(jù)可視化分析技術(shù)工程實(shí)驗(yàn)室,四川 宜賓 644000;3. 四川輕化工大學(xué)自動(dòng)化與信息工程學(xué)院,四川 自貢 643000
中國(guó)白酒文化因其悠久的歷史、豐富的內(nèi)涵,在世界文化之林中獨(dú)領(lǐng)風(fēng)騷。其與詩(shī)詞歌賦、文學(xué)典籍、書(shū)法繪畫、散文戲曲以及影視音樂(lè)等藝術(shù)形式相輔相成[1],對(duì)中國(guó)歷史文化、文學(xué)藝術(shù)、繪畫藝術(shù)、宗教文化、民風(fēng)民俗、科學(xué)技術(shù)、社會(huì)心理、軍事研究等各個(gè)領(lǐng)域產(chǎn)生了巨大的影響,已經(jīng)滲透到社會(huì)生活的各個(gè)方面。然而,中國(guó)白酒文化數(shù)據(jù)具有數(shù)據(jù)源廣泛、多元化、復(fù)雜度高等特點(diǎn),將可視化技術(shù)應(yīng)用到中國(guó)白酒文化中,對(duì)于傳播和弘揚(yáng)中國(guó)白酒文化的豐富內(nèi)涵、增強(qiáng)文化自信、促進(jìn)國(guó)際文化交流具有重要作用。利用可視化技術(shù)的直觀、易于理解、分析和交互等特性,可有效地支撐和推動(dòng)中國(guó)白酒文化的表達(dá)、研究和傳播。采用先進(jìn)的數(shù)據(jù)可視化技術(shù)提高中國(guó)白酒文化的影響力、服務(wù)中國(guó)白酒文化建設(shè)成為一項(xiàng)重要課題。
自20世紀(jì)60年代以來(lái),在計(jì)算機(jī)媒介的支撐下,人文知識(shí)的獲取、分析、集成和展示方式都在發(fā)生重大變化。海量的圖書(shū)、報(bào)紙、期刊、照片、繪本、樂(lè)曲、視頻等資料被數(shù)字化,并上傳到互聯(lián)網(wǎng)供大眾獲取和使用,隨之出現(xiàn)了許多優(yōu)秀的歷史信息化項(xiàng)目,例如中國(guó)歷代人物傳記數(shù)據(jù)庫(kù)(CBDB)提取、整理了與近百萬(wàn)名歷史人物相關(guān)的時(shí)空事件和關(guān)系信息。面對(duì)這種日益強(qiáng)化的數(shù)字化現(xiàn)狀,2016年IEEE VIS會(huì)議將數(shù)字人文和可視化兩個(gè)領(lǐng)域的專家聚在一起進(jìn)行研討,打破了傳統(tǒng)文理學(xué)科與技術(shù)之間的壁壘,為可視化技術(shù)在數(shù)字人文領(lǐng)域的應(yīng)用開(kāi)辟了新的思路。數(shù)字人文為中國(guó)白酒文化可視化研究提供了強(qiáng)有力的數(shù)據(jù)支撐,數(shù)字人文和可視化技術(shù)的交叉融合為中國(guó)白酒文化可視化的發(fā)展奠定了重要的基礎(chǔ)。
面向公眾的中國(guó)白酒文化可視化應(yīng)用主要采用可視化技術(shù)將與白酒文化相關(guān)的詩(shī)詞歌賦、古籍文本、古跡文物及戲曲書(shū)畫等晦澀枯燥的數(shù)據(jù)以直觀生動(dòng)的方式呈現(xiàn)出來(lái),并借助交互技術(shù)吸引公眾主動(dòng)探索白酒文化,從而實(shí)現(xiàn)白酒文化的傳播與傳承。比如,酒具酒器可視化能幫助受眾了解古今煮酒器、盛酒器、飲酒器、貯酒器的具體類型,制作材質(zhì)從陶器、青銅器、漆器到瓷器的歷史變遷過(guò)程,以及酒具酒器作為重要禮器所承載的禮儀文化。酒詩(shī)、酒詞可視化能幫助受眾了解中國(guó)白酒對(duì)詩(shī)詞文化創(chuàng)作的影響,從詠誦古人詩(shī)詞作品到探知古人“酒中賦詩(shī)、詩(shī)中有酒”的詩(shī)酒生活,進(jìn)而感知古人創(chuàng)作詩(shī)詞的情感。酒禮、酒俗可視化從民風(fēng)民俗的角度展現(xiàn)歷朝歷代不同地區(qū)民族的農(nóng)事節(jié)令、婚喪嫁娶、慶功祭奠、奉迎賓客等民俗活動(dòng)中白酒的中心地位。酒令可視化從娛樂(lè)的角度全方位地展現(xiàn)勸酒行為的文明化和藝術(shù)化,打破公眾對(duì)劃拳行令的單一認(rèn)知,舉凡世間事物、人物、花木、蟲(chóng)禽、曲牌、詩(shī)文、中藥以及種種風(fēng)俗、節(jié)令,無(wú)不入令。
面向領(lǐng)域?qū)<业闹袊?guó)白酒文化可視化應(yīng)用借助可視化技術(shù)對(duì)專業(yè)領(lǐng)域知識(shí)進(jìn)行分析,輔助決策。比如,可視分析技術(shù)可以幫助中國(guó)白酒文化研究專家系統(tǒng)地梳理中國(guó)白酒文化的研究現(xiàn)狀、研究主題變遷、研究熱點(diǎn)和研究方向,并在此基礎(chǔ)上,分析、預(yù)測(cè)未來(lái)的發(fā)展趨勢(shì)等。白酒文化可視化可以幫助領(lǐng)域?qū)<曳治鲋袊?guó)白酒文化發(fā)展的歷史脈絡(luò),建立白酒文化發(fā)展的知識(shí)譜系。中外白酒文化對(duì)比分析能幫助行業(yè)專家分析中西方的白酒文化差異,提升中國(guó)白酒的國(guó)際影響力。
中國(guó)白酒文化可視化流程可以分為4個(gè)層次:白酒文化數(shù)據(jù)采集層、白酒文化數(shù)據(jù)處理和分析層、白酒文化數(shù)據(jù)資源匯聚層、白酒文化可視化應(yīng)用與交互層,如圖1所示。
圖1 中國(guó)白酒文化數(shù)據(jù)可視化流程
(1)白酒文化數(shù)據(jù)采集層
白酒文化數(shù)據(jù)具有碎片化、信息覆蓋范圍廣等特點(diǎn),因此,白酒文化數(shù)據(jù)主要從詩(shī)詞歌賦、古籍文獻(xiàn)、戲曲書(shū)畫和古跡文物等信息源獲取。獲取的數(shù)據(jù)大多是多媒體數(shù)據(jù),少有結(jié)構(gòu)化數(shù)據(jù),其中文本數(shù)據(jù)是最主要的數(shù)據(jù)類型,此外還有音頻、圖片、視頻等文件數(shù)據(jù)。
(2)白酒文化數(shù)據(jù)處理和分析層
由于采集到的數(shù)據(jù)碎片化嚴(yán)重,需要先經(jīng)過(guò)數(shù)據(jù)清洗等預(yù)處理,再進(jìn)入信息分析提取階段?;谧匀徽Z(yǔ)言處理算法(如長(zhǎng)短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)等)實(shí)現(xiàn)文本信息分類和文本信息自動(dòng)化提取[2-3],最終提取出關(guān)鍵信息,如時(shí)間、地點(diǎn)、人物、事件等。涉及古籍文本數(shù)據(jù)的,還需要借助古籍文本語(yǔ)料庫(kù)進(jìn)行文本挖掘[4-5]。
(3)白酒文化數(shù)據(jù)資源匯聚層
根據(jù)數(shù)據(jù)類型的不同,數(shù)據(jù)資源匯聚層可實(shí)現(xiàn)多種數(shù)據(jù)存儲(chǔ)方式。結(jié)構(gòu)化數(shù)據(jù)以文件的形式存儲(chǔ),如JSON、CSV、XML等,也可以以表結(jié)構(gòu)的形式存儲(chǔ)在結(jié)構(gòu)化數(shù)據(jù)庫(kù)中,如MySQL、Oracle等;非結(jié)構(gòu)化數(shù)據(jù)可存儲(chǔ)在非結(jié)構(gòu)化數(shù)據(jù)庫(kù)中,如MongoDB等,若信息量巨大,還需要采用大數(shù)據(jù)分布式存儲(chǔ)技術(shù),如Hadoop分布式文件系統(tǒng)(Hadoop distributed file system,HDFS)等。
(4)白酒文化可視化應(yīng)用與交互層
通過(guò)可視化技術(shù)將白酒文化數(shù)據(jù)映射到圖像空間,比如,采用文本數(shù)據(jù)可視化、多維數(shù)據(jù)可視化、時(shí)空數(shù)據(jù)可視化以及網(wǎng)絡(luò)數(shù)據(jù)可視化等相關(guān)技術(shù),為用戶提供直觀、可交互的圖形化界面。
文化數(shù)據(jù)可視化技術(shù)很早就有應(yīng)用,如Charles Minard將拿破侖1812年侵俄戰(zhàn)爭(zhēng)的行軍圖用流式地圖的形式繪制出來(lái),該圖涵蓋了地點(diǎn)、行軍路線、人數(shù)、重大事件、溫度等多個(gè)維度的信息[6]。2010年,北得克薩斯大學(xué)和斯坦福大學(xué)聯(lián)合開(kāi)發(fā)了由美國(guó)國(guó)家基金資助的數(shù)字人文可視化項(xiàng)目Mapping Texts[7],針對(duì)北得克薩斯大學(xué)圖書(shū)館數(shù)字化的約232 500頁(yè)歷史報(bào)紙進(jìn)行文本挖掘,將其與地理空間分析結(jié)合起來(lái)進(jìn)行可視化呈現(xiàn)。
中國(guó)的文化數(shù)據(jù)可視化應(yīng)用尚在起步階段,直接將可視化技術(shù)應(yīng)用到中國(guó)白酒文化領(lǐng)域的研究更加稀少。隨著近年來(lái)可視化技術(shù)在國(guó)內(nèi)的推廣普及,在一些文化領(lǐng)域有不少可視化研究成果涌現(xiàn)。
中國(guó)白酒文化與詩(shī)詞歌賦、文學(xué)典籍、書(shū)法繪畫和散文戲曲等文學(xué)作品密切融合。中國(guó)詩(shī)酒文化之濫觴的《詩(shī)經(jīng)》中共提到“酒”62次(39篇),體現(xiàn)了人際心靈溝通和審美等多個(gè)精神層面的融合[8]?!端疂G傳》中出現(xiàn)飲酒場(chǎng)面647次,《三國(guó)演義》中出現(xiàn)飲酒場(chǎng)面319次,《西游記》中出現(xiàn)飲酒場(chǎng)面103次,《紅樓夢(mèng)》中出現(xiàn)飲酒場(chǎng)面152次[9]。“酒”在《白居易全集》中共出現(xiàn)840次,《杜甫全集》中出現(xiàn)204次,《李白全集》中出現(xiàn)250次,《韓愈全集》中出現(xiàn)138次,《柳宗元全集》中出現(xiàn)65次,《蘇東坡全集》中出現(xiàn)1 151次。《唐詩(shī)三百首》中涉及酒的詩(shī)有46首;《宋詞三百首》中與酒相關(guān)的詞有126篇;《全元散曲》中近三分之二的篇章涉及“酒”,其中“酒”出現(xiàn)了1 121次,“醉”出現(xiàn)了936次,“飲”出現(xiàn)了211次,“杯”出現(xiàn)了259次,“樽”出現(xiàn)了192次[10]。此外,酒與書(shū)法、繪畫、戲曲等文學(xué)作品更是相輔相成。
隨著大量文學(xué)作品的完全數(shù)字化以及人工智能處理技術(shù)的發(fā)展,大批學(xué)者開(kāi)始采用先進(jìn)的可視分析技術(shù)對(duì)文學(xué)作品進(jìn)行全新解析。2014年,張建立等人[11]在解析古詩(shī)詞文本空間信息的基礎(chǔ)上,基于地理信息系統(tǒng)(geographic information system,GIS)進(jìn)行了空間可視化分析。2015年,閻思瑤等人[12]首次嘗試將自然語(yǔ)言處理、計(jì)算數(shù)學(xué)和計(jì)算機(jī)動(dòng)畫等相關(guān)研究成果結(jié)合,用來(lái)解決古典詩(shī)詞的動(dòng)畫自動(dòng)生成問(wèn)題。2016年,李欣哲[13]運(yùn)用可視化技術(shù)將《詩(shī)經(jīng)》中抽象的情感內(nèi)容轉(zhuǎn)換為可感知的形式,探索了在數(shù)字媒介環(huán)境下傳播優(yōu)秀傳統(tǒng)文化經(jīng)典的新途徑。2017年,李舒迪[14]以可視化的形式展現(xiàn)了《紅樓夢(mèng)》詩(shī)詞活動(dòng)中的時(shí)序分布、人物關(guān)系、地理路線、詩(shī)詞活動(dòng)組織形式,該研究是文本可視化技術(shù)在中國(guó)古典文學(xué)上應(yīng)用的新嘗試。2018年,胡華華[15]通過(guò)可視化技術(shù)對(duì)宋詞風(fēng)格和詞人流派演變歷程進(jìn)行了呈現(xiàn),有助于人們從宏觀層面對(duì)宋詞風(fēng)格流派演變進(jìn)行認(rèn)知和理解。2019年,張瑋等人[16]提出了一套基于文本關(guān)聯(lián)與時(shí)空可視分析的方法,通過(guò)對(duì)宋詞文本的音律情感可視化與文本意象進(jìn)行關(guān)聯(lián)分析,讓文學(xué)研究者可以從多個(gè)維度了解宋詞文本的特性。2019年,吳瀟等人[17]利用文本挖掘技術(shù)對(duì)近400首描寫關(guān)中(現(xiàn)陜西省中部)風(fēng)貌的唐代詩(shī)詞進(jìn)行篩選梳理,對(duì)人文景觀情感特征、景觀空間分布特征和空間語(yǔ)義網(wǎng)絡(luò)特征展開(kāi)多維信息可視分析。2020年,侯文軍等人[18]設(shè)計(jì)并完成了包含京劇劇本列表、京劇劇本概覽圖、京劇劇本指紋圖和京劇劇本情節(jié)圖4個(gè)可視化模塊在內(nèi)的京劇劇本可視化系統(tǒng),幫助對(duì)京劇了解程度不同的人更好地了解京劇劇本,有益于京劇文化的傳播。
顯而易見(jiàn),文學(xué)作品分析與可視化在數(shù)字化后經(jīng)歷了3個(gè)階段的探索:簡(jiǎn)單的統(tǒng)計(jì)分析階段(如詞頻統(tǒng)計(jì))、可視化階段(信息提取后直接可視化呈現(xiàn),如空間信息可視化、文本信息可視化)、可視分析階段(文本挖掘后進(jìn)行可視分析,如情感分析可視化、關(guān)聯(lián)信息可視分析等)。
中國(guó)文明進(jìn)化史與白酒文化的發(fā)展密不可分,在河南省賈湖遺址發(fā)現(xiàn)的9 000年以前的釀酒痕跡是最好的證據(jù)[19]。國(guó)內(nèi)與白酒文化相關(guān)的考古遺存非常豐富,這些遺跡和遺物種類多樣,從不同角度反映了當(dāng)時(shí)人們的釀酒、飲酒等生活細(xì)節(jié),為后人研究釀酒技術(shù)、酒禮、酒俗、經(jīng)濟(jì)、藝術(shù)等提供了寶貴資料。
目前與白酒文化相關(guān)的考古遺址及歷史文物可視化研究還未起步,但是在考古領(lǐng)域,可視化技術(shù)并未缺席。覃京燕[20]提出了運(yùn)用信息思維方法指導(dǎo)數(shù)字化文化遺產(chǎn)項(xiàng)目的整體策劃,基于信息可視化模型和信息可視化設(shè)計(jì)原則,進(jìn)行數(shù)字化文化遺產(chǎn)中信息管理、信息呈現(xiàn)和信息傳播的設(shè)計(jì)。Jang M H[21]采用三維可視化技術(shù)為韓國(guó)延三河流域的歷史文化遺產(chǎn)繪制了情感地圖。Han J G等人[22]利用增強(qiáng)現(xiàn)實(shí)技術(shù)對(duì)文化遺產(chǎn)地、建筑文化遺產(chǎn)和歷史遺跡修復(fù)數(shù)字內(nèi)容的開(kāi)發(fā)進(jìn)行了研究,建立了戶外文化遺址三維模型可視化系統(tǒng)。Gupta N等人[23]提出的適合考古數(shù)據(jù)的地理可視化以及地理可視化分析工具能很好地解決考古現(xiàn)象的復(fù)雜性和多樣性。Gómez J M N等人[24]使用全景球面攝影和地面激光掃描技術(shù),建立了卡塞雷斯省歷史和文化遺產(chǎn)的交互式三維可視化系統(tǒng)。Wang B S等人[25]采用虛擬現(xiàn)實(shí)技術(shù)建立了二維地圖和三維城市模型,以及可視化敘事平臺(tái),以提升公眾的文化遺產(chǎn)保護(hù)意識(shí)。張加萬(wàn)團(tuán)隊(duì)借助圖像分析、機(jī)器學(xué)習(xí)與攝影測(cè)量學(xué)等技術(shù),建立了一套“本體監(jiān)測(cè)-關(guān)聯(lián)分析-實(shí)驗(yàn)室研究-反向控制”的預(yù)防性保護(hù)風(fēng)險(xiǎn)管理預(yù)控系統(tǒng),實(shí)現(xiàn)了敦煌壁畫病害的可視分析。
考古遺址及歷史文物領(lǐng)域的可視化研究主要集中在采用三維建模還原考古遺址和文物、運(yùn)用虛擬現(xiàn)實(shí)技術(shù)和增強(qiáng)現(xiàn)實(shí)技術(shù)實(shí)現(xiàn)交互性方面。對(duì)文物情感可視分析以及基于圖像分析技術(shù)的文物病害的可視分析等新興領(lǐng)域的研究有待進(jìn)一步深入。
歷史變遷與歷史人物之間是相互依存的關(guān)系,人類在歷史長(zhǎng)河中不斷地書(shū)寫著歷史。從微觀視角審視歷史,能看到一個(gè)個(gè)歷史人物的人生歷程,其中不少歷史人物飲酒后留下了文學(xué)佳作或傳奇故事,他們本身也成為白酒文化的一部分;從宏觀視角審視歷史,可以看得到文化中心、城鎮(zhèn)中心的變遷以及文化流派的演變過(guò)程。
在宏觀的歷史變遷可視分析方面,國(guó)內(nèi)外學(xué)者進(jìn)行了初步探索[16,26-32]。Schich M等人[26]使用大規(guī)模可視化技術(shù)追溯了歐洲和北美2 000多年來(lái)的文化敘事,描繪了歷史名人的遷徙模式及文化中心的歷史趨勢(shì)。Cho I等人[27]開(kāi)發(fā)的VAiRoma系統(tǒng)對(duì)羅馬歷史中的重大事件、時(shí)間、地點(diǎn)等信息進(jìn)行了可視分析。胡華華[15]采用散點(diǎn)圖從宋詞詞人的分期迭代和詞人所屬的流派分類兩個(gè)角度呈現(xiàn)宋詞詞人流派的歷史演變進(jìn)程,呈現(xiàn)詞人流派群體隨著歷史推進(jìn)而出現(xiàn)盛衰漲落的變化軌跡。
國(guó)內(nèi)學(xué)者更加關(guān)注微觀視角的歷史人物可視分析。吳旻家等人[28]從地理空間分析的角度對(duì)李白的漫游軌跡以及詩(shī)歌中的地理空間進(jìn)行了研究,從而分析李白的行為空間與詩(shī)歌空間。劉菊等人[29]建立了古琴名人時(shí)空信息采集系統(tǒng),動(dòng)態(tài)展示古琴名人的二維軌跡與三維軌跡,并結(jié)合古琴知識(shí)圖譜,實(shí)現(xiàn)古琴名人相關(guān)信息的智能化查詢。鄒亞國(guó)等人[30]提出了首都距、家鄉(xiāng)距、遷徙指數(shù)、前臺(tái)指數(shù)、軌跡透視圖等人生軌跡分析指標(biāo),并結(jié)合核密度、標(biāo)準(zhǔn)差橢圓等空間分析方法,對(duì)歷史名人的人生軌跡進(jìn)行探索性分析。張瑋等人[16]參照基于詞典的情感分析算法,設(shè)計(jì)了詞人人生起伏視圖,并與詞作數(shù)量相關(guān)聯(lián),分析了詞人一生的跌宕起伏。王妮滿等人[31]基于WebGIS進(jìn)行了地圖敘事性的可視化嘗試,探索了歷史人物軌跡數(shù)據(jù)由文本格式到地圖空間可視化的方法,對(duì)歷史名人的行為軌跡、社交關(guān)系進(jìn)行空間化和可視化。黃娟等人[32]基于異構(gòu)名人文化數(shù)據(jù),構(gòu)建了名人文化數(shù)字化框架,著重解決名人文化數(shù)據(jù)的組織與可視化問(wèn)題。
在歷史變遷可視分析方面,國(guó)外學(xué)者大多聚焦在龐大、多維度的歷史數(shù)據(jù)宏觀分析,國(guó)內(nèi)學(xué)者更多側(cè)重研究小數(shù)據(jù)集的、單一領(lǐng)域的數(shù)據(jù)分析。歷史人物可視分析是國(guó)內(nèi)學(xué)者較關(guān)注的領(lǐng)域,目前多數(shù)研究成果集中在基于時(shí)空可視化技術(shù)的人物行跡可視化方面,但是也有不少深入的探索分析,如人物軌跡與作品風(fēng)格的關(guān)系[28]、人物社交網(wǎng)絡(luò)的關(guān)系[32]、人物人生起伏與作品數(shù)量的關(guān)系[16]等。
目前可視化技術(shù)在中國(guó)白酒文化領(lǐng)域的研究尚在起步階段,研究成果主要集中在知識(shí)圖譜可視化領(lǐng)域。陳于后[33]對(duì)四川酒文化研究的現(xiàn)狀、研究主題的變遷、研究熱點(diǎn)、研究方向和研究趨勢(shì)等方面進(jìn)行了探討,并采用可視化方法構(gòu)建了知識(shí)圖譜。蔣玉石等人[34]繪制了白酒企業(yè)經(jīng)濟(jì)研究學(xué)者、研究機(jī)構(gòu)和研究主題的知識(shí)圖譜,使用數(shù)據(jù)可視化的方法還原了近15年來(lái)中國(guó)白酒企業(yè)經(jīng)濟(jì)研究的發(fā)展歷程。與白酒文化密切相關(guān)的文化數(shù)據(jù)可視化技術(shù)研究較為全面,從技術(shù)角度可以劃分為四大類:文本數(shù)據(jù)可視化、網(wǎng)絡(luò)數(shù)據(jù)可視化、時(shí)空數(shù)據(jù)可視化、多維數(shù)據(jù)可視化。
文本數(shù)據(jù)可視化綜合了文本分析、數(shù)據(jù)挖掘、數(shù)據(jù)可視化、計(jì)算機(jī)圖形學(xué)、人機(jī)交互、認(rèn)知科學(xué)等學(xué)科的理論和方法,將文本中復(fù)雜的或者難以通過(guò)文字表達(dá)的內(nèi)容和規(guī)律以視覺(jué)符號(hào)的形式表達(dá)出來(lái),同時(shí)向人們提供與視覺(jué)信息進(jìn)行快速交互的功能,使人們能夠利用視覺(jué)感知的并行化處理能力,快速獲取文本信息中蘊(yùn)含的主題、結(jié)構(gòu)或情感態(tài)度等方面的關(guān)鍵信息[35]。
(1)基于詞頻的文本可視化
詞頻是一種進(jìn)行情報(bào)檢索和文本挖掘的常用加權(quán)技術(shù),用于評(píng)估一個(gè)詞在一個(gè)文件或者一個(gè)語(yǔ)料庫(kù)中的一個(gè)領(lǐng)域文件集中的重復(fù)程度。統(tǒng)計(jì)文本中的詞頻能直觀地體現(xiàn)其重要性,從而展現(xiàn)文本特征。目前基于詞頻的文本可視化技術(shù)主要集中在詞云及其變種等方面。參考文獻(xiàn)[32]采用經(jīng)典詞云圖展示了民國(guó)時(shí)期關(guān)鍵名人的熱度,如圖2(a)所示;參考文獻(xiàn)[36]采用聚類詞云圖展現(xiàn)了世界五百?gòu)?qiáng)企業(yè),通過(guò)企業(yè)所在國(guó)家進(jìn)行聚類,體現(xiàn)五百?gòu)?qiáng)企業(yè)的分布情況,如圖2(b)所示;參考文獻(xiàn)[16]通過(guò)改進(jìn)的區(qū)域詞云視圖,展現(xiàn)了詞人在不同時(shí)期的作品詞頻,如圖2(c)所示;參考文獻(xiàn)[37]通過(guò)氣泡圖展現(xiàn)某一朝代姓氏的占比排行情況,氣泡越大表示該姓氏的占比越大,如圖2(d)所示。
(2)基于詞義的文本可視化
基于詞頻的可視化無(wú)法表現(xiàn)文檔關(guān)鍵詞語(yǔ)義之間的聯(lián)系,基于語(yǔ)義的文本可視化主要關(guān)注文本的內(nèi)在語(yǔ)法結(jié)構(gòu)和語(yǔ)義關(guān)系。目前經(jīng)典的基于詞義的文本可視化技術(shù)主要有語(yǔ)義網(wǎng)(phrase net)[38]、語(yǔ)義樹(shù)(word tree)[39]和DocuBurst[40]等。Van Ham F等人[38]分析 了簡(jiǎn)·奧斯汀的小說(shuō)《傲慢與偏見(jiàn)》中“X and Y”結(jié)構(gòu),并構(gòu)造了語(yǔ)義網(wǎng)。Wattenberg M等人[39]為馬丁·路德·金的歷史性演講“I have a dream”構(gòu)建了語(yǔ)義樹(shù)。Collins C等人[40]的研究中采用DocuBurst的形式來(lái)顯示文本內(nèi)容的結(jié)構(gòu),并通過(guò)徑向布局體現(xiàn)了詞的語(yǔ)義等級(jí)。
(3)多信息文本數(shù)據(jù)可視化
文本數(shù)據(jù)視化在文化領(lǐng)域的應(yīng)用不僅是對(duì)關(guān)鍵詞及其語(yǔ)義關(guān)系的信息提取,更重要的是對(duì)文本中包含的情感、意圖等不同維度的信息的處理。許多文本數(shù)據(jù)可視化方法[13,16,18]通過(guò)對(duì)文本中多維信息的處理來(lái)形成聯(lián)合數(shù)據(jù)可視化。目前多信息文本數(shù)據(jù)可視化的呈現(xiàn)方式主要有桑基圖、多圖關(guān)聯(lián)以及信息疊加等多種形式。如參考文獻(xiàn)[13]通過(guò)關(guān)鍵詞提取、情感識(shí)別的文本分析結(jié)果,直觀反映《詩(shī)經(jīng)》的主題、情感分布情況,如圖3(a)所示。參考文獻(xiàn)[16]用顏色代表情緒,用折線代表字音節(jié)的語(yǔ)調(diào)值,展示宋詞的情感音律,構(gòu)造情感音律視圖,再通過(guò)關(guān)系圖將情感音律視圖與語(yǔ)言運(yùn)用視圖關(guān)聯(lián)起來(lái),如圖3(b)所示。參考文獻(xiàn)[18]采用京劇劇本指紋圖對(duì)京劇劇本的文本結(jié)構(gòu)進(jìn)行輔助標(biāo)識(shí),通過(guò)方形像素塊的顏色代表的句長(zhǎng)及白線代表的方差值標(biāo)識(shí)出念白、唱詞等,以便快速定位到文本片段,如圖3(c)所示。
圖2 詞云圖
圖3 多信息文本數(shù)據(jù)可視化
通過(guò)抽取出與白酒文化相關(guān)的詩(shī)詞文本,筆者將文本數(shù)據(jù)可視化方法應(yīng)用于白酒文化可視化,通過(guò)統(tǒng)計(jì)不同作者的酒詩(shī)、酒詞中的詞頻,使用隨機(jī)詞云圖實(shí)現(xiàn)白酒詩(shī)詞文本可視化,如圖4(a)所示;并通過(guò)機(jī)器學(xué)習(xí)的分類算法對(duì)詩(shī)、詞體裁進(jìn)行分類,以桑基圖呈現(xiàn)詩(shī)詞作者、派別及體裁之間的聯(lián)系,如圖4(b)所示。
圖4 白酒文化之詩(shī)詞文本數(shù)據(jù)可視化
網(wǎng)絡(luò)數(shù)據(jù)可視化指在有限空間中對(duì)具有海量節(jié)點(diǎn)和邊的大規(guī)模網(wǎng)絡(luò)進(jìn)行可視化。網(wǎng)絡(luò)數(shù)據(jù)關(guān)系是文化可視化中常見(jiàn)的數(shù)據(jù)類型,如事物之間的關(guān)聯(lián)、人物之間的社交網(wǎng)絡(luò)等,常用樹(shù)形圖、圓形樹(shù)圖、力導(dǎo)向圖和關(guān)系圖等方式呈現(xiàn)。網(wǎng)絡(luò)數(shù)據(jù)可視化中的每個(gè)節(jié)點(diǎn)代表一個(gè)對(duì)象,節(jié)點(diǎn)間的連線代表對(duì)象之間的關(guān)聯(lián)關(guān)系。如參考文獻(xiàn)[13]通過(guò)樹(shù)形圖由內(nèi)而外的層次關(guān)聯(lián)屬性,形象、高效地表示出《詩(shī)經(jīng)》的章節(jié)、小節(jié)、題目、內(nèi)容等層次化數(shù)據(jù)的關(guān)系,如圖5(a)所示。參考文獻(xiàn)[41]通過(guò)樹(shù)形圖展現(xiàn)中華烹飪文化知識(shí)庫(kù)中文本的分布情況和關(guān)鍵主題之間的關(guān)系,如烹飪知識(shí)包含推薦菜譜和食材簡(jiǎn)介,飲食文化包含文化故事和美食攻略。參考文獻(xiàn)[14,31-32,42-44]使用力導(dǎo)向圖和關(guān)系圖等分析了歷史名人的人際關(guān)系網(wǎng),如圖5(b)所示。
圖5 網(wǎng)絡(luò)數(shù)據(jù)可視化
筆者將網(wǎng)絡(luò)數(shù)據(jù)可視化方法應(yīng)用于白酒文化可視化,采用力導(dǎo)向圖分析不同作者所作作品的題材分類。力導(dǎo)向圖中第一層節(jié)點(diǎn)代表詩(shī)或詞,第二層節(jié)點(diǎn)代表作者,第三層節(jié)點(diǎn)代表題材類型,各節(jié)點(diǎn)的大小代表作品數(shù)量,可直觀地呈現(xiàn)每位作者的題材偏好,如圖6所示。
(1)地理空間數(shù)據(jù)可視化
地理空間數(shù)據(jù)可視化是指運(yùn)用地圖學(xué)、計(jì)算機(jī)圖形學(xué)和圖像處理技術(shù),將地學(xué)信息輸入、處理、査詢、分析以及預(yù)測(cè)的數(shù)據(jù)及結(jié)果采用圖形符號(hào)、圖形、圖像,并結(jié)合圖表、文字、表格、視頻、音頻等可視化形式顯示,進(jìn)行交互處理的理論、方法和技術(shù)。目前地理空間數(shù)據(jù)可視化從維度上可以分為二維和三維地理空間維度,從形式上可以分為基于點(diǎn)、基于點(diǎn)線結(jié)合、基于區(qū)域的地理空間形式。參考文獻(xiàn)[11,28-31]采用不同的核密度分析方法,基于地理信息系統(tǒng)標(biāo)注了歷 史人物低、中、高軌跡點(diǎn)核密度,實(shí)現(xiàn)了對(duì)名人活動(dòng)軌跡的核密度分析及可視化。
參考文獻(xiàn)[16]先采用基于區(qū)域的地理空間可視化技術(shù)渲染出宋朝時(shí)期歷史疆域范圍,再采用基于點(diǎn)的地理空間數(shù)據(jù)可視化技術(shù)展示了宋朝詞人的地理空間分布情況。參考文獻(xiàn)[5,14-15,31,37]采用基于點(diǎn)線結(jié)合的地理空間數(shù)據(jù)可視化技術(shù),實(shí)現(xiàn)了歷史人物活動(dòng)軌跡的可視化。參考文獻(xiàn)[37]采用基于區(qū)域的地理空間數(shù)據(jù)可視化技術(shù)及圖層疊加技術(shù),清晰地展示了唐朝、宋朝、元朝、明朝和清朝等不同歷史時(shí)期中國(guó)疆域的變遷過(guò)程。參考文獻(xiàn)[13]的國(guó)風(fēng)情感地圖采用基于區(qū)域的地理空間數(shù)據(jù)可視化技術(shù),詮釋了《詩(shī)經(jīng)》國(guó)風(fēng)篇中不同風(fēng)格的民間詩(shī)歌類別所涉及的疆域范圍,并在此基礎(chǔ)上用區(qū)域邊界的顏色表示喜怒哀樂(lè)等不同的詩(shī)歌情感。
(2)時(shí)間序列數(shù)據(jù)可視化
圖6 白酒文化之詩(shī)詞題材分類力導(dǎo)向圖
時(shí)間序列數(shù)據(jù)可視化是針對(duì)具有時(shí)間屬性的數(shù)據(jù)集進(jìn)行的呈現(xiàn)形式,當(dāng)前主流的呈現(xiàn)形式有 河流圖、散點(diǎn)圖、時(shí)間軸等多種樣式。參考文獻(xiàn)[13]的時(shí)間情感河流圖采用主題河流圖技術(shù),以君主時(shí)期為橫軸時(shí)間坐標(biāo),呈現(xiàn)《詩(shī)經(jīng)》整個(gè)創(chuàng)作周期的情感變化趨勢(shì),如圖7(a)所示。參考文獻(xiàn)[14]中的創(chuàng)作詩(shī)詞時(shí)序圖采用散點(diǎn)時(shí)序圖形式,展現(xiàn)《紅樓夢(mèng)》詩(shī)詞活動(dòng)中林黛玉等人創(chuàng)作詩(shī)詞的先后順序,如圖7(b)所示。
(3)時(shí)空立方體可視化
圖7 時(shí)間序列可視化
時(shí)空立方體可視化是指將地理空間信息和時(shí)間序列信息融合在一起,構(gòu)造的三維立體可視化效果,其可以幫助用戶理解復(fù)雜空間信息的時(shí)間變化規(guī)律,主流的時(shí)空展現(xiàn)形式有組圖對(duì)比型、二維平面疊加時(shí)間軸型以及三維時(shí)空立方體等。參考文獻(xiàn)[30]中的人生軌跡點(diǎn)時(shí)空格局 圖采用平鋪成組的西漢、唐、北宋、元、明、清6個(gè)朝代的二維地圖,分別呈現(xiàn)該朝代歷史名人聚集區(qū)域,通過(guò)對(duì)比方法,直觀呈現(xiàn)了各朝代歷史名人聚集區(qū)域的變遷過(guò)程,這種可視化方法能展現(xiàn)離散的時(shí)間節(jié)點(diǎn)上的空間數(shù)據(jù)。參考文獻(xiàn)[29,45]構(gòu)建了三維的時(shí)空立方體,縱軸為時(shí)間序列,橫軸所在平面為地理空間維度,分別刻畫了古琴名人的三維時(shí)空運(yùn)動(dòng)軌跡和紅軍四渡赤水的時(shí)空立方體。
參考文獻(xiàn)[16]將詞人按照地點(diǎn)和時(shí)間劃分成幾個(gè)人生階段,通過(guò)地圖視圖中地點(diǎn)經(jīng)緯度和時(shí)間序列視圖中事件的時(shí)間之間的關(guān)聯(lián),以二維形式呈現(xiàn)詞人在不同人生階段停留的地區(qū)。參考文獻(xiàn)[27]同樣采用二維地理空間視圖疊加時(shí)間軸的方式,呈現(xiàn)了羅馬歷史中戰(zhàn)爭(zhēng)時(shí)期熱度中心的遷移過(guò)程。
筆者將時(shí)空數(shù)據(jù)可視化方法應(yīng)用于白酒文化可視化,基于歷史名人軌跡數(shù)據(jù)庫(kù),建立了白酒詩(shī)詞作者的人生軌跡時(shí)空可視化,在二維地圖上采用點(diǎn)線結(jié)合的方式描繪作者的人生軌跡,輔以時(shí)間圖例顯示作者不同年齡段的線段顏色,在浮框中以時(shí)間軸的方式顯示作者不同時(shí)間段的生平介紹,地圖與浮框以聯(lián)動(dòng)方式實(shí)現(xiàn)交互,如圖8所示。
圖8 白酒文化之詩(shī)人生平軌跡可視化
多維數(shù)據(jù)可視化指的是同時(shí)將具有多個(gè)維度屬性的數(shù)據(jù)變量進(jìn)行可視化展現(xiàn),多維數(shù)據(jù)可視化的呈現(xiàn)形式多樣,根據(jù)數(shù)據(jù)的維度不同,設(shè)計(jì)方案各不相同,典型的代表有地理空間信息疊加其他信息、時(shí)間序列信息關(guān)聯(lián)多種維度信息,呈現(xiàn)形式有單圖可交互式(一個(gè)圖集成多個(gè)維度信息,通過(guò)交互聚焦某一維度數(shù)據(jù))、多維空間立體式(如地理空間疊加情感、時(shí)間等),更多的用法是多視圖聯(lián)動(dòng)式(通過(guò)不同視圖呈現(xiàn)不同維度的信息,但視圖之間存在關(guān)聯(lián))。參考文獻(xiàn)[27]中設(shè)計(jì)的圓形主題視圖從時(shí)間、熱度排行、占比等維度呈現(xiàn)主題的變化過(guò)程。參考文獻(xiàn)[46]設(shè)計(jì)的語(yǔ)義時(shí)空立方體采用多視圖聯(lián)動(dòng)的形式同時(shí)展示時(shí)間序列、地理空間分布和語(yǔ)義變化趨勢(shì)。
參考文獻(xiàn)[17]采用三維立體方式,在二維地理信息基礎(chǔ)上疊加縱軸方向的情感分類,呈現(xiàn)了關(guān)中地區(qū)正面、中性、負(fù)面人文景觀情感空間分布,如圖9(a)所示。參考文獻(xiàn)[47]通過(guò)基于時(shí)間序列的散點(diǎn)圖的設(shè)計(jì),分析了史詩(shī)《英雄格薩爾》中熱點(diǎn)人物出場(chǎng)的頻率及章節(jié)分布情況,其中橫軸代表史詩(shī)的章節(jié),縱軸代表人物信息,散點(diǎn)的大小代表人物出場(chǎng)的頻率,將橫軸與縱軸結(jié)合起來(lái)還能體現(xiàn)同一章節(jié)中人物之間的關(guān)聯(lián)信息,如圖9(b)所示。參考文獻(xiàn)[15]將散點(diǎn)圖和主題河流圖結(jié)合起來(lái),散點(diǎn)代表該時(shí)期的代表性詞人,主題河流圖中的橫軸是年代,同時(shí)標(biāo)注了重要?dú)v史事件,縱軸代表文學(xué)風(fēng)格流派。多維信息疊加既能呈現(xiàn)某個(gè)時(shí)間區(qū)域內(nèi)在宋詞詞壇文學(xué)風(fēng)格流派的影響力強(qiáng)弱的對(duì)比變化,又能將宋詞風(fēng)格流派的演變與詞人作者相關(guān)聯(lián),體現(xiàn)詞人對(duì)流派的影響,如圖9(c)所示。
筆者將多維數(shù)據(jù)可視化方法應(yīng)用于白酒文化可視化,基于以酒具酒器為主題的數(shù)據(jù)庫(kù)(包括酒具酒器的類型、用途、材質(zhì)、朝代以及古籍文獻(xiàn)出處等多個(gè)維度的數(shù)據(jù)),采用?;鶊D關(guān)聯(lián)酒具、酒器的類型與用途、材質(zhì)和朝代,并采用?;鶊D與動(dòng)畫聯(lián)動(dòng)的交互方式,動(dòng)態(tài)書(shū)寫該類酒具酒器的古籍文獻(xiàn)出處,如圖10(a)所示。同時(shí),基于酒具酒器的文物數(shù)據(jù)和交互數(shù)據(jù),采用樹(shù)狀圖動(dòng)態(tài)呈現(xiàn)酒類器具名稱與類型之間的關(guān)系,如圖10(b)所示。
中國(guó)白酒文化大數(shù)據(jù)具有數(shù)據(jù)源廣泛、多元化、數(shù)據(jù)離散型大、數(shù)據(jù)邊界模糊性強(qiáng)、復(fù)雜度高等特點(diǎn),當(dāng)前的可視化方法主要集中在數(shù)據(jù)縮放技術(shù)、多視圖聯(lián)動(dòng)技術(shù)以及查詢和過(guò)濾技術(shù)等支持可視化推理與人機(jī)交互的重要技術(shù)[48]。比如,在時(shí)間序列視圖中,數(shù)據(jù)縮放技術(shù)能關(guān)注歷史長(zhǎng)河中某一朝代甚至某一年代的細(xì)節(jié)信息;在多維數(shù)據(jù)可視化視圖中,通常用多視圖聯(lián)動(dòng)技術(shù)關(guān)聯(lián)不同視圖中不同維度的數(shù)據(jù),通過(guò)交互能夠幫助用戶感知同一條件下不同維度的信息之間的關(guān)系和規(guī)律;對(duì)于中國(guó)白酒文化的海量數(shù)據(jù),可以通過(guò)查詢和過(guò)濾技術(shù)幫助用戶快速聚焦感興趣的信息。
這些具有交互能力的可視化方法可以幫助用戶關(guān)注細(xì)節(jié)信息和少量維度的關(guān)聯(lián)信息,但是不利于從宏觀層面將多元、離散的數(shù)據(jù)進(jìn)行關(guān)聯(lián),進(jìn)行數(shù)據(jù)分析和挖掘,更無(wú)法解決邊界模糊性和復(fù)雜性問(wèn)題。同時(shí),從文化傳播的需求出發(fā),中國(guó)白酒文化的可視化效果需要兼具藝術(shù)觀賞性,因此從中國(guó)白酒文化數(shù)據(jù)屬性出發(fā),研究滿足需求的可視分析方法將成為該領(lǐng)域的研究熱點(diǎn)。
可交互的白酒文化可視化應(yīng)用研發(fā)是提高新生代對(duì)白酒文化興趣的關(guān)鍵??梢暦治霾捎玫慕换ゼ夹g(shù)應(yīng)是貼近用戶認(rèn)知心理的、支持直接操做的、自然的交互技術(shù)[49],因此基于觸摸屏、寫字筆甚至手勢(shì)感應(yīng)的自然交互技術(shù)也應(yīng)該被合理地運(yùn)用到中國(guó)白酒文化可視化的應(yīng)用研究中。
圖9 多維數(shù)據(jù)可視化
圖10 白酒文化之酒具酒器多維數(shù)據(jù)可視化
增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)都具備較強(qiáng)的交互性,可作為白酒文化可視化的交互手段使用,比如通過(guò)增強(qiáng)現(xiàn)實(shí)技術(shù)構(gòu)造全仿真的三維酒文化博物館,體驗(yàn)者足不出戶即可隨意參觀;通過(guò)虛擬現(xiàn)實(shí)技術(shù)虛擬仿真少數(shù)民族酒文化場(chǎng)景,融合少數(shù)民族服裝、節(jié)日、祝酒歌、舞蹈等多維元素,給體驗(yàn)者沉浸式的文化感受。
中國(guó)白酒文化大數(shù)據(jù)具有多樣性、碎片化等特點(diǎn),這給數(shù)據(jù)的預(yù)處理和挖掘分析帶來(lái)了很大困難。有效地實(shí)現(xiàn)文本分類,提升自動(dòng)化信息提取的準(zhǔn)確性,都是近年來(lái)學(xué)者研究的熱點(diǎn)[2,3,50-51]。文本情感分析、人物關(guān)系推理等深入挖掘分析的算法有待進(jìn)一步探索。此外,古籍文本的文本分析難度遠(yuǎn)高于白話文文本分析,構(gòu)建全面的語(yǔ)料庫(kù)并不斷優(yōu)化分析算法也將成為學(xué)者面臨的重大課題。大規(guī)模、多維度的歷史數(shù)據(jù)宏觀分析仍是國(guó)內(nèi)研究的未來(lái)熱點(diǎn),云計(jì)算與大數(shù)據(jù)技術(shù)的高速發(fā)展為該領(lǐng)域的研究提供了技術(shù)支撐。
當(dāng)前主流的可視化技術(shù)的研究主要集中在數(shù)字文本數(shù)據(jù)可視化層面,中國(guó)白酒文化數(shù)據(jù)的多媒體屬性意味著可視化技術(shù)需要展示的不僅僅是數(shù)字文本數(shù)據(jù),還包含更多元的信息,如考古發(fā)掘的酒具酒器以圖片方式傳播、民風(fēng)民俗中存在的祝酒歌以音頻為載體、與白酒文化相關(guān)的戲曲以視頻為載體、白酒香型以嗅覺(jué)形式感知等。因此,研究多媒體信息的可視化技術(shù)也將成為中國(guó)白酒文化可視化主要的研究方向之一。
本文從中國(guó)白酒文化可視化應(yīng)用研究的視角出發(fā),分析了中國(guó)白酒文化可視化的應(yīng)用場(chǎng)景,闡述了中國(guó)白酒文化可視化的流程,并從文學(xué)作品分析與可視化、考古遺址及歷史文物可視化、歷史變遷及歷史人物可視分析3個(gè)維度入手,分析了中國(guó)白酒文化數(shù)據(jù)的特點(diǎn),探討了中國(guó)白酒文化可視化應(yīng)用研究的現(xiàn)有成果與未來(lái)方向。通過(guò)對(duì)相關(guān)文獻(xiàn)的可視化技術(shù)進(jìn)行進(jìn)一步的分類整理,總結(jié)了文本數(shù)據(jù)可視化、網(wǎng)絡(luò)數(shù)據(jù)可視化、時(shí)空數(shù)據(jù)可視化和多維數(shù)據(jù)可視化4個(gè)技術(shù)類別分別在文化可視化領(lǐng)域的應(yīng)用情況,并給出了中國(guó)白酒文化可視化未來(lái)的研究熱點(diǎn)。當(dāng)前中國(guó)白酒文化可視化的研究尚在起步階段,相信不斷改進(jìn)的數(shù)據(jù)分析技術(shù)能實(shí)現(xiàn)對(duì)中國(guó)白酒文化更深、更廣的挖掘和分析;通過(guò)多媒體可視化技術(shù)的研究,能實(shí)現(xiàn)多種感知信息的可視化,提升用戶的全方位學(xué)習(xí)和體驗(yàn);采用先進(jìn)的人機(jī)交互技術(shù),能讓公眾對(duì)中國(guó)白酒文化有更深入的體驗(yàn)。