亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)字人文中的可視化

        2022-12-02 05:28:52羅煜楚吳昊郭宇涵譚紹聰劉燦蔣瑞珂袁曉如
        大數(shù)據(jù) 2022年6期
        關(guān)鍵詞:可視化人文數(shù)字

        羅煜楚,吳昊,郭宇涵,譚紹聰,劉燦,蔣瑞珂,袁曉如,2

        1. 北京大學(xué)智能學(xué)院機(jī)器感知與智能教育部重點(diǎn)實(shí)驗(yàn)室,北京 100871;

        2. 北京大學(xué)大數(shù)據(jù)分析與應(yīng)用技術(shù)國(guó)家工程實(shí)驗(yàn)室,北京 100871

        0 引言

        信息技術(shù)的發(fā)展促使社會(huì)發(fā)生了深刻的變革,推動(dòng)了學(xué)術(shù)研究中數(shù)據(jù)驅(qū)動(dòng)的第四范式的誕生。自然科學(xué)領(lǐng)域很早就開(kāi)始了對(duì)大規(guī)模數(shù)據(jù)驅(qū)動(dòng)的研究,如天文學(xué)家對(duì)大量觀(guān)測(cè)數(shù)據(jù)進(jìn)行收集和分析,從而發(fā)現(xiàn)關(guān)于宇宙的新知識(shí)。近年來(lái),社科人文領(lǐng)域也逐漸發(fā)展了數(shù)據(jù)驅(qū)動(dòng)的研究方式,傳統(tǒng)的人文學(xué)科在信息技術(shù)的支持下走向大數(shù)據(jù),形成人文學(xué)科與計(jì)算機(jī)學(xué)科的交叉領(lǐng)域——數(shù)字人文(digital humanities)[1]。

        在信息技術(shù)之中,可視化作為一種與人聯(lián)系格外緊密的技術(shù),在數(shù)字人文研究中一直飽受關(guān)注。近年來(lái),可視化在國(guó)際數(shù)字人文大會(huì)的摘要與標(biāo)題中詞頻排名第一[2]。本文分析數(shù)字人文領(lǐng)域研究中可視化技術(shù)的應(yīng)用與發(fā)展。

        1 可視化與數(shù)字人文

        可視化與數(shù)字人文都是在計(jì)算機(jī)發(fā)明后才正式形成的學(xué)科,但可視化與數(shù)字人文之間的聯(lián)系可以追溯到更早的時(shí)候。在計(jì)算機(jī)發(fā)明之前,傳統(tǒng)人文學(xué)科和傳統(tǒng)的可視化方法已經(jīng)有了許多交集。早在數(shù)千年前,人們就已經(jīng)開(kāi)始使用圖形圖像表達(dá)數(shù)據(jù),創(chuàng)作出了地圖這類(lèi)原始的可視化作品,隨著文明的發(fā)展,也出現(xiàn)了越來(lái)越豐富的可視化方法,在各類(lèi)統(tǒng)計(jì)圖表被發(fā)明后,可視化與人文學(xué)科的合作變得更加深入。20世紀(jì)計(jì)算機(jī)的發(fā)明帶來(lái)了強(qiáng)大的計(jì)算能力,并賦予了傳統(tǒng)人文學(xué)科與傳統(tǒng)可視化圖表新的生命形式,可視化學(xué)科與計(jì)算人文學(xué)科也碰撞出了新的火花。本節(jié)從可視化與數(shù)字人文的歷史談起,介紹可視化學(xué)科與數(shù)字人文的發(fā)展沿革,并總覽性地介紹當(dāng)今可視化在計(jì)算人文研究中的現(xiàn)狀。

        1.1 可視化的發(fā)展歷史

        可視化的歷史可以追溯至史前時(shí)期。史前時(shí)期人類(lèi)已經(jīng)通過(guò)編制繩結(jié)、刻畫(huà)圖形等形式對(duì)他們的社會(huì)生活進(jìn)行有效記錄。巴比倫人在公元前6世紀(jì)就開(kāi)始制作黏土板地圖,記錄巴比倫周?chē)某擎?zhèn)、河流等地理信息,這也是現(xiàn)存最早的地圖。隨著經(jīng)濟(jì)社會(huì)發(fā)展,人們需要使用更加精細(xì)的地圖來(lái)管理城市和國(guó)家。例如,南宋《平江圖》石碑詳細(xì)記錄了南宋時(shí)期蘇州城的城市布局,是目前已知最古老的刻有城市地圖的石碑。

        從18世紀(jì)末期開(kāi)始,可視化的先驅(qū)者發(fā)明了更加豐富的可視化形式,用于分析日益復(fù)雜的經(jīng)濟(jì)形勢(shì)變化、講述歷史事實(shí)等,并將其應(yīng)用于政治、經(jīng)濟(jì)、歷史等領(lǐng)域的寫(xiě)作中,以更好地分析數(shù)據(jù)和支持觀(guān)點(diǎn)。蘇格蘭工程師威廉·普萊費(fèi)爾(William Playfair)發(fā)明了折線(xiàn)圖、柱狀圖和餅圖等可視化類(lèi)型,他設(shè)計(jì)了用于比較英國(guó)、丹麥與挪威進(jìn)出口數(shù)據(jù)的折線(xiàn)圖,清晰地展現(xiàn)了國(guó)家間貿(mào)易額的變化和貿(mào)易順逆差的變換。法國(guó)工程師查爾斯·約瑟夫·米納德(Charles Joseph Minard)于1869年出版了著名的拿破侖行軍信息圖,詳細(xì)展示了法國(guó)軍隊(duì)的進(jìn)軍過(guò)程和損失情況,并展示了地形和天氣對(duì)戰(zhàn)爭(zhēng)結(jié)果造成的影響,此外,他還通過(guò)在地圖上繪制流圖表現(xiàn)國(guó)家間的貿(mào)易情況和人口遷移等經(jīng)濟(jì)社會(huì)議題。

        隨著20世紀(jì)70年代計(jì)算機(jī)顯示技術(shù)的發(fā)展和80年代超算模擬、醫(yī)學(xué)等領(lǐng)域大量數(shù)據(jù)的產(chǎn)生,人們對(duì)探索大規(guī)??茖W(xué)數(shù)據(jù)有了強(qiáng)烈的需求,科學(xué)可視化也隨之產(chǎn)生和發(fā)展。1987年,美國(guó)國(guó)家科學(xué)基金會(huì)首次以科學(xué)可視化為主題舉辦了會(huì)議,給出了科學(xué)可視化的定義,并提出了科學(xué)可視化的需求和發(fā)展路徑[3]。此后,可視化的用途很快被拓寬到了對(duì)抽象數(shù)據(jù)的展示與分析,從而誕生了信息可視化[4]與可視分析[5]的概念。人文社科數(shù)據(jù)作為常見(jiàn)的抽象數(shù)據(jù)形式,也是信息可視化與可視分析中重要的研究對(duì)象。

        現(xiàn)在的可視化技術(shù)更強(qiáng)調(diào)借助計(jì)算機(jī)的能力,幫助人們更好地解決數(shù)據(jù)任務(wù)??梢暬瘜⑷伺c計(jì)算機(jī)共同包含在內(nèi)的數(shù)據(jù)分析流程及其高效的信息傳遞能力能夠在數(shù)字人文研究中發(fā)揮重要作用。

        1.2 數(shù)字人文歷史與現(xiàn)狀

        數(shù)字人文概念的前身是“人文計(jì)算”(humanities computing)[6]。在計(jì)算機(jī)被發(fā)明之后,人文學(xué)科的研究者敏銳地觀(guān)察到了計(jì)算機(jī)快速處理數(shù)據(jù)的能力,從而提出人文計(jì)算方法,即利用新興計(jì)算工具輔助傳統(tǒng)的人文研究。在世界第一臺(tái)通用計(jì)算機(jī)誕生僅僅3年之后的1949年,羅伯托·布薩(Roberto Busa)獲得了國(guó)際商業(yè)機(jī)器公司(International Business Machines Corporation,IBM)創(chuàng)始人托馬斯·約翰·沃森(Thomas John Watson)的支持,開(kāi)始嘗試使用計(jì)算機(jī)為海量文本編制詞語(yǔ)索引(index),這也是人文計(jì)算實(shí)踐的開(kāi)端[7]。

        近20年來(lái),隨著計(jì)算機(jī)技術(shù)與多媒體技術(shù)的發(fā)展,計(jì)算機(jī)的存儲(chǔ)與運(yùn)算能力更加強(qiáng)大,在文本之外,人文研究中的大量圖片、音頻與視頻等多媒體信息也可以被計(jì)算機(jī)處理與分析。計(jì)算機(jī)的能力早已不再局限于簡(jiǎn)單的統(tǒng)計(jì)與計(jì)算,在計(jì)算機(jī)領(lǐng)域,可視化與可視分析、數(shù)據(jù)挖掘、知識(shí)推理、智能檢索等數(shù)字技術(shù)都能與人文學(xué)科碰撞產(chǎn)生新的火花,計(jì)算機(jī)參與了人文學(xué)科研究的各個(gè)階段,計(jì)算機(jī)學(xué)科與人文學(xué)科的交叉使人文研究進(jìn)入新階段——數(shù)字人文時(shí)代[1]。

        數(shù)字人文科研社區(qū)的形成可以追溯到人文計(jì)算時(shí)代,1964年IBM在美國(guó)約克城高地(Yorktown Heights)組織了關(guān)于人文計(jì)算的研討會(huì),并出版了《文學(xué)數(shù)據(jù)處理會(huì)議論文集》(literary data processing conference proceedings)[6]。20世紀(jì)80年代,陸續(xù)出現(xiàn)了關(guān)于人文計(jì)算與數(shù)字人文的學(xué)術(shù)組織、期刊與國(guó)際性會(huì)議,如文學(xué)和語(yǔ)言計(jì)算協(xié)會(huì)(Association for Literary and Linguistic Computing,ALLC)、計(jì)算機(jī)與人文協(xié)會(huì)(Association for Computers and the Humanities,ACH)、《數(shù)字人文季刊》(Digital Humanities Quarterly,DHQ)等。2002年于德國(guó)圖賓根大學(xué)(Tuebingen University)舉辦的文學(xué)和語(yǔ)言計(jì)算協(xié)會(huì)與計(jì)算機(jī)與人文協(xié)會(huì)聯(lián)合會(huì)議(ALLC/ACH),發(fā)起了成立數(shù)字人文組織聯(lián)盟(Alliance of Digital Humanities Organizations,ADHO)的討論,嘗試協(xié)調(diào)整合世界多個(gè)地區(qū)的數(shù)字人文組織與會(huì)議。2005年,ADHO正式召開(kāi)了第一次大會(huì)。經(jīng)過(guò)數(shù)年的發(fā)展,ADHO吸收多個(gè)區(qū)域性數(shù)字人文組織,覆蓋歐洲、美洲的主要區(qū)域,亞洲、非洲也有部分?jǐn)?shù)字人文組織加入,成為當(dāng)前國(guó)際上最具有權(quán)威性與代表性的數(shù)字人文組織[8]。ADHO每年組織開(kāi)展一次國(guó)際數(shù)字人文大會(huì)(DH Conference),收錄長(zhǎng)文、短文、海報(bào)等不同形式的發(fā)表物。

        ADHO的國(guó)際數(shù)字人文大會(huì)是具有代表性的大規(guī)模數(shù)字人文會(huì)議,通過(guò)對(duì)其內(nèi)容進(jìn)行檢查,可以了解當(dāng)前數(shù)字人文研究的發(fā)展情況。筆者從卡內(nèi)基梅隆大學(xué)(Carnegie Mellon University,CMV)的數(shù)據(jù)庫(kù)中爬取了2013年至2020年國(guó)際數(shù)字人文大會(huì)的所有發(fā)表物信息,共3 043個(gè)條目。每個(gè)條目都包括作者、主題、關(guān)鍵詞、摘要等屬性。通過(guò)統(tǒng)計(jì)每年的發(fā)表物數(shù)量可以看到,大會(huì)的規(guī)模保持著較快的增長(zhǎng)速度。為了展開(kāi)更具體的分析,筆者從發(fā)表物的屬性中提取了研究主題的關(guān)鍵詞,利用可視化中的平行詞云方法[9]分析每年大會(huì)發(fā)表物中研究主題關(guān)鍵詞分布的變化情況(如圖1(a)所示),在代表年份的每一列中,出現(xiàn)次數(shù)越多的關(guān)鍵詞排名越靠前,且字號(hào)越大。除了可以發(fā)現(xiàn)可視化(visualization)一詞一直居于高位之外,筆者高亮標(biāo)出的合作(collaboration)與教育學(xué)(pedagogy)也是數(shù)字人文研究中的熱門(mén),而機(jī)器學(xué)習(xí)(machine learning)在最近幾年詞頻排名突飛猛進(jìn)。除此之外,筆者還使用詞向量嵌入與t-分布鄰域嵌入算法(t-SNE),繪制了每年的研究主題關(guān)鍵詞投影地圖。對(duì)比2006年至2020年的關(guān)鍵詞投影地圖(如圖1(b)所示),筆者發(fā)現(xiàn)許多與傳統(tǒng)人文學(xué)科相關(guān)的關(guān)鍵詞及計(jì)算(computing)、語(yǔ)料(corpus)等與人文計(jì)算中經(jīng)典方法相關(guān)的關(guān)鍵詞始終出現(xiàn)在投影地圖中。從2014年開(kāi)始,網(wǎng)絡(luò)(networking)、建模(modeling)、編碼(encoding)、合作(collaborative)等主題逐漸受到更多的關(guān)注,這也體現(xiàn)了數(shù)字人文研究中數(shù)據(jù)與方法的豐富與完善,而在2020年的投影圖中可以看到可視化(visualization,visualizing)、自然語(yǔ)言處理(natural language process)等主題開(kāi)始出現(xiàn)。這些現(xiàn)象體現(xiàn)了數(shù)字人文領(lǐng)域的研究重心變化及多學(xué)科融合的大趨勢(shì)。

        1.3 堅(jiān)持應(yīng)用需求引導(dǎo)數(shù)據(jù)開(kāi)放

        近年來(lái),多方面促成可視化與數(shù)字人文學(xué)科交叉快速發(fā)展。一方面,信息技術(shù)的不斷發(fā)展使復(fù)雜數(shù)據(jù)的數(shù)字化與計(jì)算處理成為可能,同時(shí)眾多人文學(xué)者的持續(xù)努力使數(shù)字化的人文數(shù)據(jù)持續(xù)增長(zhǎng),這些數(shù)據(jù)使人文學(xué)者的研究空間變得更加廣闊,但復(fù)雜且龐大的數(shù)據(jù)也對(duì)數(shù)字人文的研究提出了新的挑戰(zhàn)。更多更復(fù)雜的數(shù)據(jù)使學(xué)者們更難理解數(shù)據(jù)中的關(guān)鍵信息,也更難做出決策,調(diào)整參數(shù),操縱算法處理數(shù)據(jù)。為了使人和機(jī)器更有效地參與數(shù)據(jù)分析協(xié)作,人文學(xué)者不斷探尋更好的可視化方法和工具,以搭建更好地連接人與機(jī)器的橋梁,提高人機(jī)協(xié)作的效率。另一方面,從可視化研究者的角度,數(shù)字人文領(lǐng)域中出現(xiàn)的新數(shù)據(jù)和新任務(wù)也向可視化領(lǐng)域提出了新需求與新挑戰(zhàn),激勵(lì)著更多的可視化研究者進(jìn)行與數(shù)字人文相關(guān)的可視化方法研究和工具開(kāi)發(fā)。同時(shí)隨著數(shù)據(jù)公開(kāi)性與方法易用性的增長(zhǎng),藝術(shù)家、數(shù)據(jù)記者與社會(huì)大眾等群體也能夠更好地參與進(jìn)來(lái),使用可視化的工具和數(shù)字人文中的數(shù)據(jù)進(jìn)行探索與創(chuàng)作。

        近10年來(lái),可視化與數(shù)字人文的交叉已經(jīng)形成了一股顯著趨勢(shì)。在國(guó)際數(shù)字人文大會(huì)中可以發(fā)現(xiàn),近10年可視化的詞頻都穩(wěn)居前列(如圖1(c)所示)。在平行詞云圖(如圖1(c)所示)中展開(kāi)可視化一項(xiàng),可以總結(jié)出在數(shù)字人文中與可視化關(guān)聯(lián)較強(qiáng)的八大主題為:文學(xué)研究、文本分析、歷史研究、網(wǎng)絡(luò)關(guān)系分析、知識(shí)表達(dá)、古物保存、時(shí)空分析以及文化研究。

        圖1 使用可視化分析歷年DH會(huì)議出版物的總體情況

        2 數(shù)字人文中的可視化

        可視化在數(shù)字人文中的應(yīng)用場(chǎng)景復(fù)雜多樣。在數(shù)字人文研究中,可視化方法需根據(jù)數(shù)字人文的任務(wù)與數(shù)據(jù)特性來(lái)確定。此外,被使用的可視化方法也受研究者的知識(shí)背景和個(gè)人偏好的影響。本節(jié)從可視化在數(shù)字人文中參與的任務(wù)、可視化在數(shù)字人文中處理的數(shù)據(jù)以及可視化在數(shù)字人文中不同的使用視角3個(gè)角度剖析可視化在數(shù)字人文中的應(yīng)用情況。

        2.1 可視化在數(shù)字人文中參與的任務(wù)

        數(shù)字人文中的任務(wù)種類(lèi)繁多,在討論可視化在數(shù)字人文中參與的任務(wù)時(shí),筆者選擇一種抽象的任務(wù)分類(lèi)方法,以便在較短的篇幅中更加全面地分析問(wèn)題。數(shù)字人文的整體研究流程包括3個(gè)階段,分別為數(shù)據(jù)收集、數(shù)據(jù)分析、結(jié)果展示。

        數(shù)據(jù)收集指數(shù)據(jù)的采集錄入與標(biāo)注加工等任務(wù)。在此類(lèi)任務(wù)中,研究者需要將原本非數(shù)字化的材料電子化。例如實(shí)體書(shū)籍的錄入或雕塑作品的掃描建模,或初級(jí)數(shù)字化材料的加工(如文本識(shí)別)等。在數(shù)據(jù)收集的過(guò)程中,可視化本身雖然是一種信息輸出的方法,但其根本作用是輔助用戶(hù)與機(jī)器的交互,從而將用戶(hù)的知識(shí)凝結(jié)在最終的加工結(jié)果之中。一方面,可視化能較好地對(duì)信息進(jìn)行簡(jiǎn)化與轉(zhuǎn)換,降低標(biāo)注的門(mén)檻,使專(zhuān)業(yè)性不那么強(qiáng)的用戶(hù)也能參與數(shù)據(jù)收集的工作,為數(shù)字人文中的眾包(crowdsourcing)[10]提供強(qiáng)大的支持。另一方面,可視化能高效地使用圖形向用戶(hù)反饋錄入與標(biāo)注的數(shù)據(jù)結(jié)果,使用戶(hù)能及時(shí)檢查數(shù)據(jù)是否符合預(yù)期,能更容易地發(fā)現(xiàn)數(shù)據(jù)或標(biāo)注中的錯(cuò)誤。

        在數(shù)據(jù)分析階段,人文學(xué)者借助計(jì)算機(jī)高效的計(jì)算能力,結(jié)合人文專(zhuān)業(yè)知識(shí),進(jìn)行數(shù)據(jù)驅(qū)動(dòng)的分析與研究。而可視化正好可以作為用戶(hù)與計(jì)算機(jī)之間的雙向橋梁,有機(jī)地將用戶(hù)的領(lǐng)域知識(shí)與計(jì)算機(jī)高效的計(jì)算能力相結(jié)合。在可視分析的過(guò)程中,用戶(hù)基于可視化結(jié)果和自身專(zhuān)業(yè)知識(shí)不斷做出決策(decision making)[11],通過(guò)與可視化界面交互向計(jì)算機(jī)發(fā)出指令,而計(jì)算機(jī)也根據(jù)用戶(hù)的決策不斷地計(jì)算并展示新的可視化結(jié)果。在循環(huán)迭代的過(guò)程中,用戶(hù)不斷加深對(duì)數(shù)據(jù)的理解,最終從數(shù)據(jù)中得到結(jié)論。

        在最后的結(jié)果展示階段,研究者需要向?qū)W術(shù)社區(qū)高效地傳達(dá)自己的研究結(jié)論,或使用偏向故事敘述或藝術(shù)展示的方式向大眾宣傳結(jié)果。可視化此時(shí)被作為一種高效的信息輸出手段。可視化的優(yōu)點(diǎn)不僅在于更高的信息密度與更快的信息傳輸速度,同時(shí)圖形化的結(jié)果展示也更加有趣易懂,能讓不具備專(zhuān)業(yè)背景的大眾更愿意、更容易理解人文學(xué)者的成果,在教育科普領(lǐng)域起著重要的作用。

        2.2 可視化在數(shù)字人文中處理的數(shù)據(jù)

        本節(jié)分析數(shù)字人文研究中可視化應(yīng)對(duì)的數(shù)據(jù)形式。數(shù)據(jù)的形式在很大程度上直接決定了可視化的類(lèi)型。從廣泛的可視化定義來(lái)說(shuō),應(yīng)對(duì)簡(jiǎn)單統(tǒng)計(jì)數(shù)據(jù)的統(tǒng)計(jì)圖表必然是數(shù)字人文研究中最為常見(jiàn)的可視化形式,但此類(lèi)圖表的應(yīng)用早已是學(xué)術(shù)寫(xiě)作中的慣例,故不對(duì)此進(jìn)行討論。

        首先,文本可視化是數(shù)字人文中應(yīng)用最多的可視化類(lèi)型,在2019年的國(guó)際數(shù)字人文大會(huì)中,有68篇與可視化相關(guān)的長(zhǎng)文,其中32篇都是與文本可視化相關(guān)的,占比高達(dá)47%。文本可視化應(yīng)用廣泛的原因首先在于人文研究中文本材料的普遍性,同時(shí)文本的非結(jié)構(gòu)化特征使研究者難以使用完全自動(dòng)化的方法完成任務(wù)。在數(shù)字人文研究中,針對(duì)文本數(shù)據(jù)中字、詞、句、篇、主題等不同層次有不同的分析任務(wù),但總體來(lái)說(shuō),可以將這些文本分析任務(wù)按照所分析的細(xì)節(jié)程度分為近讀與遠(yuǎn)讀兩種類(lèi)型,對(duì)應(yīng)地,文本可視化也能被分為近讀與遠(yuǎn)讀兩種可視化[12]。近讀是一種關(guān)注文本中語(yǔ)言自身結(jié)構(gòu)的分析方式,包括實(shí)體分析、文字特征分析和文字復(fù)用分析等,近讀可視化往往在不丟失文本細(xì)節(jié)的情況下突出展示任務(wù)關(guān)注的部分,如使用不同顏色、不同大小的圖標(biāo)符號(hào)對(duì)“白底黑字”的原始文本進(jìn)行增強(qiáng),或使用交互方法與多視圖提高用戶(hù)的閱讀效率。例如J?nicke S等人[13]為了比較多個(gè)版本的文本,使用了一種變化圖的可視化形式突出不同版本間文字的異同(如圖2(a)所示)。而在遠(yuǎn)讀中,研究者更加關(guān)注文本總體特征與性質(zhì),往往先通過(guò)各類(lèi)統(tǒng)計(jì)方法與數(shù)學(xué)模型總結(jié)抽象文本的特征,然后進(jìn)行視覺(jué)展示。遠(yuǎn)讀可視化常包含像素、詞云、地圖等抽象形式,如在Keim D A等人[14]對(duì)杰克·倫敦(Jack London)兩部小說(shuō)的可視化中,使用顏色編碼了小說(shuō)不同章節(jié)中用詞的豐富程度(如圖2(b)所示)。

        圖2 數(shù)字人文中對(duì)文本數(shù)據(jù)進(jìn)行可視化的例子

        除文本外,網(wǎng)絡(luò)關(guān)系數(shù)據(jù)與地理時(shí)空數(shù)據(jù)也是數(shù)字人文中較多通過(guò)可視化方法被分析的對(duì)象。這兩種數(shù)據(jù)本身較高的復(fù)雜性給予了人文學(xué)者更多使用可視化方法的動(dòng)力。

        數(shù)字人文中的網(wǎng)絡(luò)關(guān)系數(shù)據(jù)多提取自文本,包括人物關(guān)系、家譜族譜、知識(shí)圖譜等。在對(duì)網(wǎng)絡(luò)關(guān)系數(shù)據(jù)進(jìn)行可視化的過(guò)程中,使用符號(hào)與線(xiàn)條代表圖中點(diǎn)與邊的點(diǎn)邊圖(node-link)是一種最常見(jiàn)的方式。點(diǎn)邊圖的編碼方式簡(jiǎn)單易懂,其中可以設(shè)置不同的位置布局方法和附加編碼方式,使其能應(yīng)對(duì)不同的任務(wù)場(chǎng)景,呈現(xiàn)不同的效果。例如Canon C等人[15]在使用點(diǎn)邊圖對(duì)氣候傳播學(xué)的學(xué)術(shù)合作關(guān)系(如圖3(a)所示)進(jìn)行可視化時(shí),使用了顏色與大小的視覺(jué)編碼及力導(dǎo)向的方法,使代表相似概念的點(diǎn)聚集在一起。而Mcguffin M J等人[16]將點(diǎn)邊圖以分層布局排布,則能較好地完成家族樹(shù)的可視化任務(wù)(如圖3(b)所示)。在點(diǎn)邊圖之外,矩陣(matrix)也是常見(jiàn)的圖可視化方法,在矩陣中,常使用矩陣格點(diǎn)的顏色對(duì)關(guān)系是否存在或關(guān)系的權(quán)重大小進(jìn)行編碼。相比點(diǎn)邊圖,矩陣可視化更加整潔,空間利用率更高,但在與路徑相關(guān)的關(guān)系分析任務(wù)中其表現(xiàn)明顯遜色于點(diǎn)邊圖。

        地理時(shí)空數(shù)據(jù)是包含地理空間位置與時(shí)間信息的數(shù)據(jù),在研究與歷史、地理等相關(guān)的數(shù)字人文中較為常見(jiàn)。數(shù)字人文中的地理時(shí)空數(shù)據(jù)有兩種常見(jiàn)的來(lái)源。一類(lèi)數(shù)據(jù)來(lái)源于文本,主要是從文本中提取的地名實(shí)體或時(shí)空事件,這種數(shù)據(jù)需要通過(guò)額外的先驗(yàn)知識(shí)才能映射到地理空間中,如從古地名對(duì)應(yīng)到目前現(xiàn)實(shí)的地理坐標(biāo)。從文本中提取的地理數(shù)據(jù)通常規(guī)模較大,可能達(dá)到數(shù)萬(wàn)個(gè)地名實(shí)體。例如在參考文獻(xiàn)[17]中,學(xué)者通過(guò)從1839年至1922年巴黎的城市目錄中提取400萬(wàn)個(gè)人名與地址,重構(gòu)了19世紀(jì)的巴黎市地圖。在應(yīng)對(duì)此類(lèi)數(shù)據(jù)時(shí),數(shù)字人文學(xué)者往往使用現(xiàn)有的地理信息系統(tǒng)(geographic information system,GIS)進(jìn)行數(shù)據(jù)可視化,使用符號(hào)與圖標(biāo)編碼數(shù)據(jù),在地圖中分析數(shù)據(jù)中的地理分布、群體移動(dòng)趨勢(shì),或隨時(shí)間改變的數(shù)據(jù)特征等。例如Donaldson C等人[18]使用地圖上的熱力圖分析文本中描述英國(guó)湖區(qū)不同景點(diǎn)的用詞偏好。另一類(lèi)數(shù)據(jù)來(lái)源于圖像數(shù)據(jù),如古代手繪地圖,此時(shí)常需要對(duì)手繪地圖進(jìn)行變形,使其與現(xiàn)有地圖對(duì)齊,然后開(kāi)始分析任務(wù)。El Khatib R等人[19]對(duì)古籍中的手繪古巴比倫地圖變形,使其與今天的世界地圖對(duì)齊。

        除了上面討論的3種數(shù)字人文中常用于可視化的數(shù)據(jù)類(lèi)型,數(shù)字人文中還有圖像、聲音、三維模型,乃至更多與具體領(lǐng)域相關(guān)的數(shù)據(jù)形式,但是針對(duì)這些數(shù)據(jù)的可視化方法遠(yuǎn)不如前3種常見(jiàn)數(shù)據(jù)類(lèi)型成熟。但即使在3種較為常見(jiàn)數(shù)據(jù)類(lèi)型的可視化應(yīng)用中,數(shù)字人文中對(duì)具體可視化技術(shù)的使用與可視化領(lǐng)域中對(duì)方法與工具的研究之間依然存在溝壑,人文學(xué)者由于缺少可視化的知識(shí)與經(jīng)驗(yàn),往往難以選出最有效的參數(shù)或方法來(lái)完成任務(wù)。Grandjean M等人[20]提到在處理網(wǎng)絡(luò)關(guān)系數(shù)據(jù)時(shí),人文學(xué)者常常無(wú)法找到合適的可視化技術(shù)改善圖中嚴(yán)重遮擋的問(wèn)題,同時(shí)也常忽略圖布局與分析任務(wù)的匹配性,這一類(lèi)問(wèn)題降低了可視化在數(shù)字人文研究中的有效性。同時(shí),這一類(lèi)問(wèn)題也對(duì)可視化領(lǐng)域提出了新的需求,暴露了當(dāng)前許多可視化工具無(wú)法支持靈活匹配任務(wù)的可視化創(chuàng)建,或?qū)幊碳寄芘c可視化專(zhuān)業(yè)知識(shí)依賴(lài)過(guò)高的問(wèn)題。因此,當(dāng)前可視化工具的發(fā)展還存在巨大的進(jìn)步空間。

        2.3 可視化在數(shù)字人文中不同的使用視角

        可視化在數(shù)字人文中的使用也受使用者知識(shí)背景和興趣偏好的影響,本節(jié)分別從數(shù)字人文學(xué)者、可視化研究者以及藝術(shù)家的角度探索若干可視化與數(shù)字人文結(jié)合的案例。

        人文學(xué)者在數(shù)字人文中的研究往往是從數(shù)據(jù)出發(fā)的。在國(guó)內(nèi)的數(shù)字人文數(shù)據(jù)中,中國(guó)歷代人物傳記資料庫(kù)CBDB[21]是極負(fù)盛名的數(shù)據(jù)庫(kù)之一。CBDB項(xiàng)目自2005年啟動(dòng)以來(lái),以眾包的方式收錄了各類(lèi)歷史文獻(xiàn)中的人物基本資料、關(guān)系往來(lái)和生平年表等信息。截至2022年8月,數(shù)據(jù)庫(kù)中已經(jīng)包含了52萬(wàn)余人的傳記信息。面對(duì)這樣一個(gè)包含了大量復(fù)雜數(shù)據(jù)的數(shù)據(jù)庫(kù),人文學(xué)者借助了許多現(xiàn)有的可視化工具進(jìn)行分析。對(duì)于CBDB中復(fù)雜的地理信息數(shù)據(jù),人文學(xué)者往往使用現(xiàn)有GIS進(jìn)行分析,如包弼德等人[22]使用顏色與大小編碼的圓圈在地圖上比較明初(1400年)與明末(1600年)時(shí)期的進(jìn)士來(lái)源地。而對(duì)于關(guān)系數(shù)據(jù),現(xiàn)有Gephi[23]、UCINET[24]等圖可視化工具也能為人文學(xué)者提供許多的支持,CBDB官方網(wǎng)站上就使用UCINET中的Pajek插件對(duì)CBDB中朱熹書(shū)信往來(lái)記錄進(jìn)行了可視化,如圖4所示。

        圖4 CBDB中的朱熹書(shū)信往來(lái)可視化

        另外,Schich M等人[25]使用可視化工具分析了Freebase、General Artist Lexicon以及Getty Union List of Artist Names這3個(gè)數(shù)據(jù)庫(kù)中15萬(wàn)位名人的出生地和死亡地信息,Schich M等人[25]借助散點(diǎn)圖(如圖5(a)所示)分析了不同城市的名人出生數(shù)與死亡數(shù),從散點(diǎn)圖中可以快速識(shí)別出生數(shù)與死亡數(shù)顯著不平衡的城市。同時(shí)作者借助圖可視化對(duì)古玩收藏家從出生到死亡的流向進(jìn)行可視化(如圖5(b)所示),在使用顏色和大小編碼的點(diǎn)邊圖中,古玩收藏家聚集的城市十分明顯。為了使大眾也能輕松理解這些埋藏在數(shù)據(jù)之中的有趣事實(shí),作者還使用了一種三維可視化方法制作故事敘述視頻(如圖5(c)所示),這種可視化故事敘述的方法不僅能夠向大眾普及歷史知識(shí),也能通過(guò)藝術(shù)化的表現(xiàn)形式引起公眾的興趣。

        圖5 S chich M等人[25]分析與展示名人的出生與死亡數(shù)據(jù)

        人文學(xué)者利用已有可視化工具或方法對(duì)人文數(shù)據(jù)進(jìn)行分析,而隨著分析任務(wù)的深入,傳統(tǒng)的工具難以應(yīng)對(duì)更加復(fù)雜的任務(wù),針對(duì)人文數(shù)據(jù)與任務(wù)的特點(diǎn)深度定制化的可視化工具和方法能發(fā)揮更大的作用。而可視化研究者則傾向于針對(duì)一類(lèi)新的數(shù)據(jù)或任務(wù)研發(fā)新的可視化方法與技術(shù),在文學(xué)可視化中就有許多例子。

        Keim D A等人[14]提出的“文學(xué)指紋”結(jié)合了文本分析算法和像素可視化方法,為單部文學(xué)作品計(jì)算出了多層次、多種類(lèi)的特征值,并以特征指紋的形式展示給用戶(hù)。圖2(b)中的杰克·倫敦的兩部小說(shuō)呈現(xiàn)出不同的特征指紋,直觀(guān)地展現(xiàn)出兩部作品在結(jié)構(gòu)上的不同。傳統(tǒng)上,學(xué)者在對(duì)文學(xué)作品的通讀中逐步建立對(duì)文本特征的整體印象,而“文學(xué)指紋”采用的遠(yuǎn)讀方法為領(lǐng)域?qū)W者提供了一種新的研究路徑,即由概覽到細(xì)節(jié)。隨著交互技術(shù)的發(fā)展,更多研究工作支持用戶(hù)在概覽與原始文本細(xì)節(jié)間切換,便于學(xué)者進(jìn)行多層次的文本分析。Alharbi M等人[26]提出了莎士比亞戲劇《奧賽羅》德語(yǔ)譯本的對(duì)讀可視分析系統(tǒng),將遠(yuǎn)讀和近讀集成在同一界面中,支持用戶(hù)通過(guò)選擇、過(guò)濾等交互方式在不同的粒度上進(jìn)行探索。

        可視分析技術(shù)的創(chuàng)新與發(fā)展為人文領(lǐng)域研究提供了新的數(shù)據(jù)探索與分析方式,對(duì)于從可視化研究者出發(fā)的可視化技術(shù)創(chuàng)新,要考慮的問(wèn)題則是如何更深入、更泛化地將其應(yīng)用到人文研究中,如何提高方法的通用性使其能適用于更多的人文研究,又如何幫助人文學(xué)者快速掌握可視化工具的使用方法。針對(duì)這些問(wèn)題,智能交互技術(shù)是一種未來(lái)可能的發(fā)展方向,在未來(lái),智能交互技術(shù)與可視分析系統(tǒng)的融合能進(jìn)一步提升系統(tǒng)的有效性、易用性,輔助人文學(xué)者更加便捷、深入地分析領(lǐng)域數(shù)據(jù)。

        除了人文學(xué)者和可視化研究者,一部分藝術(shù)領(lǐng)域?qū)W者也從藝術(shù)的角度出發(fā),創(chuàng)作出兼具藝術(shù)、科普與學(xué)術(shù)價(jià)值的數(shù)字人文作品。Xiang F等人[27]從家譜中獲得靈感,基于CBDB中的人物親屬關(guān)系,構(gòu)建了中國(guó)古代家譜樹(shù),并以交互可視化的方式呈現(xiàn)給大眾。不同于傳統(tǒng)的樹(shù)可視化方法,家譜樹(shù)引入分支、生長(zhǎng)的視覺(jué)隱喻,對(duì)樹(shù)的視覺(jué)形態(tài)進(jìn)行了增強(qiáng),如采取自下而上的生長(zhǎng)順序,使用藝術(shù)化編碼方式與三維布局。圖6(a)和圖6(b)分別是明代和宋代的皇室家族樹(shù),兩者形態(tài)差異較大,展現(xiàn)出兩個(gè)朝代皇室傳承方式的不同。張姓家族樹(shù)(如圖6(c)所示)中雜亂的水平線(xiàn)則意味著歷史記載中“一子多父”的錯(cuò)誤。藝術(shù)手法的融入使作品風(fēng)格與數(shù)據(jù)特點(diǎn)緊密契合,作品具有極高的藝術(shù)價(jià)值,亦不失有效性,既易于大眾理解,也能為歷史研究提供線(xiàn)索。

        圖6 中國(guó)古 代家譜樹(shù)可視化[27]

        從這些例子中可以發(fā)現(xiàn),人文學(xué)者、可視化研究者以及藝術(shù)家都能結(jié)合自身所長(zhǎng),分別從人文數(shù)據(jù)分析、可視化技術(shù)創(chuàng)新以及藝術(shù)美學(xué)等角度開(kāi)展可視化與數(shù)字人文結(jié)合的項(xiàng)目。但在大部分實(shí)際的項(xiàng)目中,單一背景的學(xué)者難以兼顧3個(gè)角度,最終的產(chǎn)出具有一定的局限性。要真正提升可視化與數(shù)字人文結(jié)合項(xiàng)目的效用,就需要強(qiáng)調(diào)學(xué)科之間的交叉,兼顧這些不同的角度。

        3 北京大學(xué)在可視化與數(shù)字人文交叉上的實(shí)踐

        在信息時(shí)代的新任務(wù)之下,數(shù)字人文項(xiàng)目需要多領(lǐng)域緊密交叉與合作,但現(xiàn)有的數(shù)字人文項(xiàng)目往往是由人文、技術(shù)、藝術(shù)等領(lǐng)域的研究者分別開(kāi)展的。為了探究未來(lái)可視化與數(shù)字人文結(jié)合的新范式,北京大學(xué)可視化與可視分析實(shí)驗(yàn)室對(duì)數(shù)字人文與可視化的交叉進(jìn)行了許多探索,這些探索包含教育、科普與研究領(lǐng)域。筆者通過(guò)開(kāi)展暑期學(xué)校,在教育方面探索人文、計(jì)算機(jī)、藝術(shù)多元合作模式下交叉人才的培養(yǎng)。同時(shí),為了使公眾或其他相關(guān)領(lǐng)域?qū)W者了解可視化與數(shù)字人文交叉的強(qiáng)大能力,推廣新概念新方法,助力人文知識(shí)的傳播,筆者與人文藝術(shù)等領(lǐng)域的專(zhuān)家合作,開(kāi)展面向公眾的敘事可視化實(shí)踐,參加公共展覽。在科研方面,筆者積極探索智能技術(shù)賦能數(shù)字人文研究,將可視化領(lǐng)域?qū)I(yè)知識(shí)融入計(jì)算機(jī)智能,解決其他領(lǐng)域?qū)<疑踔凉娫谑褂每梢暬ぞ邥r(shí)的困難,提升可視化工具的易用性與有效性。

        3.1 學(xué)科合作與學(xué)科交叉的教育探索

        為了更好地探索數(shù)字人文和可視化結(jié)合項(xiàng)目的多領(lǐng)域合作模式和交叉學(xué)科人才培養(yǎng)方法,北京大學(xué)開(kāi)設(shè)暑期學(xué)校并發(fā)起多個(gè)數(shù)字人文合作項(xiàng)目。首屆可視化暑期學(xué)校于2009年展開(kāi),此后每年邀請(qǐng)多元背景的國(guó)內(nèi)外學(xué)界精英到北京大學(xué)授課,13年來(lái),面向全國(guó)院校、研究機(jī)構(gòu)、工業(yè)界培養(yǎng)的可視化人才已超過(guò)千人次。暑期學(xué)校的學(xué)員背景覆蓋計(jì)算機(jī)、設(shè)計(jì)以及人文社科等各應(yīng)用領(lǐng)域。

        暑期學(xué)校提供高質(zhì)量的教學(xué)內(nèi)容和高水平的課程設(shè)計(jì),注重技術(shù)、藝術(shù)、應(yīng)用領(lǐng)域多元結(jié)合,讓學(xué)員在提升可視化理論知識(shí)和設(shè)計(jì)素養(yǎng)的同時(shí),提升項(xiàng)目設(shè)計(jì)的實(shí)踐能力。一方面,堅(jiān)持邀請(qǐng)海內(nèi)外可視化研究領(lǐng)域具有深厚造詣的知名學(xué)者,涵蓋可視化的各個(gè)研究領(lǐng)域,面向?qū)W員系統(tǒng)探討不同領(lǐng)域的主要挑戰(zhàn)、前沿理論和研究方法;同時(shí)邀請(qǐng)?jiān)O(shè)計(jì)和交互領(lǐng)域的專(zhuān)家,介紹可視化在交叉領(lǐng)域的應(yīng)用和發(fā)展。優(yōu)秀的講者確保了課程內(nèi)容的高質(zhì)量,極大地拓展了學(xué)員的知識(shí)面,為學(xué)員的動(dòng)手實(shí)踐打下堅(jiān)實(shí)的基礎(chǔ)。另一方面,在課程設(shè)計(jì)中,學(xué)員混合背景組隊(duì),開(kāi)展學(xué)科交叉教學(xué)實(shí)踐,提升學(xué)員在可視化技術(shù)、設(shè)計(jì)審美以及文化理解等方面的綜合能力。學(xué)員從復(fù)雜的數(shù)據(jù)中抽絲剝繭,設(shè)計(jì)美觀(guān)且高效的圖形圖像傳達(dá)信息,制作支持交互探索的可視化內(nèi)容。在10余天的時(shí)間內(nèi),實(shí)現(xiàn)技術(shù)堅(jiān)實(shí)、賞心悅目、具有文化內(nèi)涵又解決實(shí)際問(wèn)題的可視化項(xiàng)目。

        課程設(shè)計(jì)的選題覆蓋廣泛,與中國(guó)和世界的文化發(fā)展密切相關(guān),包括歷史、文化、經(jīng)濟(jì)以及教育等大眾關(guān)心的話(huà)題。最近兩年,暑期學(xué)校特別關(guān)注了與中國(guó)歷史人文有關(guān)的領(lǐng)域,如中國(guó)宋代木建筑、早期符號(hào)刻畫(huà)、春秋戰(zhàn)國(guó)戰(zhàn)爭(zhēng)、中國(guó)古塔、歷史人物軌跡、二十四節(jié)氣等。其中優(yōu)秀項(xiàng)目發(fā)布在“可視化看中國(guó)”在線(xiàn)欄目和“可視分析”公眾號(hào)上。部分項(xiàng)目經(jīng)過(guò)后續(xù)迭代和完善,并經(jīng)過(guò)歷史、人文等方向的領(lǐng)域?qū)<腋倪M(jìn)后,在國(guó)內(nèi)的數(shù)字人文展和博物館展覽中亮相。

        在暑期學(xué)校的成果中,一個(gè)典型的數(shù)字人文項(xiàng)目是全國(guó)十大考古新發(fā)現(xiàn)可視化項(xiàng)目。該項(xiàng)目回顧了1990—2021年全國(guó)十大考古發(fā)現(xiàn),為分析和理解中國(guó)考古的情況提供了新穎、便捷且有趣的視角。在可視化界面中(如圖7所示),作者通過(guò)地圖展示考古發(fā)現(xiàn)的地域分布,并提供時(shí)間軸篩選展示。項(xiàng)目總覽視圖展示各年代考古發(fā)現(xiàn)的數(shù)目、遺址類(lèi)型的差異,揭示了歷朝歷代中華文明的分布情況;單位分布視圖提供了考古發(fā)現(xiàn)所在省份排行榜和考古發(fā)掘單位排行榜,幫助用戶(hù)了解不同單位參與發(fā)掘的項(xiàng)目;合作關(guān)系視圖提供了不同考古單位的合作關(guān)系網(wǎng)絡(luò),展示考古學(xué)研究交流與發(fā)展情況。用戶(hù)選擇具體的考古單位,還可以查看其與合作伙伴的詳細(xì)關(guān)系?!皻v年全國(guó)十大考古新發(fā)現(xiàn)”幫助領(lǐng)域?qū)<覐牟煌S度分析中國(guó)考古的發(fā)展,促進(jìn)公眾了解中華文明的風(fēng)采。

        圖7 1990—2021年全國(guó)十大考古新發(fā)現(xiàn) 可視 化

        3.2 面向公眾展覽的敘事可視化的科普探索

        面向公眾展覽的敘事可視化也是一個(gè)重要的嘗試,在向社會(huì)公眾科普人文知識(shí)的同時(shí),也是對(duì)數(shù)字人文與可視化交叉學(xué)科中新概念、新方法的推廣。以《大運(yùn)河流域名人軌跡地圖》數(shù)字人文在線(xiàn)系統(tǒng)為例,系統(tǒng)結(jié)合多種時(shí)空可視化軌跡可視化方法,在古代名人軌跡數(shù)據(jù)上進(jìn)行可視化敘事,講述名人行跡與大運(yùn)河文化故事。項(xiàng)目參加浙江美術(shù)館“大地史詩(shī)——中國(guó)大運(yùn)河主題藝術(shù)展”。系統(tǒng)的封面輪播展示了不同時(shí)期大運(yùn)河全貌,軌跡總覽視圖根據(jù)時(shí)間篩選展示名人主要遷移方向,以箭頭的形式繪制在地圖上,其箭頭粗細(xì)表示移動(dòng)方向的規(guī)模。個(gè)人軌跡視圖使用點(diǎn)與邊表示人物移動(dòng)與停留,系統(tǒng)提供軌跡的動(dòng)畫(huà)順序播放與整體軌跡探索功能,隨著用戶(hù)對(duì)地圖的縮放,系統(tǒng)提供不同細(xì)節(jié)層次的軌跡展示。

        此外,實(shí)驗(yàn)室探索了多方合作創(chuàng)作更加偏向于藝術(shù)可視化作品的路徑。例如《宋元學(xué)案?jìng)鞒嘘P(guān)系圖》藝術(shù)可視化作品,該作品針對(duì)《宋元學(xué)案》一書(shū)的專(zhuān)業(yè)性較強(qiáng)、大眾理解難度較高的問(wèn)題,通過(guò)藝術(shù)形式普及《宋元學(xué)案》中的學(xué)派源流,幫助大眾理解中華文化在宋元時(shí)期的發(fā)展傳承關(guān)系,具體如圖8所示。該作品采用宋畫(huà)卷軸風(fēng)格的藝術(shù)方法,以《千里江山圖》為背景,以宋式房屋建筑隱喻宋元時(shí)期的不同學(xué)派。建筑之間的路徑和行人隱喻學(xué)派之間的思想傳承關(guān)系。卷軸上學(xué)派按照傳承順序從左至右排放,行人們匆匆前行,為公眾展示了一幅宋元時(shí)期中華文化流轉(zhuǎn)傳承的動(dòng)態(tài)卷軸(如圖8(a)所示)。在系統(tǒng)中,用戶(hù)能夠直接了解各學(xué)派與學(xué)者的基本信息,能夠通過(guò)交互探索學(xué)派的傳承路徑與代表人物(如圖8(b)所示),能夠在這幅人物與建筑形象豐富各異的山水宋畫(huà)中(如圖8(c)所示)沉浸式地感受學(xué)派傳承中文化思想的交融變遷。在可視化系統(tǒng)的豐富表現(xiàn)力之下,原本復(fù)雜的學(xué)派流傳關(guān)系被以一種有趣、美觀(guān)且實(shí)用的形式展示給大眾。

        圖8 《宋元學(xué)案?jìng)鞒嘘P(guān)系圖》可視化

        3.3 智能數(shù)字人文可視化技術(shù)上的研究探索

        將特定的領(lǐng)域背景知識(shí)融入計(jì)算機(jī)智能,讓計(jì)算機(jī)智能在涉及學(xué)科交叉的項(xiàng)目中彌補(bǔ)缺失的專(zhuān)業(yè)技能,這是智能時(shí)代的數(shù)字人文與可視化結(jié)合的重要方面。從可視化出發(fā),將可視化知識(shí)與計(jì)算智能結(jié)合,使計(jì)算機(jī)能夠理解用戶(hù)的任務(wù)需求,研究能通用地支持不同數(shù)據(jù)、不同用戶(hù)需要的新一代可視化創(chuàng)作工具,則能為人文學(xué)者或藝術(shù)家提供極大的支持。在結(jié)合數(shù)字人文的智能可視化技術(shù)方面,筆者也做了大量研究探索[28-30]。

        憑借在深度學(xué)習(xí)驅(qū)動(dòng)的可視化流程上多年的積累,筆者搭建了數(shù)據(jù)的可視化問(wèn)答系統(tǒng),支持用戶(hù)通過(guò)自然語(yǔ)言表達(dá)自身需求,對(duì)通用的人文數(shù)據(jù)進(jìn)行解析,并且快速構(gòu)建可視化系統(tǒng)。問(wèn)答系統(tǒng)的深度模型在大規(guī)模的語(yǔ)料數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,獲得了通用的數(shù)據(jù)支持能力,并且在支持可視化任務(wù)的擴(kuò)展數(shù)據(jù)集上進(jìn)行訓(xùn)練,從而獲得了可視化感知能力。以包含時(shí)間、省份、戶(hù)籍等屬性維度的數(shù)萬(wàn)名明朝進(jìn)士數(shù)據(jù)集為例(如圖9所示),在用戶(hù)輸入自然語(yǔ)言后,問(wèn)答系統(tǒng)解析用戶(hù)的自然語(yǔ)言輸入,并且以可視化的形式回答問(wèn)題。在此過(guò)程中,用戶(hù)只需使用自然語(yǔ)言表達(dá)需求而不用學(xué)習(xí)特定的模板。用戶(hù)想知道“不同戶(hù)籍的進(jìn)士數(shù)目隨時(shí)間的變化趨勢(shì)如何?”,系統(tǒng)通過(guò)深度模型給出“戶(hù)籍”和“年份”趨勢(shì),并繪制堆疊柱狀圖表達(dá)不同戶(hù)籍進(jìn)士的變化趨勢(shì)。用戶(hù)可以通過(guò)自然語(yǔ)言自由地表達(dá)需求,系統(tǒng)自動(dòng)渲染相應(yīng)的可視化回答。通過(guò)深度學(xué)習(xí)技術(shù)與可視分析流程的結(jié)合,數(shù)字人文將會(huì)具有更廣闊的用戶(hù)群體。大眾以低成本方式將可視化技術(shù)運(yùn)用于各類(lèi)數(shù)據(jù),實(shí)現(xiàn)面向大眾的智能數(shù)字人文時(shí)代。

        圖9 可視化問(wèn)答系統(tǒng)

        在這3個(gè)方面的 實(shí)踐中筆者發(fā)現(xiàn),促進(jìn)未來(lái)數(shù)字人文與可視化交叉融合要從加強(qiáng)人人合作與人機(jī)合作兩方面同時(shí)推進(jìn)。人人合作是要加強(qiáng)不同領(lǐng)域?qū)<抑g的協(xié)作,不僅包含探索更好的協(xié)作流程、框架與模式,同時(shí)也包含探索教學(xué)模式,培養(yǎng)兼?zhèn)涠鄬W(xué)科知識(shí)的交叉人才,讓這些交叉人才在學(xué)科合作中發(fā)揮關(guān)鍵的協(xié)調(diào)作用。除此之外,加強(qiáng)對(duì)數(shù)字人文與可視化交叉的前景和能力的宣傳,吸引更多學(xué)者嘗試與探索多領(lǐng)域合作,這也是一個(gè)重要的方面。而人機(jī)合作要強(qiáng)化計(jì)算機(jī)的能力,把專(zhuān)家知識(shí)融入智能計(jì)算機(jī)系統(tǒng),使計(jì)算機(jī)智能在數(shù)字人文與可視化交叉項(xiàng)目中能提供一些之前只有專(zhuān)家才能提供的知識(shí)支持,如讓計(jì)算機(jī)能自動(dòng)根據(jù)用戶(hù)需求設(shè)計(jì)并生成合適的可視分析系統(tǒng),這將使人文領(lǐng)域的專(zhuān)家或大眾能夠在沒(méi)有可視化專(zhuān)家的幫助下有效地使用可視化分析探索數(shù)據(jù)。

        4 結(jié)束語(yǔ)

        可視化在其發(fā)展歷史中,一直與人文社科有重要的聯(lián)系。隨著計(jì)算機(jī)技術(shù)的發(fā)展,可視化進(jìn)入與數(shù)字人文領(lǐng)域深度耦合的時(shí)代。通過(guò)對(duì)當(dāng)前數(shù)字人文中可視化的發(fā)展現(xiàn)狀進(jìn)行總結(jié)與分析,筆者發(fā)現(xiàn),現(xiàn)有的數(shù)字人文與可視化結(jié)合項(xiàng)目往往分別從人文學(xué)者、可視化研究者、藝術(shù)家的角度出發(fā),而下一代的數(shù)字人文期待多元領(lǐng)域更深度的合作。為了探索下一代可視化與數(shù)字人文結(jié)合的新范式,北京大學(xué)從教育、科普、研究3個(gè)方面出發(fā),組織多背景人才合作,開(kāi)展暑期學(xué)校探索交叉人才的教育培養(yǎng)。同時(shí)與人文藝術(shù)專(zhuān)家合作推出可視化展覽作品,普及人文知識(shí),宣傳可視化與數(shù)字人文結(jié)合的前景與魅力。在研究上,筆者摸索面向數(shù)字人文的智能可視化技術(shù),通過(guò)實(shí)踐總結(jié)了可視化與數(shù)字人文交叉學(xué)科的兩個(gè)重要發(fā)展方向,即加強(qiáng)人與人之間的合作,改進(jìn)合作方法與模式,加強(qiáng)交叉人才培養(yǎng),吸引更多領(lǐng)域?qū)<业暮献?,以及增?qiáng)人與機(jī)器之間的合作,將相關(guān)領(lǐng)域知識(shí)融入計(jì)算機(jī)智能中,發(fā)展下一代智能可視化技術(shù)。

        猜你喜歡
        可視化人文數(shù)字
        人文
        基于CiteSpace的足三里穴研究可視化分析
        基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
        云南化工(2021年8期)2021-12-21 06:37:54
        基于CGAL和OpenGL的海底地形三維可視化
        “融評(píng)”:黨媒評(píng)論的可視化創(chuàng)新
        答數(shù)字
        人文紹興
        數(shù)字看G20
        人文社科
        讓人文光輝照耀未來(lái)
        粉色蜜桃视频完整版免费观看在线| 在教室伦流澡到高潮hnp视频| 亚洲欧美在线观看一区二区| 免费一区二区三区av| 美女在线一区二区三区视频 | 黑人上司粗大拔不出来电影| 国自产偷精品不卡在线| 亚洲免费无毛av一区二区三区 | 日本一二三区免费在线 | 激情内射亚州一区二区三区爱妻| 成人片99久久精品国产桃花岛| 中文字幕人妻乱码在线| 在线观看午夜视频一区二区| 国产精品成人久久电影| 欧美成人久久久免费播放| 精品国产乱码久久免费看| 亚洲久悠悠色悠在线播放| 双腿张开被9个男人调教| 樱花AV在线无码| 亚洲码无人客一区二区三区| 无码少妇丰满熟妇一区二区| 国产免费丝袜调教视频| 日韩一二三四精品免费| 人妻系列中文字幕av| 国产精品av在线| 久久亚洲av永久无码精品| 91精品人妻一区二区三区蜜臀| 亚洲午夜精品一区二区麻豆av | 久久久精品人妻一区亚美研究所 | 日本在线免费不卡一区二区三区| 亚洲另类无码专区首页| 丰满人妻熟妇乱又伦精品视| 中文字幕精品亚洲无线码二区| 经典三级免费看片天堂| 亚洲avav天堂av在线网爱情| 国产偷国产偷亚洲欧美高清| 白色白在线观看免费2| 国产精品久久久久9999无码| 亚洲AV色无码乱码在线观看| 韩国免费一级a一片在线| 中文字幕亚洲综合久久天堂av|