亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        走向多元化的“堆?!保鹤鳛榧夹g(shù)問題的數(shù)字人文和多樣性①

        2020-08-14 09:53:24艾倫劉撰張思靜譯陳大龍校
        山東社會(huì)科學(xué) 2020年8期
        關(guān)鍵詞:堆棧人文數(shù)字

        [美]艾倫·劉撰 張思靜譯 陳大龍校

        (加州大學(xué) 圣芭芭拉分校,美國 加利福尼亞州圣芭芭拉 93106-3170)

        就像在一般人文領(lǐng)域中那樣,多樣性在數(shù)字人文中指的是包容不同的文化、身份、民族,不管是將其作為研究的對(duì)象,還是指研究群體本身。尤其要重視那些缺少代表的種族、性別、國家、語言、能力和社會(huì)經(jīng)濟(jì)階層。和一般人文領(lǐng)域不同的是,數(shù)字人文的多樣性還包括對(duì)各種技術(shù)方法的包容——例如,編碼和轉(zhuǎn)譯、規(guī)劃大量樣品的陳列和制作一次性的展覽、文本的數(shù)碼轉(zhuǎn)換和文本分析、研究和教學(xué)。不過,從根本上說,方法的包容也是社會(huì)文化的包容,因?yàn)樗哪繕?biāo)是尊重全世界的各類數(shù)字人文實(shí)踐。(4)關(guān)于世界各地本土化的數(shù)字人文實(shí)踐,參見Earhart, Amy E, “Digital Humanities within a Global Context: Creating Borderlands of Localized Expression”, Fudan Journal of the Humanities and Social Sciences, vol. 11, no. 3, (2018), pp. 357-69, doi:10 .1007/s40647-018-0224-0. 不同的國家對(duì)不同種類的數(shù)字人文工作的投入是不平衡的。例如,那些更重視將民族或土著遺產(chǎn)數(shù)字化的國家會(huì)將更多的數(shù)字人文技術(shù)和資源投放在畫廊、圖書館、檔案館和博物館。雖然學(xué)界還沒有對(duì)不同國家的數(shù)字人文實(shí)踐和優(yōu)先級(jí)進(jìn)行大規(guī)模的、系統(tǒng)化的比較研究,一些對(duì)具體國家和數(shù)字人文部門的研究卻已經(jīng)展開。參見,例如,Kizhner, Inna, et al, “Accessing Russian Culture Online: The Scope of Digitization in Museums across Russia”, Digital Scholarship in the Humanities, (19 Sept. 2018), doi: 10.1093/llc/ fqy035. Lewis, Vivian, et al, Building Expertise to Support Digital Scholarship: A Global Perspective, Council on Library and Information Resources, (2015), www.clir.org/pubs/reports/pub168/pub168. Cha, Javier, “Digital Korean Studies: Recent Advances and New Frontiers”, Digital Library Perspectives, vol. 34, no. 3, (Aug. 2018), pp. 227-44, doi:10.1108/DLP-04-2018-0013. )。同時(shí)參見費(fèi)爾蒙特(Fiormonte)和蓋麗拿·羅塞爾(Galina Russell)對(duì)數(shù)字人文領(lǐng)域所謂“地理政治和……文化語言”的不平衡所作的精辟批評(píng)。Fiormonte, Domenico, “Toward a Cultural Critique of Digital Humanities”, Debates in the Digital Humanities 2016, edited by Gold, Matthew K., and Lauren F. Klein, (U of Minnesota P, 2016), pp. 438-58. Galina Russell, Isabel, “Geographical and Linguistic Diversity in the Digital Humanities”, Literary and Linguistic Computing, vol. 29, no. 3, (Sept. 2014), pp. 307-16, doi:10.1093/llc/ fqu005.

        數(shù)字人文領(lǐng)域最包羅萬象的比喻是“大帳篷”(big tent)。這一概念隱含上述所有意義上的包容性,是數(shù)字人文多樣性平臺(tái)在意識(shí)形態(tài)層面的一種極富野心的模因(meme)。這一復(fù)制傳遞方式源于數(shù)字人文聯(lián)合機(jī)構(gòu)(ADHO)于2011年召開的年會(huì)。(5)數(shù)字人文組織聯(lián)盟會(huì)議是這個(gè)領(lǐng)域內(nèi)最重要的年度國際會(huì)議,它每年在世界的一個(gè)不同地區(qū)舉行。那次會(huì)議強(qiáng)調(diào)的是方法多樣性。會(huì)議組織者馬修·喬克斯(Matthew Jockers)和格倫·沃特希(Glen Worthey)解釋說:

        我們?yōu)閿?shù)字人文2011年會(huì)選擇的主題是“大帳篷數(shù)字人文”,這在一定程度上是為了表達(dá)我們想要包容不同形式的數(shù)字人文的愿望。眼下,在斯坦福,我們就被各種不同的數(shù)字人文實(shí)踐所環(huán)繞。與此同時(shí),數(shù)字人文在世界范圍內(nèi)都激發(fā)了熱烈的討論,尤其是在過去幾年中,有關(guān)這一學(xué)科的意義和局限性備受爭(zhēng)議。在我們看來,“大帳篷”是回應(yīng)這些爭(zhēng)論的恰切比喻。雖然數(shù)字人文2011年會(huì)屬于每一位參與者,但是,通過選擇這一主題,我們想要公開宣布我們的觀點(diǎn):斯坦福大學(xué)相信并希望推動(dòng)的數(shù)字人文是具有廣泛性和多樣性、生機(jī)勃勃、千花齊放的數(shù)字人文。(6)Jockers, Matthew, and Glen Worthey, “Welcome to the Big Tent.” Introduction, Digital Humanities 2011, Conference Abstracts, p. vi. Stanford University Library, dh2011.stanford.edu/wp-content/uploads/2011/05/DH2011_BookOfAbs.pdf.本次會(huì)議的主題“大帳篷數(shù)字人文”,最初是在會(huì)議的征稿啟事中公布的。“Call for Papers Announcement” DH2011, dh2011.stanford.edu/page_id=97.

        2012年在漢堡舉行的ADHO會(huì)議則突出了多樣性的社會(huì)文化方面。會(huì)議的主題是“數(shù)字多樣化:文化、語言和方法”,而組織者特別強(qiáng)調(diào)了其中的多文化主義和多語言主義。(7)“Call for Papers”, DH2012, www.dh2012.uni-hamburg.de/conference/archive-calls/cfps/index.html.

        隨后,數(shù)字人文蓬勃發(fā)展,即使不是伴隨著喬克斯、沃特希呼吁的“千花”,至少是伴隨著對(duì)“大帳篷”這一比喻的復(fù)制和傳遞。在數(shù)字人文領(lǐng)域,“大帳篷”被以各種基調(diào)反復(fù)提及,有些是贊揚(yáng),有些是謹(jǐn)慎,有些討論它的資格,有些則表達(dá)了批評(píng)或諷刺。根據(jù)2018年現(xiàn)代語文學(xué)會(huì)(MLA)年會(huì)上同名小組所做的項(xiàng)目介紹,數(shù)字人文“具有擴(kuò)張性和移動(dòng)力,然而又缺乏穩(wěn)定性。就多樣性和可接觸性而言,它是一頂還不夠大的帳篷”(8)“347: Varieties of Digital Humanities”, MLA 2018 NYC. Modern Language Association, mla.confex.com/mla/2018/meetingapp.cgi/Session/2517.Varieties of Digital Humanities, MLA Annual Convention, (5 Jan. 2018, New York Hilton Midtown).。

        很顯然,“大帳篷”這一形象來自歷史上群眾經(jīng)驗(yàn)的展示,比如19世紀(jì)的宗教營(yíng)會(huì)和馬戲團(tuán)的帳篷表演。(9)特拉斯(Terras)將這一比喻更多地歸結(jié)于宗教而非馬戲團(tuán)歷史。我把“大帳篷”傳統(tǒng)的宗教性(尤其是福音派教會(huì)的)和大眾娛樂性放在一個(gè)單一的、更籠統(tǒng)的框架中來解讀?;飦喌峡怂?Kyriakodis)討論了美國發(fā)生在1858年所謂的“第三次大覺醒”期間的一系列帳篷復(fù)興事件。也可參看下文中我關(guān)于第二次大覺醒的評(píng)論。馬戲團(tuán)起源于18世紀(jì)后期,但它們的鼎盛時(shí)期是19世紀(jì),尤其是在美國?!按髱づ瘛?或者說“大頂”)馬戲團(tuán)是1825年發(fā)明的(Davis)。Terras, Melissa, “Peering inside the Big Tent: Digital Humanities and the Crisis of Inclusion”, Melissa Terras’ Blog, (26 July 2011), melissaterras.blogspot.com/2011/07/peering-inside-big-tent-digital.html. Kyriakodis, Harry, “Before the Pope, the Days of the Revivalists”, Hidden City Philadelphia, (26 Aug. 2015), hiddencityphila.org/2015/08/before-the-pope-the-days-of-the-revivalists/.Davis, Janet M, “America’s Big Circus Spectacular Has a Long and Cherished History”, Smithsonian.com, (22 Mar. 2017), www.smithsonianmag.com/history/americas-big-circus-spectacular-has-long-and-cherished-history-180962621.這只是眾多例子中的兩項(xiàng),向我們展示了早期由帳篷構(gòu)建的建筑、制度和奇觀,以及其背后有關(guān)多樣性“裝置”——這里,我們借用了米歇爾·福柯的術(shù)語——的散漫習(xí)俗和信仰體系。在福柯的定義中,“裝置”本身就具有多樣化的形式,是一種“變化的多樣體”(metavariety):

        一個(gè)徹底混雜的集合體,包含了話語、制度、建筑形式、管理決策、法律、行政措施、科學(xué)陳述以及哲學(xué)、道德和慈善命題。簡(jiǎn)而言之,已經(jīng)被表述的和沒有被表述的內(nèi)容同樣豐富。這些就是“裝置”的要素?!把b置”本身就是由這些要素構(gòu)成的關(guān)系網(wǎng)絡(luò)。(10)Foucault, Michel, Power/ Knowledge: Selected Interviews and Other Writings, 1972-1977. Edited by Colin Gordon, translated by Gordon et al. (Pantheon, 1980), p.194.

        尤其是,宗教營(yíng)會(huì)和馬戲團(tuán)在建筑和制度方面那既開放又封閉的散漫結(jié)構(gòu)是大規(guī)模多元“裝置”在前現(xiàn)代時(shí)期的雛形。它們?cè)谀缓笠龑?dǎo)了一場(chǎng)漫長(zhǎng)的、逐漸走向現(xiàn)代化的融合。這一融合同時(shí)具有宗教性和世俗性、民主性和法西斯主義,連接了古老的、基于親緣關(guān)系而產(chǎn)生的民族感和逐步發(fā)展的社會(huì)、性別、種族、階級(jí)和政治地理意識(shí)。在馬戲團(tuán)的例子中,這種意識(shí)尤其具有特殊性,因?yàn)樗鼧?gòu)建了物種、國家和世界的多樣性。與美國“第二次大覺醒”(Second Great Awakening)有關(guān)的露營(yíng)集會(huì)和帳篷復(fù)興反映了這種融合。不同形式的露營(yíng)集會(huì)和帳篷復(fù)興吸引了黑人、婦女、區(qū)域性邊緣人口的大規(guī)模參與,造成了深遠(yuǎn)的社會(huì)文化和政治影響。馬戲團(tuán)用另一種方式實(shí)現(xiàn)了同樣的融合。例如,最大規(guī)模的馬戲團(tuán)帳篷演出使我們得以見證一種后帝國主義時(shí)代的多元化。這種多元化跨越物種、種族和民族,具有全球性的異國情調(diào)。正如19世紀(jì)晚期巴納姆貝利馬戲團(tuán)的一張將世界各地的人種、國家與各種動(dòng)物并置描繪的海報(bào)所宣傳的那樣,馬戲團(tuán)“讓我們得以一窺偉大的種族融合”并親臨“神奇動(dòng)物的園地”。(11)The Barnum and Bailey Greatest Show on Earth—A Glance at the Great Ethnological Congress and Curious Led Animals. (Circa 1895), Strobridge Lithography, Library of Congress Prints and Photographs Online Catalog, www.loc.gov/pictures/item/98500053.Chromolithograph.

        我們可以很容易地將更早或更晚的裝置加入正在逐步現(xiàn)代化的、既開放又封閉、既包容又排他的大規(guī)模多樣性展示中去,就像巴黎戰(zhàn)神廣場(chǎng)(Champs de Mars)的例子所見證的那樣。這座廣場(chǎng)在1790年的改造中廣為人知地召集了各個(gè)階層的巴黎人。(12)奧左夫(Ozouf)研究了在這個(gè)廣場(chǎng)以及其他法國革命紀(jì)念活動(dòng)中有關(guān)開放性的意識(shí)形態(tài),主要參考她在《節(jié)日和法國革命》中的“節(jié)日與空間”那章(126-57)。Ozouf, Mona. Festivals and the French Revolution. Translated by Alan Sheridan, (Harvard UP, 1988).位于德國紐倫堡、四周環(huán)繞著探照燈的納粹黨代會(huì)集會(huì)廣場(chǎng)(Zepplin field)展示了納粹黨基層在地區(qū)、年齡、性別方面的多樣性。還有眼下“開放源代碼”的概念性結(jié)構(gòu)(埃里克·S·雷蒙德曾令人難忘地指出,這種結(jié)構(gòu)不是“教堂式”的,而是“集市型”的(13)Raymond, Eric S, The Cathedral and the Bazaar: Musings on Linux and Open Source by an Accidental Revolutionary, (O’Reilly Media, 2001).)都是如此。在這些例子中,即使是看起來最開放的現(xiàn)代大眾共同體之典范,在某些對(duì)開放性持不同觀點(diǎn)的人看來仍像是封閉的警察國家。例如,理查德·斯托曼(Richard Stallman)就曾聲稱,和自由軟件運(yùn)動(dòng)(free-softward movement)相比,開放源代碼的軟件就是封閉的。(14)斯托曼寫道:“任何宣傳‘開放’二字的活動(dòng),往往會(huì)擴(kuò)大遮蓋了自由軟件運(yùn)動(dòng)思想的帷幕?!盨tallman, Richard, “Why Open Source Misses the Point of Free Software” (2011). GNU Operating System, Free Software Foundation, (2016), www.gnu.org/philosophy/open-source-misses-the-point.en.html.

        因此,數(shù)字人文領(lǐng)域?qū)Α按髱づ瘛崩砟畹囊粋€(gè)意見正是這一“帳篷”還不夠開放。從這一概念流行以來,“誰在帳篷里面,誰又在外面?”始終是困擾這一領(lǐng)域的問題。在2011年現(xiàn)代語言學(xué)會(huì)年會(huì)上的數(shù)字人文小組中,是否只有懂編碼的人才能成為這一領(lǐng)域的局內(nèi)人引起了爭(zhēng)論。(15)這方面的避雷針是史蒂芬·拉姆塞(Stephen Ramsay)在2011年現(xiàn)代語文學(xué)會(huì)年會(huì)上的演講《誰在里面,誰又在外面》(發(fā)布于他的博客)。Ramsay, Stephen, “Who’s In and Who’s Out”, Stephen Ramsay, (8 Jan. 2011), Internet Archive, web.archive.org/web/20121001072912/http://lenz.unl.edu/papers/2011/01/08/whos-in-and-whos-out.html.不管數(shù)字人文是多么渴望打開門戶,對(duì)一些人來說,專業(yè)技能、訓(xùn)練方式和制度方面的標(biāo)準(zhǔn)把持住了這一學(xué)科的門檻。尤其是那些事業(yè)剛剛起步的學(xué)者,對(duì)多樣性和社會(huì)公正的高度在意讓他們懷疑數(shù)字人文這一領(lǐng)域?qū)λ麄儊碚f是否太封閉了。“#轉(zhuǎn)型數(shù)字人文”(#transform DH)小組成員曾令人動(dòng)容地表示:

        那是2011年。那一年,“數(shù)字人文大帳篷”作為術(shù)語冒出地表。它將數(shù)字人文描繪為具有包容性、歡迎不同學(xué)科的領(lǐng)域。然而,對(duì)于我們這些研究性別、同性戀、種族、殘障人士,并且在個(gè)人和政治工作中都用到數(shù)字技術(shù)的學(xué)者來說,“大帳篷”還是顯得不夠大。我們對(duì)社會(huì)公正的憂慮很少真正進(jìn)入研究和討論的視野,即使在數(shù)字人文領(lǐng)域的這頂“大帳篷”內(nèi)仍是如此。(16)Bailey, Moya, et al, “Reflections on a Movement: #transformDH, Growing Up”, Debates in the Digital Humanities 2016, edited by Gold, Matthew K., and Lauren F. Klein, (U of Minnesota P, 2016), p. 72.據(jù)其網(wǎng)站所說,#transform DH是“一場(chǎng)學(xué)術(shù)游擊運(yùn)動(dòng),以求再定義大寫的數(shù)字人文學(xué)科,通過收集、分享和強(qiáng)調(diào)那些拓展邊界、追求社會(huì)公正、親民和具有包容性的項(xiàng)目,使之成為推動(dòng)學(xué)術(shù)變革的力量”?!癆bout #transformDH.” #transformDH, transformdh.org/about-transformdh/.

        這一小組的名稱來源于其在推特上的標(biāo)簽。跟一般的數(shù)字人文一樣,這一團(tuán)體較早地將社交媒體、博客、在線平臺(tái)運(yùn)用于學(xué)術(shù)研究,不管這些平臺(tái)是由硅谷的公司還是由學(xué)術(shù)界提供的(最先被使用的網(wǎng)絡(luò)平臺(tái)包括人文學(xué)討論小組[Humanist Discussion Group, humanist@lists. digitalhumanities.org]和HASTAC學(xué)者論壇[www.hastac.org/initiatives/harstac-scholars]。后來則發(fā)展出更新的專業(yè)聯(lián)盟,像MLA聯(lián)合會(huì)[mla.hcommons.org/],它的前身是CUNY學(xué)術(shù)聯(lián)盟[commons.gc.cuny.edu/])。社交媒體、博客,以及數(shù)字化聯(lián)盟看起來是比“大帳篷”更開放的帳篷。

        然而,在這種時(shí)候,我們應(yīng)該停下來思考一下數(shù)字人文對(duì)在線平臺(tái)的大量使用所透露的其他信息:“大帳篷”的比喻和在這一領(lǐng)域內(nèi)發(fā)揮著實(shí)際作用的技術(shù)平臺(tái)之間存在著明顯的不匹配?!按髱づ瘛痹谝庾R(shí)形態(tài)層面賦予數(shù)字人文多樣性的名義,但在技術(shù)層面卻沒有提供任何的指導(dǎo)。更仔細(xì)地說,問題的關(guān)鍵不在于意識(shí)形態(tài)和技術(shù)之間的二元差異,而是該領(lǐng)域還沒有認(rèn)識(shí)到他們需要一個(gè)融合了技術(shù)與意識(shí)形態(tài)的裝置——一個(gè)在任何意義上的平臺(tái)——以處理急需的工作。正如人們所使用的比喻從“大帳篷”逐漸向“公共空間”(commons)轉(zhuǎn)變所顯示的那樣,這種急需的工作是和人文學(xué)科接洽,以回應(yīng)如下問題:那些只有封閉平臺(tái)的硅谷公司如何利用了各種變化的形式(variety),將其作為匯集、過濾、描述后的集合體,卻沒有真正專注于多樣性(diversity)。

        那么,對(duì)數(shù)字人文的多樣性真正有效的、既具有意識(shí)形態(tài)的比喻性又能有助于實(shí)際操作的平臺(tái)應(yīng)該是怎樣的呢?在下文中,我將提供部分答案。之所以說這個(gè)答案是“部分”的,是因?yàn)樗鼈?cè)重于研究和思考多樣性所需要的技術(shù)革新,卻沒有涉及如何提高數(shù)字人文從業(yè)人員的多樣性——無論是在人文領(lǐng)域、學(xué)術(shù)界,還是在一般的知識(shí)工作機(jī)構(gòu)。(17)關(guān)于數(shù)字人文學(xué)者團(tuán)體對(duì)多樣性的討論和由數(shù)據(jù)驅(qū)動(dòng)的分析(尤其是ADHO年會(huì)所反映的),參見Eichmann- Kalwara, Nickoal, et al, “Representation at Digital Humanities Conferences (2000—2015)”, Bodies of Information: Intersectional Feminism and Digital Humanities, edited by Elizabeth M. Losh and Jacqueline Wernimont, (U of Minnesota P, 2018), dhdebates.gc.cuny.edu/read/untitled-4e08b137-aec5-49a4-83c0-38258425f145/section/5dcc1fee-caef-4c10-aa3c-108a9bbf0b68b#ch0.對(duì)包容性的制度化思考影響著數(shù)字人文,也受到數(shù)字人文的影響。然而,考察這個(gè)問題需要借助更多的理論和方法,例如新制度主義(neoinstitutionalism)、組織技術(shù)研究(organizational-technology studies)、思辨基礎(chǔ)設(shè)施研究(critical infrastructure studies)等。我在其他研究場(chǎng)合中采取了這些視角。(18)參見,例如, Liu, Alan, “Drafts for Against the Cultural Singularity (Book in Progress).” (2 May 2016), doi:10.21972/G2B663 和由我創(chuàng)辦并維護(hù)的“思辨基礎(chǔ)設(shè)施研究”網(wǎng)站(cistudies.org)。

        在這里,我的回答只是想要為數(shù)字人文展開完整意義上的“平臺(tái)”概念。當(dāng)前,這一概念不免要兼具意識(shí)形態(tài)性和技術(shù)操作性。特別值得一提的是,我將援用本杰明·H·布拉登(Benjamin H. Bratton)強(qiáng)有力的理論注釋。在《堆棧:論軟件和主權(quán)》一書中,布拉登對(duì)平臺(tái)提出了同時(shí)兼顧其技術(shù)、社會(huì)文化和哲學(xué)屬性的闡釋。他令人信服地論證了“堆棧”是當(dāng)前最重要的平臺(tái)概念。與之相比,其他競(jìng)爭(zhēng)對(duì)手都只是“網(wǎng)絡(luò)”(network)。統(tǒng)觀全書,布拉登始終用大寫的“The Stack”來指稱這一概念,以此強(qiáng)調(diào)它的終極屬性是一種世界體系?!岸褩!笔俏覀冞@個(gè)時(shí)代最根本的意識(shí)形態(tài)和技術(shù)平臺(tái)模式。如布拉登所說,它們既是一種主權(quán)形式,又是一套安裝在裝置中的標(biāo)準(zhǔn)和協(xié)議,向下直達(dá)環(huán)境層面。在本書最精彩的章節(jié)之一中,布拉登將這一層面稱為“地球?qū)印?the “Earth” layer)(19)Bratton, Benjamin H., The Stack: On Software and Sovereignty, (MIT Press, 2015), pp. 75-107.。

        今天,堆棧平臺(tái)有各種表現(xiàn)形式,其范圍從基本的軟件結(jié)構(gòu)到布拉登的世界體系“The Stack”。已經(jīng)成為經(jīng)典的例子是“互聯(lián)網(wǎng)協(xié)議棧”(Internet Protocol Stack)。我在圖1中給出了這一模式的簡(jiǎn)化版。(20)在描述下文所述的互聯(lián)網(wǎng)協(xié)議棧的時(shí)候,我從網(wǎng)上的技術(shù)注解、布拉登的書、詹姆斯·史密斯(James Smithies)的《數(shù)字人文和數(shù)字現(xiàn)代》中“走向人文學(xué)的系統(tǒng)分析”一章獲得了幫助。我的描述簡(jiǎn)化了互聯(lián)網(wǎng)協(xié)議棧,忽略了它的一些特定協(xié)議和特征。我也沒有討論它和早期的OSI(開放系統(tǒng)互聯(lián))堆棧模式的異同。Smithies, James, The Digital Humanities and the Digital Modern, (Palgrave Macmillan, 2017), pp. 113-51.

        圖1 國際互聯(lián)網(wǎng)堆棧由艾倫·劉綜合和改編很多其他可獲得的圖示繪制

        該圖顯示了信息如何借由路由器構(gòu)成的網(wǎng)絡(luò)在主機(jī)和主機(jī)之間(以及從作為“服務(wù)器”的主機(jī)到終端用戶的)橫向流動(dòng)。這里的“信息”是指經(jīng)過排序、結(jié)構(gòu)化、驗(yàn)證、配置之后可以被有效利用的良好通信(例如,像電子郵件和網(wǎng)站主頁一樣可以被閱讀的“文件”。)然而,實(shí)際上操縱信息的數(shù)據(jù)流卻是上下流動(dòng)的,形成一個(gè)格式化和處理數(shù)據(jù)的垂直“協(xié)議堆?!?stack of protocols)。用布拉登的話來說,“簡(jiǎn)而言之,一條信息由用戶沿著堆棧逐層發(fā)送,直至其穿過物理層橫向傳輸?shù)浇謱?duì)面或大洋彼岸的接收節(jié)點(diǎn)。被接收之后,信息又沿著堆棧逆向傳遞,從物理層到應(yīng)用層,再被下一個(gè)用戶讀取。”(21)Bratton, Benjamin H., The Stack: On Software and Sovereignty. (MIT Press, 2015), pp. 61-62.

        每一個(gè)協(xié)議層都在其所處的層級(jí)執(zhí)行標(biāo)準(zhǔn)化的數(shù)據(jù)處理方式。這種方式通過我們稱之為數(shù)據(jù)抽象化(data abstraction)和模塊化(modularity)的方式得以實(shí)現(xiàn)。抽象化是指最底部的“連接層(link layer)”在一個(gè)特定的局域網(wǎng)(例如某部門的以太網(wǎng))中傳輸數(shù)據(jù)。這已經(jīng)是對(duì)物理和電子信號(hào)媒體的一種最基本的抽象。然后, “國際互聯(lián)網(wǎng)層級(jí)”(Internet layer)并不管局域系統(tǒng),是一種更高層級(jí)的抽象。它的互聯(lián)網(wǎng)協(xié)議(IP)將數(shù)據(jù)轉(zhuǎn)化為標(biāo)準(zhǔn)化的數(shù)據(jù)包(data packets),這種數(shù)據(jù)包能在一個(gè)更廣闊的網(wǎng)絡(luò)中傳播?!斑\(yùn)輸層級(jí)”(transport layer)則是一種更高層級(jí)的抽象。通過保障數(shù)據(jù)之間的正確序列、避免擁堵、可靠性等等,它的“運(yùn)輸控制協(xié)議”(TCP)將數(shù)據(jù)包以數(shù)據(jù)“流”(stream)的形式呈現(xiàn)。位于堆棧最頂端的是“應(yīng)用層級(jí)”(application layer),這一層級(jí)的抽象支持復(fù)雜的軟件應(yīng)用和計(jì)算機(jī)界面,正是這些應(yīng)用和界面最終將數(shù)據(jù)轉(zhuǎn)變?yōu)椤靶畔ⅰ?information)供用戶使用。

        模塊化是指堆棧中每一個(gè)相對(duì)更低的層級(jí)都盡可能簡(jiǎn)單有效地專注于實(shí)現(xiàn)有限的目標(biāo),將更復(fù)雜的功能交給上面一層。與此相對(duì),每一個(gè)相對(duì)更高的層級(jí)可以對(duì)下面一層的內(nèi)部運(yùn)作保持無視。最明顯的例子就是對(duì)“互聯(lián)網(wǎng)層級(jí)”和“運(yùn)輸層級(jí)”的模塊化分離。這一分離基于所謂的端對(duì)端系統(tǒng)設(shè)計(jì)原則(end-to-end system-design principle)而實(shí)現(xiàn)。(22)雖然是在早先發(fā)展的基礎(chǔ)上產(chǎn)生的,現(xiàn)在已成為經(jīng)典的有關(guān)端到端原則的聲明是斯特茲(Saltzer)等在80年代初期提出的。Saltzer, J. H., et al, “End- to- End Arguments in System Design.” ACM Transactions on Computer Systems, vol. 2, no. 4, Nov. 1984, pp. 277-88. ACM Digital Library, doi:10.1145/357401.357402.在這一語境中的“端對(duì)端”(end-to-end)指的是互聯(lián)網(wǎng)層級(jí)的互聯(lián)網(wǎng)協(xié)議(IP)只需專注于將數(shù)據(jù)包推送過路由器,而無須保證數(shù)據(jù)的完整性,甚至無須顧慮它們是否送達(dá)。緊接著,運(yùn)輸層級(jí)的TCP會(huì)在更復(fù)雜的上位機(jī)上進(jìn)行操作,從而支持更高層級(jí)的任務(wù),例如:建立連接、檢查數(shù)據(jù)包的完整性,以及在收到數(shù)據(jù)包時(shí)為它們排序。

        IP協(xié)議棧的抽象化和模塊化原則上導(dǎo)致了三個(gè)后果,這些后果對(duì)互聯(lián)網(wǎng)的技術(shù)和社會(huì)政治演變產(chǎn)生了重大的影響。第一個(gè)后果是層級(jí)或平臺(tái)的不可知論。我的意思是說,堆棧中的每一層都不關(guān)心,甚至可能不知道它上面或下面的那一層發(fā)生了什么。這就是所謂的網(wǎng)絡(luò)中立性的基礎(chǔ)。這種原則規(guī)定了較低的數(shù)據(jù)層級(jí)不應(yīng)該在速度上受限,或者被操縱以決定諸如“誰的視頻流服務(wù)在堆棧頂端運(yùn)行得最好”這類的問題。(事實(shí)上,網(wǎng)絡(luò)中立是一個(gè)有爭(zhēng)議的問題。因?yàn)?,為了讓較低層級(jí)的限制因素能優(yōu)先阻礙某些服務(wù),層級(jí)不可知論會(huì)妥協(xié)。)第二個(gè)后果是創(chuàng)新自由(用硅谷的術(shù)語來說)。新的軟件和社交應(yīng)用可以被隨心所欲地插入堆棧,只要支持它們的層級(jí)仍然在按預(yù)期工作。第三個(gè)結(jié)果則是平臺(tái)不可知論和創(chuàng)新之間的一個(gè)細(xì)微差異,我們可以稱之為層級(jí)化涌現(xiàn)(layered emergence)。這一現(xiàn)象具有重大的技術(shù)和思想意義(包括,像我將要論證的那樣,在多樣性的語境中也是如此)。在堆棧平臺(tái)底層的半自動(dòng)運(yùn)行中會(huì)逐步涌現(xiàn)出一些什么東西?這是不確定也不可預(yù)測(cè)的。它們可能變好,也可能變壞。在布拉登的描述中,和堆棧有關(guān)的平臺(tái)具有17個(gè)特征。以下是其中最重要的幾個(gè)特征:

        1.與其他宏觀治理機(jī)構(gòu)不同的是,平臺(tái)并不按照詳細(xì)的預(yù)設(shè)性總體規(guī)劃開展工作,而是通過有序的涌現(xiàn)為行動(dòng)的展開奠定基礎(chǔ)。(23)Bratton, Benjamin H., The Stack: On Software and Sovereignty. (MIT Press, 2015), p. 47.

        7.與集權(quán)系統(tǒng)一樣,平臺(tái)將異質(zhì)的行為者和事件整合成更有序的聯(lián)盟,但平臺(tái)本身并不一定像總體規(guī)劃委員會(huì)或聯(lián)邦國會(huì)大廈那樣,處于這些聯(lián)盟的真正中心位置。(24)Bratton, Benjamin H., The Stack: On Software and Sovereignty. (MIT Press, 2015), p. 48.

        9.即使平臺(tái)保證了其系統(tǒng)用戶的身份,但無論好壞,它們提供的身份并不均勻或平等。(25)Bratton, Benjamin H., The Stack: On Software and Sovereignty. (MIT Press, 2015), p. 49.

        17.平臺(tái)主權(quán)可以是有計(jì)劃的,也可以是無計(jì)劃的;可以是普世的,也可以是具體的;可以是生成的,也可以是被動(dòng)的;可以是由技術(shù)決定的,也可以是由政治保證的。平臺(tái)主權(quán)在某些情況下是必然的,而在另一些情況下則具有很大的偶然性。并且,它在平臺(tái)系統(tǒng)的不同組成部分中可能發(fā)揮不同的作用。(26)Bratton, Benjamin H., The Stack: On Software and Sovereignty. (MIT Press, 2015), p. 51.

        即使是最標(biāo)準(zhǔn)化的、看起來運(yùn)作良好的低層堆棧之間的相互作用也會(huì)顧及更高層級(jí)的不同系統(tǒng)和行為的涌現(xiàn),包括布拉頓所說的,位于他的堆棧世界體系頂層的“用戶”(User)。在我們有關(guān)多樣性的討論中,我們可以稱之為“身份”(identity)。(27)布拉登設(shè)想了一個(gè)當(dāng)前時(shí)代的“堆?!?,它具有地球、云端、城市、住址、界面和用戶這些逐層向上的層級(jí)。對(duì)布拉登來說,這一“堆?!敝械摹坝脩簟卑ǚ侨祟惖男问剑鐧C(jī)器和主題。它們位于基礎(chǔ)層上下之間新興的、具有偶發(fā)性的連接“縱向柱”(columns,他如此稱之)之上。參見Bratton, Benjamin H., The Stack: On Software and Sovereignty, (MIT Press, 2015), pp. 66-72.

        使用上述有關(guān)平臺(tái)堆棧的圖表,我對(duì)“什么樣的平臺(tái)——既是比喻性的也是操作性的——適用于開展數(shù)字人文領(lǐng)域的多樣性工作”這個(gè)問題提供了部分的答案:它不是一個(gè)大帳篷,而是一個(gè)多樣化的堆棧。當(dāng)然,力圖在“多樣化的堆?!焙途唧w的信息平臺(tái)(如互聯(lián)網(wǎng)協(xié)議棧)之間建立精準(zhǔn)的對(duì)應(yīng)關(guān)系也是不切實(shí)際的。在我看來,重要的只是堆棧平臺(tái)的基本邏輯:模塊化的抽象層及其聯(lián)合結(jié)果。因此,我所勾勒的多樣化堆棧是由不同的抽象層所組建的,每一層的目標(biāo)都是有限的,因?yàn)樗鼈冎恍枰獮榱俗龊靡患露嬖凇T鰪?qiáng)多樣性研究的能力不是任何一個(gè)具體模塊層的職責(zé)。這是頂級(jí)的目標(biāo)。只有作為整體的堆棧才需要為思考多樣性身份的新穎而實(shí)用的方法提供支持。

        一個(gè)善意的警告:我所呼吁的多樣性堆棧跟數(shù)字人文之間存在矛盾,而這一矛盾并沒有快速解決之道。在所有的人文學(xué)領(lǐng)域中,數(shù)字人文必須跟各種背景的研究者合作,包括計(jì)算機(jī)科學(xué)家、數(shù)據(jù)科學(xué)家、數(shù)字模擬STEM科學(xué)家、社會(huì)學(xué)家、檔案管理員、數(shù)據(jù)記者,以及學(xué)術(shù)圈以外的,在硅谷或非政府公共服務(wù)機(jī)構(gòu)(例如Datakind,[www.datakind.org])的工作者。他們的共同目標(biāo)是形成一個(gè)良性循環(huán),以使多樣性研究能帶動(dòng)技術(shù)革新,而技術(shù)革新又能反過來設(shè)計(jì)理解和實(shí)踐多樣性的新方法。還有一個(gè)警告:這些甚至還不是多樣性堆棧中所有需要發(fā)展的層級(jí),而只是其中最關(guān)鍵的一些。在我所提出的堆棧中,從底層開始向上論述。然而,為了壓縮論點(diǎn),即使在較低的層級(jí),我也將指出,在實(shí)現(xiàn)多樣性的技術(shù)手段中,低層抽象概念如何向高層進(jìn)行傳遞。

        一、多語言數(shù)字人文

        鑒于語言是很多人文學(xué)研究的原材料,有關(guān)多樣性的一個(gè)基本低層級(jí)問題是多語制。(28)“更低”是一個(gè)相對(duì)的概念。我不打算討論更低層級(jí)的技術(shù)任務(wù),例如統(tǒng)一的字符編碼(Unicode character encoding)和光學(xué)字符識(shí)別(optical character recognition)。這些任務(wù)對(duì)多樣性研究也很重要。例如,從多語言主義的角度來說。數(shù)字人文需要協(xié)調(diào)跨學(xué)科的合作,以此來應(yīng)對(duì)跨語種數(shù)字研究的技術(shù)問題。

        2012年的ADHO會(huì)議在其征稿啟事中強(qiáng)調(diào)“促進(jìn)多語言和多文化”,而會(huì)議的特別小組“全球展望”(GO::DH[www.globaloutlookdh.org/])也將此作為多樣性問題的核心主題。就像“全球展望”下的“翻譯工具包”(Translation Toolkit)小組所說的,“多語言問題的復(fù)雜性和敏感性涉及經(jīng)濟(jì)不平等、殖民歷史和政治因素等更大范圍內(nèi)的問題。這些問題塑造了我們所生存的這個(gè)世界以及我們工作的環(huán)境”(29)“About: Why a Translation Toolkit?” Global Outlook:: Digital Humanities, go-dh.github.io/translation-toolkit/about.。

        今天,數(shù)字人文在跨語言工作方面遇到的困難阻礙了多樣性所需的比較研究。首先,就像數(shù)字人文學(xué)者多梅尼科·菲奧蒙特(Domenico Fiormonte)和伊莎貝爾·加林娜·羅素(Isabel Galina Russell)所指出的那樣,作為研究對(duì)象和專業(yè)交流的媒介,數(shù)字人文所優(yōu)先使用的語言(主要是英語)只覆蓋了很小的地理范圍。它的技術(shù)語料庫(經(jīng)常被嵌入工具和編碼標(biāo)準(zhǔn)中去)也主要來自英語。這不僅限制了研究的范圍,還阻礙了全球數(shù)字人文學(xué)者的合作,即便是創(chuàng)造性的社會(huì)工程和其他解決方案已經(jīng)被用于一些跨語言的學(xué)術(shù)活動(dòng)。例如,GO::DH創(chuàng)造了一個(gè)適用于學(xué)術(shù)會(huì)議的翻譯工具包。(30)“The Translation Toolkit”, Global Outlook::Digital Humanities, go-dh.github.io/translation-toolkit/.2018年在墨西哥城召開的雙語ADHO會(huì)議在其征稿啟事中推薦了這一工具。(31)“Digital Humanities 2018: ‘Bridges/ Puentes’—Call for Papers”, DH2018, dh2018.adho.org/en/cfp/.

        從根本上說,數(shù)字人文的一個(gè)核心問題是無法同時(shí)用多種語言工作,因?yàn)閿?shù)字人文的工具一般都是單語言運(yùn)行的。例如,雖然文本分析的各種方法在本質(zhì)上不限定語言,但它們一般在同一時(shí)間只能用一種語言進(jìn)行有意義的工作。這就讓比較性研究很難開展。數(shù)字人文應(yīng)該以多語言集合體的方式來工作,以此發(fā)展系統(tǒng)化、自動(dòng)化,以及規(guī)?;瘑栴}的解決方案,就像詹姆斯·李(James Lee)和保爾·迪雷(Paul Dilley)在他們的項(xiàng)目“挖掘文藝復(fù)興”中對(duì)英語和拉丁文檔案所做的主題建模(topic modeling)。(32)感謝李(Lee)為我提供了有關(guān)這個(gè)項(xiàng)目的額外信息。這一工作的目標(biāo)是將機(jī)器學(xué)習(xí)運(yùn)用于廣泛的、多語言混合的文本集合體。這類集合體需要進(jìn)行多種文化的比較研究。例如,像美國集合了英語和西班牙語的新聞報(bào)道、小說、電視對(duì)話和歌詞。大衛(wèi)·米諾(33)Mimno,David,et al,“Polylingual Topic Models”, Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing,vol.2, pp.880-89. Association for Computational Linguistics, dl.acm.org/ citation.cfm?id=1699627.等計(jì)算機(jī)科學(xué)家在《多語言主題模型》(“Polylingual Topic Models”)中所做的研究展示了有效的新技術(shù)取向。我們還可以想到的是,谷歌自2016年開始在其翻譯平臺(tái)所使用的神經(jīng)網(wǎng)絡(luò)翻譯方法將會(huì)在未來的某一天允許數(shù)字人文采用多語言進(jìn)行文本分析。這種方法基于各種語言交匯的“中介語”(interlingua)——一種由機(jī)器生成的、處于發(fā)展初期的、具有過渡性質(zhì)的語言形式。它是純粹比較理念(pure comparatism)的產(chǎn)物。(34)有關(guān)谷歌神經(jīng)網(wǎng)絡(luò)服務(wù)中的“中介語”,參見蔻德威(Coldewey)。有關(guān)谷歌如何發(fā)展其基于神經(jīng)網(wǎng)絡(luò)的翻譯服務(wù)(該服務(wù)在2016年取代了原先的舊系統(tǒng)),參見路易斯-柯勞斯(Lewis-Kraus)所寫的精彩的長(zhǎng)文章。Coldewey, Devin, “Google’s AI Translation Tool Seems to Have Invented Its Own Secret Internal Language”, TechCrunch, (22 Nov. 2016), techcrunch.com/2016/11/22/googles-ai-translation-tool-seems-to-have-invented-its-own-secret-internal-language.Lewis-Kraus, Gideon, “The Great AI Awakening”, The New York Times Magazine, (14 Dec. 2016), www.nytimes.com/2016/12/14/magazine/the-great-ai-awakening.html.

        這種努力不僅可以使多樣性方面的工作在執(zhí)行層面取得進(jìn)展,還能使其概念在更高的抽象層面發(fā)生變化。雖然人工智能“中介語”追求的多語言主義并不真正具有“交叉性”或“接觸區(qū)”(這是由金伯樂·克倫肖(35)Crenshaw, Kimberlé, “Demarginalizing the Intersection of Race and Sex: A Black Feminist Critique of Antidiscrimination Doctrine, Feminist Theory and Antiracist Politics”, University of Chicago Legal Forum, vol. 1989, no. 1, (Dec. 2015), chicagounbound.uchicago.edu/uclf/vol1989/iss1/8.、帕特里夏·希爾·柯林斯(36)Collins, Patricia Hill, Black Feminist Thought: Knowledge, Consciousness, and the Politics of Empowerment, 2nd ed., (Routledge, 2000).和瑪麗·路易斯·普拉特(37)Pratt, Mary Louise, “Arts of the Contact Zone”, Profession, (1991), pp. 33-40, JSTOR, www.jstor.org/stable/25595469.等學(xué)者最初提出的,有關(guān)多樣性的具有影響力的概念,后來又被路皮·卡瑞賽(38)Risam, Roopika, “Beyond the Margins: Intersectionality and the Digital Humanities”, Digital Humanities Quarterly, vol. 9, no. 2, (2015), www.digitalhumanities.org/dhq/vol/9/2/000208/000208.html.和埃里克·奧特加(39)Ortega, élika, “Zonas de Contacto: A Digital Humanities Ecology of Knowledges”, Debates in the Digital Humanities 2019, edited by Matthew K. Gold and Lauren F. Klein, (U of Minnesota P, 2019), dhdebates.gc.cuny.edu/read/untitled-f2acf72c-a469-49d8-be35-67f9ac1e3a60/section/aeee46e3-dddc-4668-a1b3-c8983ba4d70a#ch15.等學(xué)者運(yùn)用于數(shù)字人文),它還是顯示了有關(guān)這些主題的有趣變化。例如,如果將“交叉性”和“接觸區(qū)”類比為人工智能的人造神經(jīng)網(wǎng)絡(luò)的交叉點(diǎn),人文學(xué)科將如何增進(jìn)對(duì)這兩個(gè)概念的理解?用于圖像識(shí)別的 “卷積”(convolutional)神經(jīng)網(wǎng)絡(luò),可以是一個(gè)特別恰當(dāng)?shù)睦?也為我轉(zhuǎn)入接下來有關(guān)多媒體的討論提供了便利)。這種神經(jīng)網(wǎng)絡(luò)工作原理是依次檢測(cè)和匯集圖像中的特定特征。其中的決定性因素包括神經(jīng)元的層數(shù)(每一層都包含了很多處理節(jié)點(diǎn)),以及各層內(nèi)部和層與層之間的交互作用。這種交互作用為了識(shí)別不同的特征而被激活。人文主義的多樣性概念是否可以通過與身份節(jié)點(diǎn)(identity nodes)的分離層級(jí)在識(shí)別他人特征時(shí)進(jìn)行的社會(huì)文化互動(dòng)的對(duì)比來建立模型?(40)在這種情況下,另一類特別有提示性的神經(jīng)網(wǎng)絡(luò)是“生成性對(duì)抗網(wǎng)絡(luò)”(GANs)。它也被用于圖像識(shí)別。GANs所涉及的兩個(gè)網(wǎng)絡(luò)(一個(gè)是“生成性的”,另一個(gè)是“判別性的”)之間的“對(duì)抗性”(adversarial)關(guān)系為思考什么是“交叉點(diǎn)”、什么是“接觸區(qū)”提供了另外的啟示。(有關(guān)神經(jīng)網(wǎng)絡(luò)的介紹,參見“神經(jīng)網(wǎng)絡(luò)” “卷積神經(jīng)網(wǎng)絡(luò)”以及“生成對(duì)抗性網(wǎng)絡(luò)”。)我還要感謝法賓·歐弗特(Fabian Offert),他正在撰寫的博士論文讓我認(rèn)識(shí)到圖像識(shí)別神經(jīng)網(wǎng)絡(luò)的“可解釋性”(interpretability)對(duì)人文學(xué)科的意義。神經(jīng)網(wǎng)絡(luò):“Neural Network”, Wikipedia, (20 Mar. 2019, 19:25 UTC), en.wikipedia .org/w/index .php?title=Neural_ network&oldid=888691390.卷積神經(jīng)網(wǎng)絡(luò):“Convolutional Neural Network”, Wikipedia, (21 Mar. 2019, 21:19 UTC), en.wikipedia.org/w/index.php?title=Convolutional_neural_network&oldid =888858225.生成對(duì)抗性網(wǎng)絡(luò):“Generative Adversarial Network”, Wikipedia, (20 Mar. 2019, 09:18 UTC), en.wikipedia.org/w/index.php?title=Generative_adversarial_network&oldid =888618653.就此,克倫肖使用了一個(gè)令人難忘的比喻:人們?cè)诓煌潭鹊牧觿?shì)之下被一個(gè)疊一個(gè)地堆積在地下室中。(41)Crenshaw, Kimberlé, “Demarginalizing the Intersection of Race and Sex: A Black Feminist Critique of Antidiscrimination Doctrine, Feminist Theory and Antiracist Politics”, University of Chicago Legal Forum, vol. 1989, no. 1, (Dec. 2015), pp. 151-52, chicagounbound.uchicago.edu/uclf/vol1989/iss1/8.(畢竟,如果不幸的確如此的話,我們知道,神經(jīng)網(wǎng)絡(luò)已經(jīng)通過有偏見的人工智能人種和種族人臉識(shí)別系統(tǒng)以這種方式進(jìn)行算法操作了。)換句話說,在對(duì)交叉性理論的已有理解之外,人文學(xué)科還可以通過借用新的技術(shù)范式來發(fā)現(xiàn)哪些交叉性模式?(我們注意到,交叉性理論所使用的詞匯——例如,支配的“矩陣”和“矢量”——已經(jīng)是偽數(shù)學(xué)的[pseudo-mathematical],通過這些方式似乎做好了和技術(shù)模型進(jìn)行對(duì)話的準(zhǔn)備。(42)有關(guān)交叉性理論中的“矩陣”成語,參見,例如,Collins, Patricia Hill, Black Feminist Thought: Knowledge, Consciousness, and the Politics of Empowerment, 2nd ed., (Routledge, 2000), pp. 227-29.有關(guān)交叉性理論中的“矢量”,參見,比如說,Ritzer, George, and Jeffrey Stepnisky, Contemporary Sociological Theory and Its Classical Roots: The Basics, 5th ed., (SAGE Publications, 2017), pp.241-43.)反過來說,一旦熟悉了新的技術(shù)范式,人文領(lǐng)域的見解又將如何反向加入這些范式,從而對(duì)它們?cè)斐捎绊懀?/p>

        二、多媒體數(shù)字人文

        另一個(gè)和多樣性有關(guān)的低層級(jí)問題涉及數(shù)字圖像和音頻。數(shù)字人文一直都以文本為中心。原因是多種多樣的,包括文本在人文研究領(lǐng)域中具有主導(dǎo)性,在版權(quán)法約束下使用文本具有更大的靈活性,以及文本在技術(shù)上更容易被跟蹤(可以作為離散的符號(hào)來被量化和分析)。此外,與同等的圖像或音頻相比,借助廣泛、靈活、細(xì)致和開放的分類法(例如,文本編碼基礎(chǔ)),我們可以對(duì)文本材料進(jìn)行更有力和更大程度上的計(jì)算化管理。(43)Iconclass是一個(gè)藝術(shù)史圖像分類系統(tǒng)的例子(www.iconclass.nl/home)。關(guān)于圖像分類學(xué)的出色想法,參見Burford, Bryan, et al, “A Taxonomy of the Image: On the Classification of Content for Image Retrieval”, Visual Communication, vol. 2, no. 2, (June 2003), pp.123-61, doi: 10.1177/1470357203002002001.。對(duì)音樂流派或聲音效果進(jìn)行計(jì)算機(jī)分類的研究包括李、歐吉哈拉(Ogihara)和莫法特(Moffat)等。Li, Tao, and M. Ogihara, “Music Genre Classification with Taxonomy”, Proceedings: (ICASSP ’05): IEEE International Conference on Acoustics, Speech, and Signal Processing, 2005, vol. 5, IEEE, (2005), pp. 197-200. IEEE Xplore Digital Library, doi:10.1109/ICASSP .2005 .1416274.Moffat, David Festus Charles, et al, “Unsupervised Taxonomy of Sound Effects”, Semantic Scholar, Allen Institute for Artificial Intelligence, www .semanticscholar.org/paper/Unsupervised-Taxonomy-of-SoundEffects-Moffat/e44e2f2c60e78b930eb64bdb583654309a9b1af6.

        然而,數(shù)字人文學(xué)者已經(jīng)開始對(duì)人類經(jīng)驗(yàn)的視聽記錄進(jìn)行“遠(yuǎn)讀”(distant reading)。相關(guān)項(xiàng)目包括HiPSTAS(口語音頻文件的數(shù)字化分析digital analysis of spoken-text audio files [blogs.ischool.utexas.edu/hipstas/2012/11/14welcome-to-hiptas])、列夫·曼諾維奇(Lev Manovich)的“直接視覺化”(44)Manovich, Lev, “What Is Visualization?”, Manovich, (2010), manovich.net/index.php/projects/what-is-visualization.(由大量可縮放的圖像按照其元數(shù)據(jù)排列的“圖像圖表”[image graphs, 20-23]),以及弗雷德里克·布羅代克(Frederic Brodbeck)的“計(jì)量電影學(xué)”(有關(guān)電影“編輯結(jié)構(gòu)、色彩、語言或動(dòng)作方面的信息……經(jīng)由提取、分析、轉(zhuǎn)換為圖像呈現(xiàn),這樣電影就可以被作為一個(gè)整體來觀看,并且很容易就能被詮釋和比較”)。(45)與布羅代克(Brodbeck)的電影數(shù)據(jù)分析方法相輔相成的是電影研究中的另一種以數(shù)據(jù)為中心的方法:專注于電影產(chǎn)業(yè)的數(shù)據(jù)。例如,可參看計(jì)量電影學(xué)(Kinomatics)的項(xiàng)目(kinomatics.com/)。Brodbeck, Fredreric, “Cinemetrics”, Cinemetrics, cinemetrics.fredericbrodbeck.de/.然而,這一領(lǐng)域有很多新的、高速發(fā)展的技術(shù)性研究可供數(shù)字人文進(jìn)一步開拓。再次重申,神經(jīng)網(wǎng)絡(luò)人工智能,像用于圖像識(shí)別的人工智能,顯示了新的前景。我們可以想象一下將可以識(shí)別圖像的神經(jīng)網(wǎng)絡(luò)運(yùn)用在對(duì)人文和藝術(shù)領(lǐng)域非常重要的那些視覺材料上。例如,海因里希·沃夫林(Heinrich W?lfflin)在其作于20世紀(jì)早期的深具影響力的著作《藝術(shù)史的基本原理》(46)W?lfflin, Heinrich, Principles of Art History: The Problem of the Development of Style in Later Art, Translated by M. D. Hottinger, 1932, (Dover Publications, 1950).中,將“線性的”與“開放式畫風(fēng)的”、“平面的”與“后退的”、“開放的”與“封閉的”風(fēng)格基于正式的“主題”(motifs)進(jìn)行比較。沃夫林說:“沒有什么比比較兩幅畫中相似的手臂曲線更具啟發(fā)的事了(這兩幅畫分別由波提切利[Botticelli]和洛倫佐·迪·克雷迪[Lorenzo di Credi])所作。鋒利的肘部,前臂靈動(dòng)的線條,手指在胸前放射狀張開,每一條線都充滿了能量——這就是波提切利?!?47)W?lfflin, Heinrich, Principles of Art History: The Problem of the Development of Style in Later Art, Translated by M. D. Hottinger, 1932, (Dover Publications, 1950),p.2.顯而易見,這本書等待著機(jī)器學(xué)習(xí)的再創(chuàng)作,以產(chǎn)生和沃夫林旗鼓相當(dāng)?shù)挠^察。

        在數(shù)字人文領(lǐng)域,和多樣性有關(guān)的一個(gè)具體研究方向可能是在代表不同國家、文化和時(shí)代的圖像集方面訓(xùn)練機(jī)器的學(xué)習(xí)能力。這樣就可以對(duì)所描繪的對(duì)象(例如,圖像中的物體是什么?每一種有多少個(gè)體?)的形式結(jié)構(gòu)、色彩模式、透視系統(tǒng)和材料媒介進(jìn)行比較性的數(shù)據(jù)分析。目標(biāo)將是尋找沒有被一般藝術(shù)史上的西方、東方、非洲、土著等“運(yùn)動(dòng)”和“風(fēng)格”所容納的圖像之間的意外關(guān)系。通過將由機(jī)器學(xué)習(xí)發(fā)現(xiàn)的圖像元數(shù)據(jù)和圖像周圍那些在歷史文本中被命名和地理標(biāo)記的實(shí)體相聯(lián)系,而不僅僅是將其與圖像分類法相聯(lián)系,我們還可以進(jìn)一步發(fā)展這類比較工作。人文學(xué)領(lǐng)域?qū)Α霸娙绠嫛?ut pictura poesis)和“文本的圖像化再現(xiàn)”(ekphrasis)等“語言-視覺”層面的問題有著悠久的思考傳統(tǒng)。通過將識(shí)別、分類和注釋等方法運(yùn)用于其中,特別是通過升級(jí)這個(gè)傳統(tǒng)使之將多元性納入考慮,數(shù)字人文還可以為圖像的機(jī)器學(xué)習(xí)本身做出貢獻(xiàn)。例如,數(shù)字人文可以為解決如下問題提供一個(gè)歷史更久遠(yuǎn)、文化更多元的基線:對(duì)圖像的充分文字描述要滿足什么特征?(48)關(guān)于使用機(jī)器學(xué)習(xí)對(duì)圖像進(jìn)行文字標(biāo)注的計(jì)算科學(xué)研究的例子,參見Murthy, Venkatesh N., et al, “Automatic Image Annotation Using Deep Learning Representations”, Proceedings of the Fifth ACM on International Conference on Multimedia Retrieval, Association for Computing Machinery, (2015), pp. 603-06. ACM Digital Library, doi: 10 .1145/ 2671188 .2749391.反過來,什么才是對(duì)文本的充分視覺化?

        然而,如果不能在可縮放的、細(xì)微的、靈活的多媒體分析方面取得進(jìn)一步的進(jìn)展,數(shù)字人文將無法探索能夠做到圖文并茂的視覺認(rèn)知(約翰娜·德魯克[Johanna Drucker]將這種認(rèn)知稱為“視覺認(rèn)識(shí)論”(49)還可參看我在《與古為友》(87-92)中關(guān)于“圖形知識(shí)系統(tǒng)”和“圖形知識(shí)建模系統(tǒng)”的討論。Liu, Alan, Friending the Past: The Sense of History in the Digital Age, (U of Chicago P, 2018).),更不用說聽覺、觸覺、形體表現(xiàn)和其他方面的認(rèn)知論。(50)Drucker, Johanna, Graphesis: Visual Forms of Knowledge Production, (Harvard UP, 2014), p. 8, MetaLABprojects.因此,完整的文化幅度仍然充滿誘惑卻難以觸及。這包括各個(gè)民族的多媒體藝術(shù)總集,這些民族在過去和現(xiàn)在最燦爛的文化往往存在于文字以外的領(lǐng)域,例如口頭表演、藝術(shù)、裝飾、音樂和舞蹈。因此,同樣地(從這里切換到更高層面的抽象性),有關(guān)多樣性本質(zhì)的新想法的潛力仍然有待開發(fā)。這些想法伴隨著采樣、過濾、轉(zhuǎn)換、合成和其他操作方式潛藏在今天的多媒體數(shù)字實(shí)驗(yàn)室中。例如,如果我們探索混合、均衡或者高斯式模糊(Gaussian blurring)的數(shù)字方法——這些方法將提示包容和排斥的另類模式,我們對(duì)多樣性的理解又會(huì)有什么不同?畢竟,當(dāng)今的多元文化經(jīng)驗(yàn)有很多來自多媒體音樂、視頻和其他混合型表演形式。這些形式在被數(shù)字方法輸送的同時(shí)也被其改變。因此,研究不能只關(guān)注它們的效果,還應(yīng)將它們視為具有概念和社會(huì)重要性的、重新混合了多樣性的思想。

        三、具有代表性的數(shù)字人文語料庫

        在多樣性堆棧中,在那些聚焦于文本和視聽媒體的層級(jí)之上的,是專門用于做采集工作的抽象層級(jí)。在互聯(lián)網(wǎng)協(xié)議中,傳輸層級(jí)比底層的互聯(lián)網(wǎng)層級(jí)更抽象,因?yàn)樗鼜摹皵?shù)據(jù)包”中制造數(shù)據(jù)“流”。與此相似,采集在多樣性堆棧中的層級(jí)更高,因?yàn)樗鼜拿襟w中創(chuàng)造語料庫和檔案(以及,用英聯(lián)邦或其他運(yùn)用數(shù)字人文的國家的術(shù)語來說,就是“遺產(chǎn)”[heritage])。在這一層級(jí)上,與多樣性有關(guān)的關(guān)鍵問題不僅涉及語料的出處和規(guī)范性,還關(guān)系到它們是否具有代表性。在一個(gè)集合中,代表性的各個(gè)面向(社會(huì)、政治、經(jīng)濟(jì)、文化、語言、宗教、種族、民族、性格以及其他)如何做到互相交叉?(51)以下是原材料中有關(guān)“代表性”的一些方面,材料取自我正在指導(dǎo)的“4Humanities.org”項(xiàng)目“WhatEvery1Says”(we1s.ucsb.edu/)中用以評(píng)估大眾如何看待人文學(xué)科的新聞和其他話語的語料庫:出版的國家和地區(qū)、類型(例如報(bào)紙或雜志)、媒體(例如報(bào)紙、電視或社交媒體),發(fā)行量(受眾規(guī)模)、聲明的政治身份,以及自我確認(rèn)的與一個(gè)性別或性群體、宗教、文化遺產(chǎn)或機(jī)構(gòu)部門(例如大學(xué)或高等教育行業(yè))的關(guān)聯(lián)?!癇ibliography—Corpus Representativeness”, What Every 1 Says, we1s.ucsb.edu/research-resources/we1s-bibliography/bibliography-corpus-representativeness/. (我要感謝阿卑哥爾·多拉吉[Abigail Droge]和林賽·托馬斯[Lindsay Thomas]。他們主持創(chuàng)建了這個(gè)項(xiàng)目的原數(shù)據(jù))。有關(guān)在解釋的過程中(尤其是在數(shù)字人文領(lǐng)域,但同樣也存在于“傳統(tǒng)”人文學(xué)科)如何權(quán)衡代表性和消退性的一個(gè)深思熟慮的、系統(tǒng)化的方法,參見Tahmasebi, Nina, et al, “A Convergence of Methodologies: Notes on Data- Intensive Humanities Research”, Nina Tahmasebi, tahmasebi.se/publication/2019-aconvergenceofmethods/。有關(guān)代表性問題的其他研究,以及語料庫或檔案中的材料缺失問題,參見“Bibliography—Corpus Representativeness”, What Every 1 Says, we1s.ucsb.edu/research-resources/we1s-bibliography/bibliography-corpus-representativeness/.如何用計(jì)算機(jī)能夠跟蹤的方式來注解和衡量這些面向?更進(jìn)一步說,對(duì)于遺失或沉默的檔案資料,計(jì)算方法如何幫助我們推斷出更全面的人類模式?最后,數(shù)字化的聚合方式對(duì)統(tǒng)計(jì)“規(guī)范化”(“normalization”)概念(指讓不同規(guī)模和分布的數(shù)據(jù)之間具有可比性)的沖擊如何影響我們今天有關(guān)社會(huì)代表性和多樣性的“規(guī)范”(norms)?這些都是有關(guān)多樣性和包容性的關(guān)鍵問題在數(shù)字人文領(lǐng)域的具體呈現(xiàn)。

        雖然看起來這么說似乎是將問題簡(jiǎn)化了,并且可能引起爭(zhēng)議,但我還是建議:數(shù)字人文學(xué)者的一個(gè)必要步驟是跨國家和跨團(tuán)體的合作。他們需要和檔案管理員、社會(huì)科學(xué)家,以及民族志學(xué)者進(jìn)行磋商,并對(duì)國際標(biāo)準(zhǔn)化組織(ISO)、政府、非政府組織(NGO)的人口分類系統(tǒng)進(jìn)行梳理,以期創(chuàng)建一個(gè)能用數(shù)字跟蹤的、可擴(kuò)展的多樣性分類法。這一分類法能用更通用的本體協(xié)議(ontology protocols)來表達(dá)或與之建立聯(lián)系,用于對(duì)那些需要對(duì)個(gè)體和群體進(jìn)行分類的起源、人物和社會(huì)事件研究做出描繪。這種通用協(xié)議的例子包括:文本編碼規(guī)范(TEI)P5準(zhǔn)則(尤其是第十三章“姓名、日期、人物和地點(diǎn)”中的“個(gè)人特征”部分(52)“Names, Dates, People, and Places”, P5: Guidelines for Electronic Text Encoding and Interchange, version 3.4.0, Text Encoding Initiative, (23 July 2018), www.tei-c.org/release/doc/tei-p5-doc/en/html/ND.html.);公司機(jī)構(gòu)、個(gè)人和家庭的檔案編碼語境(EAC-CPF)模式(eac.staatsbibliothek-berlin.de/);W3C PROV數(shù)據(jù)模式(53)“PROV- Overview: An Overview of the PROV Family of Documents: W3C Working Group Note”, W3C, (30 Apr. 2013), www.w3.org/TR/prov- overview/.;以及“沖突和調(diào)解事件觀察”(CAMEO)框架。例如,CAMEO——在國際研究領(lǐng)域興起的一種描述事件的標(biāo)準(zhǔn)——就包括了一本指定行為者和行動(dòng)名稱的《代碼手冊(cè)》(Codebook)。設(shè)計(jì)這本手冊(cè)是為了幫助計(jì)算機(jī)挖掘和分析與當(dāng)代政治及軍事沖突有關(guān)的文本材料(以及和它們有關(guān)的事件推動(dòng)者、行為和地點(diǎn))。編碼手冊(cè)的“種族編碼計(jì)劃”(或稱CAMEOECS),用3個(gè)字母的編碼將全世界近600個(gè)種族群體與其“主要定居國”聯(lián)系起來進(jìn)行分類。(54)CAMEO: Conflict and Mediation Event Observations Event and Actor Codebook. Directed by Philip A. Schrodt, version 1.1b3, (Mar. 2012), Computational Event Data System, eventdata.parusanalytics.com/cameo.dir/ CAMEO.Manual.1.1b3.pdf., pp. 111, 113.有關(guān)CAMEO和更早的對(duì)沖突事件中行為者及行為編碼的國際框架,見Gerner, Deborah J., et al, “Conflict and Mediation Event Observations (CAMEO): A New Event Data Framework for the Analysis of Foreign Policy Interactions”, Computational Event Data System, eventdata.parusanalytics.com/papers.dir/gerner02.pdf和Heap, Bradford, et al, “A Joint Human/Machine Process for Coding Events and Conflict Drivers”, Advanced Data Mining and Applications: ADMA 2017, edited by Gao Cong et al, (Springer, 2017), pp. 639-54, doi: 10.1007/978-3-319-69179-4_45。CAMEOECS族裔群體的完整名單見于CAMEO的圖5.1(114-30)。根據(jù)我的統(tǒng)計(jì)(表中的行數(shù)沒有編號(hào)),共有594個(gè)群體。CAMEOECS分類法是在認(rèn)真思考之后創(chuàng)建的。這一思考過程始于查詢語言的ISO代碼和民族權(quán)力關(guān)系數(shù)據(jù)集(CAMEO111-112)。我要感謝司考特·克萊曼(Scott Kleinman)首先將我引至CAMEO。為人文學(xué)科調(diào)配出一種可擴(kuò)展的、能被機(jī)器所閱讀的多樣性分類法的努力具有正確的精神導(dǎo)向性(考慮到自我認(rèn)同和群體的多重認(rèn)同),可以促進(jìn)有急切需求的、由數(shù)據(jù)驅(qū)動(dòng)的多樣性研究。否則,彼此之間對(duì)“當(dāng)我們?cè)谡劧鄻有缘臅r(shí)候究竟在談什么”這個(gè)問題的不同理解將對(duì)此研究造成阻礙。

        我們?yōu)槭裁匆爸雌饋磉^于簡(jiǎn)化并存在爭(zhēng)議的風(fēng)險(xiǎn)創(chuàng)建一個(gè)多樣性分類法?(55)我知道我所建議的以計(jì)算為導(dǎo)向的分類方法對(duì)多樣性學(xué)術(shù)研究可能造成的風(fēng)險(xiǎn)。在這方面增強(qiáng)分類意識(shí)和自主性能帶來社會(huì)和道德上的積極作用。(例如,參見Terras, Melissa, “On Changing the Rules of Digital Humanities from the Inside”, Melissa Terras’ Blog, 2013, melissaterras.blogspot.com/2013/05/on-changing-rules-of-digital-humanities.html.)但是,如果執(zhí)行得不好,它也會(huì)導(dǎo)致地區(qū)、國家和群體之間的分歧,強(qiáng)化那些歷史上有權(quán)分類和只能被分類的群體之間的權(quán)力差,并且在另一些方面造成壓迫。(有關(guān)告誡性的例子,參見鮑克[Bowker]和斯達(dá)[Star]在他們的經(jīng)典分類學(xué)著作《為事物分類》中的“種族隔離下的種族分類和再分類案例”, Bowker, Geoffrey C., and Susan Leigh Star, Sorting Things Out: Classification and Its Consequences,[MIT Press, 1999], pp. 195-225;以及奧斯·凱耶斯[Os Keyes]有關(guān)將數(shù)據(jù)科學(xué)運(yùn)用于同性戀者的“行政暴力”討論,Keyes, Os, “Counting the Countless: Why Data Science Is a Profound Threat for Queer People”, Real Life,[8 Apr.2019], reallifemag.com/counting-the-countless.)然而,我之所以大膽地提出我的建議,是因?yàn)槲蚁嘈拧绕涫窃跒榱薟hatEvery1Says項(xiàng)目而通過幾百萬篇媒體文章和社交媒體發(fā)布對(duì)公共話語進(jìn)行研究之后——在數(shù)字人文的幫助之下,人文學(xué)科能夠找到一種方案,將其分類觀點(diǎn)貢獻(xiàn)給有關(guān)多樣性的無數(shù)分類法。若非如此,這些分類法就只能在流行文化和由國家或組織官僚機(jī)構(gòu)操控的話語中野生發(fā)展。這是因?yàn)?,就像“沖突與調(diào)解”(它的首字母縮寫是“CAMEO”)框架所指示的那樣,如果我們想要收集資料,用以進(jìn)行有關(guān)人類整體模式和社會(huì)公正,或者其他相關(guān)課題的研究,尤其是需要大數(shù)據(jù)計(jì)算的那類,那么,為那些生活在緊張的、相互交錯(cuò)的關(guān)系中的群體命名就是第一步。因?yàn)椋拖袢丝谄詹楸砘虼髮W(xué)申請(qǐng)書上的種族選項(xiàng)一樣,生活在多元社會(huì)中的人們?cè)诂F(xiàn)實(shí)生活中也在和多樣性分類法進(jìn)行協(xié)調(diào)。我們需要在復(fù)雜的國家和世界的關(guān)系網(wǎng)中更好地理解這一分類法。也是因?yàn)?,在?shù)字人文這一領(lǐng)域內(nèi)部,對(duì)多樣性存在著很多可能的國際性的誤解。在2013年,詹姆斯·史密發(fā)表了一篇博客,題為《回應(yīng)美國:數(shù)字人文后殖民理論的本土化》。作為一個(gè)在后殖民討論中對(duì)土著文化感到自豪的新西蘭人,史密斯回應(yīng)了一項(xiàng)開始于美國的,名為“后殖民數(shù)字人文”的倡議(#dhpoco[dhpoco.org/])。他反思道:“它并不代表我所理解的后殖民主義,也不代表我所知道的后殖民世界。它的確是一種批評(píng)理論,一種很有力量的混合體,融合了身份理論、女性主義、酷兒理論和激進(jìn)主義政治,但它不是‘我的’后殖民主義?!薄斑m度的本土化是必須的”,史密斯說,“因?yàn)槲覀冃枰_保我們這個(gè)地區(qū)的土著人民也能像那些被殖民地區(qū)的人民一樣參與數(shù)字人文,并且在與數(shù)字人文接觸的過程中充分受益于我們當(dāng)?shù)氐暮笾趁裨捳Z?!?/p>

        史密斯所說的“本土化”是可擴(kuò)展的數(shù)字人文分類法想要取得的一個(gè)目標(biāo)——一種“多樣性可擴(kuò)展標(biāo)記語言”(“diversity XML”)。這種語言為特定種類或區(qū)域的多樣性定義其元素和屬性。與之相對(duì)的目標(biāo)則是普遍化:在個(gè)人、群體、國家和更大的層面上系統(tǒng)地抽象出多樣性概念的能力(一路向上,直至這一模式中最常見的“命名空間”[namespace],即人類)。(56)在計(jì)算機(jī)科學(xué)的意義上,“命名空間”是一個(gè)限制著一個(gè)特定區(qū)域的抽象邏輯范圍(雖然它由精確統(tǒng)一的源頭或URI所指定)。在該區(qū)域內(nèi),一個(gè)模式或其他協(xié)議建立了實(shí)體及各種屬性的命名慣例。命名空間可以防止慣例之間的碰撞。因此,文本編碼協(xié)議,例如XML、HTML、TEI這種,都能容納使具體命名規(guī)則得以運(yùn)作的命名空間的聲明。在我的類比中,緊隨身份政治而產(chǎn)生的多樣性就是一種空間命名(namespacing)。然而,就像在被設(shè)計(jì)為強(qiáng)調(diào)混亂的碰撞和重疊的交叉性理論中那樣,這種空間命名有時(shí)候會(huì)促進(jìn)而不是防止命名空間之間的碰撞。創(chuàng)建一個(gè)能夠被共享的、具有透明度的數(shù)字人文多樣性詞匯庫——能夠?yàn)椴煌纳矸菰睾蛯傩蕴峁?dǎo)航的那種——將會(huì)更好地定位數(shù)字人文,以及一般的人文學(xué)科,使其能夠介入目前各機(jī)構(gòu)、公司和政府出于自己的目的而使用的多樣性分類法。例如,這些分類法可以用以決定誰能移民、如何劃分投票選區(qū)、選擇目標(biāo)消費(fèi)者,以及從一般意義上來講,如何分配各種資源和身份。雖然永遠(yuǎn)不會(huì)出現(xiàn)一種正確的分類法(因?yàn)?,歸根結(jié)底,對(duì)任何具體的資源和身份的政治經(jīng)濟(jì)分配都不具備無可爭(zhēng)議的合理性),卻可以有多種不同的分類法——或者,更好的是,具有差異性的分類法。

        在可擴(kuò)展的多樣性分類學(xué)的幫助之下,數(shù)字人文可以繼續(xù)創(chuàng)建計(jì)算方法來評(píng)估任何材料(或者其他研究對(duì)象)中多樣性的平衡和結(jié)構(gòu);(57)例如,阿加門(Argamon)和他的合作者們分解了數(shù)據(jù)庫“黑色戲劇——1850至今”(search.alexanderstreet.com/bld2)中的元數(shù)據(jù)(包括“姓名、種族、年齡、性別、國籍、民族、職業(yè)和性取向”)。就像瑞薩姆(Risam)注意到的那樣,他們的研究在方法上實(shí)際是交叉性(intersectional)的。他們提出的問題是,“數(shù)據(jù)庫可以做到交叉性嗎?”Argamon, Shlomo, et al, “Gender, Race, and Nationality in Black Drama, 1950-2006: Mining Differences in Language Use in Authors and Their Characters”, Digital Humanities Quarterly, vol. 3, no. 2, (2009), www. digitalhumanities.org/dhqdev/vol/3/2/000043/000043.html.Risam, Roopika, “Beyond the Margins: Intersectionality and the Digital Humanities”, Digital Humanities Quarterly, vol. 9, no. 2, (2015), www.digitalhumanities.org/dhq/vol/9/2/000208/000208.html.來代表那些因?yàn)楸坏凸?、被審查或被刪除而缺席的聲音(例如,通過數(shù)字推理方法);來對(duì)具有代表性的語料庫這一整體性概念和有關(guān)代表性的較早范式,例如“檔案”“版本”“經(jīng)典” 和“語料庫語言學(xué)”(corpus linguistics,在與語料庫相關(guān)但又有區(qū)別的意義上)進(jìn)行三邊測(cè)量。于是,一個(gè)“元步驟”(metastep)——在堆棧中要求向更高層級(jí)的軟件應(yīng)用傳送——就成了創(chuàng)建能提高多樣性并促進(jìn)其評(píng)估的工具。這一目標(biāo)的實(shí)現(xiàn)不是通過處理語料庫,而是通過處理它們的采集平臺(tái):數(shù)字存儲(chǔ)庫系統(tǒng)(就像Samvera[samvera.org/])、“數(shù)字資產(chǎn)管理”(DAM)系統(tǒng),以及“內(nèi)容管理系統(tǒng)”(CMS)。例如,讓我們?cè)O(shè)想一下,現(xiàn)在出現(xiàn)在CAMEOECS或TEI P5傳記研究中的與多樣性有關(guān)的元數(shù)據(jù)(例如,“信仰”“語言知識(shí)”“國籍”“性別”“年齡”“社會(huì)經(jīng)濟(jì)情況”“職業(yè)”“教育”)(58)參見TEI P5指導(dǎo)方針(“名稱”)的13.3.2.1部分(“個(gè)人特征”)。改進(jìn)版本可以作為標(biāo)準(zhǔn)化的運(yùn)用輸入機(jī)構(gòu)的存儲(chǔ)庫和以數(shù)據(jù)庫為后盾的DAM和CMS系統(tǒng)中去,從而允許創(chuàng)建一個(gè)由元數(shù)據(jù)分析工具和插件組成的完整的二級(jí)生態(tài)系統(tǒng),以期根據(jù)本身就具有多樣性的篩選機(jī)制(即有關(guān)多樣性的看法)來計(jì)算多樣性的各種方式。之后,這類評(píng)估工具可以采用鏈接數(shù)據(jù)或API方式來補(bǔ)充人文圖像中的缺失元素——例如,通過使用從美國數(shù)字公共圖書館(dp.la/)、歐洲館藏(www.europeana.eu/)或人文基礎(chǔ)設(shè)施網(wǎng)(HuNi [huni.net.au])獲取的材料來自動(dòng)擴(kuò)大語料庫或者網(wǎng)站。

        當(dāng)然,最終我們可能無法獲取一個(gè)具有代表性的語料庫所需的全部材料,無法就代表性的規(guī)范,甚至是分類和組織的基本方案達(dá)成共識(shí),也無法就語料庫需要權(quán)衡或推論的方面達(dá)成一致。然而,僅僅只是發(fā)明更好的方法,用于申報(bào)、跟蹤、測(cè)量、標(biāo)準(zhǔn)化,然后使用基于多樣性的元數(shù)據(jù)的材料,就會(huì)對(duì)實(shí)現(xiàn)所謂“多樣性系統(tǒng)的學(xué)術(shù)版本”(此術(shù)語改編自凱瑟琳·博德的“文學(xué)系統(tǒng)的學(xué)術(shù)版本”[“scholarly editions of a literary system”](59)Bode, Katherine, “The Equivalence of ‘Close’ and ‘Distant’ Reading; or, Toward a New Object for DataRich Literary History”, Modern Language Quarterly, vol. 78, no. 1, (Mar. 2017), pp. 97-102.)這一理想有很大幫助。經(jīng)過適當(dāng)?shù)木庉嫞粋€(gè)語料庫不僅僅能呈現(xiàn)材料的集合,還能讓我們看到它是如何被創(chuàng)造、選擇、平衡、修正,并轉(zhuǎn)換成社會(huì)文化多樣性的代表的操作過程。

        四、數(shù)字人文的時(shí)空體

        從更高的抽象層級(jí)來看,語料庫實(shí)際上代表的是其所覆蓋材料的時(shí)間和空間“世界”(worlds)。因此,我所要求的多樣性堆棧的下一層就是(用巴赫金的術(shù)語來說)改良這些集成世界之后所獲得的“時(shí)空體”(chronotope),尤其需要的是一種具有數(shù)字穿透性和操作性的時(shí)空體。它能夠以不同的方式切割時(shí)間和空間,以預(yù)測(cè)多樣性作為人類經(jīng)驗(yàn)——例如,季節(jié)性農(nóng)民工的經(jīng)驗(yàn)——在時(shí)間間隔和地緣政治領(lǐng)域的另一種分布。(60)有關(guān)“時(shí)空體”,參見巴赫金《對(duì)話想象力》中的“小說中時(shí)間和時(shí)空體的形式”。 Bakhtin, M. M., The Dialogic Imagination: Four Essays, Edited by Michael Holquist, translated by Cary Emerson and Holquist, (U of Texas P, 1981), pp. 84-258。為了簡(jiǎn)單起見,我不考慮這個(gè)問題的另一引人入勝的方面:由語料庫代表的時(shí)空“世界”和機(jī)構(gòu)或組織世界之間的聯(lián)系。后者由檔案館根據(jù)“尊重全宗原則”(respect des fonds)或“按行政機(jī)構(gòu)、組織、個(gè)人或產(chǎn)生記錄的創(chuàng)造機(jī)構(gòu)對(duì)記錄進(jìn)行分組的原則”(J.貝雷 [J. Bailey])。J. 貝雷為數(shù)據(jù)時(shí)代如何“尊重全宗原則”提供了非常精彩的批評(píng)性討論。Bailey, Jefferson, “Disrespect des Fonds: Rethinking Arrangement and Description in Born-Digital Archives”, Archive Journal, (June 2013), web.archive.org/web/20170919162159/http://www.archivejournal.net/essays/ disrespect- des- fonds- rethinking - arrangement-and-description-in-born-digital-archives/.通過類比,我們可以說,就好像話題建模中的“話題”(topic)是一種在一系列文檔中的“術(shù)語概率分布”(61)Blei, David M, “Topic Modeling and Digital Humanities”, Journal of Digital Humanities, vol. 2, no. 1, (Winter 2012), journalofdigitalhumanities.org/2-1/topic-modeling-and-digital-humanities-by-david-m-blei.,多樣性也是一種在歷史、人口、法律、經(jīng)濟(jì)、政府、新聞、文學(xué)及其他數(shù)據(jù)集等時(shí)空體中的“人類概率分布”。這種分布是過去對(duì)時(shí)空的不公正分配所產(chǎn)生的結(jié)果(例如國家領(lǐng)土和簽證期限)。就像在一個(gè)妥善建構(gòu)的話題模型中那樣,為人類多樣性主題進(jìn)行時(shí)空體建模時(shí),我們不應(yīng)該只是加固既有的刻板印象,而是應(yīng)該發(fā)掘那些有關(guān)人們及其代表如何在時(shí)空之中棲居的令人驚訝的事兒。

        當(dāng)然,數(shù)字人文及其相關(guān)領(lǐng)域的很多工作已經(jīng)聚焦于時(shí)空分析。例如,在數(shù)字歷史、文學(xué)研究、地理學(xué)和考古學(xué)領(lǐng)域中的強(qiáng)勢(shì)空間研究分支已經(jīng)使用了諸如制圖、地理信息系統(tǒng)(GIS)、激光雷達(dá)現(xiàn)場(chǎng)測(cè)繪,以及話題建模等方法。(62)主題建模在數(shù)字人文中最新穎的應(yīng)用之一是施密特(Schmidt)將這一方法運(yùn)用于歷史上的捕鯨船日志中的經(jīng)緯坐標(biāo),而不是用于文檔集之中的文字(Schmidt, Benjamin M, “When You Have a MALLET, Everything Looks Like a Nail”, Sapping Attention,[2 Nov. 2012], sappingattention.blogspot.com/2012/11/when-you-have-mallet-everything-looks.html )。由這類數(shù)據(jù)構(gòu)成的主題模式的“主題”是船舶航行的地理路線(雖然施密特指出這些主題模式也可能具有欺騙性)。這種空間研究處理了可被稱之為外部和內(nèi)部的時(shí)空體的二者之一或全部。外部時(shí)空體指的是研究涉及的行為主體、事件或工作的實(shí)際地理范圍,而內(nèi)部時(shí)空體指的是作品內(nèi)部(包括小說)對(duì)地域的指涉和表述,相當(dāng)于《歐洲文學(xué)地圖集》所說的“小說地理”(“geography of fiction”)(63)“Mapping and Analysing the Geography of Fiction with Interactive Tools” A Literary Atlas of Europe, (2019), www.literaturatlas.eu/en/.,以及伊麗莎白·F·伊萬斯(64)Evans, Elizabeth F., and Matthew Wilkens, “Nation, Ethnicity, and the Geography of British Fiction, 1880-1940”, Journal of Cultural Analytics, (13 July 2018), doi:10.22148/16.024.和馬修·威爾肯斯(Matthew Wilkens)所說的“文學(xué)地理想象”(the literary-geographic imagination)。在時(shí)間研究方面,數(shù)字人文同樣做出了廣泛的、跨學(xué)科的努力,嘗試改變?cè)谌宋难芯款I(lǐng)域可能具有典范性的“時(shí)間窗口”(time window)。傳統(tǒng)上,日、月、年或幾十年,都是研究文化現(xiàn)象的時(shí)間間距。但是,回到費(fèi)南德·布魯?shù)聽査f的《漫長(zhǎng)歲月》(65)Braudel, Fernand, “History and the Social Sciences: The Longue Durée”, On History, translated by Sarah Matthews, (U of Chicago P, 1980), pp. 25-54.,計(jì)算機(jī)遠(yuǎn)讀將時(shí)間窗口開得更寬。在這方面,具有代表性的文學(xué)歷史研究包括安德爾·哥德斯通和泰德·安德伍德的《文學(xué)研究的悄然轉(zhuǎn)變》(66)Goldstone, Andrew, and Ted Underwood, “The Quiet Transformations of Literary Studies: What Thirteen Thousand Scholars Could Tell Us”, New Literary History, vol. 45, no. 3, (2014), pp. 359-84.,以及泰德·安德伍德和喬丹·賽勒斯的《文學(xué)聲望的長(zhǎng)時(shí)段》(67)Underwood, Ted, and Jordan Sellers, “The Longue Durée of Literary Prestige”, Modern Language Quarterly, vol. 77, no. 3, (Sept. 2016), pp. 321-44, doi:10.1215/00-267-929-3570634.。在歷史學(xué)科中,同樣地,喬·戈蒂曾經(jīng)呼吁使用數(shù)字人文方法來重新強(qiáng)調(diào)“長(zhǎng)時(shí)段”(68)Guldi, Jo, “Time Wars of the Twentieth Century and the Twenty- First Century Toolkit: The History and Politics of Longue- Durée Thinking as a Prelude to the Digital Analysis of the Past”, Between Humanitiesand the Digital, edited by Patrik Svensson and David Theo Goldberg, (MIT Press, 2015), pp. 253-65.Guldi, Jo, and David Armitage, The History Manifesto, (Cambridge UP, 2014).。與此同時(shí),數(shù)字人文的媒體考古學(xué)和電子文獻(xiàn)認(rèn)知將時(shí)間窗口縮小到伍爾夫甘·恩斯特所謂的計(jì)算機(jī)“微時(shí)空水平”(microtemporal level)(69)Ernst, Wolfgang, “Archives in Transition: Dynamic Media Memories”, Digital Memory and the Archive, edited by Jussi Parikka, (U of Minnesota P, 2012), p. 97.的規(guī)模。例如,杰西卡·普拉斯曼,馬克·C·麥里諾(Mark C. Marino)和杰瑞密·道格拉斯(Jeremy Douglass)的《閱讀項(xiàng)目:威廉·龐德斯通的〈測(cè)速儀項(xiàng)目〉合作分析{無底洞}》對(duì)一部電子文學(xué)作品做出了令人矚目的閱讀,在毫秒級(jí)的水平對(duì)代碼事件進(jìn)行了深入發(fā)掘。(70)Pressman, Jessica, et al. Reading Project: A Collaborative Analysis of William Poundstone’s Project for Tachistoscope {Bottomless Pit}. (U of Iowa P, 2015), pp. 39-40, 128.

        然而,盡管數(shù)字人文領(lǐng)域已經(jīng)有這樣基于時(shí)空的研究,該領(lǐng)域的各個(gè)學(xué)科分支還沒有合作起來,并沒有向不是專門采用時(shí)空研究方法的學(xué)者就如何描述、編輯和分析如下概念提供共同的建議:世界(以及世界體系)、國家、地方、時(shí)期、時(shí)代、潮流、運(yùn)動(dòng)、世代、人生,以及事件。因此,很多數(shù)字人文項(xiàng)目對(duì)空間和時(shí)間的塑造整體上是基于“英國”或“美國”的“19世紀(jì)”或“20世紀(jì)”作品的。或者說,他們只是接受一些語料庫所劃定的范圍并將其作為時(shí)空研究的資料。例如,早期英語書籍在線(EEBO)、18世紀(jì)文集在線(ECCO),或者HathiTrust數(shù)字圖書館——至多只是通過簡(jiǎn)單的空間分析(例如,根據(jù)出版地或?qū)ψ髌分兴峒暗牡攸c(diǎn)所做的地理標(biāo)簽)或時(shí)間分割(例如,將一個(gè)語料庫按時(shí)代來劃分)的方法來調(diào)整這種語料庫的時(shí)空參數(shù)。上面提到的許多更細(xì)微的時(shí)空研究就這樣被束之高閣了,還有目前在如下領(lǐng)域更為前沿的研究也是如此:事件建模(例如,卡爾·格羅斯諾的論文“地形時(shí)間”(71)Grossner, Karl, “Topotime: Qualitative Reasoning for Historical Time”, Kgeographer, (29 July 2013), kgeographer.com/topotime-qualitative-reasoning-for-historical-time.和“事件中心”(72)Grossner, Karl, “Event Centrality”, Kgeographer, (9 July 2016), kgeographer.com/event-centrality/.)、縱向話題建模(例如,布雷和拉菲提(73)Blei, David M., and John D. Lafferty, “Dynamic Topic Models”, Proceedings of the Twenty-Third International Conference on Machine Learning, ACM, (2006), pp. 113-20. ACM Digital Library, doi: 10 .1145/1143844 .1143859.;王和麥克考倫(74)Wang, Xuerui, and Andrew McCallum, “Topics over Time: A Non-Markov Continuous-Time Model of Topical Trends”, Proceedings of the Twelfth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, ACM, (2006), pp. 424-33. ACM Digital Library, doi:10.1145/1150402.1150450.,王等(75)Wang, Chong, et al, “Continuous Time Dynamic Topic Models”, ArXiv.org, (13 June 2012), arxiv.org/abs/1206.3298.),以及高級(jí)的時(shí)間線視覺化(例如,克羅伊特里(76)Kr?utli, Florian, Visualising Cultural Data: Exploring Digital Collections through Timeline Visualisations, (2016). Royal College of Art, PhD dissertation, Florian Kr?utli, www.kraeutli.com/index.php/2016/04/15/visualising-cultural-data.)。

        這對(duì)多樣性的工作很重要,因?yàn)榭臻g和時(shí)間“如其所是”的整體形式在歷史上正是被排斥在多樣性的獲取之外的。任何一種數(shù)字人文研究工作都需要這一領(lǐng)域,以及其他時(shí)空研究方面的專家的集合,而對(duì)于和多樣性相關(guān)的研究來說則尤其如此。這種集合能創(chuàng)造一系列的協(xié)議、數(shù)據(jù)文件模板、腳本,以及范例。這種范例受先進(jìn)的時(shí)空研究的啟發(fā),專為非時(shí)空研究專家的普通數(shù)字人文學(xué)者設(shè)計(jì),幫助這些學(xué)者在大的整體時(shí)空之下,揭示研究的斷層和改變研究的形式,以便歡迎不同的文化進(jìn)入我們的時(shí)空共同體。我們需要一個(gè)有關(guān)標(biāo)準(zhǔn)的建議。換言之,這個(gè)建議需要從根本上聲明:為了讓你的項(xiàng)目在時(shí)空層面具有意義,并且對(duì)人們?nèi)绾螚佑跁r(shí)空之中的理解保持開放,這是你至少要做的四件事。再次重申,“可擴(kuò)展的標(biāo)準(zhǔn)”(extensible standards)這個(gè)概念仍然適用,因?yàn)椴煌?guī)模和種類的時(shí)空描述或時(shí)空分析只能適用于不同的研究材料。然而,核心的思想仍然是:數(shù)字人文將會(huì)形成一種對(duì)如何發(fā)掘一個(gè)語料庫中的時(shí)空信息的共識(shí);利用地理志、檔案文獻(xiàn)和傳記資料對(duì)這些信息進(jìn)行規(guī)范化處理;使用機(jī)器學(xué)習(xí)工具推斷額外的信息;并對(duì)基于上述步驟建立的時(shí)空體進(jìn)行建模和轉(zhuǎn)換。

        這就是如何從一開始就將時(shí)空體重新想象為可以容納多樣性的時(shí)間和空間的整體,而不是在事后追溯,或只將其置于邊緣位置。無論是就其對(duì)數(shù)字人文方法的創(chuàng)新性融合,還是聚焦于多樣性時(shí)空體而言,詹姆斯·李(James Lee)、布萊尼·格萊特曼(Blaine Greteman)、杰森·李(Jason Lee)和大衛(wèi)·艾琪曼(David Eichmann)發(fā)表于2018年的論文可稱為典范。這篇題為《關(guān)聯(lián)性閱讀:數(shù)字歷史主義和有關(guān)莎士比亞〈奧賽羅〉的早期現(xiàn)代種族論述》(77)Lee, James Jaehoon, et al, “Linked Reading: Digital Historicism and Early Modern Discourses of Race around Shakespeare’s Othello”, Journal of Cultural Analytics, (25 Jan. 2018), doi:10.22148/16.018.的論文報(bào)告了一些項(xiàng)目。這些項(xiàng)目“將主題模型和矢量空間模型嵌入歷史書籍的網(wǎng)絡(luò)中去……以探索提到摩爾人的文本中與種族相關(guān)的語言,以及由生產(chǎn)這些文本的書商、印刷者和出版者構(gòu)成的復(fù)雜網(wǎng)絡(luò)”。特別需要指出的是,這篇論文將早期種族多樣性作為對(duì)差異性的地理想象來考察,指出“在莎士比亞時(shí)代對(duì)種族的另類定義中,相對(duì)于那些更容易被識(shí)別的因素,比如膚色和人體構(gòu)造,地理和空間變量有著至少是同等的重要性”。

        五、身份的數(shù)字人文理論

        我將和多樣性思想有關(guān)的、可能是最高級(jí)別的抽象層放置在我所建議的多樣性堆棧的頂端。這一抽象層不是布拉登的世界堆棧中所謂的“用戶”(User),而是當(dāng)今人文學(xué)科就身份(identity)問題所做出的深度考慮。利用多語言和多媒體的材料,以及他們所建構(gòu)的人文學(xué)的時(shí)空觀念,數(shù)字人文學(xué)者現(xiàn)在擁有了為我們這個(gè)數(shù)據(jù)科學(xué)時(shí)代更新有關(guān)多樣性身份知識(shí)的機(jī)會(huì)。在1900年巴黎世界博覽會(huì)上的美國黑人展覽中(the American Negro Exhibit),W·E·杜·波依斯(W. E. B. Du Bois)和他在亞特蘭大大學(xué)的團(tuán)隊(duì)曾展示過這種多樣性身份。通過63種視覺數(shù)據(jù),他們報(bào)告了黑人群體的情況(這一報(bào)告最近在配有精美插圖的W·E·杜·波依斯的《資料圖譜:視覺化美國黑人——20世紀(jì)初的膚色線》[由懷特尼·柏特-柏皮提斯特{Whitney Battle-Baptiste}和布里特·魯斯特{Britt Rusert}編輯]中再版(78)Du Bois, W. E. B., W. E. B. Du Bois’s Data Portraits: Visualizing Black America—The Color Line at the Turn of the Twentieth Century. Edited by Whitney Battle- Baptiste and Britt Rusert, W. E. B. Du Bois Center at the University of Massachusetts Amherst / Princeton Architectural Press, (2018).)。借助新的資料集、分析方法和視覺化手段,現(xiàn)在數(shù)字人文可以繼續(xù)這類研究,為多樣性問題揭曉更多的答案,以及,同樣重要的是,為其提供新的研究框架。據(jù)推測(cè),數(shù)字人文學(xué)科或許還可以貢獻(xiàn)出有關(guān)多元身份的數(shù)字人文理論。

        在說到“揭曉更多的答案”的時(shí)候,我指的是,數(shù)字人文正在探索的低層級(jí)的多語言、多媒體資料和時(shí)空研究將會(huì)產(chǎn)生一些新的資料和數(shù)據(jù),幫助我們以各種方式確認(rèn)、調(diào)整、擴(kuò)展或修正學(xué)者有關(guān)過去和現(xiàn)在的多元文化身份的認(rèn)識(shí)。(79)瑞賽(Risam)調(diào)查了一些數(shù)字人文的項(xiàng)目,這些項(xiàng)目為多樣性提供了“如何通過交叉性視角來研究數(shù)字人文的模式”。這些層級(jí)(作為對(duì)杜·波依斯的“膚色線”[color-line]的即興發(fā)揮)(80)在《黑人的靈魂》(1903)中,杜·波依斯寫道:“20世紀(jì)的問題是膚色線的問題”。Du Bois, W. E. B. The Souls of Black Folk. Edited by Brent Hayes Edwards, (Oxford UP, 2007), p.3.,將會(huì)用實(shí)際數(shù)據(jù)為1990年代文學(xué)選集的封面經(jīng)常使用的“馬賽克” “萬花筒”和“拼貼畫”填補(bǔ)色彩。當(dāng)時(shí),這些形式就被用來象征多元文化主義。(81)在那個(gè)時(shí)代,封面上有類似馬賽克、萬花筒或拼布被子圖像的文學(xué)“讀本”包括Rico, Barbara Roche, and Sandra Mano, editors, American Mosaic: Multicultural Readings in Context, (Hough ton Mifflin, 1991). Walker, Scott, editor, Stories from the American Mosaic. (Graywolf Press, 1990). Perkins, Barbara, and George B. Perkins, editors, Kaleidoscope: Stories of the American Experience. (Oxford UP, 1993).

        在說到“提供新的研究框架”的時(shí)候,我指的是數(shù)字人文能為人文學(xué)研究做出的獨(dú)特甚至很有可能是最獨(dú)特的貢獻(xiàn):成為負(fù)載數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的理念的渠道,幫助我們重新思考“膚色線”,以及線、邊界,或者身份的位置等概念。

        例如,從數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的角度來思考我所概括的多樣性堆棧,在每個(gè)層級(jí)上都需要依賴在高維數(shù)學(xué)空間中運(yùn)行的算法。這些都是概念性的空間。在這些空間內(nèi),由成百上千甚至更多維度組成的文檔集會(huì)測(cè)算術(shù)語使用的頻率及其他屬性。在它們的相互關(guān)系中,這些維度會(huì)允許我們對(duì)其模式進(jìn)行統(tǒng)計(jì)識(shí)別——例如,哪些詞匯或文檔更傾向于同時(shí)出現(xiàn),哪些更“像”其他詞匯或與其他詞匯聚合在一起,等等此類。在前文中,我曾提及人工智能機(jī)器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)。在數(shù)字人文領(lǐng)域引發(fā)極大興趣的“詞向量”(word embedding)是人工智能在研究高維語言空間方面的一種運(yùn)用。它使用所謂的淺層神經(jīng)網(wǎng)絡(luò)將詞與詞之間的語義關(guān)系建模為“矢量”,在數(shù)字空間中根據(jù)詞匯之間的相對(duì)關(guān)系進(jìn)行定位和導(dǎo)向,使那些在語義上作用相當(dāng)?shù)脑~能彼此接近。(82)有關(guān)詞匯嵌入的解釋,見Schmidt, Benjamin M, “Vector Space Models for the Digital Humanities.” Ben’s Bookworm Blog, (25 Oct. 2015), bookworm.benschmidt.org/posts/2015-10-25-Word-Embeddings.html.例如,詹姆斯·李和他的合作者們?cè)鴮⒃~向量(“矢量空間模型”)作為他們所使用的研究方法之一。他們的論文中有一張?jiān)~匯在矢量空間中的圖表。該圖表展現(xiàn)了EEBO在1500年到1623年間的詞向量模型,闡釋了“膚色”(complexion)如何定義“一種被體貌、體格、憂郁氣質(zhì)、脾氣,以及當(dāng)?shù)氐臍夂蛩{(diào)配的表現(xiàn)形式,而遠(yuǎn)遠(yuǎn)不只是不可改變的基因類型”(圖2)。(83)李(Lee)和他的合作者們用于創(chuàng)建主題模式和詞向量的總語料庫包括“來自25363個(gè)文本的文檔,早期英語書籍在線(EEBO)/文本創(chuàng)造合作關(guān)系第一階段語料庫,以及,特別是……EEBO語料庫中提到‘Moor’這個(gè)單詞的所有變體的14708個(gè)段落(它們來自3147個(gè)文本),包括莎士比亞的戲劇和奧賽羅的版本”。然后,他們根據(jù)不同的分析目的將語料庫分割成不同的時(shí)間范圍?!笆聦?shí)上,”作者補(bǔ)充說,“與‘blacke moore’匹配出現(xiàn)的是‘行為’(behavior),而不是和身體或膚色有關(guān)的詞匯?!?/p>

        圖2 詹姆斯·李等:詞向量圖知識(shí)共享版權(quán)歸屬4.0國際許可證https://creativecommons.org/licenses/by/4.0

        這個(gè)例子說明,“詞向量”模型具有不可思議的能力,能揭露社會(huì)上帶有歧視的表達(dá)背后的文化邏輯。用來解釋“詞向量”的標(biāo)準(zhǔn)例子是由計(jì)算機(jī)生成的—— “國王之于皇后,正如男人之于什么”這個(gè)問題的答案。基于規(guī)范的英語文檔,計(jì)算機(jī)建議的答案是高緯度語義空間中的一個(gè)區(qū)域,其中最接近的詞是“女人”。當(dāng)然,這是一個(gè)顯而易見的問題,不需要計(jì)算機(jī)來解決。然而,在社會(huì)話語體系中,有很多不明顯或者有爭(zhēng)議的語義邏輯,讀起來就像是心理分析,觸及那些令多樣性成為尖銳問題的偏見。數(shù)字人文要想擺脫舊式的“大帳篷”模式,轉(zhuǎn)而采用現(xiàn)代的多樣性方法,就需要解釋——是的,也需要?jiǎng)?chuàng)造比喻——高緯度的數(shù)學(xué)空間。這樣的空間,以及它所跨越的大數(shù)據(jù)和互聯(lián)網(wǎng)的所有領(lǐng)域,就是新的“大帳篷”。

        模擬空間中的物理線和社會(huì)中的膚色線,不是連接就是分割,不是溝通就是隔絕。而與它們都不同,數(shù)據(jù)線(矢量)在這樣的數(shù)字人文空間中成為可見的,因此有關(guān)身份和多樣性的潛在的新概念是天生存在的。而且,數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)通過大量的差分(differencing)和與之對(duì)等的查找相似性的方法,在高維空間中分析事物與事物之間的關(guān)系——例如,術(shù)語頻率-逆文檔頻率(TF-IDF)、余弦相似性、主成分分析(PCA)、分層和分區(qū)聚類(30)關(guān)于這種類型的類聚,參見萊克斯米克斯(Lexomics)研究組對(duì)“類聚分析”的指導(dǎo)?!癈lusterAnalysis”,IntheMargins,byScottKleinmanetal.,version35,(19Aug.2016),scalar.usc.edu/works/lexos/cluster-analysis?path=topics.、主題建模、詞向量和社會(huì)網(wǎng)絡(luò)分析(包括對(duì)后者的向心性、等級(jí)、距離、中間性等的度量)。雖然為了能使人類理解這一切,高維的方法必然也是“降維”的方法,但這種降維是根據(jù)幕后的各種變換的可能性而制定的,提示了新穎或不確定的思考身份的方式。

        總而言之,有一整套適用于交叉性、接觸區(qū)和其他理念的身份理論,可以啟發(fā)我們重新提出與多樣性有關(guān)的問題。例如:你和我一樣嗎?這一百萬份由你所在的團(tuán)體制作,或有關(guān)你所在的團(tuán)體的文件,是否能代表我所在的團(tuán)體?或者,甚至于,有沒有不同又相似的方法能讓我們同時(shí)保持差異性和相關(guān)性?如果說身份作為堆棧的最高層級(jí),是我之前稱之為“分層涌現(xiàn)”(“l(fā)ayered emergence”)的結(jié)果,那么,至少在概念層面,我們需要理解將其從堆棧較低層提升上來的差異性和相似性的規(guī)律。只有這樣,身份才會(huì)是像我所說的那樣,“不是確定的或可以預(yù)測(cè)的,并且可以變好也可以變壞?!睌?shù)字人文的技術(shù)目標(biāo)是挖掘差異性和相似性的規(guī)律,以探索那些會(huì)影響我們對(duì)身份思考的而又出乎意料的結(jié)構(gòu)、趨勢(shì)和關(guān)聯(lián)。它的核心目標(biāo)則是幫助人文學(xué)科追求更好,而不是更壞的可能性。

        畢竟,現(xiàn)在各大企業(yè)的網(wǎng)絡(luò)媒體都在使用大數(shù)據(jù)算法來審視相似性和差異性(例如,他們的用戶“喜歡”什么)。他們這么做是因?yàn)樗麄兿胍莆杖藗兊纳矸?,匯總到他們的資料中去。與此同時(shí),一些政府也在審視和相似性及差異性有關(guān)的數(shù)據(jù)(例如,在邊境上),用來建構(gòu)他們版本的檔案化的身份,然后用來否定而不是維護(hù)這些身份。當(dāng)代對(duì)于差異性和相似性的尋求具有可觀的力量,數(shù)字人文應(yīng)該對(duì)此進(jìn)行理論化并善加利用,將其作為自身研究平臺(tái)的一部分——也就是說,不僅僅是審視,同時(shí)也是理解和想象——一個(gè)超越了“大帳篷”的、具有更豐富的人性、更多元化的未來。

        猜你喜歡
        堆棧人文數(shù)字
        人文
        答數(shù)字
        嵌入式軟件堆棧溢出的動(dòng)態(tài)檢測(cè)方案設(shè)計(jì)*
        基于堆棧自編碼降維的武器裝備體系效能預(yù)測(cè)
        人文紹興
        中國三峽(2017年3期)2017-06-09 08:14:59
        數(shù)字看G20
        人文社科
        全國新書目(2016年5期)2016-06-08 08:54:10
        讓人文光輝照耀未來
        成雙成對(duì)
        一種用于分析MCS-51目標(biāo)碼堆棧深度的方法
        亚洲国产天堂久久综合网| 香蕉视频免费在线| 又湿又黄裸乳漫画无遮挡网站 | 亚洲国产综合精品中文| 精品人妻码一区二区三区剧情| 久久久国产精品免费a片3d| 特黄aa级毛片免费视频播放| 日韩人妻系列在线视频| 亚洲国产精品国自产拍性色| 天堂网在线最新版www| 欧美日韩人妻| 午夜国产小视频在线观看黄| 久久综合精品人妻一区二区三区 | 中文人妻av大区中文不卡| 亚洲第一女人的天堂av| 国产精品免费_区二区三区观看| 免费一级特黄欧美大片久久网| 网红极品女神精品视频在线| 青青草在线这里只有精品| 国自产精品手机在线观看视频| 亚洲影院丰满少妇中文字幕无码| 中文字幕中乱码一区无线精品| 国产激情视频免费在线观看| av在线亚洲欧洲日产一区二区| 中文字幕精品久久天堂一区| 日本人妻高清免费v片| 欧美肥婆性猛交xxxx| 久久久久久久无码高潮| 国产一级片内射在线视频| av免费在线播放视频| 国产成人无码免费视频在线 | 少妇被粗大猛进进出出男女片| 97碰碰碰人妻无码视频| 国产成人精品日本亚洲18| 91久久精品一区二区喷水喷白浆| 国产亚洲自拍日本亚洲| 看全色黄大色大片免费久久| 亚洲一区区| 日本午夜精品一区二区三区| 亚洲综合色区另类av| 亚洲色偷拍一区二区三区 |