李天 耿旭樸
摘要:新文科概念的提出,肯定并強化了數(shù)字人文方法對文學研究的可行性。文章從三個方面對數(shù)字人文方法進行反思:一是從數(shù)字人文與人文計算的區(qū)別出發(fā),闡釋數(shù)字人文方法在文學研究中的獨特性;二是在對數(shù)字人文方法的客觀性提出質(zhì)疑的同時,重審數(shù)字人文方法的研究對象;三是在國內(nèi)文學發(fā)展新現(xiàn)象的語境下,探討方法原創(chuàng)的可能性。
關(guān)鍵詞:數(shù)字人文;新文科;方法論;人文計算
中圖分類號:G644 文獻標識碼:A 文章編號:1004-9436(2022)05-000-05
“融通”是新文科的首要特征。新文科是指對傳統(tǒng)文科進行學科重組、文理交叉,即把新技術(shù)融入哲學、文學、語言等課程,為學生提供綜合性的跨學科學習。新文科的概念是針對傳統(tǒng)的學科分類來說的,它打破了人文與科學之間的界限,其特征主要體現(xiàn)在多學科協(xié)同、融入信息技術(shù)以及變革人才培養(yǎng)模式等方面。新文科的“融通”是學科之間的交叉通融,但與此同時,不能遮蔽“文”的本質(zhì);文理交匯后,必須更加重視和凸顯“文”的特質(zhì)[1]。
基于計算機技術(shù)的數(shù)字人文具有典型的新文科特征,值得注意的是,新文科之“新”,不僅代表研究方法的革新,更在于新理念中蘊藏著的研究方法的原創(chuàng)可能性,即在數(shù)字人文的語境下,生成自己的新方法。對文學研究者來說,一方面,目前的數(shù)字人文方法主要來源于英美文學研究學者;另一方面,媒介技術(shù)的變革與網(wǎng)絡文學的發(fā)展,促成了獨具中國特色的新的文學現(xiàn)象,并且它們與數(shù)字人文具有契合性,使得中國文學具有方法原創(chuàng)的可能性。
結(jié)合新文科背景,文章系統(tǒng)地考察了國內(nèi)外文學研究中數(shù)字人文方法的理論與實踐,主要基于以下三點:其一,數(shù)字人文并不是簡單的量化方法,也并非人文計算的某個階段,它是一種真正的跨學科研究方法;其二,數(shù)字人文并不能保證研究的客觀性,它的積極意義也不在于此;其三,數(shù)字人文方法與傳統(tǒng)文學研究方法的研究對象有根本區(qū)別,這建構(gòu)了數(shù)字人文的獨特性。
1 作為文學研究方法的數(shù)字人文
數(shù)字人文通常被認為是人文計算發(fā)展的最新階段[2],然而,從方法論的意義上來說,數(shù)字人文與人文計算并不是一回事,雖然都以量化為起點,但量化所起的作用卻是截然不同的。
1.1 風格辨析與人文計算
人文計算的先驅(qū)是19世紀的科學家托馬斯·門登霍爾(Thomas Mendenhall)和文學教授盧修斯·謝爾曼(Lucius Sherman),他們采用人工計算的方式,將科學方法帶入文學研究領(lǐng)域,通過人工方式計算文學文本中特定單詞的頻率(詞頻),據(jù)此制作圖形化的曲線,以區(qū)分不同作者或觀察文學的發(fā)展變化。19世紀中晚期是數(shù)據(jù)方法運用在文學領(lǐng)域中的第一個高峰,日后計算機的出現(xiàn)大大提升了數(shù)據(jù)的量值和準確度,但基本上沿襲了這些開拓者的思路。
計算機的介入使得人文計算的概念開始形成,學界普遍認為人文計算出現(xiàn)在20世紀中葉,其標志是意大利神父羅伯托·布薩(Roberto Busa)的風格辨析研究。從1949年開始,布薩使用計算機對神學家托馬斯·阿奎那(Thomas Aquinas)的《神學大全》全集進行處理,生成了中世紀拉丁文字詞的索引,研究者可以據(jù)此對其的風格進行辨析,判定作品的著作權(quán)。布薩可以說是早期人文計算的代表,與19世紀的人工計算相比,人文計算離不開計算機的輔助,通過計算機對文學文本進行處理。
在文學研究中,人文計算最典型的類型是風格辨析。早期的風格辨析集中于作者風格,即對某部作品的著作權(quán)進行判斷。奧古斯都·摩根(Augustus de Morgan)在1851年就提出了詞匯表的量化研究可以作為辨析保羅書信作者的方法。如前所述,門登霍爾和謝爾曼是19世紀中期將量化方法應用在文學領(lǐng)域的代表人物,他們研究單詞長度與句子長度,將之作為一種確定文學風格的方法,門登霍爾試圖通過詞頻辨析狄更斯和威廉·薩克雷的風格差異,謝爾曼則通過文學作品中句子長度的不同觀察英國文學風格的變化[2]。
中國文學對人文計算方法的采用,始于對《紅樓夢》的著作權(quán)辨析,并于19世紀80年代形成第一個高峰,這個時期出現(xiàn)了一批用量化方法分析《紅樓夢》的研究文章,如華東師范大學陳大康[3]和復旦大學李賢平[4]等人的成果。此后,用統(tǒng)計進行《紅樓夢》作者研究的方法一直沿用至今。
1.2 大數(shù)據(jù)與數(shù)字人文
數(shù)字人文概念的興起與文學大數(shù)據(jù)直接相關(guān)。21世紀以來,互聯(lián)網(wǎng)的發(fā)展、計算與存儲能力的飛升催生了大數(shù)據(jù),與以前的數(shù)據(jù)庫相比,數(shù)字人文概念下的文學數(shù)據(jù)不僅數(shù)量巨大,而且出現(xiàn)了相應的大數(shù)據(jù)分析工具,谷歌圖書和古騰堡工程是文學大數(shù)據(jù)的典型代表。
基于文學大數(shù)據(jù),數(shù)字人文的方法真正得到應用,“文化組學”和斯坦福文學實驗室的工作是數(shù)字人文頗有代表性的成果。2011年,艾略茲·利波曼·埃頓(Erez Lieberman Aiden)和簡-拜普提斯特·邁克爾(Jean-Baptiste Michel)等提出了“文化組學”的概念,認為單詞像基因一樣包含可繼承的信息[5]。2007年,弗朗哥·莫萊蒂(Franco Moretti)用圖表的形式勾勒出了從18到19世紀英法意西日等國的小說在數(shù)量和題材上的變化[6]。2010年,斯坦福文學實驗室創(chuàng)立,以小冊子是形式發(fā)表了一系列數(shù)字人文的研究成果,他們的研究不僅多元化,并且開發(fā)了多個文學大數(shù)據(jù)分析工具。
到了數(shù)字人文階段,風格辨析仍然是重要的研究領(lǐng)域,與人文計算的辨析方法不同,斯坦福文學實驗室開發(fā)了DocuScope等工具進行類型風格識別,取得了令人矚目的成果。他們使用DocuScope對莎士比亞的戲劇進行類型分組,其結(jié)論不僅與傳統(tǒng)的類型分組一致,而且還能自動選擇出被批評家們視為例外的文本(如《亨利三世》)。不僅如此,DocuScope還可以準確地區(qū)分出工業(yè)小說、哥特式小說和教育小說等類型風格。06781BA0-0821-4532-9259-C02AC285977A
而最能體現(xiàn)大數(shù)據(jù)方法的是“遠距離閱讀”與“大分析”。“遠距離”的意義在于挖掘經(jīng)典之外的海量文本的價值,其與文本細讀結(jié)合,能產(chǎn)生更自由、開放的探索。莫萊蒂結(jié)合歷史、地理與進化理論,提供了兩百多年來多個國家的新文學史樣態(tài),其中既有文本細讀(微觀),也有抽象模型(宏觀)的建立。
2 證實與闡釋:數(shù)字人文方法是否客觀
數(shù)字人文方法與傳統(tǒng)文學研究方法的差異,通常被表述為證實性與闡釋性的不同,“遠距離”與“近距離”的不同,定量與定性的不同等。其本質(zhì)在于對客觀性的追求。
從方法本身來說,數(shù)字人文通常涉及數(shù)據(jù)采集與整理、模型建立、結(jié)論分析等過程,它們追求的是一個共同的目標:客觀性。風格辨析在于為作者風格或類型風格提供客觀的證據(jù),“遠距離”與“大分析”方法在于“追求一個更為理性的文學史”。通常,數(shù)字人文方法的客觀性被表述為證實性(Verifiable),其與傳統(tǒng)研究方法的闡釋性(Interpretive)對立。后者往往被認為是文學研究的本質(zhì),它根植于個體研究者對具體文本的閱讀,依據(jù)研究者自身的理論框架得出相應的結(jié)論,如對文學現(xiàn)象的闡釋以及對現(xiàn)象背后原因的挖掘等。
在數(shù)字人文的研究者看來,闡釋的缺陷在于它的主觀性,闡釋是“靠觀察來激發(fā)的,作為一種收集證據(jù)的方法,不管科學的還是人文的,觀察都是有缺陷的”[7]。這里的觀察是指研究者的主觀視角與判斷,基于觀察的闡釋具有軼事的(Anecdotal)及推斷的(Speculative)特征,也因此遠離了客觀性,甚至在某種程度上削弱了學術(shù)研究的科學性。而數(shù)字人文方法因為減少了人為的參與,以數(shù)據(jù)調(diào)查代替?zhèn)€人觀察,提供確定的文學史事實。另一方面,客觀性與樣本數(shù)量往往成正比,大數(shù)據(jù)所達到的樣本數(shù)量可以使調(diào)查達到一定程度的廣泛性,數(shù)據(jù)量越大,可靠性就越高,大數(shù)據(jù)的廣泛性取代了以往隨機的代表性樣本,最大限度地保證了調(diào)查的客觀性。研究者通常將闡釋性與定性、主觀、文學相關(guān)聯(lián),而將數(shù)字人文的證實性與定量、客觀、科學相關(guān)聯(lián),并將證實性與闡釋性對立起來,認為二者之間存在本質(zhì)差異。
那么,數(shù)字人文中的證實性能否保證絕對的客觀性?是否與闡釋性對立?在數(shù)字人文的證實中,最基礎(chǔ)的是對既定知識的證實或者糾正。以喬克斯對查爾斯·范寧(Charles Fanning)的研究結(jié)果的驗證為例,范寧認為愛爾蘭裔美國作家在1900—1930年間經(jīng)歷過“失去的一代”,即在這段時間內(nèi)作家匱乏。而喬克斯通過大數(shù)據(jù)分析,發(fā)現(xiàn)“失去的一代”的論點不成立,或者說是一種錯覺,這是因為范寧以愛爾蘭裔美國作家的經(jīng)典作品為研究對象,這些作品的作者大部分為男性,而1900—1930年代男性作者的缺乏讓研究者產(chǎn)生了“失去的一代”的錯覺。喬克斯的大數(shù)據(jù)包括250年間所有的出版數(shù)據(jù),以及作品的地理環(huán)境和作者的性別、出生地、年齡和居住地等信息,發(fā)現(xiàn)1900—1930年這段時間并不缺少女性作家。在喬克斯看來,以經(jīng)典作品作為研究對象的方法,忽視了更為廣泛的文學體系,容易對文學史現(xiàn)象產(chǎn)生誤判[8]。重審數(shù)字人文的客觀性不難看出,證實性/客觀性來自兩個方面:其一,數(shù)據(jù);其二,統(tǒng)計方法。這兩點看上去都成功避免了人為的干預,能保證研究結(jié)論的客觀性。但其實不僅數(shù)據(jù)本身很難保證絕對的客觀性,統(tǒng)計方法本身的適用性也需要考量。
2.1 數(shù)據(jù)的闡釋性
在數(shù)字人文方法中,數(shù)據(jù)是客觀性的重要保證,數(shù)據(jù)被認為獨立于觀察者之外,具有確定性。然而,目前的數(shù)據(jù)庫建設(shè)與利用并不能遠離研究者個人的主觀闡釋。不同于公開的大型全本數(shù)據(jù)庫,那些為文學研究創(chuàng)建的主題性數(shù)據(jù)庫都存在研究者的主觀預設(shè),如英國小說類型(1740—1900年)的主題數(shù)據(jù)庫,莫萊蒂表示該數(shù)據(jù)庫對小說的分期標準建立在他個人對英國小說史的理解之上,也就是說該數(shù)據(jù)庫的創(chuàng)建本身存在選擇性,包含著研究者個人的闡釋,不可能達到完全的客觀。在科學研究中,客觀性的重要標準之一在于可重復性,換句話說,如果數(shù)據(jù)庫足夠客觀,那么其他的研究者就可以從被引用的這些資源中重建原始數(shù)據(jù)庫。但無論是莫萊蒂還是喬克斯,都承認這是不可能的,就算喬克斯列出了他所分析的標題和作者,其他人也不可能在完全不接觸他所使用的文本的情況下重建他的論點。
目前大部分主題數(shù)據(jù)庫對文獻外部數(shù)據(jù)的采集,一般會采納文獻的首次出版信息及出版所在地等。然而嚴格說來,只采集書籍第一次出版的數(shù)據(jù)是片面的,文學作品的版本并不單一,有些書籍空有標題卻從未出版過,有些文學作品被重版多次,而作品的其他內(nèi)部信息,如作者、出版者、編輯、插圖、書商、廣告者等卻被選擇性忽視了。另一方面,根據(jù)18世紀之后的全球化趨勢,僅從國別表明文學作品的地理性太過單薄。選擇性數(shù)據(jù)庫建立的文學體系忽視了文學作品之間的不同以及體系的動態(tài)變化。這些闡釋性的選擇造成了文學體系的不充分性,往往只是在一定時間和空間中流通的文學的子集,無法達到大數(shù)據(jù)所要求的全本和整體的概念。正因為數(shù)據(jù)的主觀性,大衛(wèi)·布魯爾認為,“遠距離”方法雖解析了“伴隨而來的那些經(jīng)典化過程”[9],卻以忽視歷史上文學作品的不同面向為代價。數(shù)字人文方法的認同者們一方面贊成使用數(shù)據(jù),另一方面也承認這種知識的新形式無可避免地會抽象或簡化原本復雜的文學現(xiàn)象,以至于用“與魔鬼共謀”來形容“遠距離”與“大分析”方法[10]。
2.2 統(tǒng)計方法的模糊性
由于往往涉及數(shù)據(jù)采集與整理、模型建立、結(jié)論分析等過程,且數(shù)據(jù)處理方法受益于統(tǒng)計學較多,數(shù)字人文也被稱為“統(tǒng)計學與社會語言學的混合”。然而,在數(shù)字人文研究中,統(tǒng)計方法類似于一個黑匣子,研究者個人并不需要了解其運作過程,傳統(tǒng)的論證過程被包裹起來。例如,斯坦福文學實驗室在研究莎士比亞戲劇和小說類型時采用主成分分析(PCA)方法,它將一組文本里許多具有相似分布的不同詞頻組合到一個新的成分中,從而提取出一小組相關(guān)的能夠反映出這組文本之間的主要差異的主成分,雖然提供了一種可以用來同時“閱讀”大量詞頻的圖形化方式,但這些新的主成分究竟代表什么含義卻是模糊的。06781BA0-0821-4532-9259-C02AC285977A
2.3 研究的理論預設(shè)
約翰·弗羅認為,“遠距離”并不能實現(xiàn)“一個類型與傾向的客觀敘述”的目標,因為它忽視了某些基本的關(guān)鍵因素,即作為基礎(chǔ)的形態(tài)分類并不是事先給予或不證自明的,而是“通過闡釋性的Decision建構(gòu)的”[11]。這里所謂的形態(tài)分類,即DocuScope對小說進行分類之前,需要先有教育小說、哥特式小說等既定的類型,而這些既定類型建立在文學的闡釋基礎(chǔ)之上。基于這個基本假設(shè)條件,才能依據(jù)小說的標題由20~25個詞縮短到6~7個詞,得到市場規(guī)模和標題長度之間的否定性關(guān)系,以及專有名詞與小說是轉(zhuǎn)喻關(guān)系,而抽象名詞和小說是隱喻關(guān)系等結(jié)論。
然而,如果這種質(zhì)疑是針對數(shù)字人文方法的客觀性,那么該質(zhì)疑實際上是無意義的,因為預設(shè)是幾乎所有能產(chǎn)生新知識/觀點的基石,無論是何種領(lǐng)域的研究,都不可能離開研究者的預設(shè)。如果沒有研究者的理論預設(shè),機器閱讀就會失去其目的,無論工具多么先進,終將不能產(chǎn)生有意義的研究成果。數(shù)字人文方法并不會顛覆研究本身的價值取向,而是其論證方法,其本質(zhì)則源于研究對象的不同。
3 “文本”:面向?qū)ο蟮募w話語
數(shù)字人文與傳統(tǒng)文學研究方法之所以看上去如此不同,并不是因為定性與定量的區(qū)分,而在于研究對象的差異。數(shù)字人文的研究對象并非傳統(tǒng)意義上的文學文本,而是作為對象的“文本”。
3.1 面向?qū)ο蠖钦撌霰旧淼亩嗝浇檎撟C方式
文學文本是傳統(tǒng)文學研究的對象,即作為整體的文學作品,這是一個由語言文字組成、充滿著作者情感與想象的完整世界,因此文學作品從本質(zhì)上來說是無法量化的。文學是審美形態(tài)的語言作品,并不是語言的機械組合。語言文字是作品的組成成分,但將它們組織起來的是作者的主觀意識,無論是情感還是認知都無法被量化,作為完整世界的文學作品也無法被切斷為詞或句子。量化意味著將文學作品打碎、分離,它不再是完整統(tǒng)一的文學世界,而變成了一堆毫無情感與想象力的數(shù)值,從這個意義上看,計數(shù)與文學天生就是對立的。
然而數(shù)字人文的研究對象并非僅是傳統(tǒng)文學意義上的文本,它更傾向于作為物質(zhì)對象的“文本”,如果借用計算機語言來比喻,傳統(tǒng)文學研究方法類似于“面向過程”,研究的是文學作品內(nèi)部的論述過程,而數(shù)字人文方法則是一種“面向?qū)ο蟆?。對研究者來說,文學文本類似于“所指”,研究者需要闡釋文本內(nèi)部傳達的意義,而“文本”則更像“能指”,它向外擴展它作為質(zhì)料的地位。
風格辨析所研究的正是作為語言質(zhì)料的“文本”。風格辨析之所以能通過數(shù)字人文的方法來實現(xiàn),其理論基礎(chǔ)在于風格所呈現(xiàn)出的語言特征。文學作品可以被看作字母、單詞與句子的組合,作為語料它們是可以被量化的。文學風格是一種相對穩(wěn)定的整體話語特色,在一定程度上可以體現(xiàn)為語言與修辭,雖然影響風格的因素包括作者的情感體驗、個性與心理、藝術(shù)素質(zhì)與時代影響等,但在具體文本中,風格表現(xiàn)為對某些詞匯的重復性使用,這一重復性成了可被量化的特征。另外,語言質(zhì)料還被用來研究標題與文學市場的關(guān)系(莫萊蒂),以及個體小說家在文學史上的影響力(喬克斯)等。
“遠距離”與“大分析”所依賴的不僅是“文本”的語言質(zhì)料,更是它在大文化語境中的新坐標。當文學作品被置于文化生產(chǎn)的更大領(lǐng)域中,被置于其他文化產(chǎn)品和出版物的族群之中,新的坐標使之擁有了更多的信息維度,這是“遠距離”與“大分析”能有效進行的基礎(chǔ)。當今“文本”的物質(zhì)信息與印刷時代不同,它們擁有多媒介的表現(xiàn)形式,呈現(xiàn)出比以前更強的流動性,基于文字處理軟件與轉(zhuǎn)化工具,“文本”可以作為對象被改變、替換、計算,也可以轉(zhuǎn)化成其他媒介形式,一個主對象由多媒介對象環(huán)繞,不同的媒介形式產(chǎn)生“文本”的不同面向?!拔谋尽辈辉偈钦Z言構(gòu)成的單個文本,而是由縱橫交錯的各種面向共同完成,從而使得文本性(Texture)與其原來的“紋理”和“紡織品”的含義再次關(guān)聯(lián)。正如馬克等將出版物、檔案、語料庫作為三個基本概念,研究者用“場域”來形容數(shù)字人文方法下的大文化語境,“遠距離閱讀”并不關(guān)注單個文本的具體特點,而是通過文本語料庫考察更大的趨勢和模式[12]。
與物質(zhì)對象相應而生的是多媒介的論證方式。統(tǒng)計工具的設(shè)計、可視化的運用等,都是針對“文本”而產(chǎn)生的新論證方式。對大規(guī)模的數(shù)據(jù)集所展現(xiàn)出的大跨度的趨勢或關(guān)系,可視化是比文字更清晰、精確并且更富有說服力的論證方式,能讓曾經(jīng)隱藏的信息變得視覺化,《圖表、地圖、樹:文學史的抽象模型》里的圖表、樹作為分析與解釋工具用來揭示世界小說發(fā)展的總體規(guī)律,《網(wǎng)絡理論,情節(jié)分析》里的網(wǎng)狀圖用來顯示對哈姆雷特人物關(guān)系的全新發(fā)現(xiàn)[13],《大分析:數(shù)字方法與文學史》里的蜂巢用來作為文學史影響力論證的總結(jié),它們構(gòu)成了闡釋性的一部分,以至于能“促生新的內(nèi)容”,甚至能“產(chǎn)生詩意的效果”[14]。如學者查德·魏爾蒙用“驚奇”的移位來解釋數(shù)字人文對圖表、地圖和示意圖的偏愛,在這里,“遠距離閱讀”中的“距離”并不僅僅是一種機器功能,而是這些參與到文學閱讀中的新式示意圖和圖表的功能,它們本身就是文本,可以被閱讀,可以被解釋,也可以成為驚奇的對象[15]。
3.2 個人話語到集體話語
從精神性到物質(zhì)性,從文本到“文本”,研究對象的變化引發(fā)了一系列的連鎖效應。從研究過程到研究者構(gòu)成,也都出現(xiàn)了與以往截然不同的面貌?!靶挛目啤钡摹叭谕ā币馕吨芯糠椒ǖ慕徊媾c跨越,這種跨越并非僅體現(xiàn)在個體研究者的知識構(gòu)成上,需要不同領(lǐng)域的學者合作完成。換句話說,意味著個體著述的時代轉(zhuǎn)入合作項目的時代。
傳統(tǒng)以“正典”為對象、以細讀為方式的研究方法,建立在個體閱讀的基礎(chǔ)之上,對有限的數(shù)據(jù)集進行精細分析,長期以來形成了對一系列主題歷史性的、一般性的和風格上的研究。在數(shù)字人文語境下,面對大數(shù)據(jù)集和基于文本挖掘的文化分析,研究開始更傾向于集體性和合作性,流動性的文本意味著集體話語的生成。
“文本”的物質(zhì)性帶來的是研究對象的擴大化,文學作品所依賴的媒介正變得不透明。在印刷術(shù)一統(tǒng)天下的時代,書籍成為一種不言而喻的、透明的媒介,研究者只需要讀取承載于其上的文本信息,穩(wěn)定的印刷文化使研究者忽視了潛在的物質(zhì)性力量,而在信息物質(zhì)化與媒介多元化的時代,以往被視為透明的媒介已經(jīng)與創(chuàng)造活動密不可分。研究對象擴展到作為空間記錄單位的書籍,擴展到墨跡、雕版印刷和出版商的物質(zhì)性歷史,擴展到媒介與人的認知和身體互動。著述不僅是重要見解的簡單包裝,而且還是整個社會文化裝置的一部分。06781BA0-0821-4532-9259-C02AC285977A
面對新的研究對象,個體研究已經(jīng)無法滿足數(shù)字人文的需要,“項目”一詞越來越多地出現(xiàn)在數(shù)字人文的研究目錄之中,研究者正在經(jīng)歷從個體著述時代轉(zhuǎn)入合作創(chuàng)作項目的時代,項目管理也成為數(shù)字人文領(lǐng)域中的重要課題。項目集體包括不同領(lǐng)域的研究者,也包括知識平臺的構(gòu)建者以及互動形式的參與者。數(shù)字人文研究過程中,文學研究者、數(shù)據(jù)庫設(shè)計者及計算機技術(shù)人員正緊密合作,他們利用數(shù)字性手段進行論證,再通過多元媒體組合進行傳播,知識平臺不再僅僅只是圖書管理與技術(shù)人員或者出版單位的工作。學術(shù)交流形式的改變,使得讀者參與、探索、探討、互動等對著述發(fā)揮著越來越重要的作用。在數(shù)字人文出版物上發(fā)表的項目列出一大批作者也是常見現(xiàn)象。上述的斯坦福文學實驗室的工作大部分都是群體作者,涉及平臺開發(fā)更是如此。安妮認為,“以我為核心的單一著述模式已經(jīng)轉(zhuǎn)變?yōu)橐晕覀優(yōu)橹行牡暮献餍灾瞿J健盵14]。
4 結(jié)語
從“融通”的意義上來說,數(shù)字人文具有典型的新文科特征,新文科之“新”蘊藏著研究方法的原創(chuàng)可能性。數(shù)字人文的方法,無論是論證方式、分析工具還是數(shù)據(jù)庫設(shè)計,大部分仍然來自英美文學實踐,國內(nèi)方法的原創(chuàng)性并不突出。但英美的研究主要集中于傳統(tǒng)的文學形態(tài)——出版物。就西方數(shù)字人文的主要研究機構(gòu)而言,無論是斯坦福文學實驗室,還是數(shù)字人文中心,文本分析與文學史研究都占據(jù)較大比例。
而新時代,最具有中國特色的文學形式是網(wǎng)絡文學。20世紀末誕生的網(wǎng)絡文學迅速發(fā)展到今天的龐大規(guī)模,不僅成為讀者接受的主要文學形式,也成為文學研究與產(chǎn)業(yè)研究的重要對象。比起傳統(tǒng)文學作品,網(wǎng)絡文學更適合數(shù)字人文的方法,不僅因為它具有原生的數(shù)字性,也因為與傳統(tǒng)印刷文學相比,網(wǎng)絡文學更具有物質(zhì)性,它更像是一個對象,一個被各種媒介形式和交互方式包圍的對象。
一方面,數(shù)字人文方法擅長處理大數(shù)據(jù)集,而能夠產(chǎn)生文學大數(shù)據(jù)的,除了日漸成熟的各類文學數(shù)據(jù)庫之外,最顯著的當屬網(wǎng)絡文學大數(shù)據(jù)。它不僅擁有天然的電子文本優(yōu)勢,還因為強互動性產(chǎn)生了龐大的實時數(shù)據(jù)流。不論在學術(shù)界還是產(chǎn)業(yè)界,數(shù)據(jù)都是分析網(wǎng)文最重要的指標,就同一時間段所產(chǎn)生的文本數(shù)據(jù)來說,無論是單個作品的體量,還是作品的數(shù)量,網(wǎng)絡文學已經(jīng)遠遠超過傳統(tǒng)文學。另一方面,網(wǎng)絡文學并不是傳統(tǒng)意義上單純的文學話語,而是一個多面向的“文本”。在這個文學生態(tài)系統(tǒng)中,作者與讀者的數(shù)量前所未有,接受者意圖可能直接影響作品生產(chǎn),而且大量影視作品改編自網(wǎng)絡文學,IP概念的興起使得它超過了傳統(tǒng)文學的傳播形態(tài)。
數(shù)字人文幾乎與計算機技術(shù)同步發(fā)(下轉(zhuǎn)第頁)(上接第頁)展,與世界接軌的信息產(chǎn)業(yè)為我國提供了產(chǎn)生自生科學方法的環(huán)境。典籍的數(shù)字化是信息產(chǎn)業(yè)發(fā)展的直接影響之一,統(tǒng)計學與計量學等為數(shù)字人文提供了方法上的保障。科技的發(fā)展為數(shù)字人文提供了產(chǎn)生模型和數(shù)據(jù)方法的土壤,中國文學研究可以在此基礎(chǔ)上發(fā)展出自己的研究方法。
參考文獻:
[1] 陳鵬.“新文科”要培養(yǎng)什么樣的人才[N].光明日報,2019-05-20(008).
[2] 李天.數(shù)字人文背景下的文學研究:量化方法在中西文學研究中的比較[J].廈門大學學報(哲學社會科學版),2020(5):153-162.
[3] 陳大康.從數(shù)理語言學看后四十回的作者:與陳炳藻先生商榷[J].紅樓夢學刊,1987(1):293-318.
[4] 李賢平.《紅樓夢》成書新說[J].復旦大學學報(社會科學版),1987(5):3-16.
[5] 讓-巴蒂斯特·米歇爾,等.使用百萬數(shù)字化書籍的文化定量分析[J].科學,2010(331):176-182.
[6] 弗蘭克·莫萊蒂.圖表,地圖,樹:文學史抽象模型[M].紐約:維索出版社,2007:7-13.
[7] 馬修·喬克斯,等.十九世紀文學的重要主題[J].詩學,2013(6):750-769.
[8] 馬修·喬克斯.大分析:數(shù)字方法與文學史[M].香檳:伊利諾伊大學出版社,2013:36-46.
[9] 大衛(wèi)·布魯爾.計數(shù)、共鳴和形式,一種思辨的宣言(附注)[J].十八世紀小說,2011(2):161-170.
[10] 希瑟·愛.近而不深:文學倫理與描寫轉(zhuǎn)向[J].新文學史,2010(2):371-391.
[11] 約翰·弗羅.思考小說[J].新左翼評論,2008(49):137.
[12] 馬克·阿爾吉-休伊特,等.正典/檔案:文學場域大型動力學[J].山東社會科學,2017(9):46-62.
[13] 弗蘭克·莫萊蒂.網(wǎng)絡理論,情節(jié)分析[J].新左翼評論,2011(68):80-102.
[14] 安妮·博迪克,等.數(shù)字人文:改變知識創(chuàng)新與分享的游戲規(guī)劃[M].馬林青,韓若畫,譯.北京:中國人民大學出版社,2019:45.
[15] 查德·魏爾蒙,曾毅.神圣閱讀:從奧古斯丁到數(shù)字人文主義者[J].山東社會科學,2017(9):38-45.
作者簡介:李天(1984—),女,湖北荊州人,博士,副教授,研究方向:數(shù)字人文、新媒體藝術(shù)、影像美學。
耿旭樸(1981—),男,河南南陽人,博士,高級工程師,系本文通訊作者,研究方向:大數(shù)據(jù)、數(shù)字信號處理、遙感技術(shù)。06781BA0-0821-4532-9259-C02AC285977A