亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        媒介構造與范式生產:“遠讀”方法的演變及其前景

        2022-09-15 03:51:00
        文藝理論研究 2022年4期
        關鍵詞:萊蒂研究者媒介

        鄭 楠

        在傳統(tǒng)的文學研究中,文學作品常被視為一種渾然天成的藝術奇觀,是作家偉大心靈的文字反映,因此研究者需要依賴“細讀”(close reading)來理解文學作品,即“對文本的語言、結構、象征、修辭、音韻、文體等因素進行仔細解讀”(趙一凡630)。因為能夠讓研究者對文本產生精細獨到的解釋,所以細讀在很長時間內都是文學研究的范式。但由此也帶來了一個顯而易見的問題,正如雷蒙德·威廉斯(Raymond Williams)所言:“沒有人真的懂19世紀的小說,因為沒有人讀完了或是能夠讀完從單行本到報紙連載小說在內的全部作品?!保?8)確實如此。假如說細讀幾十乃至幾百本小說尚具有可行性,但當研究對象的數(shù)量擴大到成千上萬本時,細讀便顯得捉襟見肘。

        細讀的局限性正是本文研究“遠讀”(distant reading)方法的一個切入點。本文指出,造成這一局限性的原因并非在于細讀方法本身,而在于研究者對于研究對象的認知。對文本的認知方式決定了文學的研究方法,因此想要解決運用細讀方法時所面臨的困境,研究者需要轉變自身對于文本的認知。而基于細讀在面對大量文本時不可避免的局限性,有學者提出應該嘗試由細讀改為遠讀,遠讀的文學研究方法應運而生。遠讀在何種意義上改變了研究者對于文本的認知?它能彌補細讀的缺陷嗎?遠讀本身又有怎樣的特點和問題?它有可能成為未來文學研究的新范式嗎?本文將嘗試對這些問題作出學理化的探討。

        一、遠讀1.0:閱讀媒介

        闡釋遠讀,必須從斯坦福大學教授弗朗科·莫萊蒂(Franco Moretti)談起。2000年,莫萊蒂在《新左翼評論》()上發(fā)表了題為《對世界文學的猜想》(“Conjectures on World Literature”,下簡稱《猜想》)的文章,并在其中明確提出了遠讀的概念:“遠離閱讀。我要重申的是:距離,是認知的條件。有了距離,你就可以關注那些比文本小得多或大得多的單位:手法、主題、修辭——或是體裁和系統(tǒng)?!保R蒂12)此后,遠讀概念以及這篇文章受到越來越多的關注。截至2021年7月21日,在谷歌學術(Google Scholar)上,《猜想》一文的被引量已經高達2 614次。另外,以在Web of Science的核心合集中以“distant reading”為主題而檢索到的247篇論文為例,經由VOSviewer軟件做作者共被引分析(author cocitation analysis),發(fā)現(xiàn)莫萊蒂已經成了理解遠讀的關鍵人物。因此,本文試圖將莫萊蒂的《猜想》作為考察當代遠讀的起點,以此探析莫萊蒂的遠讀究竟為何會引起學界的高度關注。

        在《猜想》中,莫萊蒂用自己的方式承接了威廉斯當初所提出的問題:“為人所知的19世紀英國小說就有3萬部,而還有4萬、5萬、6萬部不為人知,更未曾讀過,將來也沒人會去讀?!保?)也就是說,第一,對于任何試圖進行文學總體研究的學者而言,研究對象的體量問題是顯而易見的,研究者無法窮盡所有的研究對象,他們所細讀過的文本必然遠遠少于其未細讀過的文本。第二,在海量的文獻中選擇可進行細讀的研究對象,研究者的篩選標準必須是“為人所知”,即研究對象要與文學的經典化(canonization)密切相關。正所謂“除非你覺得極少數(shù)文本確實重要,否則你不會花費那么多氣力去研讀”(11)。但問題在于,即使研究者只選擇各國的經典文本去展開文學討論,研究對象也未必能被研究者盡數(shù)細讀,更何況關于“何為經典”的討論又涉及另一個巨大的、邊界含糊的學術難題。莫萊蒂認為,如果僅靠傳統(tǒng)的細讀研究法來研究文學,“世界文學”就很難有真正來臨的那一天。為此,他提出了一種探索“世界文學”的可能性,即遠讀。

        在《猜想》中,莫萊蒂展示了自己依據(jù)眾多民族文學專家的研究材料而進行遠讀的過程。他首先借用了“世界體系理論”(The Theory of World System)的經濟假設,即世界資本主義體系“同為一體,但不平等”(10)。由此,或許可以認為,在相互關聯(lián)的世界文學體系內,強勢的中心文學(西歐文學)會入侵并改變弱勢的邊緣文學(非西歐文學)。為了驗證這一猜想,莫萊蒂以“西方小說形式如何影響本土文學內容”為切入點,不直接閱讀文學文本,而通過閱讀二十多種文學批評專著,最終從眾多民族文學研究者的研究中得到了一個共同點,即大量“邊緣地區(qū)”(指非西歐國家)的文學,在特定時期都受到過“中心地區(qū)”(西歐國家)小說形式的影響,而外來的“西方形式”在遭遇“本土內容”時,雙方會相互妥協(xié)。妥協(xié)的方式與程度雖各有不同,但這一普遍規(guī)律卻足以證明:世界文學是一個不平等的整體。

        可以看到,一開始的遠讀方法并沒有涉及任何量化分析(quantitative analysis)。莫萊蒂所做的,不過是“把別人的研究成果拼湊起來”(11),并從中分析出小范圍的細讀所難以反映的文學規(guī)律。這其中的遠讀更像是對于他人研究的“綜合”(synthesis)。大概也正是因此,在《猜想》一文發(fā)表后,學界的討論更多聚焦在莫萊蒂對“世界文學體系”的描述上(Moretti,“More Conjectures”73)。有學者認為,所謂的遠讀方法并沒有像莫萊蒂宣稱的那般具有革命性(Spivak 107 109)。因為遠讀方法似乎只是一種變形的文獻綜述,綜述在傳統(tǒng)文學研究中并不罕見,而莫萊蒂所采用的民族文學研究也有對其他研究的借鑒與總結。伊利諾伊大學厄巴納 香檳分校的學者泰德·安德伍德(Ted Underwood)就認為,遠讀“是一種將歷史知識探究描述為實驗的實踐”(33)。還有的學者據(jù)此把遠讀歸為“數(shù)字人文”(digital humanities)研究的一種。

        本文認為,上述說法雖有一定真知灼見,但其并沒有深入探討遠讀的方法論意義,甚至部分混淆了遠讀在不同階段的內涵。更準確地說,遠讀是一種借鑒科學實驗思維的文學研究方法,與純粹的文學研究不同,它正是通過“閱讀媒介”實現(xiàn)了“假設 驗證”的實驗閉環(huán),它具有鮮明的實驗性。

        所謂閱讀媒介,指的是改變研究者認知文本方式的信息反饋裝置。我們知道,遠讀方法的全過程是,先由研究者對文學文本進行理論上的假設,再由閱讀媒介根據(jù)研究假設對文學文本進行特定的處理,然后反饋相應的文本信息,最后由研究者通過分析該信息以驗證假設是否成立。在這一過程中,研究者對文本的認知逐漸從原始的文字材料轉變?yōu)榉答伒男畔㈩愋?。為便于理解,本文以閱讀媒介為中心,構建了《猜想》中遠讀方法的分層模型,如圖1所示。

        圖1

        我們可以從整個遠讀的分層模型入手來進一步理解該流程?!恫孪搿分械倪h讀方法實際上出現(xiàn)了金字塔型的三個層次。底層為原始材料,即整個遠讀研究所涉及的大規(guī)模文學文本,中層則是閱讀媒介,即莫萊蒂利用的二十多本民族文學研究專著,頂層則是作為研究者的莫萊蒂。從這個模型來看遠讀的具體運作流程,我們或許更容易理解遠讀的實驗特性。所謂實驗,即“在受控條件下進行的檢驗,以證明已知的真理或檢驗假設的有效性”(Muijs 13)。“假設 驗證”是實驗方法區(qū)別于其他研究方法的關鍵所在。結合波普爾的證偽理論,科學研究需要堅持對研究假設進行檢測。只有當研究假設可被檢驗時,研究者才不會堅持不可靠的研究前提,否則研究者就有可能為了符合假設而歪曲事實或經驗材料。而之所以稱遠讀為“文學實驗”,關鍵就在于閱讀媒介,正是這一反饋裝置使得遠讀方法中“假設 驗證”的流程得以完成。具體到莫萊蒂的遠讀方法,這個過程邏輯就是:“世界文學體系”是莫萊蒂的研究問題,“現(xiàn)代小說是西方小說形式與本土內容相互妥協(xié)的成果”則是莫萊蒂的研究假設。莫萊蒂不需要在具體的文本語境中證明這一假設,而是通過收集不同的民族文學研究組成閱讀媒介,這一閱讀媒介則根據(jù)莫萊蒂的假設,反饋了“西方小說形式同本土內容存在結合問題”的信息。莫萊蒂根據(jù)這一反饋的信息,驗證了研究假設最終成立,從而得出世界文學同一而不平等的結論。

        盡管傳統(tǒng)文學研究中也有研究設想,但卻鮮有形成基于信息反饋的驗證機制,因而研究者很難清晰地知道自己的研究設想是否可靠,或存在哪些問題。特別是依賴細讀方法的研究,其文本分析更多聚焦在對研究設想的闡釋,雖然這一做法豐富了文學研究的進路與結論,但在缺乏明確驗證機制的情況下,很容易出現(xiàn)“強制闡釋”,即用理論框定文本,致使文學研究頻頻陷入尋求自圓其說的僵局,而這一做法顯然無益于文學知識的生產。莫萊蒂在《猜想》中所展現(xiàn)出的“假設 驗證”機制,無疑證明了文學研究能夠引入一種更為科學的實驗方法。

        關于遠讀的理論設想是非常美好的,但在實際運用中卻存在不少困難。最重要的一個困難,就是缺乏對他人研究成果的選擇標準。因為即使是針對同一個研究對象,不同研究者的研究思路和結論都有可能差別很大,而在不進行細讀的情況下,似乎很難作出客觀公正的篩選。莫萊蒂的《猜想》也沒有給出解決方案。不僅如此,莫萊蒂在文中所使用的民族文學研究大多為英文著作,因而在關乎方法與主題等內容性的選擇標準之外,還存在著語言這一層篩選機制。是否有其他尚未進入英語世界的民族文學研究,其與莫萊蒂所引用的著作相比,彼此的闡釋恰好相悖?對于因語言而產生的研究障礙,這更是一個無解的難題。第二個困難就是對他人的研究難以驗證。正如有學者指出,《猜想》中的遠讀其實是一個基于信任的方案(Parla 123)。莫萊蒂所利用的民族文學研究,歸根結底是他人細讀文本的產物。由于莫萊蒂并沒有直接面對底層的文本,因此他必然難以親自判斷他人的細讀在何種程度上是可靠的。因此,莫萊蒂對他人研究的采用只能建基于信任之上:信任文學專家的文本收集與文本分析,信任科學共同體對相關成果的評價,唯獨缺失屬于研究者基于文本信息的自身判斷。

        不難發(fā)現(xiàn),上述兩個弊端均集中于作為閱讀媒介的他人研究。這也是本文強調閱讀媒介是一個反饋裝置的重要原因。民族文學專家的細讀,其反饋的不僅是文本包含的信息,更是專家的價值判斷。研究者需要依靠解讀這些反饋,才能完成對于假設的驗證。假如研究者既無法解釋對人為價值判斷的選擇標準,又無法驗證反饋信息的真實性,那就如同在遠讀方法中引入了一個信息處理的“黑箱”(black box):一個具有信息反饋功能,卻不清楚內部運作結構的篩選系統(tǒng)。這便是《猜想》中遠讀所遺留下來的挑戰(zhàn)——其在實踐中仍存在著“信息黑箱”。修復閱讀媒介的弊端,進一步優(yōu)化其性能,成為改進遠讀方法的核心任務。

        二、遠讀2.0:從量化分析到建構模型

        發(fā)表《猜想》之后,莫萊蒂于2003年又在《新左翼批評》上發(fā)表了《圖表、地圖、樹型圖(一)》(“Graphs,Maps,Trees-I”),并于次年展示了第二、三部分的成果,最終在2005年集結成同名書籍(下文簡稱《圖表》)?!秷D表》是莫萊蒂的另一部代表作,展示了《猜想》之后莫萊蒂對于閱讀媒介的改進,即將他人的細讀替換為量化分析。具體而言,為了研究文學史中“小說的崛起”(the rise of novel),莫萊蒂將目標聚焦于書籍史(book history)——對書籍文本的印刷、發(fā)行與流通等的研究——通過量化書籍史研究中的數(shù)據(jù),統(tǒng)計不同國家小說出版的時間、數(shù)量以及地點等信息,并將之形成圖表、地圖以及樹形圖。如圖2所示,在統(tǒng)計了英國、日本、意大利、西班牙以及尼日利亞分別在1700年至2000年間小說的出版數(shù)量后,莫萊蒂將數(shù)據(jù)繪制成圖表。借助圖表,莫萊蒂發(fā)現(xiàn),上述五個國家的小說發(fā)行都經歷過一個快速上升的階段。

        圖2 (Moretti,Graphs,Maps,Trees 6)

        用量化分析來取代《猜想》中他人的細讀,解決了《猜想》中閱讀媒介難以被檢驗的問題。正如莫萊蒂所言:“量化數(shù)據(jù)之所以有用,是因為它們獨立于解釋?!保?0)數(shù)據(jù)的統(tǒng)計方法是清晰而明確的,能夠單獨地被其他研究者分析和理解,而數(shù)據(jù)本身則是客觀存在的,不因不同研究者的閱讀而發(fā)生改變。因此,不同于細讀所隱含的價值判斷,量化分析這一閱讀媒介所反饋的,是關于文本的客觀說明。

        文學研究的量化分析也成為莫萊蒂及其團隊后來的工作方向。2011年,莫萊蒂出版了論文合集《遠讀》(),其中收錄的《風格公司:對1740至1850年間七千本英國小說標題的反思》(“Style,Inc:Reflections 7000 Titles[British Novels,1740 1850]”)一文就引入了考察小說標題字數(shù)的平均數(shù)和中位數(shù)的統(tǒng)計方法,通過計算分析1740年到1850年隨著出版市場的擴大,小說標題字數(shù)呈現(xiàn)出下滑的趨勢,并綜合當時書籍購買者的喜好與標題長度所帶來的廣告效益等方面的思考,研究者得出了市場對小說呈現(xiàn)方式(the presentation of novels)存在影響的結論。(179 210)

        上文提到,安德伍德更傾向于將遠讀視為一種文學史研究,因為文學史研究更多集中于對文學規(guī)律的研究,相比對文學作品的美學研究而言,這種觀點認為遠讀更追求“普遍客觀”,這也使得在文學史研究中運用量化分析顯得更為合適。這個看法固然有其合理性,但實際上只關注到遠讀探索文學史規(guī)律的案例事實,而忽略了遠讀中閱讀媒介在改變文學認知模式上的潛力。在《遠讀》的最后一篇論文《網(wǎng)絡理論,情節(jié)分析》(“Network Theory,Plot Analysis”)中,莫萊蒂將遠讀運用在對《哈姆雷特》的情節(jié)分析上。通過對人物對話的量化計算,莫萊蒂設計出《哈姆雷特》的人物網(wǎng)絡圖,如圖3所示:

        圖3 (Moretti,Distant Reading 213)

        在上述過程中,作為閱讀媒介的量化分析先將文本轉化為數(shù)字,而后再通過可視化呈現(xiàn)將數(shù)字轉化為網(wǎng)絡圖譜,這便是閱讀媒介實現(xiàn)認知改變的方法——研究者眼中的小說從線性文字變成了空間網(wǎng)絡。莫萊蒂介紹了網(wǎng)絡圖譜的四個優(yōu)勢:一、將歷時性的文字閱讀變成共時性的網(wǎng)絡結構;二、情節(jié)可視化;三、構建文學模型;四、通過文學模型進行“文學實驗”。(215 220)更為關鍵的是,可視化網(wǎng)絡能夠直接呈現(xiàn)量化數(shù)據(jù)難以呈現(xiàn)的事實。如圖3所示,盡管哈姆雷特(Hamlet)和克勞狄斯(Claudius)在網(wǎng)絡中心性的數(shù)值上相差不遠(中心性等于與其他網(wǎng)絡節(jié)點最短距離的平均數(shù),相鄰兩個節(jié)點的距離為1):哈姆雷特為1.62,克勞狄斯則是1.45,似乎二者同樣是故事的中心人物,但分別將二者抽離出網(wǎng)絡后,可以發(fā)現(xiàn),哈姆雷特對網(wǎng)絡的影響力要比克勞狄斯大,這證明了哈姆雷特才是故事的主角。對數(shù)據(jù)可視化的使用使得遠讀不只限于大規(guī)模的文學文本研究,也使得作品批評得以展開。利用網(wǎng)絡圖譜,遠讀可以直觀地呈現(xiàn)數(shù)據(jù)統(tǒng)計所隱藏的內部聯(lián)系,如圖4所示:

        圖4 (Moretti,Distant Reading 221)

        盡管網(wǎng)絡圖譜對原先的問題有所改進,不過以上研究仍然存在問題。雖然量化分析能夠確保閱讀媒介反饋信息的客觀性,但對文本的量化往往只是為了用數(shù)據(jù)來驗證已有研究的正確與否。而事實上,不需要關系網(wǎng)絡,讀者也能夠輕易判斷出哈姆雷特才是文本的主角,這樣的遠讀方法所能帶來的研究意義極為有限。同時,目前的閱讀媒介大多是簡單的量化分析方法,研究者難以利用這些數(shù)據(jù)產生新的文學知識。為何選擇此種數(shù)據(jù)的變化來證明研究假設,而非另外一種?這需要研究者進行說明與解釋,但選擇依據(jù)依舊很少出現(xiàn)在遠讀的研究中。美國羅格斯大學學者安德魯·戈德斯通(Andrew Goldstone)就指出,實踐遠讀的研究者未能系統(tǒng)性地說明分析特定數(shù)據(jù)的理由何在(“Distant Reading:More Work to be Done”)。上述莫萊蒂的《風格公司》便是一例,加拿大麥吉爾大學學者蘇真(Richard Jean So)認為,《風格公司》在數(shù)據(jù)的處理上仍有缺陷,理由在于莫萊蒂對數(shù)據(jù)的處理更像是由直覺所驅動的(“All Models Are Wrong”671)。利用平均數(shù)和中位數(shù)確實能展示出某種數(shù)據(jù)的變化,但卻沒辦法告訴研究者這一變化趨勢的強度,有可能上述兩個指標所展示出來的變化只是某種暫時性的噪音(noise),因而莫萊蒂在這一文章中的分析方法顯得不夠系統(tǒng)化(“All Models Are Wrong”670 671)。綜上所述,量化分析需要運用多種數(shù)理知識,但文學研究者往往缺乏這一方面的知識,從而導致采用的量化分析方式過于簡單與唯一,并且缺乏選擇依據(jù)。這是造成在文學研究中運用量化分析難以產生高價值數(shù)據(jù)的重要原因。因此,深化對量化分析的認識,是避免遠讀變成簡單數(shù)字統(tǒng)計的重中之重。

        如何深化對于文本的量化分析?蘇真給出的建議是建模(modeling)。針對《風格公司》的直覺驅動問題,蘇真提出了一個關于方法上的建議,即在計算機上利用回歸模型(regression model)對數(shù)據(jù)進行再處理,分析小說標題隨年份遞增后字數(shù)上升或下降趨勢的強弱。通過建立回歸模型,蘇真為《風格公司》引入了擬合(fitting)的概念,研究者可以根據(jù)模型擬合數(shù)據(jù)的精確度作出模型的調整,由此分析統(tǒng)計數(shù)據(jù)所呈現(xiàn)出的真正趨勢。(“All Models Are Wrong”671)

        如果說量化是將文本轉化為客觀數(shù)據(jù)的集合,那么建模則是在數(shù)據(jù)集合中搭建結構關系。不同的量化方式會使文本產生不同的數(shù)據(jù),在這個意義上,文本能夠產出的數(shù)據(jù)集合是多維的(multi-dimensional)。但假如研究者只關注單一維度的數(shù)據(jù),只因該數(shù)據(jù)的變動幅度非常大,就宣稱該數(shù)據(jù)的變化代表了整個數(shù)據(jù)集合的變化,這就很容易產生錯誤的研究結論。因為有可能該數(shù)據(jù)本身的權重很小,因此用它來進行整體評價是不恰當?shù)?。只有當研究者利用多維數(shù)據(jù)建構出模型,并通過模型挖掘出多維數(shù)據(jù)的結構關系,才能從整體上去把握某個數(shù)據(jù)的變化是不是對于整體具有顯著意義,也才能判定數(shù)據(jù)與數(shù)據(jù)之間呈現(xiàn)出何種聯(lián)系。如此一來,研究者對于數(shù)據(jù)的選擇與分析會更加系統(tǒng)化,更加有據(jù)可依,而不是僅憑自身直覺來決定研究方向。

        除了對系統(tǒng)性的強調外,建模的另外一個意義在于迭代性。模型,本質上是對研究對象的一種數(shù)學關系表達,是一種理想化的產物,因此在實踐中,模型并不一定能夠準確地描述文本,只能盡量地去接近文本。知名統(tǒng)計學家喬治·博克斯(George Box)的名言“所有的模型都是錯的”(All models are wrong)便是對這一事實的高度總結。但這并非意味著模型就是無效的,恰恰相反,模型的有效之處就在于其“無效”。換而言之,建構模型的一大意義便在于尋找模型所反饋的錯誤。模型中出現(xiàn)的錯誤一般分為兩種:在代入數(shù)據(jù)后,要么模型中出現(xiàn)了研究假設認為不應該存在的現(xiàn)象,要么沒有出現(xiàn)假設認為應該存在的現(xiàn)象。在上述兩種情況中,或者是建構的模型出現(xiàn)了問題,或者是研究假設出現(xiàn)了問題,不管是何種情況,都迫使研究者不得不重新調整自身建構的模型或假設,使之更加符合數(shù)據(jù)的情況。這種調整并非一次性的,而是永無止境的,因為模型只是對象的一種表征,它雖不是真實的對象,但卻可以無限地接近對象,而正是建模這種不斷在假設、模型、數(shù)據(jù)之間來回往返的迭代性,才使得模型得以揭示人類憑借直覺所感知不到的事實。

        蘇真本人便用具體的實踐展示如何理解建構模型的意義。他和芝加哥大學的霍伊特·朗(Hoyt Long)聯(lián)手,在《文學模式識別:細讀與機器學習之間的現(xiàn)代主義》(“Literary Pattern Recognition:Modernism between Close Reading and Machine Learning”)中進行了一次以俳句(haiku)為對象的建模研究。具體而言,蘇真和朗首先發(fā)現(xiàn),通過傳統(tǒng)的文本細讀法進行俳句的本體研究,無法同通過歷史主義批評的俳句傳播研究很好地結合起來,更無法揭示出俳句確立為俳句的本質性和特殊性,究竟在它從日本傳播到西方的過程之中發(fā)生了什么變化。兩位研究者試圖找出一種能夠展示文體形式層面與歷史文化層面之間相互影響的研究方法。為此,蘇真和朗構建了一個在傳統(tǒng)文本細讀中被確定為俳句的英語俳句語料庫(由翻譯作品和改編作品組成)與一個非英語俳句語料庫,他們先為俳句做了一個通用的文本表示模型(詞包模型),并給出一個關于區(qū)分俳句與非俳句的假設:俳句可以通過共有的措辭和音節(jié)數(shù)模式來區(qū)別于非俳句。在這個假設的基礎上,他們運用機器學習(machine learning)讓電腦程序在兩個語料庫自動識別分類依據(jù)。蘇真和朗發(fā)現(xiàn),模型對俳句翻譯作品的判斷率較高,改編作品卻較低。他們一開始懷疑原因是假設中對模型的限定條件過多,于是刪除了音節(jié)數(shù)的特征。但再進行測試后卻發(fā)現(xiàn),在考察條件變得更加寬松后,機器的判斷率卻下降了。這種分類錯誤反而揭示了俳句和非俳句語料庫具有重疊之處的可能。蘇真與朗通過對這些錯誤分類的重新審視,發(fā)現(xiàn)了在美國詩歌領域中可能存在更為廣泛的“東方主義共鳴”。這種作為統(tǒng)計學意義上的俳句模式為研究者重新描繪了俳句的定義與傳播路徑,并提示了一種在流傳過程中所保持的“俳句性”。

        在上述例子中,蘇真展示了不斷調整假設與模型,最終完成文學批評的全過程。這種批評并非一次性完成的,而是要通過不斷的迭代才能達到。部分學者提出以“尺度閱讀”(scalable reading)來形容這種研究,即研究者“形成一些松散的猜想→大規(guī)模的文獻挖掘(所謂‘遠讀’)→找出離群值→通過回歸細讀來精準定位→提出隨意閱讀難以發(fā)現(xiàn)的問題——又或者,繼續(xù)在細讀、遠讀間回返,不斷精確模型,無限逼近想要再現(xiàn)的問題”(趙薇46)。麥吉爾大學學者安德魯·派博(Andrew Piper)就在其《枚舉:數(shù)據(jù)與文學研究》(:,2018)中用示意圖展示了此種遠讀與細讀的結合,如圖5所示:

        圖5 (Piper 10)

        本文認為,上述說法有值得商榷之處?;诒疚脑趫D1提出的遠讀分層模型,這種循環(huán)往復式的研究實際上一直發(fā)生在遠讀方法的內部,而非如圖5所示是遠讀、建模與細讀三個獨立部分的組合。正是因為目前關于遠讀的研究并沒有清晰地提出閱讀媒介這一概念,才使得學界對遠讀方法產生眾多的誤解。遠讀從來都不是與細讀相互割裂的研究方法——從遠讀1.0到遠讀2.0的演變中,遠讀一直能夠包含細讀,而這一包含方式,正是通過閱讀媒介實現(xiàn)的。

        首先,在遠讀1.0中,莫萊蒂的《猜想》其實有著兩個層次的細讀,第一重是作為閱讀媒介的民族文學專家對底層文本的細讀,第二重是莫萊蒂對于作為閱讀媒介的民族文學專家研究的細讀。不難發(fā)現(xiàn),《猜想》中的第一重細讀是為第二重細讀服務的,換言之,遠讀1.0本身可以視為經由閱讀媒介這一概念所連接起來的雙重細讀。

        其次,在遠讀2.0中,當閱讀媒介被置換為更加“客觀”的數(shù)理方法之后,細讀的方式和意義均發(fā)生了改變。例如,通過閱讀媒介對文本的轉換,細讀可以無須讀“字”,而是讀“數(shù)據(jù)”和“圖”。如上文所示,對文學文本從“字”到“數(shù)據(jù)”與“圖”的認知變化無疑打開了一個更為廣闊的文學思考空間。同時,遠讀2.0中的細讀意義并不在于探討個別文本的神圣之處。與之相反,此番細讀實際上是在探究一個整體結構中的異常之處。細讀異常能夠給予我們關于整體更深刻的洞見。正如學者吉云飛提出的,數(shù)字時代下文學研究一大張力在于“對局部的理解總是離不開對整體的理解”(181),這已然揭示了遠讀與細讀的辯證法——如果說基于計算的遠讀2.0是對于研究對象的系統(tǒng)性把握,那么細讀就是對這一系統(tǒng)把握的不斷調整。而這種調整機制,正是通過引入跨學科的閱讀媒介實現(xiàn)的。作為當代遠讀方法的持續(xù)探索者,蘇真的看法呼應了上述觀點:“文本細讀的結果為我們反思遠讀方式的局限性提供了關鍵的機會。”(“Race and Distant Reading”72)所以,在遠讀2.0中,局部細讀是系統(tǒng)遠讀的調整基礎,后者始終包含著前者。

        更進一步來看,將遠讀同細讀對立起來的態(tài)度,在一定程度上也反映了對學科范式轉變過程的誤解。一提起范式轉變(paradigm shift),人們往往會聯(lián)想到托馬斯·庫恩(Thomas Kuhn)所提出的“科學革命”,仿佛范式轉變的過程就是一場范式之間的權力斗爭,例如有數(shù)字人文學者表示,數(shù)字人文研究(遠讀)需要融入主流人文學界,展示其在人文研究領域的領導力(Liu 495)。這種說法其實是變相地表達了數(shù)字人文研究(遠讀)與傳統(tǒng)人文研究(細讀)存在競爭關系的觀點。問題在于,范式轉變并非逼迫研究者作出非此即彼的選擇。理解范式轉變的意義,要根植于庫恩如下的判斷:“范式改變的確使科學家對他們研究所及的世界的看法變了?!保?4)新范式的出現(xiàn)意味著我們關于對象的認識方式切實發(fā)生了改變,但并不代表過去的研究方法全然失效了。范式轉變的意義更多在于充盈我們對研究對象的理解,而不在于掩埋我們到達今日這一認識現(xiàn)狀的道路。

        回到遠讀與細讀的問題上,本文強調這并不是兩種截然獨立的研究范式。歸根結底,遠讀是一種多學科研究方法的融合,傳統(tǒng)細讀自然是其中一種。而理解閱讀媒介所扮演的角色,則是理解這一方法融合的關鍵所在。在如今的數(shù)字時代,與其說媒介是人的延伸,不如說人分布于媒介之中。在認知科學領域,已有眾多學者提出以“分布式認知”(distributed cognition)來解釋人類與技術的交互方式。所謂分布式認知,指的是主體對客體的認知發(fā)生不僅局限于個體之內,而是分布于媒介、文化以及社會等多種外部因素中(Michael Engestrom 42 43)。認知能力的分布并非簡單地將研究者的認知任務交托給搜索引擎、數(shù)據(jù)庫以及文獻分析軟件等種種現(xiàn)代媒介,而是意識到“認知任務分布于內部表征和外部表征之中,分布式認知活動源于二者的交互作用”(周國梅 傅小蘭150)。而細讀融入遠讀的方式,正是研究者通過閱讀媒介從而與文本進行多次交互所實現(xiàn)的:研究者可以利用遠讀從更大范圍去驗證細讀的猜想,而通過細讀,研究者反過來不斷地調整遠讀的方向。因此,遠讀對細讀的涵蓋亦可轉換為如下表達——遠讀是在閱讀媒介加持下的交互式細讀。遠讀不是對細讀的取代,而是對細讀在特定使用條件下所存缺陷的彌補。遠讀的出現(xiàn)宣告了新時代中細讀的變化,而非細讀的消亡。而基于上述論證,本文也確認了文學研究者之主體性在遠讀實踐中的重要地位。文學研究者作為遠讀方法的頂層存在,其主觀能動性在遠讀方法中仍然非常重要。沒有研究者的細讀,就沒有不斷精進完善的遠讀。如果失去身處頂層研究者的主體構思,僅憑閱讀媒介不可能產出有價值的文學研究。

        綜上所述,閱讀媒介是遠讀方法中具備改變認知功能的信息反饋裝置。他人研究、量化分析和構建模型是閱讀媒介三種不同的呈現(xiàn)方式,這三者都使得讀者意識到文學文本并非必須依賴親自細讀才能體會個中真意的“神圣文字”,文本可以從多個角度進行理解——他人研究將文本轉化為專家意見,量化分析將文本轉化為數(shù)據(jù),建構模型則是將數(shù)據(jù)轉化為系統(tǒng)。前兩者因為缺乏可驗證性、系統(tǒng)性和迭代性,因而產出的是一種靜態(tài)的認知改變。構建模型由于兼具這三個特性,因而是一種動態(tài)的認知改變。也就是說,研究者通過中層閱讀媒介所反饋的信息,去查看底層“原始材料”中為何會出現(xiàn)離群值,或調整閱讀媒介,或調整假設,最終產生有價值的文學批評。顯而易見,這種文學批評是通過改變研究者對文本的認知方式所達到的,離開閱讀媒介這個概念,很容易將遠讀僅僅理解為一種數(shù)字運算的過程。

        三、遠讀的未來:新文科的研究范式

        2019年4月29日,教育部、中央政法委以及科技部等多部委在天津聯(lián)合召開“六卓越一拔尖”計劃2.0啟動大會,建設新文科成為熱點話題。結合目前學界對新文科的討論,新文科之“新”,在于其融合新興產業(yè)領域、轉變傳統(tǒng)研究范式以及適應社會發(fā)展需求(王銘玉 張濤)。而作為融合了文學、統(tǒng)計學以及計算機科學等多學科研究方法的遠讀,正有成為新文科研究范式的潛力。

        當然,想要讓遠讀符合建設新文科的要求,我們仍有不少問題需要解決。首先,最關鍵的因素,即文學研究者該如何提出合適的問題。所謂合適的問題,指的是需要利用以及能夠利用遠讀去解決的問題。例如鑒賞陶淵明《歸園田居》中的詩人心態(tài),由于其文本量過小,加之心態(tài)這一目標難以量化,可能就不太適合使用遠讀。而大規(guī)模文本的問題就非常需要遠讀的方法,就像文學史研究一樣。本文甚至認為,大部分文學史研究,都有可能在運用遠讀后被重新改寫。

        而在提出合適的問題這一方面,目前國內較為常見的一種做法是,組成一個跨學科的團隊,由文學學者提出問題,再由統(tǒng)計學者將之轉化為統(tǒng)計模型,然后由計算機學者進行編程和計算,最后再由文學學者進行闡釋(項蕾等175)。團隊合作的方式能夠較好地彌補文學研究者缺乏數(shù)理知識背景的缺陷,但這也涉及一個難點,就是從文學學者所提出的文學問題,到統(tǒng)計學者(或者計算機學者)的實踐操作之間,究竟該如何轉換。為了填補這一學科之間的鴻溝,文學研究者是否需要了解一定的統(tǒng)計與編程的概念及方法?

        在本文看來,這一回答是肯定的。遠讀既然要發(fā)展為新文科,自然應當是由人文學者主導研究,而在這種情況下,主導者的跨學科思維就顯得非常重要。完全依靠團隊中理工科出身的學者來完成具體實踐是不夠的,從蘇真對俳句的研究中就可以看出,光是模型的迭代就同時需要文學、統(tǒng)計學以及計算機科學等多種學科知識的有機結合,這并不是一段段能夠獨立切割開來的任務流程,并不是說人文學者提出問題后就可以高枕無憂,等著統(tǒng)計學家與計算機學家生產出數(shù)據(jù)后再進行分析??鐚W科知識的結合是全過程的,而參與這一過程必然要求人文學者理解和掌握更多其他學科的知識。

        雖然這并不意味著文學研究者就必須成為統(tǒng)計專家或者計算機專家,但跨學科的知識掌握究竟需要多少才算足夠?這倒確實是一個亟待解決的問題。以編程這個問題為例,目前學界對此就有明顯的爭議。例如,有學者認為團隊合作就足夠了,人文學者并不需要掌握編程技術(Ore“To Code or Not To Code”)。而朗則建議人文學者需要了解一定的編程知識,同時也要具備實際操作的能力(朗蘇真 林懿52)。本文認同朗的觀點,而這也是本文提出閱讀媒介的基礎,即不同的認知工具會帶來不一樣的認知結果。莫萊蒂本人曾表示過編程對改變認知方式的重要性:

        我在年輕的研究生和同事身上看到,編碼賦予了他們一種我所不具備的,而且將來也不可能獲得的智慧和直覺。這種智慧體現(xiàn)在腳本編寫上。但是,在編寫腳本的過程中,某個概念也會逐漸成形。雖然這個概念往往不會以概念的形式呈現(xiàn),但是你能夠看到它就隱藏在編寫的腳本里[……]因此,我認為開展數(shù)字人文研究項目的高校,不管這些項目是大是小,都應該確保每個人都有機會獲得這種智慧。(丁斯曼 莫雷蒂36)

        這可以證明,編程或建模不僅僅是一種分析方法,更是一種認知工具。正是基于對認識方式的改變,研究者對諸如風格或流派劃分等問題才可能有全新的認識,因為類似的問題完全有可能轉化為統(tǒng)計學意義上的詞語特征問題。斯坦福文學實驗室(Stanford Literary Lab)所發(fā)布的《小冊子4》()就佐證了這一見解。在這一名為《2 958部19世紀英國小說的定量文學史:語義群集法》(“A Quantitative Literary History of 2,958 Nineteenth Century British Novels:The Semantic Cohort Method”)的文章中,莫萊蒂的兩位研究生利用算法提取并分析出近3 000本小說中的詞義群變化,判斷出19世紀英國小說敘事模式經歷了從“講述”到“展示”(from telling to showing)的變化,這一結果亦符合當時不斷擴大的社會空間的模糊性與流動性特征。因此,本文認為人文學者至少要了解其他學科的核心研究范式,從而獲得一種改變自身認知文學的能力,才有可能在學科融合的基礎上提出運用遠讀才能解決的重要問題。

        亟須解決的第二個問題是文學文本數(shù)據(jù)的匱乏。盡管量化或建模的工作可以利用人工完成(莫萊蒂的《哈姆雷特》關系網(wǎng)絡就是手工繪制的),但目前越來越多運用遠讀方法的研究已經需要依靠計算機來完成量化與建模的工作。而運用遠讀的前提是計算機必須能夠“讀到”文本,這就涉及文本的電子化。從目前來說,獲取電子化文本有兩種方式。第一種是利用現(xiàn)成的文本數(shù)據(jù)庫,例如谷歌圖書(Google Books)、青空文庫(Aozora Bunko)、古登堡計劃(Project Gotenberg),等等。但現(xiàn)有的數(shù)據(jù)庫未必包含研究者想要研究的文本,因此第二種方式則是研究者將想要研究的紙質文本轉化為電子文本。而為了實現(xiàn)紙質文本的電子化,研究者需要先掃描紙質文本,然后將獲得的掃描圖像進行分析處理,最終將其轉化為計算機能夠識別的字符,這一過程便是光學字符識別(optical character recognition,簡稱OCR)。

        然而當研究對象多達成千上萬本,甚至需要構建一個數(shù)據(jù)庫的時候,OCR就非常耗時耗力,這種工作往往需要以年為時間單位進行計算,這也是目前文本數(shù)據(jù)匱乏的重要原因之一。同時,OCR的識別率很大程度上依賴于文字檢測算法。就目前而言,OCR對現(xiàn)代印刷品的識別率較高,但對較為久遠的印刷品以及紙稿的識別率就比較低。除非文字檢測算法能夠取得更加重大的進步,否則當面對無法進行OCR的文本時就不得不考慮手動輸入,而這又加大了文本電子化的難度。以上兩種情況均可以考慮用外包(outsourcing)或者眾包(crowdsourcing)的方式來處理。外包,就是將文字識別、轉錄、矯正等工作交由專業(yè)的文字識別機構來完成,而眾包則是將該工作以自由自愿的形式交給公眾志愿者來完成,例如上海市圖書館開展的盛宣懷檔案抄錄項目,選取盛宣懷檔案中與辛亥革命相關的日記、文稿以及信札等紙質材料,供廣大民眾在線認領轉錄。

        最后便是研究成果的評價問題。因為遠讀方法本身是一種多學科方法的融合,因此對采用了遠讀的文學研究的評價工作就不能由單個領域的評審專家來做。例如,傳統(tǒng)文學論文期刊評審文學論文的過程基本上要先由編輯初審,再交給對應領域的文學專家多輪盲審,最終決定刊發(fā)與否。然而作為一個多學科合作的文學研究成果,單憑文學專家又如何能夠評判該成果所包含的統(tǒng)計學運算?同時,運用遠讀的文學研究很多時候會涉及計算機代碼的運算,而這些代碼往往是研究成功的關鍵所在,那么期刊的文學專家又該如何基于這些代碼去復現(xiàn)研究過程是否可靠?因此,面對新興的遠讀方法,文學期刊或許需要擴大盲審專家的學科領域。同時,學界還需要創(chuàng)建更多有能力評價人文學科與理工學科交叉成果的期刊,例如清華大學主辦的《數(shù)字人文》與中國人民大學主辦的《數(shù)字人文研究》,等等。學術期刊之所以重要,是因為其是學術研究成果最為核心的展示平臺。缺乏更多合適的平臺,遠讀便難以進入學界的視野中心,其中蘊含的多學科研究方法便難以得到推廣與理解,學科融合更將舉步維艱。

        不難發(fā)現(xiàn),遠讀方法極大地改變了文學領域的研究思路。本文試圖指出閱讀媒介是內嵌于遠讀方法中具備改變認知功能的信息反饋裝置,以此理解遠讀方法的出發(fā)點。研究者通過閱讀媒介所反饋的信息,改變自身認知文學文本的方式,進而改變了文學研究的方法。從他人研究、量化分析到建構模型,閱讀媒介的進化是遠讀方法演變的核心。在這一演變過程中,遠讀方法展示出對跨學科研究方法的融合,并揭示了這一融合的價值,最終指明了傳統(tǒng)文科向新文科轉變的可能路徑。文學研究者只有深入地去了解遠讀方法的核心,而不是止步于量化、數(shù)據(jù)與建模等概念,才能夠理解實踐遠讀方法的關鍵,以獲得遠讀方法對文學研究范式轉變的啟示。

        同時,我們也需要意識到,遠讀對整個文學學科的建制提出了更新的要求。建設新文科是文學學科發(fā)展不可逆轉的潮流,這是文學在面對當代科技沖擊時所作出的積極反應。不過新文科的建設并非是一朝一夕便能夠完成的,從遠讀方法的演變過程中可以發(fā)現(xiàn),學科間不同方法的借鑒與融合是一個需要反復探索的工作。為此,文學研究者既要更加重視跨學科合作,也要促進自身的思維轉變,理解其他學科的研究范式,做到取長補短。同時,學界也要為新文科的成果建立完善的評價體系,創(chuàng)造成更多的展示機會。唯有打通人文學科與其他學科之間的知識壁壘,才能為新文科的發(fā)展奠定堅實基礎,使文學研究在新時代煥發(fā)更強大的活力。

        猜你喜歡
        萊蒂研究者媒介
        夜行車
        綠洲(2022年4期)2022-02-24 07:22:39
        高等教育中的學生成為研究者及其啟示
        100件東西
        媒介論爭,孰是孰非
        傳媒評論(2019年7期)2019-10-10 03:38:32
        研究者稱,經CRISPR技術編輯過的雙胞胎已出生??茖W將如何回應?
        英語文摘(2019年2期)2019-03-30 01:48:40
        書,最優(yōu)雅的媒介
        好日子(2018年9期)2018-10-12 09:57:18
        研究者調查數(shù)據(jù)統(tǒng)計
        中華手工(2018年6期)2018-07-17 10:37:42
        歡迎訂閱創(chuàng)新的媒介
        醫(yī)生注定是研究者
        論《開普雷斯》中萊蒂女士的危險征程
        开心五月骚婷婷综合网| 8ⅹ8x擦拨擦拨成人免费视频| 国产精品video| 精品丝袜国产在线播放| 国产麻豆一区二区三区在| 吃奶摸下高潮60分钟免费视频| 欧洲一卡2卡三卡4卡免费网站| 久久半精品国产99精品国产| 成人激情视频一区二区三区 | 国产一区二区三区三区四区精品| 中国女人内谢69xxxx免费视频| 欧美日韩国产色综合一二三四| 免费美女黄网站久久久| av免费在线免费观看| 青春草在线视频免费观看| 亚洲黄视频| av最新版天堂在资源在线| 加勒比日韩视频在线观看| 99精品久久精品一区二区| 亚洲欧美日韩综合久久久| 国产v精品成人免费视频400条| 亚洲av手机在线观看| 狠狠摸狠狠澡| 久久人人爽天天玩人人妻精品| 日本a在线播放| 日本久久黄色高清视频| 亚洲中国精品精华液| 亚洲处破女av日韩精品| 亚洲无码夜夜操| 亚洲av毛片在线播放| 国产suv精品一区二区四| 国产欧美日韩一区二区三区在线| 国产情侣一区在线| 高清不卡av在线播放| 人人妻人人做人人爽| 久久人人爽人人爽人人片av麻烦| 2021精品综合久久久久| 丝袜av乱码字幕三级人妻| 少妇粉嫩小泬喷水视频| 人与嘼av免费| 日本啪啪一区二区三区|