亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        自我重復與東亞文學現代性,1900—1930①

        2018-07-10 11:17:04霍伊特戴安德朱遠騁
        山東社會科學 2018年7期
        關鍵詞:浪漫主義小說文本

        [美]霍伊特·朗 [美]戴安德 [美]朱遠騁 撰  汪 蘅 譯

        (芝加哥大學 東亞語言與文化系,美國 芝加哥 60637;賓夕法尼亞大學 沃頓商學院,美國 賓夕法尼亞州 19019)

        定義上的模糊對文學學者如何理解類型必不可少:任何文本的身份識別總是多元決定(overdetermined)的。同樣重要的還有這樣一種觀念,認為幾組文本能夠通過將自己與其他文本區(qū)分開而保持一致。本文中我們使用計算方法,認為對于現在列在“私小說”和浪漫主義文學標志下的敘事實踐,詞匯重復的加強趨勢是個顯著的一致點。我們所說的趨勢比所有自我指涉的作品都有的基本特征弱,但比僅有少量作品才有的次要特征強。這一趨勢在兩種文化語境中都存在,這促使我們思考重復在文學風格中的作用,以及其作為一種文學風格的作用。一方面,我們認為重復指明了與私小說和浪漫主義文學都相關的具體的形式轉化:寫作的白話化和對西式語法結構的采納。另一方面,我們認為重復也與內容層面上的變化有關,尤其和重視敘述心理現實主義和精神失常有關。在這方面,作為風格的重復是一種表面現象,辨識了在自我的智識成形(figuration)和確定的語言戰(zhàn)略之間發(fā)生的一組更深刻復雜的相互作用。我們認為,透過計算察看這個表面,開啟了新的比較框架,可分析東亞文學現代性的空間內這些相互作用的效用。

        我們的論證分為三部分。第一部分,我們建立理論基礎,將重復性與學者早先歸于日本私小說和中國浪漫主義小說的一組定性特征(qualitative traits)相聯系。在收集了一組可測量的、抓住了語言中不同重復種類的語言特點后,我們測試了這些特點和同時期小說作品相比在多大程度上是這些類型的典型特征。第二部分,過去在審美、社會語言學和心理學方面對重復的學術研究認為,重復對意義構建十分重要,我們借鑒這方面的研究,討論了我們的實驗發(fā)現。通過評估文學評論家和語言學家如何嘗試為語言中的重復建立模型、對比定性和定量建立模型的不同優(yōu)勢,我們賦予定量模型歷史意義,并表明它已經與之前從語言表面解讀反常心理過程癥狀的努力緊密相關。第三部分,我們轉向幾個在分析中確認的重復最多的段落,思考如何從文本表面解讀作為風格的重復。我們確信有多種解讀方式:作為風格趨勢,連接跨越文化和語言邊界的文學關系;作為出于不同審美目的而由作者激活的趨勢;最后,作為建立在語義意義或意識形態(tài)基礎上的比較框架的補充。

        一、作為趨勢的重復(Repetition as Tendency)

        在日本,文學的自我塑造(self-fashioning)這一現代事業(yè)是在19、20世紀之交后嚴肅開啟并于1910年代繁榮起來的。這種寫作追溯性地集合在“私小說”(shishōsetsu)的標簽下,其中許多將自然主義的具象邏輯(representational logic)轉化為癡迷于記錄自我的內心思想和日常經驗,無論其有多令人震驚或庸常。在一位日本評論家1909年所稱的這個“自白的年代”,中國“五四”一代作家中有許多當時以學生身份居住在日本。*Shimamura Hōgetsu, “Jo ni kaete jinseikanjō no shizenshugi o ronzu” [By Way of a Preface: On Naturalism and my Weltanschauung]. Cited in Fowler, 100.其中一些回國后,于1921年組成了創(chuàng)造社,如今這個文學群體與考察并探索個人主體性的浪漫主義興趣緊密相連。私小說和浪漫主義作家一起產生了形形色色的自我指涉寫作,對日本和中國現代小說史都極為重要。

        但是正典產生了一致性問題,這些歸類也一樣。數十年來對這些作家的學術研究表明,沒有什么單一因素能界定其小說。評論家分離出貫穿其中的諸多意識形態(tài)趨勢,質疑其時間內聚性(temporal cohesion),并將其敘事小說的地位問題化,以此對文本一致性提出爭議。*對這一評論的透徹分析,尤其對伊藤整(Ito Sei)、平野謙(Hirano ken)和小林秀雄(Kobayashi Hiedeo)的貢獻,見Fowler, chapter 3; 以及Irmela Hijiya-Kirschnereit, Rituals of Self-Revelation:Shishōsetsu as Literary Genre and Socio-cultural Phenomenon (Cambridge, MA: Council on East Asian Studies, Harvard University, 1996), chapter 9.私小說和浪漫主義小說是否是有意義的類型標簽依然模糊,這甚至導致了極端的相對主義主張,全然否認存在一致的形式或類型;聲稱這些標簽只是不著邊際的話語和意識形態(tài)范式,可通過它閱讀任何文本。*參見Tomi Suzuki, Narrating the Self: Fictions of Japanese Modernity (Stanford, CA: Stanford UniversityPress, 1996), 5-6.有的學者雖然沒有否認此類文學中存在變化,卻從相反的假設出發(fā),將私小說和浪漫主義小說看作有明確形式或實證模式的類型。他們關注敘事結構、修辭風格或社會和媒介語境,試圖分離出一套能維系這些文本的特征。*中國的情況參見Edward Gunn, Rewriting Chinese: Style and Innovation in Twentieth-Century ChineseProse(Stanford: SUP, 1991); Liu, Translingual Practice; Haiyan Lee, Revolution of the Heart: A Genealogy of Love in China, 1900-1950(Stanford: Stanford University Press, 2007); 及RaymondHsu,The Style of Lu Hsun: Vocabulary and Usage (Hong Kong: Centre of Asian Studies, University of Hong Kong Press, 1979).日本的情況參見Fowler, Rhetoric of Confession; Hijiya-Kerschnereit, Rituals of Self-Revelation; 和Barbara Mito Reed, “Language, Narrative Structure, and the Shōsetsu” (diss.Princeton University, 1988)

        我們在本文中的目標并非要統(tǒng)轄這一持續(xù)的類型辯論,這樣做會有失我們作為評論家的身份。沒有解決這一爭論的單一途徑,因為對這些類型標簽本體論現實(ontological reality)的辯護或反對都建立在對比較單位的不同假設上。是作者、理想的讀者,還是文本的某些方面?在這里,我們明確將注意力集中于共同的語言模式。它們提供了比較的范圍,包含數以千計的文本和多種語言語境。它們也提供了粒度(granularity)層面,可通過這個層面觀察匯聚一起的風格趨勢,以實例說明作為文學建構的現代自我?;蛘呓栌酶ヌm克·莫雷蒂對布爾喬亞風格的分析,作為由“無意識的語法模式和語義聯合、而非清晰明確的觀念”組成的“精神狀態(tài)”。*Moretti, The Bourgeois: Between History and Literature (London: Verso, 2013), 19.我們需要回答的第一個問題是:在“私小說”和“浪漫主義”標簽下的小說中是否存在任何這種精神狀態(tài)。

        最初提到,有幾個高階現象(higher order phenomena)表現了這組小說的特點。學者們早已注意到它的興起分別與日本的“言文一致”(genbun-itchi)和中國的白話文運動影響下現代書面白話文的強化密切相連。還有人指出與白話化同時發(fā)生的對舶來的敘事技巧和歐化語法的廣泛實驗,但與前者迥然不同。*中國的情況參見Liu and Gunn. 日本的情況參見 Kisaka Motoi, Kindai bunshō seiritsu no shosō[Various Aspects of the Formation of Modern Style] (Osaka: Wazumi shoin, 1988), Chapter 3. 書面日本語的方言風格和概念結構及語法結構轉移之間的辨別,見Karatani, 49-51. 通常認為這二者是“言文一致”(genbun itchi)的新文學語言的發(fā)展中既有差異又有聯系的兩個運動。一方面,這些舶來品包括自由間接引語、漫長的內心獨白、拒絕情節(jié)設置等。*情節(jié)化方面,私小說曾被形容為“沉悶乏味”的描述,除了“某人的生活別無他物”(Yasuoka Shōtarō, 25); “片段、短促”(Yokomitsu Ri’ichi, 52) ,或者個人體驗的“隨機”記敘 (Kume Masao, 46); “用于私人表達的媒介,受損于對結構太關注”(Ito Sei, 63); 還有,“一串印象主義的沉思”(Uno Koji, 7)。上述引文全部引自Fowler。中國方面,郁達夫的作品被單挑出來用于強調“不完整的、無目地的、充滿不確定的”旅程。引自Liu, 149,郭沫若對他一部作品的初期批評的著名回應:“將他的作品看作有開始、高潮和結尾的簡單敘述是錯誤的——他是在試圖以夢的象征主義的形式表現無意識?!币訪iu,131。另一方面,也包括使用人稱代詞、物做主語、西式句法和對主/賓關系夸張的說明等。確實,日語和漢語作為非屈折語,傳統(tǒng)上對于句子中是否具有語法上的主語有很大靈活性,很多人關注在創(chuàng)造新的自我敘述結構的同時,這兩種語言是否會被施加影響并改變外形。在日語的情況中,有人認為這種靈活性使得敘事權能(narratorial authority)和人物視角間發(fā)生滑移(slippage),模糊了私小說作為現實主義小說的身份。*見Reed, 144-169; Fowler, Chapter 2; and Liu, 153-54.

        雖然這些復雜的文學語言發(fā)展為理解自我指涉小說的獨特性提供了重要基礎,但它們作為特征并不能很好地作出衡量,也不一定能將此類小說同其他也采用相仿的白話風格或西式語法結構的當代類型分隔開。因此我們的目標是找到一組定量測量方法,能讓我們比較數百個文本,同時有可能在自我指涉小說中挑出能指示這些高階現象的語言趨勢。這些現象曾經捕獲了其對文學語言影響的某些方面,現在實際意味著我們要為它們創(chuàng)造有效的指標(proxy)。從情節(jié)和敘事的角度,我們推斷,相比情節(jié)驅動的作品及其更動態(tài)的敘事焦點,這些文本更強烈的心理學焦點可能更適于語義場的收縮和更小的詞匯多樣性。換句話說,私小說和浪漫主義小說是否傾向于將詞匯焦點集中在更小的詞匯表上?另外,從風格的角度我們推測,向白話文寫作轉移的一個結果可能是語言中重復和冗余增加。采用西式語法特征,尤其是每句話中指明主語和賓語這一傾向可能只會進一步加劇這種趨勢。

        雖然有些推斷只是合理的直覺,但是在與書面詞語相關的情況下如何理解口述性這方面,我們對白話文寫作的假設有很長歷史。如果我們將冗余理解為某些語言單位(即字母、音素、語素)的重復,要么因為它們在語境上彼此依賴,要么因為它們強化了信息的可信性,那么所有的自然語言本質上都是冗余的。*實際上有人辯稱冗余的水平甚至在所有語言中都很穩(wěn)定。參見Marcelo A. Montemurro and Damián H. Zanette,”Universal Entropy of Word Ordering Across Linguistic Families.” In PLoS ONE 6(5): e19875.它們建立于其上的規(guī)則和慣例允許我們預測——例如——跟在另一個單詞或一系列單詞后的那個詞,并因此能夠省去上下文暗示的詞。許多人認為這種內置的語言冗余一般在口語和口頭文化中更為極端。瓦爾特·翁(Walter Ong)在米爾曼·帕里(Milman Parry)關于當代南斯拉夫口傳史詩的研究基礎上認為,固定套話表達和重復有助于口頭文化里的記憶,在口頭講述的話語里,“大腦必須前進得更慢,緊跟注意焦點,其中大部分是它已經處理過的內容。冗余,即重復剛說過的話,保證說話人和聽者在軌道上?!?Walter Ong, Orality and Literacy: The Technologizing of the Word [1982] (1991): 35-40.研究對話的語言學家指出“重復不僅位于特定話語如何被創(chuàng)造(在說話者之間)的核心,而且位于話語本身如何被創(chuàng)造的核心”;這個觀念也被文學學者采用,以確定西式文本中口語風格的語言標記(markers)。*Deborah Tannen, Talking Voices: Repetition, Dialogue, and Imagery in Conversational Discourse(Cambridge: Cambridge University Press, 2007), 49. 最近一篇對文學中重復和口語風格研究的概述文章見Marissa Gemma, Frédéric Glorieuz, and Jean-Gabriel Ganascia, “Operationalizing the Colloquial Style: Repetition in 19th-Century American Fiction,”in Digital Scholarship in the Humanities 2015 fqv066 (doi: 10.1093/llc/fqv066),本文也是對這一工作進行定量擴展的極為出色的嘗試。我們想知道,在何種程度上,口述性的這種重復特質在日語和漢語文學新的白話風格中顯明自己?

        幸運的是,語言學家對重復的持續(xù)興趣產生了大量定量測量,以捕捉冗余和詞匯多樣性的各個方面。其中許多測量方法,尤其單詞為主要分析單位的測量,其共同來源是1930年代到1950年代間在美國和歐洲研究的心理語言學領域,這段時間的特點是人們對用于教學或臨床評估的詞匯多樣性測量方法的開發(fā)的廣泛興趣。研究人員想知道,考慮到特定的寫作或言語樣本,是相同單詞以更高頻率重復得更多,還是許多不同單詞以較低頻率使用?1935年,喬治·齊普夫闡述了以他名字命名的法則,聲明在給定的自然語言樣本中,詞頻排名的分布遵循冪定律,因此任何單詞的頻率與其在頻率表上的排名成反比(也就是說,最常見的詞出現的次數是排名第二的常見詞的2倍,以此類推)。1938年,約翰·B·卡羅爾開發(fā)了多樣性測量方法,其基礎是觀察到單詞多樣性隨著文本規(guī)模的增長必然接近極限。他的測量關注的是常見詞在一篇文章中傾向于重復的頻率,他斷言這樣的測量方式有助于評估人的言語行為與語言規(guī)范間的相對遵循度。*John Carroll, “Analysis of Verbal Behavior,” in Psychological Review 51 (March, 1944): 102-119.第二年,溫德爾·約翰遜引入了類符—型符比(TTR):文本中獨特的單詞的數量除以總單詞量。他猜想這個比例可以作為“窘迫或迷失程度的測量方式”起作用,而且可以幫助定量“一根筋”或者“偏執(zhí)狂”現象。*Wendell Johnson, Language and Speech Hygiene: An Application of General Semantics, Outline of a Course (Chicago: Chicago Institute of General Semantics, 1939), 11.1940年代見證了更多建立在這些基礎性測量方法上的嘗試,以便評估給定文本片段中的詞匯有多重復、統(tǒng)一或集中。簡單來說,其中有些測量方法擁有對文本長度變化較不敏感的優(yōu)勢,能夠減弱或忽略罕見詞的影響。

        引人注目的是,它們還和一種在1950年代變得非常有影響的測量方式共享數理關系:熵,它代表了從另一角度解決重復問題的測量方法。有些心理語言學家追隨克勞德·香農和華倫·韋弗在貝爾實驗室的研究,開始用更基于概率的(probabilistic)方法處理重復,不僅分析使用的單詞的多樣性,還分析單詞先后順序的可預測性,也稱為“轉移概率”(transitional probabilities)。他們通過冗余和信息的雙透鏡重新聚焦了有關重復的觀念。在一個信息論文本中,一條消息的冗余量(它的熵)反應了其中的“信息”量。此處信息指基于所有可用組成單位基礎上的消息的可能性,也是在統(tǒng)轄所有組成單位排列方式的現存規(guī)則或模式條件下、所有的單位組合方式的可能性。簡單說,信息代表了初始限制條件下,一條消息能以多少種不同方式構建。那么,信息極其豐富的語言也許就是其中任何給定單詞都有均等機會出現在彼此旁邊的語言。這種人造語言中,每條消息都攜帶新信息,因為每條消息都和它之前那條同樣隨機、不可預測。這些消息也將完全無法理解,這也是為什么所有自然語言都有某些內置的冗余。

        盡管熵證明對許多心理語言學家而言是理論上富有成效的概念,但是要用任何整體方法測量它也確實非常棘手。它不僅隨著測量中的文本長度變化,還隨著研究中的序列長度和分析單位變化。序列變長時,用于預測本序列中下一項目隨機性的潛在組合的數量也會變大。因此,熵會隨文本或語料庫被測部分的多少而發(fā)生偏向,也會隨著單位數量及其潛在組合數量的增加而越來越難以處理。從實踐中看,這意味著初期將熵用于文本受限于較小的分析單位(即字母、音節(jié)),因為人們可能期待在給定的部分文本中看到更完整的潛在組合的區(qū)間。*可參見Wilhem Fucks的研究,他在1952年嘗試將信息論用于文體測算,并比較了散文和詩歌中音節(jié)的熵?!癘n the Mathematical Analysis of Style,” in Biometrika 39, no. 9 (1952): 122-129.這也意味著焦點保持在個體的詞或詞對上,就像古斯塔夫·赫爾丹用熵推斷作家在寫作中如何操縱表達法的可變性以避免不恰當的重復。*Gustav Herdan, Language as Choice and Chance (Groningen: P. Noordhoff, 1956), 167.受限于個體單詞層面時,熵僅僅捕捉樣本全部單詞在該樣本中可用的不同單詞中的分布。這種情況下,熵最低的段落就是每個單詞都獨特、不同的段落;熵最高的段落中每個詞都相同,因此高度冗余。*其他關于熵作為有效的詞匯豐富性測量方法的評論文章,可見P. Thoiron, “Diversity Index and Entropy as Measures of Lexical Richness,” in Computers and the Humanities 20, no. 3 (1986): 197-202; 以及 David Hoover, “Another Perspective on Vocabulary Richness,” in Computers and the Humanities, 37, no. 2 (2003): 151-178.

        測量詞匯多樣性和熵的不同方法雖有局限,但也確實提供了量化文本重復量的基線。用這個基線,我們首先確定了與同時期寫作的其他小說相比,私小說或浪漫主義小說是否顯示了夸張的重復傾向。白話風格、西式語法結構和心理聚焦相結合,是否轉化為更狹窄的單詞范圍并重復得更多?為了回答這個問題,我們首先為每種語言構建了語料庫。在日本文學方面,我們收集了學者專門指定或解讀為私小說類型的約65種文本。我們還收入了自我指涉或心理作品,其作者與此種類型有關或只暫時以此種寫作模式做實驗。作品大部分出版于1910年代和1920年代,約30位作者。之后我們收集了規(guī)模相仿的通俗語料庫,我們期待它們在內容和敘事焦點層面明顯偏離,但在文學語言層面并不如此。它主要是1920年代和1930年代由現代白話風格寫就的高度情節(jié)化的歷史小說和偵探小說。*私小說語料庫通過非原始的英文和日文來源創(chuàng)建,包括Fowler; Hasegawa Izumi, “Meiji?·Taishō?·Shōwa shishōsetsu sanjūgo sen” [A Selection of 35 I-Novels from Meiji, Taishō, and Shōwa], in Kokubungaku: kaishaku to kanshō 27, no. 14 (1962); Wataskushi shōsetsu handobukku [The I-Novel Handbook], Akiyama Shun and Katsumata Hiroshi, eds. (Bensei shuppan, 2014). 與私小說有關的作者的其他文本的選擇是通過Nihon kindai bungaku daijiten(Encyclopedia of Modern Japanese Literature日本現代文學百科全書)辨識,基于其自傳性內容的程度來選擇。最后,還收入了幾部標志性的自然主義風格文本,但并不被認為是私小說:例如德田秋聲(Tokuda Shūsei’)的《粗暴》(Arakure)和有島武郎(Arishima Takeo)的《某個女人》(Aru onna)。文本來自青空文庫(Aozora Bunko)(日本的古登堡計劃)或由我們自己數字化。通俗作品語料庫從青空文庫建立,包括類型作者的作品,如海野十三(Unno Jūza)、 甲賀三郎(Kōga Saburō)、 吉川英治(Yoshikawa Eiji)、 中里介山(Nakazato Kaizan)和野村胡堂(Nomura Kodō)??稍诒疚乃降腄ataverse找到語料庫作品標題完整列表和有關元數據。需要注意,為與中文的情況對等,我們用在本次實驗中的比較語料庫的種類因此受限,未來用同時期純粹的現實主義小說與私小說作比較將很重要。本項目還創(chuàng)建了一個無產階級小說語料庫,但為了簡化分析,不得不丟棄不用。

        因為缺乏對等的通俗類型小說語料庫,我們對中國文學采取了略為不同的方法。首先,我們確定了與創(chuàng)造社密切相關的主要“五四”作家的100多個浪漫主義文本,包括郁達夫、郭沫若和張資平等的1920年代作品。不過我們的控制組是一組100本同時代通俗文學作品,例如歷史演義小說和“鴛鴦蝴蝶派”故事。*浪漫主義語料庫的核心是鄭伯奇為影響深遠的《中國新文學大系》第五集創(chuàng)造社文學卷所寫的導論中提到的文本和作者。(鄭伯奇編輯:《中國新文學大系》第五集,良友圖書印刷公司1981年版)。在這部經典文集中,我們主要關注1925年之前的作品,以避免與“五卅慘案”后郭沫若開始提倡的政治化的、傾向大眾的作品混雜??刂平M語料庫的核心基于“鴛鴦蝴蝶派文學”重要作品列表,參見魏紹昌編輯的《鴛鴦蝴蝶派研究資料》卷二(上海文藝出版社1962年版)。盡管如此,許多文本可能不是嚴格意義上的“鴛蝴派”派作品,而是更通俗的(商業(yè)上成功的)《三國演義》風格的歷史演義小說。最初我們的項目目的是比較1930年代的浪漫主義小說、通俗小說和社會主義現實主義小說,但最后這個語料庫證明難以根據重復的脈絡與浪漫主義加以辨別,部分原因是1930年代的社會主義現實主義的文學風格受到“五四”時期風格發(fā)展的深刻影響。我們希望避免歷時比較引起的影響問題,因而將社會主義現實主義語料庫丟棄不用。將來研究中文類型相互作用的項目將包括這個社會主義現實主義語料庫,還有魯迅(其早期小說與浪漫主義同期)的作品、1920年代末和1930年代初所謂新感覺派的自戀體小說。雖然選擇這些作品是因其高度情節(jié)化的特質以及缺乏心理聚焦,這和日本的情況一樣,但其中大多數也以舊白話風格寫作,這同浪漫派作家發(fā)展出的白話文模式顯著不同。所以這種情況下是從內容和語言風格方面作比較。盡管有此差異,我們在兩種情況下的目標都是要明確,對重復和冗余的各種測量方法是否足以界定私小說和浪漫主義小說有類型上與眾不同的傾向,超越了紙頁上字詞的意義。

        因此下一步是應用這些測量方法。因為像TTR和熵這樣的測量方法往往與所測段落的長度高度相關,所以對它們的應用要使結果獨立于文本長度。尤其對這兩種方法,這意味著將文本分為1000字片段;測量這批片段的TTR和熵,包括停用詞(stopwords);再計算文本所有片段的平均值、標準差和累計和(方程1)。

        標準差告訴我們所有語塊(chunks)TTR和熵的波動,累計和告訴我們數值趨于比均值高或低多少。我們意識到我們的熵值測量法與個體詞的邊際分布相關,考慮到其序列本質,也在詞的聯合分布基礎上計算了熵。借自伊奧阿尼斯·孔托伊阿尼斯的這個方法采取非參數角度,捕捉詞序或字序間的遠程關系(long-range dependencies)。*I. Kontoyiannis, “The Complexity and Entropy of Literary Styles,” in NSF Technical Report, no.97 (June 1996-October 1997): 1-15.這種情況下它是非參數性的,因為沒有和馬爾科夫模型為基礎的熵測量的較小的語境(一元模型,二元模型等)綁定。因此,對文本的單位(我們的研究里就是單獨的字)序列中每個位置i來說,這個方法尋找始于位置i、不存在于i之前的最長序列。例如,在i=100的位置,它將尋找之前100個字當中出現的最長的字序列。不同的i的長度用于估計整個文本的熵。這里我們選擇關注個體音標和漢字的序列,這樣一來,較低熵值就說明相同字序列的重復更多。雖然用于找到配對序列的窗口的規(guī)模依然取決于我們最短文本的長度,使得到的熵估計(entropy estimates)有所偏差,但估計值本身與文本長度無關。

        我們擔心僅有TTR和熵給重復提供的窗口太窄,另外應用了兩個數理上與熵有關但原本作為詞匯多樣性指標而創(chuàng)造的特征。第一個是喬治·尤爾的“特征K”,于1944年開發(fā)出來測量文本中的詞匯重復性或一致性。它依靠詞序和頻率做計算,將所有詞頻之和與特定頻率單詞的數量相關聯,尤爾的設計使之獨立于樣本規(guī)模。*參見George Yule, The Statistical Study of Literary Vocabulary [1944] (Hamden, CT: Archon Books, 1968). 測量計算如下:10,000×(M2-M1)/(M1×M1). M1是單詞類符的數量。給定序號頻率上的單詞數乘以序號的平方 (例如,所有出現2次的詞乘以22) ,然后所有數值相加得到M2。它還預設特定文本樣本中詞的發(fā)生遵循泊松分布(Poisson distribution),將詞作為任何間隔(即樣本長度)中以已知平均比率發(fā)生的固定事件(fixed event)處理。赫爾丹后來校正了這一推測,開發(fā)了調整后的K,在60年代被廣泛用作詞匯集中度的風格測量方法,包括嘗試分析精神分裂語言。*Juhan Tuldava, “Stylistics, Author Identification,” in Quantitative Linguistics: An International Handbook, ed. Reinhard K?hler, et. al (Berlin: Walter de Gruyter, 2005), 374. 另見Arthur Holstein, “A Statistical Analysis of Schizophrenic Language,” in Statistical Methods in Linguistics 4 (1965): 10:14.我們納入的另一個特征是詞匯集中度指標,也是在1944年,由法國語言學家皮埃爾·吉羅開發(fā)的眾所周知的“吉羅的C”,表示文本累積詞頻的比例由文本中最常見的50個“實義”詞(content words)所占據。高指標值表示“作者將注意力集中在相對狹窄的、具有完全意義的單詞范圍內”,反過來也證明了“主題的緊湊、主旨的集中,(和)某些情況下的現成句子”*Tuldava, 375. 吉羅的C是將最常用的50個詞的頻率相加再除以單詞總數。。這個測量方法比尤爾的K對文本長度敏感,因此解釋力較弱,但它的解釋更直觀。二者都有無需將文本分為小塊的益處。重要的是,二者都和熵類似,依賴相對詞頻之和。*關于尤爾的K和熵值測量方法的關系,參見Kumiko Tanaka-Ishii and Shunsuke Aihara,“Computational Constancy Measures of Texts,” in Association for Computational Linguistics 41, no. 3 (2015): 481-502.

        我們逐一檢查了這些測量方法,發(fā)現幾乎所有方法都擅長將私小說和浪漫主義小說與同時期通俗作品區(qū)分開。日語語料庫平均TTR和熵的分布表明,私小說一般在二者的計數中得分都較低,表明詞匯多樣性較低、重復較多。整體上,我們發(fā)現多數測量方法表明這種小說模式有更多重復性,而且令人驚訝地指出這個趨勢似乎跨語言成立。*我們用成對的t檢驗和邦費羅尼校正來確定每個特征分布間的顯著性。顯著性表明比較的兩個樣本中每個特征的均值并不相等。顯著性在p<= .05 水平上評定。數據行與指定的類型標簽呼應,數據列與預測的類型標簽呼應。在漢語作品方面,分離也同樣明顯。(圖1)

        圖1 平均熵按類型分布的小提琴圖。寬度代表一個類型中有特定平均熵的文本的相對比例。日本的情況(左),我們看到熵低于通俗作品的私小說的段寬(band)更窄。中國的情況(右),我們看到熵低于通俗作品的浪漫主義小說的比例大得多

        尤爾的K和吉羅的C也揭示出兩種情況在統(tǒng)計學上的顯著差異,反映出自我指涉小說詞匯一致性和緊密型的傾向。*中文情況中這兩個測量方法不那么可靠,原因在于二者和長度更相關。這可能與中文語料庫文本長度的變化大有關系,語料庫包括一些非常短的文本和一些特別長的文本。有趣的是,自我指涉小說也傾向于有更多重復性的極端波動,它們的TTR和熵的標準差更高也表明這點。這些文本平均來說更為重復,但也顯示出在較少重復的段落和較多重復的段落之間更劇烈的轉換。有個測量方法沒有顯示范疇間明顯差異,即孔托伊阿尼斯的熵測量法,這表明沒有哪個文本組比其他組有明顯更廣泛的依賴性。不過,與其他特征聯合分析時,它確實有助于確認某些以詞為基礎的測量方式無法捕捉其重復方式的自我指涉文本,后面我們將回到這點。我們驚訝地發(fā)現,整體而言大多數測量方法都指向此種小說模式中更多的重復性,而且重要的是這一趨勢似乎跨語言成立。

        因為僅憑這些方法無法解釋引起重復增加的可能原因,所以下一步我們就用粒度更細(finer-grained)的詞匯和語法特征給它們做三角測量。也就是說我們?yōu)榘自掞L格、語法結構和自我指涉的內容等高階現象尋求額外的測算指標。包括明顯的事物,如敘事模式(是否第一人稱)、與思想感情相關的動詞的比率。*我們計入的日語詞如下:思、感じ、考え、心持、気分、心配、気持、考へ;我們計入的中文詞如下:想、覺得、知道、心里、曉得、精神、想起、感到、覺、感覺、思想、感情。也包括可能與西式語法和翻譯作品的影響相關的特征:第一或第三人稱代詞的比率;標點符號比率;僅有句號的比率;語法功能詞(停用詞)比率。所有這些特征就本身而言,除了敘事模式,都證明是整體類型差異的可靠指標??紤]到私小說和浪漫主義小說的自白和唯我本質,我們推測代詞和“思想/感情”動詞都是如此,但是停用詞(這些作品中更常見)和標點(較少)就不明顯。至少在日本的情況中后者的一個可能原因在于這些作品包含的對話更少。*我們在中文情況中無法確定這點,因為有些通俗文本的OCR結果不太可靠,需要進一步校對,保證標點精確反映原始文本。我們可以想象,自我沉思不會留給閑聊多少時間。比照我們對重復性的測量,將這些粒度更細的特征繪圖,最有趣的發(fā)現是熵和表達沉思、感情和精神注意力的動詞比率間存在相關。這個關系對日本和中國都成立,無論作品是第一人稱還是第三人稱,在每個類型內也成立。(圖2)

        比較私小說和浪漫主義小說文本中最冗余的100個段落和最不冗余的100個段落,揭示出最為冗余的段落中有些“思想/感情”動詞尤其明顯。*為了確立特殊性,我們用卡方檢驗比較了100個熵能最高的語塊和100個熵能最低的語塊中的詞頻。出現4次以下的詞被排除。低熵私小說最特殊的思想/感情詞是:考え(思考) 和幾個思う(思考)的詞性變化,而浪漫主義篇章中它們是心(心/腦)和知道(知道),卡方測試值確認這些都位于前5%最特殊的詞當中。這些結果表明簡單的詞匯重復和認知表現之間的強相關。

        圖2 比照日本和中國的平均熵繪制的“思想/感情”詞比率圖。線性回歸線按類型適配。兩種情況下我們都能觀察到,隨著“思想/感情”詞比率增加(橫軸),文本平均熵下降(縱軸),表明更多詞匯重復

        確認重復是私小說和浪漫主義小說明確傾向的最后一步是將所有個體特征合為一個單獨模型,以評估它們在區(qū)分這部小說和通俗作品時的相對權重。我們想知道,這樣的模型,只靠熵、TTR、“思想/感情”詞等測量方法,能多好地預測文本類型。使用有最佳子集選擇(subset selection)的邏輯回歸分類符(classifier),我們確認了我們在個體特征上看到的情況。*邏輯回歸分類器使用一套獨立變量(此處即特征),從范疇上決定作品的類別(或類型)。它考慮這些特征在語料庫子集中的分布,并確認它們在不同類型中是否差異顯著。最佳子集挑選會嘗試特征的每種組合可能性,以界定兩組文本中最具區(qū)分性的組合。雖然在計算上難以處理十個以上的特征(即1000個組合),但我們還是得到了一個相對較小的特征集。我們用了一組不同的起始特征多次運行分類,“最佳”特征幾乎總是相同,從而讓我們對這一程序的可靠性有了信心。分類器用這些特征來確定之前未見過的作品的范疇。在日本的情況里,分類符猜到文本指定類型的準確率為樣本的80%。事實上,它只需要孔托伊阿尼斯熵的測量法和思想/動作詞比率、停用詞和句號就實現了這一精確性。這不是說其他特征就沒有辨別力,只是說明沒有它們分類符也能表現得一樣好。在中國這邊,模型幾乎每次都猜到正確類型(表1),只需要平均熵和尤爾的K就可做到。這里,只需詞匯的冗余和一致性就足以分開兩個語料庫。不幸的是,和日本的情況不同,我們無法為語言差異做控制,這就很難確定重復性主要是語言效應,還是心理敘述的影響也起了作用。不過,兩個結果都支持這個觀點,即重復對于私小說和浪漫主義小說作家所做的實驗而言至關重要。作為自我重復的沖動,匯集起來產生了自我指涉寫作類型的審美潮流看起來明顯跨越了不同文化和語言語境。

        日語語料庫 通俗小說私小說通俗小說5.11.9私小說0.95.0

        漢語語料庫通俗小說浪漫主義小說通俗小說12.30.1浪漫主義小說0.15.6

        表1我們的邏輯回歸分類符的混淆矩陣。這些矩陣用10倍交叉驗證作出,表示分類符平均多久預測一次
        設定分類標簽。中文的情況里,我們看到“通俗”作品幾乎完全沒有被分類為“浪漫主義”作品,反之亦然。
        在日文情況里,“通俗”作品與“私小說”區(qū)分開略為困難

        二、解讀重復(Reading Repetition)

        在20世紀早期自我指涉小說中的這個沖動被識別后,尚未明了這種趨勢在風格層面或在產生新“精神狀態(tài)”種類這方面的意義??紤]到我們使用的重復的定義受到限制,此趨勢需要與其他方式做比對,對重復的意義劃界并解讀。我們的測量方法正好捕捉到千字窗口中作家重復同一組有限單詞的相對程度。他或她在給定文本的諸多窗口中這么做得越多,文本整體越重復。我們的目標是弄明白這種持續(xù)的詞匯壓縮是否符合特定語言模式、敘事情境或題材,以及是否產生特定審美效果。

        當然了,讀者不會以零散的千字語塊來閱讀文本。我們測量的重復代表了可能會讓文學學者感興趣的諸多種類重復中的細小碎片。J·希利斯·米勒在《小說與重復》中編目了其他選項:“小范圍內,有言語要素(verbal elements)的重復:單詞,修辭格,形狀或手勢,或者更微妙地,如隱喻般行事的隱秘的重復……較大范圍內,事件或場景可在文本內復制……一個人物可重復之前的世代,或者歷史或神話人物……最后,作者可以在一部小說中重復來自他其他小說的母體、主題、人物或事件?!?J. Hillis Miller, Fiction and Repetition: Seven English Novels (Cambridge, MA: Harvard University Press, 1982), 1-2.米勒繼續(xù)說明,我們部分地通過覺察到這些重現來闡釋小說,因為“任何小說都是由重復和重復中的重復,或以鏈條方式與其他重復相連的重復構成的復雜組織”*Miller, Fiction and Repetition, 2.。當然,問題就藏在覺察中。如吉爾·德勒茲所言,某些事物或事件的重復對于它在人的心里獲得固定身份必不可少——讀者的心也是如此——但重復得以安置(posit)的方式是抽象的,這個身份總是虛置的(virtual)。我們概括出一件事的發(fā)生與下一次之間的無盡變化,讓重復的概念成為可能。*James Williams, Gilles Deleuze’s Difference and Repetition: A Critical Introduction and Guide (Edinburgh:Edinburgh University Press, 2013), 11-12.作為讀者,我們對文學文本中重復的覺察總是要基于某種限定重復邊界并遏制無窮維度的方法,沿著這些維度,事物或事件的任何兩個事例都可能不同。

        如果研究個體文本或關注較小的分析單位,如音素或詞,這個方法容易說清楚,對詩歌頭韻、排比或押韻的研究是這方面的典型。但如果這些單位變得復雜,研究者試圖在不止少數幾個文本中追蹤這種重復,就比較困難了。例如,為了追蹤一個主題或母體的重復,需要顯著抽象方能在諸多實例中確定主題或母題的身份。抽象中的一致性越少,就越難以肯定同樣的事情正在重復,也越難以對重復提供定量解釋,既然只有某些內容比可能預期的重復得更多(或更少)時重復才有意義。研究重復的語言學家尤其遵循這一事實,因而特別小心,要把計數的對象和計數從中獲得重要性的背景都表達清楚。例如最近的一個方法論調查就列出了不少于十個重復可以采取的形式,包括絕對重復(單頻)、位置重復(文本中給定位置上預期之外的偏高或偏低頻率)、關聯重復(給定框架內的兩件事同時發(fā)生得比預期更頻繁)、數據塊中的重復(一個事物根據文本數據塊的合法分布而重復)。*完整列表參見Gabriel Altmann and Reinhard K?hler, Forms and Degrees of Repetition in Texts (Berlin: Walter de Gruyter, 2015), 5-6.重要的是每種情況都假定重復只在與現有用法模式相關時才有定量的意義,無論就這件事本身而言,還是它與某些語境有關的用法,或者與時間有關的用法。*Deborah Tannen稱這些重復的多重語境為“固定性維度”(dimensions of fixity),提出雖然“所有的表達都形式相對固定,但還是無法不注意到有些語言例證比其他的更固定。這可被視為反應了這些維度的幾個連續(xù)體。首先,有形式上相對固定性的連續(xù)體,然后有語境上相對固定性的連續(xù)體,以及第三個,時間上的?!眳⒁娖銽alking Voices: Repetition, Dialogue, and Imagery in Conversational Discourse (Cambridge: Cambridge University Press, 2007), 55.這種嚴格的假設也許限制了我們能計數的事物的種類,但相對定性方法,優(yōu)勢在于我們得以增強分析并推斷大量文本中重復的相對程度。

        與此同時,這個優(yōu)勢并不會讓對重復的定量方法變得在德勒茲的意義上更不“虛置”(virtual),也不會有助于解釋此種重復的語言功能或象征效果。語言學家們自己也很小心地指出,重復的發(fā)生有許多原因。當然存在外在的結構因素,例如語法或一種語言詞匯量施加的自然限制。也可以為了建立主題聯系、提供修辭重點、達到風格效果、甚至為了控制信息流而有目的、有策略地使用重復。在粒度更細的層面,它用來在對話中輔助理解,通過為新信息提供框架而提高效率,增強對話的共同參與感并因此強化社會紐帶。甚至可能是無意識的,例如說話者重復正在說的內容并有瞬間延遲,或者模仿其他人的言語。當模仿變成強迫性的或自動的,而非被外界刺激激發(fā),那么對重復的解釋會偏離,朝心理學和精神或神經疾病的方向去。*對重復的更廣泛的闡釋可能,參見Altmann and K?hler, 2-3; 以及Tannen, chapter 3.考慮到許多研究材料明顯的心理學傾向,這最后一種解讀尤其與我們的研究相關。

        弗洛伊德是最早嚴密思考重復的心理學功能的人之一,將重復發(fā)生的行為闡釋為心靈機制面對不愉快的、被壓抑的記憶時的抵抗。*Freud, “Remembering, Repeating, and Working-Through” [1914], in Standard Edition vol. 12, 145-157.他在《超越快樂原則》(1920)一書中充分探討了這個題目,并深究了對重復沖動的不同解釋,分別將之歸因于病人試圖贏得對情境的把控、病人自我(ego)中對壓抑的表達,以及“死亡沖動”——一種植根于細胞層面、要返回前有機狀態(tài)的沖動。盡管他對語言在精神病理學中的作用很關注,但這位“談話療法”的奠基人卻在很大程度上忽略了重復在言語或散文中的具體行為,反而關注夢、游戲和其他外在表現或壓抑的形式。

        隨著1940年代和1950年代心理語言學的興起,語言重復重要性的討論獲得推動,對重復的解釋作為窺探人類心理的窗口發(fā)生了強烈的定量轉向。如威廉·萊維爾特(William Levelt)在他寫的該領域的通史中提出,“突然有可能定量在發(fā)出者和接收者之間傳播的信息量了,其冗余、傳播率和頻道噪音,諸如此類?!?Levelt, A History of Psycholinguistics: The Pre-Chomskyan Era (Oxford: Oxford University Press, 2013), 5.喬治·齊普夫(George Zipf)對詞頻的研究是這一轉變的先驅,他那如今廣為人知的法則即由他對大腦的一種深刻特質的信念所激發(fā),他稱之為“省力原則”。他從一套交流模型中得到這一性質。在這樣的模型中,說話者將(他們的)詞匯規(guī)模減至單個詞而獲益,而聽者則更愿意“增加詞匯規(guī)模,直到每個不同的意思都有個明顯不同的詞”*George Zipf, Human Behavior and the Principle of Least Effort (Cambridge, MA: Addison-Wesley Press, 1949), 21. 本文論最初闡述于The Psycho-Biology of Language: An Introduction to Dynamic Philology (Boston: Houghton Mifflin Company, 1935). 對其理論的總結參見Levelt, 453.。交流中這兩種力生出的平衡產生了他的定律描述的平滑的序號-頻率關系(rank-frequency relation)。不過這個規(guī)范卻是由觀察到的對它的偏離而確定的。具體說,齊普夫分析了他記錄的自閉癥和精神分裂患者的言語,認為序號-頻率關系中一個較為急劇的負斜率(negative slope)說明較小的一組詞過載了較大的一組意義,表明這些病患不太會根據共同文化詞匯來調校自己的個人語言。*Zipf (1949): 285-87.

        詞匯重復和多樣性作為偏離社會規(guī)范的指標也吸引了約翰·卡羅爾(John Carroll)和溫德爾·約翰遜(Wendell Johnson)等早期心理語言學家。約翰遜在1940年代初參加了幾個研究,在其他方法之外,也用到他的TTR測量方法來比較成人和兒童、不同的年齡組、不同IQ組、不同性別、精神分裂癥患者和普通成年人之間的言語和書寫。*Levelt, A History of Psycholinguistics, 456.研究發(fā)現,更高的IQ與更高的詞匯多樣性和更高的TTR相關,大學新生的TTR比精神分裂癥患者略高,電話講話比精神分裂癥患者更重復。認為更低的用詞多樣性和更多重復意味著某種反常情況(例如教育程度較低、向他人傾訴的能力更低,或極端口述性),這對早期心理語言學家有關語言和認知的看法起了重要作用。后來,熵及其伴隨著的冗余也成了令人信服的框架,用于思考語言的心理學,無論是羅曼·雅各布森(Roman Jakobson)對語言作為符號的深思,認為其慣例在內在的、情感的語言(傾向于更多冗余)與外化的、智識的語言之間有區(qū)別,還是安東尼·韋爾登(Anthony Wilden)用冗余重新解釋弗洛伊德對以多元決定方式顯露的多種心靈癥狀的描述。他認為,重復沖動的確是抵御內心噪音的保障。*Roman Jakobson, “Langue and Parole: Code and Message,” in On Language, eds. Linda R. Waugh and Monique Monville-Burston (Cambridge, MA: Harvard University Press, 1990): 97-98; Anthony Wilden, System and Structure: Essays in Communication and Exchange (London: Tavistock Publications Limited, 1972), 35-37.最近,斯坦福文學實驗室在對通俗和經典小說差異的研究中經過TTR測量后提示重復和創(chuàng)傷敘述之間存在潛在關聯。見Mark Algee-Hewitt, et al., “Canon/Archive” (2015), 9-10.

        圖3 基于我們分類模型的最像“私小說”的標題。右側文本原本標簽為“私小說”。左側文本是“通俗”作品。標題越接近1.0,根據之前從語料庫學到的內容,模型就越會認為這是一部私小說

        因此,重復的形式幫助界定甚至建構了現代的心理學主體。這段簡史為豐富的解釋空間增加了又一關鍵維度,通過它重復能被解讀。如我們所見,它提供了一個范圍,可憑借它想象口頭與書寫、內在語言與外化言語、精神分裂等隔離的心理狀態(tài)與有社會意識的常規(guī)主體性之間的差異。通過量化私小說和浪漫主義小說的重復趨勢,我們得以進入這個數百文本范圍的空間。我們的測量方法也有助于在空間內沿連續(xù)體為文本定位。我們能做到這點是因為其相對冗余,也考慮到測得的特征作為復合體與某種類型中觀察到的特征相符的程度,而非其他類型。下圖展現了由我們的分類器和模型中的特征判斷的最有可能是“私小說”的日語文本。(圖3)一部作品在圖中位置越高,分類器就越有信心認為該作品也有語料庫其他“私小說”中觀察到的定量趨勢。

        雖然沿著此類連續(xù)體為文本重新定位產生新的比較機會,還是需要靠我們在重復的解釋空間里航行。能否僅僅以對口語風格的欲望或采用外國語法,就解釋我們所測量到的重復?我們能否從中看到將重復性與內在精神過程和可能的精神崩潰相聯系的策略?我們曾經說過重復作為風格是所有這些事情的附帶現象,但只有通過察看個體文本,我們才能理解它們如何跨越不同文化和語言語境同特定的文學主體性模型互動。這一步很關鍵,還因為像我們測量的那樣,如果只有重復,那么幾乎不能捕捉到將自我指涉小說與其他寫作模式分隔開的那些差異。我們的測量結果表明,有些私小說和浪漫主義小說相對而言不重復,而少數通俗作品(在日本,這大多是偵探小說)重復性接近最自我冗余的作品。探索這些例外對未來的研究很重要,但這里我們將考慮推動重復趨勢至極端的文本,它們有助于加強比較分析的焦點,即作為風格的重復規(guī)定了重復置于其上的具體美學用法,并讓我們通過測量得以觀察這些方法。

        三、作為風格的重復(Repetition as Style)

        在這更窄的透鏡里,圖3頂端的作品被認為最像“私小說”,原因是對重復和某些詞匯和比喻條目(即思考詞、停用詞、句號)的傾向。其中幾個證實了將重復視為文學語言轉變和嘗試敘述心理內在性和精神錯亂相結合后的表面效應。例如,葛西善藏(Kasai Zenzō)的后期作品《柯樹葉》(椎の若葉,1924)就值得注意,因為這是在12小時內口授給書記員的。*該作者由于飲酒過度,后期時常長期臥床,口授是出版商唯一能從他那兒發(fā)掘材料的辦法。見Fowler, 272-73.愛德華·富勒評論道,這賦予作品一種口述性,“斷然而重復地表明了自己”,尤其因為葛西拒絕審閱自己口授的內容,這讓他如同一個漫談的講故事的人,不斷通過選擇性記憶重提自己之前的話語,導致“越來越冗余的概括……(和)狂亂而近乎公式化的對精神錯亂的冥想”*Fowler, Rhetoric of Confession, 274.。結果是高度“不連貫的”敘事風格不規(guī)則地從一樁軼事轉換至下一樁,即使是在相同的精神場地猛烈翻騰。被評論家平野謙(Hirano Ken)授予日本第一部“真正的”私小說稱號的《疑惑》(Giwaku, 1913)中,如富勒所言向我們呈現出類似的“幽閉恐懼癥”*Fowler, Rhetoric of Confession, 151. 平野在其著作《藝術與私生活》(1964)中作出這一評論。轉引自Fowler, 150-51.。小說作者近松秋江(Chikamatsu Shūkō)因為展現了“對私生活短視的心事重重”和縱情于“自我生成的疑慮”的主角而聞名,制造了一種“孤立的(相對于個性化的)意識”,幾乎全然隔絕于政治、社會和家庭關切,并反復停留在作者生平的某段時期。*Fowler, Rhetoric of Confession, 151-52.《疑惑》便是如此,這些時期通常涉及被舊情人拋棄以及在主角梳理記憶、搜尋過去的欺騙證據時隨之而來的惡心、狂怒和絕望的感受。但這里我們所得的只有這些感受。小說的全部行為發(fā)生在敘事者腦內,起首幾句就暗示了這一事實:“大多是裹上被子后腦袋里就開始描寫殺你,以及我坐牢時的光景,再重寫,描寫再重寫。想著你嫁到了何處,想著把你找出來,心情窒息得每天每天只有不停地想象著同樣的東西?!?譯自《近松秋江:文集》[Chikamatsu Shūkō: An Anthology], ed. Hirano Ken, in Nihon bungaku zenshu, vol. 14 (Shūeisha, 1974), 100.

        《疑惑》出現的時期,關于精神崩潰的敘述被某些人視為文學價值的標志。作家舟木重雄(Funaki Shigeo)在《疑惑》出版當年評論道,如今正在產生的最高質量的作品中,“沒有哪個不在某種程度上承認神經(shinkei)的運作”*見Hibi Yoshitaka, ‘Jiko hyōsho’ no bungaku-shi [A Literary History of ‘Self Representation] (Tokyo: Kanrin shobō, 2002), 228. 這句話的語境是對志賀直哉(Shiga Naoya)近期作品的評論,后者后來成為這個時代最獲認可的私小說作家。。舟木本人就撰寫被稱為“神經衰弱小說”的這種自我指涉子類型(sub-genre)小說,這也強化了認為心理退化和精神痛苦是現代藝術正當來源和主題的看法。*Hibi, 228-34. 另見Christopher Hill,“Exhausted by their Battles with the World: Neurasthenia and Civilization Critique in Early Twentieth-Century Japan,” in Perversion and Modern Japan, ed. Nina Cornyetz and Keith Vincent (London: Routledge, 2009); 及Pau Pitarch-Fernandez, “Cultivated Madness: Aesthetics, Psychology and the Value of the Author in Early 20th-Century Japan.” PhD dissertation, Columbia University, 2015.歐洲自然主義寫作有些種類亦有此看法。夏爾·巴古利(Charles Baguley)對法國自然主義作品的研究認為,雖然自然主義小說在范圍上太籠統(tǒng),無法引發(fā)具體的主題決定因素,但他們有一種典型運動是朝著“瓦解和困惑的方向”,“從秩序向無序,從精神穩(wěn)定向歇斯底里和瘋狂”。*David Baguley, Naturalist Fiction: The Entropic Vision (Cambridge: Cambridge University Press, 1990), 207.作為風格的重復是一種方式,葛西和近松等作家通過它能將這種運動朝向精神崩潰方向寫作,所用的正是用來描述它的語言。

        我們語料庫里最像“私小說”的文本是武者小路實篤(Mushanokōji Saneatsu)1910年的《天真的人》(Omedetakihito)。雖然在評論史上不算成功,但武者小路本人在1920年代追溯既往時認可這本書為私小說奠基之作。小說家宇野浩二(Uno Kōji)說,他“出眾的風格”為書面語改革結合了真正的口語風格,是“某種意義上私小說的起源”。*宇野浩二的論文《對私小說的個人看法》(“Watakushi shōsetsu shiken”) [Personal View of the I-novel], i轉引自Lippit, 29.確實,像武者小路這樣的自然主義作家,作為一個群體,與口語語言的發(fā)展及西式句法和表達法的采納都緊密相連。*Kisaka, 382-83. 鈴木登美(Tomi Suzuki)提到,谷崎潤一郎(Tanizaki Jun’ichirō)在一篇1929年的論文中也曾作出此種聯系,他在文中說,“對現代白話風格的西化和人造性貢獻最多的是日本自然主義運動中的作家”,其中多數繼續(xù)朝書面語的西化發(fā)展。Suzuki, 176.本類型公認奠基者之一的一部作品—— 以來自作者的留言開頭:“我相信存在一種自私的文學,為自我的文學”——作為最像“私小說”的作品出現,這給了我們信心:重復正在這個類型里獲得確鑿的趨勢。

        《天真的人》如何處理精神崩潰表現了主題的另一變化,值得更詳細的分析。這部中篇小說對瘋狂的描繪既偏執(zhí)又自戀,內心思想的重復和冗余驅動著這部作品的許多心理描寫,甚至達到令讀者發(fā)自肺腑地感到文本重復性的程度。在對一個男人可憐巴巴試圖吸引一個女孩注意的描寫中,在第一頁我們就5次被敘述者告知:“我渴求女人?!泵看嗡紟缀踔鹱种貜瓦@句。頭幾頁中還很明顯的是過度使用第一人稱代詞“自分”(jibun),幾乎每隔一句話就用來表示主語,語法上全無必要。好像敘述者感到每一刻都被迫不著邊際地重申他的自我的在場,以免讀者忘了誰在敘述。這種沖動在搪塞的時刻變得尤其嚴重,一再反復地推遲與他迷戀的女子阿鶴(Tsuru)真正邂逅。

        我聽說星期五是西洋人忌諱的日子。因此兩三年前即使想和她見面也盡量避免在星期五出門。但是有時覺得這種迷信不好而故意出門。但是感覺一點兒不好。她搬家后見面就得去更遠。所以更討厭在星期五特意出門了。但是那是迷信,有時覺得迷信不好也會刻意出門。那時竟會想不碰上反而更好一些。況且將近一年沒有遇上鶴了,卻還是不喜歡特意在星期五出門去見她。但是好想見面。這種時候,覺得反正之前從沒遇見過,不遇見到底是好還是不好怎么著都行。這樣慢慢就停止去遇見了。*Mushanokōji Mushanokōji, “Omedetaki hito,” Gendai Nihon bungaku zenshū, vol. 40 (Chikuma Shobō, 1973), 7-8.

        此處及整個文本里,阿鶴只是塊屏幕,用來反射敘述者復雜難懂的內心斟酌,他對她的欲望似乎毫無驅動的緣由,他越是想方設法避開與她實際遇見,欲望就越發(fā)強烈。她成了異想天開的借口,讓敘述者思索肉欲的本質、自我的本質以及假如他找到法子和她結婚的話他本身自我迷戀的可能后果。無需說,這樣的婚姻沒有發(fā)生。他們僅有的一次確實相見是火車上偶遇,敘述者再次未能將思想轉為行動。

        快到四谷的時候我站了起來??聪蝥Q的方向。鶴迎上了我的目光。鶴馬上移開了視線。我痛定思痛決心從鶴的前面走過去。電車即將停止,鶴卻沒有站起來。朝我背過臉去。電車哐當停了下來。我正要從鶴的前面經過。這時鶴忽然站了起來。我暗喜。我的手碰到了鶴的后背。我決定跟在鶴的后面下車。就在這時,車門旁一位帶著孩子的人站了起來。我沒有勇氣厚著臉撥開那個男人去緊跟著鶴。我讓那倆人插進了我和鶴的中間。*Saneatsu, “Omedetaki hito,” 25.

        重復不僅表示內心混亂,還起到減緩行動的作用,將每一步與下一步連接,同時保存單一的關注感。當敘述者最終鼓起勇氣喊出她的名字,她回應以一句粗率的“我能幫你嗎?”接著朝另一個方向走開。雖然所有跡象都相反,他卻將此看作她對他愛的信號,盡管這是我們最后一次看到她。但是,這卻是必須如此,如果阿鶴作為活生生的、呼吸著的角色進入故事,只會讓敘述者的單軌思路脫軌。重復和冗余的風格在這里并未引發(fā)瘋狂本身,而是日本小說中前所未有的極為自我中心的敘事模式。

        在中國的浪漫主義文學語料庫里,我們再次發(fā)現高重復率與過度思想(excessive thought)的交匯處有許多自我迷戀的作品。(圖4)奇怪的是大多數極端離群值屬于同一個作者:葉靈鳳(1905—1975)。葉在中國現代文學史的位置總是在變化,沒有定論。葉在浪漫主義寫作的圖景中出現得相對較晚,他于1925年加入創(chuàng)造社時,該社團已經從沉溺的自我敘述轉向到有政治傾向的民族認同和階級意識興趣。葉渴望在快速發(fā)展的現代文學領域占據一個位置,他將自己包裝成花花公子和反傳統(tǒng)者,以寫作撩人的三角戀、城市的頹廢和弗洛伊德式的性欲描繪為特色的小說很快獲得成功,并以意在“達到精神混亂”的方式將關注放在身體和心理的“反?!?從手淫、閹割和同性戀到雙性戀、自殺和亂倫)上。*Yingjin Zhang, The City in Modern Chinese Literature and Film: Configurations of Space, Time, and Gender (Stanford: Stanford University Press, 1996), 211.這樣的敘述會在1930年代由穆時英、劉吶鷗和施蟄存等所謂“新感覺派”作家推動的現代派文學高峰期為他贏得中心地位。但在1920年代,他的作品依然和浪漫主義結盟,讓葉得到“第二代浪漫主義者”的地位。其閾限性(liminality)使得葉在自己的時代難以劃分范疇,直到今天,在學術研究中他還是一位研究不足的人物。*葉在學術研究中的邊緣化也因為他在1920年代后期對魯迅的攻擊,以及他在1930年代的政治情況。參見Zhang, 208.

        圖4 對照中文文本平均熵繪制的“思想/感覺”詞的比率,某些離群作品標明書名加以突出

        葉1928年的故事《愛的戰(zhàn)士》是他最為重復的文本之一,這是個以城市青年三角戀為特色的代表性篇章。敘事在年輕女作者莎菲和她花言巧語的情郎小萍之間轉換視角,后者幻想自己是愛神國里的拿破侖。每一部分極少對話或角色互動,基本是關于角色內心狀態(tài)的孤立沉思。故事開端是莎菲在寫日記,渴望著小萍:

        我不相信這是春天。低的,低的,這是一塊已經低得要壓到我的頭上的一塊灰布。我不相信這上面曾經有過金紅的太陽,我不相信這上面曾經有過鏡子樣的月亮。不會有這些。這都是夢中的事,這都是幸福的人騙著不幸的人的話。你相信么?你相信這下面會有一片油綠的草地,青的溪水旁邊有一株粉紅的桃花,花下有一位青年的男子正在抱著——什么?我不相信。我沒有勇氣能再寫下去。*Ye Lingfeng xiaoshuo quanbian Vol. 1 (Shanghai: Xuelin chubanshe, 1997), 168.

        仔細看,容易看出如“低的”“我”“相信”這些詞的重現如何最終得到低熵值分(entropy score)。節(jié)奏貫穿整個敘述并增加了兩位敘事者過度傷感的語調,賦予文本一劑強烈的想象的內在性。隨著故事發(fā)展,莎菲對戀情越來越幻滅,小萍則反過來,對女性的好色追逐愈發(fā)大膽。故事黑暗地終結于莎菲為報復小萍不忠而灌醉并刺死他,勝利地宣稱自己為“愛的戰(zhàn)士”。*這個結局突出了葉受到奧斯卡·王爾德《莎樂美》及其對以愛之名殺人的蛇蝎美人描繪的影響。參見Xiaoyi Zhou, “Salome in China: The Aesthetic Art of Dying,” in Wilde Writings: Contextual Conditions, ed. Joseph Bristow (Toronto: University of Toronto Press, 2003), 295-316.這暴烈的過度反應反過來讓莎菲的重復性寫作風格顯得危險地怪異、狂躁。莎菲并不是特別引人同情的角色,故事也不該被解讀為一個女權主義者對父權的控訴。相反,重復從風格上增強了葉對聳人聽聞之事的嗜好,有學者認為這是典型的“刻奇的”(kitschy)夸示行為。*雖然葉靈鳳的小說包含了“新穎性”和實驗,但他顯然決定媚俗,也就是說重復、平庸、老套……(他的故事)既先鋒又為大眾文化樂于接受。參見Jianmei Liu, “Shanghai Variations on ‘evolution Plus Love;,” in Modern Chinese Literature and Culture, 14, no. 1 (Spring, 2002), 82 and 84.這種刻奇的媚俗可以理解為嘗試將現代自我的修辭推到過分的地步,建立并放大浪漫主義先驅們特有的心理敘述的重復風格。

        強化的重復是否有助于解釋葉在文學領域的離群位置,或者反之?這兩種解釋都有可能。但我們更重要的觀點是,這種相關表明,當此類型在大轉型邊緣時,創(chuàng)造社浪漫主義的語言傾向如何被推到極致。*史書美(Shu-mei Shih)形容1920年代葉的新興文學團體將“郭沫若的‘自我的爆發(fā)’和郁達夫的自我沉溺推到極端,不顧一切限制性規(guī)范,夸大自我,頌揚性行為而沒有困擾五四前輩的那種焦慮”。見Lure of the Modern: Writing Modernism in Semicolonial China, 1917-1937 (Berkeley: University of California Press, 2001), 255.位于自我指涉浪漫派寫作邊緣的一位作家成為最極端的例證,而不是日本那樣位于起源處的作家,這表明我們的測量也許捕捉到了這些寫作模式相對軌跡中的不同時刻。此處,葉令人吃驚的突出程度提出了新的問題:詞匯冗余與1920年代上?!拔逅摹蔽膶W商業(yè)生存能力之間的關系,以及文學運動的追隨者會將該運動始創(chuàng)者發(fā)展的風格趨勢夸張到何等程度。*隨著創(chuàng)造社的政治化,浪漫主義文學類型在1920年代后期迅速衰落,所以我們的語料庫沒有超過1928年。因而需要做更多工作去測量葉后期作品中重復的進化,或者將他同1930年代的同時代人進行比較。

        雖然葉的故事平均而言最為重復,我們察看其他高度冗余的篇章時,浪漫主義運動的一些重要人物也顯現出來。例如郁達夫的《街燈》(1926)和郭沫若的小說《落葉》(1925)就包含一些極為重復的段落。整體上這些作品與葉的故事有幾個共同特點,例如以現在時寫就,情節(jié)極簡。*并不是說敘述者不會追憶過去。在《后悔》(郭沫若)、《菊子夫人》(葉靈鳳)和《落葉》(郭沫若)中,緬懷往事的敘述者對回憶和他們在其中記錄敘事的假定的當下(putative presence)之間的時間差距非常自覺。它們也都傾向于采用強調呼語(direct address)的敘事模式,要么以信件和日記的框架設置,要么以冗長的間接引語語塊的形式??淄幸涟⒛崴箿y量方式確定的低熵值的作品中,這種白話文風格和大量間接引語同樣突出顯現,上述方法捕捉到較長詞序的重復而不只是個體詞。(表2)

        表2非參數熵值測量基礎上熵最低的15部中文語料庫文本。按這個測量方法,最高熵值在7.1到8.4之間,因此是2倍冗余。每個類型的中線值是5.7

        我們在這里也看到了葉靈鳳作品,但也有幾個郭沫若的浪漫主義短篇小說:《十字架》(1924)、《葉羅提之墓》(1924)和《亭子間中》(1925)。后面這些文本突出的重復對于人類讀者來說更為明顯,無論是頻繁的感嘆或強調狀語,例如“十分細心地細心地……輕輕地輕輕地”(《亭子間中》),或者近乎逐字復制句子:“看護婦把手伸去替他省脈,意識昏迷的他卻在叫道:——‘啊,多謝你呀,嫂嫂?!醋o婦又把手伸前去插體溫表在他的右脅窩下,他又在叫道:——‘啊,多謝你呀,嫂嫂?!?《葉羅提之墓》)。從郭沫若這樣的經典作家筆下出來的這種過度重復的風格往往被視為那個時期白話文寫作的標志。

        然而,盡管郭沫若的故事全都引發(fā)挫敗的“五四”時期個人(以及,碰巧,刻畫死亡主題)特有的強烈傷感氛圍,但許多重復率最高的中文文本不限于喚起創(chuàng)傷或痛苦。事實上,我們發(fā)現喚起“苦悶”——一種暗示痛苦/絕望的有影響的情緒——的詞,和“思想/感覺”詞不同,和低熵之間沒有富于意義的關聯。相反,如我們在葉靈鳳的作品里所見的,冗余也是性挑動、感傷和自由戀愛的重要資源(或效果)。這種重復起作用的方向與弗洛伊德的死亡沖動相反,倒是符合一種快樂原則。*弗洛伊德在此處出現特別有理由,因為葉靈鳳自己就是弗洛伊德心理學的狂熱崇拜者。參見Jingyuan Zhang, Psychoanalysis in China: Literary Transformations 1919-1949 (Ithaca: Cornell University Press, 1992).這種快樂也許是尋歡作樂的、有罪的、自戀的、力比多的,或狂躁的,表明重復、內在性和感傷之間非常復雜的關系,有助于界定浪漫主義小說中的文學主體性。*關于感傷,參見Haiyan Lee關于中國現代文學“情感的結構”的說法:“現代的主體首先是感傷的主體?!盧evolution of the Heart: A Genealogy of Love in China, 1900-1950 (Stanford: SUP, 2007), 7.不過,更為徹底地探索重復與具體的弗洛伊德式心理機制的關系,或與一般感傷的關系,則不在本文范圍內。

        四、結語

        作為風格的重復觀念有什么可以提供給東亞文學現代性的歷史?如最初所言,這些歷史交替地維護了一批自我指涉文學的一致性,這些文學將語言的轉變與心理學敘述相連,也強調了不可能將其貶低為一套單一的形式特征。我們這篇論文的目標在于拿起一些與這種文學相關的一貫性,將其置換至定量語域,繼而創(chuàng)造一個框架,用于探究類型的一致與類型的模糊之間的差距。這個框架在利用學者們對這種文學已有知識的同時,也意在應用可使用的計算功能,將這知識擴展到迄今尚未開拓的比較方向上。

        學者已然知曉的是日本私小說作者和中國浪漫主義作家在1920年代早期圍繞著一種新的語法心態(tài)(grammatical mentality)相交于此,這種語法心態(tài)綜合了語言變化和對心理自我的癡迷。因此,一方面武者小路和葉靈鳳等作者的作品闡釋了將書面語口語化和采納西式語法概念及結構相結合的風格革命。自然主義作家逐漸成為這種革命在日本的典范,在中國則是“五四”一代作家(包括浪漫主義作家),他們倡導漢語寫作的口語化和歐化。這樣的語言實驗旨在提供一種與現代個體的主體性相稱的寫作模型,實際則提供了自我“發(fā)現”的條件。柄谷行人和劉禾等學者已經表明,在日本和中國文學史上內化的現代主體(modern interiorized subject)的發(fā)展中,白話寫作都是生成式的(generative),而非反應式的(reactive):新的文學語言與其說是對表達心理內在的新欲望的反應,不如說是使這些表達得以可能的條件。*Karatani, 61.了解到中國浪漫主義作家直接從日本同行那里吸取靈感,私小說在此時期廣泛譯為中文,只會強化共同的審美和意識形態(tài)工程的感受,突破了空間、語言和文化的差異(division)。

        也許,存在著一種比較方法說明這些歧異如何以無數方式將個體文本中更廣泛的語言轉變和心理敘事潮流的征象具體化。此處,我們采取了另一種思路,嘗試歸納地界定將跨越不同個體表達的這些潮流互動聯系起來的特征。我們在比較語境中大規(guī)模察看私小說和浪漫主義文學,并發(fā)現了它們的重復趨勢。誠然,對于本時期文學寫作更為廣泛復雜的轉變來說,我們的重復定量模型只是一個松散的指標。但是我們的初步結果表明,它捕捉到了這些潮流互動里的某些東西,識別了來自這種互動的語法心態(tài)的代表性作品。另外,正因為重復不等同于這些潮流或與之并存,我們的模型才提供了新的、不熟悉的工具,對自我指涉的作品彼此比較和關聯。武者小路實篤和葉靈鳳的文本從未共同出現在東亞文學現代性的比較史上,但難以忽視它們作為性欲和幻想敘事的交疊。這交疊并非我們設計模型時要捕捉的。它只知道這些文本傾向于更多重復,重復又和與認知有關的詞松散相關。但是通過將重復作為風格特征分離出來,我們得以審視這種更為抽象的文本語域——布羅代爾所說的“無意識歷史”的范圍——將熟悉與不熟悉的作品置于新的比較語境。*參見“History and the Social Sciences: The Longue Durée,” trans. Sarah Matthews, in On History (Chicago: University of Chicago Press, 1980), 25-54.這個語境同時挑出了武者小路實篤和葉靈鳳(或者近松秋江和郭沫若)這樣獨特的作者,他們特意采取了服務于自我發(fā)現的極端重復風格。同時,它揭示出這一選擇是由來自內部的心理壓力和來自外部的社會語言學壓力所驅動的變化中的語法心態(tài)的共同征象。它讓我們得以檢視東亞文學現代性的文本面(textual surface),并思考在此之下發(fā)生的更深的系統(tǒng)轉變所激起的那些更寬泛的波動。

        猜你喜歡
        浪漫主義小說文本
        漫談詩的革命浪漫主義
        中華詩詞(2022年1期)2022-12-31 05:40:44
        叁見影(微篇小說)
        紅豆(2022年9期)2022-11-04 03:14:42
        遛彎兒(微篇小說)
        紅豆(2022年9期)2022-11-04 03:14:40
        勸生接力(微篇小說)
        紅豆(2022年3期)2022-06-28 07:03:42
        十九世紀法國浪漫主義大師
        藝術啟蒙(2022年6期)2022-06-22 06:48:48
        西班牙浪漫主義的狂想
        藝術啟蒙(2022年3期)2022-03-24 02:35:10
        在808DA上文本顯示的改善
        那些小說教我的事
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
        亚洲日产AV中文字幕无码偷拍| 无码人妻久久一区二区三区免费| 在线播放无码高潮的视频| 欧美色色视频| 成年人视频在线播放麻豆| 99久久精品在线视频| 精品www日韩熟女人妻| 欧美乱妇日本无乱码特黄大片| 丝袜美腿爆炒国产在线观看| 中文字幕一二三四五六七区| 色狠狠色噜噜av天堂一区| 肉体裸交丰满丰满少妇在线观看| 亚洲无码美韩综合| 日韩精品中文字幕一区二区| 亚洲精品色婷婷在线影院| 国产精品一区二区 尿失禁| AV无码系列一区二区三区| 成人性生交大全免费看| 国产99在线 | 亚洲| 国产伦精品一区二区三区视| 久久精品国产亚洲av调教| 亚洲一区二区三区乱码在线中国| 国产精品久久久久久久久岛| 国产成人亚洲综合无码DVD| 蜜桃视频永久免费在线观看| 日韩欧美亚洲国产精品字幕久久久| 国产成人av免费观看| 久久se精品一区二区国产| 东风日产车是不是国产的 | 色噜噜狠狠狠综合曰曰曰| 婷婷九月丁香| 男女视频在线观看一区二区| 欧美a级在线现免费观看| 国产山东熟女48嗷嗷叫| 中国精品久久久久国产| 少妇被粗大进猛进出处故事| 久久午夜夜伦鲁鲁片免费无码| 一本大道久久a久久综合| 亚洲精品国产熟女久久久| 亚洲av无码无限在线观看| 国产精品99久久精品爆乳|