亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        菲茨杰拉德作品一致性的潛在語(yǔ)義分析

        2013-09-05 02:18:20劉海燕尹曉虎
        統(tǒng)計(jì)與信息論壇 2013年1期
        關(guān)鍵詞:菲茨杰拉德相似性章節(jié)

        劉海燕,尹曉虎

        (1.南京信息工程大學(xué) 語(yǔ)言文化學(xué)院,江蘇 南京 210044;2.72465部隊(duì),山東 濟(jì)南 250022)

        一、引 言

        美學(xué)價(jià)值和審美觀因時(shí)因人而異,有關(guān)菲茨杰拉德評(píng)論的研究便印證了這一點(diǎn)。盡管現(xiàn)在菲茨杰拉德被譽(yù)為“爵士時(shí)代的桂冠詩(shī)人”,然而他在生前并未獲得如此崇高的文學(xué)地位,并且評(píng)論家們對(duì)于他的作品,尤其是他的長(zhǎng)篇小說,一直充滿了爭(zhēng)議。例如,Miller便認(rèn)為《了不起的蓋茨比(The Great Gatsby)》是菲茨杰拉德創(chuàng)作生涯的頂點(diǎn),而《夜色溫柔(Tender is The Night)》和《最后的大亨(The Last Tycoon)》則是華麗的失敗,因?yàn)楹髢刹孔髌吩僖膊荒軐?shí)現(xiàn)《了不起的蓋茨比》所達(dá)到的藝術(shù)水準(zhǔn)[1]293-296;Edward Weeks也曾經(jīng)認(rèn)為在《人間天堂(This Side of Paradise)》和《夜色溫柔》之間找不出任何不同[2]1-10。同時(shí),也有評(píng)論家對(duì)此存在不同看法,評(píng)論家Seldes認(rèn)為《夜色溫柔》是菲茨杰拉德作家生涯中最偉大的小說;Malcolm Cowley甚至曾經(jīng)將這部作品中的事件按照時(shí)間順序重新排序,試圖推翻以往評(píng)論家們都認(rèn)為的《夜色溫柔》在結(jié)構(gòu)上是斷裂的和松散的這一論斷[2]1-10。

        文學(xué)批評(píng)應(yīng)該回歸到文本文學(xué)成就的研究,但迄今為止關(guān)于菲茨杰拉德作品的評(píng)論幾乎都與其生平和傳記有關(guān),這些定性的評(píng)論并不能提供有力的證據(jù)以支撐對(duì)菲茨杰拉德作品優(yōu)劣的比較和評(píng)判。從結(jié)構(gòu)上看,文本表現(xiàn)為語(yǔ)段和按照句法定義的單元(從句、句子)序列,同時(shí)也是一個(gè)統(tǒng)一的整體,完整、一致、情感、信息、人本、分段、時(shí)空統(tǒng)一等是文學(xué)文本最重要的概念[3]。有意義的優(yōu)秀的英語(yǔ)文本必然是一致的、有條理的和連貫的,“在一致的文本中,意義是清晰的,文本的各個(gè)段落形成了統(tǒng)一的整體”[4]。文本具有較高的一致性被認(rèn)為是寫作上取得成功的一個(gè)重要指標(biāo),一致性高的作品更容易被閱讀和理解[5]。

        Halliday和Hasan是最早研究一致性的學(xué)者,他們認(rèn)為文本不是形式的整體,而是語(yǔ)義和邏輯的整體[6]。Harker認(rèn)為一致性是文本的一種表象性質(zhì),它描述文本中的結(jié)構(gòu)和相互關(guān)系,通過這種結(jié)構(gòu)和 關(guān) 系 建 立 表 面 上 的 統(tǒng) 一 性[7];Hwang 和Merrifield則認(rèn)為一致性是文學(xué)文本的一個(gè)固有屬性,它描述了文本不同要素之間的關(guān)系,取決于作者表達(dá)其意圖的方式[8]189-210;Leech和 Short將文本一致性分為交叉所指(如使用代詞)和聯(lián)系,聯(lián)系包括句子之間的邏輯或其他聯(lián)系,包括意義的隱含聯(lián)系[9]250-251;Tyrkkō提出一致性是對(duì)文學(xué)文本質(zhì)量的一種評(píng)價(jià),包括語(yǔ)法一致性和詞匯一致性[10]。語(yǔ)法一致性是指文本而不是單詞的堆砌、句子的羅列,文本意義的標(biāo)準(zhǔn)是不僅句子及其序列有意義,而且它們要有明確的所指;詞匯一致性就是文本中詞匯項(xiàng)的意義之間的關(guān)系。

        由此可見,學(xué)者們對(duì)于一致性概念和內(nèi)涵的認(rèn)識(shí)還不盡統(tǒng)一,亟需建立能夠自動(dòng)處理文本和計(jì)算文本一致性的方法及工具。近年來,心理語(yǔ)言學(xué)、語(yǔ)料庫(kù)語(yǔ)言學(xué)和計(jì)算語(yǔ)言學(xué)的最新發(fā)展,已經(jīng)建立了能夠在不同維度上分析文本的復(fù)雜計(jì)算機(jī)工具,特別是已經(jīng)有能夠自動(dòng)處理大型詞匯索引、語(yǔ)法解析、語(yǔ)義分析、論文評(píng)分、摘要評(píng)論等的算法和程序[11]?;谶@些最新成果,有研究提出:文本的一致性可以通過考察文本不同單元所描述語(yǔ)義信息的相關(guān)程度進(jìn)行測(cè)度,而文本內(nèi)部相關(guān)程度的評(píng)估則可以采用潛在語(yǔ)義分析方法[12]107-122。

        因此,可以利用潛在語(yǔ)義分析方法來計(jì)算文本的一致性測(cè)度,這為定量比較和判別菲茨杰拉德不同作品在寫作上的優(yōu)劣和差異提供了一種可行的思路。以下通過計(jì)算菲茨杰拉德的四部小說《人間天堂》、《漂亮冤家(The Beautiful and Damned)》、《了不起的蓋茨比》和《夜色溫柔》的一致性測(cè)度,首次對(duì)這些作品從語(yǔ)義角度進(jìn)行一致性的定量比較,以檢驗(yàn)上述作品現(xiàn)有的定性評(píng)論。

        二、小說文本的向量空間模型與潛在語(yǔ)義分析

        潛在語(yǔ)義分析是一種用于提取和推斷語(yǔ)篇中單詞使用語(yǔ)境之間關(guān)系的完全自動(dòng)的數(shù)學(xué)/統(tǒng)計(jì)技術(shù),其基本思想是假設(shè)在單詞及其語(yǔ)境之間存在著潛在的依賴關(guān)系,并且這種關(guān)系可以用其中若干變量構(gòu)成的語(yǔ)義空間來表示,它的主要功能是通過比較文本的向量表示從而計(jì)算文本之間的相似性,這一相對(duì)簡(jiǎn)單的相似性標(biāo)準(zhǔn)源于文本意義的心理學(xué)理論,并且已經(jīng)在許多文本分析任務(wù)中取得了與人類分析結(jié)論相一致的結(jié)果[13]。因此,作品的意義可通過探討單詞與其上下文之間的關(guān)系來理解[14]。

        潛在語(yǔ)義分析的基礎(chǔ)是文本的向量空間模型,文本的意義是文本中所出現(xiàn)的所有單詞意義的平均,并可采用矩陣的形式表示。矩陣中的行代表不同的單詞,每一列表示一個(gè)文本章節(jié)或其他語(yǔ)境,行和列對(duì)應(yīng)的元素表示行所代表的單詞在列所代表的語(yǔ)境中出現(xiàn)的次數(shù)[15]。

        具體而言,如果以小說的章節(jié)來劃分文本語(yǔ)境,假設(shè)在包含D個(gè)章節(jié)的小說中共有T個(gè)類符,類符i∈(1,2,…,T)在章節(jié)j∈(1,2,…,D)中出現(xiàn)的次數(shù)用頻率fij表示,這些頻率構(gòu)成了類符章節(jié)矩陣F,該矩陣即為小說文本的向量空間表示;F的每一列表示小說中的一個(gè)章節(jié);類符i在章節(jié)j中的相對(duì)重要性用ωij表示,ωij的值是fij和單詞統(tǒng)計(jì)測(cè)度重要性的函數(shù)。基于對(duì)類符章節(jié)矩陣F或類符權(quán)重矩陣W=(ωij)的奇異值分解,即可進(jìn)行文本潛在語(yǔ)義分析。

        三、基于潛在語(yǔ)義分析的作品一致性測(cè)度及其計(jì)算

        本文分析的并非是矩陣F,而是類符權(quán)重矩陣W=(ωij)。ωij通常被定義為ωij=lijgi,其中g(shù)i是反映類符i的整體價(jià)值的全局權(quán)重,例如可以是類符出現(xiàn)的章節(jié)個(gè)數(shù)的倒數(shù);lij是反映類符i在章節(jié)j中重要性的局部權(quán)重,例如類符頻率的對(duì)數(shù)。在本文的分析中,全局權(quán)重采用了逆章節(jié)頻率,而局部權(quán)重則采用了類符的對(duì)數(shù)頻率,其中類符i的全局逆章節(jié)頻率權(quán)重定義為gi=ln(D/dfi),dfi是類符i的章節(jié)頻率,定義為dfi=dij,dij為1表示類符i在文本j中出現(xiàn),否則為0;類符i的局部對(duì)數(shù)頻率權(quán)重定義為lij=ln (fij+1)。

        為了測(cè)度小說文本的一致性,筆者考察了小說章節(jié)之間的相似性,并定義了小說的章節(jié)相似性矩陣S。對(duì)于由D個(gè)章節(jié)構(gòu)成的小說,其章節(jié)相似性矩陣S為D×D的對(duì)稱矩陣。矩陣S中的元素sjk表示章節(jié)j與章節(jié)k之間所表達(dá)意義的相似程度,這一相似程度可以利用類符在這兩個(gè)章節(jié)中的權(quán)重向量的余弦函數(shù)來計(jì)算,即:

        根據(jù)上述定義,利用筆者的計(jì)算結(jié)果[16],即可計(jì)算菲茨杰拉德小說的章節(jié)相似性矩陣。下面以包含了9個(gè)章節(jié)的《了不起的蓋茨比》為例,其章節(jié)相似性矩陣S的計(jì)算結(jié)果為:

        利用章節(jié)相似性矩陣S的一些性質(zhì),可對(duì)小說文本的一致性進(jìn)行分析和比較,其理論基礎(chǔ)如下:

        定義1[17]446-450矩陣被稱為正矩陣,是指該矩陣的元素都是非負(fù)的且該矩陣不是零矩陣。若該矩陣的所有元素都為正,則稱該矩陣為嚴(yán)格正矩陣。

        定義2[17]446-450n(n≥2)階的矩陣A= (aik)被稱為不可約的,是指對(duì)于集合 {1,2,…,n} 的任意非空子集P,總存在k∈P和jP,使得ajk≠0。

        定理1[17]446-450非負(fù)矩陣A是不可約的,當(dāng)且僅當(dāng)A的矩陣指數(shù)exp(A)嚴(yán)格正。

        定理2(Perron-Frobenius定理)[18]若非負(fù)不可約矩陣A的譜半徑為ρ(A),則有:

        1.ρ(A)>0,且ρ(A)是A的重?cái)?shù)為1的本征值。

        2.A的對(duì)應(yīng)于ρ(A)的左和右本征向量都是正的。

        3.若λ為A的其他本征值,則有|λ|≤ρ(A)。

        根據(jù)定義1、2和定理1,小說文本的章節(jié)相似性矩陣S是不可約的嚴(yán)格正矩陣。由定理2知:任何嚴(yán)格正的相似性矩陣S都至少存在一個(gè)實(shí)數(shù)非負(fù)本征值,且該本征值的模是所有本征值中最大的,從而可以用該本征值作為小說文本的一致性測(cè)度,記作λCoherence。同時(shí),因?yàn)橄嗨菩跃仃嘢是對(duì)稱的且其元素sij都介于0和1之間,包含D個(gè)章節(jié)的小說章節(jié)相似性矩陣SD×D的最大本征值則不會(huì)超過D。為比較包括不同章節(jié)數(shù)的小說之間一致性的差異,定義小說文本的一致性系數(shù)(Coefficient of Coherence):CC=λCoherence/D,有 CC∈[1/D,1]。

        基于上述定義和定理,菲茨杰拉德小說一致性的潛在語(yǔ)義分析計(jì)算步驟可以歸納如下:

        (1)首先獲得小說文本的電子版,對(duì)其中的拼寫和語(yǔ)法錯(cuò)誤進(jìn)行必要的修正。

        (2)根據(jù)上下文的時(shí)態(tài)和語(yǔ)態(tài)將文本中的縮寫、縮略語(yǔ)等補(bǔ)充完整,如將“I’m”改成“I am”。

        (3)去除文本中的符號(hào)和數(shù)字,包括引號(hào)、連字符等。

        (4)編制計(jì)算機(jī)程序讀入小說文本,利用KSTEM算法將單詞詞干化,構(gòu)建小說文本的類符列表。

        (5)編寫算法,統(tǒng)計(jì)小說各個(gè)章節(jié)中的類符數(shù)及其在各章節(jié)中的出現(xiàn)次數(shù),以獲得文本的向量空間表示矩陣F。

        (6)計(jì)算類符的全局逆章節(jié)頻率權(quán)重和局部對(duì)數(shù)頻率權(quán)重,以建立類符權(quán)重矩陣W。

        (7)對(duì)菲茨杰拉德的每部小說,根據(jù)類符權(quán)重矩陣計(jì)算其章節(jié)相似性矩陣S。

        (8)對(duì)每部小說的章節(jié)相似性矩陣S進(jìn)行奇異值分解,以得到對(duì)應(yīng)的最大本征值。

        (9)根據(jù)每部小說章節(jié)相似性矩陣S的最大本征值和章節(jié)數(shù),計(jì)算小說的一致性測(cè)度和一致性系數(shù)。

        采用上述方法和步驟,計(jì)算菲茨杰拉德的四部小說的一致性測(cè)度和一致性系數(shù),結(jié)果見圖1。

        圖1 菲茨杰拉德小說一致性的計(jì)算和比較圖

        如圖1所示,從文本一致性的角度看,《人間天堂》到《了不起的蓋茨比》,菲茨杰拉德在對(duì)文本一致性的把握上是穩(wěn)步提升的。然而對(duì)于《夜色溫柔》,其一致性測(cè)度與一致性系數(shù)卻展現(xiàn)出兩個(gè)相反的結(jié)論:一致性測(cè)度顯示《夜色溫柔》要優(yōu)于菲茨杰拉德的前三部作品;一致性系數(shù)卻表明《夜色溫柔》稍遜于前三部作品。

        對(duì)于這一結(jié)果可以這樣理解:小說文本的一致性與小說章節(jié)的結(jié)構(gòu)安排有關(guān),菲茨杰拉德的前三部作品都是分為9個(gè)章節(jié),而《夜色溫柔》則細(xì)分為61個(gè)章節(jié)。一致性測(cè)度是從整體連續(xù)性的角度來考察小說主題的全局連貫性和統(tǒng)一性,而一致性系數(shù)則是從章節(jié)與章節(jié)之間相關(guān)性的角度考察小說主題的局部連貫性和統(tǒng)一性。從這個(gè)意義來說,盡管《夜色溫柔》較菲茨杰拉德的前三部作品在主題意義上更為集中和內(nèi)斂,然而該作品的章節(jié)安排卻使章節(jié)與章節(jié)之間的意義表達(dá)更為松散,這就可以解釋為何不同的評(píng)論家對(duì)菲茨杰拉德的小說會(huì)有不同的認(rèn)識(shí)和評(píng)判。

        四、結(jié) 論

        小說文本的一致性是該小說在創(chuàng)作上是否良好的一個(gè)重要指標(biāo),評(píng)論家們對(duì)文本一致性的認(rèn)知分歧將會(huì)導(dǎo)致對(duì)該作品評(píng)判的差異。潛在語(yǔ)義分析為定量計(jì)算和比較不同作品的一致性提供了可行的思路和方法。本文以菲茨杰拉德的四部長(zhǎng)篇小說為例,基于潛在語(yǔ)義分析方法首次定義了小說文本的章節(jié)相似性矩陣、一致性測(cè)度和一致性系數(shù),并根據(jù)一致性測(cè)度和一致性系數(shù)對(duì)菲茨杰拉德的四部作品進(jìn)行了比較和分析,檢驗(yàn)并解釋了現(xiàn)有不同評(píng)論家們對(duì)這幾部作品的定性評(píng)論。

        本文的計(jì)算和分析表明:小說文本的一致性與小說章節(jié)的結(jié)構(gòu)安排有關(guān)。一致性測(cè)度是從整體連續(xù)性的角度來考察小說主題的全局連貫性和統(tǒng)一性,而一致性系數(shù)則是從章節(jié)與章節(jié)之間相關(guān)性的角度考察小說主題的局部連貫性和統(tǒng)一性。評(píng)論家們對(duì)小說文本全局一致性和局部一致性的不同側(cè)重,導(dǎo)致其對(duì)同一部作品有著截然不同的評(píng)論。

        [1] Bryant Mangum F.Scott Fitzgerald:American Novelist and Short Story Writer,Reader's Guide to Literature in English[M].London:Fitzroy-Dearborn,1995.

        [2] Kirk Curnutt.The Cambridge Introduction to F.Scott Fitzgerald[M].Cambridge,UK:Cambridge University Press,2007.

        [3] Alois Heuboeck.Some Aspects of Coherence,Genre and Rhetorical Structure and Their Integration in a Generic Model of Text[J].Language Studies Working Papers,2009,35(1).

        [4] Ambreen Shahriar,Habibullah Pathan.Coherence and the Role of Cohesion in Coherent Texts[J].Language in India,2012(5).

        [5] Mirella Lapata,Regina Barzilay.Automatic Evaluation of Text Coherence:Models and Representations[C].in Proceedings of the 19th International Joint Conference on Artificial Intelligence,San Francisco:Morgan Kaufmann Publishers Inc,2005.

        [6] Eyyup Coskun.Text coherence in the narrative texts of Turkish students and Bilingual Uzbek students in Turkey[J].Scientific Research and Essay,2009(7).

        [7] John Harker W.The Role of Cohesion and Coherence in Processing Literary Texts[J].Working Papers of the Linguistics Circle of the University of Victoria,1986(1).

        [8] HWang Shin Ja J,Merrifield William R.Language in Context:Essays for Robert E.Longacre[M].Dallas:Summer Institute of Linguistics and the University of Texas at Arlington,1992.

        [9] Leech Geoffrey N,Short Michael H .Style in Fiction:A Linguistic Introduction to English Fictional Prose[M].New York:Longman,1981.

        [10] Jukka Tyrkk.Fuzzy Coherence:Making Sense of Continuity in Hypertext Narratives[D].Helsinki:University of Helsinki,2011.

        [11] McNamara Danielle S,Max M.Louwerse and Arthur C.Graesser.Coh-Metrix:Automated cohesion and coherence scores to predict text readability and facilitate comprehension[R].Memphis:University of Memphis,2003.

        [12] McCarthy Philip M,Briner Stephen W ,Vasile Rus,et al.Textual Signatures:Identifying Text-Types Using Latent Semantic Analysis to Measure the Cohesion of Text Structures,in Natural Language Processing and Text Mining[M].London:Springer-Verlag,2007.

        [13] Preslav Nakov.Latent Semantic Analysis for German literature investigation[C].in 7th Fuzzy Days on Computational Intelligence,Theory and Applications,London,UK:Springer-Verlag,2001.

        [14] Roberto Basili,Paolo Marocco.A geometrical approach to literary text analysis[C].in Toward Computational Models of Literary Analysis,Genoa,Italy:University of Roma Tor Vergata,2006.

        [15] Landauer Thomas K,F(xiàn)oltz Peter W,Darrell Laham.An Introduction to Latent Semantic Analysis[J].Discourse Processes,1998,25(2-3).

        [16] 劉海燕,黎漫暉.菲茨杰拉德創(chuàng)作能力的變遷--基于詞匯測(cè)度的統(tǒng)計(jì)分析[J].統(tǒng)計(jì)與信息論壇,2010(10).

        [17] Thieme Horst R .Perron-Frobenius Theory of Positive Matrices and Associated Linear Dynamical Systems,in Mathematics in Population Biology[M].Princeton:Princeton University Press,2003.

        [18] Unnikrishna Pillai S,Toresten Suel,Cha Seunghun.The Perron-Frobenius theorem:Some of its applications[J].IEEE Signal Processing Magazine,2005(2).

        猜你喜歡
        菲茨杰拉德相似性章節(jié)
        一類上三角算子矩陣的相似性與酉相似性
        淺析當(dāng)代中西方繪畫的相似性
        認(rèn)真
        完美無缺的作品
        高中數(shù)學(xué)章節(jié)易錯(cuò)點(diǎn)提前干預(yù)的策略研究
        干船塢中的美國(guó)“伯克”級(jí)導(dǎo)彈驅(qū)逐艦“菲茨杰拉德”號(hào)(DDG 62)
        素養(yǎng)之下,美在引言——《“推理與證明”章節(jié)引言》一節(jié)比賽課的實(shí)錄
        《了不起的蓋茨比》與菲茨杰拉德
        低滲透黏土中氯離子彌散作用離心模擬相似性
        黃廖本《現(xiàn)代漢語(yǔ)》詞匯章節(jié)中的幾個(gè)問題
        看一区二区日本视频免费| 亚洲av无码av制服另类专区| 亚洲日韩欧洲无码av夜夜摸 | 日本三级香港三级人妇99| 久久亚洲av无码西西人体| 日韩人妻精品无码一区二区三区| 久久99精品久久久久九色| 激情网色图区蜜桃av| 久久96日本精品久久久| 国内少妇毛片视频| 精品国产人妻一区二区三区| AV教师一区高清| 亚洲国产成人精品一区刚刚| 亚洲一区二区国产一区| 亚洲av成人无码一区二区三区在线观看 | 免费毛片在线视频| 亚洲啊啊啊一区二区三区 | 不卡国产视频| 少妇激情一区二区三区| 麻豆69视频在线观看| 国产精品a免费一区久久电影| 国产精品视频二区不卡| 国产高清天干天天视频| 亚洲天堂av高清在线| 性色av一二三天美传媒| 毛多水多www偷窥小便| 日韩国产成人精品视频| 狼人狠狠干首页综合网| 一区二区三区视频在线观看免费 | 在线观看av手机网址| 一级黄色一区二区三区视频| 亚洲成人福利在线视频| 国产福利视频在线观看| 色拍拍在线精品视频| 国产人妖在线免费观看| 亚洲中文字幕日韩综合| 热久久美女精品天天吊色| 久久免费看少妇高潮v片特黄| 国产成人午夜av影院| 亚洲毛片在线观看免费| 精品伊人久久大香线蕉综合|