亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        敘事性文學(xué)作品的情節(jié)自動(dòng)分析方法

        2020-07-20 07:18:32楊江劉嬌萍甘苗
        語(yǔ)文學(xué)刊 2020年3期
        關(guān)鍵詞:分析

        ○ 楊江 劉嬌萍 甘苗

        (湖南科技大學(xué) 外國(guó)語(yǔ)學(xué)院,湖南 湘潭 411201)

        一、引 言

        敘事性作品是以記敘事件或講述故事為主要特征的一類文學(xué)作品,承擔(dān)著敘述故事情節(jié)、刻畫(huà)人物形象、解釋現(xiàn)實(shí)世界的基本功能[1]239,又分為虛構(gòu)性和非虛構(gòu)性敘事作品,主要包括小說(shuō)、劇本、童話、寓言、神話、編年史、報(bào)告文學(xué)、日記等。情節(jié)是敘事性作品中表現(xiàn)人物之間相互關(guān)系的一系列事件的發(fā)展過(guò)程,一般包括開(kāi)端、發(fā)展、高潮和結(jié)局四個(gè)部分。情節(jié)分析是理解和欣賞敘事性文學(xué)作品最重要的手段。

        一直以來(lái),對(duì)于敘事性文學(xué)作品的情節(jié)分析,人們采用的唯一方法是人工閱讀,即通過(guò)人對(duì)作品的閱讀活動(dòng)來(lái)了解和掌握情節(jié),從而或獲得對(duì)敘述內(nèi)容的深入理解,以達(dá)成對(duì)文學(xué)的審美需求,或進(jìn)一步總結(jié)和歸納情節(jié)的結(jié)構(gòu)規(guī)律和演化模式,以實(shí)現(xiàn)對(duì)敘事本身進(jìn)行研究的目的。無(wú)論是讀者還是研究者,人工閱讀的方法都能準(zhǔn)確、深刻、相對(duì)全面地理解作品的情節(jié),是理想、可行、最為人接受的方法。隨著數(shù)字人文(digital humanities)的興起和大數(shù)據(jù)時(shí)代的到來(lái),學(xué)界和業(yè)界對(duì)敘事性作品中與情節(jié)相關(guān)的信息產(chǎn)生了新的需求,使得人工閱讀的方法逐漸顯露出一些力所不逮之處,這主要體現(xiàn)在四個(gè)方面:(1)工作所需涉及的資料和數(shù)據(jù)在數(shù)量上均大大超過(guò)了人工閱讀所能處理的范疇;(2)不能引入計(jì)算分析的方法,通過(guò)大量數(shù)據(jù)的匯集使研究結(jié)論“自動(dòng)涌現(xiàn)”[2-3];(3)難以開(kāi)展和實(shí)施更宏觀、長(zhǎng)歷時(shí)的集群研究;(4)不易從海量作品中挖掘新的信息。因此,探索一種基于機(jī)器閱讀的新的情節(jié)分析方法,使其既能適應(yīng)時(shí)代需要和滿足各種需求,又能彌補(bǔ)人工閱讀固有的局限性,是非常必要的。

        文學(xué)研究中的敘事理論,尤其是經(jīng)典敘事學(xué)中的結(jié)構(gòu)主義敘事學(xué),對(duì)敘事性作品的情節(jié)分析具有直接的指導(dǎo)作用。從普洛普歸納的民間故事中的7種人物角色和31種人物行為功能,到后來(lái)敘事學(xué)家建立的敘事結(jié)構(gòu)和敘事語(yǔ)法[4-6],都為情節(jié)分析提供了理論上的支持。此后,萊恩在《可能的世界、人工智能與敘事理論》一書(shū)中借鑒人工智能的分析方法,描述了不同體裁的敘事作品的結(jié)構(gòu)特征[7],又為敘事性作品的自動(dòng)化分析方法的有效性提供了有力的證據(jù)。另一方面,結(jié)合自然語(yǔ)言處理技術(shù)和社會(huì)網(wǎng)絡(luò)分析理論進(jìn)行文學(xué)作品人物關(guān)系分析的相關(guān)研究,為情節(jié)自動(dòng)分析展示了方法上的可能性。其中,Still分析了莎士比亞戲劇中的人物關(guān)系,證明其具有同現(xiàn)實(shí)社會(huì)網(wǎng)絡(luò)相同的“小世界”屬性[8];Elson著重探討了從19世紀(jì)英國(guó)小說(shuō)中自動(dòng)抽取人物關(guān)系方法的有效性,并證實(shí)都市和鄉(xiāng)村兩種背景下的小說(shuō)在社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)上不具有文學(xué)研究者通常所認(rèn)為的顯著差異性。[9]可以說(shuō),前述三類研究為情節(jié)自動(dòng)分析在理論、方法和可行性上做出了有益的探索,具有啟發(fā)和借鑒意義,是本文工作開(kāi)展的基礎(chǔ)。但頗為遺憾的是,就情節(jié)自動(dòng)分析而言,這些研究相對(duì)分散,未能默契、緊密地串接在一起,因而也不能形成一個(gè)相對(duì)統(tǒng)一的研究框架和路徑。從這個(gè)角度看,國(guó)內(nèi)外學(xué)界至今未見(jiàn)有同類研究。

        基于上述背景,本文提出一種基于人物關(guān)系演變的敘事性文學(xué)作品情節(jié)自動(dòng)分析方法,該方法在較少人工干預(yù)的情況下,利用自然語(yǔ)言處理技術(shù),基于敘事學(xué)、語(yǔ)言學(xué)、社會(huì)網(wǎng)絡(luò)分析理論,對(duì)敘事性文學(xué)作品的敘事過(guò)程進(jìn)行探索性分析,以達(dá)到自動(dòng)推理敘事過(guò)程的發(fā)展和演變的目的。需要特別指出的是,本文所指的“情節(jié)分析”,是針對(duì)敘事過(guò)程的開(kāi)端、發(fā)展演變和結(jié)局所進(jìn)行一種探索性分析,與傳統(tǒng)意義上的情節(jié)分析相比,在深度和廣度上有所局限,屬于淺層的情節(jié)“理解”。

        本文的研究?jī)r(jià)值和意義在于:(1)研究方法具有創(chuàng)新性。文章運(yùn)用計(jì)算語(yǔ)言學(xué)常用的自然語(yǔ)言處理技術(shù),借鑒文學(xué)、語(yǔ)言學(xué)知識(shí)和理論以及社會(huì)科學(xué)的計(jì)量、統(tǒng)計(jì)、計(jì)算的研究方法,對(duì)小說(shuō)情節(jié)進(jìn)行自動(dòng)分析。(2)研究?jī)?nèi)容較為深入,研究領(lǐng)域歸屬新興交叉學(xué)科。本文針對(duì)小說(shuō)情節(jié)展開(kāi),是實(shí)質(zhì)性的文學(xué)研究范疇;在研究方法上綜合運(yùn)用自然語(yǔ)言處理技術(shù)、文學(xué)知識(shí)和理論、語(yǔ)言學(xué)知識(shí)和理論、社會(huì)網(wǎng)絡(luò)科學(xué)知識(shí)等,屬新興交叉學(xué)科。(3)本文有望建立一套研究文學(xué)作品的“外部”方法。(4)本文成果能有效促進(jìn)文本分析、內(nèi)容挖掘、自然語(yǔ)言處理等相關(guān)研究。

        二、敘事性文學(xué)作品的情節(jié)結(jié)構(gòu)

        文學(xué)敘事(narration)用話語(yǔ)虛構(gòu)社會(huì)生活事件的過(guò)程,敘事的構(gòu)成一般通過(guò)敘述內(nèi)容、敘述話語(yǔ)和敘述行為三個(gè)方面進(jìn)行分析。其中,敘述內(nèi)容即構(gòu)成一段敘述話語(yǔ)主題的故事內(nèi)容, 是被講述的故事, 包括事件、情節(jié)、人物、場(chǎng)景等[1]242。這些敘事要素之間的關(guān)系較為復(fù)雜,但如果將情節(jié)看作故事內(nèi)容中的“動(dòng)態(tài)”要素,是統(tǒng)領(lǐng)故事發(fā)展的上層單位,那么事件、人物和場(chǎng)景則是相對(duì)“靜態(tài)”的下位組成單位;而如果暫且舍棄故事內(nèi)容中的其他要素不談,對(duì)故事的分析則可近似等同于對(duì)情節(jié)的分析,如圖1所示。這是本文的第一個(gè)假設(shè)。

        圖1 敘事內(nèi)容分析的層次結(jié)構(gòu)

        情節(jié)是按照因果邏輯組織起來(lái)的一系列事件[1]244,但事件不是孤立存在的。敘事作品中的事件,絕大多數(shù)具有社會(huì)性,其活動(dòng)主體通常是人物,他們參與到事件當(dāng)中,成為推動(dòng)事件發(fā)展的行動(dòng)要素。缺乏人物的事件則喪失了社會(huì)性,只能稱作自然現(xiàn)象。事件還包括人物的動(dòng)作行為以及由此產(chǎn)生的結(jié)果。事件的發(fā)生要在一定的場(chǎng)所或環(huán)境下進(jìn)行,由此形成一個(gè)個(gè)場(chǎng)景。可見(jiàn),對(duì)事件的分析需要融合人物和場(chǎng)景,才能更加準(zhǔn)確地把握情節(jié)。當(dāng)然,倘若從人物的角度來(lái)看情節(jié),道理也是相同的,即需要把事件和場(chǎng)景因素考慮進(jìn)去。將事件做切分,可以得到情節(jié)的組成單位——情節(jié)單元(motif),它們敘事完整,是事件、人物和場(chǎng)景相互交錯(cuò)的綜合體,是情節(jié)分析的最小單位,如圖2所示。這是本文的第二個(gè)假設(shè)。

        圖2 情節(jié)的構(gòu)成

        情節(jié)按照事件敘述的順序在時(shí)間的線條上展開(kāi)。情節(jié)單元在時(shí)序上的綿延,實(shí)現(xiàn)了敘事要素從靜態(tài)到動(dòng)態(tài)的轉(zhuǎn)變;在特定時(shí)點(diǎn)或時(shí)段,情節(jié)單元占據(jù)著一定的空間,容納著事件、人物和場(chǎng)景以及它們內(nèi)部和相互之間的關(guān)系。如果說(shuō)情節(jié)是動(dòng)畫(huà)電影,那么情節(jié)單元?jiǎng)t是電影膠片,而時(shí)間的流動(dòng)就如放映機(jī),使情節(jié)單元展示出動(dòng)態(tài)的效果。情節(jié)具有時(shí)空二維屬性,是本文的第三個(gè)假設(shè),如圖3所示。

        圖3 情節(jié)的時(shí)空結(jié)構(gòu)

        在上述假設(shè)的前提下,本文提出一種基于人物關(guān)系演變的敘事性文學(xué)作品情節(jié)自動(dòng)分析方法。以下對(duì)該方法進(jìn)行具體闡述。

        三、基于人物關(guān)系的情節(jié)自動(dòng)分析方法

        本文采用的情節(jié)自動(dòng)分析方法主要包含情節(jié)單元切片、人物關(guān)系抽取、情節(jié)信息抽取、情節(jié)單元?dú)v時(shí)分析等步驟,自然語(yǔ)言處理技術(shù)貫穿各環(huán)節(jié)。工作流程如圖4所示。

        圖4 基于人物關(guān)系的情節(jié)分析工作流程

        (一)情節(jié)單元切片

        情節(jié)單元切片涉及兩個(gè)主要問(wèn)題:切片依據(jù)和切片數(shù)量。情節(jié)單元占據(jù)時(shí)間和空間,因而可以從時(shí)、空兩個(gè)角度進(jìn)行劃分,從而得到情節(jié)單元切片。相對(duì)而言,根據(jù)空間的不同劃分情節(jié)單元,具有更廣的適用性,這一點(diǎn)可以從話劇尤其是舞臺(tái)劇場(chǎng)景變化的必要性和重要性中得到參照。切片的多少?zèng)Q定了分析的精細(xì)程度,切片越多,掌握的情節(jié)發(fā)展細(xì)節(jié)就越多,分析的復(fù)雜度也隨之相應(yīng)地增加;切片越少,對(duì)情節(jié)運(yùn)動(dòng)過(guò)程的掌握就越少,遺漏的細(xì)節(jié)信息就越多。一般來(lái)說(shuō),敘事性作品的篇幅越長(zhǎng),包含的情節(jié)單元的數(shù)量也越多,為降低分析的復(fù)雜度,可以通過(guò)適當(dāng)增大切片的厚度來(lái)減少情節(jié)單元的數(shù)量。對(duì)于長(zhǎng)篇作品,也可以依據(jù)作品本身既有的章節(jié)劃分進(jìn)行切片。

        由于文本時(shí)間和故事時(shí)間可能不一致,在對(duì)情節(jié)進(jìn)行切片后,需要依據(jù)故事時(shí)間重組情節(jié)單元切片,使可能存在的各種逆時(shí)序敘述(倒敘、插敘)還原成順時(shí)序結(jié)構(gòu)。

        (二)人物關(guān)系抽取

        單個(gè)獨(dú)立的情節(jié)單元可以從多個(gè)角度著手分析,但最終都應(yīng)歸納出事件、人物和場(chǎng)景三個(gè)要素,以構(gòu)建動(dòng)態(tài)的情節(jié)時(shí)空演變鏈。相對(duì)而言,從人物關(guān)系入手是一種更為適宜和妥當(dāng)?shù)囊暯?。首先,敘事作品建?gòu)的情節(jié)通常被約束在一個(gè)虛擬化社會(huì)的范疇內(nèi),具有社會(huì)屬性,而社會(huì)學(xué)所關(guān)注的一個(gè)重要方面即是個(gè)體之間的關(guān)系,因而可以用社會(huì)分析方法來(lái)分析敘事作品的情節(jié)。其次,人具有社會(huì)性,虛擬社會(huì)亦是如此,社會(huì)性的本質(zhì)是關(guān)系,因此,探討人物實(shí)質(zhì)上就是探討人物關(guān)系。人物關(guān)系是一種社會(huì)網(wǎng)絡(luò),可以采用社會(huì)網(wǎng)絡(luò)分析法考察。再次,事件是人物的活動(dòng),人物是事件的主體;場(chǎng)景是事件發(fā)生的場(chǎng)所和環(huán)境,也是人物活動(dòng)的空間。所以,事件和場(chǎng)景可以統(tǒng)籌在人物之下,而且這些信息在有人物出現(xiàn)的上下文中總能獲得。最后,一般而言,不同的事件有不同的參與者,事件的發(fā)展變化導(dǎo)致人物關(guān)系的變化。因此,在某些情況下,可以將事件的進(jìn)程簡(jiǎn)化為人物關(guān)系的演變。

        為避免混淆,以下給出人物關(guān)系的工作定義。

        定義1:人物關(guān)系是敘事性文學(xué)作品中人物之間的社會(huì)關(guān)系。

        根據(jù)我們對(duì)30余篇中外小說(shuō)和童話作品的考察和統(tǒng)計(jì)發(fā)現(xiàn),人物關(guān)系又可具體分為六種:(1)對(duì)話關(guān)系,即人物之間產(chǎn)生了對(duì)話;(2)動(dòng)作關(guān)系,即人物之間存在的主動(dòng)施為動(dòng)作;(3)共現(xiàn)關(guān)系,即多個(gè)人物同時(shí)出現(xiàn)在某一時(shí)空內(nèi);(4)提及關(guān)系,即人物對(duì)話或心理活動(dòng)中提及的不在現(xiàn)場(chǎng)的一方;(5)情感關(guān)系,即人物之間對(duì)非己方持有的情感;(6)其他關(guān)系,即不屬于上述五種關(guān)系中任何一種的其他關(guān)系。

        定義2:人物關(guān)系表示成點(diǎn)和線的連接。

        其中,點(diǎn)代表人物,線代表人物之間的某種關(guān)系。一個(gè)情節(jié)單元中的人物關(guān)系構(gòu)成一個(gè)社會(huì)網(wǎng)絡(luò)。這里的“網(wǎng)絡(luò)”,是圖論中的概念。在圖論中,“圖”是一系列頂點(diǎn)和把各個(gè)頂點(diǎn)連接起來(lái)的連線組成的集合,“網(wǎng)絡(luò)”則是由一張圖和附加在圖的點(diǎn)線之上的信息兩部分構(gòu)成的。本文中圖表示的是人物關(guān)系網(wǎng)絡(luò)的結(jié)構(gòu),附加信息指事件和場(chǎng)景。

        (三)情節(jié)信息抽取

        情節(jié)信息抽取完成從情節(jié)切片中得到場(chǎng)景和時(shí)間信息、從人物關(guān)系網(wǎng)絡(luò)中得到人物和事件信息的任務(wù),并將其用模板結(jié)構(gòu)表示,使信息組織結(jié)構(gòu)化。事件的歸納推導(dǎo)是這個(gè)環(huán)節(jié)的關(guān)鍵任務(wù),事件由多個(gè)動(dòng)作組成,動(dòng)作具體明確,而事件相對(duì)抽象,需要一定的歸納和推導(dǎo)。結(jié)構(gòu)主義敘事學(xué)對(duì)童話故事中的事件進(jìn)行過(guò)總結(jié),其他類型的敘事文學(xué)則更多有賴于先驗(yàn)知識(shí)庫(kù)。我們采取的策略是先枚舉后決策,依據(jù)主要人物的活動(dòng)軌跡進(jìn)行推理,難以決策的事件則留待歷時(shí)分析步驟解決,少數(shù)情況輔以人工干預(yù)。

        (四)情節(jié)單元?dú)v時(shí)分析

        重組后的情節(jié)單元按照自然時(shí)間的秩序在時(shí)間和空間兩個(gè)維度上鋪開(kāi),從人物關(guān)系的演變?nèi)胧?,通過(guò)對(duì)單元之間組合發(fā)展的歷時(shí)性考察,可以推導(dǎo)出完整的情節(jié)表層結(jié)構(gòu)。歷時(shí)性考察不僅指從敘事的開(kāi)端到結(jié)尾的貫穿,也包含對(duì)情節(jié)單元的階段性分析;考察的對(duì)象可以是故事中的全體人物,在有的情況下,也可依據(jù)由其他技術(shù)手段或先驗(yàn)知識(shí)獲得的中心人物及其關(guān)聯(lián)人物之間的社會(huì)關(guān)系作局部分析,以減少待分析的數(shù)據(jù)量,或得到更多的微觀信息。歷時(shí)分析完成后即生成情節(jié)梗概。

        為實(shí)現(xiàn)上述分析方法,自然語(yǔ)言處理技術(shù)的調(diào)用必不可少,其中許多技術(shù)在此過(guò)程中起著關(guān)鍵性的作用,直接關(guān)系著分析結(jié)果的有效與否和好壞程度。命名實(shí)體抽取是對(duì)人名、地名、時(shí)間表達(dá)式等的識(shí)別和處理,與情節(jié)中的人物、場(chǎng)景、時(shí)間等對(duì)應(yīng),是本文中最重要的語(yǔ)言技術(shù)。事件抽取關(guān)系著情節(jié)中的事件要素,動(dòng)作、對(duì)話抽取以及情感分析則決定著人物關(guān)系的分析。此外,一些基礎(chǔ)性的自然語(yǔ)言處理技術(shù),比如詞法和句法分析,也影響著以其為前提的相關(guān)技術(shù)。

        四、實(shí)驗(yàn)結(jié)果及討論

        我們?cè)O(shè)計(jì)了兩類實(shí)驗(yàn)對(duì)基于人物關(guān)系演變的情節(jié)自動(dòng)分析方法進(jìn)行驗(yàn)證。第一類實(shí)驗(yàn)是對(duì)方法的驗(yàn)證,目的是考察其可行性,同時(shí)為了排除現(xiàn)有語(yǔ)言技術(shù)水平的局限可能帶來(lái)的不利影響,所用數(shù)據(jù)是人工標(biāo)注的語(yǔ)料;第二類實(shí)驗(yàn)是對(duì)方法的應(yīng)用,目的是考察其有效性。以下分別對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行討論。

        (一)情節(jié)自動(dòng)分析方法的驗(yàn)證

        實(shí)驗(yàn)數(shù)據(jù)為10篇來(lái)自《格林童話》和《安徒生童話》的故事,語(yǔ)料文本均為英譯本,收集自互聯(lián)網(wǎng)(網(wǎng)址:http://www.24en.com/novel/children/)。原始語(yǔ)料使用Stanford POS Tagger[10]進(jìn)行詞語(yǔ)切分和詞性賦碼,輸出為xml格式的待標(biāo)文本后,交由三名英語(yǔ)專業(yè)研究生標(biāo)注。標(biāo)注完成后再?gòu)慕Y(jié)果文本中抽取出各類情節(jié)信息,生成對(duì)應(yīng)的時(shí)間網(wǎng)絡(luò)(temporal network)數(shù)據(jù),運(yùn)用社會(huì)網(wǎng)絡(luò)分析(Social Network Analysis)軟件Pajek[11]進(jìn)行分析。限于篇幅,以童話故事《灰姑娘》為例闡述實(shí)驗(yàn)結(jié)果。

        依據(jù)標(biāo)注結(jié)果,《灰姑娘》中共有10個(gè)人物、10個(gè)場(chǎng)景。其中,主要人物Cinderella出現(xiàn)在除場(chǎng)景8以外的所有場(chǎng)景中,Prince出現(xiàn)在場(chǎng)景4至10中,Step-sisters出現(xiàn)在場(chǎng)景2至8和場(chǎng)景10中,Stepmother則出現(xiàn)在場(chǎng)景1至2和4至8中。圖5和圖6是按場(chǎng)景切分的情節(jié)單元的歷時(shí)變化圖。

        圖5 《灰姑娘》情節(jié)單元?dú)v時(shí)變化圖(上)

        圖6 《灰姑娘》情節(jié)單元?dú)v時(shí)變化圖(下)

        我們將《灰姑娘》的故事按照事件、場(chǎng)景和人物在時(shí)空維度上排列鋪開(kāi),把具體的故事情節(jié)抽象成一幅幅靜態(tài)的圖像,稍微發(fā)揮想象,讓這些圖像依次“放映”,就不難獲得整個(gè)故事的情節(jié):生母逝世→灰姑娘受到繼母和繼姐妹的不公對(duì)待→參加舞會(huì)前她被刁難→王子在舞會(huì)上對(duì)灰姑娘一見(jiàn)鐘情→王子三次尋找灰姑娘→假新娘兩次被發(fā)現(xiàn)→王子找到灰姑娘→繼姐妹婚禮上受到懲罰。在此基礎(chǔ)上,我們還可以為其添加更多的信息,這類細(xì)節(jié)信息越多,人們所理解的情節(jié)內(nèi)容也就越豐富。例如,在上圖中,我們?yōu)橹饕宋镌黾恿艘恍┡c其他人物的情感關(guān)系,附加在人物關(guān)系的連線上,從而得知了他們之間的“敵友”關(guān)系。通過(guò)類似方法的不斷累積,我們對(duì)情節(jié)內(nèi)容的把握也就漸趨接近真實(shí)的情節(jié)了。

        從上圖我們不難發(fā)現(xiàn),人物關(guān)系的變動(dòng)體現(xiàn)為關(guān)系網(wǎng)絡(luò)結(jié)構(gòu)的差異,這或反映了事件的變化,或反映了場(chǎng)景的更迭。首先,人物的出現(xiàn)和退出表示了事件的異動(dòng)。人物Mother僅出現(xiàn)在場(chǎng)景1中,表明該場(chǎng)景的事件是導(dǎo)致其退出故事的原因。其次,人物關(guān)系變動(dòng)越劇烈,事件的相似度就越低,如場(chǎng)景1和2;人物關(guān)系變動(dòng)越少,事件的相似度就越高,如場(chǎng)景6和7。再次,主要人物總是出現(xiàn)在更多的關(guān)系網(wǎng)絡(luò)中,如Cinderella和Prince,而次要人物則體現(xiàn)為較少的場(chǎng)景和關(guān)系數(shù)量,如Mother。因此,關(guān)系網(wǎng)絡(luò)結(jié)構(gòu)的差異主要體現(xiàn)為不同次要人物與固定的主要人物之間的關(guān)系變化,如場(chǎng)景3和4。最后,多數(shù)情況下,不同的事件具有不同的場(chǎng)景,所以人物關(guān)系的變動(dòng)還反映了場(chǎng)景的更迭,如場(chǎng)景9和10。

        運(yùn)用本文的分析方法獲知童話故事的情節(jié),《灰姑娘》并非特例。同樣的方法對(duì)其他九篇童話故事的分析實(shí)驗(yàn),都得到了良好的結(jié)果,證明了基于人物關(guān)系演變的情節(jié)分析方法是可行的。但實(shí)驗(yàn)結(jié)果也表明,篇幅較短的故事,如《萵苣姑娘》《女水妖》,分析的結(jié)果不如篇幅較長(zhǎng)的;人物較少的故事,如《小紅帽》,分析的結(jié)果不如人物較多的;場(chǎng)景切分過(guò)細(xì)的標(biāo)注文本,分析結(jié)果不如相對(duì)較粗的,如《魔鬼的三根金發(fā)》,標(biāo)注者切分出了16個(gè)場(chǎng)景,多數(shù)場(chǎng)景中只有一兩對(duì)人物關(guān)系,少數(shù)場(chǎng)景中的人物關(guān)系卻很多,造成了信息分布的不均衡,對(duì)結(jié)果造成了較大影響,可見(jiàn)情節(jié)單元切分對(duì)情節(jié)分析方法的重要性。

        使用童話故事作為實(shí)驗(yàn)數(shù)據(jù),一是考慮到人工標(biāo)注的繁重工作量,二是因?yàn)橥捁适虑楣?jié)結(jié)構(gòu)的簡(jiǎn)潔性。其他類別的敘事性文學(xué)作品的情節(jié)可以通過(guò)倒敘、插敘等方法的運(yùn)用呈現(xiàn)出高度的復(fù)雜性,但仍然可以通過(guò)層次切分和敘事時(shí)間的調(diào)整進(jìn)行組合拼接,因而其通常只對(duì)技術(shù)造成困難,并不妨礙方法的使用。

        (二)情節(jié)自動(dòng)方法的應(yīng)用

        本類實(shí)驗(yàn)的對(duì)象是長(zhǎng)篇小說(shuō)《簡(jiǎn)·愛(ài)》,文本來(lái)源于Project Gutenberg(網(wǎng)址:http://www.gutenberg.org/ebooks/1260)。我們使用Stanford CoreNLP[12]對(duì)原始文本進(jìn)行詞性賦碼、命名實(shí)體識(shí)別和依存句法分析后,對(duì)部分命名實(shí)體的標(biāo)注結(jié)果做了簡(jiǎn)單的修正,使人名和地名保持一致,最后仍采用Pajek軟件分析數(shù)據(jù)。圖7是《簡(jiǎn)·愛(ài)》的人物關(guān)系整體網(wǎng)。

        圖7 《簡(jiǎn)·愛(ài)》人物關(guān)系整體網(wǎng)

        《簡(jiǎn)·愛(ài)》以第一人稱視角敘述故事,共分38章,按文本既有的章節(jié)劃分,我們得到38個(gè)“場(chǎng)景”。由于這種情況下的“場(chǎng)景”是通常理解的多個(gè)場(chǎng)景的復(fù)合體,可稱其為“復(fù)合場(chǎng)景”。圖8和圖9是第1和38章復(fù)合場(chǎng)景的人物關(guān)系圖。

        圖8 《簡(jiǎn)·愛(ài)》復(fù)合場(chǎng)景1的人物關(guān)系圖

        圖9 《簡(jiǎn)·愛(ài)》復(fù)合場(chǎng)景38的人物關(guān)系圖

        通過(guò)考察人物關(guān)系整體網(wǎng)和各個(gè)復(fù)合場(chǎng)景網(wǎng)絡(luò)中頂點(diǎn)的度與點(diǎn)度中心性,可以大致探求出《簡(jiǎn)·愛(ài)》的主要人物,如簡(jiǎn)·愛(ài)、羅切斯特、貝茜、里德太太、李維斯等,其中,中心人物是女主人公簡(jiǎn)·愛(ài)。以簡(jiǎn)·愛(ài)為中心頂點(diǎn)(圖中標(biāo)簽為“I”的頂點(diǎn))輻射出來(lái)的連線,其數(shù)量多少表示某一復(fù)合場(chǎng)景內(nèi)部情節(jié)的復(fù)雜度,其大小體現(xiàn)人物間互動(dòng)的強(qiáng)度,其長(zhǎng)短在本文中可以理解為人物間的親疏程度。這些數(shù)據(jù)為人物關(guān)系分析提供了基礎(chǔ)信息。

        復(fù)合場(chǎng)景中由于人物關(guān)系的復(fù)雜性,對(duì)主要場(chǎng)景和重要事件的識(shí)別和歸并造成了困難。我們對(duì)問(wèn)題進(jìn)行了簡(jiǎn)化,通過(guò)僅分析與中心人物存在連線的辦法來(lái)確定主要場(chǎng)景,通過(guò)歸并僅與中心人物存在連線的人物之間發(fā)生的頻次較高的事件的辦法來(lái)確定重要事件,每個(gè)環(huán)節(jié)都輔以少量的人工查驗(yàn)和修正。將所有復(fù)合場(chǎng)景按形如圖10的樣式進(jìn)行整合,再配上場(chǎng)景名稱和主要事件,小說(shuō)的情節(jié)脈絡(luò)便不難掌握。

        圖10 《簡(jiǎn)·愛(ài)》復(fù)合場(chǎng)景5的人物關(guān)系圖

        實(shí)驗(yàn)過(guò)程中也發(fā)現(xiàn)了一些問(wèn)題。我們結(jié)合圖8、9、10作簡(jiǎn)要說(shuō)明。

        第一,同前所述,人物關(guān)系的變化意味著場(chǎng)景或事件的更迭,在《簡(jiǎn)·愛(ài)》中,相同的場(chǎng)景下人物關(guān)系網(wǎng)絡(luò)也發(fā)生了變化,但事件卻不盡相同。如第1至4章的主要場(chǎng)景都是蓋茨海德莊園,但在此發(fā)生的多個(gè)事件推動(dòng)了情節(jié)的發(fā)展。第二,Stanford CoreNLP對(duì)人名共指消解的處理仍不能令人滿意。如圖8中的Georgiana Reed、圖10中的Maria Temple以及圖9中的Jane都未能歸并為一個(gè)頂點(diǎn)。第三,復(fù)合場(chǎng)景中對(duì)主要場(chǎng)景和重要事件的識(shí)別和歸并是情節(jié)自動(dòng)分析的一個(gè)難點(diǎn)。我們的簡(jiǎn)單處理方法導(dǎo)致將復(fù)合場(chǎng)景1的主要場(chǎng)景名稱分析為“客廳”,回查文本后發(fā)現(xiàn)如果不結(jié)合全文幾乎無(wú)法將其正確歸納為蓋茨海德莊園。第四,按文本自然章節(jié)進(jìn)行情節(jié)單元切片的做法非常粗糙,使得重要場(chǎng)景的變更無(wú)法被識(shí)別,會(huì)導(dǎo)致嚴(yán)重的分析錯(cuò)誤。圖10中實(shí)際包含了從蓋茨海德莊園到孤兒院兩個(gè)場(chǎng)景的轉(zhuǎn)換,但當(dāng)主要場(chǎng)景被分析為孤兒院后,會(huì)錯(cuò)誤地得出貝茜跟隨簡(jiǎn)·愛(ài)一同來(lái)到孤兒院。對(duì)上述問(wèn)題的改善是我們下一步研究的重點(diǎn)。

        五、結(jié) 語(yǔ)

        數(shù)字人文的興起和大數(shù)據(jù)時(shí)代的到來(lái)對(duì)文學(xué)內(nèi)容的理解提出了新的需求。為使機(jī)器閱讀小說(shuō)成為可能,本文對(duì)敘事性文學(xué)作品的情節(jié)結(jié)構(gòu)進(jìn)行分析后認(rèn)為:(1)對(duì)故事的分析近似等同于對(duì)情節(jié)的分析,其中情節(jié)分析包含對(duì)事件、人物和場(chǎng)景的分析;(2)情節(jié)單元在時(shí)間的線條上展開(kāi),占據(jù)一定的空間,容納事件、人物和場(chǎng)景,是組成情節(jié)的最小單位;(3)一般而言,人物關(guān)系的演變或體現(xiàn)了事件的發(fā)展,或反映了場(chǎng)景的變更。在此基礎(chǔ)上,本文探討了基于人物關(guān)系演變的敘事性文學(xué)作品的情節(jié)自動(dòng)分析方法,通過(guò)場(chǎng)景和事件對(duì)情節(jié)單元進(jìn)行切片,繼而運(yùn)用自然語(yǔ)言處理和社會(huì)網(wǎng)絡(luò)分析技術(shù),在歷時(shí)的層面上推理敘事過(guò)程的開(kāi)端、發(fā)展演變和結(jié)局。本文最后設(shè)計(jì)了兩類實(shí)驗(yàn)對(duì)上述方法進(jìn)行驗(yàn)證,結(jié)果表明,基于人物關(guān)系演變的敘事性文學(xué)作品的情節(jié)自動(dòng)分析方法具有較高的可行性和一定程度的有效性。

        本文提出的方法以自然語(yǔ)言處理技術(shù)為基礎(chǔ),但囿于該領(lǐng)域當(dāng)前技術(shù)水平的局限,在某些環(huán)節(jié)上仍需輔以人工干預(yù),部分結(jié)果尚不能令人滿意。此外,該方法在細(xì)節(jié)問(wèn)題的處理上仍存在一些不足,有些問(wèn)題如事件抽取、歸并和重要度計(jì)算等限于時(shí)間精力未能涉及,因而需要在分析的廣度和深度上進(jìn)一步加強(qiáng)探索,這些都為未來(lái)的工作指明了方向。

        猜你喜歡
        分析
        禽大腸桿菌病的分析、診斷和防治
        隱蔽失效適航要求符合性驗(yàn)證分析
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
        經(jīng)濟(jì)危機(jī)下的均衡與非均衡分析
        對(duì)計(jì)劃生育必要性以及其貫徹實(shí)施的分析
        GB/T 7714-2015 與GB/T 7714-2005對(duì)比分析
        出版與印刷(2016年3期)2016-02-02 01:20:11
        網(wǎng)購(gòu)中不良現(xiàn)象分析與應(yīng)對(duì)
        中西醫(yī)結(jié)合治療抑郁癥100例分析
        偽造有價(jià)證券罪立法比較分析
        少妇被粗大猛进进出出| 婷婷亚洲久悠悠色悠在线播放| 久久人人爽人人爽人人av东京热| 国产美女高潮流白浆在线观看| 久久免费看视频少妇高潮| 西川结衣中文字幕在线| 欧洲freexxxx性少妇播放| 揄拍成人国产精品视频| 国产一级一厂片内射视频播放| 亚洲亚色中文字幕剧情| 精品乱码久久久久久久| 亚洲伊人久久大香线蕉影院| 亚洲高清av一区二区| 中国国产不卡视频在线观看| 黑人巨大跨种族video| 亚洲熟妇在线视频观看| 亚洲国产线茬精品成av| 久久无码高潮喷水抽搐| 婷婷五月综合丁香在线| 亚洲一区二区三区av在线免费| 美女视频在线观看一区二区三区| 人妻少妇被粗大爽.9797pw| 国产成人午夜精华液| 久久精品国产亚洲综合色| 扒开女性毛茸茸的视频| 国产精品爽爽ⅴa在线观看| 人人妻人人澡av天堂香蕉 | 国产91在线精品观看| 亚洲自偷精品视频自拍| 久久久精品2019免费观看| 国产成人丝袜在线无码| 中文字幕av人妻少妇一区二区 | 人妻丰满熟妇av无码区hd| 欧美日韩中文字幕久久伊人| 极品少妇一区二区三区四区视频| 大ji巴好深好爽又大又粗视频| 无码人妻品一区二区三区精99| 中文字幕亚洲精品人妻| 国产av精品麻豆网址| 国产高清一区二区三区视频| 91精品久久久久含羞草|