亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        “從此,我們多了個(gè)天眼般的閱讀者”

        2019-12-19 11:19:40
        南方周末 2019-12-19
        關(guān)鍵詞:小說(shuō)研究

        “計(jì)算機(jī)不理解任何人類語(yǔ)言,但是它有兩個(gè)好處,第一很快,第二很穩(wěn)定。你讓我看兩千萬(wàn)字的小說(shuō),我看到后面就完全忘記前面。”

        “用數(shù)

        字史學(xué)的方式去研究歷史,人的價(jià)值或者個(gè)性怎么辦?”

        南方周末記者 曹穎

        南方周末實(shí)習(xí)生 杜嘉禧

        發(fā)自上海、廣州

        戰(zhàn)玉冰用12.5小時(shí)“讀”完了749部中國(guó)網(wǎng)絡(luò)小說(shuō),總字?jǐn)?shù)七億兩千九百多萬(wàn)字。即便按一天一部的速度閱讀,普通人要用兩年多時(shí)間才能讀完。戰(zhàn)玉冰只用了半天時(shí)間,因?yàn)樗柚艘豢畲髷?shù)據(jù)軟件。

        軟件是上海作家走走開(kāi)發(fā)的。2017年,走走辭去《收獲》雜志社的編輯職務(wù),與鄭翔宇聯(lián)合創(chuàng)業(yè),新業(yè)務(wù)主要是為影視公司評(píng)估文學(xué)作品。當(dāng)時(shí),影視公司熱衷于購(gòu)買網(wǎng)絡(luò)文學(xué)的作品版權(quán)。這些作品動(dòng)輒幾百萬(wàn)字,走走讀完一部就需要一周。這也是行業(yè)內(nèi)普遍的煩惱。走走暢想,如果有一個(gè)工具,能幫大家迅速看完小說(shuō),告訴大家情節(jié)是什么就好了。大數(shù)據(jù)軟件的雛形誕生了。

        軟件研發(fā)不久,影視行業(yè)遭遇寒冬,走走和鄭翔宇的公司業(yè)務(wù)短缺,面臨轉(zhuǎn)型。2019年,《收獲》雜志復(fù)刊四十周年,雜志社得知走走的軟件,想用這款軟件做一個(gè)報(bào)告,分析過(guò)去四十年《收獲》刊載小說(shuō)的風(fēng)格變化。走走的軟件從此邁向人文學(xué)科。

        報(bào)告由復(fù)旦大學(xué)博士生戰(zhàn)玉冰撰寫。戰(zhàn)玉冰的專業(yè)是中國(guó)現(xiàn)當(dāng)代文學(xué),學(xué)者們研究時(shí)也會(huì)用到統(tǒng)計(jì),比如魯迅《狂人日記》里寫到了多少次“狂人”、多少次“吃人”?!巴ㄟ^(guò)統(tǒng)計(jì)數(shù)據(jù)來(lái)樹(shù)立小說(shuō)的主題,這樣的研究很多?!睉?zhàn)玉冰的博士論文需統(tǒng)計(jì)民國(guó)時(shí)期偵探小說(shuō)發(fā)表情況,他用了半年時(shí)間,才統(tǒng)計(jì)完這項(xiàng)龐大的數(shù)據(jù)。《收獲》四十年刊載的小說(shuō)也是龐大的數(shù)據(jù),借助軟件,戰(zhàn)玉冰只用兩周就拿到了想要的數(shù)據(jù)。

        數(shù)字文學(xué)只是“數(shù)字人文”的眾多分支之一,其他分支包括數(shù)字史學(xué)、數(shù)字哲學(xué)、數(shù)字藝術(shù)等等。據(jù)南京大學(xué)藝術(shù)學(xué)院副教授陳靜研究,中國(guó)學(xué)界2009年才開(kāi)始廣泛關(guān)注數(shù)字人文。這一年,武漢大學(xué)王曉光教授發(fā)表科普文章《“數(shù)字人文”的產(chǎn)生、發(fā)展與前沿》,在“科學(xué)網(wǎng)”上獲得上萬(wàn)在線點(diǎn)擊。2011年,中國(guó)首家數(shù)字人文研究中心落戶武漢大學(xué)。

        “數(shù)字人文不僅是量化的方式或者統(tǒng)計(jì)的方式,也可以用文本挖掘,用社會(huì)網(wǎng)絡(luò)信息,或者用可視化的方式呈現(xiàn)你的論文結(jié)果?!蹦暇┐髮W(xué)歷史系教授王濤告訴南方周末記者,他2014年就接觸到“數(shù)字史學(xué)”,但在他的世界史研究方向,至今仍然很少有人應(yīng)用數(shù)字方法做研究。

        和尿布一起購(gòu)買

        最多的商品是啤酒

        根據(jù)大數(shù)據(jù)統(tǒng)計(jì),在《收獲》復(fù)刊四十年來(lái)刊載的小說(shuō)中,第一個(gè)十年最突出的高頻詞是“我要”。戰(zhàn)玉冰分析,“我要”意味著經(jīng)歷“文革”十年壓抑之后,個(gè)人主體意識(shí)的覺(jué)醒和自我表達(dá)欲望的急劇提升,這也與當(dāng)時(shí)以控訴“文革”為主題的“傷痕文學(xué)”和書寫自我經(jīng)歷的“知青文學(xué)”的流行相互契合。從第二個(gè)十年開(kāi)始,高頻詞變成了“我們”“他們”“自己”。文學(xué)創(chuàng)作逐漸恢復(fù)到了對(duì)日常生活的關(guān)注、描摹和書寫當(dāng)中。

        后來(lái),戰(zhàn)玉冰又用軟件分析了48部茅盾文學(xué)獎(jiǎng)獲獎(jiǎng)作品,排名第一的高頻詞是“心里”。這個(gè)結(jié)果符合戰(zhàn)玉冰對(duì)“嚴(yán)肅文學(xué)”的想象和認(rèn)知,但他找不到二者之間必然的因果關(guān)系?!澳芨杏X(jué)到,但是我就是說(shuō)不清楚,最后論文其實(shí)也沒(méi)有說(shuō)清楚?!睉?zhàn)玉冰告訴南方周末記者,當(dāng)時(shí)他認(rèn)為學(xué)術(shù)研究就應(yīng)該注重因果關(guān)系,因此感到痛苦。

        為此,戰(zhàn)玉冰看了很多數(shù)字研究的書。他讀到沃爾瑪超市抓取交易數(shù)據(jù),發(fā)現(xiàn)和尿布一起購(gòu)買最多的商品是啤酒。超市沒(méi)有追問(wèn)為什么,只是根據(jù)這個(gè)結(jié)果,把啤酒跟尿布擺在一起。戰(zhàn)玉冰豁然開(kāi)朗:“相關(guān)性本身是有價(jià)值的,不一定非要把它變成因果。”

        王濤曾用軟件統(tǒng)計(jì)德國(guó)史研究,數(shù)據(jù)顯示,學(xué)者們最關(guān)心的問(wèn)題是猶太人問(wèn)題,最關(guān)注的時(shí)期是二戰(zhàn)時(shí)期。這一現(xiàn)象和王濤自己的經(jīng)驗(yàn)一致,他在文中寫道:“此前,我們只能憑印象認(rèn)識(shí)到德國(guó)史研究的流行度,現(xiàn)在借助大數(shù)據(jù)的定量分析,證實(shí)了我們的印象。這應(yīng)該是數(shù)字人文最令人著迷的地方。”

        高頻詞似乎成為研究者重點(diǎn)關(guān)注的對(duì)象,王濤反思:“我們把更多注意力投注在大樣本的數(shù)據(jù),丟棄了低頻率的內(nèi)容。對(duì)于歷史研究而言,這些被忽視的內(nèi)容可能同樣具有價(jià)值?!?/p>

        2019年,李洱小說(shuō)《應(yīng)物兄》摘得茅盾文學(xué)獎(jiǎng)。戰(zhàn)玉冰通過(guò)軟件分析意外地發(fā)現(xiàn),“心里”并非這部小說(shuō)的高頻詞,但其余四十七部獲獎(jiǎng)作品中,“心里”均是高頻詞?!稇?yīng)物兄》似乎不符合數(shù)據(jù)呈現(xiàn)的“嚴(yán)肅文學(xué)”的特征。

        這個(gè)特例同樣有研究?jī)r(jià)值。戰(zhàn)玉冰發(fā)現(xiàn),李洱在小說(shuō)里用了一種近乎冰冷的客觀敘事態(tài)度來(lái)取代主觀抒情和心理描寫,李洱常常使用“他問(wèn)自己”“他聽(tīng)見(jiàn)自己說(shuō)”一類的表達(dá)方式,把人物的心理活動(dòng),變成一種主客體之間的對(duì)話。

        上述分析與李洱的解讀不謀而合,“熟悉我的人都知道,我是很強(qiáng)調(diào)小說(shuō)的對(duì)話性的。小說(shuō)現(xiàn)代性的最重要的標(biāo)志就是對(duì)話性,它包含著作者和讀者對(duì)話,作者和作品中人物的對(duì)話,作品中人物之間的對(duì)話,以及讀者和作品中人物的對(duì)話”,2019年12月13日,李洱在南方周末舉辦的N—TALK“文學(xué)之夜”現(xiàn)場(chǎng)表示,文學(xué)的使命就是表達(dá)差異,“所有的對(duì)話都伴隨著爭(zhēng)議、質(zhì)疑,而爭(zhēng)議和質(zhì)疑會(huì)打開(kāi)小說(shuō)的空間”。

        《長(zhǎng)安十二時(shí)辰》的

        故事形狀是

        “倒N型”

        2019年,《思南文學(xué)選刊》揭曉了國(guó)內(nèi)首個(gè)AI文學(xué)榜單,評(píng)委是大數(shù)據(jù)軟件“一葉故事薈”(時(shí)稱“谷臻小簡(jiǎn)”),二十種文學(xué)雜志提供了771部短篇小說(shuō)供其評(píng)選。

        2019年1月21日前,莫言的《等待摩西》始終最受“一葉故事薈”青睞,但1月21日新作品送到,它“變心”了。最終陳楸帆的《出神狀態(tài)》成為“一葉故事薈”評(píng)選出的年度最愛(ài)短篇小說(shuō)。

        “一葉故事薈”通過(guò)數(shù)據(jù)分析評(píng)判文學(xué)作品,包括判斷情節(jié)曲線、人物情緒糾結(jié)度等。在它的評(píng)判下,《出神狀態(tài)》的系數(shù)為0.998941,略高于《等待摩西》的系數(shù)0.998931。但開(kāi)發(fā)這個(gè)軟件的走走說(shuō):“計(jì)算機(jī)跟人一樣,沒(méi)法評(píng)判語(yǔ)言的好壞,你沒(méi)法說(shuō)閻連科的反諷質(zhì)量低于余華的零度敘事?!?/p>

        情節(jié)曲線也應(yīng)用于人文學(xué)科研究,通過(guò)分析文本,軟件描畫出沖突曲線模型,即用一條簡(jiǎn)單的線條描繪一個(gè)故事的“形狀”,其中包含情緒情感、結(jié)構(gòu)意義、節(jié)奏節(jié)拍等幾個(gè)維度的特征。走走向南方周末記者展示了六個(gè)模型:W型、N型、V型、M型、倒N型、倒V型,前三種是積極型結(jié)局,后三種是消極型結(jié)局?!爱?dāng)故事情節(jié)為積極向上或者沖突較為激烈時(shí)曲線呈現(xiàn)上升趨勢(shì);當(dāng)故事情節(jié)為消極向下時(shí)曲線呈現(xiàn)下降趨勢(shì)。當(dāng)故事情節(jié)出現(xiàn)情況好轉(zhuǎn)或悲劇來(lái)襲時(shí),曲線則呈現(xiàn)出拐點(diǎn),曲線拐點(diǎn)越多即表明故事中大的情節(jié)、轉(zhuǎn)折越多。”這六種模型是“一葉故事薈”分析了國(guó)內(nèi)近二十年間改編成影視的724部文學(xué)作品所得。

        《長(zhǎng)安十二時(shí)辰》的故事形狀是倒N型,《霸王別姬》的故事形狀是M型,“以《白鹿原》的故事形狀(W型)為例,情節(jié)較積極,但在故事走到約三分之一的時(shí)候,氛圍走入全文最低谷,雖然最后有所回升,但整體基調(diào)以悲涼為主?!弊咦咧钢娔X上的模型解釋。

        走走與王濤在歷史研究領(lǐng)域合作,嘗試描繪口述史的故事形狀。“口述史本身,某種意義上就是一個(gè)故事,就是一個(gè)人的故事,我們可以從文學(xué)文本這個(gè)角度來(lái)理解口述史這個(gè)材料?!?/p>

        《被改變的人生——南京大屠殺幸存者口述生活史》一書記錄了49位幸存者的回憶,軟件測(cè)繪出他們的情緒變化圖譜,初步結(jié)果顯示大部分口述者遵循著“甜-苦-甜”的V型情感模式,但走走對(duì)南方周末記者說(shuō):“應(yīng)該更注意那些相反情緒,呈倒V型的敘述者,他們的人生可能過(guò)得并不好?!?/p>

        沖突曲線模型的靈感來(lái)自美國(guó)作家馮內(nèi)古特?!八岢鲆粋€(gè)問(wèn)題,我能不能用一條線畫出一個(gè)故事來(lái),從開(kāi)始到結(jié)束有一根線?!奔夹g(shù)負(fù)責(zé)人鄭翔宇受此啟發(fā),把故事里的事件、節(jié)奏、情節(jié)變化轉(zhuǎn)換成程序語(yǔ)言,讓計(jì)算機(jī)處理。“計(jì)算機(jī)不理解任何人類語(yǔ)言,但是它有兩個(gè)好處,第一很快,第二很穩(wěn)定。你讓我看兩千萬(wàn)字的小說(shuō),我看到后面就完全忘記前面?!?/p>

        戰(zhàn)玉冰用沖突曲線模型分析了茅盾文學(xué)獎(jiǎng)獲獎(jiǎng)作品,數(shù)據(jù)呈現(xiàn)的結(jié)果是,第一至四屆及第六屆的“明快-沉郁”作品數(shù)據(jù)比例普遍在0以上,其他五屆的數(shù)據(jù)則基本保持在0以下,歷屆獲獎(jiǎng)作品似乎呈現(xiàn)逐漸偏向沉郁的特征。他分析,這與小說(shuō)主題從宏大歷史敘事向日常生活敘事轉(zhuǎn)變相一致。

        這些曲線也意外地勾勒出作者的寫作風(fēng)格,走走向南方周末記者展示莫言《蛙》和余華《現(xiàn)實(shí)一種》兩部作品的故事曲線。莫言在描寫王仁美死亡事件時(shí),“一尸兩命”情節(jié)的故事曲線情緒值接近0,余華在寫山崗被處以死刑時(shí),數(shù)據(jù)分析出的曲線情緒值也一樣?!翱赡苣切┲骷遥绕湎裼嗳A、莫言這種,他寫死亡這種事情,反而不是大悲大喜的,反而特別冷靜?!弊咦弑硎尽傲愣葦⑹隆彪m不是新鮮話題,但數(shù)據(jù)分析或許能發(fā)揮輔助作用。

        海子自殺前的

        文字情緒

        比過(guò)去都低

        接受采訪時(shí),戰(zhàn)玉冰已經(jīng)使用數(shù)據(jù)分析完成四篇論文報(bào)告。寫到第三篇時(shí),他心頭曾有過(guò)一絲負(fù)擔(dān):這三篇文章的核心思路都是使用大數(shù)據(jù)來(lái)分析某一批中國(guó)當(dāng)代小說(shuō),方法論上的相近性可能會(huì)造成論述觀點(diǎn)與行文結(jié)構(gòu)的重復(fù)。

        戰(zhàn)玉冰使用大數(shù)據(jù)分析發(fā)現(xiàn),國(guó)內(nèi)被影視改編的文學(xué)作品,故事曲線比較普遍的是“W”形和“N”形。戰(zhàn)玉冰在論述時(shí)強(qiáng)調(diào):“這一數(shù)據(jù)分析和研究的意義并非是要為作家提供寫作上的指導(dǎo),或者告訴作家如何去迎合市場(chǎng)、如何才能更好地賣出自己小說(shuō)的影視版權(quán)?!?/p>

        美國(guó)“相對(duì)論傳媒”電影部門創(chuàng)始人瑞恩·卡瓦諾崇尚數(shù)據(jù),利用數(shù)據(jù)預(yù)測(cè)電影票房表現(xiàn)再?zèng)Q定是否投資。他的名言是“即使我同意拍了,模型不同意也不行”。他曾與索尼聯(lián)合出品了電影《百貨戰(zhàn)警》,票房大約是投資的十倍。后來(lái),電影《點(diǎn)球成金》找到卡瓦諾投資,他經(jīng)過(guò)數(shù)據(jù)分析后認(rèn)為這部電影不會(huì)賺錢。然而《點(diǎn)球成金》全球票房突破1億美元,并獲2012年奧斯卡金像獎(jiǎng)最佳影片提名??ㄍ咧Z的電影部門最終在2015年宣布破產(chǎn)。

        老師曾提醒戰(zhàn)玉冰,學(xué)術(shù)研究還是要回歸傳統(tǒng)方法,“數(shù)據(jù)相對(duì)淺表化,通過(guò)理論達(dá)成的研究對(duì)思維的鍛煉更深刻?!比缃瘢瑧?zhàn)玉冰的主要精力用在三個(gè)傳統(tǒng)研究方向上,新增的數(shù)字人文方向,被他排在第四位。曾有一句話讓戰(zhàn)玉冰深有感觸,他依稀記得其大意:“數(shù)據(jù)是不可能取代人類的,也不要通過(guò)人類排斥數(shù)據(jù)。只是從此以后,我們多了一個(gè)更加全面的、天眼一般的閱讀者?!?/p>

        杭州師范大學(xué)心理科學(xué)研究院副研究員胡超和走走合作,研究寫作對(duì)心理治療的幫助,借用軟件來(lái)分析文本中的情緒表達(dá)?!耙酝芏嘈睦韺W(xué)研究重形式、輕內(nèi)容,而文字是人類心理內(nèi)容最重要的載體。一個(gè)現(xiàn)實(shí)因素是人工文本分析成本極高,這在快節(jié)奏發(fā)論文、申請(qǐng)基金的壓力下尤其突出。文本自動(dòng)化分析技術(shù)可能是突破瓶頸的測(cè)量技術(shù)。”胡超告訴南方周末記者。

        胡超目前發(fā)現(xiàn),海子等自殺的詩(shī)人在其自殺前的作品文字情緒比過(guò)去都低,且更多采用第一人稱視角的“我”進(jìn)行敘述。但對(duì)于已有的數(shù)據(jù)分析結(jié)果,他也存疑:“專業(yè)作家和普通人群的表達(dá)方式可能不同,有正話反說(shuō)的現(xiàn)象,文字所表達(dá)的情緒可能不代表他本人的真實(shí)情緒?!?/p>

        “現(xiàn)在技術(shù)就是需要越高層次、越抽象的理解力的時(shí)候,機(jī)器和人差得越遠(yuǎn)?!编嵪栌畋硎緳C(jī)器目前尚不能完全理解需要生命體驗(yàn)的事情,如詩(shī)歌?!澳闳ズ瞬橐黄恼碌恼Z(yǔ)法是不是正確,這件事機(jī)器已經(jīng)超過(guò)人。詩(shī)歌需要一種經(jīng)驗(yàn),需要一種很抽象的理解力,同時(shí)需要人作為人的經(jīng)驗(yàn)去理解。”

        “用數(shù)字史學(xué)的方式去研究歷史,人的價(jià)值或者個(gè)性怎么辦?”這是王濤常常聽(tīng)到的質(zhì)疑,對(duì)此他并不擔(dān)憂,“雖然數(shù)據(jù)庫(kù)是一樣的,算法是一樣的,甚至題庫(kù)都是一樣的,但是你給不同的人看,他基于他的見(jiàn)識(shí),基于他的知識(shí)儲(chǔ)備,他對(duì)結(jié)果的認(rèn)知可能是不一樣的?!?/p>

        猜你喜歡
        小說(shuō)研究
        叁見(jiàn)影(微篇小說(shuō))
        紅豆(2022年9期)2022-11-04 03:14:42
        遛彎兒(微篇小說(shuō))
        紅豆(2022年9期)2022-11-04 03:14:40
        勸生接力(微篇小說(shuō))
        紅豆(2022年3期)2022-06-28 07:03:42
        FMS與YBT相關(guān)性的實(shí)證研究
        2020年國(guó)內(nèi)翻譯研究述評(píng)
        遼代千人邑研究述論
        視錯(cuò)覺(jué)在平面設(shè)計(jì)中的應(yīng)用與研究
        科技傳播(2019年22期)2020-01-14 03:06:54
        那些小說(shuō)教我的事
        EMA伺服控制系統(tǒng)研究
        新版C-NCAP側(cè)面碰撞假人損傷研究
        国产乱人精品视频av麻豆网站| 国产人成无码中文字幕| 三级国产女主播在线观看| 国产一区二区美女主播| 欧美熟妇另类久久久久久多毛| 少妇饥渴偷公乱a级无码| 国产日韩欧美网站| 高清亚洲精品一区二区三区| 亚洲视频免费一区二区| 国产尤物av尤物在线观看| 国产成人精品精品欧美| 国产麻豆一区二区三区在线播放| 性色视频加勒比在线观看| 亚洲日韩一区二区三区| 中字无码av电影在线观看网站| 男女啪啪免费视频网址| 国产精品偷窥熟女精品视频| 亚洲日本中文字幕天天更新| 亚洲三级香港三级久久| 精品久久中文字幕一区| 国产精品h片在线播放| 无码专区久久综合久中文字幕| 亚洲图片第二页| 久久久国产精品黄毛片| 最近2019年好看中文字幕视频| 亚洲人成电影在线无码| 日本成人在线不卡一区二区三区| 水蜜桃在线观看一区二区| 国产熟妇人妻精品一区二区动漫| 国产av一区二区三区丝袜| 亚洲av熟女少妇一区二区三区 | 四川发廊丰满老熟妇| 国产黄三级三·级三级| 亚洲国产丝袜美女在线| 亚洲av无码偷拍在线观看| 内射精品无码中文字幕| 超碰性爱| 婷婷色国产精品视频二区| 999久久久国产精品| 精品国产高清a毛片| 久久久精品人妻一区二区三区游戏|