亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        給文學(xué)作品做“親子鑒定”

        2020-07-16 03:46:24朱會(huì)鑫
        讀者·校園版 2020年14期
        關(guān)鍵詞:文本

        朱會(huì)鑫

        我們知道DNA(脫氧核糖核酸)技術(shù)可以對(duì)人進(jìn)行親子鑒定,可你知道嗎,隨著科技的不斷進(jìn)步,AI(人工智能)已經(jīng)可以給文學(xué)作品做“親子鑒定”,進(jìn)而判定其作者是誰(shuí)。那么,AI是如何判定文學(xué)作品的作者的呢?利用AI判定文學(xué)作品的作者是否準(zhǔn)確呢?

        下面,我們就以利用AI判定英國(guó)著名戲劇《亨利八世》的作者是誰(shuí)為例。與《紅樓夢(mèng)》究竟是誰(shuí)寫的一樣,《亨利八世》也存在同樣的問(wèn)題。可以說(shuō),在長(zhǎng)達(dá)一個(gè)世紀(jì)的時(shí)間里,關(guān)于《亨利八世》的作者是誰(shuí)的爭(zhēng)論一直沒(méi)有停息,直到最近的一項(xiàng)研究才使這個(gè)問(wèn)題的答案變得明朗起來(lái)。

        捷克科學(xué)院的研究員普列查奇,最近使用機(jī)器學(xué)習(xí)技術(shù)來(lái)識(shí)別《亨利八世》的作者,并取得了具有說(shuō)服力的結(jié)果。那么,他究竟是如何利用AI判定《亨利八世》的作者的呢?

        簡(jiǎn)單地說(shuō),就是從詞匯和節(jié)奏入手,辨別文本的來(lái)源。在了解作者的風(fēng)格和常用的字詞與句式后,再去辨別目標(biāo)作品中的文本習(xí)慣樣式,以判定它們是否出自同一個(gè)作者之手。即通過(guò)算法模型對(duì)文本常用詞、常用語(yǔ)句和節(jié)奏模式進(jìn)行分析,使算法學(xué)會(huì)辨別相關(guān)作者的寫作特征。

        具體來(lái)說(shuō),就是先將劇本《亨利八世》細(xì)化成多個(gè)小場(chǎng)景,再使用支持向量機(jī)對(duì)《亨利八世》的各個(gè)場(chǎng)景進(jìn)行歸因分類和分析。其中,以500種最常見的節(jié)奏類型的頻率和500個(gè)最常見單詞的頻率作為分類器的功能集。鑒于作者在不同時(shí)期可能出現(xiàn)的風(fēng)格差異,普列查奇采用了同時(shí)期其他戲劇的場(chǎng)景(如《暴風(fēng)雨》《科里奧蘭納斯》)作為訓(xùn)練樣本,對(duì)于可能的作者也同樣收集了訓(xùn)練樣本。

        最終,普列查奇收集了53個(gè)莎士比亞訓(xùn)練樣本、90個(gè)弗萊徹訓(xùn)練樣本和46個(gè)馬辛格訓(xùn)練樣本。為了測(cè)試模型的準(zhǔn)確性,他還通過(guò)交叉驗(yàn)證的方式進(jìn)行了檢驗(yàn)。完成訓(xùn)練學(xué)習(xí)后,在《亨利八世》的文本上運(yùn)行該模型,最后結(jié)合詞匯和多功能化的綜合分析,確定哪些作者參與了劇本的寫作,以及他們的具體貢獻(xiàn)。

        結(jié)果證明,這是區(qū)分莎士比亞、弗萊徹和馬辛格風(fēng)格非??煽康囊罁?jù)。尤其是使用常用詞和常用節(jié)奏的組合模型,在3位作者的風(fēng)格鑒定上,準(zhǔn)確率高達(dá)96%。當(dāng)模型應(yīng)用于《亨利八世》的分析時(shí),結(jié)果清楚地表明,莎士比亞和弗萊徹都參與其中,另一位傳聞中的劇作家馬辛格在算法的層面上和劇本無(wú)關(guān)。

        為了更可靠地了解具體作者承擔(dān)的份額,以超越特定場(chǎng)景的簡(jiǎn)單歸因,普列查奇采用滾動(dòng)歸因分析方法,確定了具體文本片段屬于某位作者的概率。滾動(dòng)歸因是一項(xiàng)針對(duì)涉及混合作者身份的案例技術(shù)。在滾動(dòng)歸因中,不對(duì)整個(gè)文本或其邏輯部分(章節(jié)、場(chǎng)景等)進(jìn)行分類,而是對(duì)其固定長(zhǎng)度的重疊部分進(jìn)行分類。該方法使用移動(dòng)窗口的概念,同時(shí)與標(biāo)準(zhǔn)的監(jiān)督分類技術(shù)相結(jié)合,旨在評(píng)估離散文本樣本之間的樣式差異,以測(cè)試其文本樣式的一致性。

        結(jié)果表明,結(jié)合了詞匯特征的滾動(dòng)歸因方法是非常可靠的:在區(qū)分莎士比亞和弗萊徹時(shí),滾動(dòng)歸因的準(zhǔn)確率高達(dá)99.77%。

        對(duì)文學(xué)研究者和愛好者來(lái)說(shuō),利用AI對(duì)文學(xué)作品進(jìn)行“親子鑒定”,以破解名著的作者之謎,是一件很有價(jià)值的事情,同時(shí)也提供了一個(gè)數(shù)據(jù)維度的視角,以解決此類問(wèn)題。

        (成瑜摘自《知識(shí)窗》2020年第2期,邱炯圖)

        猜你喜歡
        文本
        文本聯(lián)讀學(xué)概括 細(xì)致觀察促寫作
        重點(diǎn):論述類文本閱讀
        重點(diǎn):實(shí)用類文本閱讀
        初中群文閱讀的文本選擇及組織
        甘肅教育(2020年8期)2020-06-11 06:10:02
        作為“文本鏈”的元電影
        在808DA上文本顯示的改善
        “文化傳承與理解”離不開對(duì)具體文本的解讀與把握
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        從背景出發(fā)還是從文本出發(fā)
        久久国产精品久久久久久| 亚洲天堂av在线一区| 日韩精品极品系列在线免费视频| 中文字幕av伊人av无码av| 白又丰满大屁股bbbbb| 无码天堂亚洲国产av麻豆| 国产视频一区二区三区在线看| 亚洲乱码中文字幕在线| 国产成人亚洲精品| 精品国产群3p在线观看| 一本色道久久88综合亚洲精品| 少妇激情一区二区三区99| 51国产黑色丝袜高跟鞋| 国产婷婷丁香久久综合| 日韩在线精品视频免费| 桃红色精品国产亚洲av| 亚洲精品第一国产综合亚av| 无码av免费永久免费永久专区 | 精品人妻一区二区三区不卡毛片| 亚洲国产精品18久久久久久| 国产成人免费一区二区三区| 日韩中文字幕一区二区高清 | 国产亚洲自拍日本亚洲| 国产午夜精品理论片| 麻豆国产乱人伦精品一区二区| 女同另类专区精品女同| 狠狠色丁香婷婷久久综合| 99精品国产兔费观看久久99| 99久久精品久久久| 久久亚洲精品国产av| 专干老肥熟女视频网站300部| av鲁丝一区鲁丝二区| 手机在线免费av网址| 十八禁视频在线观看免费无码无遮挡骂过 | 大香蕉视频在线青青草| 女人被男人爽到呻吟的视频| 波多野结衣aⅴ在线| 日韩高清av一区二区| 精品天堂色吊丝一区二区| 欧产日产国产精品精品| 少妇bbwbbw高潮|