亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        紅樓夢(mèng)前80章與后40章的作者分析

        2019-10-21 08:11:47譚翔予陳龍石水萌
        錦繡·上旬刊 2019年5期

        譚翔予 陳龍 石水萌

        摘 要:《紅樓夢(mèng)》的作者問題成功地吸引了國內(nèi)外讀者的注意?;诖?,本文以數(shù)理統(tǒng)計(jì)為基礎(chǔ),應(yīng)用支持向量機(jī)的理論和方法,建立相應(yīng)模型,證實(shí)了《紅樓夢(mèng)》前80章回和后40章回在某些字、詞、句上確實(shí)存在顯著性差異。首先采用引用大膽假設(shè),小心驗(yàn)證的思路,使用機(jī)器學(xué)習(xí)-支持向量機(jī)進(jìn)行分類,通過高斯徑向基函數(shù),尋找到最優(yōu)分類超平面,由于數(shù)據(jù)樣本不足,導(dǎo)致分類結(jié)果正確率僅為85%;然后,使用matlab軟件繪制類別分界圖。最終效果:0-80章回在1的水平上,81-120章回在-1的水平上,并且分界點(diǎn)明顯在80-81章回之間,佐證了《紅樓夢(mèng)》前80章回和后40章回作者不同。

        關(guān)鍵詞:紅樓夢(mèng);格拉布斯檢驗(yàn);方差分析;支持向量機(jī)

        0.引言

        《紅樓夢(mèng)》,中國古典四大名著之一,清代作家曹雪芹創(chuàng)作的章回體長篇小說?!都t樓夢(mèng)》開篇以神話形式介紹作品的由來,說女媧煉三萬六千五百零一塊石補(bǔ)天,只用了三萬六千五百塊,剩余一塊未用[5],棄在青埂峰下。剩一石自怨自愧,日夜悲哀。一僧一道見它形體可愛,便給它鐫上數(shù)字,攜帶下凡。不知過了幾世幾劫,空 空道人路過,見石上刻錄了一段故事,便受石之托,抄寫下來傳世。輾轉(zhuǎn)傳到曹雪 芹手中,經(jīng)他批閱十載、增刪五次而成書。

        以賈、史、王、薛四大家族的興衰為背景,以賈府的家庭瑣事、閨 閣閑情為脈絡(luò),以賈寶玉、林黛玉、薛寶釵的愛情婚姻故事為主線,刻畫了以賈寶 玉和金陵十二釵為中心的正邪兩賦有情人的人性美和悲劇美。通過家族悲劇、女兒悲劇及主人公的人生悲劇,揭示出封建末世危機(jī)。

        同時(shí)也是一部具有世界影響力的人情小說作品[1],是中國古典小說巔峰之作,中國封建社會(huì)的百科全書,傳統(tǒng)文化的集大成者。小說以“大旨談情,實(shí)錄其 事”自勉,只按自己的事體情理,按跡循蹤,擺脫舊套,新鮮別致,取得了非凡的藝術(shù)成就。“真事隱去,假語村言”的特殊筆法更是令后世讀者腦洞大開,揣測(cè)之說久而遂多[3]。圍繞《紅樓夢(mèng)》的品讀研究形成了一門顯學(xué)——紅學(xué)。

        因某些歷史原因,《紅樓夢(mèng)》在傳播和保留過程中出現(xiàn)了令人遺憾的缺失。前80章回曹雪芹本著,120章回高鶚續(xù)40章回的兩大版本,是目前公認(rèn)的版本。本文通過建立SVM分類模型[2],就《紅樓夢(mèng)》前80章回和后40章回中的語句和語義來佐證前80章回和后40章回的作者不同。

        1 數(shù)據(jù)預(yù)處理

        1.1格拉布斯檢驗(yàn)法

        通過下列公式進(jìn)行計(jì)算1-80章與81-120章“必是”、“索性”、“為什么”等詞在不同章節(jié)出現(xiàn)的次數(shù)對(duì)應(yīng)的<!--[if gte vml 1]> <![endif]--><!--[if !vml]-->3092465.png<!--[endif]-->值:

        <!--[if gte vml 1]> <![endif]--><!--[if !vml]--><!--[endif]-->? (1)

        <!--[if gte vml 1]> <![endif]--><!--[if !vml]--><!--[endif]-->經(jīng)過一系列的計(jì)算,整理得到下表,用所得到的<!--[if gte vml 1]> <![endif]--><!--[if !vml]--><!--[endif]-->值與格拉布斯臨界值檢驗(yàn)表進(jìn)行對(duì)比,其中<!--[if gte vml 1]> <![endif]--><!--[if !vml]--><!--[endif]-->,將異常數(shù)據(jù)剔除[4]。

        通過對(duì)比格拉布斯臨界值找出可疑極值點(diǎn),將這些可疑極值點(diǎn)進(jìn)行剔除。

        1.2 距離反比加權(quán)插值法

        由于相鄰章節(jié)在內(nèi)容和作者上都有很大的相似性,相鄰章節(jié)之間的影響會(huì)比較大,所以采用距離反比加權(quán)插值法進(jìn)行填補(bǔ),更大程度上保留了章節(jié)的信息量,具體計(jì)算過程如下:

        設(shè)每組數(shù)據(jù)之間的距離為1,權(quán)重計(jì)算公式如下:

        5 SVM分類

        先大膽假設(shè),后合理驗(yàn)證。本文選擇使用SVM[6]方法來進(jìn)行學(xué)習(xí)分類,為了證明分界點(diǎn)在80章與81章之間,在語句和語義選擇上。通過參考資料,分析出它們不同之處,用關(guān)鍵字詞反映語句和語言的特點(diǎn),最終選擇了“怎么”、“若”兩個(gè)作為代表,“怎么”代表反問句,“若”代表假設(shè)句。模型如下:

        假設(shè)1-10章回與81-90章回作者不同;

        選擇核函數(shù)[10]進(jìn)行SVM學(xué)習(xí)。

        常用的核函數(shù)有四種,包括線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基核函數(shù)、二層神經(jīng)網(wǎng)絡(luò)核函數(shù),在這四種核函數(shù)中,最常用的是高斯徑向基函數(shù),它的特點(diǎn):收斂速度快,泛化能力強(qiáng)。

        作為核函數(shù)[7]進(jìn)行SVM學(xué)習(xí),找尋分類最優(yōu)超平面,通過拉格朗日方法把問題轉(zhuǎn)化為其對(duì)偶問題

        <!--[if gte vml 1]> <![endif]--><!--[if !vml]--><!--[endif]-->為拉格朗日乘子該,問題就是求解最優(yōu)化問題。分類函數(shù)變?yōu)?/p>

        之后通過支持向量機(jī)進(jìn)行分類分類效果見下圖:

        對(duì)分類結(jié)果進(jìn)行分析,使用的SVM分類正確率為85%。因?yàn)闃颖緜€(gè)體的數(shù)據(jù)太少,學(xué)習(xí)樣本數(shù)目不足,盡管對(duì)數(shù)據(jù)進(jìn)行了處理[8]但仍然有較大的隨機(jī)性,將分類結(jié)果做成表格(數(shù)據(jù)見附錄)和圖,分析兩類的分界點(diǎn)。

        求證分類

        結(jié)論

        分界點(diǎn)明顯在80章和81章之間,雖然中間有少量章節(jié)被錯(cuò)誤劃分,但是在假設(shè)的前提下,可以認(rèn)定《紅樓夢(mèng)》前80章回和后40章回不是一個(gè)作者。

        參考文獻(xiàn)

        [1]汪維輝.《紅樓夢(mèng)》前80回和后40回的詞匯差異[J].古漢語研究,2010(03):35-40+95-96.

        [2]施建軍.基于支持向量機(jī)技術(shù)的《紅樓夢(mèng)》作者研究[J].紅樓夢(mèng)學(xué)刊,2011(05):35-52.

        [3]楊粟森,彭旭,趙映誠.基于數(shù)理統(tǒng)計(jì)的《紅樓夢(mèng)》前80回與后40回相關(guān)性的多指標(biāo)綜合分析[J].電子世界,2017(02):197-199.

        [4]公麗艷,孟憲軍,劉乃僑,畢金峰.基于主成分與聚類分析的蘋果加工品質(zhì)評(píng)價(jià)[J].農(nóng)業(yè)工程學(xué)報(bào),2014,30(13):276-285.

        [5]胡竹菁,戴海琦.方差分析的統(tǒng)計(jì)檢驗(yàn)力和效果大小的常用方法比較[J].心理學(xué)探新,2011,31(03):254-259.

        [6]楊小勇.方差分析法淺析——單因素的方差分析[J].實(shí)驗(yàn)科學(xué)與技術(shù),2013,11(01):41-43.

        [7]林海明,杜子芳.主成分分析綜合評(píng)價(jià)應(yīng)該注意的問題[J].統(tǒng)計(jì)研究,2013,30(08):25-31.

        [8]丁愛玲,謝小軍,聞怡.具有高斯核函數(shù)的支撐矢量機(jī)與徑向基函數(shù)分類器的比較[J].交通與計(jì)算機(jī),2003(03):44-48.

        麻豆国产精品一区二区三区| 国产精品乱一区二区三区| 日韩欧美精品有码在线观看| 午夜桃色视频在线观看| 噜噜噜噜私人影院| 中文字幕人妻熟女人妻洋洋 | 首页动漫亚洲欧美日韩| 国产男女乱婬真视频免费| 亚洲av乱码一区二区三区人人| 亚洲精品无码av人在线观看| 午夜免费观看日韩一级视频| 69一区二三区好的精华| 日韩无码视频淫乱| 国产不卡一区二区三区视频| 日本精品一区二区三区在线观看| 国产成人精品午夜二三区波多野| 中文乱码人妻系列一区二区| 亚洲夫妻性生活视频网站| 亚洲最大一区二区在线观看| 日本真人做人试看60分钟| 亚洲av无码av在线播放| 无人视频在线播放在线观看免费| 上海熟女av黑人在线播放| 天天躁日日躁狠狠久久| 无码日韩人妻AV一区免费| 日本视频一区二区三区三州| 狠狠色狠狠色综合网| 久久精品国产亚洲av高清漫画 | 亚洲人成影院在线高清| 极品粉嫩嫩模大尺度视频在线播放| 乱码1乱码2美美哒| 日韩精品无码一区二区三区免费| 日日骚一区二区三区中文字幕 | 大胆欧美熟妇xxbbwwbw高潮了| 无码高潮少妇毛多水多水免费| 91麻豆精品国产91久久麻豆| 自愉自愉产区二十四区| 精品久久久久一区二区国产| 久久偷拍国内亚洲青青草| 老师开裆丝袜喷水视频| 蜜桃av噜噜一区二区三区|