亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)理統(tǒng)計(jì)的《紅樓夢》前80回與后40回相關(guān)性的多指標(biāo)綜合分析

        2017-02-17 00:54:02中國石油大學(xué)華東理學(xué)院楊粟森趙映誠
        電子世界 2017年2期
        關(guān)鍵詞:介詞副詞紅樓夢

        中國石油大學(xué)(華東)理學(xué)院 楊粟森 彭 旭 趙映誠

        基于數(shù)理統(tǒng)計(jì)的《紅樓夢》前80回與后40回相關(guān)性的多指標(biāo)綜合分析

        中國石油大學(xué)(華東)理學(xué)院 楊粟森 彭 旭 趙映誠

        一直以來,紅樓夢的作者是否唯一是一個(gè)很受爭議的問題。本文在數(shù)理統(tǒng)計(jì)的基礎(chǔ)上對《紅樓夢》的前80回與后40回以及把前80回分成兩個(gè)40回的相關(guān)性作了比較分析。先利用U檢驗(yàn)分別從多個(gè)指標(biāo)進(jìn)行相關(guān)性分析,判斷結(jié)果不盡相同。然后利用多指標(biāo)綜合的層次分析法把多個(gè)指標(biāo)的計(jì)算結(jié)果結(jié)合起來判斷。統(tǒng)計(jì)結(jié)果表明:《紅樓夢》的前80回和后40回相關(guān)性弱,前80回的兩組相關(guān)性很強(qiáng),因此,可以確定前80回和后40回非同一人所寫。

        相關(guān)性;U檢驗(yàn);p-值;多指標(biāo);層次分析模型

        0.引言

        《紅樓夢》是我國四大名著之首,對于其作者是否唯一也有爭論,把統(tǒng)計(jì)學(xué)的定量分析方法引入紅學(xué)研究是很自然的。

        華裔學(xué)者陳炳藻教授在美國威斯康星大學(xué)召開的“首屆國際《紅樓夢》研討會(huì)”上曾發(fā)表了通過統(tǒng)計(jì)學(xué)方法算出相關(guān)用詞的相關(guān)程度,發(fā)現(xiàn)前80回與后40回均為曹雪芹一人所作。我國華東師范大學(xué)陳大康教授得出了迥異的結(jié)論,它將紅樓夢分成3組,通過分析各組之間用詞句式,做出推論:后40回非曹雪芹所作(但含有少量殘稿)。復(fù)旦大學(xué)李賢平[1]先生在《復(fù)旦學(xué)報(bào)》 上發(fā)表了論文《〈紅樓夢〉 成書新說》主要使用了模式識別和探索性數(shù)據(jù)分析的方法, 從《紅樓夢》 中抽取了47個(gè)虛字, 統(tǒng)計(jì)其在各回中的使用頻率, 在此基礎(chǔ)上用統(tǒng)計(jì)學(xué)方法探索各回寫作風(fēng)格的接近程度, 并用聚類方法對120回進(jìn)行了分析。提出了新觀點(diǎn):《紅樓夢》前80回是曹雪芹根據(jù)《石頭記》增刪而成;而后40回則是曹家親友搜集整理原稿加工補(bǔ)寫而成。東南大學(xué)韋博成[2]通過運(yùn)用各回合對于情景的關(guān)注程度,分析前80回和后40回合的不同。2009年張運(yùn)良[3]等利用句類分析結(jié)合近鄰算法的文本分類方法對《紅樓夢》作者問題進(jìn)行了研究,文章提取《紅樓夢》中的各種句類作為特征,并且將回分為3組,每組40回,選擇2組作為訓(xùn)練集,另一組作為測試集,進(jìn)行了兩組實(shí)驗(yàn),從實(shí)驗(yàn)結(jié)果得出前80回與后40回為不同作者所寫的結(jié)論。

        一個(gè)作者的筆風(fēng)或一篇文章的文筆特征是多因素綜合的結(jié)果。比如,詞的用法,句子的長短,人物稱謂,以及作者所處的社會(huì)背景等等。單純從某一方面考慮難免會(huì)走向片面??紤]到在確定作者是否唯一時(shí),這些因素往往難以量化。本文從介詞、副詞、顏色、人名、情緒詞五種能夠很大程度上反映作者寫作風(fēng)格的指標(biāo)出發(fā),對它們分別進(jìn)行前八十回和后四十回的相關(guān)性分析判斷,由于計(jì)算出來的結(jié)果不盡相同,根據(jù)一些指標(biāo)所判斷出來的相關(guān)性為相關(guān),而另外一些則判斷出來無關(guān),所以我們利用p-值和層次分析法[4]將五種指標(biāo)的判斷結(jié)果綜合起來,從而得出《紅樓夢》前80回和后40回相關(guān)性不強(qiáng)的分析結(jié)果。并使用同樣方法在對前80回進(jìn)行相關(guān)性分析判斷,發(fā)現(xiàn)前八十回相關(guān)性很強(qiáng),這就證明了檢驗(yàn)方法的科學(xué)性。

        1.五種指標(biāo)的數(shù)據(jù)收集

        對《紅樓夢》一百二十回的每一回的介詞(以、為、與、于)、副詞(很、頗、十分、都)、顏色(紅、黃、藍(lán)、綠)、人名(寶玉、寶釵、黛玉、襲人)、情緒詞(哭、笑、喜、悲)出現(xiàn)頻數(shù)的進(jìn)行統(tǒng)計(jì)。(表2.1)

        表2.1 介詞、副詞、顏色、人名、情緒詞統(tǒng)計(jì)數(shù)據(jù)

        2.U檢驗(yàn)?zāi)P偷慕⒑头治鰧?shí)現(xiàn)

        2.1 U檢驗(yàn)?zāi)P偷睦碚?/p>

        根據(jù)數(shù)理統(tǒng)計(jì)[5]上,對于總體分布未知時(shí)的樣本,當(dāng)樣本數(shù)足夠大時(shí),仍有:

        其中,Xa為X的平均值,Ya為Y的平均值,n1為X的元素個(gè)數(shù),n2為Y的元素?cái)?shù),s1^2、s2^2為X和Y的方差。

        2.2 《紅樓夢》前八十回和后四十回、前八十回的兩個(gè)四十回的U檢驗(yàn)分析

        將前八十回的數(shù)據(jù)設(shè)為X1,后四十回的數(shù)據(jù)設(shè)為Y1;前八十回中的前四十回的數(shù)據(jù)設(shè)為X2,前八十回中的后四十回的數(shù)據(jù)設(shè)為Y2。針對這五種指標(biāo)因素分別利用U檢驗(yàn)進(jìn)行均值差的顯著性檢驗(yàn):H0: u1=u2;H1:u1≠u2。

        分別對五種因素進(jìn)行五次顯著性檢驗(yàn),根據(jù)式3-1得到五組u值和p值。結(jié)果見表3.1。

        表3.1 五種因素顯著性檢驗(yàn)

        3.基于層次分析法的多指標(biāo)綜合

        3.1 建立遞階層次結(jié)構(gòu)

        將判斷紅樓夢的作者是否唯一這個(gè)問題分解為三個(gè)層次,最上層為目標(biāo)層,即作者是否唯一,最下層為方案層,有兩種選擇,有相關(guān)和無關(guān),中間為準(zhǔn)則層,有介詞、副詞、顏色、人名、情緒等五個(gè)準(zhǔn)則。各層間的聯(lián)系用相連的直線表示。

        圖4.1 紅樓夢的作者是否唯一的層次結(jié)構(gòu)圖

        3.2 構(gòu)造準(zhǔn)則層對目標(biāo)層的比較判斷矩陣(正互反矩陣)

        對各指標(biāo)之間進(jìn)行兩兩對比之后,根據(jù)各指標(biāo)對相關(guān)性影響程度,按1—9尺度排定各評價(jià)指標(biāo)的相對比重,依次構(gòu)造出介詞、副詞、顏色、人名和情緒的判斷矩陣A。

        A=[1,3,1/3,4,1/4;1/3,1,1/4,4,1/5;3,4,1,8,1/2;1/4,1/4,1/8,1,1/9;4, 5,2,9,1];

        其中,A=(aij)n×n,aij>0,aji=1/aij,用Ci(i=1,2,3,4,5)依次表示介詞、副詞、顏色、人名、情緒等五個(gè)準(zhǔn)則。aij表示Ci和Cj對于目標(biāo)的重要性之比。

        3.3 計(jì)算權(quán)向量并做一致性檢驗(yàn)

        對于給出的A可以計(jì)算出,λ= 5.203,歸一化的特征向量為=(0.141,0.0823,0.2967,0.03390,0.4461)T,由于成對比較陣通常不是一致陣,需要進(jìn)行一致性檢驗(yàn)。一致性指標(biāo):

        當(dāng)n=5時(shí),隨機(jī)一致性指標(biāo)RI=1.12,最后計(jì)算一致性指標(biāo)CI與隨機(jī)一致性指標(biāo)RI之比,即:CR=CI/RI=0.045<0.1,因此可以認(rèn)為A的不一致程度在容許范圍之內(nèi),可用其特征向量作為權(quán)向量。即權(quán)向量為:

        ω=(0.141,0.0823,0.2967,0.03390,0.4461)T

        記作:ω(2)=(ω1(2),ω2(2),…ω5(2))

        3.4 構(gòu)造方案層對準(zhǔn)則層的比較判斷矩陣

        前面已經(jīng)得到了第二層(準(zhǔn)則層)對第1層(目標(biāo)層)的的權(quán)向量,接下來要構(gòu)造第3層對第2層的每一準(zhǔn)則的成對比較陣。設(shè)相關(guān)和無關(guān)權(quán)重的比值為bij,通過計(jì)算每個(gè)因素相關(guān)性得到的P值,將P值與顯著性水平α=0.05比較。P值大于α的因素的bij>1,并且P值越大,bij越大;P值小于α的因素的bij<1,并且P值越小,bij越??;構(gòu)造第三層對第二層的每一個(gè)準(zhǔn)則的成對比較陣。

        3.4.1 前八十回和后四十回的成對比較陣

        構(gòu)造前八十回和后四十回的成對比較陣:

        B1=[1,1/9;9,1];

        B2=[1,1/8;8,1];

        B3=[1,1/5;5,1];

        B4=[1,9;1/9,1];B5=[1,1/9;9,1];

        由第3層的成對比較陣:

        Bk(k=1,2,3,4,5)和Ck(k=1,2,3,4,5)

        計(jì)算出權(quán)向量ω(31):

        ω(31)=[0.1,0.11,0.17,0.9,0.1;0.9,0.89,0.83,0.1,0.9];

        并且通過一致性檢驗(yàn)。

        3.4.2 前八十回中的前四十回和后四十回的成對比較陣

        C1=[1,9;1/9,1]; C2=[1,9;1/9,1];

        C3=[1,1/9;9,1]; C4=[1,1/6;6,1];

        C5=[1,9;1/9,1];

        由第3層的成對比較陣:

        Ck(k=1,2,3,4,5)

        計(jì)算出權(quán)向量ω(32):

        ω(32)=[0.9,0.9,0.1,0.14,0.9;0.1,0.1,0.9,0.86,0.1];

        并且通過一致性檢驗(yàn)。

        3.5 計(jì)算組合權(quán)向量

        接下來,由各準(zhǔn)則對目標(biāo)的權(quán)向量ω(2)和各方案對每一準(zhǔn)則的權(quán)向量ω(3k) (k=1,2),計(jì)算兩個(gè)方案對目標(biāo)的權(quán)向量,稱為組合權(quán)向量,記作ω(4)。對于方案P1,它在準(zhǔn)則層的權(quán)重用ω(3k)的第一個(gè)分量表示,對于方案P2,它在準(zhǔn)則層的權(quán)重用ω(3k)的第二個(gè)分量表示。而5個(gè)準(zhǔn)則對于目標(biāo)的權(quán)重用權(quán)向量ω(2)表示。即:

        ω(4)=ω(2)* ω(3k)T。

        3.5.1 前八十回和后四十回的組合權(quán)向量

        前八十回和后四十回:

        ω(4)=ω(2)*ω(31)T=[0.148,0.852]

        即P1在目標(biāo)層的組合權(quán)重為0.148,同P2在目標(biāo)的組合權(quán)重為0.852,發(fā)現(xiàn)方案一的權(quán)重小于方案二的權(quán)重。所以,可得到前八十回和后四十回?zé)o關(guān)。

        3.5.2 前八十回中的前四十回和后四十回的組合權(quán)向量

        前八十回中的前四十回和后四十回:

        ω(4)=ω(2)*ω(32)T=[0.637,0.363]

        即P1在目標(biāo)層的組合權(quán)重為0.637,P2在目標(biāo)的組合權(quán)重為0.363,發(fā)現(xiàn)方案一的權(quán)重大于方案二的權(quán)重。所以,可得到前八十回的兩個(gè)四十回是相關(guān)的。

        4.結(jié)語

        由以上的討論,可以得出《紅樓夢》的前八十回和后四十回?zé)o關(guān),并使用前八十回中的兩個(gè)四十回來證明了算法的科學(xué)性。因此從這個(gè)角度看,《紅樓夢》可能不是同一個(gè)人所做。對于《紅樓夢》的作者是否唯一這一問題,由于影響文章風(fēng)格的因素有很多,在作判斷和決策時(shí),這些因素的重要性、影響力往往難以量化。經(jīng)過查閱資料知,層次分析法是一個(gè)非常有效的處理方法。本文就是考慮了介詞、副詞、顏色、人名、情緒這幾個(gè)指標(biāo),利用層次分析法把這五個(gè)指標(biāo)分別計(jì)算的結(jié)果綜合起來得出《紅樓夢》的作者不是同一個(gè)人所做的結(jié)論。

        [1]李賢平.《紅樓夢》成書新說[J].復(fù)旦學(xué)報(bào)(社會(huì)科學(xué)版), 1987(5):3-16.

        [2]韋博成.《紅樓夢》前80回與后40回某些文風(fēng)差異的統(tǒng)計(jì)分析(兩個(gè)獨(dú)立二項(xiàng)總體等價(jià)性檢驗(yàn)的一個(gè)應(yīng)用)[J].應(yīng)用概率統(tǒng)計(jì),2009,25(4):441-448.

        [3]張運(yùn)良,朱禮軍,喬曉東,等.基于句類特征的作者寫作風(fēng)格分類研究[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(22):129-131.

        [4]姜啟源,謝金星,葉俊.?dāng)?shù)學(xué)模型[M].高等教育出版社,2011:249.

        [5]李榮華,丁永臻,陳曉林.概率論和數(shù)理統(tǒng)計(jì)[M].中國石油大學(xué)出版社,2014:11.

        楊粟森,現(xiàn)就讀于中國石油大學(xué)(華東)理學(xué)院信息與計(jì)算科學(xué)專業(yè)。

        彭旭,現(xiàn)就讀于中國石油大學(xué)(華東)理學(xué)院信息與計(jì)算科學(xué)專業(yè)。

        趙映誠,現(xiàn)就讀于中國石油大學(xué)(華東)理學(xué)院信息與計(jì)算科學(xué)專業(yè)。

        猜你喜歡
        介詞副詞紅樓夢
        The Wheels on the Bus
        介詞和介詞短語
        副詞“好容易”及其詞匯化成因
        論《紅樓夢》中的賭博之風(fēng)
        從《紅樓夢》看養(yǎng)生
        海峽姐妹(2020年7期)2020-08-13 07:49:32
        《〈紅樓夢〉寫作之美》序
        別樣解讀《紅樓夢》
        海峽姐妹(2018年5期)2018-05-14 07:37:10
        介詞不能這樣用
        副詞和副詞詞組
        看圖填寫介詞
        日韩a毛片免费观看| 色综合久久中文综合网亚洲| 大ji巴好深好爽又大又粗视频| 国精无码欧精品亚洲一区| 亚洲成在人线在线播放无码| 亚洲综合无码一区二区| 亚洲av午夜成人片精品| 免费看片的网站国产亚洲| 少妇无码av无码专线区大牛影院| 久久不见久久见免费影院www| 九九久久精品国产| 亚洲av美女在线播放啊| 亚洲中文字幕不卡一区二区三区| 亚洲一区二区懂色av| 欧美丰满熟妇xxxx性ppx人交| 国产内射999视频一区| 国产老妇伦国产熟女老妇高清| 亚洲av天堂一区二区| 久久精品国产99国产精品亚洲| 无码一区二区波多野结衣播放搜索| 亚洲AV成人无码天堂| 男女性行为免费视频网站| 久久久久久九九99精品| 五月天激情综合网| 亚洲综合免费在线视频| 一区二区三区视频在线观看免费| 首页 综合国产 亚洲 丝袜| 亚洲中文字幕久久精品蜜桃 | 亚洲性码不卡视频在线| 一区二区三区视频在线观看免费| 亚洲人成未满十八禁网站| 精品人妻伦九区久久AAA片69| 国产亚洲av夜间福利在线观看| 色综合久久久无码中文字幕| 精品国产一区二区三区久久狼| 亚洲A∨日韩Av最新在线| 亚洲高清激情一区二区三区| 国产熟妇疯狂4p交在线播放| 精品人妻潮喷久久久又裸又黄| 国产精品麻豆A在线播放| 中文字幕精品一区二区三区|