亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        名義變量的關(guān)聯(lián)強(qiáng)度分析

        2017-08-11 10:48:45戴建國(guó)
        關(guān)鍵詞:名義測(cè)度度量

        戴建國(guó)

        (廣州大學(xué) 數(shù)學(xué)與信息科學(xué)學(xué)院,廣東 廣州 510006)

        ?

        名義變量的關(guān)聯(lián)強(qiáng)度分析

        戴建國(guó)

        (廣州大學(xué) 數(shù)學(xué)與信息科學(xué)學(xué)院,廣東 廣州 510006)

        針對(duì)獨(dú)立性檢驗(yàn)統(tǒng)計(jì)量不能度量關(guān)聯(lián)性強(qiáng)弱和一些關(guān)聯(lián)測(cè)度不具解釋性的問題,首先介紹了Goodman—Kruskal提出的兩種度量名義變量間關(guān)聯(lián)性強(qiáng)弱的指標(biāo),然后將其拓展到多變量的情況,并給出了實(shí)例進(jìn)行分析,結(jié)果表明其對(duì)實(shí)際情況的確有更好更合理的解釋意義.

        名義變量;關(guān)聯(lián)測(cè)度;可解釋性

        0 引 言

        隨著大數(shù)據(jù)時(shí)代的興起,在數(shù)據(jù)分析工作中經(jīng)常會(huì)遇到離散變量數(shù)據(jù)的情況,在醫(yī)學(xué)和社會(huì)學(xué)統(tǒng)計(jì)工作中尤為普遍,而其也通常是通過列聯(lián)表的形式來分析.在對(duì)于最簡(jiǎn)單的二維名義變量列聯(lián)表(即兩個(gè)變量都不存在自然序)分析時(shí),通常只對(duì)兩個(gè)名義型變量進(jìn)行獨(dú)立性檢驗(yàn),涉及到的檢驗(yàn)統(tǒng)計(jì)量有皮爾遜卡方統(tǒng)計(jì)量,Yate’s連續(xù)修正卡方統(tǒng)計(jì)量,似然比等檢驗(yàn)統(tǒng)計(jì)量.但對(duì)于獨(dú)立性檢驗(yàn)統(tǒng)計(jì)量來說,它們只能驗(yàn)證變量間有沒有關(guān)聯(lián),而不能給出一個(gè)度量關(guān)聯(lián)的指標(biāo),當(dāng)然也存在一些度量列聯(lián)表中變量關(guān)系強(qiáng)弱的指標(biāo),比如Phi系數(shù),列聯(lián)系數(shù),Cramer’s系數(shù)[1]等一些度量指標(biāo),而他們依然存在局限性,首先它們作為一個(gè)度量指標(biāo)沒有給出合理的解釋,其次是比較難用于高維列聯(lián)表的情況.而本文介紹的測(cè)度λGK,τGK克服了這些局限性,它們是Goodman—Kruskal在1954年提出來的[2],其都是以引入某變量后而減少預(yù)測(cè)誤差比例為基礎(chǔ)來構(gòu)造的統(tǒng)計(jì)量.目前對(duì)于這兩個(gè)關(guān)聯(lián)測(cè)度的研究與應(yīng)用的文獻(xiàn)有[3-6],尤其在文獻(xiàn)[3]中從不同的角度給出了τGK的更為一般的形式和深入的研究.

        1 列聯(lián)表的概念與結(jié)構(gòu)

        設(shè)一個(gè)二維列聯(lián)表,其行為名義變量A有r個(gè)類別,列為名義變量B有c個(gè)類別,如表1所示,

        表1 二維列聯(lián)表的一般結(jié)構(gòu)

        2 關(guān)聯(lián)測(cè)度λGK,τGK的定義與解釋

        2.1 關(guān)聯(lián)測(cè)度λGK

        當(dāng)有兩個(gè)名義變量X,Y時(shí),分別視為自變量和因變量,設(shè)它們的類別數(shù)分別為I,J,則有一個(gè)二維列聯(lián)表與之對(duì)應(yīng),其主要過程是基于最佳預(yù)測(cè),當(dāng)不知道X信息時(shí),自然而然會(huì)將Y預(yù)測(cè)為其邊緣概率最大的一類;知道X信息時(shí),則在X的每一個(gè)類別下預(yù)測(cè)Y類別中最大的那一類,其相對(duì)減小即為:

        當(dāng)可拓展到有n個(gè)名義變量的情況,設(shè)其中一個(gè)因變量為Y,其他n-1個(gè)為自變量記為X1,……X(n-1),對(duì)應(yīng)的類別數(shù)分別為N1,……,N(n-1),則對(duì)應(yīng)的關(guān)聯(lián)測(cè)度為:

        2.2 關(guān)聯(lián)測(cè)度τGK

        3 實(shí)例分析

        表2 有關(guān)黨派認(rèn)同的數(shù)據(jù)

        4 結(jié)束語

        對(duì)于以上給出的關(guān)聯(lián)測(cè)度,其與一些檢驗(yàn)統(tǒng)計(jì)量和關(guān)聯(lián)指標(biāo)相比,不僅能度量關(guān)聯(lián)性的強(qiáng)弱,而且具有可解釋性,在國(guó)外已被廣泛討論與應(yīng)用,但在國(guó)內(nèi)比較少人關(guān)注這兩個(gè)關(guān)聯(lián)測(cè)度,而且隨著R軟件的普及,也有專家給出計(jì)算相關(guān)指標(biāo)的函數(shù)包,并命名為Goodman-Kruskal以方便被更多人使用,但該包中只給出兩個(gè)名義變量的計(jì)算函數(shù),并沒有給出多變量的情況,所以有待進(jìn)一步去研究.

        [1]薛允蓮,姜世強(qiáng),劉貴浩,等.列聯(lián)表資料的關(guān)聯(lián)強(qiáng)度[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2011,28(3):244-246.

        [2]GoodmanLA,KruskalWH.MeasuresofAssociationforCrossClassifications[J].Springer-Verlag,1979,31(49):20-30.

        [3]HuangW,ShiY,WangX.Anominalassociationmatrixwithfeatureselectionforcategoricaldata[J].Statistics,2013,25(25):58-65.

        [4]BiswasA,ParkE.Measuresofassociationfornominalcategoricalvariables☆[J].JournaloftheKoreanStatisticalSociety,2009,38(3):247-258.

        [5]TahaA,HadiAS.Pair-wiseassociationmeasuresforcategoricalandmixeddata[J].InformationSciences,2016,s346-347:73-89.

        [6]LeeAJ.Somesimplemethodsforgeneratingcorrelatedcategoricalvariates[J].ComputationalStatistics&DataAnalysis,1997,26(2):133-148.

        [責(zé)任編輯:王 軍]

        Nominal variable correlation strength analysis

        DAI Jianguo

        (School of Mathematics and Information Science,Guangzhou University,Guangzhou 510006,China)

        in view of the independence test statistics can’t measure strength of correlation and some associated measures can’t be interpreted,first introduced the Goodman-Kruskal correlations strength index between two nominal variables i,then extended to multivariable case,and gives the examples were analyzed,and the results show that the fact there are better and reasonable explanation.

        nominal variables;correlation measure;interpretability

        2017-02-21

        戴建國(guó)(1992—),男,江西撫州人,廣州大學(xué)碩士研究生,主要從事概率統(tǒng)計(jì),數(shù)據(jù)挖掘的研究.

        O211

        A

        1672-3600(2017)09-0011-03

        猜你喜歡
        名義測(cè)度度量
        有趣的度量
        三個(gè)數(shù)字集生成的自相似測(cè)度的乘積譜
        R1上莫朗測(cè)度關(guān)于幾何平均誤差的最優(yōu)Vornoi分劃
        模糊度量空間的強(qiáng)嵌入
        非等熵Chaplygin氣體測(cè)度值解存在性
        Cookie-Cutter集上的Gibbs測(cè)度
        逆行,以生命的名義
        迷向表示分為6個(gè)不可約直和的旗流形上不變愛因斯坦度量
        以二胎的名義,享受生活
        好日子(2018年9期)2018-10-12 09:57:18
        地質(zhì)異常的奇異性度量與隱伏源致礦異常識(shí)別
        女人被狂躁到高潮视频免费网站| 中文字幕在线久热精品| 久久精品国产亚洲AV香蕉吃奶 | av网站免费线看| 亚洲AV小说在线观看| 亚洲天码一区二区三区| 亚洲av无码日韩av无码网站冲| 欧美黑人又粗又硬xxxxx喷水 | 一区二区特别黄色大片| 国产一区二区三区啊啊| 亚洲a∨无码男人的天堂| 草草网站影院白丝内射| 无码啪啪人妻| 亚洲最大一区二区在线观看| 内射合集对白在线| 国际无码精品| 亚洲24小时在线免费视频网站 | 国产av天堂亚洲国产av天堂| 丁香五香天堂网| 波多野结衣一区二区三区免费视频| 白白色免费视频一区二区在线| 中国美女a级毛片| 丝袜足控一区二区三区| 放荡人妻一区二区三区| 一区在线视频免费播放| 人人摸人人操| 色爱无码A V 综合区| 青青草是针对华人绿色超碰 | 久久精品国产99久久丝袜| 性色av一区二区三区密臀av| 性高朝久久久久久久3小时| 国产一区二区三区影院| 91久久综合精品国产丝袜长腿| 国产精品一区二区三区av在线| 少妇人妻在线无码天堂视频网| 亚洲中文字幕乱码| 91麻豆精品激情在线观最新| 国产精品天天看天天狠| a级毛片毛片免费观看久潮喷| 四虎无码精品a∨在线观看| 国产av一区二区亚洲精品|