亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        MIC與傳統(tǒng)相關(guān)分析方法比較研究*

        2019-05-10 11:28:06
        山西青年 2019年9期
        關(guān)鍵詞:互信息離群適用范圍

        梁 珊

        (華南理工大學廣州學院,廣東 廣州 510800)

        大數(shù)據(jù)時代,傳統(tǒng)的相關(guān)分析方法已不能滿足對數(shù)據(jù)的探索以及認知需求,隨著計算機技術(shù)的提升,大量新的相關(guān)分析方法產(chǎn)生,MIC作為目前為止最具有代表性,發(fā)展最快,認同度最高的大數(shù)據(jù)相關(guān)分析方法被廣泛使用。本文總結(jié)相關(guān)分析的發(fā)展史,在此基礎(chǔ)上比較研究MIC的適用范圍、測度效果、解釋能力及計算速度,分析其優(yōu)缺點,以避免使用過程中的誤用。

        一、MIC概述

        Reshef(2011)指出大數(shù)據(jù)中度量相關(guān)性的統(tǒng)計量應該具有“普遍性”和“均等性”。并給出MIC方法。MIC主要思想是:如果兩個變量之間存在著相關(guān)關(guān)系,那么在變量的散點圖中可以繪制網(wǎng)格線,通過網(wǎng)格線將隨機變量數(shù)據(jù)集進行劃分,形成網(wǎng)格,計算變量之間的相關(guān)關(guān)系就是在每種網(wǎng)格劃分方式下,計算變量數(shù)據(jù)集的互信息,然后歸一化互信息來確保在不同劃分方式下的互信息值可以做比較。最大相關(guān)系數(shù)就是在各種網(wǎng)格劃分方式下,互信息的最大值。

        可以證明MIC具有如下性質(zhì):(1)MIC是互信息歸一化后的最大值,因此MIC取值范圍在[0,1]之間;(2)由于互信息具有對稱性,因此,MIC(X,Y)=MIC(Y,X);(3)I{x,y}的取值僅依賴于數(shù)據(jù)點的排序分布,對隨機變量進行單調(diào)變換,其數(shù)據(jù)點的排序分布不會發(fā)生變化,故MIC在隨機變量的單調(diào)變換下具有不變性;(4)大數(shù)據(jù)樣本下,對于無噪音的相關(guān)關(guān)系,MIC趨近于1;當兩個變量獨立時,MIC趨近于0。

        在大數(shù)據(jù)相關(guān)分析方法中,MIC最具有代表性,發(fā)展最快,認同度最高,因此,本文將MIC作為大數(shù)據(jù)相關(guān)分析方法的典型代表與傳統(tǒng)相關(guān)分析方法進行比較。

        二、適用范圍比較

        表1 適用范圍比較

        注:*表示該方法對變量的維度沒有限制。

        比較可知:分布要求方面,Pearson相關(guān)系數(shù)、典型相關(guān)分析要求變量服從正態(tài)分布,其他方法則沒有此要求;測度的相關(guān)關(guān)系類型方面,Pearson相關(guān)系數(shù)和經(jīng)典的典型相關(guān)系數(shù)只能度量隨機向量間的線性相關(guān)關(guān)系;Copula函數(shù)、HHG、MIC可以測度線性相關(guān),也可以測度非線性相關(guān);測度維度方面,典型相關(guān)分析、Copula函數(shù)、HHG可以測度多維數(shù)據(jù)相關(guān)性。

        適用范圍的綜合比較來看,MIC對于兩維數(shù)據(jù)之間的相關(guān)關(guān)系顯現(xiàn)出明顯優(yōu)勢,對隨機變量的分布沒有要求,測度的相關(guān)關(guān)系類型涵蓋了線性相關(guān)和非線性相關(guān),缺點是不能測度多維數(shù)據(jù)的相關(guān)程度。

        三、測度效果比較

        (一)對非線性相關(guān)關(guān)系的測度

        取X={xi:i=1:500}~U(-1,1),按照表2-4中的各個相關(guān)關(guān)系類型模擬變量Y,計算變量X與Y之間的Pearson相關(guān)系數(shù)與MIC得分。

        表2 MIC與Pearson相關(guān)系數(shù)對比表

        結(jié)果表明,MIC可以準確度量變量之間的線性關(guān)系以及非線性關(guān)系,而Pearson相關(guān)系數(shù)則僅能識別線性相關(guān)關(guān)系。

        (二)對異常值的敏感程度

        取X={xi:i=1:30}~U(0,1),ε={εi:i=1:30}~N(0,1),Y=2X+ε。在模擬得到數(shù)據(jù)(X,Y)基礎(chǔ)上增加四個離群點,增加離群點后的數(shù)據(jù)設(shè)為(X′,Y′)。左圖為數(shù)據(jù)(X,Y)的散點圖,增加離群點后,得到右圖,為數(shù)據(jù)(X′,Y′)的散點圖。

        圖1 MIC穩(wěn)定性示意圖

        分別計算(X,Y)和(X′,Y′)的Pearson相關(guān)系數(shù)與MIC值,MIC(X,Y)=0.26,ρ(X,Y)=0.33;MIC(X′,Y′)=0.26,ρ(X′,Y′)=0.60。去掉離群點前后數(shù)據(jù)的MIC得分相同,而ρ(X′,Y′)-ρ(X,Y)=0.27,表明MIC具有穩(wěn)定性,而Pearson相關(guān)系數(shù)易受異常值的影響。

        四、相關(guān)關(guān)系的解釋能力比較

        Copula函數(shù)、HHG、MIC三者均可以度量變量之間的非線性相關(guān)關(guān)系,除HHG方法之外,Copula函數(shù)和MIC都可以對相關(guān)關(guān)系進行進一步的描述和解釋。Copula函數(shù)能夠刻畫不同邊緣分布之間的連接結(jié)構(gòu),因此能夠全面地描述相關(guān)關(guān)系結(jié)構(gòu),在金融時間序列中被廣泛使用。而MIC方法則衍生出諸多統(tǒng)計量,可以通過這些統(tǒng)計量對變量之間的相關(guān)關(guān)系類型做出逐步推斷。例如:MIC-ρ2可以檢驗變量之間的相關(guān)關(guān)系類型是否為非線性相關(guān)關(guān)系,最大非對稱得分(maximal asymmetry score,MAS)用來度量兩個變量間的單調(diào)性,最大值(maximum edge value,MEV)可以用來判斷變量間的關(guān)系是否是函數(shù)關(guān)系,最小網(wǎng)格單元數(shù)(minimum cell number,MCN)可以用來衡量相關(guān)性的復雜程度。

        五、計算速度比較

        研究對象從樣本到類總體的轉(zhuǎn)變,對相關(guān)分析方法的計算能力與計算速度提出了較高要求,將MIC與HHG相關(guān)關(guān)系計算方法相比較,MIC的計算時間較短,滿足數(shù)據(jù)流挖掘中算法時間復雜度低的原則。

        圖2 HHG與MIC計算時長比較

        六、結(jié)論

        通過比較研究發(fā)現(xiàn),MIC具有以下優(yōu)點:對于兩維數(shù)據(jù)的復雜相關(guān)關(guān)系測度適用范圍廣、結(jié)果測度準確,不易受異常值影響、解釋能力強、計算快,能夠滿足大數(shù)據(jù)挖掘需求;缺點方面:MIC只能測度兩變量之間的相關(guān)關(guān)系,不能測度多變量的相關(guān)關(guān)系,因此,對MIC方法的改進可以從測度變量的個數(shù)入手。

        猜你喜歡
        互信息離群適用范圍
        論犯罪公式及其適用范圍
        法大研究生(2020年2期)2020-01-19 01:42:28
        叉車定義及適用范圍探討
        離群數(shù)據(jù)挖掘在發(fā)現(xiàn)房產(chǎn)銷售潛在客戶中的應用
        基于互信息的貝葉斯網(wǎng)絡結(jié)構(gòu)學習
        聯(lián)合互信息水下目標特征選擇算法
        離群的小雞
        改進的互信息最小化非線性盲源分離算法
        電測與儀表(2015年9期)2015-04-09 11:59:22
        基于增量式互信息的圖像快速匹配方法
        城市地下車行道路功能定位及其適用范圍研究
        應用相似度測量的圖離群點檢測方法
        精品国产高清一区二区广区| 国产一区二区三区av香蕉| 久久久99精品视频| 国产一级av理论手机在线| 亚洲一区二区三区码精品色| 三个黑人插一个女的视频| 丝袜美腿高清在线观看| 人妻少妇中文字幕久久| 无码人妻一区二区三区免费视频| 亚洲欧美激情精品一区二区| 亚洲VA中文字幕无码毛片春药| 日本专区一区二区三区| av天堂一区二区三区精品| 丰满少妇被啪啪到高潮迷轩| 国产精品女主播福利在线| 极品美女扒开粉嫩小泬图片| 无码人妻精品一区二区三| 老熟妇乱子伦av| 国产美女遭强高潮网站| 97在线视频免费| 中文字幕精品亚洲一区二区三区| 人妖一区二区三区在线| 精品国产一区二区三区三级| 内射欧美老妇wbb| 国产无遮挡又黄又爽在线观看 | 99久热在线精品视频观看| 国产一区二区女内射| 国产福利酱国产一区二区| 日韩一线无码av毛片免费| 97久久成人国产精品免费| 亚洲国产都市一区二区| 丝袜美腿亚洲综合在线播放| 国产亚洲成人精品久久久| 天天夜碰日日摸日日澡性色av| 国产男女无遮挡猛进猛出| 国产一区二区三区四区五区vm| 国产成人久久精品亚洲小说| 精品国产亚洲av久一区二区三区| 国产精品国产三级国产剧情| 丰满女人猛烈进入视频免费网站| 一本色道久久综合狠狠躁篇|