亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        鳶尾花數(shù)據(jù)集在隨機向量數(shù)字特征中的相關應用

        2021-05-15 04:23:08馬淑蘭
        寧夏師范學院學報 2021年4期
        關鍵詞:鳶尾花協(xié)方差花瓣

        馬淑蘭

        (寧夏師范學院 數(shù)學與計算機科學學院,寧夏 固原 756000)

        多元統(tǒng)計分析是統(tǒng)計學中內(nèi)容十分豐富、應用性極強的一個重要分支,它在自然科學、社會科學和經(jīng)濟學等各個領域中得到了越來越廣泛的應用,是一種非常重要和實用的多元數(shù)據(jù)處理方法.它的內(nèi)容從一元統(tǒng)計推廣到多元統(tǒng)計,主要闡述了多元分布的基本概念及其統(tǒng)計推斷,也涉及了多元統(tǒng)計獨有的涉及降維方法包括:費希爾判別、主成分分析、因子分析、對應分析和典型分析[1-2].多元統(tǒng)計分析是指針對多元數(shù)據(jù)的統(tǒng)計分析方法,是同時考量多個變量,從多元數(shù)據(jù)集中獲取信息的統(tǒng)計方法.在當前大數(shù)據(jù)時代,信息技術推動了可視化教學發(fā)展,借助計算機軟件搜集可視化教學素材成為新的理工科教學理念的重要內(nèi)容[3-4].R語言是新西蘭奧克蘭大學的Robert Gentleman 和Ross Ihaka及其他志愿者人員共同開發(fā),主要用于統(tǒng)計分析、數(shù)據(jù)挖掘以及數(shù)據(jù)可視化,是一個用于統(tǒng)計計算和統(tǒng)計制圖的優(yōu)秀工具[5].RStudio是一款R語言的綜合開發(fā)環(huán)境,使得R運行更加方便.本文以Fisher的鳶尾花數(shù)據(jù)集為研究對象[6],利用R語言對隨機向量數(shù)字特征相關內(nèi)容進行數(shù)據(jù)可視化,幫助學習者理解和掌握數(shù)學期望、協(xié)方差矩陣、相關系數(shù)矩陣等概念及性質(zhì).

        1 隨機向量數(shù)字特征

        1.1 數(shù)學期望

        p×q隨機矩陣X=(xij)的數(shù)學期望定義為

        特別地,當q=1時得隨機向量x=(x1,x2,…,xp)′的數(shù)學期望定義,即

        E(x)=[E(x1),E(x2),…,E(xp)]′.

        1.2 協(xié)方差矩陣

        設x=(x1,x2,…,xp)′和y=(y1,y2,…,yq)′分別為p維和q維隨機向量,x和y的協(xié)方差矩陣定義為

        可將其簡寫為

        Cov(x,y)=E[x-E(x)][y-E(y)]′.

        當x=y,Cov(x,x)稱為x的協(xié)方差矩陣,記作V(x).

        1.3 相關矩陣

        設x=(x1,x2,…,xp)′和y=(y1,y2,…,yq)′分別為p維和q維隨機向量,x和y的相關矩陣定義為

        當x=y,ρ(x,x)稱為x的相關矩陣,記作R=(ρij),其中ρij=ρ(xi,yj),ρii=1,即

        2 多元數(shù)據(jù)數(shù)字特征的展示與可視化

        2.1 數(shù)據(jù)來源

        鳶尾花數(shù)據(jù)集(Fisher′s iris flower data set)由英國統(tǒng)計學家Ronald Aylmer fisher(費希爾)于1936年整理得到的,為了量化不同種類的鳶尾花形態(tài)上的區(qū)別進行收集的,它包含了三類鳶尾花數(shù)據(jù):山鳶尾(Setosa)、雜色鳶尾(Versicolour)、維吉尼亞鳶尾(Virginica)的花萼、花瓣的長度與寬度.這個數(shù)據(jù)集是一個非常典型的多元數(shù)據(jù)集,共有150個不同種類鳶尾花的觀測值,每一種鳶尾花的觀察數(shù)據(jù)均為50個.數(shù)據(jù)集中的行代表了很多朵鳶尾花的樣本,數(shù)據(jù)集中的每一列代表一個信息維度,共有五個信息維度即花萼的長(Sepal length),花萼的寬(Sepal width),花瓣的長(Petal length),花瓣的寬((Petal width ),鳶尾花的種類(Species).不同的鳶尾花在形態(tài)上有沒有什么不同呢?這個問題給了Fisher研究多元統(tǒng)計分析方法的動機,面對這樣一個數(shù)據(jù)集能做很多統(tǒng)計分析,比如變量之間的相關性分析,判別分析、回歸分析等.生活中這樣類似的數(shù)據(jù)集有很多,這也是利用該數(shù)據(jù)集做統(tǒng)計分析的原因.

        2.2 基于R語言的數(shù)據(jù)結(jié)果展示與可視化

        在多元統(tǒng)計分析中,相比一元隨機變量數(shù)字特征的表達,多元數(shù)據(jù)的數(shù)字特征表達方式要復雜一些.在一元狀態(tài)下,數(shù)學期望、協(xié)方差、相關系數(shù)等都用一個數(shù)值可以表示,而多元情況則用隨機向量及矩陣表示.在R中調(diào)用colMeans函數(shù)對上述數(shù)據(jù)集中前四列變量求出數(shù)學期望,如表1所示

        表1 三種鳶尾花前四個信息維度的數(shù)學期望

        所求數(shù)學期望結(jié)果應記為(5.84,3.06,3.76,1.20).

        在R中分別調(diào)用cov及cor函數(shù)即可得出前四列變量協(xié)方差矩陣及相關系數(shù)矩陣,如表2,表3所示.

        表2 三種鳶尾花前四個信息維度的協(xié)方差陣

        所求協(xié)方差矩陣結(jié)果應記為

        表3 三種鳶尾花前四個信息維度的相關矩陣

        以上是數(shù)字特征數(shù)值形式呈現(xiàn),為了更好的解讀數(shù)字特征在數(shù)據(jù)分布及其數(shù)據(jù)間相互依存關系中所起的作用,仍然以鳶尾花數(shù)據(jù)集前四個信息維度為例,利用R繪圖功能以圖形方式展現(xiàn)數(shù)據(jù)分布如圖1所示,數(shù)據(jù)間兩兩相關程度如圖2所示.

        圖1 三種鳶尾花前四個信息維度的分布直方圖與兩兩散點圖

        圖2 包含相關系數(shù)的三種鳶尾花前四個信息的分布直方圖與兩兩散點圖

        2.3 結(jié)果與分析

        表1分別給出了鳶尾花數(shù)據(jù)集前四個變量數(shù)據(jù)的均值,即刻畫了前四個信息維度的中心位置為(5.84,3.06,3.76,1.20),結(jié)合圖1中的直方圖分布圖可以看出數(shù)據(jù)集里三種鳶尾花的花萼的長(Sepal length)、花萼的寬(Sepal width)、花瓣的長(Petal length)、花瓣的寬((Petal width )都分別向各自的中心位置集中.表2列出了鳶尾花數(shù)據(jù)集前四個變量數(shù)據(jù)的協(xié)方差矩陣數(shù)表,刻畫了前四個信息維度的兩兩線性關系,結(jié)合圖1中的二維散點圖可以了解到四個信息維度數(shù)據(jù)的分散程度,利用圖中的線性擬合曲線能看出花瓣的長(Petal length)、花瓣的寬((Petal width )線性關系最強.表3給出了鳶尾花數(shù)據(jù)集前四個變量數(shù)據(jù)的相關系數(shù)矩陣數(shù)表,這個數(shù)表理論上可以認為是協(xié)方差矩陣數(shù)表的標準化結(jié)果,將兩兩散點圖的信息用[-1,1]之間的數(shù)去刻畫,由于協(xié)方差矩陣的對稱性,圖2在圖1的基礎上把上三角的位置用相關系數(shù)填充,這樣增強了圖形的可視化效果,圖2中上三角位置中的數(shù)據(jù)越大意味著其對稱位置數(shù)據(jù)的線性相關性越強,譬如花瓣的長(Petal length)、花瓣的寬((Petal width )線性關系最強,相關系數(shù)為0.96.

        3 結(jié)論

        本文以隨機向量數(shù)字特征理論為研究內(nèi)容,以Fisher的鳶尾花數(shù)據(jù)集為研究對象,利用R語言強大的統(tǒng)計和繪圖功能,完成了相關數(shù)據(jù)的展示和可視化,整個分析結(jié)果一目了然.“數(shù)缺形時少直覺,形少數(shù)時難入微”,在互聯(lián)網(wǎng)和信息技術突飛猛進的背景下,數(shù)據(jù)的可視化充斥在生活的方方面面,利用理論知識和實用的計算機軟件,提煉數(shù)據(jù)隱含信息、挖掘其統(tǒng)計規(guī)律并對其發(fā)展規(guī)律進行預測分析將成為數(shù)據(jù)分析的關鍵內(nèi)容.

        猜你喜歡
        鳶尾花協(xié)方差花瓣
        花瓣數(shù)一數(shù)
        鳶尾花觀察日記
        天天愛科學(2023年3期)2023-02-23 03:43:22
        鳶尾花
        鳶尾花開
        童話世界(2018年35期)2018-12-03 05:23:14
        我有鳶尾花一樣的靈魂(外一首)
        散文詩(2017年18期)2018-01-31 02:43:33
        花瓣報
        天上的花瓣雨旋落
        學生天地(2016年16期)2016-05-17 05:46:02
        不確定系統(tǒng)改進的魯棒協(xié)方差交叉融合穩(wěn)態(tài)Kalman預報器
        自動化學報(2016年8期)2016-04-16 03:38:55
        一種基于廣義協(xié)方差矩陣的欠定盲辨識方法
        閱讀花瓣雨
        国产午夜在线视频观看| 99在线国产视频| 琪琪av一区二区三区| 国产精品久久久免费精品| 中文字幕久久久人妻无码 | 中文字幕亚洲精品一二三区 | 一区二区三区在线观看视频免费| 精品国产精品三级在线专区| 国产精品免费_区二区三区观看| 男女真实有遮挡xx00动态图| 亚洲啊啊啊一区二区三区| 国产草逼视频免费观看| 日射精情感性色视频| 久久精品免费一区二区喷潮| 超短裙老师在线观看一区| 天堂网站一区二区三区| 真人无码作爱免费视频禁hnn| 亚洲无码夜夜操| 91国产熟女自拍视频| 亚洲精品无码专区在线在线播放| 国产va免费精品观看| 亚洲国产成人aⅴ毛片大全| 日本一区二区国产精品| 亚洲国产av精品一区二区蜜芽 | 欧美精品aaa久久久影院| 亚洲女同一区二区三区| 在线播放免费人成毛片乱码| 国产偷窥熟女精品视频| 国产一区二区三区资源在线观看| 熟妇人妻无乱码中文字幕av| 永久免费观看国产裸体美女| 成 人 网 站 在线 看 免费| 美女被内射中出在线观看| 久久青青草原精品国产app| 93精91精品国产综合久久香蕉| 亚洲国产欲色有一二欲色| 超碰国产精品久久国产精品99 | 亚洲综合中文字幕乱码在线| 亚洲一区二区三区厕所偷拍| 久久人人爽av亚洲精品| 久久精品夜夜夜夜夜久久|