亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        函數(shù)型數(shù)據(jù)分析若干方法

        2022-01-26 05:10:30靳雪晴
        現(xiàn)代計算機 2021年34期
        關鍵詞:方法模型

        靳雪晴

        (銅陵學院數(shù)學與計算機學院,銅陵 244000)

        0 引言

        在實際生活中,我們需要對很多數(shù)據(jù)進行深度挖掘,例如身高增長、醫(yī)學病例診斷、天氣變化、各種數(shù)據(jù)分析用到醫(yī)學診斷、氣象報告、兒童增長分析、筆記識別、腦電數(shù)據(jù)分析等等方面。函數(shù)型數(shù)據(jù)分析就是這樣一種新型的統(tǒng)計學分析方法,它相比于普通常見的方法,具有更強的適用性。這是因為函數(shù)型數(shù)據(jù)分析具有能夠對無限維的數(shù)據(jù)進行分析,并且還能夠對數(shù)據(jù)進行多重降維而且把握更多更有利信息的特點[1]。隨著科技的發(fā)展,函數(shù)型特征的數(shù)據(jù)應用越來越廣泛,也促使函數(shù)型數(shù)據(jù)分析方法正處于迅速發(fā)展階段。

        函數(shù)型數(shù)據(jù)就是把數(shù)據(jù)用函數(shù)的形式表現(xiàn)出來,它具有一個非常明顯的特征就是這個函數(shù)具有數(shù)據(jù)性。當我們在分析一些普通的數(shù)據(jù)的時候可能只會用到普通的函數(shù)去研究他的一些數(shù)據(jù)的簡單排列,但是在面對非常多維的、間隔非常密集數(shù)據(jù)的時候這些普通函數(shù)就會無從下手,而且在數(shù)據(jù)統(tǒng)計中,經常有一些數(shù)據(jù)無法獲取,就算能夠獲取也需要付出很大的代價。常常出現(xiàn)數(shù)據(jù)缺失的現(xiàn)象,很大程度上阻礙了科學的進步與發(fā)展。數(shù)據(jù)缺失的情況可以總體概括為以下幾點:①完全隨機缺失。②隨機缺失。③不可忽略缺失。我們這時候就會需要一個新的函數(shù)來對他們進行數(shù)據(jù)的收集,以及進行普通函數(shù)無法進行的全面的深刻的分析。對于這種現(xiàn)象我們就應該對數(shù)據(jù)采用函數(shù)型數(shù)據(jù)分析方法來進行彌補,盡可能的保留有用的信息,還原真實的情況。函數(shù)數(shù)據(jù)不同以往把函數(shù)當成一連串的點的集合,而是把函數(shù)數(shù)據(jù)當成一個個單獨的項。函數(shù)型數(shù)據(jù)表現(xiàn)形式一般都是一條平滑的曲線或者就是一連串的函數(shù)xi(t)構成的,這其中的t一般都是時間,當然也能是除去時間外的自由變量;xi(t)中i取1,2,3…,N它則表示被測試對象的數(shù)量[2]。

        函數(shù)型數(shù)據(jù)分析的基本想法是將帶有某種函數(shù)性質的數(shù)據(jù)看成一個整體,并非當作個體觀測值的一個序列。一方面,它克服了純粹的非參數(shù)函數(shù)回歸模型的維數(shù)限制。同時使得與線性部分的解釋作用變得更加容易,另一方面,考慮一些自變量和因變量之間的關系為非線性會比標準的線性回歸更加靈活。

        1 含函數(shù)型數(shù)據(jù)模型的介紹

        函數(shù)型數(shù)據(jù)模型的介紹:本文將介紹三種函數(shù)型數(shù)據(jù)模型:完全模型、部分模型、含誤差模型。

        1.1 完全模型

        其中T滿足:

        而且Γ還是L2[0,1]→L2[0,1]上的算子,其中β(s,t)符合條件,那么我們認為函數(shù)型的隨機誤差εi(t)是互不相干的,并且E{εi(t)}=0,E‖εi(t)‖2=a2<∞,我們這邊不對εi進行是不是同分部進行要求;模型中數(shù) 據(jù) 對 (X i(t),Y i(t))滿 足χi(t)∈L2[0,1],Y i(t)∈L2[0,1][3]。

        1.2 部分模型

        如果在一個數(shù)據(jù)中既存在向量型又存在函數(shù)型的話,我們就稱這個數(shù)據(jù)為混合數(shù)據(jù),像這樣同時含有向量型和函數(shù)型數(shù)據(jù)的模型在我們的日常生活中也是經常存在的。

        在公式中Y是在概率空間(Ω,β,P)上的隨機的變量,且這個值是實值,那么Z代表的是(Z1,…,Z p)T上邊的隨機變量,這個值可以是0維到P維的實值[4]。{X(t):t∈Γ} 是在(Ω,β,P)概率空間上的過程值,整個公式的樣本是在[0,1]上的函數(shù)。式中的β=(β1,…,βp)是在任意一個維度上的參數(shù)向量,根據(jù)公式可以知道e,X(t),Z他們三個是互相不相關的。那么在β(t=0)β(t)=0的時候,本模型就是屬于經典的線性的回歸方程。

        1.3 含誤差模型

        1.3.1 解釋變量帶有測量誤差

        在考慮函數(shù)型回歸模型中解釋變量帶有測量誤差的情形時,大多研究中只考慮一個解釋變量的測量誤差,而實際中我們的函數(shù)型回歸模型中不止一個解釋變量,可能是兩個或兩個以上,即不止一個誤差變量。

        1.3.2 響應變量隨機缺失

        關于函數(shù)型回歸模型在響應變量隨機缺失的情形,模型大多為單參數(shù)模型,而較為忽略對于出現(xiàn)多個參數(shù)函數(shù)型回歸模型的情形;而在處理缺失數(shù)據(jù)方法時會存在資源的大量浪費和丟棄隱藏在這些對象中的信息;同時在截面數(shù)據(jù)、時間序列數(shù)據(jù)及面板數(shù)據(jù)下建立的回歸模型中考慮到解釋變量有測量誤差,同時響應隨機缺失的復雜情形下模型的統(tǒng)計推斷。

        2 函數(shù)型數(shù)據(jù)分析法

        模型通常采用的方法。函數(shù)型數(shù)據(jù)的分析法,主要分為對數(shù)據(jù)分析、統(tǒng)計分析、主成分分析、最小二乘估計等。新型的函數(shù)型數(shù)據(jù)分析方法相比于較早的分析方法,他們有幾個共同的地方就是分析出滿足下一步計算所需的數(shù)據(jù),突出不同特征的數(shù)據(jù)以及他們之間的變化聯(lián)系情況等等。在本文中主要講述主成分分析和最小二乘估計及其在函數(shù)型數(shù)據(jù)模型中的應用。

        現(xiàn)大致介紹主成分分析法與最小二乘法的一些不足之處。①主成分分析法。主成分分析法中,應保證降維后的信息量保持在一個較高水平,因為其解釋其含義帶有模糊性,在變量降維過程中體現(xiàn)其弊端(即提取主成分個數(shù)m通常要小于原始變量個數(shù)p,除非p本身較?。?;另外,被提取的主成分需給出符合實際意義和背景的解釋,否則研究無實際含義。②最小二乘法。當矩陣XTX不可逆時,不能用最小二乘估計,因為最小二乘法是線性估計,在本質上已經默認其是線性的關系,就表現(xiàn)出一定的局限性,而且在回歸過程中,回歸的關聯(lián)式不可能全部通過每個回歸數(shù)據(jù)點。但用于曲線擬合,當自變量與因變量均值為0時,相同方差的隨機誤差,該方法可給出統(tǒng)計意義上最好的參數(shù)擬合。

        2.1 主成分分析

        主成分分析法所利用的基本思想就是,函數(shù)在處理多維的數(shù)據(jù)的時候,通過對數(shù)據(jù)進行主要的成分把握,對數(shù)據(jù)進行有效的降低維度,對所處理的數(shù)據(jù)進行簡化。盡管這樣做會使得數(shù)據(jù)變的不是非常完整,但也通過降低緯度的方式掌握了問題絕大部分的重要信息,這樣做會大大降低下一步對數(shù)據(jù)進行的難度。然后把這些提取出來的變量通過方差依次減少的方式進行排列。假設X=(x1,…,x P)是P維隨機變量,Σ為它的協(xié)方差矩陣,λ1≥λ2≥…≥λP是Σ的特征值,Φ1,…,ΦP是相應的特征向量,根據(jù)矩陣的性質,我們可以得到:

        考慮變換了的隨機變量:

        若Y代表新隨機變量所成的向量,而?代表以?1,?2,…,?P為各列的正交矩陣,則Y便由X通過正交變換Y=?X而得到。

        2.2 最小二乘估計

        最小二乘法估計一般使用于過度確定的系統(tǒng),所謂的過度確定系統(tǒng)就是指未知數(shù)的個數(shù)是少于方程組的個數(shù)的一個系統(tǒng),用回歸方程來求近似解的傳統(tǒng)方式。在最小二乘法中相對比較重要的值就是殘差了,因為它反映了在曲線擬合過程中所采用的數(shù)據(jù)值與擬合值之間的大小差距[6]。當然在最估計中,殘差還是越小越好,只有殘差越小則說明擬合曲線越接近原數(shù)值曲線。在將殘差最小化的過程中出現(xiàn)的問題一般可以歸納為二種,其中第一種就是針對線性的或者普通的最小二乘法、第二種就是非線性的。具體采用哪種方法還是要看數(shù)據(jù)的殘差是不是線性的。無論是哪種情況他們的核心算法都是一樣的,當所要處理的數(shù)據(jù)是線性的時候它本身擁有一個完整的解決方案,當所處理的數(shù)據(jù)是非線性的時候,這時候通常就會用到一種迭代方法,在每一次的迭代系統(tǒng)由線性近似。無論是哪種方式最終我們都能夠一條由自變量和因變量擬合而成的曲線?;貧w分析它的最初目的就是對原數(shù)據(jù)進行科學估計從而更加清晰的表達出原數(shù)據(jù),通常情況下在我們決定最佳擬合的時候,都是采用最小二乘法估計,因為使用最小二乘法來對數(shù)據(jù)進行估計是非常方便準確的。這種估計可以表示為:

        3 結語

        盡管說函數(shù)型數(shù)據(jù)的出現(xiàn)很大程度上豐富了數(shù)據(jù)同及分析的領域,逐步發(fā)展成了能夠更好地解決現(xiàn)實生活中問題的好工具、好幫手。但是函數(shù)型數(shù)據(jù)分析畢竟是一個數(shù)學數(shù)據(jù)分析的新興產物。它的很多方面還是有待完善,因此我們還需要不斷地去探索研究這個領域。盡管說我們在進行函數(shù)型數(shù)據(jù)分析的時候引入了很多的基函數(shù),從而得到所觀測數(shù)據(jù)的函數(shù)型曲線。但是我們相信,隨著科學技術的蓬勃發(fā)展,未來會有更多的基函數(shù)來供我們進行使用。

        另外空間型數(shù)據(jù)分析相對于函數(shù)型數(shù)據(jù)分析來講,能夠處理里的維度信息更加龐大,并且這幾年也得到了很好的發(fā)展,相信未來能有越來越多的分析方法來供我們更好地對數(shù)據(jù)進行處理。

        猜你喜歡
        方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        學習方法
        可能是方法不對
        3D打印中的模型分割與打包
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        FLUKA幾何模型到CAD幾何模型轉換方法初步研究
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        伊人五月亚洲综合在线| 亚洲av无码av在线播放| 乱人伦中文字幕在线不卡网站 | 国产呦系列呦交| 国产自拍一区在线视频| 麻花传媒68xxx在线观看| 欧美日韩国产一区二区三区不卡| 九九99国产精品视频| 白嫩少妇在线喷水18禁| 天堂av在线美女免费| 成人精品一区二区三区中文字幕| 久久国产亚洲AV无码麻豆| 一区二区中文字幕蜜桃| 亚洲av无码精品无码麻豆| 成av免费大片黄在线观看| 51精品视频一区二区三区| 色综合中文字幕综合网| 999zyz玖玖资源站永久| 四川老熟女下面又黑又肥 | 音影先锋色天堂av电影妓女久久| 国产av一区二区三区天美| 亚洲中文字幕无码av永久| 亚洲日韩精品欧美一区二区一 | 国产午夜福利短视频| 色婷婷一区二区三区四区| 白白色发布免费手机在线视频观看| 久久人妻少妇嫩草av无码专区| 亚洲欲色欲香天天综合网| 丝袜美腿一区二区在线观看| 日本熟妇另类一区二区三区| 老师粉嫩小泬喷水视频90| 国产午夜精品福利久久| 久久亚洲av熟女国产| 亚洲日韩中文字幕在线播放| 久久久久久久无码高潮| 男人的天堂av一二三区| 国产女同va一区二区三区| 国产成人精品123区免费视频| 99久久超碰中文字幕伊人| 久久综合五月天啪网亚洲精品| 国产亚洲精品久久久闺蜜|