亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        統(tǒng)計學(xué)與大數(shù)據(jù)

        2017-04-18 18:35:48張曉麗
        關(guān)鍵詞:統(tǒng)計分析大數(shù)據(jù)統(tǒng)計學(xué)

        張曉麗

        【摘要】首先,本文給出了筆者認(rèn)為的統(tǒng)計學(xué)研究的典型問題究竟是什么;然后,闡述了什么是大數(shù)據(jù);最后,就筆者的理解淺談了大數(shù)據(jù)時代統(tǒng)計學(xué)究竟還有沒有用武之地.

        【關(guān)鍵詞】統(tǒng)計學(xué);大數(shù)據(jù);統(tǒng)計分析

        一、統(tǒng)計學(xué)研究的典型問題

        眾所周知,統(tǒng)計學(xué)是處理數(shù)據(jù)的一門科學(xué).人們給統(tǒng)計學(xué)下的定義很多,比如,《不列顛百科全書》中“統(tǒng)計學(xué)是收集、分析、表述和解釋數(shù)據(jù)的科學(xué)”;《韋伯斯特國際詞典(第3版)》中“統(tǒng)計是一門收集、分析、解釋和提供數(shù)據(jù)的科學(xué)”;Mario F.Triola的《初級統(tǒng)計學(xué)》中“統(tǒng)計指的是一組方法,用來設(shè)計實驗、獲得數(shù)據(jù),然后在這些數(shù)據(jù)的基礎(chǔ)上組織、概括、演示、分析、解釋和得出結(jié)論”.筆者認(rèn)為,統(tǒng)計學(xué)研究的典型問題是“運用已知數(shù)據(jù)獲得所研究的客觀事物的數(shù)量特征和發(fā)展規(guī)律,利用規(guī)律對所研究的客觀事物的行為進(jìn)行預(yù)測”.

        首先,統(tǒng)計學(xué)研究的典型問題的關(guān)鍵之一就是必須有所研究問題的數(shù)據(jù),這是研究的前提.那么如何獲得已知數(shù)據(jù)呢?我們說可以通過調(diào)查,也可以通過實驗.先來說通過調(diào)查獲得已知數(shù)據(jù),情況有兩種,一種是抽樣調(diào)查,另一種是普查.給大家舉一個例子,比如,某研究部門想知道其所在城市所有職工家庭的年平均收入.那么,“該城市所有職工家庭的年平均收入”就構(gòu)成了所研究問題的總體.“該城市中的每一個職工家庭的年平均收入”就是總體中的個體.如果要通過抽樣調(diào)查來獲得數(shù)據(jù),也就是抽取部分個體組成樣本,比如,該部門抽取了2 000個職工家庭的年平均收入作為樣本,那么就獲得了2 000個樣本數(shù)據(jù)(某年的年收入數(shù)據(jù)),這就是通過抽樣調(diào)查獲得的已知數(shù)據(jù).再用這同一個例子來說一說普查.比如,2016年,該研究機構(gòu)對其所在城市中的每一個職工家庭都進(jìn)行了調(diào)查,獲得了每個個體(職工家庭)的2015年的年收入數(shù)據(jù),這就是通過普查獲得的已知數(shù)據(jù).

        當(dāng)然也可以通過實驗來獲得已知數(shù)據(jù),做實驗的過程就復(fù)雜了.要想通過實驗獲得靠譜的數(shù)據(jù),首先,得滿足樣本量足夠大,然后,就是要做到隨機.現(xiàn)實中這兩點也不是很容易做到的.例如,假設(shè)我們現(xiàn)在想研發(fā)一種做運動鞋的新材料,看看是不是比舊的材料更耐磨.又假設(shè)我們現(xiàn)在的研發(fā)成本非常高,只能提供4雙樣品鞋.于是,我們找來了8個孩子來試穿,4雙新材料4雙舊材料.看到這兒,第一反應(yīng)是樣本量小了,但是沒有辦法啊,實際情況只允許我們做到這種程度.那么在樣本量無法擴大的前提下,怎么做才能使實驗靠譜呢?我們給每一個孩子隨機選一只腳穿新材料,另一只腳穿舊材料.這樣,每一組新舊材料的對比都是基于同一個孩子的,這就不存在比如,孩子是否喜歡運動等的混淆因素了.

        統(tǒng)計學(xué)研究的典型問題的第二個關(guān)鍵點就是需要有合理的統(tǒng)計分析.針對已經(jīng)獲得的已知數(shù)據(jù)也就是樣本數(shù)據(jù),我們采用合理的統(tǒng)計分析,定會對所研究的客觀事物的數(shù)量特征和規(guī)律進(jìn)行準(zhǔn)確的描述、分析和判斷.

        統(tǒng)計學(xué)研究的典型問題的第三個關(guān)鍵點就是對未來的預(yù)測具有不確定性.分兩個方面來給大家闡述.首先,未來必須是未知的,如果所研究的某事物的未來行為或特征是已經(jīng)知道的,那這就不屬于統(tǒng)計學(xué)要研究的問題.其次,預(yù)測必須是不確定的.如果預(yù)測的結(jié)果只有一種,也就是預(yù)測的結(jié)果是確定的,那這也不屬于統(tǒng)計學(xué)要研究的問題.比如,我們想知道人體的骨骼有多少塊骨頭?于是,抽選部分人作為樣本,通過對樣本研究獲得已知數(shù)據(jù),進(jìn)而來預(yù)測其余未被抽中的人,這種預(yù)測具有確定性,人體骨骼是由206塊骨頭組成.這就不屬于統(tǒng)計學(xué)要研究的問題.再比如,一種新藥出廠后用于臨床試驗獲得已知數(shù)據(jù),然后對更廣泛的同類型病人的療效做預(yù)測性推斷,具有不確定性.

        二、什么是大數(shù)據(jù)

        當(dāng)今,“大數(shù)據(jù)”如日中天,似乎已經(jīng)成為人們的流行語,那什么是大數(shù)據(jù)呢?麥肯錫對大數(shù)據(jù)的定義是從數(shù)據(jù)集的“大體量”入手的:大數(shù)據(jù)是指那些規(guī)模大到傳統(tǒng)的數(shù)據(jù)庫軟件工具已經(jīng)無法采集、存儲、管理和分析的數(shù)據(jù)集.維基百科采納了麥肯錫的定義,認(rèn)為大數(shù)據(jù)是一組龐大而復(fù)雜的數(shù)據(jù)集的集合,大且復(fù)雜到難以用現(xiàn)有的數(shù)據(jù)庫管理工具或傳統(tǒng)的數(shù)據(jù)處理應(yīng)用來處理,大數(shù)據(jù)就是一切可記錄信號的集合.狹義地講,大數(shù)據(jù)是一個大樣本和高維變量的數(shù)據(jù)集合.廣義地講,大數(shù)據(jù)涵蓋多學(xué)科領(lǐng)域、多源、混合的數(shù)據(jù),自然科學(xué)、人文社會、經(jīng)濟學(xué)、通訊、網(wǎng)絡(luò)、商業(yè)和娛樂等各種領(lǐng)域的數(shù)據(jù)集相互重疊連成了一片數(shù)據(jù)的海洋.大數(shù)據(jù)涉及各種數(shù)據(jù)類型,包括文本與語言、錄像與圖像、時空、網(wǎng)絡(luò)與圖形.我認(rèn)為,當(dāng)今流行的“大數(shù)據(jù)”是通過互聯(lián)網(wǎng)獲得的足夠大量的、包含一切數(shù)據(jù)類型的數(shù)據(jù)的集合.

        三、大數(shù)據(jù)時代,統(tǒng)計學(xué)是不可或缺的

        我們姑且先不去談大數(shù)據(jù)和統(tǒng)計學(xué)中的數(shù)據(jù)誰更全面,誰更方便獲得,誰更相對有代表性;不去談什么樣本和總體,我們就只是來說一說,大數(shù)據(jù)時代,只是有全部的數(shù)據(jù)就足夠了嗎?筆者認(rèn)為當(dāng)然不是.無論是大數(shù)據(jù)還是統(tǒng)計學(xué)中的樣本數(shù)據(jù)最初都是雜亂的、無序的,所以說,大數(shù)據(jù)時代,數(shù)據(jù)的處理、理論分析等的問題就顯得尤為重要了.這些重要問題的解決都離不開統(tǒng)計學(xué),它需要統(tǒng)計理論和統(tǒng)計分析方法.

        就是舍恩伯格和庫克耶也不同意安德森的極端觀點.他們指出“大數(shù)據(jù)絕不會叫囂‘理論已死”,因為“大數(shù)據(jù)是在理論的基礎(chǔ)上形成的”,無論是如何搜集數(shù)據(jù)、分析數(shù)據(jù)、還是解讀研究結(jié)果,都得依賴?yán)碚?“大數(shù)據(jù)時代絕對不是一個理論消亡的時代,相反地,理論貫穿于大數(shù)據(jù)分析的方方面面.”

        綜上,即便是在大數(shù)據(jù)時代,統(tǒng)計學(xué)也是不可或缺的.

        猜你喜歡
        統(tǒng)計分析大數(shù)據(jù)統(tǒng)計學(xué)
        關(guān)于投稿的統(tǒng)計學(xué)要求
        統(tǒng)計學(xué)符號使用的說明
        統(tǒng)計學(xué)符號使用的說明
        本刊對來稿中統(tǒng)計學(xué)處理的有關(guān)要求
        如何發(fā)揮新時期統(tǒng)計工作的作用之我見
        企業(yè)固定資產(chǎn)分析存在問題及對策分析
        以統(tǒng)計分析為基礎(chǔ)的房地產(chǎn)稅收優(yōu)化分析
        SPSS在高校圖書館服務(wù)體系中的應(yīng)用研究
        科技視界(2016年20期)2016-09-29 11:18:30
        基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
        科技視界(2016年20期)2016-09-29 10:53:22
        无码久久精品国产亚洲av影片| 97青草超碰久久国内精品91| 精品国产sm最大网站| 久久精品国产色蜜蜜麻豆| 亚洲AV无码一区二区三区人| 欧美熟妇与小伙性欧美交| 亚洲最大av在线精品国产| 国产av夜夜欢一区二区三区| 精品无码专区久久久水蜜桃| 无码国产精品色午夜| 国产丝袜美腿在线视频| 一本丁香综合久久久久不卡网站| 在线永久免费观看黄网站| 人妻被猛烈进入中文字幕| 亚洲天堂av在线观看免费| 久久国产人妻一区二区| 欧美成人精品一区二区综合 | 中文字幕综合一区二区| 高潮内射双龙视频| 免费无码成人av在线播| 成人自拍视频国产一区| 日韩有码在线观看视频| 亚洲日韩一区精品射精| 亚洲综合自拍| 在线播放偷拍一区二区| 日韩人妻不卡一区二区三区| 欧美日韩国产一区二区三区不卡| 中文字幕亚洲人妻系列| 大尺度极品粉嫩嫩模免费| 男人扒开添女人下部免费视频 | 中文字幕亚洲无线码高清| 91人妻一区二区三区蜜臀| 久久久久国色av免费观看性色| 女同久久精品国产99国产精品| 国产精品国产三级国产三不| 亚洲国产一区二区三区精品| 99久久精品国产一区二区三区| 亚洲国产99精品国自产拍| 粉色蜜桃视频完整版免费观看在线 | av免费不卡国产观看| 欧美人与物videos另类xxxxx|