摘 要:隨著社會的發(fā)展,科技也不斷進步,當前社會已經(jīng)進入了大數(shù)據(jù)時代,在這個信息化、智能化、數(shù)據(jù)化的時代中,人們的生活也發(fā)生了翻天覆地的變化。如今互聯(lián)網(wǎng)興起,人們在生活中、工作中,都離不開互聯(lián)網(wǎng),互聯(lián)網(wǎng)已經(jīng)與人們的工作、學(xué)習(xí)、生活相融合?;ヂ?lián)網(wǎng)中的網(wǎng)絡(luò)數(shù)據(jù)也打破了地域等界線,將人們僅僅相連,本文就大數(shù)據(jù)下的概率論與數(shù)理統(tǒng)計理論知識展開分析,研究了概率論與數(shù)理統(tǒng)計的由來以及兩者之間的關(guān)系,最后針對概率論與數(shù)理統(tǒng)計的實際應(yīng)用展開探討。
關(guān)鍵詞:大數(shù)據(jù) 概率論 數(shù)理統(tǒng)計
大數(shù)據(jù)時代能夠讓人們足不出戶就了解到全世界的各類信息,在大數(shù)據(jù)支持下,人們通過互聯(lián)網(wǎng)、計算機就能夠?qū)π畔⑦M行搜索、統(tǒng)計,研究不同學(xué)科之間的交集,人們接觸的到的信息越來越多,就需要對信息進行處理,通過對信息的處理,提高對信息利用的能力,這樣才能夠充分利用大數(shù)據(jù),因此當前大數(shù)據(jù)下概率論與數(shù)理統(tǒng)計的研究引起了社會各界學(xué)者的關(guān)注。
一、大數(shù)據(jù)下的概率論與數(shù)理統(tǒng)計概述
(一)大數(shù)據(jù)概念與特點
大數(shù)據(jù)(big data)指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)[1]。大數(shù)據(jù)時代具有三個典型的特點,分別是數(shù)據(jù)量大、數(shù)據(jù)種類多、數(shù)據(jù)分析全面。這三個特點之間具有一定的關(guān)聯(lián)性,由于數(shù)據(jù)量大,在大數(shù)據(jù)中,人們可以通過數(shù)據(jù)獲得各種各樣的信息,通過信息的篩選與分析,能夠得到全面的結(jié)論,因為結(jié)論是通過大量數(shù)據(jù)實踐得到的,因此具有高度的科學(xué)性。在大數(shù)據(jù)時代背景下,概率論與梳理統(tǒng)計也得到了新的發(fā)展。
(二)大數(shù)據(jù)下的概率論與數(shù)理統(tǒng)計
概率論與數(shù)理統(tǒng)計都屬于統(tǒng)計的一部分,自古以來,統(tǒng)計就無處不在,并且緊隨時代的發(fā)展而發(fā)展,在古時候有結(jié)繩記事,如今社會已經(jīng)發(fā)展為大數(shù)據(jù)時代,在大數(shù)據(jù)時代中統(tǒng)計的發(fā)展也有了翻天覆地的變化。概率論與數(shù)理統(tǒng)計的應(yīng)用最早出現(xiàn)于法國,也就是大家都耳熟能詳?shù)馁€徒典故,在大數(shù)據(jù)時代,統(tǒng)計學(xué)得到了新的發(fā)展,概率論與數(shù)理統(tǒng)計也能夠在大數(shù)據(jù)的背景下,發(fā)揮出更加大的作用,是統(tǒng)計能夠有現(xiàn)實的依托,得到的統(tǒng)計數(shù)據(jù)也會更加精確。
概率論是研究隨機現(xiàn)象數(shù)量規(guī)律的數(shù)學(xué)分支。隨機現(xiàn)象是相對于決定性現(xiàn)象而言的。在一定條件下必然發(fā)生某一結(jié)果的現(xiàn)象稱為決定性現(xiàn)象。在生活中,有很多我們常見的常識問題與概率論都有聯(lián)系,比如假設(shè)在標準大氣壓下,純水加熱到100攝氏度時水必然會沸騰等。隨機現(xiàn)象則是指偶然性,當我們想要預(yù)測一件事情發(fā)生的可能性時,通過對其的觀察發(fā)現(xiàn),其結(jié)果具有偶然性,我們難以判斷其出現(xiàn)的結(jié)果是什么,但是可以通過概率進行分析,比如常見的擲硬幣,眾所周知,硬幣有兩面,在正常情況下進行拋擲,可能出現(xiàn)正面或反面[2],我們沒有辦法對其結(jié)果進行預(yù)測,但是正面與反面出現(xiàn)的概率都是50%,因此我們能夠根據(jù)其出現(xiàn)的次數(shù)進行推測,比如在一次實驗中,我們對普通一元硬幣進行拋擲,每次實驗拋擲100次,一共進行4次實驗,實驗結(jié)果如下表1所示。
通過上述實驗可以看出,具有偶然性的事件會根據(jù)概率進行分布,硬幣出現(xiàn)正面次數(shù)與方面的次數(shù)十分接近。
數(shù)理統(tǒng)計是數(shù)學(xué)的一個分支,分為描述統(tǒng)計和推斷統(tǒng)計。它以概率論為基礎(chǔ),研究大量隨機現(xiàn)象的統(tǒng)計規(guī)律性。描述統(tǒng)計的任務(wù)是搜集資料,進行整理、分組,編制次數(shù)分配表,繪制次數(shù)分配曲線,計算各種特征指標,以描述資料分布的集中趨勢、離中趨勢和次數(shù)分布的偏斜度等[3]。
在大數(shù)據(jù)時代背景下,概率論與數(shù)理統(tǒng)計得到了發(fā)展的新契機,受大數(shù)據(jù)本身具有的特點影響,通過收集大數(shù)據(jù),對大數(shù)據(jù)信息進行分析,能夠得到比較優(yōu)的答案,而概率論與數(shù)理統(tǒng)計分析,也是通過概率研究事件發(fā)生的幾率,基于大數(shù)據(jù)的概率論與數(shù)理統(tǒng)計,能夠更加科學(xué),結(jié)果更加精確。
二、大數(shù)據(jù)下概率論與數(shù)理統(tǒng)計的新方法
大數(shù)據(jù)下概率論與數(shù)理統(tǒng)計十分重要,我們以校園教育為例,國家倡導(dǎo)在當今社會中應(yīng)該充分利用大數(shù)據(jù)、大時代、人工智能等特點與優(yōu)勢,積極響應(yīng)國家做好現(xiàn)代化教育的號召。網(wǎng)絡(luò)中的教育資源根據(jù)學(xué)科進行分類,有教案、試卷、素材、課件等等,并且設(shè)有中考專區(qū)、高考專區(qū)、優(yōu)課專區(qū)等,大家也可以通過社區(qū)模塊將自己認為比較好的教育、學(xué)習(xí)資源進行上傳,實現(xiàn)資源共享。資源共享平臺充分的體現(xiàn)出了當前大數(shù)據(jù)時代的優(yōu)勢,當前高校中學(xué)生的生活離不開電腦、智能手機,教師教學(xué)也需要多媒體等方式,數(shù)據(jù)的選擇能夠提高教學(xué)水平,校園管理水平[4]。
由大數(shù)據(jù)背景下學(xué)校教學(xué)管理的改變能夠看出,學(xué)校利用統(tǒng)計學(xué)原理對學(xué)科知識進行統(tǒng)計,以分模塊的方式為學(xué)生的學(xué)習(xí)提供便捷條件,除了在校園之外,生活中、工作中各個方面都能夠應(yīng)用到大數(shù)據(jù)下概率論與數(shù)理統(tǒng)計,因此其十分重要。
在大數(shù)據(jù)背景下,統(tǒng)計學(xué)涌現(xiàn)出很多新的方法,如下:
首先,可視化分析法,大數(shù)據(jù)分析的使用者有大數(shù)據(jù)分析專家,同時還有普通用戶,但是他們二者對于大數(shù)據(jù)分析最基本的要求就是可視化分析,因為可視化分析能夠直觀的呈現(xiàn)大數(shù)據(jù)特點,同時能夠非常容易被讀者所接受,就如同看圖說話一樣簡單明了。比如很多APP具有推薦的功能,就能夠根據(jù)使用者的瀏覽數(shù)據(jù)進行推薦其感興趣的內(nèi)容。
其次,統(tǒng)計分析法,統(tǒng)計與分析主要利用分布式數(shù)據(jù)庫,或者分布式計算集群來對存儲于其內(nèi)的海量數(shù)據(jù)進行普通 的分析和分類匯總等,以滿足大多數(shù)常見的分析需求,在這方面,一些實時性需求會用到EMC的GreenPlum等。
第三,預(yù)測性分析,大數(shù)據(jù)分析最終要的應(yīng)用領(lǐng)域之一就是預(yù)測性分析,從大數(shù)據(jù)中挖掘出特點,通過科學(xué)的建立模型,之后便可以通過模型帶入新的數(shù)據(jù),從而預(yù)測未來的數(shù)據(jù)。比如百度地圖優(yōu)化行車路線,都是根據(jù)大數(shù)據(jù)進行分析,運用新型的統(tǒng)計方法開展的的軟件。
三、大數(shù)據(jù)下概率論與數(shù)理統(tǒng)計的關(guān)系分析
從定義的角度出發(fā)嗎,概率論是對我們看到的事件的隨機性進行分析,研究其發(fā)生的規(guī)律,而數(shù)據(jù)統(tǒng)計是一種方法,其借助于計算機、互聯(lián)網(wǎng)等進行操作,能夠準確的分析大數(shù)據(jù)下事件發(fā)生的概率,并且能夠?qū)κ挛镞M行分類統(tǒng)計,因此概率論屬于真實存在的一種事實,而數(shù)理統(tǒng)計是一種科學(xué)的方法,是針對數(shù)據(jù)進行處理的一種方式。概率論與數(shù)理統(tǒng)計之間有相輔相成的關(guān)系,其主要目的都是對數(shù)據(jù)進行處理,使數(shù)據(jù)能夠具有科學(xué)的意義,并且對現(xiàn)實生活中的問題解決提供依據(jù)。在概率論與數(shù)理統(tǒng)計這兩者之間,前者能夠為后者提供研究的理論基礎(chǔ),而后者又能夠為前者提供數(shù)據(jù)分析,兩者相結(jié)合,能夠使大數(shù)據(jù)的分析更加精確,數(shù)據(jù)處理也能夠更加有意義[5]。
概率論與數(shù)理統(tǒng)計從很早的時候就已經(jīng)開始應(yīng)用了,但是當今社會中的數(shù)據(jù)量已經(jīng)是海量數(shù)據(jù)時代,互聯(lián)網(wǎng)等技術(shù)也在不斷的發(fā)展,傳統(tǒng)的數(shù)據(jù)處理方式難以適應(yīng)當前的海量數(shù)據(jù),因此應(yīng)該選取涉及面比較廣,構(gòu)成數(shù)據(jù)的量比較大的新型處理方式。概率論與數(shù)理統(tǒng)計最早起源與賭博,大數(shù)據(jù)時代為其提供了發(fā)展的基礎(chǔ),數(shù)據(jù)來源比較廣,數(shù)據(jù)的內(nèi)容也比較豐富,采用概率論與數(shù)理統(tǒng)計的方式對數(shù)據(jù)進行處理,有助于數(shù)據(jù)的分析。
當今社會已經(jīng)具備概率論與數(shù)理統(tǒng)計的研究基礎(chǔ),概率論與數(shù)理統(tǒng)計的研究在社會中也具有了應(yīng)用的價值,因此在數(shù)據(jù)分析方面,概率論與數(shù)理統(tǒng)計兩者能夠相互聯(lián)系與支撐。
四、大數(shù)據(jù)下概率論與數(shù)理統(tǒng)計的案例分析
PredPol公司通過與洛杉磯和圣克魯斯的警方以及一群研究人員合作,基于地震預(yù)測算法的變體和犯罪數(shù)據(jù)來預(yù)測犯罪發(fā)生的幾率,可以精確到500平方英尺的范圍內(nèi)。在洛杉磯運用該算法的地區(qū),盜竊罪和暴力犯罪分布下降了33%和21%。通過概率論與數(shù)理統(tǒng)計的方式,我們能了解到盜竊罪和暴力犯罪時有發(fā)生,并且根據(jù)以往的犯罪記錄,我們能夠推測出不同地區(qū)的犯罪率,結(jié)合大數(shù)據(jù)背景,犯罪發(fā)生幾率就能夠得到精確,這就是大數(shù)據(jù)與數(shù)理統(tǒng)計相結(jié)合的優(yōu)勢。
在當今社會中,概率論與數(shù)理統(tǒng)計的應(yīng)用越來越多,比如企業(yè)在經(jīng)營過程中,經(jīng)常會遇到審計問題,企業(yè)中的經(jīng)營項目過多,應(yīng)收賬款的賬目數(shù)據(jù)量過大,在審計的過程中,難以針對每一項的數(shù)據(jù)進行審計,這時就會應(yīng)用概率論與數(shù)理統(tǒng)計的方法進行抽樣調(diào)查,根據(jù)特定的抽樣方式,對賬目信息進行抽取,在對樣本進行審查,能夠有效的審計其賬目的準確性。概率論與數(shù)理統(tǒng)計的應(yīng)用能夠解決生活的很多問題,因此該課題具有較高的研究價值。
總 結(jié)
總而言之,當今社會中有很多企業(yè)都能夠利用大數(shù)據(jù)時代中的數(shù)據(jù)信息對企業(yè)活動作出分析,這種方式能夠使企業(yè)的發(fā)展更加科學(xué)。我們在生活中經(jīng)常會遇到一些難題,在解決難題時經(jīng)常會十分糾結(jié)不知該如何選擇,在大數(shù)據(jù)時代,通過概率論與數(shù)理統(tǒng)計能夠幫助人們在大量數(shù)據(jù)中找到比較正確的解決方法,因此在當今時代中,概率論與數(shù)理統(tǒng)計是一種十分科學(xué)的方法。
參考文獻
[1] 翟雪. 基于大數(shù)據(jù)下概率論與數(shù)理統(tǒng)計的研究與分析[J]. 神州, 2016(8):20-20.
[2] 張薇. 基于大數(shù)據(jù)下概率論與數(shù)理統(tǒng)計的研究與分析[J]. 科研:00032-00033.
[3] 葛明星, 蘇永剛. 數(shù)據(jù)素養(yǎng)與數(shù)學(xué)概念相融合的課改研究——以概率論與數(shù)理統(tǒng)計為例[J]. 數(shù)學(xué)學(xué)習(xí)與研究, 2018(5).
[4] 張麗. 基于MATLAB平臺的商學(xué)院校數(shù)學(xué)教育教學(xué)一體化改革探討[J]. 電腦知識與技術(shù), 2016, 12(19):140-142.
[5] 趙月瑩. 從數(shù)學(xué)思維角度淺析傳統(tǒng)數(shù)學(xué)運算在未來計算機科學(xué)與技術(shù)領(lǐng)域中人工智能方面的應(yīng)用[J]. 中國戰(zhàn)略新興產(chǎn)業(yè) 2018(4).
作者簡介:常鋒強(1983.05 --),男,漢族,本科,中國人民大學(xué)中級,研究方向: 概率論與數(shù)理統(tǒng)計。