唐小勇 李小春
摘 要: 大數(shù)據(jù)時代的統(tǒng)計思維、相關(guān)概念、研究對象發(fā)生了重大的改變,因此,應(yīng)更新教學內(nèi)容,轉(zhuǎn)變思維模式,提升計算機技能來培養(yǎng)適應(yīng)大數(shù)據(jù)時代的優(yōu)秀人才。
關(guān)鍵詞:大數(shù)據(jù) 概率論 教學
引言
隨著高等教育由精英教育向大眾教育的轉(zhuǎn)型,高等教育在滿足社會精英人才需求的同時,還應(yīng)該培養(yǎng)適應(yīng)社會現(xiàn)代化發(fā)展的應(yīng)用型本科人才。作為本科院校大多數(shù)專業(yè)的公共數(shù)學基礎(chǔ)課程之一的《概率論》,一直在自然科學、社會科學、工程技術(shù)、經(jīng)濟生活等領(lǐng)域起著重要的作用。不同于其它兩門公共數(shù)學基礎(chǔ)課程《高等數(shù)學》、《線性代數(shù)》是研究確定性現(xiàn)象的數(shù)學分支,《概率論計》是研究隨機現(xiàn)象的數(shù)據(jù)規(guī)律的一門學科。所謂的隨機現(xiàn)象指的是事前不可預言的現(xiàn)象,需要在大量的數(shù)據(jù)中找出某種規(guī)律,然后對這種規(guī)律提出合理的假設(shè),再對這種假設(shè)進行檢驗,最后根據(jù)這種規(guī)律來預測未來的發(fā)展趨勢。不同于自然科學等存在的客觀現(xiàn)象,社會生活中廣泛存在著隨機現(xiàn)象,因此,概率論也成為處理隨機現(xiàn)象的最好工具。但是,隨著“云時代”的到臨,大數(shù)據(jù)受到越來越多的關(guān)注。根據(jù)研究機構(gòu)Gartner給出的定義,大數(shù)據(jù)是需要新處理模式才能有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應(yīng)海量、高增長率和多樣化的信息資產(chǎn)。根據(jù)IBM提出的有關(guān)大數(shù)據(jù)的特征,它具有“5V”的特征:規(guī)模性(Volume)、高速性(Velocity)、多樣性(Variety)、低價值密度性(Value)、真實性(Veracity)。而隨著大數(shù)據(jù)大規(guī)模的被廣泛使用,不僅僅很多學者和研究機構(gòu)也開始關(guān)注這個問題,各國政府以及企業(yè)也非常重視大數(shù)據(jù)的挖掘工作。大數(shù)據(jù)所隱藏的價值信息不但成為很多行業(yè)贏得競爭的關(guān)鍵,還對國家的穩(wěn)定發(fā)展具有重大的戰(zhàn)略意義。為此,李克強總理在2015年9月簽批《促進大數(shù)據(jù)發(fā)展行動綱要》,綱要明確提出在未來5到10年推動大數(shù)據(jù)的發(fā)展和應(yīng)用。[1]
但是,大數(shù)據(jù)的數(shù)據(jù)特征使得傳統(tǒng)的統(tǒng)計學方法不一定再使用,傳統(tǒng)的統(tǒng)計學理論需要更新。因此,與之相對應(yīng)的《概率論》課程的教學也需要進行改革。
一、大數(shù)據(jù)與傳統(tǒng)統(tǒng)計學
大數(shù)據(jù)給統(tǒng)計學帶來了新的機遇,但也帶來了一些新的挑戰(zhàn),一些經(jīng)典的統(tǒng)計學分析在大數(shù)據(jù)中已經(jīng)完全失效。因此,在大數(shù)據(jù)時代背景下,傳統(tǒng)統(tǒng)計學應(yīng)該如何發(fā)展?相關(guān)統(tǒng)計學課程又應(yīng)當做怎樣的教學改革,這都是統(tǒng)計學家與教學工作者很關(guān)注的問題。
1.相關(guān)性與因果性。舍恩伯格等在《大數(shù)據(jù)時代》中提到:“相關(guān)關(guān)系比因果關(guān)系更好地了解這個世界”,這種區(qū)別于傳統(tǒng)數(shù)學研究“因果關(guān)系”的現(xiàn)象引起了更多國外學者的關(guān)注。數(shù)據(jù)之間的相關(guān)關(guān)系的研究,使得人們對于世界的認識有一個更為開放的信息系統(tǒng)視覺,對事物的認識不再局限于封閉的領(lǐng)域。比如淘寶每年在11.11日舉辦的光棍節(jié)大促銷活動,淘寶官網(wǎng)通過hadoop數(shù)據(jù)平臺,對2011-2015年的淘寶全網(wǎng)數(shù)據(jù)分析,發(fā)現(xiàn)中國人在八大行業(yè)如時尚美妝、家電數(shù)碼、食品、服裝等方面消費較多,而且對這八大行業(yè)給出了行業(yè)發(fā)展趨勢報告。而且,通過個體的消費偏好、消費金額等數(shù)據(jù),利用相關(guān)性原理,以計算機強大的分析能力來尋找個體購物的最優(yōu)的關(guān)聯(lián)物。很多網(wǎng)站也涌現(xiàn)出大數(shù)據(jù)相關(guān)性的應(yīng)用成果,不需要個體自行搜索,系統(tǒng)根據(jù)歷史記錄,自動給出可視化的數(shù)據(jù)新聞。
雖然大數(shù)據(jù)分析的相關(guān)性研究的結(jié)果價值不凡,但相關(guān)性不能反應(yīng)出事物之間的本質(zhì)關(guān)系,只能反映出數(shù)據(jù)之間的關(guān)系。還有就是事物之間的相關(guān)性并不能替代事物之間的因果關(guān)系,因為基于相關(guān)分析的結(jié)果只是反映出事物之間的關(guān)聯(lián)性,說明事物間有某種相同的變化趨勢,但是事物之間可能并不存在因果關(guān)系。故如果做決策分析時,直接采用相關(guān)性的結(jié)論,可能會導致決策失誤。
2.總體、個體、樣本
總體、個體、樣本是統(tǒng)計學中最基本的概念,也是統(tǒng)計學中最重要的關(guān)系,幾乎所有的統(tǒng)計理論都是從這三個概念出發(fā)而發(fā)展出來的?,F(xiàn)有的統(tǒng)計學中,總體指的是具有某種共同屬性的組成的集合,個體指的是集合中的每個元素,即是符合總體屬性的個別事物,是數(shù)據(jù)的承擔者或是來源者,樣本指的是從總體中隨機抽取的每個元素組成的集合。統(tǒng)計學研究的是總體的發(fā)展規(guī)律,但由于一些客觀原因如人力、物力的限制,無法來研究總體的發(fā)展規(guī)律,就從總體中隨機抽樣出一部分樣本,通過對樣本的研究來探討出總體的發(fā)展規(guī)律。所以,在一般的統(tǒng)計學中,其研究的邏輯路線是:先確定好研究的對象,然后研究每個個體的性質(zhì),從中找出所需的變量或者研究指標,然后再抽樣獲取所需變量的具體數(shù)據(jù),進而根據(jù)這些數(shù)據(jù)通過統(tǒng)計分析得出結(jié)論,然后對結(jié)論進行檢驗。這種思路,很顯然是先確定總體,再由總體來確定研究所需的數(shù)據(jù)。但是,在大數(shù)據(jù)背景下,先看到的是數(shù)據(jù)而不是數(shù)據(jù)的承擔者,特別是網(wǎng)絡(luò)化時代當中的數(shù)據(jù),根本無法得知數(shù)據(jù)的來源以及數(shù)據(jù)的基本特征,呈現(xiàn)出來的除了數(shù)據(jù)本身之外并無其他東西。這就導致大多數(shù)情況下直接面對全體數(shù)據(jù),原來傳統(tǒng)統(tǒng)計學中的抽樣以及統(tǒng)計理論完全失效了。[2]
舍恩伯格等在《大數(shù)據(jù)時代》中也提出,大數(shù)據(jù)的“大”不僅僅是數(shù)據(jù)體量的大,更重要的是數(shù)據(jù)結(jié)構(gòu)本身的重大改變。因此,他們在書中提出“要全體不要抽樣的”觀點。因為大數(shù)據(jù)可提供所有數(shù)據(jù)本身的信息,通過數(shù)據(jù)不但可以研究事物之間的普遍性規(guī)律,還可以具體研究個體的特征信息。但是,對舍恩伯格的“不需要樣本”的觀點,很多人持懷疑態(tài)度。因為在探索性的大數(shù)據(jù)分析中,抽樣分析仍然需要,只是功能會發(fā)生改變。而且,從動態(tài)的來看,大數(shù)據(jù)只是某個時刻的總體而已,后面時刻總要包含前面時刻的總體,那么,前面時刻的大數(shù)據(jù)也只是后面時刻大數(shù)據(jù)的一個樣本而已。所以,即使大數(shù)據(jù)的總體、樣本的關(guān)系發(fā)生了改變,但抽樣分析還是必不可少的,只是需要構(gòu)建新的方法而已。
三、大數(shù)據(jù)時代下統(tǒng)計學教學的思考
大數(shù)據(jù)時代下,傳統(tǒng)的統(tǒng)計學思維模式發(fā)生了改變,一些統(tǒng)計理論需要構(gòu)建,新的軟件需要學習。因此,在大數(shù)據(jù)背景下,概率論的教學該怎樣進行?這是每個數(shù)學教師所面臨的問題。
1.改變思維模式。由于大數(shù)據(jù)研究的事物對象發(fā)生了改變,直接面對全體數(shù)據(jù)本身,因此,統(tǒng)計思維模式也應(yīng)跟著變化。在大數(shù)據(jù)時代下,數(shù)據(jù)不僅僅是研究對象,還是研究的基礎(chǔ)資源,數(shù)據(jù)本身可以反映出事物之間的關(guān)系,還可以協(xié)助解決其他問題。所以,在現(xiàn)行的統(tǒng)計課堂上,需要改變統(tǒng)計思維模式。對數(shù)據(jù)的看法需要改變,從原來的研究對象來確定數(shù)據(jù)轉(zhuǎn)變成通過數(shù)據(jù)來研究事物對象。通過對數(shù)據(jù)的掌握與分析,來進一步揭示事物的本質(zhì)關(guān)系。
2.更新教學內(nèi)容。由于大數(shù)據(jù)當中的研究對象發(fā)生改變,抽樣的理論需要重新構(gòu)建,傳統(tǒng)數(shù)學當中的確定性關(guān)系不再至關(guān)重要,事物之間的相關(guān)性比因果性更重要,等等這些方法與概念的重新推導與定義,都需要更新教學內(nèi)容。而且,在傳統(tǒng)概率論教學中,重公式推導輕數(shù)值計算。所以,在大數(shù)據(jù)時代下,數(shù)學的理論推導應(yīng)該讓步與數(shù)值計算,統(tǒng)計學課程的設(shè)定應(yīng)該更加重視應(yīng)用層面的知識,應(yīng)該培養(yǎng)學生解決實際問題的能力。
3.重視計算機技能。大數(shù)據(jù)時代下,一些傳統(tǒng)的統(tǒng)計軟件解決不了的問題,可以在新的軟件下得以實現(xiàn)。而且大數(shù)據(jù)需要的是統(tǒng)計知識與計算機技能的結(jié)合,學生除掌握基本的統(tǒng)計理論外,還應(yīng)該熟練操作計算機。運用計算機與統(tǒng)計方面的知識把數(shù)據(jù)整合在一起進行分析,轉(zhuǎn)化成可以分析的統(tǒng)計數(shù)據(jù),并對數(shù)據(jù)的結(jié)果進行解釋,這些都需要加強學生的計算機技能的培養(yǎng)。
在大數(shù)據(jù)時代下,數(shù)據(jù)比黃金還重要,但如何把這些數(shù)據(jù)轉(zhuǎn)化成所需要的知識,這還需要統(tǒng)計學的教學得到改變。因此,教師應(yīng)該針對現(xiàn)實社會人才的需求狀況,積極改革統(tǒng)計學的教學,來培養(yǎng)出適應(yīng)時代發(fā)展的優(yōu)秀人才。
參考文獻
[1] 李小平. 概率論與數(shù)理統(tǒng)計[M].北京:高等教育出版社, 2013.
[2] 馬雙鴿,方匡南.大數(shù)據(jù)時代統(tǒng)計學發(fā)展的若干問題[J].統(tǒng)計研究,2017,1:5-11.
作者簡介
唐小勇(1973-),男,湖南洞口人,博士,副教授,湖南農(nóng)業(yè)大學信息科學技術(shù)學院教師,研究方向為大數(shù)據(jù)技術(shù),高等教育理論.
通訊作者
李小春(1979-),男,湖南新邵人,副教授,湖南農(nóng)業(yè)大學經(jīng)濟學院在讀博士,研究方向為農(nóng)業(yè)經(jīng)濟理論,數(shù)學教育理論.