譚雅藍(lán) 重慶市第八中學(xué)校
引言:現(xiàn)階段,信息的多樣性發(fā)展推動(dòng)了大數(shù)據(jù)時(shí)代的到來(lái),無(wú)論是學(xué)校檔案、圖書館還是交通、企業(yè)財(cái)務(wù)都具有龐大的數(shù)據(jù)流,與此同時(shí)也加大了統(tǒng)計(jì)學(xué)的難度,以往的統(tǒng)計(jì)手段和系統(tǒng)已經(jīng)無(wú)法滿足當(dāng)前形勢(shì)的需求,如何滿足大數(shù)據(jù)處理需求是統(tǒng)計(jì)行業(yè)亟待解決的問(wèn)題。
大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)相比,其重點(diǎn)在于“大”,也就是說(shuō)數(shù)據(jù)量的龐大和復(fù)雜是其主要特點(diǎn),與傳統(tǒng)數(shù)據(jù)在性質(zhì)上還是相同的。大數(shù)據(jù)形勢(shì)下的統(tǒng)計(jì)學(xué)需要有強(qiáng)大的信息采集、整合和處理能力,每個(gè)步驟既相互獨(dú)立,又密切關(guān)聯(lián)。而大數(shù)據(jù)與統(tǒng)計(jì)學(xué)之間是相互促進(jìn)又相互制約的關(guān)系,統(tǒng)計(jì)學(xué)在大數(shù)據(jù)時(shí)代面臨的挑戰(zhàn)主要表現(xiàn)為以下幾個(gè)方面:
大數(shù)據(jù)時(shí)代的特點(diǎn)為規(guī)?;?、系統(tǒng)化、多樣化,而信息資源的獲取方式也豐富多樣。當(dāng)時(shí)當(dāng)前形勢(shì)下,我國(guó)在統(tǒng)計(jì)學(xué)領(lǐng)域使用的手段還過(guò)于守舊,無(wú)法滿足大數(shù)據(jù)時(shí)代的要求,加大了信息管理的難度。也就是說(shuō)大數(shù)據(jù)環(huán)境給統(tǒng)計(jì)學(xué)提出了更高的要求,這是挑戰(zhàn)之一[1]。另外,電子信息的進(jìn)步與統(tǒng)計(jì)軟件之間的不平衡也是阻礙統(tǒng)計(jì)學(xué)發(fā)展的因素之一,這使由于很多軟件都是隨著計(jì)算機(jī)技術(shù)的發(fā)展而衍生出來(lái)的,具有一定的局限性,內(nèi)容為使用已有模板來(lái)優(yōu)化統(tǒng)計(jì)步驟,從而提升工作質(zhì)量和效率。現(xiàn)階段,我國(guó)主要用于統(tǒng)計(jì)的軟件有SAS、stata、SPSS等等,想要迎合大數(shù)據(jù)時(shí)代的發(fā)展還需要不斷改進(jìn)和完善,達(dá)到優(yōu)化傳輸和存儲(chǔ)數(shù)據(jù)的目的。所以,軟件設(shè)計(jì)者要加強(qiáng)統(tǒng)計(jì)工具的創(chuàng)新和升級(jí),并將軟件系統(tǒng)和商務(wù)網(wǎng)絡(luò)相連,便于用戶更新和下載,從而提高軟件的利用率。
在統(tǒng)計(jì)過(guò)程中,樣本起著至關(guān)重要的作用,其主要作用是對(duì)數(shù)據(jù)進(jìn)行整合分析并發(fā)現(xiàn)數(shù)量之間的關(guān)系和特點(diǎn),而數(shù)據(jù)信息的實(shí)際價(jià)值決定了樣本的選擇和使用。大數(shù)據(jù)的發(fā)展使樣本的選用更為困難。第一,這種環(huán)境下,數(shù)據(jù)規(guī)模的龐大使人們既想探究數(shù)據(jù)信息的涵義,又想掌握數(shù)據(jù)信息的由來(lái),而以往的統(tǒng)計(jì)方法無(wú)法滿足這些要求,這就急需轉(zhuǎn)變統(tǒng)計(jì)學(xué)的方法,從而滿足人們的使用需求。第二,數(shù)據(jù)的規(guī)模性、復(fù)雜性和分散性在一定程度上限制了樣本選取和使用,相比于傳統(tǒng)工作范圍更廣且界定不夠明確。第三,隨著電子商務(wù)和網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,數(shù)據(jù)也在日益遞增,很多信息內(nèi)容都值得考究,但是網(wǎng)絡(luò)平臺(tái)的數(shù)據(jù)大多缺少規(guī)律性,與統(tǒng)計(jì)學(xué)要求的條理、邏輯、結(jié)構(gòu)不符,這導(dǎo)致很多有實(shí)際意義的數(shù)據(jù)無(wú)法得到有效利用。
統(tǒng)計(jì)學(xué)在大數(shù)據(jù)環(huán)境下正面臨著巨大的挑戰(zhàn),因此,要盡量革新統(tǒng)計(jì)結(jié)構(gòu),滿足當(dāng)前形勢(shì)的需求,達(dá)到準(zhǔn)確選取和分析數(shù)據(jù)的目的。
由于大數(shù)據(jù)時(shí)代的變革,統(tǒng)計(jì)學(xué)領(lǐng)域也在不斷創(chuàng)新發(fā)展,以往的統(tǒng)計(jì)手段僅能使用一臺(tái)計(jì)算機(jī)處理數(shù)據(jù),現(xiàn)代化的統(tǒng)計(jì)方法可以充分利用多臺(tái)計(jì)算機(jī),以移動(dòng)硬盤為操作基礎(chǔ),實(shí)現(xiàn)數(shù)據(jù)信息的匯總分析,使數(shù)據(jù)流更為清晰具體,而各種復(fù)雜分散的信息都可以通過(guò)系統(tǒng)進(jìn)行整合歸納,工作效率和質(zhì)量都有所提高。除此之外,數(shù)據(jù)的種類正隨著時(shí)代的發(fā)展不斷增多,而統(tǒng)計(jì)手段也迎合了社會(huì)的需求正趨于多樣化,未來(lái)的發(fā)展前景是不可限量的。
各領(lǐng)域的進(jìn)步致使數(shù)據(jù)呈現(xiàn)規(guī)模化、復(fù)雜化、分散化發(fā)展形態(tài),這也是大數(shù)據(jù)時(shí)代生成的原因,而這個(gè)時(shí)代的到來(lái)也改變了人們的生活、工作和學(xué)習(xí)。例如人們使用網(wǎng)絡(luò)查詢信息時(shí)可以利用搜索功能,系統(tǒng)會(huì)在短時(shí)間內(nèi)將整合的信息傳達(dá)到網(wǎng)頁(yè)上,便于人們?yōu)g覽或?qū)W習(xí)[2]。預(yù)處理數(shù)據(jù)的概念是對(duì)一些缺少規(guī)律性的復(fù)雜數(shù)據(jù)進(jìn)行整理,遵循了隨機(jī)抽樣原則,步驟為先篩選,再糾正,最后對(duì)數(shù)據(jù)進(jìn)行查缺補(bǔ)漏,通過(guò)這個(gè)流程可以將統(tǒng)計(jì)數(shù)據(jù)在使用之前無(wú)用信息就得到剔除,錯(cuò)誤數(shù)據(jù)可以得到改正而缺失的信息可以在第一時(shí)間得到補(bǔ)充,確保信息的高效性、準(zhǔn)確性和完整性,有利于數(shù)據(jù)的有效使用和共享傳播。
以往的統(tǒng)計(jì)數(shù)據(jù)在選取歸納以及使用是都具有局限性,具體表現(xiàn)為數(shù)據(jù)處理量偏小且精確性不夠,并且人為統(tǒng)計(jì)很容易受到外界因素的影響,與現(xiàn)代化統(tǒng)計(jì)學(xué)相比比較容易出現(xiàn)誤差,極有可能達(dá)不到預(yù)期的結(jié)果。而大數(shù)據(jù)時(shí)代的到來(lái)推動(dòng)了統(tǒng)計(jì)學(xué)的發(fā)展,在現(xiàn)代化技術(shù)的支持下可將數(shù)據(jù)轉(zhuǎn)換壓縮并投入使用,從各個(gè)步驟上來(lái)看都縮短了工作時(shí)間,還可以針對(duì)影響因素創(chuàng)建動(dòng)態(tài)信息模型,使統(tǒng)計(jì)模型可以滿足各種類型數(shù)據(jù)的處理需求,減少不匹配情況的發(fā)生。
由于以往的工作中統(tǒng)計(jì)基數(shù)較大,對(duì)于樣本的選用浪費(fèi)了大量的時(shí)間和人力,但大數(shù)據(jù)要求抽樣方式的革新,可以先講數(shù)據(jù)打亂混合,不用擔(dān)心所選取的數(shù)據(jù)過(guò)于隨機(jī),而抽樣的數(shù)據(jù)樣本都是經(jīng)過(guò)仔細(xì)篩選而得,具有一定的代表價(jià)值,這樣采集使用的數(shù)據(jù)信息可以省時(shí)省力,且周期短、代表性強(qiáng),有助于以往抽樣方法的創(chuàng)新和發(fā)展。
結(jié)論:總而言之,大數(shù)據(jù)環(huán)境下的統(tǒng)計(jì)學(xué)面臨著嚴(yán)峻的挑戰(zhàn),與此同時(shí)大數(shù)據(jù)也給統(tǒng)計(jì)行業(yè)帶來(lái)了發(fā)展機(jī)遇。統(tǒng)計(jì)學(xué)是實(shí)用性強(qiáng)的一門學(xué)科,在各行各業(yè)中都占據(jù)著重要的地位,所以統(tǒng)計(jì)學(xué)的改革和創(chuàng)新一定要滿足時(shí)代的要求,在數(shù)據(jù)的處理上要確保質(zhì)量和效率,這樣才能給各行業(yè)的規(guī)劃、調(diào)控提供理論上的支持。