徐藝歌
【摘要】? ? 隨著計(jì)算機(jī)、電子通信等現(xiàn)代化信息技術(shù)的迅速發(fā)展和技術(shù)的逐漸成熟,當(dāng)下人類社會(huì)已經(jīng)進(jìn)入到了深化發(fā)展時(shí)期的信息時(shí)代,與之相應(yīng)的就是基于信息時(shí)代下多種現(xiàn)代化信息設(shè)備及技術(shù)而產(chǎn)生的種類豐富多樣、傳播便捷迅速、價(jià)值密度高且總信息量龐大的數(shù)據(jù),即意味著人類社會(huì)進(jìn)程邁入大數(shù)據(jù)時(shí)代,而基于大數(shù)據(jù)時(shí)代背景下數(shù)據(jù)的高效率收集、安全存儲(chǔ)、正確分類處理、具有邏輯性的分析成為了當(dāng)下發(fā)展的熱點(diǎn)以及未來市場潛力挖掘的有效途徑,本文就通過對相關(guān)文獻(xiàn)的閱讀,闡述大數(shù)據(jù)挖掘的有效途徑——統(tǒng)計(jì)學(xué)分析技術(shù)在多領(lǐng)域中的應(yīng)用,以實(shí)現(xiàn)對統(tǒng)計(jì)學(xué)的進(jìn)一步認(rèn)識(shí),為更好的挖掘其價(jià)值發(fā)揮作用。
【關(guān)鍵詞】? ? 大數(shù)據(jù)? ? 統(tǒng)計(jì)學(xué)? ? 應(yīng)用
引言:
隨著信息時(shí)代進(jìn)程的不斷推進(jìn),每個(gè)人所扮演的角色不再僅僅是信息的接收者,同時(shí)也在扮演著信息的發(fā)出者,因此各行各業(yè)會(huì)在日積月累中形成極為龐大的數(shù)據(jù)量,這些數(shù)據(jù)可能會(huì)存在著一些規(guī)律和對某種未來發(fā)展方向的預(yù)測價(jià)值,統(tǒng)計(jì)學(xué)作為一種重要的信息分類方式和價(jià)值挖掘手段,在各個(gè)領(lǐng)域的數(shù)據(jù)分析處理中發(fā)揮了重要的作用,成為極為重要的科研方法之一,本文就從統(tǒng)計(jì)學(xué)分析方法在金融、醫(yī)療、科研、教育等領(lǐng)域中的應(yīng)用進(jìn)行闡述,以實(shí)現(xiàn)對統(tǒng)計(jì)學(xué)分析應(yīng)用的深層了解,與實(shí)際生活應(yīng)用接軌,從而在掌握統(tǒng)計(jì)學(xué)方法的同時(shí)能挖掘出龐大數(shù)據(jù)中的潛在價(jià)值,以實(shí)現(xiàn)各個(gè)領(lǐng)域的創(chuàng)新和再發(fā)展。
一、統(tǒng)計(jì)學(xué)在金融領(lǐng)域中的應(yīng)用
1.1統(tǒng)計(jì)學(xué)在金融投資風(fēng)險(xiǎn)管理中的應(yīng)用
金融投資和股票基金的投資管理都存在著一定的風(fēng)險(xiǎn)。而統(tǒng)計(jì)學(xué)方法在金融領(lǐng)域中的應(yīng)用就可以在極大程度上使得股民和基金購買者在金融投資中規(guī)避風(fēng)險(xiǎn),同時(shí)獲得一定的收益。
例如,通過對金融領(lǐng)域中的指標(biāo)選取,建立市場走勢風(fēng)向標(biāo),利用諸如統(tǒng)計(jì)學(xué)中的馬柯威茨組合理論等分析投資理財(cái)中的損失概率分布、可能獲得收益和與其收益的偏離程度等具有指導(dǎo)價(jià)值的信息,從而得出以何種分散化的投資方法來規(guī)避金融投資風(fēng)險(xiǎn)的風(fēng)險(xiǎn)管理理論[1]。
筆者也嘗試著以股票市場中的上市一周年市盈率、歷史PEG、區(qū)間漲跌、換手率、Wind全A指數(shù)區(qū)間收益率等作為樣本,進(jìn)行統(tǒng)計(jì)學(xué)的因子分析理論處理,以獲得股票投資的紅利價(jià)值指標(biāo)、股票的影響價(jià)值指標(biāo)和投資價(jià)值指標(biāo),如表1所示,獲得了較為滿意的預(yù)測結(jié)果。
1.2統(tǒng)計(jì)學(xué)在金融定向服務(wù)中的應(yīng)用
統(tǒng)計(jì)學(xué)除了可以分析指導(dǎo)金融投資和進(jìn)行風(fēng)險(xiǎn)規(guī)避之外,對金融行業(yè)的業(yè)務(wù)開展也具有重要的意義,例如通過對參與金融業(yè)務(wù)的客戶的工作、收入、家庭等數(shù)據(jù)信息的獲取,建立相應(yīng)的信息庫,并對這些數(shù)據(jù)進(jìn)行分類、關(guān)聯(lián)、聚類、序列模式等分析,以實(shí)現(xiàn)對用戶信用等級(jí)體系的建立以及對客戶履約和投資能力進(jìn)行一定的預(yù)估,評定用戶金融守約能力的同時(shí),也能挖掘潛在的具有更高價(jià)值的客戶,從而實(shí)現(xiàn)對金融交易對象的個(gè)性化、特色化的定向服務(wù),服務(wù)具有針對性,交易的成功率也得以保障。
二、統(tǒng)計(jì)學(xué)在醫(yī)學(xué)領(lǐng)域中的應(yīng)用
2.1統(tǒng)計(jì)學(xué)在醫(yī)學(xué)流行病學(xué)中的應(yīng)用
醫(yī)學(xué)中很多疾病的發(fā)生呈現(xiàn)出一定的傾向性,傾向性可表現(xiàn)為時(shí)間、地域、性別等,因而對這些疾病的發(fā)生數(shù)據(jù)進(jìn)行收集,運(yùn)用統(tǒng)計(jì)學(xué)的離散、中位、均數(shù)等方法分析,從而確認(rèn)這些疾病發(fā)生的季節(jié)性、性別趨勢、年齡段、地域特點(diǎn)等,從而使得疾病的治療和預(yù)防以及篩查工作得以順利的開展,例如普外科的腹疝,兒童好發(fā)斜疝、中老年男性好發(fā)直疝,而中年婦女好發(fā)股疝,這就為腹疝的診斷提供了一定的流行學(xué)診斷依據(jù);胃癌多發(fā)于中年男性,因此中年男性成為胃癌篩查的重點(diǎn)人群;子宮內(nèi)膜癌多表現(xiàn)為女性停經(jīng)后的不規(guī)則流血[2],這為患者疾病的早發(fā)現(xiàn)提供警示作用;冬春季高發(fā)流感,這就為流感的預(yù)防提供了依據(jù)。
2.2統(tǒng)計(jì)學(xué)在醫(yī)學(xué)預(yù)防中的應(yīng)用
統(tǒng)計(jì)學(xué)在醫(yī)學(xué)預(yù)防中的應(yīng)用,主要是針對某種疾病發(fā)生的高危因素的挖掘,從而實(shí)現(xiàn)對這些致病高危因素行為的規(guī)避,以及對具有高危因素群體的疾病篩查、診斷具有提示作用。例如,研究心臟病的危險(xiǎn)因素,選擇指標(biāo)有年齡、性別、體重、最大攝氧量,自變量為患病與否,可先進(jìn)行這些單因素與因變量之間的t檢驗(yàn)或者卡方檢驗(yàn),從而篩掉一些無意義的指標(biāo),再將這些納入的指標(biāo)進(jìn)行二分類Logistic回歸分析[3],最終回歸方程中納入的具有統(tǒng)計(jì)學(xué)意義的指標(biāo)即為與疾病發(fā)生相關(guān)的指標(biāo),連續(xù)變量的OR值意味著自變量每增加一個(gè)單位,疾病發(fā)生風(fēng)險(xiǎn)的增加值,分類變量的OR值則意味著賦值高的指標(biāo)是賦值低的多少倍[4]。如圖1所示,即年齡每上升一歲,疾病發(fā)生的風(fēng)險(xiǎn)就會(huì)增加1.089倍;若女性賦值為0,男性賦值為1,則男性發(fā)病率是女性的7.026倍。
2.3統(tǒng)計(jì)學(xué)在其它多領(lǐng)域中的應(yīng)用
除了上述在醫(yī)療、金融領(lǐng)域的深入應(yīng)用外,統(tǒng)計(jì)學(xué)在其他諸多領(lǐng)域中的應(yīng)用也十分廣泛和成熟,例如在工程領(lǐng)域中,不同的建筑對混凝土的強(qiáng)度需求不同,為了達(dá)到設(shè)計(jì)的標(biāo)準(zhǔn),將混凝土強(qiáng)度進(jìn)行數(shù)學(xué)期望模型的建模,并通過強(qiáng)度的正態(tài)分布以確定可達(dá)標(biāo)的混凝土強(qiáng)度,此外,工程領(lǐng)域中的工程管理和張拉力與油表讀數(shù)也涉及到了統(tǒng)計(jì)學(xué)方法的應(yīng)用[5];統(tǒng)計(jì)學(xué)在產(chǎn)品的個(gè)性化服務(wù)中也發(fā)揮了重要的作用,例如我們用的音樂播放器會(huì)根據(jù)聽歌習(xí)慣進(jìn)行數(shù)據(jù)收集,然后有針對性地推薦用戶可能會(huì)喜歡的歌手或者歌曲,瀏覽器會(huì)根據(jù)瀏覽記錄進(jìn)行相關(guān)新聞推送,購物網(wǎng)站根據(jù)瀏覽記錄推送配套商品等等;統(tǒng)計(jì)學(xué)也在社會(huì)學(xué)、管理學(xué)等諸多領(lǐng)域中發(fā)揮作用,并朝著多學(xué)科融合的方向發(fā)展,在更多領(lǐng)域中發(fā)揮著更重要的作用。
三、結(jié)論
綜上所述,在信息時(shí)代下,數(shù)據(jù)潛在價(jià)值的挖掘?yàn)楦鱾€(gè)領(lǐng)域的創(chuàng)新、健康、穩(wěn)步的發(fā)展創(chuàng)造良好的條件,也提供了有效的途徑,隨著其在多個(gè)領(lǐng)域中應(yīng)用的深入,大數(shù)據(jù)分析也具有更為廣闊的發(fā)展前景和空間,諸如統(tǒng)計(jì)分析等研究方法也將不斷地與時(shí)俱進(jìn),以實(shí)現(xiàn)對未來更龐大、更繁雜、更深層價(jià)值挖掘需求的滿足,從而推動(dòng)人類社會(huì)進(jìn)程翻開新的篇章。
參? 考? 文? 獻(xiàn)
[1].馮瑩.淺談統(tǒng)計(jì)學(xué)在金融及證券領(lǐng)域的應(yīng)用[J].商情,2012(49):1-1.
[2].楊曦,馬珂,吳成.子宮內(nèi)膜癌的流行病學(xué)及高危因素[J].實(shí)用婦產(chǎn)科雜志,2015, 31(7):485-488.
[3].張聰聰.先天性心臟病危險(xiǎn)因素分析[D].復(fù)旦大學(xué),2011.
[4].馮磊,年士艷,趙陽,等.不同分析策略下應(yīng)用二分類Logistic回歸進(jìn)行疾病風(fēng)險(xiǎn)評估的結(jié)果差異性分析[J].中華檢驗(yàn)醫(yī)學(xué)雜志,2018,41(3):232-236.
[5].張毅,余成起.淺談統(tǒng)計(jì)學(xué)在工程中的應(yīng)用[J].四川水泥, 2015(8):91-91.