亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)時代金融專業(yè)數(shù)學(xué)的發(fā)展趨勢

        2014-09-22 02:08:22張瑞亭
        大學(xué)教育 2014年14期
        關(guān)鍵詞:支持向量機機器學(xué)習(xí)數(shù)據(jù)挖掘

        張瑞亭

        [摘 要]隨著科學(xué)技術(shù)的飛速發(fā)展和人們獲取數(shù)據(jù)的多樣化,人類擁有的數(shù)據(jù)急劇增加。在大數(shù)據(jù)時代,數(shù)據(jù)已成為新型戰(zhàn)略資源,是驅(qū)動創(chuàng)新的重要因素。如何獲取隱藏在數(shù)據(jù)背后的潛在的規(guī)律備受研究人員關(guān)注。數(shù)據(jù)挖掘是一門邊緣應(yīng)用學(xué)科,它的蓬勃發(fā)展是由于它在各個領(lǐng)域的廣泛應(yīng)用。結(jié)合金融數(shù)據(jù)的特點以及目前數(shù)據(jù)挖掘、機器學(xué)習(xí)存在的問題,研究未來金融專業(yè)數(shù)學(xué)的發(fā)展方向和動態(tài)趨勢,對于大數(shù)據(jù)時代下培養(yǎng)金融專業(yè)學(xué)生具有十分重要的意義。

        [關(guān)鍵詞]數(shù)據(jù)挖掘 機器學(xué)習(xí) 支持向量機 金融數(shù)據(jù)

        [中圖分類號] F83 [文獻標識碼] A [文章編號] 2095-3437(2014)14-0029-02

        一、背景

        數(shù)據(jù)是與自然資源、人力資源一樣重要的戰(zhàn)略資源,其背后隱含著巨大的經(jīng)濟價值。近年來,“大數(shù)據(jù)”研究已經(jīng)備受關(guān)注。[1]例如,2012年,美國政府在國內(nèi)發(fā)布了“大數(shù)據(jù)”研究和《發(fā)展倡議》,投資約兩億美元發(fā)展大數(shù)據(jù)研究,用以強化國土安全、轉(zhuǎn)變教育學(xué)習(xí)模式和進一步加速科學(xué)和工程領(lǐng)域的創(chuàng)新速度和水平。繼1993年美國宣布“信息高速公路”計劃后,這項決定標志著美國的又一次重大科技發(fā)展部署。美國政府認為“大數(shù)據(jù)”研究勢必對未來的科技、經(jīng)濟等各領(lǐng)域的發(fā)展帶來深遠影響。在大數(shù)據(jù)應(yīng)用的技術(shù)需求牽引下,數(shù)據(jù)科學(xué)研究和人才培養(yǎng)引起了各國的重視。美國哥倫比亞大學(xué)和紐約大學(xué)、澳大利亞悉尼科技大學(xué)、日本名古屋大學(xué)、韓國釜山國立大學(xué)等紛紛成立數(shù)據(jù)科學(xué)研究機構(gòu);美國加州大學(xué)伯克利分校和伊利諾伊大學(xué)香檳分校、英國鄧迪大學(xué)等一大批高校開設(shè)了數(shù)據(jù)科學(xué)課程。

        二、機器學(xué)習(xí)理論

        機器學(xué)習(xí)(machine learning)是繼專家系統(tǒng)之后人工智能應(yīng)用的又一重要研究內(nèi)容,在某種意義上,機器學(xué)習(xí)或?qū)⒄J為是數(shù)據(jù)挖掘的同義詞。數(shù)據(jù)挖掘是指有組織、有目的地收集數(shù)據(jù)、分析數(shù)據(jù),從海量數(shù)據(jù)中尋找潛在規(guī)律,并使之為決策規(guī)劃提供有價值信息的技術(shù)。機器學(xué)習(xí)是人工智能的核心部分,在金融、工業(yè)、商業(yè)、互聯(lián)網(wǎng)以及航天等各個領(lǐng)域均發(fā)揮著重要的作用。對機器學(xué)習(xí)研究的進展,必將對人工智能、數(shù)據(jù)挖掘領(lǐng)域的發(fā)展具有深遠影響。

        機器學(xué)習(xí)方法主要包括:Exper System(專家系統(tǒng))、K-Nearest Neighbor(K近鄰算法)、Decision Tree(決策樹)、Neural Net(神經(jīng)網(wǎng)絡(luò))、Support Vector Machine(支持向量機)、Cluster Analysis(聚類分析)等。近幾年,研究人員將遺傳算法、神經(jīng)網(wǎng)絡(luò)、系統(tǒng)理論以及當(dāng)代數(shù)學(xué)研究的最新進展,應(yīng)用于金融領(lǐng)域。這使得金融領(lǐng)域數(shù)據(jù)挖掘在金融管理中備受青睞。例如,產(chǎn)品定價、金融風(fēng)險管理、投資決策甚至金融監(jiān)管都越來越重視金融數(shù)據(jù)挖掘,通過數(shù)據(jù)挖掘發(fā)現(xiàn)金融市場發(fā)展的潛在規(guī)律與發(fā)展動態(tài)。機器學(xué)習(xí)理論及其在金融領(lǐng)域的應(yīng)用成為了一個比較熱的研究領(lǐng)域。[2] [3]

        三、金融數(shù)據(jù)的特點

        在眾多機器學(xué)習(xí)方法中,基于Logistic回歸、判別分析等傳統(tǒng)的統(tǒng)計方法,對金融模型假定條件非常嚴格,在實際應(yīng)用中很難達到理想效果。其原因在于對金融數(shù)據(jù)的非線性和非平穩(wěn)性的操作具有片面局限性,在實際處理金融數(shù)據(jù)時,既定假設(shè)與金融市場發(fā)展實際并不完全一致,這樣可能會影響模型的推廣能力和泛化能力。

        基于分類樹方法、K-近鄰判別分析、遺傳算法等傳統(tǒng)的非參數(shù)統(tǒng)計方法,其預(yù)測能力較好,但不能量化解釋指標的程度。例如,K-近鄰判別分析是一種非參數(shù)距離學(xué)習(xí)方法,通常按照數(shù)據(jù)樣本之間的距離或相關(guān)系數(shù)進行度量,這樣會受到少數(shù)異常數(shù)據(jù)點的影響。但是,在相同樣本容量下,如果對于具體問題確實存在特定參數(shù)模型可以應(yīng)用時,非參數(shù)方法效率相對較低。以神經(jīng)網(wǎng)絡(luò)、支持向量機等為典型的機器學(xué)習(xí)方法,優(yōu)點在于可以有效處理金融數(shù)據(jù)的非線性特性,并且不需要事先嚴格的統(tǒng)計假設(shè),這樣會表現(xiàn)出較強的適應(yīng)效果,充分體現(xiàn)人工智能、機器學(xué)習(xí)等方法的魅力。神經(jīng)網(wǎng)絡(luò)預(yù)測精度是各種機器學(xué)習(xí)方法中相對較好的,因為在一定程度上,神經(jīng)網(wǎng)絡(luò)可以按照任意精度近似非線性函數(shù),為高度非線性問題的建模和算法提供相應(yīng)支持。盡管神經(jīng)網(wǎng)絡(luò)技術(shù)進步有目共睹,但仍然存在一些難題。例如,通常難以確定隱層節(jié)點數(shù),并會存在“過學(xué)習(xí)”現(xiàn)象和局部極小值等問題。

        四、支持向量機

        傳統(tǒng)的統(tǒng)計模式識別方法是在樣本數(shù)目足夠多的情況下進行的,但是樣本數(shù)目足夠多在實際問題里面往往難以保證。1968年Vapnik等人首次提出了統(tǒng)計學(xué)習(xí)理論,專門從事有限樣本情況下機器學(xué)習(xí)規(guī)律的研究。在此基礎(chǔ)上,1995年Vapnik等人首先提出支持向量機(Support Vector Machine,簡稱SVM)的學(xué)習(xí)方法,它是數(shù)據(jù)挖掘中的一項新的技術(shù)。SVM是機器學(xué)習(xí)研究領(lǐng)域的一項重大成果,主要研究如何根據(jù)有限學(xué)習(xí)樣本進行模式識別和回歸預(yù)測,使在對未知樣本的估計過程中,期望風(fēng)險最小。近年來,它被廣泛地應(yīng)用于統(tǒng)計分類以及回歸分析中。近幾年的研究成果表明,SVM在實用算法研究、設(shè)計和實現(xiàn)方面已取得豐碩的成果,其在理論研究和算法實現(xiàn)方面都有突破性進展,逐漸開始成為克服維數(shù)災(zāi)難和過學(xué)習(xí)等傳統(tǒng)問題的有力手段。支持向量機可以成功處理回歸分析和模式識別等諸多問題,并可推廣于預(yù)測和綜合評價等領(lǐng)域,因此可應(yīng)用于管理、經(jīng)濟等多種學(xué)科。支持向量機屬于一般化線性分類器,可以認為是提克洛夫規(guī)則化(Tikhonov Regularization)方法的一個特例,其特點是他們能夠同時最小化經(jīng)驗誤差與最大化幾何邊緣區(qū)。支持向量機的優(yōu)點表現(xiàn)在:1.它通過使用結(jié)構(gòu)風(fēng)險最小化代替?zhèn)鹘y(tǒng)的經(jīng)驗風(fēng)險最小化,使用滿足Mercer 條件的核函數(shù),把輸入空間的數(shù)據(jù)變換到高維的Hilbert 空間,將向量映射到一個更高維的空間里。在這個空間里建立有一個最大間隔超平面,實現(xiàn)了由輸入空間中的非線性分析到Hilbert 空間中的線性分析。2.訓(xùn)練的復(fù)雜度與輸入空間的維數(shù)無關(guān),只與訓(xùn)練的樣本數(shù)目有關(guān)。3.稀疏性。決定最大間隔超平面的只是少數(shù)向量——支持向量,就推廣能力方面而言, 較少的支持向量數(shù)在統(tǒng)計意義上對應(yīng)好的推廣能力。4.本質(zhì)上,SVM算法是一個二次優(yōu)化問題,能保證所得到的解是全局最優(yōu)的解。綜上所述,SVM在一定程度上解決了以往困擾機器學(xué)習(xí)方法的很多問題,例如,模型選擇與“過學(xué)習(xí)”問題、非線性和高維小樣本等維數(shù)災(zāi)難問題、局部極小問題等。[4]正是由于SVM具有完備的理論基礎(chǔ)和出色的應(yīng)用表現(xiàn),使其在解決高維小樣本、非線性、壓縮感知以及高維模式識別問題中表現(xiàn)出獨特的優(yōu)勢,正成為自神經(jīng)網(wǎng)絡(luò)之后,機器學(xué)習(xí)領(lǐng)域中新的研究熱點之一。[5] [6]endprint

        同其他機器學(xué)習(xí)方法比較,支持向量機更具嚴密的理論基礎(chǔ),因而在模型表現(xiàn)上也略勝一籌,被成功應(yīng)用于模式分類、非線性回歸,從使用效果來看,其結(jié)果較為理想。但從實踐角度分析來看,模型參數(shù)的選擇過度依賴人們的實驗方法和實踐技能,在一定程度上降低了模型的推廣泛化能力和應(yīng)用領(lǐng)域。同時計算方面,訓(xùn)練時間過長、核參數(shù)的確定,在大訓(xùn)練樣本情況下, SVM面臨著維數(shù)災(zāi)難,甚至?xí)捎趦?nèi)存的限制導(dǎo)致無法訓(xùn)練。目前支持向量機在金融數(shù)據(jù)挖掘方面也存在一定的局限性,主要表現(xiàn)以下幾方面:動態(tài)適應(yīng)性、魯棒性、特征變量異質(zhì)性調(diào)整、模型推廣精度等不盡如人意;建模方法與技術(shù)還有待進一步完善;支持向量機研究金融數(shù)據(jù)挖掘和金融問題的成果雖然不少,但大多集中在股票價格和股票市場走勢預(yù)測方面,關(guān)于公司財務(wù)危機預(yù)測、套期保值分析、金融市場連接機制分析及其創(chuàng)新成果方面有待加強。

        五、結(jié)論

        大數(shù)據(jù)時代下金融專業(yè)的數(shù)學(xué)重在以下方面的應(yīng)用:深度學(xué)習(xí)(Deep Learning)、機器學(xué)習(xí)和數(shù)據(jù)挖掘、分布式計算,如MR、Hadoop等,在大數(shù)據(jù)中預(yù)測最先取得突破的技術(shù)環(huán)節(jié)將會是分析中的大數(shù)據(jù)挖掘與關(guān)聯(lián)分析、存儲結(jié)構(gòu)和系統(tǒng)、數(shù)據(jù)采集和數(shù)據(jù)化。目前金融問題的研究方向和發(fā)展趨勢,主要集中在計量經(jīng)濟方法,例如,格蘭杰因果分析、向量自回歸、條件異方差、隨機波動分析等。這些計量經(jīng)濟方法和技術(shù)大部分使用了線性技術(shù),以及與金融市場不太吻合的理論假設(shè),基于這些方法的結(jié)果,例如,資產(chǎn)預(yù)測價格、發(fā)展動態(tài)以及風(fēng)險評估結(jié)果和實際出入較大,影響了金融管理的效率。對于我們大學(xué)教師來說,如何將已有分析數(shù)據(jù)算法整合,讓學(xué)生抓住重點,挖掘到比較可靠的信息或知識,都將成為金融專業(yè)數(shù)學(xué)研究的方向和目標。

        [ 注 釋 ]

        [1] Anand Rajaraman Jeffrey David Ullman.大數(shù)據(jù)——互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理[M].北京:人民郵電出版社,2012.

        [2] Kumar, P.R. and Ravi, V. 2007. Bankruptcy prediction in banks and firms via statistical and intelligent techniques-a review. European Journal of Operational Research, 180(1):1-28.

        [3] M. Oet, R. Eiben, T. Bianco,D.Gramlich, S. Ong, and J.Wang,“SAFE: an early warning system for systemic banking risk,”in Proceedings of the 24th Australasian Finance and BankingConference, SSRN, 2011.

        [4] 沈傳河.金融問題中的支持向量機應(yīng)用研究[D].山東科技大學(xué)博士論文,2011.

        [5] Chang C.C. and Lin, C.J., 2001. LIBSVM: A library for support vector machines.

        [6] 鄧乃揚,田英杰.數(shù)據(jù)挖掘中的新方法——支持向量機[M].北京:科學(xué)出版社,2004.

        [責(zé)任編輯:陳 明]endprint

        猜你喜歡
        支持向量機機器學(xué)習(xí)數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        動態(tài)場景中的視覺目標識別方法分析
        論提高裝備故障預(yù)測準確度的方法途徑
        價值工程(2016年32期)2016-12-20 20:36:43
        基于機器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護中的應(yīng)用
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
        時代金融(2016年27期)2016-11-25 17:51:36
        前綴字母為特征在維吾爾語文本情感分類中的研究
        基于熵技術(shù)的公共事業(yè)費最優(yōu)組合預(yù)測
        價值工程(2016年29期)2016-11-14 00:13:35
        基于支持向量機的金融數(shù)據(jù)分析研究
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        亚洲а∨精品天堂在线| 国产一区二区三区在线影院| 青青草成人在线播放视频| 亚洲国产系列一区二区| 老熟妇乱子伦牲交视频| 国产成熟人妻换╳╳╳╳| 欧美精品久久久久久久自慰| 亚洲性69影视| 亚洲精品国产精品系列| 女同av一区二区三区| 国产精品黄色片在线看| 精品国产性色无码av网站| 三级在线看中文字幕完整版| 一本一本久久a久久精品 | 亚洲专区欧美| 熟女丝袜美腿亚洲一区二区三区 | 亚洲熟女一区二区三区| 不卡高清av手机在线观看| AV熟妇导航网| 国产91大片在线观看| 我和隔壁的少妇人妻hd| 中国农村熟妇性视频| 国产无码夜夜一区二区| 99精品视频69v精品视频免费| 国产一区二区三区尤物| 伊人大杳焦在线| 亚洲最大日夜无码中文字幕| 巨臀精品无码AV在线播放| 国产丝袜美腿嫩模视频诱惑| 久久亚洲精品情侣| 国产乱xxⅹxx国语对白| 亚洲综合色一区二区三区小说| av中文码一区二区三区| 亚洲一区二区三区免费网站 | 国产精品二区三区在线观看| 999zyz玖玖资源站永久| 免费a级毛片无码| 国产福利酱国产一区二区| 女同在线视频一区二区| 久久精品中文少妇内射| 18禁黄网站禁片免费观看|