亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基金關(guān)聯(lián)特征提取的大數(shù)據(jù)隨機(jī)搜索算法及應(yīng)用

        2020-04-14 03:22:28袁先智劉海洋周云鵬嚴(yán)誠(chéng)幸李欣鵬郭鐵信錢(qián)國(guó)騏
        管理科學(xué) 2020年6期
        關(guān)鍵詞:業(yè)績(jī)準(zhǔn)則關(guān)聯(lián)

        袁先智,劉海洋,周云鵬, 嚴(yán)誠(chéng)幸,馮 馳 李欣鵬,李 波,郭鐵信,錢(qián)國(guó)騏,曾 途

        1 成都大學(xué) 商學(xué)院,成都 610106 2 廣西大學(xué) 商學(xué)院,南寧 530004 3 中山大學(xué) 管理學(xué)院,廣州 510275 4 成都數(shù)聯(lián)銘品科技有限公司,成都 610041 5 中國(guó)平安財(cái)產(chǎn)保險(xiǎn)股份有限公司 蘇州分公司,江蘇 蘇州 215006 6 山東大學(xué) 中泰證券金融研究院,濟(jì)南 250100 7 重慶理工大學(xué) 理學(xué)院,重慶 400054 8 中南大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,長(zhǎng)沙 410083 9 墨爾本大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,墨爾本 VIC3010

        引言

        2016年9月11日,中國(guó)證監(jiān)會(huì)頒布并實(shí)行《公開(kāi)募集證券投資基金運(yùn)作指引第2號(hào)——基金中基金指引》,為基金中基金(fund of fund,FOF)的市場(chǎng)化和規(guī)范化鋪平了道路,進(jìn)一步豐富了中國(guó)金融產(chǎn)品體系,為投資者提供更多的選擇。FOF通過(guò)遴選優(yōu)質(zhì)基金構(gòu)建基金池來(lái)實(shí)現(xiàn)提高收益、降低風(fēng)險(xiǎn)和降低費(fèi)用的目的,因此如何選取優(yōu)質(zhì)基金成為構(gòu)建FOF基金池的核心要素之一。從SHARPE[1]建立基于風(fēng)險(xiǎn)和收益的基金評(píng)價(jià)指標(biāo),到BARBER et al.[2]從基金自身以外的因素對(duì)基金業(yè)績(jī)的影響的研究,以及GALAGEDERA et al.[3]建立的三階段多維度基金績(jī)效網(wǎng)絡(luò)評(píng)估方法,已有研究都將挖掘基金業(yè)績(jī)的有效信息作為重要的研究方向?;鹗袌?chǎng)的迅速發(fā)展,學(xué)術(shù)界和應(yīng)用領(lǐng)域?qū)鹂?jī)效的探討層出不窮。由于數(shù)據(jù)存儲(chǔ)技術(shù)和網(wǎng)絡(luò)技術(shù)的進(jìn)步,金融科技領(lǐng)域的數(shù)據(jù)量級(jí)飛速增長(zhǎng)?,F(xiàn)有的社會(huì)網(wǎng)絡(luò)中存在大量的信息,信息量大、密度低且來(lái)自不同維度,因此對(duì)于數(shù)據(jù)的融合處理變得尤為重要,而在大數(shù)據(jù)框架下從多維度數(shù)據(jù)提取出影響基金績(jī)效強(qiáng)弱的特征和方法的研究還很少見(jiàn)。鑒于上述背景,本研究以2018年Wind基金評(píng)級(jí)無(wú)缺失的701個(gè)債券型基金作為樣本,從基金自身、基金經(jīng)理和基金公司3個(gè)維度出發(fā),結(jié)合海量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)構(gòu)建刻畫(huà)基金特征的基礎(chǔ)指標(biāo)體系;特別是在5%(基于抽樣樣本2倍的標(biāo)準(zhǔn)方差)的誤差容忍度下使用基于馬爾科夫鏈蒙特卡洛的吉布斯抽樣方法[4]對(duì)與基金業(yè)績(jī)相關(guān)的特征進(jìn)行深入挖掘,提出提取基金特征的有效方法,篩選出與基金業(yè)績(jī)有關(guān)聯(lián)的特征指標(biāo);利用比值比,即在邏輯回歸模型中以自然對(duì)數(shù)為底數(shù)的回歸系數(shù)的指數(shù)函數(shù),對(duì)篩選出的特征指標(biāo)進(jìn)行相關(guān)性分類;使用受試者工作特征曲線[5]對(duì)篩選后的特征指標(biāo)對(duì)基金業(yè)績(jī)的預(yù)測(cè)能力進(jìn)行系統(tǒng)分析。本研究提出在多種可以影響基金業(yè)績(jī)的特征因子且存在觀測(cè)樣本數(shù)據(jù)不全的情況下,如何有效進(jìn)行特征提取,實(shí)現(xiàn)構(gòu)建FOF基金池的一般方法論,為支持業(yè)界針對(duì)FOF建立優(yōu)質(zhì)基金池提供了一種新的思路,也為更多學(xué)者探討影響基金績(jī)效的指標(biāo)特征提供新的分析方法。

        1 相關(guān)研究評(píng)述

        SHARPE[1]建立了基于基金風(fēng)險(xiǎn)和收益的基金績(jī)效評(píng)價(jià)指標(biāo)——夏普比率,通過(guò)對(duì)美國(guó)34家共同基金的研究表明,基金績(jī)效具有一定持續(xù)性,即基金現(xiàn)有業(yè)績(jī)對(duì)基金未來(lái)業(yè)績(jī)產(chǎn)生影響;VIDAL-GARCA et al.[6]基于時(shí)間序列模型對(duì)35個(gè)不同國(guó)家的共同基金樣本的研究表明,基金的績(jī)效表現(xiàn)在統(tǒng)計(jì)和經(jīng)濟(jì)意義上具有一定的持續(xù)性,特別是對(duì)于排名靠前和靠后的國(guó)家的共同基金?;鹂?jī)效表現(xiàn)也受到基金規(guī)模的影響,ELTON et al.[7]和YIN[8]的研究表明,基金規(guī)模過(guò)大會(huì)帶來(lái)流動(dòng)性問(wèn)題等,從而侵蝕基金業(yè)績(jī);梁珊等[9]通過(guò)實(shí)驗(yàn)研究發(fā)現(xiàn),開(kāi)放式股票型基金規(guī)模對(duì)基金選股能力和基金平均風(fēng)格收益存在倒U形的影響。關(guān)于基金費(fèi)率對(duì)基金業(yè)績(jī)影響的研究,一般認(rèn)為較高的費(fèi)用代表基金管理者個(gè)人投入多、實(shí)力強(qiáng),基金投資管理能力也應(yīng)該較好,投資業(yè)績(jī)較佳。還有學(xué)者關(guān)注基金業(yè)績(jī)與基金資金流量之間的關(guān)系以及對(duì)贖回異象進(jìn)行分析,即基金的凈資金流隨基金業(yè)績(jī)的增長(zhǎng)而下降[10],但也有研究表明基金業(yè)績(jī)與資金流量之間具有正相關(guān)關(guān)系[11-12]。

        除了基金自身的因素外,基金經(jīng)理的個(gè)人特質(zhì)、職業(yè)特質(zhì)和能力特質(zhì)等也影響基金的業(yè)績(jī)?;鸾?jīng)理的個(gè)人特質(zhì)方面,BARBER et al.[2]的研究表明,男性基金經(jīng)理比女性基金經(jīng)理交易更加頻繁,進(jìn)而帶來(lái)的交易成本的增加使男性基金經(jīng)理的收益率較低;ESHRAGHI et al.[13]認(rèn)為基金經(jīng)理的自信與基金業(yè)績(jī)存在倒U形關(guān)系;BODNARUK et al.[14]的研究結(jié)果表明,基金業(yè)績(jī)與基金經(jīng)理的風(fēng)險(xiǎn)厭惡程度存在相關(guān)性?;鸾?jīng)理的職業(yè)特質(zhì)方面,HAN et al.[15]的研究表明團(tuán)隊(duì)管理的基金比單一經(jīng)理的基金業(yè)績(jī)更好;徐瓊等[16]發(fā)現(xiàn)排名靠前的基金經(jīng)理平均任職時(shí)間相對(duì)較長(zhǎng),反映出投資經(jīng)驗(yàn)豐富的基金經(jīng)理在提高基金業(yè)績(jī)和風(fēng)險(xiǎn)控制方面具有一定的競(jìng)爭(zhēng)優(yōu)勢(shì)?;鸾?jīng)理的能力特質(zhì)方面,CHEVALIER et al.[17]采用橫截面法研究基金經(jīng)理個(gè)人特征對(duì)基金業(yè)績(jī)的影響,在被解釋變量中加入體現(xiàn)基金風(fēng)格的代理變量,結(jié)果表明管理基金業(yè)績(jī)與基金經(jīng)理畢業(yè)院校和成績(jī)高度相關(guān),是否有MBA學(xué)歷對(duì)基金業(yè)績(jī)影響不顯著。

        基金公司特征對(duì)基金業(yè)績(jī)也產(chǎn)生影響?;鸸窘?jīng)營(yíng)規(guī)模反映了基金公司的整體實(shí)力,通常認(rèn)為基金公司規(guī)模越龐大,實(shí)力越雄厚,旗下基金數(shù)量越多,基金整體水平可能越高,存在規(guī)模效應(yīng)[18-19]。但ELTON et al.[7]認(rèn)為基金公司規(guī)模越大,每只基金獲得的支持和資源越分散,最終對(duì)基金產(chǎn)生負(fù)面影響?;鸸径聲?huì)的強(qiáng)監(jiān)管也將給基金的業(yè)績(jī)帶來(lái)積極的影響[20],ADAMS et al.[21]的研究證實(shí)獨(dú)立董事比例高的基金公司旗下基金的業(yè)績(jī)表現(xiàn)更好。此外基金公司的歷史業(yè)績(jī)表現(xiàn)也對(duì)基金未來(lái)業(yè)績(jī)產(chǎn)生影響,SIALM et al.[22]的研究證實(shí)經(jīng)營(yíng)不善的基金公司旗下的基金即使表現(xiàn)良好,也難以帶來(lái)足夠的新資金,同時(shí)面臨極高的基金經(jīng)理流失率。中國(guó)部分學(xué)者也專門(mén)對(duì)機(jī)構(gòu)投資者的投資特征與企業(yè)和市場(chǎng)之間的聯(lián)動(dòng)關(guān)系進(jìn)行研究分析[23-25]。

        綜合上述研究,刻畫(huà)優(yōu)質(zhì)基金的指標(biāo)可能來(lái)自于多個(gè)方面的多個(gè)特征,因此通過(guò)模型方法篩選優(yōu)質(zhì)基金面臨可選特征維度過(guò)高的問(wèn)題(即維數(shù)災(zāi)難),不同維度的特征給分析基金業(yè)績(jī)帶來(lái)難度。PREMACHANDRA et al.[26]利用二階段DEA網(wǎng)絡(luò)模型建立基金的績(jī)效評(píng)估方法,GALAGEDERA et al.[3]進(jìn)一步將評(píng)估方法拓展到三階段DEA網(wǎng)絡(luò)模型,但該方法仍然是基于多個(gè)指標(biāo)的基金績(jī)效評(píng)估方法,并未解決如何提取基金績(jī)效關(guān)聯(lián)特征。

        在金融科技領(lǐng)域,對(duì)多維數(shù)據(jù)的特征信息(特別是包含非結(jié)構(gòu)化數(shù)據(jù)特征信息的信息集)進(jìn)行特征挖掘和提取的方法較少?;鸬奶卣鞣N類繁多,與基金相關(guān)的海量數(shù)據(jù)中包含非結(jié)構(gòu)化的文本或圖形特征,用傳統(tǒng)方法難以在大量數(shù)據(jù)中進(jìn)行有效的量化篩選等。本研究結(jié)合金融科技領(lǐng)域目前的數(shù)據(jù)現(xiàn)狀,利用隨機(jī)搜索算法提取基金績(jī)效關(guān)聯(lián)特征,是不同于已有研究的一個(gè)方向。在大數(shù)據(jù)隨機(jī)搜索算法方面,AGRAWAL et al.[27]提出關(guān)聯(lián)規(guī)則的概念和APRIORI算法,認(rèn)為動(dòng)機(jī)是針對(duì)購(gòu)物籃分析問(wèn)題。但在搜索關(guān)聯(lián)規(guī)則空間時(shí)要實(shí)現(xiàn)這些算法在計(jì)算上非常困難,規(guī)則空間隨著特征數(shù)的增加呈指數(shù)級(jí)擴(kuò)大。之后諸多學(xué)者都對(duì)關(guān)聯(lián)規(guī)則挖掘問(wèn)題進(jìn)行了大量的理論探索、算法改進(jìn)和設(shè)計(jì),特別是基于隨機(jī)搜索方法及相關(guān)的應(yīng)用方面做了許多工作,如在吉布斯抽樣方法的研究和應(yīng)用方面,除GEMAN et al.[28]、SCHWARZ[29]和QIAN et al.[30]進(jìn)行了一系列基礎(chǔ)性工作外,QIAN et al.[31]提出基于吉布斯采樣構(gòu)建的算法,在不損失信息的情況下大大減少了后續(xù)挖掘的規(guī)則空間,并在之后利用基于吉布斯抽樣方法,針對(duì)貝葉斯多變點(diǎn)問(wèn)題進(jìn)行研究。另外,GLASSERMAN[32]利用馬爾科夫鏈蒙特卡洛方法在計(jì)量金融方面進(jìn)行了大量的應(yīng)用研究,NARISETTY et al.[33]探討一種用于支持模型選擇的一致可伸縮吉布斯抽樣算法。但是比較全面的、基于隨機(jī)搜索方法對(duì)影響基金業(yè)績(jī)的關(guān)聯(lián)特征指標(biāo)方面的系統(tǒng)性研究和方法目前并不多,特別是在大數(shù)據(jù)范疇下以多維度數(shù)據(jù)信息為出發(fā)點(diǎn),并在設(shè)定控制誤差容忍度(如不大于5%)情形下,建立與基金業(yè)績(jī)強(qiáng)弱關(guān)聯(lián)關(guān)系的特征因子提取和分類的工作更是少見(jiàn)。因此,本研究希望找出影響基金業(yè)績(jī)的特征因子的提取、篩選并分類的方法,將分類樣本按相關(guān)性排序,從而基于FOF優(yōu)質(zhì)基金池,構(gòu)建針對(duì)基金篩選的一般方法。

        2 大數(shù)據(jù)隨機(jī)搜索算法

        2.1 基金業(yè)績(jī)相關(guān)特征提取的基本思路

        本研究的重點(diǎn)是建立針對(duì)影響基金業(yè)績(jī)的主要特征指標(biāo)的提取方法。需要指出的是,提取影響基金業(yè)績(jī)的特征不是基于傳統(tǒng)計(jì)量回歸分析工具直接實(shí)現(xiàn)的,本研究要考慮存在多種可能影響基金業(yè)績(jī)的特征因子,同時(shí)還面臨樣本觀測(cè)量不足的客觀現(xiàn)實(shí)困難,在這樣的前提下,需要采用新的方法和路徑實(shí)現(xiàn)特征提取。

        通常情況下,假定有M個(gè)可能影響基金業(yè)績(jī)的變量,最基本的篩選方法是考慮所有可能的組合情形。但對(duì)這種考慮所有可能組合的方法,即使只考慮線性組合,也至少有2M次的判斷處理,這就是典型的NP問(wèn)題[34]。另外,如果使用統(tǒng)計(jì)回歸分析方法,可能出現(xiàn)建模時(shí)支持M個(gè)自變量的統(tǒng)計(jì)推斷模型方法面臨樣本觀測(cè)量不足的問(wèn)題,特別是大數(shù)據(jù)場(chǎng)景下海量數(shù)據(jù)與有限樣本觀測(cè)量之間的矛盾。為了解決NP問(wèn)題和樣本觀測(cè)量不足的困難,從20世紀(jì)50年代開(kāi)始,在馬爾科夫鏈蒙特卡洛模擬框架下的吉布斯抽樣方法日趨流行和發(fā)展起來(lái),其實(shí)質(zhì)是通過(guò)隨機(jī)搜索的思想[4],可以解決上面提到的NP問(wèn)題以及樣本觀測(cè)量數(shù)據(jù)不足前提下的許多實(shí)踐和應(yīng)用問(wèn)題。吉布斯抽樣方法也在最近30多年中得到極大發(fā)展,如GLASSERMAN[32]的研究。

        本研究在馬爾科夫鏈蒙特卡洛框架下,利用吉布斯抽樣方法建立影響基金業(yè)績(jī)的特征因子的提取方法。假設(shè)任意一個(gè)變量是否與基金業(yè)績(jī)存在關(guān)聯(lián)性服從伯努利分布(僅包含存在關(guān)聯(lián)性和不存在關(guān)聯(lián)性兩種結(jié)果),伯努利分布的參數(shù)可表示為一個(gè)變量與基金業(yè)績(jī)存在關(guān)聯(lián)的顯著性(以下簡(jiǎn)稱關(guān)聯(lián)顯著性)。為了計(jì)量關(guān)聯(lián)顯著性,首先,本研究隨機(jī)從備選變量集合中選擇一個(gè)子集I0進(jìn)行建模,擬合基金業(yè)績(jī)指標(biāo),本研究選擇以Wind評(píng)級(jí)作為業(yè)績(jī)?cè)u(píng)價(jià)標(biāo)準(zhǔn);其次,采用AIC準(zhǔn)則[35]或BIC準(zhǔn)則[28]構(gòu)造馬爾科夫鏈蒙特卡洛中的狀態(tài)轉(zhuǎn)移概率,保證用于構(gòu)建模型的特征子集始終能向擬合優(yōu)度更高的方向轉(zhuǎn)移,最終每一個(gè)變量被選入特征子集的概率(非條件概率)隨著模擬次數(shù)的增加而穩(wěn)定于一個(gè)特定的值,這個(gè)值即為各個(gè)變量關(guān)聯(lián)顯著性的理論值;最后,由馬爾可夫鏈的性質(zhì)可知,進(jìn)行吉布斯抽樣抽取的初始特征子集I0不會(huì)影響最終的模擬結(jié)果。同時(shí),在特征因子與基金業(yè)績(jī)是否存在關(guān)聯(lián)性服從伯努利分布的假定下,為了使吉布斯抽樣結(jié)果的誤差不大于5%,本研究設(shè)定控制樣本誤差需要的隨機(jī)抽樣樣本量為400,這就解決了特征空間復(fù)雜度高而且觀測(cè)樣本不足的問(wèn)題,同時(shí)將NP問(wèn)題通過(guò)吉布斯抽樣方法中的隨機(jī)搜索轉(zhuǎn)化為多項(xiàng)式復(fù)雜度問(wèn)題,從而減少計(jì)算的復(fù)雜度,即在觀測(cè)樣本數(shù)量有限的條件下,通過(guò)吉布斯抽樣方法,基于AIC準(zhǔn)則或BIC準(zhǔn)則構(gòu)造轉(zhuǎn)移矩陣,對(duì)特征因子的所有情況(構(gòu)建成的冪集)進(jìn)行篩選,得出與基金業(yè)績(jī)相關(guān)的特征集,基于比值比的指標(biāo)分類方法,提高了指標(biāo)的可解釋性。

        2.2 基于吉布斯抽樣方法支持下的影響基金業(yè)績(jī)的特征因子提取方法

        影響基金業(yè)績(jī)的因素非常多,如何在指標(biāo)復(fù)雜、觀測(cè)數(shù)據(jù)有限的前提下平衡模型的可靠性和可解釋性,是一個(gè)比較困難的工作。QIAN et al.[30]首次在特征挖掘過(guò)程中使用吉布斯抽樣方法,給出大數(shù)據(jù)框架下進(jìn)行特征篩選的方向。本研究采用的基金業(yè)績(jī)特征篩選方法正是在這一方法基礎(chǔ)上,使其能夠?qū)鹑趫?chǎng)景做出實(shí)時(shí)、準(zhǔn)確、有效和可解釋的全面分析。在此基礎(chǔ)上,建立一種基于馬爾科夫鏈蒙特卡洛框架下的吉布斯抽樣算法,以比值比作為驗(yàn)證標(biāo)準(zhǔn)參數(shù),實(shí)現(xiàn)基金績(jī)效關(guān)聯(lián)特征的提取和分類,從而支持FOF基金池的構(gòu)建。提取影響基金業(yè)績(jī)的特征因子的主要流程如下:

        第1步 建立基準(zhǔn)模型,構(gòu)建初始特征集合。

        在篩選特征之前,根據(jù)基金的三分類確定基礎(chǔ)模型,本研究基于Softmax函數(shù)建立評(píng)價(jià)基金的模型,基于模型初步篩選部分特征作為初始特征,隨機(jī)抽取一個(gè)特征子集,即

        I0=(0,1,1,…,0)∈{0,1}k

        (1)

        其中,I0為在初始特征中隨機(jī)抽取的一個(gè)特征子集,k為在初始特征樣本中存在的特征數(shù)。初始模型中系數(shù)不為0的特征記為1,系數(shù)為0的特征記為0。

        第2步 基于AIC準(zhǔn)則和BIC準(zhǔn)則構(gòu)建特征分布函數(shù),即構(gòu)建支持隨機(jī)抽樣的標(biāo)準(zhǔn)。

        PC(js=1|J-s)

        (2)

        其中,PC(js=1|J-s)為概率分布函數(shù),s為特征數(shù),js為第s個(gè)特征,J-s為除第s個(gè)特征之外全部特征的組合,IC為J-s的確定值。由于特征的復(fù)雜性,本研究無(wú)法直接構(gòu)建概率分布函數(shù)PC(J),因此嘗試基于AIC準(zhǔn)則和BIC準(zhǔn)則構(gòu)建指標(biāo)轉(zhuǎn)移概率函數(shù)PAIC(J)和PBIC(J),分別基于AIC準(zhǔn)則和BIC準(zhǔn)則構(gòu)建兩組條件概率分布函數(shù),目的是在最后一步中比較兩者的模型效果。條件概率分布函數(shù)可表示為

        (3)

        第3步 確定抽樣次數(shù),若進(jìn)行有限次重復(fù)抽樣關(guān)聯(lián)顯著性的誤差,可根據(jù)(4)式進(jìn)行計(jì)量,即

        (4)

        其中,Std(p)為特征頻率的標(biāo)準(zhǔn)差;p為某一變量的關(guān)聯(lián)顯著性;t為抽樣次數(shù),t=0,1,2,…,M。在樣本特征的吉布斯抽樣中假定所有樣本特征服從伯努利分布,可以表示抽樣誤差。

        若按照2-sigma準(zhǔn)則控制模擬誤差,為了保持提取特征的顯著性,通常需要使模擬誤差控制在0.05以內(nèi),則由(4)式可知需要進(jìn)行400次抽樣。這里,n-sigmia等于n個(gè)單位的標(biāo)準(zhǔn)差Std(p),n=1,2,或3。若選用更嚴(yán)格的誤差控制準(zhǔn)則(如3-sigma準(zhǔn)則)或縮小誤差控制范圍,則需要更多的抽樣次數(shù)。本研究使用2-sigma準(zhǔn)則控制模擬誤差,可以在保證顯著性的同時(shí)降低計(jì)算的復(fù)雜度。

        確定好最大抽樣次數(shù)M后,進(jìn)行吉布斯抽樣,具體過(guò)程如下:

        (2)對(duì)s循環(huán)進(jìn)行抽樣,s=1,2,…,k,有

        (5)

        (3)得到(J(1),J(2),…,J(M))。

        第4步 計(jì)算特征頻率,并篩選入模指標(biāo)。

        第5步 構(gòu)建最終分析模型并進(jìn)行模型效果測(cè)試。

        選擇關(guān)聯(lián)顯著性大于某個(gè)設(shè)定水平(根據(jù)實(shí)際工作的需要設(shè)定)的特征指標(biāo)建立邏輯回歸模型,分別在訓(xùn)練集合和測(cè)試集合中檢驗(yàn)?zāi)P偷男Ч?。比較使用AIC構(gòu)建分布函數(shù)的模型與使用BIC構(gòu)建分布函數(shù)的模型結(jié)果,根據(jù)比較結(jié)果確定最優(yōu)模型。

        3 基金業(yè)績(jī)關(guān)聯(lián)的特征刻畫(huà)

        3.1 基金樣本的選取和劃分

        由于基金業(yè)績(jī)與市場(chǎng)整體走勢(shì)相關(guān),同時(shí)考慮到數(shù)據(jù)樣本的豐富性,本研究選取2018年Wind基金評(píng)級(jí)無(wú)缺失的701個(gè)債券型基金作為樣本,用于特征挖掘和分類模型構(gòu)建。訓(xùn)練集和測(cè)試集的樣本中好、中、壞3個(gè)等級(jí)的樣本比率相同,并按照3:1的比例將總樣本劃分為訓(xùn)練集(526個(gè)樣本)和測(cè)試集(175個(gè)樣本)。在本研究的分析中,訓(xùn)練集將用于特征挖掘、模型的參數(shù)估計(jì)和模型效果的初步檢驗(yàn),測(cè)試集將用于模型效果的最終檢驗(yàn)及壞樣本的閾值劃定。

        通常從基金的投資收益和風(fēng)險(xiǎn)角度測(cè)量基金業(yè)績(jī)。綜合考慮基金投資收益和風(fēng)險(xiǎn)的指標(biāo)中較為經(jīng)典的3個(gè)指標(biāo)為詹森指數(shù)、夏普比率、特雷諾比率[36-37]。目前多家評(píng)級(jí)機(jī)構(gòu)和學(xué)者都提出了較新的業(yè)績(jī)?cè)u(píng)價(jià)體系和方法,這些方法基本都是對(duì)傳統(tǒng)經(jīng)典方法的拓展和改進(jìn)。為了使分析結(jié)果符合中國(guó)市場(chǎng)的一般規(guī)律,本研究根據(jù)基金業(yè)績(jī)將基金分為好、中、壞三檔,這3個(gè)檔次是基于萬(wàn)得資訊提出的Wind基金評(píng)級(jí)給出。Wind基金評(píng)級(jí)建立在投資者風(fēng)險(xiǎn)偏好基礎(chǔ)上,通過(guò)投資者的風(fēng)險(xiǎn)厭惡指數(shù)對(duì)基金收益進(jìn)行調(diào)整定義萬(wàn)得風(fēng)險(xiǎn)調(diào)整收益(簡(jiǎn)稱WRAR),再根據(jù)WRAR的相對(duì)排名將基金劃分為5個(gè)等級(jí),即一星至五星,一星最差,五星最好。本研究基于Wind評(píng)級(jí)對(duì)基金業(yè)績(jī)進(jìn)行重新劃分,將評(píng)級(jí)為一星的定義為壞基金,將評(píng)級(jí)為二星和三星的定義為中基金,將評(píng)級(jí)為四星和五星的定義為好基金。

        3.2 初始特征指標(biāo)池的建立

        通過(guò)梳理已有研究可以發(fā)現(xiàn),基金本身、基金經(jīng)理、基金公司等維度的特征將對(duì)基金業(yè)績(jī)產(chǎn)生影響?;鸨旧韺用?,如前文所述,基金歷史業(yè)績(jī)能夠?qū)鹞磥?lái)業(yè)績(jī)產(chǎn)生影響,基金規(guī)模過(guò)大帶來(lái)流動(dòng)性問(wèn)題等,從而侵蝕基金業(yè)績(jī)。因此,基金的投資結(jié)構(gòu)、風(fēng)險(xiǎn)指標(biāo)和其他關(guān)聯(lián)特征也有可能對(duì)基金業(yè)績(jī)產(chǎn)生影響[38],特別是面臨行情變化時(shí)前兩者對(duì)基金業(yè)績(jī)的影響就顯得較為重要。從基金經(jīng)理的角度出發(fā),趙秀娟等[39]認(rèn)為基金經(jīng)理的經(jīng)驗(yàn)和能力與基金業(yè)績(jī)之間存在正相關(guān)關(guān)系。所以,本研究將基金經(jīng)理的個(gè)人特質(zhì)、職業(yè)特質(zhì)和業(yè)績(jī)指標(biāo)納入與基金業(yè)績(jī)有關(guān)聯(lián)的特征指標(biāo)池。

        通過(guò)對(duì)基金業(yè)績(jī)相關(guān)特征的梳理,結(jié)合業(yè)界的實(shí)踐經(jīng)驗(yàn),本研究將基金公司維度特征從經(jīng)營(yíng)規(guī)模、財(cái)務(wù)指標(biāo)、經(jīng)營(yíng)能力、基本信息和股權(quán)結(jié)構(gòu)等方面進(jìn)行初始特征分類,形成基金初始特征?;?個(gè)維度的基金初始特征見(jiàn)表1,有58個(gè)3級(jí)指標(biāo)的特征都有可能對(duì)基金業(yè)績(jī)產(chǎn)生不同程度的影響,每個(gè)指標(biāo)包含不同基金、不同時(shí)間段的數(shù)據(jù),最終形成初始指標(biāo)數(shù)據(jù)池。

        3.3 基金關(guān)聯(lián)特征的提取和解讀

        本研究基于基金業(yè)績(jī)較好和較差的特征分類,第1步采用吉布斯算法從58個(gè)初步特征中篩選出36個(gè)與基金業(yè)績(jī)之間存在顯著關(guān)聯(lián)性的特征。第2步使用這些特征建立三分類邏輯回歸模型,以邏輯回歸模型中各個(gè)特征的比值比作為測(cè)量特征與基金業(yè)績(jī)的關(guān)聯(lián)顯著性的標(biāo)準(zhǔn)。然后與使用全部58個(gè)特征構(gòu)建的三分類邏輯回歸模型進(jìn)行對(duì)比,以驗(yàn)證提煉出的特征結(jié)果的表現(xiàn)程度。

        應(yīng)用比值比對(duì)特征與基金業(yè)績(jī)(好或者不好)的關(guān)聯(lián)性強(qiáng)弱進(jìn)行定義,規(guī)則如下:

        (1)較強(qiáng)關(guān)聯(lián)。對(duì)應(yīng)特征的比值比小于0.800或大于1.200時(shí),此特征為與基金業(yè)績(jī)(好或者不好)的關(guān)聯(lián)性較強(qiáng);

        表1 基金初始特征Table 1 Initial Features of Funds

        續(xù)表1

        (2)一般關(guān)聯(lián)。對(duì)應(yīng)特征的比值比大于等于1.100且小于等于1.200或比值比大于等于0.800且小于等于0.900時(shí),此特征為與基金業(yè)績(jī)(好或者不好)的關(guān)聯(lián)性一般;

        (3)較弱關(guān)聯(lián)。對(duì)應(yīng)特征的比值比大于0.900且小于1.100時(shí),此特征為與基金業(yè)績(jī)(好或者不好)的關(guān)聯(lián)性較弱。

        基于上面的特征分析和對(duì)應(yīng)好壞基金的特征刻畫(huà),本研究根據(jù)36個(gè)特征與基金業(yè)績(jī)的關(guān)聯(lián)性強(qiáng)弱劃分為強(qiáng)相關(guān)特征、一般相關(guān)特征和弱相關(guān)特征3類,分類結(jié)果見(jiàn)表2。

        由表2可知,①?gòu)?qiáng)相關(guān)特征有16個(gè),它們對(duì)基金業(yè)績(jī)較好和較差都呈現(xiàn)出較強(qiáng)關(guān)聯(lián)性;②一般相關(guān)特征有9個(gè),它們包含兩類:第1類為對(duì)于基金業(yè)績(jī)較差的呈現(xiàn)較強(qiáng)關(guān)聯(lián)而對(duì)基金業(yè)績(jī)較好的呈現(xiàn)出弱關(guān)聯(lián)的特征,第2類為在基金業(yè)績(jī)較差和較好中都呈現(xiàn)出一般關(guān)聯(lián)的特征;③弱相關(guān)特征有11個(gè),它們對(duì)基金業(yè)績(jī)較差的呈現(xiàn)出較弱關(guān)聯(lián)。

        需要說(shuō)明的是,本研究中強(qiáng)相關(guān)特征、一般相關(guān)特征和弱相關(guān)特征的定義是基于特征與基金業(yè)績(jī)的關(guān)聯(lián)性強(qiáng)弱定義的,因此使用相關(guān)性命名,從而與上文中使用的關(guān)聯(lián)性區(qū)別開(kāi)來(lái)。

        對(duì)基于吉布斯抽樣得到的特征進(jìn)行分析可以發(fā)現(xiàn),強(qiáng)相關(guān)特征與一般相關(guān)特征都能從基金評(píng)價(jià)的業(yè)務(wù)邏輯層面得到解釋。例如,16個(gè)強(qiáng)相關(guān)特征和9個(gè)一般相關(guān)特征從投資表現(xiàn)、風(fēng)險(xiǎn)管理、團(tuán)隊(duì)能力和公司經(jīng)營(yíng)狀況4個(gè)方面反映了基金業(yè)績(jī)。

        表2 特征提取結(jié)果Table 2 Results for Features Extraction

        (1)投資表現(xiàn)。投資表現(xiàn)是能夠最直接從收益率中反映的,平均收益率和幾何平均年化收益率反映基金的投資表現(xiàn),凈資產(chǎn)收益率反映基金在投資過(guò)程中對(duì)于杠桿的運(yùn)用能力。

        (2)風(fēng)險(xiǎn)管理。測(cè)量基金管理團(tuán)隊(duì)成績(jī)的一個(gè)重要標(biāo)準(zhǔn)就是最大回撤,它體現(xiàn)了管理團(tuán)隊(duì)對(duì)于風(fēng)險(xiǎn)的控制能力。在本研究的初始特征池中,基金風(fēng)險(xiǎn)等級(jí)也是一個(gè)能有效反應(yīng)風(fēng)險(xiǎn)管理能力的特征。在中國(guó)證券投資基金大致可以分為股票型、債券型和混合型,僅有混合型基金能夠有效地利用各種不同的資產(chǎn)進(jìn)行風(fēng)險(xiǎn)分散和對(duì)沖,因此基金類型也能夠有效反映基金的風(fēng)險(xiǎn)管理能力。

        (3)團(tuán)隊(duì)能力。投資表現(xiàn)和風(fēng)險(xiǎn)管理可以有效反映基金管理團(tuán)隊(duì)的能力,但這兩個(gè)方面都要經(jīng)過(guò)一段時(shí)間的任職才能觀測(cè)到?;鸾?jīng)理的個(gè)人經(jīng)歷可以在其上任之前為我們提供關(guān)于管理團(tuán)隊(duì)能力的信息,基金經(jīng)理學(xué)歷和基金經(jīng)理最大工作年限兩個(gè)指標(biāo)從定性角度為刻畫(huà)基金經(jīng)理能力提供了信息,學(xué)歷較低和工作年限較短且風(fēng)格青澀的基金經(jīng)理很難領(lǐng)導(dǎo)一個(gè)優(yōu)秀的基金管理團(tuán)隊(duì);基金經(jīng)理曾任職基金公司數(shù)量越多,通常意味著其工作更換比較頻繁,有可能顯示出其工作能力難以領(lǐng)導(dǎo)基金管理團(tuán)隊(duì);團(tuán)隊(duì)穩(wěn)定性能夠?yàn)橥顿Y策略和風(fēng)險(xiǎn)管理流程帶來(lái)更好的一致性。

        (4)公司經(jīng)營(yíng)狀況?;饒F(tuán)隊(duì)的表現(xiàn)可以反映出公司的經(jīng)營(yíng)狀態(tài)。董監(jiān)高平均任期和成立年限反映基金公司的日常經(jīng)營(yíng)的穩(wěn)定性;公司獲獎(jiǎng)較多和托管費(fèi)率較低反映基金公司在行業(yè)中的口碑和商務(wù)運(yùn)營(yíng)能力較強(qiáng);基金公司旗下基金數(shù)量多意味著基金公司規(guī)模較大,也能反映出基金公司經(jīng)營(yíng)狀況的穩(wěn)定性;浮動(dòng)管理費(fèi)率和費(fèi)率優(yōu)惠反映基金團(tuán)隊(duì)的薪酬激勵(lì)方式,浮動(dòng)管理費(fèi)率和費(fèi)率優(yōu)惠越高基金管理團(tuán)隊(duì)的收入與其投資表現(xiàn)的關(guān)系越密切,這也反映了基金團(tuán)隊(duì)對(duì)于自身能力的自信。

        4 實(shí)證分析

        4.1 數(shù)據(jù)使用說(shuō)明

        本研究使用邏輯回歸模型對(duì)測(cè)試集中較差的基金檢驗(yàn)特征篩選效果。首先,使用篩選得到的36個(gè)特征進(jìn)行邏輯回歸建模,并與使用初始特征集中所有58個(gè)特征建立的邏輯回歸模型的效果進(jìn)行比較,再比較使用不同的數(shù)據(jù)處理方法和建模方法的模型效果,從而找出最佳的建模方案。

        對(duì)于分類模型,本研究希望其能在準(zhǔn)確預(yù)測(cè)出壞樣本的基礎(chǔ)上盡可能少地將好樣本歸類為壞樣本,因此使用ROC曲線分析進(jìn)行模型檢驗(yàn)。

        4.2 數(shù)據(jù)測(cè)試結(jié)果

        本研究使用假陽(yáng)率(false positive ration,FPR)為0.100和0.200時(shí)的真陽(yáng)率(true positive ratio,TPR)測(cè)量模型效果,將其分為6個(gè)級(jí)別的分類標(biāo)準(zhǔn),見(jiàn)表3。

        表3 ROC分類標(biāo)準(zhǔn)Table 3 ROC Standard of Classification

        測(cè)試集的模型檢驗(yàn)結(jié)果見(jiàn)表4,模型1~模型4分別表示使用相應(yīng)的特征集合及建模方法得出的模型效果,4個(gè)模型的ROC曲線見(jiàn)圖1(a)~圖1(d)。圖中,橫軸為假陽(yáng)率,表示非壞樣本被歸類為壞樣本的比率;縱軸為真陽(yáng)率,表示被識(shí)別出的壞樣本在所有壞樣本中所占比例。由圖1可知,模型1訓(xùn)練集的ROC曲線表現(xiàn)得很好,但測(cè)試集的ROC曲線表現(xiàn)與訓(xùn)練集的ROC曲線有較大差距,且不如模型2測(cè)試集合的ROC曲線,說(shuō)明模型1的預(yù)測(cè)能力不佳,可能存在過(guò)擬合現(xiàn)象。模型2~模型4各自訓(xùn)練集和測(cè)試集的ROC曲線表現(xiàn)較為一致,反映出模型能夠有效刻畫(huà)基金的表現(xiàn),模型3和模型4有更好的刻畫(huà)能力。

        表4 測(cè)試集的模型檢驗(yàn)結(jié)果Table 4 Model Validation Results for the Test Set

        (a)模型1

        (b)模型2

        (c)模型3

        (d)模型4

        由表4可知,模型2在假陽(yáng)率為0.100和0.200時(shí),其真陽(yáng)率都比模型1高,證明風(fēng)險(xiǎn)基因篩選得到的36個(gè)特征能夠有效刻畫(huà)基金的表現(xiàn),但模型效果仍未達(dá)標(biāo)。模型3在假陽(yáng)率為0.100和0.200時(shí),其真陽(yáng)率都比模型2高,模型效果達(dá)到Ⅱ-a級(jí)標(biāo)準(zhǔn)。由此可以看出,對(duì)篩選特征中的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行歸一化處理比對(duì)所有特征都做標(biāo)簽化處理更有利于建模,說(shuō)明針對(duì)多維數(shù)據(jù)進(jìn)行特征提取再進(jìn)行分類對(duì)模型效果具有顯著的提升。模型4在假陽(yáng)率為0.100和0.200時(shí),其真陽(yáng)率都比模型3低,模型效果達(dá)到Ⅱ-b級(jí)標(biāo)準(zhǔn),由此可以看出,二分類邏輯回歸對(duì)壞樣本的識(shí)別效率略優(yōu)于三分類邏輯回歸。

        綜上所述,對(duì)比模型1與模型2的效果可知,本研究用大數(shù)據(jù)特征提取方法得到的特征子集能夠更有效地識(shí)別較差的基金。對(duì)比模型2與模型3的效果可知,對(duì)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行歸一化處理,對(duì)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行標(biāo)簽化處理,模型檢驗(yàn)效果有非常顯著的提升。對(duì)比模型3與模型4可知,在對(duì)某一類(較差)基金進(jìn)行識(shí)別的建模工作中,二分類邏輯回歸與多分類邏輯回歸模型的效果差異不大,在本研究中二分類邏輯回歸因其計(jì)算復(fù)雜度較低而體現(xiàn)出優(yōu)勢(shì)。

        本研究在評(píng)價(jià)模型時(shí)已經(jīng)確定了對(duì)假陽(yáng)率的容忍度為0.200,則可以按照假陽(yáng)率為0.200時(shí)對(duì)應(yīng)的邏輯回歸概率設(shè)置判定的閾值,閾值設(shè)定結(jié)果見(jiàn)表5。

        表5 邏輯回歸概率閾值Table 5 Threshold of Logistic Regression Probability

        根據(jù)4個(gè)模型的ROC表現(xiàn),當(dāng)模型的假陽(yáng)率控制在0.200以內(nèi),使真陽(yáng)率達(dá)到最大時(shí)的概率閾值都在0.100左右。

        4.3 穩(wěn)定性檢驗(yàn)

        本研究使用AIC準(zhǔn)則和BIC準(zhǔn)則構(gòu)建馬爾科夫鏈篩選特征,將按比值比分類后的結(jié)果進(jìn)行比較。使用AIC準(zhǔn)則和BIC準(zhǔn)則進(jìn)行特征篩選的流程與上文相同。

        使用AIC準(zhǔn)則進(jìn)行特征篩選得到37個(gè)特征,經(jīng)過(guò)比值比分類,有20個(gè)特征與基金業(yè)績(jī)強(qiáng)相關(guān),有9個(gè)特征與基金業(yè)績(jī)一般相關(guān),剩余8個(gè)特征與基金業(yè)績(jī)?nèi)跸嚓P(guān),特征篩選的結(jié)果見(jiàn)表6。

        使用BIC準(zhǔn)則進(jìn)行特征篩選得到18個(gè)特征,經(jīng)過(guò)比值比分類,有10個(gè)特征與基金業(yè)績(jī)強(qiáng)相關(guān),有5個(gè)特征與基金業(yè)績(jī)一般相關(guān),其余3個(gè)特征與基金業(yè)績(jī)?nèi)跸嚓P(guān),特征篩選的結(jié)果見(jiàn)表7。

        與使用邏輯回歸模型預(yù)測(cè)準(zhǔn)確性評(píng)分篩選特征的結(jié)果(表2)相比,使用AIC準(zhǔn)則進(jìn)行特征篩選得到的強(qiáng)相關(guān)特征更多,而使用AIC準(zhǔn)則和BIC準(zhǔn)則進(jìn)行特征篩選得到的弱相關(guān)特征都比邏輯回歸模型進(jìn)行特征篩選得到的結(jié)果要少。

        由表4可知,使用篩選后的特征子集,并對(duì)其中的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行歸一化處理,對(duì)其中的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行標(biāo)簽化處理后,可以使邏輯回歸模型對(duì)壞基金的識(shí)別效果達(dá)到最佳。使用AIC準(zhǔn)則和BIC準(zhǔn)則進(jìn)行特征篩選得到的強(qiáng)相關(guān)和一般相關(guān)特征進(jìn)行二分類邏輯回歸建模。建模方法和模型評(píng)價(jià)標(biāo)準(zhǔn)與前文相同,模型回歸結(jié)果見(jiàn)表8,ROC曲線見(jiàn)圖2。

        由圖2可知,模型5和模型6各自訓(xùn)練集與測(cè)試集的ROC曲線表現(xiàn)較為一致,模型對(duì)基金的表現(xiàn)均有較好的刻畫(huà)能力,且用AIC特征篩選準(zhǔn)則的模型6的ROC曲線優(yōu)于用BIC特征篩選準(zhǔn)則的模型5,并且當(dāng)假陽(yáng)率為0.200時(shí)的真陽(yáng)率優(yōu)于模型3。使用BIC準(zhǔn)則進(jìn)行特征篩選的特征子集中包含的特征數(shù)較少,所以擬合效果劣于模型3和模型6。綜上可知,使用AIC準(zhǔn)則進(jìn)行特征篩選也可以得到較優(yōu)的模型效果。

        5 結(jié)論

        本研究基于影響基金業(yè)績(jī)的多維度數(shù)據(jù)信息構(gòu)建基礎(chǔ)特征池,通過(guò)吉布斯抽樣實(shí)現(xiàn)多維數(shù)據(jù)信息下的有效特征提取方法,并運(yùn)用邏輯回歸模型,通過(guò)比值比進(jìn)一步對(duì)有效特征進(jìn)行相關(guān)性分類,建立與基金業(yè)績(jī)相關(guān)性強(qiáng)弱排序的特征集,并用于對(duì)基金業(yè)績(jī)的預(yù)測(cè)。

        研究結(jié)果表明,基金業(yè)績(jī)可以通過(guò)投資表現(xiàn)、風(fēng)險(xiǎn)管理、團(tuán)隊(duì)能力和公司經(jīng)營(yíng)狀況4個(gè)方面進(jìn)行比較全面的刻畫(huà)。

        (1)投資表現(xiàn)刻畫(huà)特征。平均收益率和幾何平均年化收益率刻畫(huà)基金投資表現(xiàn)的強(qiáng)關(guān)聯(lián)特征,凈資產(chǎn)收益率是刻畫(huà)基金在投資過(guò)程中對(duì)于杠桿的運(yùn)用能力的強(qiáng)關(guān)聯(lián)指標(biāo)。

        (2)風(fēng)險(xiǎn)管理刻畫(huà)特征。測(cè)量基金風(fēng)險(xiǎn)大小的一個(gè)高度關(guān)聯(lián)的特征指標(biāo)是最大回撤,它體現(xiàn)了管理團(tuán)隊(duì)對(duì)于風(fēng)險(xiǎn)的控制能力;另外,基金風(fēng)險(xiǎn)等級(jí)也是一個(gè)能有效反映風(fēng)險(xiǎn)管理能力的特征。

        (3)團(tuán)隊(duì)能力刻畫(huà)特征。投資表現(xiàn)和風(fēng)險(xiǎn)管理兩個(gè)方面可以有效反映基金管理團(tuán)隊(duì)的能力,但這兩個(gè)方面都要經(jīng)過(guò)一段時(shí)間的任職才能觀測(cè)到,而基金經(jīng)理個(gè)人經(jīng)歷、基金經(jīng)理學(xué)歷和基金經(jīng)理最大工作年限是刻畫(huà)基金經(jīng)理團(tuán)隊(duì)能力的強(qiáng)關(guān)聯(lián)指標(biāo)。

        (4)基金所在公司經(jīng)營(yíng)狀況刻畫(huà)特征?;鸸镜慕?jīng)營(yíng)狀況是其下屬基金團(tuán)隊(duì)表現(xiàn)的基礎(chǔ),董監(jiān)高平均任期、成立年限、公司獲獎(jiǎng)和托管費(fèi)率較低是刻畫(huà)基金公司在行業(yè)中的口碑和商務(wù)運(yùn)營(yíng)能力較強(qiáng)的強(qiáng)關(guān)聯(lián)特征,基金只數(shù)多少、浮動(dòng)管理費(fèi)率和費(fèi)率優(yōu)惠可以刻畫(huà)基金管理團(tuán)隊(duì)的收入與其投資表現(xiàn)的緊密關(guān)系和團(tuán)隊(duì)自信能力。

        表6 使用AIC準(zhǔn)則進(jìn)行特征提取的結(jié)果Table 6 Results for Feature Extraction(AIC)

        表7 使用BIC準(zhǔn)則進(jìn)行特征提取的結(jié)果Table 7 Results for Feature Extraction(BIC)

        表8 測(cè)試集的模型檢驗(yàn)結(jié)果(AIC準(zhǔn)則和BIC準(zhǔn)則)Table 8 Model Validation Results for the Test Set(AIC and BIC)

        (a)模型5

        (b)模型6

        本研究基于AIC準(zhǔn)則和BIC準(zhǔn)則建立的隨機(jī)搜索方法均能對(duì)指標(biāo)起較好的篩選作用。使用AIC準(zhǔn)則進(jìn)行特征篩選得到37個(gè)特征,經(jīng)過(guò)比值比分類,有20個(gè)特征與基金業(yè)績(jī)強(qiáng)相關(guān),有9個(gè)特征與基金業(yè)績(jī)一般相關(guān),剩余8個(gè)特征與基金業(yè)績(jī)?nèi)跸嚓P(guān);使用BIC準(zhǔn)則進(jìn)行特征篩選得到18個(gè)特征,經(jīng)過(guò)比值比分類,有10個(gè)特征與基金業(yè)績(jī)強(qiáng)相關(guān),有5個(gè)特征與基金業(yè)績(jī)一般相關(guān),其余3個(gè)特征與基金業(yè)績(jī)?nèi)跸嚓P(guān)。

        在模型效果方面,使用AIC準(zhǔn)則和BIC準(zhǔn)則進(jìn)行特征篩選得到的強(qiáng)相關(guān)和一般相關(guān)特征進(jìn)行二分類邏輯回歸建模并對(duì)基金業(yè)績(jī)進(jìn)行預(yù)測(cè),利用特征篩選后的指標(biāo)建立的模型能夠較好地預(yù)測(cè)未來(lái)基金業(yè)績(jī)的好、壞,同時(shí)基于BIC準(zhǔn)則的過(guò)擬合風(fēng)險(xiǎn)更低。本研究方法為金融科技領(lǐng)域如何處理海量的非結(jié)構(gòu)化信息、實(shí)現(xiàn)有效的特征提取提供了一種思路和框架,在大數(shù)據(jù)的5V特征中如何有效處理數(shù)據(jù)并形成支持實(shí)踐的運(yùn)用上提供了完整的案例;本研究提出的基于大數(shù)據(jù)隨機(jī)搜索算法的特征提取方法框架下對(duì)刻畫(huà)基金業(yè)績(jī)特征的特征提取方法,不僅是理論上的創(chuàng)新,同時(shí)其結(jié)果可以用于指導(dǎo)業(yè)界實(shí)踐,如基金風(fēng)險(xiǎn)管理和相關(guān)的資產(chǎn)投資業(yè)務(wù)的實(shí)踐工作。

        本研究建立了與基金業(yè)績(jī)相關(guān)性強(qiáng)弱的特征集,但依據(jù)特征集構(gòu)建形成不同的FOF,對(duì)其業(yè)績(jī)好壞的分類對(duì)比的實(shí)證研究還有待進(jìn)一步展開(kāi),這部分內(nèi)容還需要更為深入的后續(xù)工作。

        猜你喜歡
        業(yè)績(jī)準(zhǔn)則關(guān)聯(lián)
        一圖讀懂業(yè)績(jī)說(shuō)明會(huì)
        具非線性中立項(xiàng)的二階延遲微分方程的Philos型準(zhǔn)則
        朗盛第二季度業(yè)績(jī)平穩(wěn) 保持正軌
        上海建材(2019年5期)2019-12-30 06:30:00
        主要業(yè)績(jī)
        “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
        三生業(yè)績(jī)跨越的背后
        奇趣搭配
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        基于Canny振蕩抑制準(zhǔn)則的改進(jìn)匹配濾波器
        一圖讀懂《中國(guó)共產(chǎn)黨廉潔自律準(zhǔn)則》
        久久亚洲色www成人欧美| 国产无卡视频在线观看| 亚洲精品综合久久国产二区| 久久综合亚洲鲁鲁五月天| 一区二区三区四区中文字幕av| av无码国产在线看免费网站| 日本高清h色视频在线观看| 538在线啪在线观看| 亚洲一码二码在线观看| 青青草在线免费观看视频| 国产精品久久国产精品99 gif| 乱子伦在线观看| 99香蕉国产精品偷在线观看| 狠狠躁夜夜躁AV网站中文字幕| 亚洲视频一区二区三区免费 | 亚洲国产美女精品久久久久∴| 精品国产三级a∨在线观看| 青草蜜桃视频在线观看| 中文字幕亚洲精品第一页| 91久久综合精品久久久综合 | 欧美 国产 综合 欧美 视频| 99国产免费热播视频| 亚洲av午夜成人片精品| 色婷婷av一区二区三区不卡| 一区二区三区国产免费视频| 精品欧洲av无码一区二区14| 国产亚洲精品久久久久婷婷瑜伽| 久久免费观看国产精品| 中文字幕高清一区二区| 日本一区二区三区区视频| 99久久精品无码一区二区毛片| 少妇av射精精品蜜桃专区| 九九99久久精品在免费线18| 加勒比一本大道大香蕉| 成人影院在线视频免费观看| 特级毛片a级毛片100免费播放 | 国产精品天堂avav在线| 亚洲av色香蕉一区二区三区蜜桃| 国产av剧情一区二区三区| 国产精品人妻一区二区三区四| 无码AV高潮喷水无码专区线|