亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        新能源汽車行業(yè)股票價(jià)格預(yù)測(cè)研究
        ——基于機(jī)器學(xué)習(xí)算法

        2024-02-28 08:26:54陳夢(mèng)龍吳志鵬
        關(guān)鍵詞:新能源模型

        陳夢(mèng)龍,樊 騁,吳志鵬

        (合肥經(jīng)濟(jì)學(xué)院 金融學(xué)院,安徽 合肥 230036)

        一、問題的提出

        隨著全球氣候變化的加劇,減少碳排放已成為全球共同的責(zé)任?!半p碳”目標(biāo)的提出,為中國新能源汽車行業(yè)的發(fā)展提供了巨大的機(jī)遇,也帶來了挑戰(zhàn)。中國股票市場(chǎng)中新能源汽車行業(yè)及其相關(guān)上下游板塊也因此受到了廣泛的關(guān)注和追捧,成為了投資者追逐的熱點(diǎn)板塊之一。然而,新能源汽車行業(yè)的發(fā)展仍面臨著多種挑戰(zhàn),如技術(shù)瓶頸、市場(chǎng)需求不足等。如何降低新能源汽車行業(yè)股票的投資風(fēng)險(xiǎn)、提高投資收益,成為了一個(gè)重要的研究課題。經(jīng)驗(yàn)研究表明,新能源汽車行業(yè)股票價(jià)格受政策支持、技術(shù)創(chuàng)新、市場(chǎng)競(jìng)爭(zhēng)等多種因素影響,因此,新能源汽車股票價(jià)格波動(dòng)及其背后的驅(qū)動(dòng)因素成為學(xué)者以及投資者關(guān)注的焦點(diǎn)。

        最早使用機(jī)器學(xué)習(xí)方法研究股價(jià)預(yù)測(cè)問題可以追溯到White(1988)[1]使用神經(jīng)網(wǎng)絡(luò)分析IBM普通股票的日回報(bào)率的非線性規(guī)律;Kamijo和Tanigawa(1990)[2]應(yīng)用循環(huán)神經(jīng)網(wǎng)絡(luò)分析東京證券交易所上市公司的股票價(jià)格漲跌的模式,獲得較好的預(yù)測(cè)效果及識(shí)別效果;Saad等(1998)[3]發(fā)現(xiàn)時(shí)延神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和概率神經(jīng)網(wǎng)絡(luò)都是有效的股票走勢(shì)預(yù)測(cè)模型。其后,隨著機(jī)器學(xué)習(xí)模型的不斷開發(fā)以及股價(jià)預(yù)測(cè)方面技術(shù)分析手段的不斷推陳出新,大量文獻(xiàn)開始將二者結(jié)合,即以新的股價(jià)技術(shù)分析指標(biāo)作為特征變量訓(xùn)練新的機(jī)器學(xué)習(xí)模型。

        但目前相關(guān)文獻(xiàn)并沒有直接使用機(jī)器學(xué)習(xí)模型研究A股新能源汽車股票價(jià)格預(yù)測(cè)問題,大多數(shù)集中于將機(jī)器學(xué)習(xí)方法應(yīng)用于新能源相關(guān)領(lǐng)域,例如清潔能源行業(yè)、光伏行業(yè)股票的價(jià)格預(yù)測(cè),并通過模型預(yù)測(cè)誤差等模型評(píng)價(jià)指標(biāo)篩選出該類股票價(jià)格預(yù)測(cè)中的最優(yōu)模型。Jabeur等(2021)[4]通過考察綠色能源資源、全球環(huán)境指數(shù)(ESG)和新能源股票市場(chǎng),利用隨機(jī)森林和LightGBM等模型,對(duì)新能源股價(jià)及石油價(jià)格崩盤期進(jìn)行了探究;Sadorsky(2021)[5]使用隨機(jī)森林模型及技術(shù)指標(biāo)作為特征變量,分析了清潔能源交易基金的股價(jià)方向預(yù)測(cè);Sadorsky(2022)[6]使用基于決策樹的機(jī)器學(xué)習(xí)方法預(yù)測(cè)新能源股票價(jià)格的方向。相似研究還有Sadorsky(2022)[7]分析了清潔能源股票價(jià)格走向,使用了隨機(jī)森林、極端隨機(jī)樹、隨機(jī)梯度提升和支持向量機(jī)等機(jī)器學(xué)習(xí)方法,并發(fā)現(xiàn)這些方法的預(yù)測(cè)準(zhǔn)確率高于傳統(tǒng)模型機(jī)器學(xué)習(xí)方法進(jìn)行美國清潔能源股票價(jià)格預(yù)測(cè)。

        以上文獻(xiàn)表明,在分析新能源及相關(guān)領(lǐng)域的股票市場(chǎng)時(shí),使用基于樹的機(jī)器學(xué)習(xí)方法預(yù)測(cè)股票價(jià)格,有更高的準(zhǔn)確性。此外,在眾多機(jī)器學(xué)習(xí)方法中,選擇何種機(jī)器學(xué)習(xí)方法對(duì)于股價(jià)預(yù)測(cè)也十分重要。Nti 等(2019)[8]使用隨機(jī)森林和長(zhǎng)短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)30天后的加納證券交易所(GSE)多個(gè)領(lǐng)域的股票價(jià)格,結(jié)果發(fā)現(xiàn)這兩種方法都可以高精度地預(yù)測(cè)不同領(lǐng)域股票價(jià)格的未來走勢(shì);Ma等(2019)[9]通過對(duì)2013年至2017年上證指數(shù)的數(shù)據(jù)進(jìn)行模擬和比較,使用隨機(jī)森林和LSTM神經(jīng)網(wǎng)絡(luò)構(gòu)建的股票預(yù)測(cè)模型可以提高股票預(yù)測(cè)的準(zhǔn)確性,并且可以通過該模型構(gòu)建有效的交易策略;Polamuri等(2019)[10]使用美國標(biāo)普500指數(shù)中公司的歷史股票價(jià)格數(shù)據(jù)預(yù)測(cè)未來價(jià)格,對(duì)比多種機(jī)器學(xué)習(xí)模型發(fā)現(xiàn),基于決策樹和隨機(jī)森林的回歸模型是最好的算法;Illa等(2021)[11]使用了道-瓊斯指數(shù)從2000年到2016年的歷史數(shù)據(jù),發(fā)現(xiàn)將隨機(jī)森林與LSTM神經(jīng)網(wǎng)絡(luò)和情感分析技術(shù)結(jié)合的集成學(xué)習(xí)模型可以顯著提高預(yù)測(cè)的準(zhǔn)確性;Cosenza等(2021)[12]以全球5個(gè)地區(qū)的股市為研究對(duì)象,比較了普通最小二乘回歸、隨機(jī)森林和k近鄰三種模型的預(yù)測(cè)效果,結(jié)果發(fā)現(xiàn)前兩者的預(yù)測(cè)精度相近,均優(yōu)于k近鄰,并且變量選擇對(duì)隨機(jī)森林的預(yù)測(cè)性能沒有影響;Yin等(2023)[13]通過分析美國4家上市公司股價(jià),使用了隨機(jī)森林模型結(jié)合指數(shù)平滑方法和決策樹來優(yōu)化模型,結(jié)果發(fā)現(xiàn)隨機(jī)森林在中長(zhǎng)期股票趨勢(shì)預(yù)測(cè)中具有優(yōu)勢(shì),并且該種方法可以進(jìn)一步提高隨機(jī)森林模型的性能。

        可以看出,近年的文獻(xiàn)在多個(gè)國家的多個(gè)股票市場(chǎng)的股價(jià)預(yù)測(cè)中,隨機(jī)森林都獲得了較高的預(yù)測(cè)精確度。同時(shí),這些文獻(xiàn)的常用方法都是盡可能加入足夠多的特征變量讓機(jī)器學(xué)習(xí)模型自行篩選,但并沒有關(guān)注特征變量之間進(jìn)行比較。本文在此基礎(chǔ)之上,使用隨機(jī)森林方法來研究新能源汽車行業(yè)股票價(jià)格預(yù)測(cè)問題,并與簡(jiǎn)單回歸樹及裝袋法這兩種機(jī)器學(xué)習(xí)方法進(jìn)行對(duì)比。根據(jù)Basak 等(2019)[14]的對(duì)比,篩選7種最為常用的股票技術(shù)分析指標(biāo)作為特征變量。通過對(duì)比特征變量重要性,篩選出對(duì)股票價(jià)格預(yù)測(cè)最為重要的特征變量。

        與既有研究相比,本文重點(diǎn)回答以下問題:1.結(jié)合我國股票市場(chǎng)新能源汽車行業(yè)的特征,通過選擇多種影響因素有效地整合到機(jī)器學(xué)習(xí)模型中,以提高預(yù)測(cè)結(jié)果的可靠性,同時(shí)分析影響新能源汽車行業(yè)價(jià)格變動(dòng)的最重要的變量。2.基于機(jī)器學(xué)習(xí)算法的新能源汽車行業(yè)股票價(jià)格預(yù)測(cè)模型能否有效地捕捉市場(chǎng)中的價(jià)格波動(dòng),如何選擇合適的機(jī)器學(xué)習(xí)算法以提高預(yù)測(cè)準(zhǔn)確性。3.機(jī)器學(xué)習(xí)算法在預(yù)測(cè)新能源汽車行業(yè)股票價(jià)格過程中可能面臨的過擬合、數(shù)據(jù)不平衡等問題如何解決?;卮鹕鲜鰡栴}對(duì)于投資者來說具有重要的實(shí)際意義,有助于降低投資風(fēng)險(xiǎn),提高投資收益。通過對(duì)基于機(jī)器學(xué)習(xí)算法的新能源汽車行業(yè)股票價(jià)格預(yù)測(cè)研究的深入探討,有望為投資者提供更加有效的投資策略和決策支持,也能為中國新能源汽車行業(yè)及股市的研究提供一定啟示。

        二、模型說明

        (一)隨機(jī)森林模型

        隨機(jī)森林模型(Random Forest)為Ho(1995)[15]首先提出的,這是一種基于決策樹的集成學(xué)習(xí)算法,能夠有效地處理回歸問題。它通過組合多個(gè)決策樹來構(gòu)建一個(gè)強(qiáng)大的預(yù)測(cè)模型,每個(gè)決策樹都是在隨機(jī)選擇的樣本和特征上進(jìn)行訓(xùn)練,并用投票的方式來決定最終的預(yù)測(cè)結(jié)果。具體來說,隨機(jī)森林中的每個(gè)決策樹都是通過自助采樣和隨機(jī)特征選擇來構(gòu)建的。自助采樣意味著從原始數(shù)據(jù)集中有放回地抽取相同大小的樣本子集,用于訓(xùn)練每個(gè)決策樹。隨機(jī)特征選擇則意味著在每個(gè)節(jié)點(diǎn)處,從所有特征中隨機(jī)選擇一部分特征進(jìn)行分裂。假設(shè)有一個(gè)訓(xùn)練集,其中Xi是輸入特征向量,Yi是對(duì)應(yīng)的輸出標(biāo)簽。對(duì)于回歸問題,隨機(jī)森林方法的思路是學(xué)習(xí)一個(gè)預(yù)測(cè)函數(shù)F(X),使得預(yù)測(cè)值F(Xi)盡可能接近真實(shí)值Yi。

        隨機(jī)森林算法的步驟如下:首先,對(duì)于每棵樹Ti,從訓(xùn)練集D中有放回地隨機(jī)采樣n個(gè)樣本,得到一個(gè)樣本子集Di,然后隨機(jī)選擇k 個(gè)特征子集,用于訓(xùn)練決策樹;用Di和選定的特征子集來訓(xùn)練一棵決策樹Ti。其次,對(duì)于一個(gè)新的輸入向量X,通過計(jì)算所有樹的輸出的平均值得到最終預(yù)測(cè)值:

        其中,T是決策樹的數(shù)量。為了衡量預(yù)測(cè)值與真實(shí)值之間的誤差,通常采用平方誤差損失函數(shù),即;而對(duì)于回歸問題:令和,則可以通過最小化加權(quán)平方誤差(即殘差平方和)的準(zhǔn)則來選擇最佳的劃分變量j和最佳的劃分點(diǎn)s,具體公式如下:

        其中,c1與c2分別為兩個(gè)區(qū)域內(nèi)部的均值。最佳的劃分變量j和最佳的劃分點(diǎn)s可以通過貪心算法進(jìn)行選取。而對(duì)于隨機(jī)森林的預(yù)測(cè)問題,最終的預(yù)測(cè)結(jié)果是所有決策樹的預(yù)測(cè)結(jié)果的平均值,即:

        其中,B表示決策樹的數(shù)目,fb(X)表示第b棵決策樹對(duì)于輸入樣本X的預(yù)測(cè)。隨機(jī)森林具有以下優(yōu)點(diǎn):第一,能夠處理高維數(shù)據(jù)和大量特征,不需要進(jìn)行特征選擇;第二,具有較高的準(zhǔn)確率和泛化能力;第三,能夠評(píng)估特征的重要性,提供特征選擇的依據(jù)。隨機(jī)森林回歸算法的基本思想是將數(shù)據(jù)集隨機(jī)劃分為多個(gè)子集,建立多棵決策樹并計(jì)算每顆決策樹的回歸效果,最終將這些決策樹的結(jié)果合并得到最終模型的預(yù)測(cè)結(jié)果。

        (二)裝袋法

        裝袋法最早由Breiman(1996)[16]提出,是一種基于集成學(xué)習(xí)的機(jī)器學(xué)習(xí)算法,其基本思想是通過對(duì)多個(gè)訓(xùn)練集進(jìn)行隨機(jī)采樣,從而得到多個(gè)子訓(xùn)練集,然后分別對(duì)這些子訓(xùn)練集進(jìn)行訓(xùn)練,最后將這些訓(xùn)練好的模型進(jìn)行組合,得到一個(gè)更加穩(wěn)定和準(zhǔn)確的模型。

        假設(shè)一個(gè)包含N個(gè)樣本的訓(xùn)練集D,每個(gè)樣本的特征向量為Xi,標(biāo)簽為Yi。采用裝袋法訓(xùn)練一個(gè)大小為M的模型集合,其中每個(gè)模型用hm(X)表示。則裝袋法的預(yù)測(cè)結(jié)果為:

        其中,Y表示最終的預(yù)測(cè)結(jié)果。

        (三)決策樹

        決策樹是最早由Stone 和Hunt(1963)[17]提出的一種基于樹結(jié)構(gòu)的機(jī)器學(xué)習(xí)算法,用于解決回歸問題。它的基本思想是將數(shù)據(jù)集劃分為多個(gè)子集,每個(gè)子集對(duì)應(yīng)一個(gè)葉子節(jié)點(diǎn),并在每個(gè)葉子節(jié)點(diǎn)上預(yù)測(cè)一個(gè)數(shù)值。通過不斷地遞歸劃分?jǐn)?shù)據(jù)集,最終得到一個(gè)樹形結(jié)構(gòu),可以用于對(duì)新的數(shù)據(jù)進(jìn)行回歸預(yù)測(cè)。

        假設(shè)有一個(gè)包含N個(gè)樣本的訓(xùn)練集D,每個(gè)樣本的特征向量為Xi,標(biāo)簽為Yi。使用決策樹建模,得到一個(gè)樹形結(jié)構(gòu),對(duì)于每個(gè)葉子節(jié)點(diǎn)k,它對(duì)應(yīng)的預(yù)測(cè)值為ck。則決策樹的預(yù)測(cè)結(jié)果為:

        其中,Y表示對(duì)于輸入的特征向量X的預(yù)測(cè)值,k表示葉子節(jié)點(diǎn)的個(gè)數(shù),I(X∈Rk)表示X是否屬于葉子節(jié)點(diǎn)k所對(duì)應(yīng)的子集。

        三、特征工程與數(shù)據(jù)來源

        (一)特征工程

        本文選擇相對(duì)強(qiáng)度指標(biāo)(Relative Strength Index,簡(jiǎn)稱RSI)、隨機(jī)震蕩指標(biāo)(Stochastic Oscillator,簡(jiǎn)稱%K值)、威廉指標(biāo)(William%R值)、移動(dòng)平均線收斂/發(fā)散指標(biāo)(簡(jiǎn)稱MACD)、收益率指標(biāo)、平衡成交量指標(biāo)(On Balance Volume,簡(jiǎn)稱OBV值)及換手率這7個(gè)指標(biāo)作為特征值進(jìn)行分析。

        1.相對(duì)強(qiáng)度指標(biāo)(RSI)

        相對(duì)強(qiáng)度指標(biāo)是一種用于衡量股票價(jià)格漲跌幅度的技術(shù)分析指標(biāo),RSI指標(biāo)的取值范圍為0 ~100,通常認(rèn)為當(dāng)RSI值超過70時(shí),股票處于超買狀態(tài);當(dāng)RSI值低于30時(shí),股票處于超賣狀態(tài)。RSI指標(biāo)可以用于股票價(jià)格的技術(shù)分析,幫助投資者判斷股票的買賣時(shí)機(jī)。

        2.隨機(jī)震蕩指標(biāo)(%K)

        隨機(jī)震蕩指標(biāo)(%K)是一種用于衡量股票價(jià)格相對(duì)高低水平的技術(shù)分析指標(biāo)。%K 的取值范圍為0 ~100,通常認(rèn)為當(dāng)%K值超過80時(shí),股票處于超買狀態(tài);當(dāng)%K值低于20時(shí),股票處于超賣狀態(tài)。隨機(jī)震蕩指標(biāo)可以用于股票價(jià)格的技術(shù)分析,幫助投資者判斷股票的買賣時(shí)機(jī)。

        3.威廉指標(biāo)(William %R)

        威廉指標(biāo)是一種技術(shù)分析工具,用于測(cè)量股票價(jià)格的超買和超賣情況。該指標(biāo)的取值范圍在0到-100之間,當(dāng)%R指標(biāo)的數(shù)值超過-20時(shí),表示股票處于超買狀態(tài);當(dāng)%R指標(biāo)的數(shù)值低于-80時(shí),表示股票處于超賣狀態(tài)。

        4.移動(dòng)平均線收斂/發(fā)散指標(biāo)(MACD)

        移動(dòng)平均線收斂/發(fā)散指標(biāo)是一種技術(shù)分析工具,用于測(cè)量股票價(jià)格的趨勢(shì)和動(dòng)量。該指標(biāo)的計(jì)算是基于兩個(gè)移動(dòng)平均線之間的差異,通常用于判斷股票價(jià)格的買入和賣出時(shí)機(jī)。MACD線的數(shù)值可以是正數(shù)或負(fù)數(shù),表示股票價(jià)格的上漲或下跌趨勢(shì)。當(dāng)MACD 線的數(shù)值大于0 時(shí),表示股票價(jià)格處于上漲趨勢(shì);當(dāng)MACD線的數(shù)值小于0時(shí),表示股票價(jià)格處于下跌趨勢(shì)。除了MACD線之外,還可以計(jì)算出MACD的信號(hào)線,用于判斷股票價(jià)格的買入和賣出時(shí)機(jī)。MACD的信號(hào)線通常采用9天的時(shí)間周期,當(dāng)MACD線向上突破信號(hào)線時(shí),表示股票價(jià)格處于買入時(shí)機(jī);當(dāng)MACD線向下突破信號(hào)線時(shí),表示股票價(jià)格處于賣出時(shí)機(jī)。

        5.收益率(RATE)

        收益率指標(biāo)用于衡量?jī)r(jià)格變化的速度和幅度。

        6.平衡成交量(OBV)

        平衡成交量指標(biāo)是一種技術(shù)分析工具,用于測(cè)量股票價(jià)格的漲跌動(dòng)量。OBV指標(biāo)的計(jì)算基于股票交易量的增減情況,可以用于判斷股票價(jià)格的趨勢(shì)和買賣時(shí)機(jī)。當(dāng)OBV指標(biāo)的數(shù)值持續(xù)上升時(shí),表示股票價(jià)格處于上漲趨勢(shì);當(dāng)OBV指標(biāo)的數(shù)值持續(xù)下降時(shí),表示股票價(jià)格處于下跌趨勢(shì)。OBV指標(biāo)也可以與股票價(jià)格進(jìn)行比較,如果股票價(jià)格上漲而OBV指標(biāo)下降,則可能預(yù)示著價(jià)格趨勢(shì)的反轉(zhuǎn)。

        7.換手率

        換手率是指某一特定時(shí)間段內(nèi),某個(gè)證券交易的股數(shù)與該證券流通股本的比率,通常用百分?jǐn)?shù)表示。換手率越高,表示該股票的流通性越好,市場(chǎng)交易越活躍。換手率可以反映出市場(chǎng)對(duì)該股票的熱度和投資者的情緒,是衡量股票市場(chǎng)活躍程度的重要指標(biāo)。

        (二)數(shù)據(jù)來源及模型預(yù)測(cè)評(píng)價(jià)指標(biāo)

        1.數(shù)據(jù)來源

        本文選擇2016年7月20日至2023年4月28日上證A股新能源汽車指數(shù)日度數(shù)據(jù)作為研究樣本,新能源汽車股票數(shù)據(jù)來源于wind 數(shù)據(jù)庫,特征變量數(shù)據(jù)來源于英為財(cái)情網(wǎng)站及手工計(jì)算,共得到1 648 個(gè)樣本值。為了消除量綱不一致問題,已經(jīng)對(duì)特征變量經(jīng)過標(biāo)準(zhǔn)化計(jì)算。本文所有數(shù)據(jù)分析均在python3.7 中實(shí)現(xiàn)。

        2.模型預(yù)測(cè)評(píng)價(jià)指標(biāo)

        本文選取袋外均方誤差、測(cè)試誤差及擬合優(yōu)度三種方法對(duì)比衡量單棵決策樹、裝袋法及隨機(jī)森林三種模型預(yù)測(cè)效果,袋外均方誤差及測(cè)試誤差值越小,說明預(yù)測(cè)效果越好;擬合優(yōu)度值越大,說明預(yù)測(cè)效果越好。

        四、實(shí)證分析和結(jié)果解釋

        (一)隨機(jī)森林模型預(yù)測(cè)準(zhǔn)確性

        本文檢驗(yàn)機(jī)器學(xué)習(xí)中的隨機(jī)森林算法來構(gòu)建新能源汽車行業(yè)股票價(jià)格預(yù)測(cè)模型的準(zhǔn)確性,圖1為隨機(jī)森林的預(yù)測(cè)值與實(shí)際值的散點(diǎn)圖,由圖可知,散點(diǎn)緊密地圍繞在45度線周圍,表明了隨機(jī)森林取得了較好的預(yù)測(cè)效果。進(jìn)一步分析回歸樹的棵數(shù)對(duì)預(yù)測(cè)誤差的影響,如圖2所示,可知在150棵樹之后,預(yù)測(cè)誤差降到比較低的水準(zhǔn),并隨著棵數(shù)增加保持平穩(wěn)。

        圖1 隨機(jī)森林預(yù)測(cè)值和實(shí)際值的散點(diǎn)圖

        圖2 回歸樹棵數(shù)對(duì)預(yù)測(cè)誤差的影響

        (二)變量對(duì)于新能源汽車股票價(jià)格預(yù)測(cè)的重要程度

        為了進(jìn)一步探究新能源汽車股票價(jià)格預(yù)測(cè)的關(guān)鍵因素,即研究新能源股的RSI值、%K值、William%R、MACD值、價(jià)格變動(dòng)率、OBV值、換手率對(duì)新能源汽車股票價(jià)格的預(yù)測(cè)何者更重要,本文進(jìn)一步分析這些變量的重要性,分析結(jié)果如表1所示。將其按照重要性排序,各特征的重要性如表1,柱狀圖展示如圖3。結(jié)果表明,最重要的三個(gè)特征為平衡成交量指標(biāo)、換手率指標(biāo)及移動(dòng)平均線收斂/發(fā)散指標(biāo),對(duì)股票價(jià)格預(yù)測(cè)的重要性分別為0.5196、0.2105和0.1059。平衡成交量之所以在預(yù)測(cè)新能源汽車行業(yè)股票價(jià)格時(shí)最為重要,一個(gè)較為合理的解釋是,新能源汽車行業(yè)需要大量資金投入研發(fā)、生產(chǎn)和銷售,資金流向?qū)善眱r(jià)格會(huì)產(chǎn)生較大影響,平衡成交量指標(biāo)可以反映市場(chǎng)資金的流入和流出情況,幫助投資者把握行業(yè)資金動(dòng)向。同時(shí),新能源汽車行業(yè)受到政策、技術(shù)和市場(chǎng)等多方面因素的影響,股票價(jià)格波動(dòng)較大,而該指標(biāo)通過分析成交量與股票價(jià)格的關(guān)系,能夠反映市場(chǎng)活躍程度,為投資者提供有關(guān)市場(chǎng)趨勢(shì)的信息,可以幫助投資者判斷市場(chǎng)的買賣力量,提前發(fā)現(xiàn)趨勢(shì)變化的信號(hào),從而作出及時(shí)的投資決策。

        圖3 隨機(jī)森林變量重要性圖

        進(jìn)一步分析這三個(gè)特征變量,并繪制偏依賴程度圖(Partial Dependence),用于展示特征變量與模型預(yù)測(cè)結(jié)果之間的關(guān)系。圖4 從左至右分別是OBV、換手率和MACD 的偏依賴程度圖??梢钥闯觯?dāng)OBV 指標(biāo)的值從較低水平開始增加時(shí),股價(jià)預(yù)測(cè)的重要性也隨之增加,這意味著在OBV指標(biāo)上升的情況下,市場(chǎng)對(duì)于新能源汽車股價(jià)的預(yù)測(cè)變得更加可靠和重要。OBV 指標(biāo)上升通常表示市場(chǎng)對(duì)該行業(yè)的買入興趣增加,投資者對(duì)于新能源汽車股價(jià)的預(yù)期也隨之提高。然而,當(dāng)OBV 指標(biāo)接近零值時(shí),股價(jià)預(yù)測(cè)的重要性達(dá)到最低點(diǎn)。這表明在OBV 指標(biāo)接近零值的情況下,市場(chǎng)對(duì)于新能源汽車股價(jià)的預(yù)測(cè)變得更加困難。因?yàn)镺BV 指標(biāo)接近零值時(shí),市場(chǎng)處于相對(duì)平衡狀態(tài),投資者對(duì)于新能源汽車行業(yè)的未來走勢(shì)持有較為謹(jǐn)慎的態(tài)度,導(dǎo)致股價(jià)預(yù)測(cè)的不確定性增加。但隨著OBV的進(jìn)一步增加,此特征變量對(duì)股價(jià)預(yù)測(cè)的重要性進(jìn)一步增加。

        圖4 OBV、換手率及MACD偏依賴程度

        換手率指標(biāo)從0開始增加時(shí),對(duì)股價(jià)預(yù)測(cè)的重要性也隨之增加。這意味著在低換手率水平下,新能源汽車股價(jià)受到換手率的積極影響,即換手率的增加會(huì)推動(dòng)股價(jià)上漲。然而,當(dāng)換手率超過約400%后,偏依賴程度開始下降,這表明在高換手率水平下,換手率的增加反而對(duì)新能源汽車股價(jià)的預(yù)測(cè)產(chǎn)生負(fù)面影響,即換手率的進(jìn)一步增加可能導(dǎo)致股價(jià)下跌。

        MACD指標(biāo)的值從較低水平開始減少時(shí),對(duì)于新能源股價(jià)預(yù)測(cè)的重要性也隨之降低。意味著在MACD指標(biāo)下降的情況下,對(duì)于新能源汽車股價(jià)的預(yù)測(cè)變得不太可靠。由于投資者對(duì)于新能源汽車行業(yè)的興趣減弱,導(dǎo)致股價(jià)受到較小的關(guān)注和波動(dòng)。當(dāng)MACD 指標(biāo)接近零值時(shí),股價(jià)預(yù)測(cè)的重要性達(dá)到最低點(diǎn)。隨著MACD指標(biāo)進(jìn)一步上升,股價(jià)預(yù)測(cè)的重要性也開始增加,這意味著在MACD指標(biāo)上升的情況下,市場(chǎng)對(duì)于新能源汽車股價(jià)的預(yù)測(cè)變得更加可靠和重要。因?yàn)镸ACD指標(biāo)上升通常表示市場(chǎng)對(duì)該行業(yè)的買入興趣增加,投資者對(duì)于新能源汽車股價(jià)的預(yù)期也隨之提高。

        (三)三種機(jī)器學(xué)習(xí)算法的對(duì)比分析

        為了對(duì)比分析隨機(jī)森林算法與其他算法之間的優(yōu)劣,本文對(duì)比分析單棵決策樹、裝袋法與隨機(jī)森林法三種方法在模型擬合優(yōu)度及預(yù)測(cè)方面的表現(xiàn),使用袋外均方誤差用于衡量機(jī)器學(xué)習(xí)模型的泛化能力和預(yù)測(cè)準(zhǔn)確性。具體來說,袋外均方誤差越小,說明模型的泛化能力越強(qiáng),對(duì)未知數(shù)據(jù)的預(yù)測(cè)準(zhǔn)確性越高。使用測(cè)試集的擬合優(yōu)度來衡量模型的擬合程度,擬合優(yōu)度越接近1,說明模型的擬合程度越好,同時(shí)預(yù)測(cè)準(zhǔn)確性越高。

        本文在python的scikit-learn模塊中初始化了三個(gè)模型,在單棵決策樹中,使用默認(rèn)參數(shù)對(duì)原數(shù)據(jù)建立了1棵樹。在裝袋法中建立了300棵樹,并對(duì)每棵樹的訓(xùn)練集進(jìn)行了隨機(jī)采樣。在隨機(jī)森林模型中,直接對(duì)原數(shù)據(jù)建立了300棵樹且不對(duì)其剪枝。進(jìn)一步對(duì)三個(gè)模型在訓(xùn)練集和測(cè)試集上的表現(xiàn)進(jìn)行了評(píng)估,具體指標(biāo)如表2所示。結(jié)果表明,在袋外均方誤差及測(cè)試集的擬合優(yōu)度方面,隨機(jī)森林模型的表現(xiàn)最佳,顯著高于單棵決策樹和裝袋法。該結(jié)論在圖5也能得到體現(xiàn),圖5為單棵決策樹、裝袋法及隨機(jī)森林三種機(jī)器學(xué)習(xí)方法的測(cè)試誤差之間的對(duì)比,橫軸為樹的棵數(shù),縱軸為測(cè)試誤差,可以看出隨機(jī)森林的測(cè)試誤差與裝袋法接近,且二者皆遠(yuǎn)小于單棵決策樹的測(cè)試誤差。在決策樹的數(shù)量超過200棵之后,隨機(jī)森林法的測(cè)試誤差略小于裝袋法。說明在設(shè)置參數(shù)時(shí),適當(dāng)提高決策樹的數(shù)目可降低隨機(jī)森林方法的測(cè)試誤差,即提高隨機(jī)森林方法對(duì)新能源汽車股票價(jià)格的預(yù)測(cè)精度。同時(shí),測(cè)試誤差是在模型訓(xùn)練完成后,使用獨(dú)立的測(cè)試數(shù)據(jù)集來評(píng)估模型的性能。測(cè)試誤差越小,說明模型的泛化能力越強(qiáng)。在隨機(jī)森林中,測(cè)試誤差通常比單一決策樹和裝袋法要小,因?yàn)殡S機(jī)森林綜合了多棵決策樹的結(jié)果,可以更好地避免過擬合。

        表2 決策樹、裝袋法及隨機(jī)森林三種方法預(yù)測(cè)準(zhǔn)確度對(duì)比

        圖5 單棵決策樹、裝袋法及隨機(jī)森林三種算法測(cè)試誤差對(duì)比

        綜上所述,從袋外均方誤差、擬合優(yōu)度和測(cè)試誤差三個(gè)指標(biāo)的角度來看,隨機(jī)森林優(yōu)于單棵決策樹和裝袋法。因?yàn)殡S機(jī)森林綜合了多棵決策樹的結(jié)果,可以更好地?cái)M合數(shù)據(jù)、避免過擬合,并且具有更好的泛化能力。

        (四)隨機(jī)森林模型的交叉驗(yàn)證誤差

        為了全面展示和檢驗(yàn)隨機(jī)森林模型的實(shí)際預(yù)測(cè)性能及穩(wěn)健性,引入隨機(jī)森林模型的交叉驗(yàn)證誤差。該方法可以有效地評(píng)估模型的泛化能力,即其對(duì)未知數(shù)據(jù)的預(yù)測(cè)性能。圖6為隨機(jī)森林模型在不同最大特征數(shù)下的交叉驗(yàn)證誤差。當(dāng)最大特征數(shù)為4時(shí),交叉驗(yàn)證誤差達(dá)到最低點(diǎn),這意味著隨機(jī)森林模型在這個(gè)參數(shù)設(shè)置下表現(xiàn)最好,預(yù)測(cè)的準(zhǔn)確性最高。圖形先降低再上升,說明在最大特征數(shù)小于4時(shí),增加特征數(shù)可以提高模型的預(yù)測(cè)能力,但當(dāng)最大特征數(shù)超過4后,繼續(xù)增加特征數(shù)反而會(huì)導(dǎo)致模型的預(yù)測(cè)能力下降,因?yàn)橐肓诉^多的噪聲或者不相關(guān)的信息,導(dǎo)致模型過擬合。對(duì)于新能源汽車股票價(jià)格預(yù)測(cè),通過設(shè)置最大特征數(shù)為4,可以幫助提高預(yù)測(cè)模型的準(zhǔn)確性、泛化能力和效率。這有助于提高預(yù)測(cè)結(jié)果的可靠性,并為投資者和決策者提供更準(zhǔn)確的股票價(jià)格預(yù)測(cè)信息。

        圖6 隨機(jī)森林模型的交叉驗(yàn)證誤差

        五、總結(jié)

        隨著我國提出實(shí)現(xiàn)“雙碳”目標(biāo),大力發(fā)展新能源汽車行業(yè)已經(jīng)成為國家戰(zhàn)略,這為新能源汽車相關(guān)上市公司帶來巨大發(fā)展機(jī)遇。本文使用2016年7月20日至2023年4月28日上證A股新能源汽車指數(shù)日度數(shù)據(jù)作為研究樣本,采用機(jī)器學(xué)習(xí)中的隨機(jī)森林模型,通過選擇7個(gè)常用股票投資技術(shù)分析指標(biāo)作為特征變量,預(yù)測(cè)新能源汽車行業(yè)股票價(jià)格,并對(duì)指標(biāo)的特征重要性進(jìn)行對(duì)比,進(jìn)一步對(duì)比隨機(jī)森林模型與決策樹模型及裝袋法的模型預(yù)測(cè)能力。

        (一)研究結(jié)論

        第一,隨機(jī)震蕩指標(biāo)、換手率指標(biāo)和移動(dòng)平均線收斂/發(fā)散指標(biāo)對(duì)于預(yù)測(cè)新能源汽車行業(yè)股票價(jià)格是最為重要的三個(gè)指標(biāo)。進(jìn)一步分析發(fā)現(xiàn),這些指標(biāo)的偏依賴程度都與其取值呈非線性關(guān)系。這些結(jié)果可以為投資者提供關(guān)于預(yù)測(cè)股票價(jià)格最為重要的信息,從而更好地指導(dǎo)其投資決策。

        第二,隨機(jī)森林模型在預(yù)測(cè)股票價(jià)格方面具有較高的準(zhǔn)確性和可靠性。首先,在袋外預(yù)測(cè)誤差、擬合優(yōu)度和測(cè)試誤差方面,隨機(jī)森林模型都表現(xiàn)出了優(yōu)異的性能。這些結(jié)果表明,隨機(jī)森林模型可以在新能源汽車行業(yè)板塊的投資決策中起到關(guān)鍵的作用。其次,相比于裝袋法與決策樹模型,隨機(jī)森林模型在預(yù)測(cè)股票價(jià)格方面具有較高的準(zhǔn)確性和可靠性。最后,對(duì)于新能源汽車股票價(jià)格預(yù)測(cè),經(jīng)過檢驗(yàn)隨機(jī)森林模型交叉驗(yàn)證誤差,當(dāng)設(shè)置最大特征數(shù)為4時(shí),可以幫助提高預(yù)測(cè)模型的準(zhǔn)確性。因?yàn)樵卺槍?duì)新能源汽車行業(yè)股價(jià)預(yù)測(cè)時(shí),選擇最大特征數(shù)為4時(shí)交叉驗(yàn)證誤差最好,且此時(shí)具有較好的模型的泛化能力。

        (二)研究啟示及政策建議

        第一,加大新能源汽車相關(guān)上市公司的政策支持力度。隨著國家對(duì)新能源汽車產(chǎn)業(yè)的戰(zhàn)略支持,相關(guān)上市公司獲得了巨大發(fā)展機(jī)遇。因此,國家應(yīng)繼續(xù)加大對(duì)新能源汽車產(chǎn)業(yè)的扶持力度,通過稅收優(yōu)惠、補(bǔ)貼、資金支持等多種政策手段,幫助新能源汽車企業(yè)獲得發(fā)展所需的資金支持,降低企業(yè)融資和運(yùn)營成本。

        第二,完善新能源汽車股票市場(chǎng)的監(jiān)管體系。本文研究發(fā)現(xiàn)隨機(jī)森林模型可以較好地預(yù)測(cè)新能源汽車股票價(jià)格,這說明新能源汽車股票市場(chǎng)存在一定的規(guī)律性。為提高股票市場(chǎng)定價(jià)效率,防止股價(jià)過度波動(dòng),應(yīng)建立健全新能源汽車股票的監(jiān)管機(jī)制,避免市場(chǎng)操縱和內(nèi)幕交易問題,維護(hù)市場(chǎng)秩序。加強(qiáng)新能源汽車行業(yè)的財(cái)政支持和稅收優(yōu)惠以鼓勵(lì)投資,推動(dòng)行業(yè)發(fā)展。

        第三,加強(qiáng)新能源汽車股票投資決策能力建設(shè)。相關(guān)部門應(yīng)加強(qiáng)新能源汽車領(lǐng)域的數(shù)據(jù)監(jiān)測(cè)和模型建設(shè)工作,并向投資者廣泛宣傳相關(guān)投資分析方法,幫助投資者提高決策能力和水平。投資者在投資新能源汽車行業(yè)股票時(shí),應(yīng)當(dāng)關(guān)注隨機(jī)震蕩指標(biāo)和相對(duì)強(qiáng)度指標(biāo)等重要的指標(biāo),避免過度依賴MACD指標(biāo)等不重要的指標(biāo)。同時(shí)應(yīng)當(dāng)綜合考慮多種因素,避免過度依賴技術(shù)指標(biāo)或者其他單一因素,從而規(guī)避風(fēng)險(xiǎn)。

        第四,堅(jiān)持長(zhǎng)期新能源汽車發(fā)展戰(zhàn)略,并加強(qiáng)新能源汽車行業(yè)監(jiān)管,消除市場(chǎng)風(fēng)險(xiǎn)。新能源汽車產(chǎn)業(yè)仍處于發(fā)展階段的初期,國家應(yīng)采取長(zhǎng)遠(yuǎn)和穩(wěn)定的政策,為企業(yè)提供一致和可預(yù)期的發(fā)展環(huán)境,促進(jìn)新能源汽車產(chǎn)業(yè)快速成長(zhǎng),助力國家實(shí)現(xiàn)“雙碳”目標(biāo)。針對(duì)新能源汽車行業(yè)股市風(fēng)險(xiǎn),政府要加強(qiáng)對(duì)新能源汽車行業(yè)的監(jiān)管,確保企業(yè)公開透明、誠信經(jīng)營,避免不良企業(yè)的違規(guī)操作和市場(chǎng)扭曲,通過政策引導(dǎo)和財(cái)政支持,促進(jìn)新能源汽車行業(yè)的發(fā)展,包括技術(shù)創(chuàng)新、產(chǎn)業(yè)升級(jí)、市場(chǎng)擴(kuò)大等方面,從而提高新能源汽車行業(yè)的整體水平和競(jìng)爭(zhēng)力。同時(shí)針對(duì)新能源汽車行業(yè)的上市公司,政府應(yīng)積極考慮稅收優(yōu)惠、信貸扶持等,以鼓勵(lì)更多的投資者關(guān)注并投資新能源汽車行業(yè),推動(dòng)行業(yè)的快速發(fā)展。

        (三)研究局限和今后研究方向

        本文對(duì)新能源汽車行業(yè)股票價(jià)格預(yù)測(cè)準(zhǔn)確性和可靠性方面進(jìn)行了研究,但存在一定的局限性:一是本文所選取的特征值僅限于七種常見股票市場(chǎng)投資指標(biāo),未涵蓋更多可能影響股價(jià)的潛在因素,如宏觀經(jīng)濟(jì)環(huán)境、政策法規(guī)變化等。二是本文所采用的隨機(jī)森林模型雖然在預(yù)測(cè)表現(xiàn)上優(yōu)于其他機(jī)器學(xué)習(xí)方法,但在實(shí)際應(yīng)用中仍存在一定的局限性,例如對(duì)超大規(guī)模數(shù)據(jù)的處理效率較低。

        未來的研究方向可從以下方面展開:一是可以考慮拓展特征值的選擇范圍,引入更多與新能源汽車行業(yè)相關(guān)的指標(biāo),如技術(shù)創(chuàng)新水平、行業(yè)政策支持度等,以提高預(yù)測(cè)模型的準(zhǔn)確性和全面性。二是可以進(jìn)一步優(yōu)化機(jī)器學(xué)習(xí)算法,提高其對(duì)大規(guī)模數(shù)據(jù)的處理能力和效率,以適應(yīng)現(xiàn)實(shí)應(yīng)用場(chǎng)景的需求,可以結(jié)合深度學(xué)習(xí)等前沿技術(shù),構(gòu)建更加復(fù)雜和精準(zhǔn)的預(yù)測(cè)模型,為新能源汽車行業(yè)的投資決策提供更可靠的參考依據(jù)。

        猜你喜歡
        新能源模型
        一半模型
        重要模型『一線三等角』
        63%新能源二手車開不滿5萬公里就被賣掉
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        新能源汽車成為主流還需要多久?
        海峽姐妹(2019年8期)2019-09-03 01:01:00
        3D打印中的模型分割與打包
        買不買新能源汽車
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        “新能源門”的背后
        風(fēng)能(2015年4期)2015-02-27 10:14:36
        順應(yīng)新能源發(fā)展趨勢(shì)
        風(fēng)能(2015年4期)2015-02-27 10:14:34
        尤物国产一区二区三区在线观看| 国产内射XXXXX在线| 色婷婷狠狠97成为人免费| 国产精品成人va| 久久久精品国产亚洲麻色欲| 一区二区三区日韩蜜桃| 五十六十日本老熟妇乱| 蜜臀久久99精品久久久久久小说| 欧美性猛交xxxx乱大交蜜桃| japanese色国产在线看视频| 精品一区二区三区亚洲综合| 国模冰莲极品自慰人体| 国产成人a人亚洲精品无码| 91精选视频在线观看| 日韩女优中文字幕在线| 丰满的少妇av一区二区三区| 国产三级久久久精品麻豆三级| 最新69国产成人精品视频免费| 亚洲另类欧美综合久久图片区| 无码中文字幕专区一二三| 自拍偷区亚洲综合激情| 四虎影视久久久免费观看| 亚洲中文字幕无码专区| 偷拍熟女亚洲另类| 国产三级精品三级男人的天堂| 国产成人综合亚洲看片| 久久麻豆精品国产99国产精| 亚洲中文无码精品久久不卡| 中文字幕你懂的一区二区| 天堂丝袜美腿在线观看| 亚洲中文字幕一区精品自拍| 在线观看免费午夜大片| 日本一级淫片免费啪啪| 日本一区二区三级在线观看| 性按摩xxxx在线观看| 97超级碰碰人妻中文字幕| 少妇爽到爆视频网站免费| 国产一区二区三区仙踪林| 久久久久亚洲av片无码v| 精品综合久久久久久8888| 日本亚洲视频免费在线看|