周彩節(jié),黃恒秋
(廣西民族師范學院,廣西 崇左 532200)
隨著人們生活水平的不斷提高,其理財觀點也在發(fā)生著變化?;?、股票、理財保險、債券等各式各樣的理財產(chǎn)品的出現(xiàn)以及 CPI 的持續(xù)增長,人們不再認為銀行是唯一可選擇的理財方式,究竟什么更適合中國人的理財習慣? 現(xiàn)代人的思維中已將收益高 、見效快、風險小的現(xiàn)代理財模式投放在自己的理財計劃中,這一理財模式也是現(xiàn)代社會投資理財?shù)闹饕l(fā)展目標。人們通過長時間的觀察發(fā)現(xiàn),股票投資是可以實現(xiàn)人們收益高、見效快目標的理財途徑之一。
證券業(yè)作為金融行業(yè)三大支柱之一,其發(fā)展成熟程度介于銀行與保險業(yè)之間,它相較銀行業(yè) 、保險業(yè)有資金流動量大、高風險等不同特點。在金融危機席卷世界各地的環(huán)境下,證券業(yè)如何起到穩(wěn)定金融市場的作用 ,規(guī)避股票投資風險意義重大。目前,借助互聯(lián)網(wǎng)各種工具,股民與證券公司已能夠獲得相關實時信息,并通過機器學習分析信息對股市趨勢所造成的影響。現(xiàn)代科學技術目前已涉足金融領域 ,但網(wǎng)絡金融依然是我國金融行業(yè)的新鮮事物,它的大力發(fā)展會為金融行業(yè)注入新的血液,金融行業(yè)也將會受益于此而獲得質(zhì)的飛躍。
股票投資其實是一種基本買賣的行為,即低價買進,高價賣出,從中賺取差價。如何判斷價格的最低點與最高點成為實現(xiàn)股市交易理想狀態(tài)的關鍵所在。目前股票分析方法主要分為兩種:基本分析與技術分析。前者研究的方向在于股票自身的內(nèi)在價值,影響股票內(nèi)在價值的因素來自股票市場以外,包括國家所處的經(jīng)濟環(huán)境與相關經(jīng)濟政策、行業(yè)的發(fā)展狀況和企業(yè)自身的經(jīng)營狀況等。而后者的研究更側(cè)重于對股票市場內(nèi)部進行研究,注重對市場本身行為的影響。在股票形態(tài)分析的相關活動中,基本分析與技術分析通常組合起來使用,二者形成分析技術的優(yōu)勢互補 。
本文不打算預先定義某類形態(tài),而是基于真實的交易數(shù)據(jù),利用數(shù)據(jù)挖掘算法,自動進行價格形態(tài)聚類,并計算每類股票的收益情況,從而找出其對投資者有參考意義的形態(tài),基本思路如下:
第一,以上證A股2017年9月4日至2017年11月13日的交易數(shù)據(jù)為聚類樣本數(shù)據(jù),并利用關鍵點提取算法,提取能反映價格走勢的關鍵價格點,基于關鍵價格點進行K-均值聚類分析,這類K取8,即對價格走勢形態(tài)聚為8個類。
第二,對每一類股票,以2017年11月14日買入,2017年11月15日賣出,計算其總收益。
第三,與同期的上證指數(shù)收益進行對比,找出對投資者有參考意義的形態(tài),以便為投資者有針對性地對出現(xiàn)這些形態(tài)的股票進行更為深入的指標技術分析和基本面分析, 從而提供更為完備、更為準確的投資策略。
數(shù)據(jù)來源于國泰安數(shù)據(jù)庫,取上證A股2017年9月4日至2017年11月15日的交易數(shù)據(jù)為分析樣本,指標選取日收盤價。以2017年9月4日至2017年11月13日的交易數(shù)據(jù)為聚類樣本數(shù)據(jù),并利用關鍵點提取算法,提取能反映價格走勢的關鍵價格點,以關鍵價格點數(shù)據(jù)作為聚類分析數(shù)據(jù)。以2017年11月14日至15日交易數(shù)據(jù)作為收益率計算數(shù)據(jù)。
由于股票價格作為聚類特征,其維度較大。通過分析發(fā)現(xiàn),股票價格走勢主要由一些關鍵價格點構成,因此選擇其關鍵的價格點作為聚類特征即可。由文獻[1],Xi-1,Xi,Xi+1構成的序列模式,|Xi-(Xi-1+Xi+1)/2|越大,Xi成為關鍵點的可能性就越大。在此給出關鍵價格特征點的提取算法:
算法:關鍵價格點特征提取算法
輸入:樣本數(shù)據(jù)Pdatan×m
輸出:關鍵價格點數(shù)據(jù)Keydata
步驟1: 預定義Keydata=zeros(n,q),dat=zeros(n,m)全0矩陣。其中,n為樣本數(shù)量,m為原始數(shù)據(jù)的特征向量元素個數(shù),q為提取的關鍵價格點個數(shù)。
步驟2: 計算d(i,j),結果存放在dat中,考慮矩陣計算方法。
for j=2∶64
dat(:,j)==abs(pdata(:,j)-(pdata(:,j-1)+pdata(:,j+1))/2);
end
步驟3: 對dat中的每一行,獲取前q-2個最大值的位置index。
for i=1:n
index=zeros(1,q)
index(1)=1;
index(1)=m;
for j=2:q-1
[~,I]=max(dat(i,:));
index(j)=I;
dat(i,I)=0;
end
對index從小到大排序
Keydata(i,:)=pdata(i,index);
end
步驟4: 輸出Keydata。
對某個股票價格走勢圖關鍵特征提取如圖1所示:(其中藍色線為原始數(shù)據(jù)走勢曲線圖,星號紅色點為關鍵價格點,虛線部分為關鍵價格曲線圖)。
圖1 關鍵價格點擬合情況
從圖1可以看出,關鍵價格點基本能擬合原來的價格趨勢,同時維度降低了。
2.3.1 K-均值聚類算法
步驟1:隨機初始化K個聚類中心,即K個類中心向量;
步驟2:對每個樣本,計算其與各個類中心向量的距離,并將該樣本指派給距離最小的類;
步驟3:更新每個類的中心向量,更新的方法為取該類所有樣本的特征向量均值;
步驟4:直到各個類的中心向量不再發(fā)生變化為止,這里采用0.01的誤差,作為退出條件。
2.3.2 收益分析
為了更好地觀察股票價格形態(tài)的收益情況,選擇到更有價值的形態(tài),我們希望是聚出更多的類。因此,K-均值聚類算法中,筆者選擇K=8,即聚8個類,并觀察收益情況。如圖2所示。
圖2 8類關鍵價格曲線以及相關收益率
圖2的8類關鍵價格曲線中,只有1種形態(tài)獲得了正收益,其他形態(tài)均為負收益。獲得正收益的第1種形態(tài),收益率為4.8605%。同期的上證指數(shù)2017年11月14日和15日跌幅分別為-0.86%和-0.8%。由此可以得出這種形態(tài)的收益率是非??陀^的。
本文基于真實的交易數(shù)據(jù),利用數(shù)據(jù)挖掘算法,自動進行價格形態(tài)聚類,并計算每類股票的收益情況,從而找出其對投資者有參考意義的形態(tài),以便為投資者有針對性地對出現(xiàn)這些形態(tài)的股票進行更為深入的指標技術分析和基本面分析,提供更為完備、更為準確的投資策略(聚類越多,供投資者參考的就越全面)。