胡濱
【摘要】 針對國內(nèi)證券行業(yè)數(shù)據(jù)信息分散、系統(tǒng)功能單一的情況,設計了基于數(shù)據(jù)挖掘技術的證券投資分析系統(tǒng)。在Microsoft.NET的框架上,利用SQL SeNer技術、ADO.NET技術進行數(shù)據(jù)庫搭建、智能數(shù)據(jù)采集、轉(zhuǎn)換及分析處理,快速地從大量數(shù)據(jù)中得到即時的有效信息并做出決策。
【關鍵詞】 數(shù)據(jù)挖掘 蟻群分析 證券 投資決策
一、數(shù)據(jù)挖掘與證券的關系
1989年8月,第十一屆國際聯(lián)合人工智能學術會議在美國Detroit市召開,在這次會議上,數(shù)據(jù)挖掘第一次形成了一個正式的概念。此后,每年會舉辦一屆KDD國際會議來推進對數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的研究進程。
在商業(yè)領域中,數(shù)據(jù)挖掘給企業(yè)的商業(yè)信息處理帶來了一個全新的思維方式。證券行業(yè)是一個交易量巨大的行業(yè),我國的證券交易系統(tǒng)具有成熟的事物處理系統(tǒng),多年的運營中,交易數(shù)據(jù)庫中累積了巨量的數(shù)據(jù)。利用數(shù)據(jù)挖掘工具來發(fā)掘其中有價值的知識和信息,將會為證券投資的正確決策帶來不可估量的作用。如何對交易數(shù)據(jù)進行挖掘成為了證券投資研究的重中之重。
在證券投資領域,較為新穎的是蟻群算法,它具有很高的計算效率,而且不需設定最終簇的數(shù)量。在今年來不斷的發(fā)展改進中,蟻群算法在某些方面的問題中表現(xiàn)出了更接近實際的效果。
本文將使用這種新的算法工具來對證券投資決策過程進行分析,對股票的行業(yè)因素、公司因素、收益和成長因素等加以考慮,建立全面的評價體系,并通過聚類分析方法來決策投資過程。
二、開發(fā)平臺
該數(shù)據(jù)挖掘系統(tǒng)是在MicrosofLNet的框架基礎上設計的。.NET框架是一種高度分布式的應用程序開發(fā)平臺。該平臺含有內(nèi)部網(wǎng)絡和外部網(wǎng)絡快捷開發(fā)的多項技術,可以進行敏捷軟件開發(fā)、快速應用開發(fā),支持多種語言,通用性、可移植性強、開發(fā)成本低、數(shù)據(jù)庫使用便捷。
ADO.NET是.NET環(huán)境中最常用到的數(shù)據(jù)接口,提供數(shù)據(jù)訪問服務。ADO.NET使用了多層次的資料處理架構(gòu),將中斷連接方式應用到程序設計中,提高了程序的延展性。
三、系統(tǒng)結(jié)構(gòu)功能設計與設計
3.1 數(shù)據(jù)庫連接配置
對數(shù)據(jù)庫進行操作的過程要保證安全性,在ADO.NET中實現(xiàn)這一功能時,需要請求連接,并對相關信息進行認證,認證成功后便可以通過客戶端對數(shù)據(jù)庫進行操作。為了實現(xiàn)數(shù)據(jù)檢索功能,定義了一系列基本方法,設置不同的鏈接字符串,用于對數(shù)據(jù)庫進行動態(tài)鏈接,以滿足業(yè)務查詢的需求。
3.2 數(shù)據(jù)采集
數(shù)據(jù)采集系統(tǒng)不但要對數(shù)據(jù)進行定時采集、壓縮和傳送,還要保證接收和加載等過程。為了使采集程序有更強的適應性,數(shù)據(jù)采集系統(tǒng)采用了兩級分工的工作模式:客戶端采集傳送,由服務端負責接收和加載,這樣可以大大提高在廣域網(wǎng)中可能出現(xiàn)的傳輸性能不佳情況下的傳輸效率。為了對不同采集條件、不同的數(shù)據(jù)源進行智能采集,客戶端采用了多模塊的工作方式,以實現(xiàn)不同的采集功能。
3.3 數(shù)據(jù)轉(zhuǎn)換
證券、銀行等系統(tǒng)進行系統(tǒng)切換時,需要進行數(shù)據(jù)遷移。數(shù)據(jù)遷移技術能夠?qū)㈦x線存儲和在線存儲進行融合,常常應用于系統(tǒng)升級、數(shù)據(jù)更新等工作中。數(shù)據(jù)遷移對于新系統(tǒng)的成功切換是至關重要的,它的質(zhì)量影響著系統(tǒng)上線和之后運行的穩(wěn)定。由于證券市場的特點,股票交易等信息變化迅速,必須要一種數(shù)據(jù)轉(zhuǎn)換系統(tǒng)來應對不斷動態(tài)變化的數(shù)據(jù)信息,及時地更新股票信息。
數(shù)據(jù)轉(zhuǎn)換系統(tǒng)使用了.NET平臺技術進行開發(fā),在源數(shù)據(jù)庫和目的數(shù)據(jù)庫之間進行直接轉(zhuǎn)換。
3.4 數(shù)據(jù)挖掘分析
經(jīng)過連接數(shù)據(jù)庫,采集數(shù)據(jù),數(shù)據(jù)轉(zhuǎn)換后得到的信息將被用于數(shù)據(jù)挖掘分析,采用蟻群算法對數(shù)據(jù)進行挖掘分析,主要步驟如下:(1)建立股票綜合評價指標體系;(2)選定蟻群分析范圍;(3)收集股票樣本指標數(shù)據(jù);(4)求行業(yè)指標均值;(5)數(shù)據(jù)標準化處理;(6)運行蟻群分析;(7)生成類譜圖;(8)分析聚類結(jié)果,尋找具有投資價值的股票,進行決策。
四、總結(jié)
證券行業(yè)形勢復雜多變,對大量的數(shù)據(jù)進行簡單的存儲記錄對開展業(yè)務、投資分析、推斷決策助力甚微。將數(shù)據(jù)挖掘技術應用于證券分析投資中,可以降低數(shù)據(jù)的冗余度。本文搭建基于.NET及SQL Sever平臺的證券分析系統(tǒng),對數(shù)據(jù)進行提取、轉(zhuǎn)化,根據(jù)一定模式進行處理,克服證券行業(yè)信息系統(tǒng)智能化水平低、數(shù)據(jù)簡單堆積的缺點,提高了數(shù)據(jù)的利用效率。