摘要:數(shù)據(jù)挖掘是一種潛在的功能強大的新技術(shù),它是在大型數(shù)據(jù)中發(fā)現(xiàn)隱含模式和關(guān)系的過程。它能幫助企業(yè)在他們的數(shù)據(jù)倉庫中找到最重要的信息。數(shù)據(jù)挖掘工具能預(yù)測未來趨勢和行為,使得商務(wù)活動具有前瞻性,并作出具有知識驅(qū)動的決策。外匯市場中波動的客觀存在使外匯持有者有可能蒙受巨大損失,本文通過數(shù)據(jù)挖掘中的相關(guān)技術(shù)對外匯市場的走勢進行預(yù)測的。
關(guān)鍵詞:數(shù)據(jù)挖掘;人工神經(jīng)網(wǎng)絡(luò);匯率
中圖分類號:F820文獻標識碼:A文章編號:1009-3044(2008)28-0033-02
The Forecast Functions of Data Mining in Foreign Exchange Market
CHEN Feng-juan
(Liaoning University of International Business and Economics, Dalian 116052, China)
Abstract: Data mining is a new technology with big potentialfunctions.It is a process whichcanfind hiden patterns and relations in the a large number of datas.It also can help the enterprise find the most important information from their data warehouse.Data mining has forecast functions ,it canmake decisions which drived by knowledge.The fluctuates inforeign exchange market make many people lose their money.This paper forecast the tendency of the foreign exchange market by technology of data mining.
Key words: data mining; artificial neural networks; exchange rate
1 引言
數(shù)據(jù)挖掘(Data Mining),簡稱 DM,它的本質(zhì)就是發(fā)現(xiàn)數(shù)據(jù)實質(zhì)與數(shù)據(jù)間的關(guān)系的探索過程,找出潛在于數(shù)據(jù)中的現(xiàn)實事務(wù)的規(guī)律和趨勢,進而把感覺轉(zhuǎn)化為事實。它與傳統(tǒng)的數(shù)據(jù)分析的本質(zhì)區(qū)別是數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識。數(shù)據(jù)挖掘所提供的自動的預(yù)期分析已經(jīng)遠遠超出由典型的決策支持系統(tǒng)工具對過去事件所做的回顧性分析的范圍[1]。
外匯市場中有大量的信息,它的波動性非常大,趨勢很難把握,本文從數(shù)據(jù)挖掘的預(yù)測算法出發(fā),分析外匯市場中的數(shù)據(jù),對外匯市場進行預(yù)測。
2 數(shù)據(jù)挖掘的基本概念
數(shù)據(jù)挖掘就是從大型數(shù)據(jù)庫的數(shù)據(jù)中提取人們感興趣的知識,這些知識是隱含的、事先未知的、但潛在有用的信息,提取的知識可以表示為概念、規(guī)則、規(guī)律、模式等形式。數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術(shù),其主要特點是對商業(yè)數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)進行抽取、轉(zhuǎn)換、分析和其它模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù) [2]。
2.1 數(shù)據(jù)挖掘的功能
數(shù)據(jù)挖掘通過預(yù)測未來趨勢及行為,做出前瞻的、基于知識的決策。數(shù)據(jù)挖掘的目標是從數(shù)據(jù)中發(fā)現(xiàn)隱含的、有意義的知識。具體的功能有以下7個方面。
1) 概念描述;2) 關(guān)聯(lián)分析;3) 分類與預(yù)測;4) 聚類分析;5) 趨勢分析;6) 孤立點分析;7) 偏差分析。
預(yù)言是通過分類或估值起作用的,也就是說,通過分類或估值得出模型,該模型用于對未知變量的預(yù)言。從這種意義上說,預(yù)言其實沒有必要分為一個單獨的類。預(yù)言其目的是對未來未知變量的預(yù)測,這種預(yù)測是需要時間來驗證的,即必須經(jīng)過一定時間后,才知道預(yù)言準確性是多少[3]。
3 外匯市場的相關(guān)特點
3.1 匯率的概念及標價
匯率就是以一國貨幣表示另一國貨幣的價格,或者說是兩種貨幣折算時的比例?,F(xiàn)在,國際上主要通行兩種標價方法:
1) 直接標價法:是以一個單位的外國貨幣表示若干本國貨幣的方法。也就是說,將外國貨幣當作商品,而本國貨幣作為價值尺度。
2) 間接標價法:是以一定單位的本國貨幣為標準,來計算應(yīng)該收取多少單位的外國貨幣。也就是說,本國貨幣被當作商品,用外國貨幣的數(shù)額來表示本國貨幣的價格,充當了價 值尺度。
3.2 匯率的種類
1) 按匯率的穩(wěn)定性分為固定匯率和浮動匯率
固定匯率指一國貨幣同另一國貨幣的匯率基本固定 , 其波動被限制在極小的范圍內(nèi) , 波動幅度很小。浮動匯率指一國貨幣當局不規(guī)定本幣對 其它貨幣的官方匯率 , 外匯匯率完全由市場供求關(guān)系來決定。
2) 按外匯交易期限可分為即期匯率和遠期匯率
即期匯率是指買賣雙方在達成交易后的兩個工作日內(nèi)進行外匯資金收付的匯率。遠期匯率是指買賣雙方在達成交易后的一定時期以后進行外匯資金交割的匯率。
3) 按匯率是否適用于不同來源與用途可分為單一匯率和多重匯率
單一匯率指一國對外只有一個匯率 , 不同來源和用途的外匯收支均按此進行結(jié)算。多重匯率指一國對某一外幣的匯價因來源與用途不同而規(guī) 定兩種以上的匯率。
3.3 影響匯率變動的因素
一國匯率的變動要受到許多因素的影響 , 既包括經(jīng)濟因素 , 又包括政治因素與心理因素等。而各個因素之間又有互相依存、互相制約的關(guān)系。同時, 同一個因素在不同的國家、 在不同的時間內(nèi)所起的作用也不相同 , 所以匯率變動在不同的時間內(nèi)所起的作用也不相同,所以匯率變動是一個極其錯綜復(fù)雜的問題[4]。
4 基本外匯預(yù)測方法
預(yù)測外匯市場行為的兩種主要分析方法是: 技術(shù)分析和基本面分析。它們的用途相同——預(yù)測價格或走勢。 技術(shù)分析員研究影響,而基本面分析員研究市場走勢的起因。 許多成功的交易人結(jié)合兩種方法而取得了豐碩的成果。
4.1 技術(shù)分析
技術(shù)分析是一種通過研究過去市場行為的圖表來預(yù)測價格走勢和期貨市場趨勢的方法。 技術(shù)分析關(guān)心市場中實際發(fā)生了什么而不是將會發(fā)生什么,它根據(jù)金融工具的價格和交易量的數(shù)據(jù)制作出圖表,并將其作為主要工具使用。 技術(shù)分析的另一個優(yōu)點是有經(jīng)驗的分析師能同時關(guān)注許多市場和市場工具。
技術(shù)分析基于下面三個個要素:
1) 市場行為包容消化一切
這就是說實際價格反映了一切可能影響市場的因素,例如供給和需求、政治因素和市場觀點。 然而真正的技術(shù)分析師只關(guān)心價格走勢本身,而不是引起變化的原因。
2) 價格跟隨走勢
技術(shù)分析用于定義長期處于主導(dǎo)地位的市場行為模式。 對于許多給定的模式,有很大可能會產(chǎn)生預(yù)期的結(jié)果。 另外,也有一些已知的經(jīng)常重復(fù)的模式。
3) 歷史不斷重演
外匯圖表的認知和歸類已經(jīng)超過一百年了,許多模式不斷重復(fù)的事實證明人類的心理隨著時間推移并沒有什么大的改變。
4.2 基本面分析
基本面分析是預(yù)測金融工具遠期價格走勢的方法,是基于經(jīng)濟、政治、環(huán)境以及其它影響支撐金融工具的基本供給和需求的相關(guān)因素和統(tǒng)計數(shù)字。 在實踐中,許多市場參與者結(jié)合使用技術(shù)分析和基本面分析來決定他們的交易策略。 技術(shù)分析的一個主要優(yōu)點是經(jīng)驗豐富的分析師能同時關(guān)注許多市場和市場工具,而基本面分析師需要深入了解某個特定的市場。 基本面分析著重于市場中應(yīng)該發(fā)生的事。 價格分析涉及的因素包括: 供給和需求、季節(jié)循環(huán)、天氣以及政府政策。
基本面分析研究市場走勢的起因,而技術(shù)分析研究其影響?;久娣治鍪菍ω泿沤灰讜r機進行的宏觀或戰(zhàn)略評估,以除了其價格走勢以外的任何標準為基礎(chǔ)。 這些標準通常包括貨幣發(fā)行國的經(jīng)濟狀況、貨幣政策和其它”基礎(chǔ)”要素。
5 數(shù)據(jù)挖掘的預(yù)測算法
5.1 基于人工神經(jīng)網(wǎng)絡(luò)的匯率預(yù)測方法
人工神經(jīng)網(wǎng)絡(luò)( Artificial Neural Networks, 簡寫為ANNs)也簡稱為神經(jīng)網(wǎng)絡(luò)(NNs)或稱作連接模型(Connectionist Model),是對人腦或自然神經(jīng)網(wǎng)絡(luò)(Natural Neural Network)若干基本特性的抽象和模擬。人工神經(jīng)網(wǎng)絡(luò)以對大腦的生理研究成果為基礎(chǔ),其目的在于模擬大腦的某些機理與機制,實現(xiàn)某個方面的功能。國際著名的神經(jīng)網(wǎng)絡(luò)研究專家,第一家神經(jīng)計算機公司的創(chuàng)立者 與領(lǐng)導(dǎo)人HechtNielsen給人工神經(jīng)網(wǎng)絡(luò)下的定義就是:“人工神經(jīng)網(wǎng)絡(luò)是由人工建立的以有向圖為拓撲結(jié)構(gòu)的動態(tài)系統(tǒng),它通過對連續(xù)或斷續(xù)的輸入狀態(tài)而進行相應(yīng)的信息處理?!盵5]
目前在神經(jīng)網(wǎng)絡(luò)研究方法上已形成多個流派,最富有成果的研究工作包括:多層網(wǎng)絡(luò) BP算法,Hopfield網(wǎng)絡(luò)模型,自適應(yīng)共振理論,自組織特征映射理論等。
神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法有許多種,它在非線性預(yù)測方面具有明顯的優(yōu)勢 , 其用于匯率預(yù)測是有效的。
5.2 基于貝葉斯網(wǎng)絡(luò)的匯率預(yù)測方法
貝葉斯分類是統(tǒng)計學(xué)分類方法。它們可以預(yù)測類成員關(guān)系的可能性,如給定樣本屬于一個特定類的概率。貝葉斯分類基于貝葉斯定理,分類算法的比較研究發(fā)現(xiàn),一種稱作樸素貝葉斯分類的簡單貝葉斯分類算法可以與判定樹和神經(jīng)網(wǎng)絡(luò)分類算法相媲美。用于大型數(shù)據(jù)庫,貝葉斯分類也已表現(xiàn)出高準確率與高速度。
樸素貝葉斯分類假定一個屬性值對給定類的影響?yīng)毩⒂谄渌鼘傩缘闹?。該假定稱作類條件獨立。做此假定是為了簡化所需計算,并在此意義下稱為“樸素的”。 當假定成立時,與其它所有分類算法相比,樸素貝葉斯分類是最精確的[6]。
用貝葉斯網(wǎng)絡(luò)對外匯市場進行數(shù)據(jù)挖掘,產(chǎn)生匯率變化趨勢的短期預(yù)測結(jié)果。要想改善貝葉斯網(wǎng)絡(luò)的預(yù)測精度 ,一方面需要能夠得到大量的數(shù)據(jù)來對貝葉斯網(wǎng)絡(luò)進行訓(xùn)練;另外一方面就是找到一個合適的方法能夠?qū)⒔?jīng)濟領(lǐng)域?qū)<业慕?jīng)驗知識以貝葉斯網(wǎng)絡(luò)所要求的形式進行表達,使得貝葉斯網(wǎng)絡(luò)完全將這些領(lǐng)域知識結(jié)合進去。
通過以上的分析 , 要想改善貝葉斯網(wǎng)絡(luò)的預(yù)測精度 , 一方面需要能夠得到大量的數(shù)據(jù)來對貝葉斯網(wǎng)絡(luò)進行訓(xùn)練; 另外一方面就是要找到一個合適的方法能夠?qū)⒔?jīng)濟領(lǐng)域?qū)<业慕?jīng)驗知識以貝葉斯網(wǎng)絡(luò)所要求的形式表達出來,使得貝葉斯網(wǎng)絡(luò)完全將這些領(lǐng)域知識結(jié)合進去。
6 結(jié)束語
數(shù)據(jù)挖掘具有的預(yù)言功能在很多大型的數(shù)據(jù)庫中有廣泛的應(yīng)用,在外匯瞬息萬變的市場中存在著大量的數(shù)據(jù),同時也存在著各種分析方法,使用數(shù)據(jù)挖掘的算法能對外匯市場進行一些預(yù)測。本文對數(shù)據(jù)挖掘的一些預(yù)測算法進行了分析,希望能對相關(guān)的研究起到一些作用。
參考文獻:
[1] 韓家煒.數(shù)據(jù)挖掘:概念與技術(shù)[M].北京:機械工業(yè)出版社,2001.
[2] 毛國君.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2005.
[3] 史忠植.知識發(fā)現(xiàn)[M].北京:清華大學(xué)出版社;2002.
[4] 吳俊德.外匯交易及資金管理[M].北京:中信出版社,2001.
[5] 韓力群.人工神經(jīng)網(wǎng)絡(luò)理論、設(shè)計及應(yīng)用[M].北京:化學(xué)工業(yè)出版社,2007.
[6] 戴葵. 神經(jīng)網(wǎng)絡(luò)設(shè)計[M].北京:機械工業(yè)出版社,2005.