趙凱
摘 要:隨著現(xiàn)在科技的快速發(fā)展,各種科技方法也隨之孕育而生,例如信號處理、人工智能和模式識別等學科在各個領域都有所發(fā)展,當今的分析手段也由原先的人工分析轉(zhuǎn)向智能化進行轉(zhuǎn)變,但是其機構和內(nèi)部的運行是較為復雜多變,現(xiàn)在更加強調(diào)的是處理方法和概念上改進,其中?;嬎銊t是強調(diào)從實際中進行處理,然后再是使用可行滿意的近似解進行求解,這樣來優(yōu)化方法,使得方法也變得知識化,再使用一般的邏輯思維方法來求解方法。而模糊理論使用語義變量的性質(zhì),這樣來處理在實際中出現(xiàn)的不確定性的煩惱,因此其也被應用于各大領域里。對于模糊理論的模糊時間序列的定義,對存在的模糊時間序列的模型進行分析,在這個的基礎上再進一步的加入模糊時間序列的預測模型,為了更為精準的選擇方法,文章先是對數(shù)據(jù)進行擬合,再選擇合適的方法處理后續(xù)的工作,對于結果常常是選擇MSN、平均誤差和標準誤差來評價一個指標。
關鍵詞:模糊時間;計算機信息粒;平均誤差;標準誤差
中圖分類號:TP311.13 ? 文獻標識碼:A ? ? ?文章編號:1001-5922(2020)10-0182-06
Abstract:With the rapid development of science and technology, a variety of scientific and technological methods are also born. For example, signal processing, artificial intelligence and pattern recognition have developed in various fields. Today's analytical methods have also changed from the original artificial analysis to the intelligence. However, their organization and internal operation are more complex and changeable. Now it is more emphasized that the processing method and concept are improved, in which granulation calculation emphasizes processing from the reality, and then using feasible and satisfactory approximate solution to solve, so as to optimize the method, make the method also become knowledge, and then use the general logical thinking method to solve the method. Fuzzy theory uses the nature of semantic variables to deal with the problems of uncertainty in practice, so it is also applied in various fields. For the definition of fuzzy time series in fuzzy theory, the existing model of fuzzy time series is analyzed, on this basis, we will further add fuzzy time series forecasting models. In order to select more accurate methods, the paper first fit the data, and then select the appropriate method to handle the subsequent work. For the results, we often choose MSN, average error and standard error to evaluate an index.
Key words:fuzzy time; computer information granule; average error; standard error
0? ? ?引言
隨著現(xiàn)在科技的快速發(fā)展,經(jīng)濟也隨著增長,預測在我們實際生活中逐漸也占據(jù)著很大的地位,最為明顯的一個便是在股市和人口的預測,當今股市的預測也是成為當今的研究的熱點,股市中的股票指數(shù)具有隨機性、時變性和非線性關系等特征,現(xiàn)在研究關于股票的預測模型也隨之多種多樣,在1999年,我國的科研人員就就對上證的綜合指數(shù)采用時間序列的方式進行了研究,還建立了ARIMA模型,在建立模型的第一步便是先對上證指數(shù)進行數(shù)據(jù)擬合,預測一下大致的模型類型,然后再依據(jù)這個方向進行選擇合適的數(shù)學模型,尋找出數(shù)據(jù)之間的規(guī)律,再實際生活中我們常常是采用ARIMA的預測模型,并對時間進行大致的預測。
1? ? ?模糊時間序列
1.1 模糊時聞序列的定義
模糊時間序列[1]這個定義是在1993年的時候在國外提出的,具體的定義是將U定義為論域,并將U依次劃分成多個小的論域,同時將A在U的論域上定義為語義變量集,f ^是A上的隸屬函數(shù)[2],uk是A上的模糊集A,其中的元素是u,F(xiàn)(t)是X(t),(t-1,2,…)上的模糊時間序列。
1.2? ?不同模糊時間序列模型分析
國外的學者So和Chissom定義了模糊時間序列后,隨后也有很多的外國學者也提出了很多的模糊時間序列的預測模型[3]和方法,像什么Song和Chissom的變時間模型、基于均值的模糊時間序列模型和馬爾科夫模型等一系列的模型,并對此重新定義了論域和區(qū)間間隔,在論域上也將模糊集、模糊語義變量重新定義了一下,將模糊邏輯的關系和類別和關系也再一次重新分類了,將最為基礎的名詞定義完后,就可以將模型用于預測。
以上的模型是通過大量的計算來確定模糊的邏輯關系,如果遇到較為難的模糊邏輯關系,max-minde運行的時間也是需要大量的時間才可以計算出結果的,這個模型也是有一定缺陷的,這種模型是沒有考慮到模糊區(qū)域的精確度的問題。若是再區(qū)間是有較大的間隔,那么模糊時間的序列就會有較大的波動性,這種波動性就只有當區(qū)間的間隔是比較小的時候,才不會表達的較為明顯,這種模型如果要應用的話,就的先計算出所有數(shù)據(jù)的絕對誤差和絕對誤差的平均數(shù),而且還要再這個的基礎上重新定義模糊集、模糊語義變量,同時對模糊時間序列模型進行重新構建,將上證指數(shù)進行進一步的預測,以上的模型相互比較,我們可以通過縮短區(qū)間的間隔來提高最后結果的精度。再模型里,常常是依據(jù)以往的大量數(shù)據(jù)來對模糊集進行定義,第1步是先將1組有規(guī)律的預測數(shù)據(jù)進行1個大致方向的預測,再和舊的模糊時間序列模型進行相比,通過這樣的方式來提高預測精度,相較于另1個模型,那種模型就沒有考慮到模糊集的區(qū)間間隔的預測精度,對此我們也可以通過其他的方式來對精度進行提高。
1.3? ?一種新的基于模糊時間序列的預測方法
在預測方法的基本思路里,可以將Chen模型重新分別出模糊集和sI1n模型重新定義的模糊集相互進行結合,從而就提出了一種基于模糊時間序列的預測模型。
此種方法的大致思路就是,第1步先是計算出A;和A:的絕對誤差[4],然后再是將絕對誤差的平均數(shù)的一半來對間隔的區(qū)間進行縮短,第2步便是將統(tǒng)計的對象歷史數(shù)據(jù)再區(qū)間隨機進行分布,對于如何劃分出模的區(qū)間是要依據(jù)統(tǒng)計的結果的,將劃分的絕對誤差作為劃分的依據(jù),再就是模糊集語義變量和模糊集是要進行重新定義,對于歷史的數(shù)據(jù)也是要進行模糊化,這樣來確定模糊的關系性。以上的預測方法如下所示:
1)先把U定義出來,同時劃分出論域,如表1是上證指數(shù)[5]的數(shù)據(jù)表:
依據(jù)絕對誤差進行劃分區(qū)間,上表的定義域是[3076,3801],最后的劃分結果如表2。
2)表3便是將歷史的數(shù)據(jù)見進行再區(qū)間上分布,再按每個區(qū)間的具體數(shù)目進行分布,這樣來劃分出區(qū)間。
3)根據(jù)表4的區(qū)間來重新定義模糊集,A是上證股所形成的模糊集的語義變量,相對而言,表1就是根據(jù)歷史數(shù)據(jù)的模糊化,定義如下。
對于不同的方法我們常常都是采用MSN、平均誤差和標準差[6]這3個指標來對上證指數(shù)進行預測評估的,3個指標的運算公式如下:
3個公式里:實際指數(shù):表示第iE1實際指數(shù)值,誤差的百分比是指實際指數(shù)*100%f得到的值,從表中,我們也不難發(fā)現(xiàn)我們所選擇的3個指標數(shù)值是最小的,最后的預測結果也是精度最高的。
2? ? ?計算機信息粒構建
2.1? ?信息?;喗?/p>
信息?;钕仁窃谕鈬难芯繂T提出來的,信息粒化的基本思路是將1個整體劃分成1個小的部分,使得每1個部分成為1個信息粒,外國的學者就對此指出:信息粒其實就是一些元素的集合,元素之間是依據(jù)相似性、接近的功能而融合再一起。其實現(xiàn)在都是數(shù)字化的時代,信息粒在我們的生活中也是無處不在。
其實信息粒本就是我們認識世界的一個基礎,當對世界進行認知的時候,我們常會把一些相似的種類放置在一起來研究,并發(fā)現(xiàn)他們的規(guī)律和性質(zhì)所在,子啊解決這類事情的時候,我們常常會利用信息粒的研究方式。最為常見的便是在時間上的劃分,將時間分成年、月、日和時等一些系列的時間單位。信息粒可以更為細致的劃分,粒其實可以有非模糊的?;绞?,這在很多方法中起著很重要作用。參見表5、表6。
其實很多的推理中,粒都是模糊化,而對于非模糊的?;膊]有有如此的現(xiàn)象,模糊的信息粒其實是起源于人類的?;畔?,在這個的基礎上進行不斷的衍生出來。
信息粒化有3種模型,有2種是從理論上進行分的,有模糊集理論和粗糙集理論,最后1種模型是商空間理論,并且3種模型相互間都是有關聯(lián)的,其中模糊集理論和粗糙集理論都是有很強的互補性,主要是他們可以通過理論的優(yōu)化和整合來解決問題的不完整性和隨機性,商空間理論[7]和粗糙集理論[8]則是利用等價的方式來敘述粒化,用?;瘉碚f概念,唯一不同的是他們的起始點不同罷了,其中商空間理論研究的是空間關系,而粗糙集理論則是研究的論域里的對象點集,點集之間的拓撲拓撲關系就會沒有考慮到,相較于商空間論就是考慮了商空間之間的論域元素之間的拓撲關系,其實論域就是一個拓撲空間,下面我們主要是研究模糊集理論的模型,而對于其他的2種模型我們就沒做過多的詳細說明。在20世紀的60年代,美國的著名數(shù)學家就提出了模糊集合論,并在這個的基礎上衍生出了模糊信息?;膯栴},對應的數(shù)據(jù)粒公式如:
公式(1)中的G是模糊子集,用隸屬函數(shù)來進行刻畫,x是論域U中變量。
g -就是表達出現(xiàn)的可能性如何,劃分可能、不可能和很不可能這3種情況是依據(jù)x和y之間的相對大小如何,像這種信息粒的刻畫是不具有概率性的,也是1種較為特殊的現(xiàn)象,在實際中常把這2種劃分成2種,1種模糊粒是 πp-粒,另外一種就是π-粒,美國提出這一結論的教授認為,人們可以使用語言來表達思想、判斷和推理,其實語言也就是1種很粗的?;?,那么如果要對語言進行推理和判斷,就得先計算俠義的模糊詞,需要利用到的數(shù)學概念和運算有:加、減、乘和除,通過這些方式來構建1個系統(tǒng)的數(shù)學體系來,同時還得考慮到模糊邏輯的概念和其他的代數(shù)結構,這樣來構建用詞來的定義域的類似結構。
2.2? ?模糊信息?;椒P?/p>
相應的概念建立好了之后,就的考慮如何來進行模型的構建工作了,對于非模糊的信息?;玫降姆椒ㄓ泻芏?,種類分為3種,其中有區(qū)間信息?;?、像空間信息粒化和信息密度的信息?;@幾種方法在很多的科研工作中也是被廣泛的應用,但是像非模糊的信息粒都是在很多的前提條件下進行的,并且它也不能更為精準的描述出事物的特征,所以建立模糊的信息粒就是我們的首要之選。
模糊信息粒將模糊集的形式來表達信息粒,將時間序列進行模糊?;_@個過程可以分成大致的2個部分:第1個部分是劃分窗口和第2個部分是模糊劃分窗口,其實模糊劃分窗口就是將時間序列分成無數(shù)個小的序列。模糊化就是將產(chǎn)生的每一個窗口模糊化,模糊信息粒是生成無數(shù)個模糊集,而將這2種廣義的模式相結合就為信息粒,這種信息粒為f-?;?,在模糊的過程中最為關鍵的就是將創(chuàng)建一個合理的模糊集,通過這樣來取代模糊化的過程的舊窗口,下面所用的?;椒ň褪荳itold Pedrycz(W. Pedrycz),經(jīng)常所用的模糊粒子的基本形式有拋物線型、梯形和三角型。見圖1~圖4。
3? ? ? 結語
模型的構造是把Chen模型重新分出模糊集和Sun模型來選擇模糊集的區(qū)間的間隔這2種思想相互結合,從而衍生出一種新型的模糊時間序列方法來預測上證指數(shù)。在表5中,計算出模型的MSN、平均誤差(%)和標準差(%)這3個指標來懸著合適的模型?;谛畔⒘;瘉碜鲆粋€回歸分析,在這個的基礎上應用于MatlabGUI來對數(shù)據(jù)進行信息?;挠^察,這個軟件也被用于機器學習和回歸分析。
參考文獻
[1]梁小珍,鄔志坤,楊明歌,等.基于二次分解策略和模糊時間序列模型的航空客運需求預測研究[J].中國管理科學,2019:1-11.
[2]李守強,田世龍,李梅,等.主成分分析和隸屬函數(shù)法綜合評價15種(系)馬鈴薯的營養(yǎng)品質(zhì)[J].食品工業(yè)科技,2020,41(06):272-276+291.
[3]王思遠,譚瀚霖,李東杰.基于改進傳染動力學易感-暴露-感染-恢復(SEIR)模型預測新型冠狀病毒肺炎疫情[J].第二軍醫(yī)大學學報,2020(3):1-5.
[4]魏琦,張少峰,吳常鋮,等.基于最大長度序列的二維絕對位置檢測方法的誤差分析[J].電子測量與儀器學報,2019,33(10):82-88.
[5]閔詩筠.經(jīng)濟政策不確定性對我國股市波動的影響——基于2007—2019年上證指數(shù)的實證分析[J].江蘇商論,2020(03):88-92.
[6]薛麗,李聰凱,賈元忠.考慮質(zhì)量損失和預防維修策略下的VSIEWMA標準差控制圖經(jīng)濟決策模型[J/OL].工業(yè)工程與管理:1-12[2020-05-05].http://kns.cnki.net/kcms/detail/31.1738.t.20200408.1816.015.html.
[7]王允強.基于數(shù)學形態(tài)學和商空間粒度計算的車牌定位算法的研究[D].合肥:安徽大學,2011.
[8]孫曙光,王銳雄,杜太行,等.基于粗糙集與證據(jù)理論的交流接觸器預期電壽命預測[J/OL].電工技術學報:1-12[2020-05-05].https://doi.org/10.19595/j.cnki.1000-6753.tces.190633.