亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于FNN模型的決策算法研究

        2020-12-25 06:07:58侯慶山邢進生
        計算機技術(shù)與發(fā)展 2020年12期
        關(guān)鍵詞:分類

        侯慶山,邢進生

        (山西師范大學(xué) 數(shù)學(xué)與計算機科學(xué)學(xué)院,山西 臨汾 041000)

        0 引 言

        數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展和完善,吸引了相關(guān)信息產(chǎn)業(yè)和大量研究人員的注意。隨著計算機相關(guān)技術(shù)的不斷成熟和進步,數(shù)據(jù)量變得越來越龐大,更多的數(shù)據(jù)可以被利用。利用相關(guān)的數(shù)據(jù)挖掘技術(shù)可以將這些數(shù)據(jù)轉(zhuǎn)化為更有意義的信息和知識。收集到的信息可以應(yīng)用到市場調(diào)查、生產(chǎn)控制、進化分析和科學(xué)探索[1-2]等領(lǐng)域。樣本分類是一種重要的數(shù)據(jù)挖掘技術(shù),涉及到從現(xiàn)實世界的大型數(shù)據(jù)庫中提取出有效的知識模式。與有效知識數(shù)據(jù)挖掘的相關(guān)研究是非常重要的,決策過程的復(fù)雜程度以及決策結(jié)果的好壞往往取決于所用的分類方法是否有效。

        由于輸入數(shù)據(jù)的不精確性、模糊性、類別間邊界的重疊性以及特征定義的不明確性,在對數(shù)據(jù)樣本進行分類時的任何階段都可能存在不確定性。傳統(tǒng)的樣本分類算法中證據(jù)理論是模糊決策的有效工具,在對樣本分類時,往往需要對樣本的特征進行篩選、降維以及為樣本分配權(quán)重等處理。這些處理過程往往需要人工的參與,因此傳統(tǒng)的樣本分類算法通常是比較復(fù)雜的。首次出現(xiàn)的Dempster-Shafer證據(jù)理論[3]被認為是智能系統(tǒng)中推理不確定性信息的有效模型,但當高度沖突的證據(jù)被組合起來時,樣本數(shù)據(jù)的分類結(jié)果往往是錯誤的[4-6]。Murph等人[7]提出了一種基于計算所有證據(jù)平均值的證據(jù)組合方法,但并沒有考慮證據(jù)權(quán)重對于融合結(jié)果的影響,將所有的權(quán)重設(shè)定為同一值。Han等人[8]提出了一種改進的基于證據(jù)距離測量的平均組合方法,每個證據(jù)主體的權(quán)重都被考慮在內(nèi)。但其組合規(guī)則不能有效地處理高度沖突的證據(jù)組合。Deng等人[9]提出了一種新的加權(quán)平均證據(jù)組合方法,但隨著樣本特征增多,利用不確定性度量來確定證據(jù)主體的權(quán)重變得困難。

        總體上看,數(shù)據(jù)樣本分類[10-11]就是發(fā)現(xiàn)區(qū)分數(shù)據(jù)類型的相關(guān)模型算法,以便模型能夠預(yù)測具有未知類標簽值的樣本。人工神經(jīng)網(wǎng)絡(luò)[12-14]是一種流行的數(shù)據(jù)建模工具,可以執(zhí)行類似于人腦的智能任務(wù)。多層感知器反向傳播網(wǎng)絡(luò)[15-16]算法是神經(jīng)網(wǎng)絡(luò)領(lǐng)域中進行數(shù)據(jù)分類的可靠方法之一。徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)[17-18]是另一種利用徑向基函數(shù)作為激活函數(shù)的強大神經(jīng)網(wǎng)絡(luò)模型。此外,針對輸入樣本數(shù)據(jù)的不確定性,基于經(jīng)典集合論的模糊集合論[19-21]在處理現(xiàn)實生活中的不確定性方面是非常靈活的。在模糊系統(tǒng)中,特征與不同樣本類別的隸屬度相關(guān)聯(lián)。

        該文提出的算法與傳統(tǒng)的證據(jù)理論算法相比,利用神經(jīng)網(wǎng)絡(luò)模型并結(jié)合模糊理論對數(shù)據(jù)集進行有效的分類,避免了人工參與樣本特征分配權(quán)重、特征選擇等問題,過程更為簡單,效果更加良好。神經(jīng)網(wǎng)絡(luò)處理數(shù)值和定量數(shù)據(jù),模糊系統(tǒng)處理符號和定性數(shù)據(jù)。該算法有效地結(jié)合了這兩種方法的優(yōu)勢,利用基于模糊集理論的方法將模糊系統(tǒng)的類人邏輯推理與神經(jīng)網(wǎng)絡(luò)的學(xué)習相結(jié)合,樣本分類的算法效率大幅提升。

        1 基礎(chǔ)理論

        1.1 模糊理論

        1.1.1 模糊因素集和模糊因素權(quán)重集

        模糊因素集被定義為Ω={b1,b2,…,bm},其中bi,i∈[1,m]表示第i個決定分類結(jié)果的模糊因素。W={w1,w2,…,wm},其中wi,i∈[1,m]表示第i個影響因素對分類結(jié)果的影響程度。

        1.1.2 隸屬度函數(shù)

        模糊決策的結(jié)果與隸屬度函數(shù)存在緊密的聯(lián)系,隸屬度函數(shù)定義如下:對于模糊數(shù)據(jù)集Ω中的任意元素bi,都有一個數(shù)F(bi)∈[0,1]與其相對應(yīng),當bi在Ω中變動時,F(xiàn)(bi)稱作隸屬度函數(shù)。隸屬度的大小表明了輸入樣本屬于該類可能性的大小。

        1.2 前饋神經(jīng)網(wǎng)絡(luò)模型

        1.2.1 結(jié)構(gòu)組成

        前饋神經(jīng)網(wǎng)絡(luò)由多層連續(xù)的非線性函數(shù)構(gòu)成,包含輸入層、隱含層、輸出層三部分。結(jié)構(gòu)如圖1所示。

        圖1 前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

        1.2.2 前向傳播

        前饋神經(jīng)網(wǎng)絡(luò)可通過式(1)進行傳播。通過逐層的網(wǎng)絡(luò)傳遞,由輸出層將最終結(jié)果輸出。網(wǎng)絡(luò)的傳遞及輸出過程可由式(2)表達。

        (1)

        其中,fl(·)表示第l層網(wǎng)絡(luò)節(jié)點的激活函數(shù),W(l)∈Rm(l)×m(l-1)表示第l-1層和第l層之間的權(quán)值矩陣,其中m(l)表示第l層的節(jié)點個數(shù)。b(l)∈Rm(l)表示第l-1層和第l層之間的偏置值。z(l)∈Rm(l)表示第l層網(wǎng)絡(luò)節(jié)點的輸入值,a(l)∈Rm(l)表示第l層網(wǎng)絡(luò)節(jié)點的輸出值。

        x=a(0)→z(1)→a(1)→z(2)→…→a(L-1)→

        z(L)→a(L)

        (2)

        其中,L表示網(wǎng)絡(luò)的層數(shù)。

        1.2.3 反向傳播

        對于輸入樣本(X,y),網(wǎng)絡(luò)損失采用交叉熵損失,損失定義如式(3)所示。

        (3)

        (4)

        (5)

        通過隨機梯度下降法對網(wǎng)絡(luò)參數(shù)進行學(xué)習和調(diào)整,在網(wǎng)絡(luò)的迭代訓(xùn)練過程中,第l層權(quán)重和偏置參數(shù)的更新可由式(6)、式(7)表達。

        (6)

        (7)

        其中,α表示學(xué)習率。

        2 算法設(shè)計與實現(xiàn)

        2.1 隸屬度函數(shù)設(shè)計

        考慮N個輸入樣本,每個輸入樣本包含k個屬性,輸入樣本共屬于M個類別。定義輸入樣本集S={s1,s2,…,sn},樣本屬性集A={a1,a2,…,ak},樣本類別集C={c1,c2,…,cM}。定義的樣本屬性隸屬度函數(shù)可由式(8)表達。

        (8)

        i∈[1,k],j∈[1,n]

        式中,參數(shù)z決定了隸屬度函數(shù)的中心位置,參數(shù)e,l控制交界點處的斜率。隸屬度函數(shù)的形狀及位置由參數(shù)e,l,z決定,通過調(diào)控相關(guān)參數(shù)得到滿足需求的屬性隸屬度函數(shù)。輸入樣本某一類別的隸屬度可由式(9)表達。

        (9)

        j∈[1,n],i∈[1,k],m∈[1,M]

        對輸入樣本的類別隸屬度進行歸一化操作,可由式(10)表達。

        (10)

        2.2 基于模糊理論的神經(jīng)網(wǎng)絡(luò)設(shè)計

        (1)求解輸入樣本的隸屬度矩陣。

        假定包含N個輸入樣本s以及M個預(yù)測類別c,每個樣本包含了k個樣本特征a。

        (11)

        (2)設(shè)置神經(jīng)網(wǎng)絡(luò)激活函數(shù)與網(wǎng)絡(luò)損失。

        在輸入樣本前向傳播的過程中,樣本信息可由式(12)進行表達,將輸入信息z經(jīng)過網(wǎng)絡(luò)節(jié)點的激活函數(shù),得到網(wǎng)絡(luò)節(jié)點的激活值。為簡化計算,神經(jīng)網(wǎng)絡(luò)的激活函數(shù)選取ReLU與Swish-B激活函數(shù),由式(13)定義表達。

        (12)

        式中,W=[w1,w2,…,wn]∈Rd為權(quán)重向量,b表示偏置值。

        (13)

        針對樣本分類問題,神經(jīng)網(wǎng)絡(luò)的損失采用交叉熵損失函數(shù),可由式(14)表達。

        (14)

        式中,n表示輸入樣本的數(shù)量,m表示輸入樣本種類,yij表示第i個樣本屬于分類j的標簽值,取值為0或1。f(xij)表示樣本i被預(yù)測為j類別的概率。

        (3)網(wǎng)絡(luò)參數(shù)調(diào)節(jié)。

        將求解好的隸屬度矩陣輸入到神經(jīng)網(wǎng)絡(luò)中,利用反向傳播算法對網(wǎng)絡(luò)的參數(shù)進行不斷的迭代修正。算法描述如下:

        步驟:

        ①對網(wǎng)絡(luò)的權(quán)值參數(shù)W和b隨機初始化。

        ②對樣本訓(xùn)練集Ω中的樣本進行隨機抽取排序。

        ③從樣本訓(xùn)練集Ω中依次選取訓(xùn)練樣本(X(n),y(n))。

        ④通過前向傳播計算每一層的輸入值與激活函數(shù)的值。

        ⑤通過反向傳播算法調(diào)整每一層的誤差值,更新網(wǎng)絡(luò)的權(quán)值與偏置值。

        ⑥重復(fù)步驟②~⑤直到網(wǎng)絡(luò)模型在樣本驗證集上的錯誤趨于穩(wěn)定。

        輸出:權(quán)值矩陣W與偏置b。

        (4)預(yù)測集樣本的預(yù)測。

        利用訓(xùn)練好的人工神經(jīng)網(wǎng)絡(luò)對樣本預(yù)測集數(shù)據(jù)進行預(yù)測,對網(wǎng)絡(luò)性能做出評估。

        3 實 驗

        3.1 相關(guān)數(shù)據(jù)集說明

        選取鳶尾花數(shù)據(jù)集作為算法網(wǎng)絡(luò)的實驗數(shù)據(jù)集,鳶尾花數(shù)據(jù)集作為統(tǒng)計學(xué)習與樣本分類領(lǐng)域的經(jīng)典數(shù)據(jù)集,常被用于實驗測試。數(shù)據(jù)集中記錄了150條數(shù)據(jù),分為3類鳶尾花(Iris-Setosa,Iris-Versicolour,Iris-Virginica),每類鳶尾花包含了50條數(shù)據(jù)。每條數(shù)據(jù)記錄了鳶尾花的四個特征,即花瓣的長度和寬度,花萼的長度和寬度,通過鳶尾花的特征預(yù)測鳶尾花的品種。

        3.2 數(shù)據(jù)可視化分析

        (1)讀取鳶尾花數(shù)據(jù)集的csv文件,鳶尾花數(shù)據(jù)集中的部分數(shù)據(jù)如表1所示。每條數(shù)據(jù)包含了Sepal.Length、Sepal.Width、Petal.Length、Petal.Width四個屬性以及品種類別Species。數(shù)據(jù)集各類屬性的均值、方差、中位數(shù)、最大值和最小值等如表2所示。

        表1 數(shù)據(jù)集部分數(shù)據(jù)

        表2 數(shù)據(jù)集屬性值數(shù)據(jù)

        (2)繪制3類鳶尾花數(shù)據(jù)各屬性值與ID之間的關(guān)系圖,如圖2所示。

        (a)花萼長與ID之間關(guān)系

        (b)花萼寬與ID之間關(guān)系

        (c)花瓣長與ID之間關(guān)系

        (d)花瓣寬與ID之間關(guān)系

        ID為1~50的為Setosa鳶尾花,51~100的為Versicolour鳶尾花,剩余的為Virginica鳶尾花。通過關(guān)系圖可以直觀地分析各類鳶尾花的屬性值分布范圍。

        3.3 訓(xùn)練與預(yù)測

        3.3.1 數(shù)據(jù)處理

        在進行相關(guān)參數(shù)設(shè)定之前,首先要對鳶尾花數(shù)據(jù)集進行一系列的數(shù)據(jù)操作,對數(shù)據(jù)集的操作可從以下兩個方面考慮:

        (1)基于3.2節(jié)的數(shù)據(jù)分析,分析鳶尾花數(shù)據(jù)集中是否存在異常點,如果存在,將異樣點刪除,并處理某些樣本屬性的丟失值。丟失的樣本屬性值通常由該屬性基于統(tǒng)計信息的平均值替換。

        (2)對數(shù)據(jù)集進行相關(guān)性分析,分析樣本屬性之間是否存在相關(guān)性,如果存在,去除相關(guān)的冗余屬性。

        對處理過的數(shù)據(jù)進行劃分,將原始數(shù)據(jù)集劃分為訓(xùn)練數(shù)據(jù)集、測試數(shù)據(jù)集以及驗證數(shù)據(jù)集三個部分。其中,訓(xùn)練數(shù)據(jù)集包含80組鳶尾花數(shù)據(jù),驗證數(shù)據(jù)集包含40組鳶尾花數(shù)據(jù),驗證集用于監(jiān)測過擬合現(xiàn)象以及超參數(shù)的調(diào)整,測試數(shù)據(jù)集包含30組鳶尾花數(shù)據(jù),用于驗證模型的準確性。

        3.3.2 參數(shù)設(shè)定

        根據(jù)鳶尾花種類,設(shè)定3種不同參數(shù)的隸屬度函數(shù),求解樣本基于不同鳶尾花種類的隸屬值?;邙S尾花數(shù)據(jù)集的可視化分析,隸屬度函數(shù)中心位置參數(shù)Z分別設(shè)置為:Z1=5,Z2=6,Z3=7,其中Z1表示Setosa隸屬度函數(shù)的中心,Z2表示Versicolor隸屬度函數(shù)的中心,Z3表示Virginica隸屬度函數(shù)的中心。e1=1,e2=e3=2,l1=l2=l3=2。

        3.3.3 神經(jīng)網(wǎng)絡(luò)設(shè)計

        基于對鳶尾花數(shù)據(jù)集的分析,設(shè)計具有單隱含層的神經(jīng)網(wǎng)絡(luò)模型,采用隨機梯度下降法對網(wǎng)絡(luò)模型的參數(shù)進行學(xué)習。神經(jīng)網(wǎng)絡(luò)輸入層中的節(jié)點個數(shù)等同于隸屬度函數(shù)的種類個數(shù)。輸出層節(jié)點的數(shù)量與數(shù)據(jù)集中存在的類的數(shù)量相同。神經(jīng)網(wǎng)絡(luò)的輸入層為數(shù)據(jù)樣本對各類鳶尾花的隸屬度值,共有3個神經(jīng)元,輸出層為類別種類,共有3個輸出神經(jīng)元。對隱含層設(shè)置不同個數(shù)的神經(jīng)元,通過實驗選擇最優(yōu)隱含層神經(jīng)元個數(shù),以樣本分類準確率為評價指標,實驗結(jié)果如表3所示。

        表3 神經(jīng)元數(shù)目準確率測試結(jié)果

        根據(jù)實驗結(jié)果,最終隱藏層神經(jīng)元數(shù)目設(shè)定為4,選取ReLU作為隱含層和輸出層的激活函數(shù),Swish-B作為輸入層和隱含層的激活函數(shù),設(shè)置網(wǎng)絡(luò)誤差為0.000 1,學(xué)習率為0.01,最大迭代次數(shù)為100。模型訓(xùn)練過程的性能變化如圖3所示。

        圖3 不同隱層神經(jīng)元數(shù)目下的訓(xùn)練性能

        3.3.4 數(shù)據(jù)集訓(xùn)練和預(yù)測

        在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練階段,首先將鳶尾花數(shù)據(jù)集分為訓(xùn)練集、驗證集、預(yù)測集三部分,對其進行模糊化處理。把經(jīng)模糊化處理后的訓(xùn)練集應(yīng)用于提出的模糊神經(jīng)網(wǎng)絡(luò),訓(xùn)練網(wǎng)絡(luò)以建立模糊神經(jīng)網(wǎng)絡(luò)分類模型。在測試階段,通過模糊化處理后的測試集對模型性能進行評估,根據(jù)測試集樣本預(yù)測的準確性對模型進行評估。其詳細步驟如下:

        Step1:隨機抽取鳶尾花數(shù)據(jù)集中的80條樣本數(shù)據(jù)作為訓(xùn)練集,隨機抽取40條樣本數(shù)據(jù)作為驗證集,剩余部分數(shù)據(jù)作預(yù)測集。

        Step2:利用式(8)~式(10)求解出預(yù)測集樣本和驗證集樣本的隸屬度矩陣D1、D2。

        Step3:設(shè)置網(wǎng)絡(luò)誤差、學(xué)習率等相關(guān)參數(shù),利用訓(xùn)練集的隸屬度矩陣D1對網(wǎng)絡(luò)進行100次的迭代訓(xùn)練,利用驗證集的隸屬度矩陣D2對神經(jīng)網(wǎng)絡(luò)的超參數(shù)進行調(diào)整。模型迭代過程中的損失變化如圖4所示。

        圖4 模型訓(xùn)練過程中的迭代損失變化

        Step4:利用測試集樣本預(yù)測的準確率對模型的性能進行評估。

        3.4 實驗結(jié)果對比

        選取引言部分四種經(jīng)典的基于證據(jù)理論的樣本分類算法,計算傳統(tǒng)算法基于鳶尾花數(shù)據(jù)集的分類準確率,與文中提出的樣本分類方法進行比較,結(jié)果如圖5、表4所示。

        表4 準確率比較

        圖5 相關(guān)算法精確度比較

        隨著模糊神經(jīng)網(wǎng)絡(luò)訓(xùn)練迭代次數(shù)的增加,樣本分類的準確性最終穩(wěn)定到0.98,與基于證據(jù)理論的分類算法相比,樣本分類的準確率明顯提升。

        4 結(jié)束語

        由于基于證據(jù)理論的分類算法在進行樣本分類時過于復(fù)雜,樣本的某些屬性間存在相關(guān)性。另外,在復(fù)雜數(shù)據(jù)集上,基于證據(jù)理論的樣本分類算法往往不夠理想,隨著樣本屬性的增加,算法過程變得越來越復(fù)雜,數(shù)據(jù)集中樣本的沖突變得明顯。該文提出了一種基于模糊神經(jīng)網(wǎng)絡(luò)的樣本分類算法,并采用鳶尾花數(shù)據(jù)集對算法進行檢驗。與傳統(tǒng)的樣本分類算法相比,一方面,基于模糊神經(jīng)網(wǎng)絡(luò)的樣本分類算法不需要過多關(guān)注求解過程中的計算以及樣本某些屬性間是否存在相關(guān)性。另一方面,基于證據(jù)理論的樣本分類算法中存在如何將權(quán)重合理分配給相關(guān)特征等問題,基于模糊神經(jīng)網(wǎng)絡(luò)的樣本分類算法引入隨機梯度下降的方法,通過多次迭代訓(xùn)練結(jié)合反向傳播算法自動求解出合理的權(quán)重值。由實驗結(jié)果可知,基于模糊神經(jīng)網(wǎng)絡(luò)的樣本分類算法對分類問題的平均準確性為98%,樣本分類的準確性與傳統(tǒng)數(shù)據(jù)算法相比顯著提高。

        猜你喜歡
        分類
        2021年本刊分類總目錄
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        星星的分類
        我給資源分分類
        垃圾分類,你準備好了嗎
        分類討論求坐標
        數(shù)據(jù)分析中的分類討論
        按需分類
        教你一招:數(shù)的分類
        人妻精品无码一区二区三区| 国产欧美亚洲精品第二区首页| 天堂视频一区二区免费在线观看| 国产精品老熟女乱一区二区| 朋友的丰满人妻中文字幕| 女人色毛片女人色毛片18| 在线丝袜欧美日韩制服| av人妻在线一区二区三区| 狠狠摸狠狠澡| 久久午夜伦鲁片免费无码| 97精品国产高清自在线看超| 日本一级三级在线观看| 国产日韩欧美一区二区东京热| 国产全肉乱妇杂乱视频| 亚洲午夜看片无码| 日本免费看一区二区三区| 内射口爆少妇麻豆| 国产亚洲av人片在线观看| 国产在视频线精品视频www666| 亚洲精品aⅴ无码精品丝袜足| 黄色大片国产精品久久| 中国杭州少妇xxxx做受| 欧美成人一区二区三区| 精品一二区| 国产一区二区三区的区| 色先锋av影音先锋在线| 免费的毛片视频| 大屁股流白浆一区二区| 日韩女同视频在线网站| 日韩精品一区二区三区免费视频 | 四虎影视免费永久在线观看| 国产一区二区三区小说| 精品久久久亚洲中文字幕| 在线观看国产激情视频| 区二区三区玖玖玖| 亚洲欧洲精品国产二码 | 久久99天堂av亚洲av| 4hu四虎永久在线观看| 国产资源精品一区二区免费| 亚洲国产av自拍精选| 美女脱了内裤露出奶头的视频|