吳思楠
摘 要:文章研究了情緒神經(jīng)網(wǎng)絡(luò)的效率,該網(wǎng)絡(luò)使用改進(jìn)的反向傳播學(xué)習(xí)算法。實(shí)驗(yàn)結(jié)果表明,人工情緒可以成功建模并有效實(shí)施,以改善神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)和普遍性。
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);反向傳播算法;人工情感建模;面部識(shí)別
人們?cè)谔囟〞r(shí)刻的感覺在臨床術(shù)語中被稱為“情緒”。6種基本情緒被認(rèn)為是快樂、悲傷、憤怒、恐懼、厭惡和驚訝,而其他已知的人類情感往往被視為這6種復(fù)雜社交情境的特殊化。研究人員從各種觀點(diǎn)研究了情緒在人工智能中的作用:開發(fā)與人類更優(yōu)雅互動(dòng)的代理人和機(jī)器人,開發(fā)利用情緒模擬來輔助自己推理的系統(tǒng),或創(chuàng)建更接近人體情感互動(dòng)和學(xué)習(xí)的機(jī)器人。皮卡德指出:“智能復(fù)雜自適應(yīng)系統(tǒng)中將會(huì)有功能,它們必須響應(yīng)不可預(yù)測(cè)的復(fù)雜信息,這些信息起著情感在人們身上發(fā)揮作用的作用?!币虼?,對(duì)于計(jì)算機(jī)以實(shí)時(shí)方式響應(yīng)復(fù)雜的情感信號(hào),他們將需要像我們所擁有的系統(tǒng),我們稱之為情感。
人類的情感不僅是一種合乎邏輯的理性成分,它們與行為和感情緊密相連。人類情感系統(tǒng)在生存、社會(huì)互動(dòng)和合作以及學(xué)習(xí)中起著至關(guān)重要的作用。機(jī)器需要一種情感—機(jī)器運(yùn)動(dòng)。因此,我們可以確定智能機(jī)器需要情緒,以便在學(xué)習(xí)復(fù)雜任務(wù)時(shí)以及在對(duì)人類的學(xué)習(xí)和決策制定進(jìn)行建模時(shí)提高其表現(xiàn)。
情緒在人類決策過程中發(fā)揮著重要作用,因此,當(dāng)我們?cè)噲D模擬人類反應(yīng)時(shí),它們應(yīng)該嵌入推理過程中。Bates使用Ortony等描述的模型提出了一個(gè)可信的代理人。該模型僅描述了基本情緒和先天反應(yīng);然而,它為構(gòu)建計(jì)算機(jī)情感模擬提供了一個(gè)很好的起點(diǎn)。Kort等提出了一個(gè)模型,他們的目的是概念化情緒對(duì)學(xué)習(xí)的影響,然后,建立一個(gè)工作的基于計(jì)算機(jī)的模型,將識(shí)別學(xué)習(xí)者的情感狀態(tài)并對(duì)其作出適當(dāng)?shù)姆磻?yīng),以便學(xué)習(xí)將以最佳的速度進(jìn)行。Poel等引入了模擬混合神經(jīng)網(wǎng)絡(luò)架構(gòu),用于情緒學(xué)習(xí)。系統(tǒng)從注釋數(shù)據(jù)中學(xué)習(xí)如何產(chǎn)生情緒狀態(tài)以及由內(nèi)部和外部刺激引起的變化。Clocksin探討了記憶中的問題,并結(jié)合可能的人工認(rèn)知架構(gòu)進(jìn)行了研究。這項(xiàng)工作與人工智能研究中考慮記憶和情感的傳統(tǒng)方式背道而馳,并且源于社會(huì)和發(fā)展心理學(xué)中出現(xiàn)的兩種思想[1]。
本文提出了一種基于情緒反向傳播學(xué)習(xí)算法的情緒神經(jīng)網(wǎng)絡(luò)。情緒神經(jīng)網(wǎng)絡(luò)具有兩種模擬情緒,有助于網(wǎng)絡(luò)學(xué)習(xí)和分類過程。這兩種情緒是焦慮和自信。結(jié)合這些情緒參數(shù)的基本原理是它們對(duì)我們?nèi)祟愓J(rèn)知過程中的學(xué)習(xí)的影響。在實(shí)踐中,兩個(gè)情感參數(shù)意味著當(dāng)情緒神經(jīng)網(wǎng)絡(luò)被訓(xùn)練時(shí),一個(gè)是使用所有節(jié)點(diǎn)作為訓(xùn)練模式樣本的輸入平均值,另一個(gè)是某種程度上的增加慣性項(xiàng)用于在訓(xùn)練時(shí)期進(jìn)展時(shí)修改從一種模式到下一種模式的變化水平。從數(shù)學(xué)的角度來看,當(dāng)接近成本函數(shù)的最小值時(shí),我們不希望被單個(gè)模式的誤差所左右,其中一些模式可能是異常值。因此,我們關(guān)注最近學(xué)習(xí)步驟積累的“記憶”。
本文旨在研究這些額外的情緒參數(shù)對(duì)情緒神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)和決策中的表現(xiàn)的影響。我們使用臉部圖像數(shù)據(jù)庫(kù),它已經(jīng)在我們以前的作品中有效地使用。該數(shù)據(jù)庫(kù)包括270個(gè)不同性別,種族和年齡的30人的圖像,具有各種照明條件和對(duì)比度。面部圖像的多樣性旨在研究情緒神經(jīng)網(wǎng)絡(luò)的穩(wěn)健性。
1 具有情緒參數(shù)的學(xué)習(xí)算法
反向傳播學(xué)習(xí)算法是用于訓(xùn)練分層神經(jīng)網(wǎng)絡(luò)的廣義delta規(guī)則。自前人引入該算法以來,該算法已被廣泛使用。在本節(jié)中,基于情緒反向傳播學(xué)習(xí)算法的情緒神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,根據(jù)情緒神經(jīng)網(wǎng)絡(luò)內(nèi)的信息流詳細(xì)解釋,該網(wǎng)絡(luò)由3層組成:輸入層(i)神經(jīng)元,具有(h)神經(jīng)元的隱藏層和具有(j)神經(jīng)元的輸出層。
1.1 輸入層神經(jīng)元
這些是非處理神經(jīng)元;每個(gè)輸入層神經(jīng)元的輸出定義為YIi=Xii
其中,XIi和YIi分別是輸入和輸出輸入層中神經(jīng)元i的值。
1.2 隱藏層神經(jīng)元
這些是處理神經(jīng)元,因此,S形激活函數(shù)用于激活該層中的每個(gè)神經(jīng)元。這里,假設(shè)有一個(gè)隱藏層。但是相同的過程可以應(yīng)用于多個(gè)隱藏層。
其中XHh和YHh分別是隱藏層中神經(jīng)元h的輸入和輸出值。使用進(jìn)入該神經(jīng)元的所有輸入值的總電位計(jì)算隱藏層神經(jīng)元XHh的輸入??傠娢皇禽斎胫档某朔ê退鼈兊南嚓P(guān)權(quán)重的總和。
其中Whi是隱藏神經(jīng)元h給予輸入神經(jīng)元i的權(quán)重,YIi是輸入神經(jīng)元i的輸出,r是輸入層神經(jīng)元的最大數(shù)量。
其中Whb是由隱藏神經(jīng)元h給予隱藏層偏置神經(jīng)元b的權(quán)重,Xb是偏置神經(jīng)元的輸入值。
1.3 輸出層神經(jīng)元
這些也是處理神經(jīng)元,因此,S形激活函數(shù)用于激活該層中的每個(gè)神經(jīng)元。
其中XJj和YJj分別是輸出層中神經(jīng)元j的輸入和輸出值。除了偏置和情緒神經(jīng)元之外,還使用從先前隱藏層饋送神經(jīng)元的所有輸入值的總電位來計(jì)算輸出層神經(jīng)元XJj的輸入。因此,輸出層神經(jīng)元的輸入被定義為常規(guī)總電位,偏置總電位和情緒總電位之和。
其中Wjh是輸出神經(jīng)元j給隱藏神經(jīng)元h給出的權(quán)重,YHh是隱藏神經(jīng)元h的輸出。l是隱藏層神經(jīng)元的最大數(shù)量。
其中Wjb是輸出神經(jīng)元j給輸出層偏置神經(jīng)元b給出的權(quán)重,Xb是偏置神經(jīng)元的輸入值,它被設(shè)置為1(Xb=1)。
其中Wjm是輸出神經(jīng)元j給輸出層情緒神經(jīng)元m給出的權(quán)重,而Xm是情緒神經(jīng)元的輸入值。
2 面部識(shí)別實(shí)施
人臉的復(fù)雜性源于隨著時(shí)間的推移而發(fā)生的面部特征的不斷變化。盡管有這些變化,我們?nèi)祟惾匀荒軌蜃R(shí)別面孔并識(shí)別人物。這種能力并不存在于機(jī)器中,因此,需要在我們嘗試創(chuàng)建智能自主機(jī)器時(shí)人為地模擬識(shí)別。
當(dāng)前的面部識(shí)別方法依賴于檢測(cè)局部面部特征并將其用于面部識(shí)別或全局地分析面部作為整體。局部面部識(shí)別系統(tǒng)使用面部?jī)?nèi)的面部特征;全局人臉識(shí)別系統(tǒng)使用整個(gè)面部來識(shí)別人。
在該部分中,情緒神經(jīng)網(wǎng)絡(luò)用于在呈現(xiàn)他/她的面部圖像識(shí)別人時(shí)使用了基于反向傳播學(xué)習(xí)算法的傳統(tǒng)神經(jīng)網(wǎng)絡(luò)以及用于面部識(shí)別的全局模式平均。在訓(xùn)練或測(cè)試神經(jīng)網(wǎng)絡(luò)之前,全局模式平均用于面部圖像預(yù)處理。