常甜甜,張建科,李小平,馮 晶
(西安郵電大學(xué) 理學(xué)院,陜西 西安 710121)
最優(yōu)化理論是人工智能領(lǐng)域的有力技術(shù)方法之一?!肮こ淘O(shè)計中的最優(yōu)化數(shù)學(xué)方法”(簡稱為“工程優(yōu)化”)是研究生的公共課程,其在機器視覺領(lǐng)域、數(shù)據(jù)挖掘領(lǐng)域、人工智能領(lǐng)域發(fā)揮著愈來愈重要的作用。傳統(tǒng)的數(shù)學(xué)教學(xué)手段是課件結(jié)合粉筆加黑板,教師以書本內(nèi)容為主,枯燥地講授數(shù)學(xué)的理論知識?!肮こ虄?yōu)化”是一門實用性極強的學(xué)科,這門課程的教學(xué)方法仍然停留在“概念-理論-計算”的傳統(tǒng)教學(xué)模式,學(xué)生在學(xué)習(xí)的過程當(dāng)中不知道如何將理論與實際結(jié)合起來,不知道學(xué)習(xí)的優(yōu)化算法到底可以用來做什么?影響了學(xué)生的學(xué)習(xí)熱情和創(chuàng)造性思維的培養(yǎng)。目前高校在教育教學(xué)過程中,不斷的與時俱進,調(diào)整教學(xué)方法和大綱,以適應(yīng)時代變化[1-13]。筆者所在最優(yōu)化教學(xué)團隊在教學(xué)內(nèi)容和方法上進行改革,提出案例教學(xué)法,即“工程案例-建模-理論分析-問題求解”的教學(xué)模式。具體地首先給出一個淺顯易懂的工程案例問題,且是該領(lǐng)域的研究熱點問題,根據(jù)問題建立最優(yōu)化模型,引導(dǎo)學(xué)生將最優(yōu)化原理與各自專業(yè)中的研究對象相結(jié)合,最后采用最優(yōu)化計算方法來求解問題,完成一個“問題-建模-理論-計算-應(yīng)用”的完整流程,提高學(xué)生用最優(yōu)化方法解決工程實際問題的能力。所選案例要緊扣教學(xué)內(nèi)容,案例分析的目的是使學(xué)生加深對所學(xué)理論知識的理解和運用理論知識解決實際問題的能力,因此,所選案例必須是針對課程內(nèi)容的。即案例內(nèi)容具有一定的代表性和普遍性,具有舉一反三、觸類旁通的作用,而不是實踐中根本不會發(fā)生的案例,且典型的案例往往涉及的關(guān)系比較全面,涵蓋的法律知識較多,有助于學(xué)生從各個方面對所學(xué)理論加以驗證,從中得出正確結(jié)論。因此,案例的選擇應(yīng)該具備真實可信、客觀生動、案例多樣化、相關(guān)性以及典型性。
案例教學(xué)法,即“工程案例-建模-理論分析-問題求解”的四步教學(xué)模式。工程案例的引入可以采用具體模型(如最小二乘模型),也可以采用實際應(yīng)用問題(如圖像重建)。以文獻[13]為例,具體的工程案例設(shè)計舉例如表1所示,從表1中的涉及教材內(nèi)容方面可以發(fā)現(xiàn),這幾個工程案例涵蓋了教材的全部內(nèi)容,而且這幾個工程案例是目前學(xué)科研究方向的熱點研究內(nèi)容。當(dāng)將這些案例吃透后,理論問題自然而然產(chǎn)生,比如為什么初始點的選取會引起解不穩(wěn)定?優(yōu)化模型的光滑化問題?為什么單純形法在可行域頂點達到最優(yōu)解?優(yōu)化模型問題的分類問題?帶著這些理論問題引導(dǎo)學(xué)生進行進一步的定理證明及推導(dǎo)。
表1 教案設(shè)計涉及內(nèi)容
以醫(yī)學(xué)圖像重建[14]和模式分類[15-18]案例為例對案例教學(xué)法具體進行說明。
2.1.1 醫(yī)學(xué)圖像重建背景
電阻抗圖像重建問題遵循電磁場基本規(guī)律滿足MAXWELL方程,其可以簡化為準靜態(tài)電磁場問題,滿足Laplace方程[14]:
(1)
Laplace方程給出了模型參數(shù)(電導(dǎo)率)和測量參數(shù)(邊界電壓)之間的關(guān)系,已知電導(dǎo)率σ求電勢φ稱為正問題,已知電勢φ求電導(dǎo)率σ稱為反問題。有限元法(FEM)是求解電磁場問題的常用數(shù)值解法。FEM法需要將場域離散化,即將場域進行剖分,剖分后圖像重建問題可以看作是以下線性方程組:
Jσ=φ
(2)
式中:J為Jacobian矩陣,σ為電導(dǎo)率分布,φ為邊界測量電壓值。
2.1.2 最優(yōu)化模型建立
問題(2)是一個典型的欠定問題(ill-posed problem), 可采用最小二乘法思想逼近其近似解, 即求解:
(3)
式中:Γ稱為正則化矩陣(在很多情況下,取單位矩陣I)。 第一項為擬合度量, 第二項為正則項。p取不同值:0、1、2, 即得不同類正則化算法。L2范數(shù)的優(yōu)點是目標函數(shù)光滑,求導(dǎo)計算方便, L2范數(shù)正則化的典型代表是Tikhonov正則化方法:
以下就問題(5)的求解問題進行討論。
2.1.3 最優(yōu)化算法理論分析
無約束優(yōu)化問題的一般迭代格式[2]是:
σk+1=σk+λkdk
(6)
式中:λk是最優(yōu)步長,dk是當(dāng)前搜索方向,σ定義同上。牛頓法的步長是定長的,即λk=1, 搜索方向是:
(7)
圖1 牛頓法算法迭代點序列圖示
式(7)是牛頓法算法的搜索方向, 點列迭代如圖1所示. 因此只有Hessian矩陣正定時,牛頓方向才是下降方向。給定初始值點x0, 過點做切線與x軸相交, 以交點做垂線與曲線相交于點x1,以此類推即可得到牛頓法算法的迭代點列,直至達到收斂要求。但是,但目標函數(shù)曲線變化較大,或者初始值選取不當(dāng)時,牛頓法算法可能不收斂。
圖2 牛頓法算法初始點選取不當(dāng)情況下迭代點列圖示
假設(shè)圖2目標函數(shù)f(x)的可行域為[a,b], 圖2(a)為目標函數(shù)曲度變化較大時, 取b點為初始點x0,經(jīng)過幾步迭代到x2,在x2點做曲線的切線可以發(fā)現(xiàn)x3點落到了可行域[a,b]外,因此這種情況下牛頓法算法不收斂; 圖2(b)中如果初始點選取為a,則在下一步迭代時,點直接落在了可行域外,算法不收斂;但在圖2(c)中,初始點選為b點,則x1落在了可行域內(nèi),算法收斂。由此,可以發(fā)現(xiàn)牛頓法算法對初始點的選取直接關(guān)系到算法的穩(wěn)定性和收斂性。
在牛頓法算法中,每次迭代都涉及到目標函數(shù)的梯度dk和Hessian矩陣?2f-1(σk), 具體計算如下:
梯度函數(shù)為:?f(σ)=2JT(Jσ-φ)+2ασ
Hessian矩陣為:?2f(σ)=2JTJ+2α
牛頓法步驟描述如下:
輸入:已知選定初始分布σ0,ε>0,k=0。
轉(zhuǎn)向b)
b)計算σk+1=σk+dk,k=0, 轉(zhuǎn)向a)
輸出:σ*=σk+1。
2.1.4 最優(yōu)化問題求解及應(yīng)用實例
圖像重建問題的正向問題計算借助EIDORS3.10軟件[22]計算。具體的實驗參數(shù)設(shè)置:目標選取三種情況, 成像目標在中心點位置, 成像目標在1/2半徑處,以及成像目標在邊界位置。電極總數(shù)為16個,接觸阻抗值為0.005 Ω,電流強度為1 mA,背景電導(dǎo)率為0.0025 s/m,目標電導(dǎo)率為0.005 s/m,采用對向激勵模式,仿真數(shù)據(jù)剖分單元格總數(shù)1968個,節(jié)點數(shù)1049個。
表2 牛頓法成像結(jié)果
提出問題:在實驗中發(fā)現(xiàn),如果初始點值為0.0015,牛頓法失效,代碼出現(xiàn)報錯,提示:Hessian矩陣必須為正定矩陣。從而引起學(xué)生對于下降類算法的證明以及為什么教材中要求Hessian矩陣為正的問題的思考。并引導(dǎo)學(xué)生對該問題的解決方法。
2.2.1 模式分類背景
支持向量機(support vector machine, SVM)是一種數(shù)據(jù)挖掘新方法[17],可以解決小樣本問題、非線性問題以及高維數(shù)據(jù)等問題,且推廣能力較強以及具有全局最優(yōu)解。被廣泛應(yīng)用于綜合評價、預(yù)測問題、數(shù)據(jù)擬合以及模式識別等問題。SVM模型基于極大間隔分類器的準則可推導(dǎo)獲得,是一個凸二次規(guī)劃問題,引導(dǎo)學(xué)生思考,如何求解該凸二次規(guī)劃問題?
2.2.2 最優(yōu)化模型建立
以線性可分情況下的支持向量建模為例,SVM的算法思想是在多個分類超平面中,基于極大間隔原則,找出其中的最優(yōu)決策超平面,見圖3。
圖3 極大分類超平面圖示
引導(dǎo)學(xué)生并提問:在一個線性可分問題中可以存在多個分類面,如何使得該分類面確定且唯一?一個直觀的方法就是采用極大間隔準則,如圖3所示,找一個方向向量w,在方向向量的切向量方向取一條線,沿切向量方向移動該線,當(dāng)該線觸碰到正類樣本則停止,繼續(xù)向下平移碰觸到負類樣本后停止. 取這兩個線中間線即為要找的唯一的分類線。該法則滿足兩類樣本點間間隔最大原則??梢缘玫骄€性可分支持向量分類機原始問題為:
(8)
式中:xi為樣本點,yi為樣本對應(yīng)標記,l為樣本數(shù),w和b為超平面方程參數(shù)。為使得分類問題可以引入核函數(shù)來處理非線性問題,將原始問題轉(zhuǎn)化為對偶問題進行研究,此處就引入了對偶問題的理論。
2.2.3 最優(yōu)化算法理論分析
此處可引入并講解KKT條件和Wolf對偶理論,式(8)的拉格朗日函數(shù)為:
(9)
式中:α為拉格朗日乘子。由wolf對偶原理,求拉格朗日函數(shù)關(guān)于w,b的偏導(dǎo)數(shù)??梢缘玫剑?/p>
(10)
代入(9)可得對偶問題為:
αi≥0,i=1, …,l
(11)
在最優(yōu)化問題(11)的求解過程中涉及到工作集(working set selection)的選取問題,需要引入KKT條件,因此可以在這部分給學(xué)生仔細解釋KKT條件的理論知識,本文不再贅述。設(shè)α*是對偶問題的任意解,則可按下式計算出原始問題的解:
(12)
2.2.4 最優(yōu)化問題求解及應(yīng)用實例[18]
為了讓學(xué)生有更直觀的理解,并測試所提出算法的有效性,實驗數(shù)據(jù)來源于網(wǎng)絡(luò)或者實際應(yīng)用問題,例如:UCI數(shù)據(jù)庫[23],所選測試數(shù)據(jù)信息見表3。表4為SVM分類結(jié)果,評估準測為精度,即:
(13)
表3 實驗數(shù)據(jù)描述
表4 SVM分類結(jié)果
在樣例建模和求解過程中,引導(dǎo)學(xué)生思考在整個樣例過程中需要進行哪些條件的判定?模式分類還有哪些應(yīng)用?最優(yōu)化模型的分類?停機準確的選取問題等等。
“工程優(yōu)化”是人工智能、數(shù)據(jù)挖掘、機器學(xué)習(xí)等熱門研究領(lǐng)域的數(shù)學(xué)基礎(chǔ)課程,但在實際教學(xué)中發(fā)現(xiàn),按部就班的采用傳統(tǒng)的教學(xué)方式時,學(xué)生并不能理解教材與實際應(yīng)用問題之間的關(guān)系,以至于遇到實際工程問題后仍然不能解決問題。本教學(xué)改革方式采用案例教學(xué)法,通過引入各個學(xué)科的熱點研究問題,針對熱點問題進行建模、分析、求解,幫助學(xué)生搭建理論與實際之間的聯(lián)系,提高學(xué)生解決實際問題的能力。