于坤杰,王昕,王振雷
(1 華東理工大學(xué)化工過程先進(jìn)控制和優(yōu)化技術(shù)教育部重點(diǎn)實驗室,上海 200237;2 上海交通大學(xué)電工與電子技術(shù)中心,上海 200240)
通過模擬實際班級中教師給學(xué)生的教學(xué)過程和學(xué)生的學(xué)習(xí)過程,2011年Rao等[1]提出了一種新型的群智能優(yōu)化算法——教學(xué)優(yōu)化算法(teachinglearning-based optimization,TLBO)。該算法分為教師階段和學(xué)生階段,教師階段是教師教導(dǎo)學(xué)生知識,學(xué)生階段是學(xué)生之間互相交流,通過這兩個階段不斷的提高學(xué)生成績。教學(xué)優(yōu)化算法具有參數(shù)少,算法簡單,易理解,求解精度高等優(yōu)點(diǎn)[2-4]。
TLBO算法自提出以來,已經(jīng)引起很多學(xué)者的關(guān)注,并且得到了很好的應(yīng)用[5-7]。2012年Rao等[8]通過在算法中加入精英策略提出了精英教學(xué)優(yōu)化算法(ETLBO),ETLBO算法在解決復(fù)雜的約束問題上,顯示出了很好的性能。Anguluri Rajasekhar等[9]提出相對精英教學(xué)優(yōu)化算法(ETLBO),改進(jìn)算法在尋優(yōu)精度及速度上有所改進(jìn)。Taher Niknam等[10]提出了基于改進(jìn)TLBO算法的多目標(biāo)優(yōu)化方法并應(yīng)用在自動電壓調(diào)節(jié)器位置的分配上,取得了較好的效果。Rao等[11]在教師數(shù)量、教學(xué)因子及學(xué)習(xí)方式上進(jìn)行改進(jìn),提出了改進(jìn) TLBO算法(modified TLBO,MTLBO),并將其成功用于熱點(diǎn)冷卻器優(yōu)化和熱交換器優(yōu)化中。然而,這些改進(jìn)的TLBO算法存在收斂速度慢,迭代后期容易陷入局部最優(yōu)的問題。
針對上述問題,本文提出的改進(jìn)算法對教學(xué)因子進(jìn)行自適應(yīng)調(diào)整,使教學(xué)因子TF呈線性減小,這樣算法在搜索前期進(jìn)行全局搜索,使搜索空間快速收斂于最優(yōu)解附近,提高收斂速度,搜索后期進(jìn)行局部精細(xì)搜索,提高搜索精度。同時,考慮實際的學(xué)生學(xué)習(xí)過程中,學(xué)生獲取的知識存在一定程度上的誤解,所以在算法中引入信任權(quán)重,對學(xué)生已經(jīng)獲取的知識采取部分信任的策略,避免對已學(xué)知識的過分信任。這樣可以加強(qiáng)學(xué)生和老師之間,以及學(xué)生之間的信息共享,可以使算法跳出局部最優(yōu)。在基準(zhǔn)函數(shù)的實驗測試中,結(jié)果顯示本文提出的改進(jìn)TLBO算法(improved TLBO,ITLBO)收斂速度快,并且能夠跳出局部最優(yōu)。最后在裂解爐裂解原料效益的應(yīng)用中,改進(jìn)算法獲得了良好的應(yīng)用效果,大大提高了裂解效益。
教學(xué)優(yōu)化算法是模擬以班級為單位的教師給學(xué)生的教學(xué)過程和學(xué)生的學(xué)習(xí)過程而提出的新型智能優(yōu)化算法。學(xué)習(xí)過程中,班級中學(xué)生成績的提高需要教師的教導(dǎo),同時,學(xué)生之間需要互相交流來促進(jìn)知識的吸收,進(jìn)一步提高成績。對應(yīng)這兩個學(xué)習(xí)方式,該算法分為兩個階段:教師階段(教師教導(dǎo)學(xué)生),學(xué)生階段(學(xué)生之間互相交流)。在TLBO算法中,教師和學(xué)生相當(dāng)于進(jìn)化算法中的個體,而教師是適應(yīng)度值最好的個體,學(xué)生所學(xué)習(xí)的不同科目相當(dāng)于不同的決策變量,學(xué)生的學(xué)習(xí)成績相當(dāng)于適應(yīng)度值。
這個階段模擬學(xué)生獲取知識通過教師的“教”過程。該階段,教師教導(dǎo)學(xué)生們知識,努力提高班級學(xué)生的平均水平。在任意迭代次數(shù) i,假設(shè)班級學(xué)生人數(shù)為n,學(xué)習(xí)科目數(shù)為m,學(xué)生在某一學(xué)習(xí)科目j的平均水平為Mj,i,由于教師是最具有知識的人,所以當(dāng)前班級中成績最好的學(xué)生作為教師。每一科目的當(dāng)前學(xué)生平均水平與對應(yīng)的教師水平之間的差,由式(1)給出。
式中,Xj,kbest,i為教師在科目j的水平。ri為0~1的隨機(jī)數(shù)。TF為教學(xué)因子,它決定平均值改變的程度,TF由式(2)隨機(jī)確定為1或2。
根據(jù)當(dāng)前教師水平與學(xué)生平均水平之間的差Difference_Meanj,i,教師階段對解的更新如式(3)所示。
式中,x'j,k,i為 xj,k,i更新后的值。如果 x'j,k,i對應(yīng)的適應(yīng)度值優(yōu)于xj,k,i的適應(yīng)度值,則接受x'j,k,i。
這個階段模擬班級中學(xué)生互相交流的學(xué)習(xí)過程。通過學(xué)生間的互相交流,學(xué)生可以從比自己知識多的學(xué)生那獲取新的知識。學(xué)生階段的學(xué)習(xí)過程如下。
隨機(jī)選擇兩個學(xué)生P和Q,對應(yīng)的水平為X'j,p,i和 X'j,Q,i,X'j,p,i≠X'j,Q,i。X'j,p,i和 X'j,Q,i分別為 Xj,p,i和Xj,Q,i在教師階段的更新值, ()f x為優(yōu)化目標(biāo)函數(shù)。學(xué)生階段過程是通過分析兩個學(xué)員之間的差異進(jìn)行學(xué)習(xí)調(diào)整,該階段過程由式(4)給出。
如果新解 X''j,p,i對應(yīng)的適應(yīng)度值優(yōu)于X'j,p,i對應(yīng)的適應(yīng)度值,則接受X''j,p,i。
在基本的TLBO算法的教師階段過程中,教學(xué)因子TF由式(2)隨機(jī)取值為2或1,教學(xué)方法比較單一,這樣一來,學(xué)生在向教師學(xué)習(xí)時,出現(xiàn)兩個極端情況,要么全盤接受,要么全部否定不予接受。但是,在實際學(xué)生向教師學(xué)習(xí)過程中,學(xué)生根據(jù)自己的吸收能力向教師學(xué)習(xí),學(xué)習(xí)前期,學(xué)生和教師之間水平相差較大,學(xué)生學(xué)習(xí)的知識多而快,當(dāng)學(xué)生水平接近教師水平時,往往學(xué)習(xí)進(jìn)步逐步變慢。在TLBO算法中,教學(xué)因子TF決定平均值改變的程度,較大的TF能夠加快算法搜索速度,但會使搜索能力下降。較小的TF能夠使搜索更加細(xì)微,但會使搜索速度下降。
因此,改進(jìn)的TLBO算法對教學(xué)因子進(jìn)行了改進(jìn),提出一種自適應(yīng)的教學(xué)因子,即隨著迭代的進(jìn)行,線性地減小TF的值。改進(jìn)的教學(xué)因子TF由式(5)給出。
式中,TFmax、TFmin為教學(xué)因子的最大、最小值;itermax為最大迭代代數(shù);iter為當(dāng)前迭代代數(shù)。
改進(jìn)后的教學(xué)因子TF在算法搜索前期大,后期小。這樣就能使算法在搜索前期采用全局搜索,使搜索空間快速收斂于最優(yōu)解附近區(qū)域,提高搜索速度。后期采用局部精細(xì)搜索以獲得高精度的解。
基本TLBO算法對學(xué)生已獲取的知識采取完全信任的策略。然而,在實際的學(xué)生學(xué)習(xí)過程中,學(xué)生已獲取的知識可能存在一定程度上的誤解,也就是存在錯誤的知識,如果對已獲取的知識過分信任,學(xué)生會盲目信任自己的水平,這樣算法就容易陷入局部最優(yōu)。
因此,改進(jìn)的 TLBO算法引入信任權(quán)重 w(w<1),對學(xué)生已獲得的知識采用部分信任的策略,避免學(xué)生對已獲得知識的過分信任,以加強(qiáng)學(xué)生和老師之間,以及學(xué)生之間的信息共享,以使算法跳出局部最優(yōu)。本文在引入信任權(quán)重w時,考慮教師階段是學(xué)生向教師學(xué)習(xí)知識,如果對學(xué)生已獲取知識的信任度低,這樣就能從教師那獲取更多的知識。所以教師階段的信任權(quán)重w1低于學(xué)生階段的信任權(quán)重 w2。教師階段解的更新式(3)引入信任權(quán)重w1,如式(6)所示。
學(xué)生階段更新過程式(4)引入信任權(quán)重 w2,如式(7)所示。
綜上所述,改進(jìn)TLBO算法用于優(yōu)化問題的步驟表述如下。
(1)初始化種群(班級),根據(jù)具體需要優(yōu)化的問題設(shè)定種群數(shù),維數(shù),教學(xué)因子TF上下限,信任權(quán)重w。
(2)評價種群個體,選擇種群中適應(yīng)度值最好的個體作為教師。
(3)按照式(1)、式(5)、式(6)進(jìn)行教師階段的迭代過程,接受好的解。
(4)按照式(7)進(jìn)行學(xué)生階段的迭代過程,接受好的解。
(5)重復(fù)步驟(2)~步驟(4),直到滿足結(jié)束條件為止。
為了測試改進(jìn)TLBO算法的有效性,針對8個典型的測試函數(shù)進(jìn)行仿真實驗,測試函數(shù)如表1所示,并與標(biāo)準(zhǔn)TLBO算法進(jìn)行比較。算法參數(shù)設(shè)置為種群數(shù)ps=10,教學(xué)因子最大值TFmax=2,最小值TFmin=1,信任權(quán)重選舉經(jīng)驗常數(shù)w1=0.1,w2=0.5,迭代代數(shù)itermax=500。
兩種算法都連續(xù)運(yùn)行30次,表2給出了優(yōu)化結(jié)果,其中“最優(yōu)值”表示運(yùn)行30次結(jié)果的最好值,“平均值”表示運(yùn)行30次結(jié)果的平均值,“標(biāo)準(zhǔn)差”表示運(yùn)行30次結(jié)果的標(biāo)準(zhǔn)差。從表2中的比較中可以看出,改進(jìn)的TLBO算法在這8個高維復(fù)雜函數(shù)上都達(dá)到了很高的精度,尤其在函數(shù) f1、f3、f4、f6和f8都能達(dá)到全局最優(yōu)解,而基本TLBO算法僅在f8達(dá)到了全局最優(yōu)解,其余都陷入了局部最優(yōu)解。
圖1和圖2為兩種算法分別在f6和f8中一次尋優(yōu)的收斂曲線,在圖1中,改進(jìn)的TLBO算法很快收斂到全局最優(yōu)解0,而基本TLBO算法收斂緩慢并陷入了局部最優(yōu)解。圖2中改進(jìn)TLBO算法基本在20代就收斂到全局最優(yōu),而基本TLBO算法在100代收斂到全局最優(yōu)。通過對比可以看出,改進(jìn)的TLBO算法收斂速度有顯著提高并且能夠跳出局部最優(yōu),達(dá)到了預(yù)期的效果。
表1 測試函數(shù)
表2 優(yōu)化結(jié)果比較
圖1 兩種算法在f6中的收斂曲線
圖2 兩種算法在f8中的收斂曲線
乙烯裂解爐是乙烯裝置的核心,是乙烯裝置經(jīng)濟(jì)效益的決定環(huán)節(jié)[12-13]。在保證裂解爐運(yùn)行周期的情況下,如何讓裂解原料效益達(dá)到最大一直是人們追求的目標(biāo)。
在裂解原料價格穩(wěn)定的情況下,影響裂解效益的因素主要有:裂解原料屬性、裂解爐出口壓力(COP)、裂解爐出口溫度(COT)、進(jìn)料量、汽烴比(SHR)、停留時間等。然而,現(xiàn)場裂解爐的出口壓力(COP)的測量位置處于高溫高壓的位置,難以獲得其真實準(zhǔn)確值,另外,裂解爐模擬計算發(fā)現(xiàn),裂解原料的屬性也是無法控制的。因此,可以自由控制調(diào)節(jié)的因素只有裂解爐的COT和SHR。應(yīng)用基于自由基反應(yīng)的裂解爐反應(yīng)管模擬軟件 CoilSim1D進(jìn)行裂解模擬[14-15],并采集現(xiàn)場操作參數(shù)對模擬結(jié)果進(jìn)行差值校正,使模擬結(jié)果更接近于現(xiàn)場實際結(jié)果,進(jìn)而建立裂解爐效益模型。模型的輸入變量由裂解原料屬性值、裂解爐出口溫度(COT)、進(jìn)料量、汽烴比(SHR)、原料價格、產(chǎn)品價格和操作成本等構(gòu)成,模型的輸出為裂解每噸裂解原料所得到的效益。裂解爐裂解效益的目標(biāo)函數(shù)為:
式中,yield=[乙烯,丙烯,副產(chǎn)品,燃料氣消耗量,稀釋蒸汽,進(jìn)料量],v為價格因子,對應(yīng)各自價格。輸入變量的范圍:裂解爐出口溫度(COT),818<COT<845;汽烴比(SHR),0.495<SHR<0.6565。
目標(biāo)是在裂解爐條件發(fā)生變化時,優(yōu)化出口溫度(COT)和汽烴比(SHR),以獲得最大效益。用改進(jìn)教學(xué)優(yōu)化算法優(yōu)化這個效益模型。實驗參數(shù)設(shè)置為:種群數(shù)ps=10,教學(xué)因子最大值TFmax=2,最小值TFmin=1,信任權(quán)重w1=0.1,w2=0.5,迭代代數(shù)itermax=100。在現(xiàn)場采集到的數(shù)據(jù)中選舉 3個點(diǎn),每個點(diǎn)對應(yīng)的原料類型如表3所示。其中參考價格為:乙烯,8500元/噸;丙烯,9000元/噸;副產(chǎn)品,4000元/噸;燃料氣,-2.5元/立方米;稀釋蒸汽,-80元/噸;原料,-5500元/噸(“-”表示該項使效益降低)。
改進(jìn)教學(xué)優(yōu)化算法優(yōu)化的效益與實際效益比較結(jié)果見表4,從比較結(jié)果可以看出,經(jīng)過算法優(yōu)化,裂解效益顯著提高。這樣就可以在改變進(jìn)料屬性之前先對模型進(jìn)行優(yōu)化,避免在進(jìn)料改變時僅憑經(jīng)驗對操作條件進(jìn)行盲目的改變,從算法尋優(yōu)中獲得最佳的COT和SHR,以獲得較高的裂解效益。
表3 3種裂解原料數(shù)據(jù)
表4 優(yōu)化結(jié)果比較
本文提出了一種改進(jìn)的教學(xué)優(yōu)化算法,該算法對教學(xué)因子進(jìn)行自適應(yīng)調(diào)整使算法前期進(jìn)行全局搜索,后期進(jìn)行局部精細(xì)搜索來提高算法的收斂速度和精度。同時引入信任權(quán)重,對學(xué)生已獲取知識采取部分信任策略,加強(qiáng)學(xué)生之間以及學(xué)生和老師之間的信息共享,避免算法陷入局部最優(yōu)。8個函數(shù)優(yōu)化的仿真結(jié)果表明,改進(jìn)算法收斂速度顯著提高并且能夠跳出局部最優(yōu)。最后在裂解爐裂解原料效益優(yōu)化的應(yīng)用中,本文提出的改進(jìn)算法能夠在裂解原料屬性發(fā)生改變時,快速優(yōu)化操作變量,顯著提高裂解效益。
[1] Rao R V,Savsani V J,Vakharia D P.Teaching-learning-based optimization:A novel method for constrained mechanical design optim ization problems[J].Computer.Aided Design,2011,43(3):303-315.
[2] Matej Crepinsek,Shih His Liu,Luka Mernik.A note on teaching-learning-based optim ization algorithm[J].Information Sciences,2012:79-93.
[3] Rao R V,Savsani V J,Vakharia D P.Teaching-learning-based optimization:An optim ization method for continuous non-linear large scale problems[J].Information Sciences,2012,183(1):1-15.
[4] Rao R V,Savsani V J,Balic J.Teaching-learning-based optim ization algorithm for unconstrained and constrained real-parameter optimization problems[J].Engineering Optimization,2012,44(12):1447-1462.
[5] Rao R V,Pater V.Multi-objective optimization of heat exchangers using a modified teaching-learning-based optim ization algorithm[J].Applied Mathematical Modeling,2013,37(3):1147-1162.
[6] Zou F,Wang L,Hei X H,et al.Multi-objective optim ization using teaching-learning-based optim ization algorithm[J].Engineering Applications of Artificial Intelligence,2013,26(4):1291-1300.
[7] Rao R V,Kalyankar V D.Parameter optim ization of modern machining processes using teaching-learning-based optim ization algorithm[J].Engineering Applications of Artificial Intelligence,2013,26:524-531.
[8] Rao R V,Patel V.An elitist teaching-learning-based optim ization algorithm for solving complex constrained optim ization problems[J].International Journal of Industrial Engineering Computations,2012,3(4):535-560.
[9] Anguluri Rajasekhar,Rapol Rani.Elitist teaching learning opposition based algorithm for global optim ization[C]//IEEE International Conference on Systems,Man,and Cybernetics,2012:1124-1129.
[10] Taher Niknam,Rasoul Azizipanah-Abarghooee,Mohammad Rasoul Narimani.A new multi objective optim ization approach based on TLBO for location of automatic voltage regulators in distribution systems[J].Engineering Applications of Artificial Intelligence,2012,25:1577-1588.
[11] Rao R V,Pater V.Multi-objective optization of two stage thermoelectric coolers using a modified teaching-learning-based optim ization algorithm[J].Engineering Applications of Artificial Intelligence,2013,26:430-445.
[12] Liu S T,Wang H G,Qian F,et al.Coupled simulation of combustion w ith heat transfer and cracking reaction in SL-II industrial ethylene pyrolyzer[J].Journal of Chemical Industry and Engineering(China),2011,62(5):1309-1317.
[13] Li P,Li Q A,Lei R X,et al.Development and application of advanced process control system for ethylene cracking heaters[J].Journal of Chemical Industry and Engineering (China),2011,62(8):2217-2220.
[14] Van Geem K M,Hudebine D,Reyniers M F,et al.Molecular reconstruction of naphtha steam cracking feedstocks based on commercial indices[J].Computers & Chemical Engineering,2007,31(9):1020-1034.
[15] Pyl S P,Van Geem K M,Reyniers M F,et al.Molecular reconstruction of complex hydrocarbon m ixtures:An application of principal component analysis[J].AIChE Journal,2010,56(12):3174-3188.