馮 茜,李 擎,全 威,裴軒墨
1) 北京科技大學(xué)自動化學(xué)院,北京 100083 2) 華北理工大學(xué)機械工程學(xué)院,唐山 063210 3) 北京科技大學(xué)工業(yè)過程知識自動化教育部重點實驗室,北京 100083
多目標優(yōu)化問題具有多個相互沖突的目標函數(shù),某一目標求得的最佳方案,不可能同時使得其他目標為最優(yōu)值,甚至導(dǎo)致退化. 多目標優(yōu)化[1]作為一類復(fù)雜的最優(yōu)化問題,既被用于生產(chǎn)調(diào)度、城市運輸、網(wǎng)絡(luò)通信等系統(tǒng)的實時設(shè)計,又涉及工程設(shè)計、數(shù)據(jù)挖掘、資本預(yù)算等智能規(guī)劃問題,無論是在理論研究還是工程實踐中都具有深遠的意義. 隨著現(xiàn)實世界中問題所呈現(xiàn)的多元化、規(guī)?;l(fā)展模式,多目標優(yōu)化問題面臨著非線性、多維度、智能性、動態(tài)規(guī)劃等多方面的嚴峻挑戰(zhàn).
傳統(tǒng)的多目標優(yōu)化方法主要有:加權(quán)求和法[2]、約束法[3]、目標規(guī)劃法[4]、距離函數(shù)法[5]以及極大極小法[6]等. 這些優(yōu)化方法大多是采取不同的策略將多目標問題分解為單目標問題,再使用單目標算法完成優(yōu)化,依賴于先驗知識,受限于Pareto前沿的形狀. 尤其是當(dāng)多目標問題呈現(xiàn)出非線性、高維度等復(fù)雜特性時,傳統(tǒng)方法很難確保好的優(yōu)化效果甚至不可行.
近年來,進化算法將生物信息融入元啟發(fā)式算法之中,憑借其獨特的更新機制,在組合優(yōu)化和數(shù)值優(yōu)化領(lǐng)域[7]均已取得了很多突破性研究成果.典型的多目標進化算法有:多目標粒子群算法[8],多目標蜂群算法[9],多目標蟻群算法[10],多目標免疫算法[11],多目標差分算法[12]等. 粒子群算法是一種受到自然界中鳥類群體覓食行為的啟發(fā)而發(fā)展起來的進化算法,鑒于其實現(xiàn)簡單、搜索高效、收斂快速等優(yōu)勢,不僅在各類復(fù)雜的實驗測試中還是實際工程應(yīng)用中,均得到了廣泛應(yīng)用.
1995年,Kennedy和Eberhart兩位博士[13]共同提出了粒子群優(yōu)化算法(Particle swarm optimization,PSO). ven den Bergh[14]從理論角度對PSO算法的穩(wěn)定性和收斂性進行了分析和證明. 2002年,Cello與Lechuga[15]正式發(fā)表了多目標粒子群優(yōu)化算法的成果. 粒子群算法求解多目標優(yōu)化問題,稱為多目標粒子群(Multiobjective particle swarm optimization,MOPSO)算法.
PSO算法中,將鳥群的個體位置或食物當(dāng)作優(yōu)化問題的解,利用群體中個體與最優(yōu)個體以及個體之間的信息交互,引導(dǎo)整個群體中個體在保留自身多樣性信息的同時,朝向群體最優(yōu)個體收斂,通過不斷地更新逐漸找到最優(yōu)解. 鳥群中個體被抽象為“粒子”,忽略其質(zhì)量、體積,拓撲結(jié)構(gòu)決定了每次迭代時“粒子”受到自身和群體狀態(tài)信息的綜合影響,即粒子的更新機制是通過種群歷史最優(yōu)粒子和個體歷史最優(yōu)粒子的有機結(jié)合得到,如圖1所示. 粒子i下一時刻的速度 vi(t+1)是由當(dāng)前速度 vi(t)、其自身最優(yōu)位置 p bi(t)、全局最優(yōu)位置gb(t)共同決定的,該粒子以更新后速度從當(dāng)前位置 xi(t)移至新的位置 xi(t+1). 隨著迭代的不斷深入,整個粒子群體在“引領(lǐng)者”的帶動下,完成決策空間中最優(yōu)解的搜索.
圖1 決策空間中粒子移動示意圖Fig.1 Image of particle movement in the decision space
多目標粒子群算法憑借其高效、快速的優(yōu)勢,成為了多目標優(yōu)化的主要研究方向. 處理多目標優(yōu)化問題時,既要克服傳統(tǒng)多目標優(yōu)化過程中的普遍性難點,又要考慮粒子群算法用于多目標優(yōu)化時的針對性問題. 歸納如下:
(1)優(yōu)化過程中,如何挑選“領(lǐng)導(dǎo)”粒子,帶領(lǐng)整個種群在保留部分個體信息的前提下快速逼近帕累托前沿,即最優(yōu)粒子選擇策略;
(2)粒子群算法中,種群個體受到“最優(yōu)”粒子的影響,由于收斂過快而導(dǎo)致“早熟”,如何引導(dǎo)粒子“跳出”局部最優(yōu),即多樣性保持機制;
(3)外部存儲集中非支配解的數(shù)量的急劇增加,如何引導(dǎo)種群在保障多樣性的前提下,進一步提高搜索效率,以強化算法在收斂速度方面的優(yōu)勢,即收斂性提高手段;
(4)如何在優(yōu)化過程的不同階段,動態(tài)協(xié)調(diào)整體開發(fā)和局部搜索之間的關(guān)系,以獲得最佳優(yōu)化結(jié)果,即多樣性和收斂性的平衡方法;
(5)為了提升算法性能而進行的迭代公式的改進、重要參數(shù)的動態(tài)整定以及粒子間信息交互方式的調(diào)整,即迭代公式、參數(shù)、拓撲結(jié)構(gòu)的改進方案.
下面將從以上5個方面對近年來多目標粒子群優(yōu)化算法的改進措施進行較為詳細的介紹.
采用粒子群算法進行優(yōu)化時,每次迭代都需要進行全局最優(yōu)粒子(Global best particle, gbest)和個體最優(yōu)粒子(Personal best particle, pbest)的選擇.gbest作為整個種群的核心“領(lǐng)導(dǎo)者”,對整個優(yōu)化過程的收斂速度、搜索效率以及“最優(yōu)”結(jié)果會產(chǎn)生極大的影響;而每個粒子到目前為止自身的“最優(yōu)”狀態(tài),對避免陷入局部最優(yōu),保持種群多樣性并獲得最好的優(yōu)化結(jié)果起到重要作用. 因此,合理和有效的“最優(yōu)”粒子選擇機制具有重要意義. 單目標優(yōu)化時,“最優(yōu)”個體是唯一的,而多目標優(yōu)化時,每次更新都可能產(chǎn)生“當(dāng)前”最優(yōu)解集,存儲于外部存儲集中. 隨著優(yōu)化進程的不斷深入,最優(yōu)解集的數(shù)量會急劇增加,這將會導(dǎo)致巨大的選擇壓力,而這一困難在處理高維度優(yōu)化問題時會顯得愈發(fā)突出.
為了能夠高效帶領(lǐng)種群收斂到真正的帕累托最優(yōu)前沿又不失多樣性,有些學(xué)者基于分解思想設(shè)計最優(yōu)粒子選擇策略. Zhu等[16]設(shè)計了一種基于外部存儲集引導(dǎo)的擇優(yōu)策略,分配粒子對分解產(chǎn)生的子問題進行優(yōu)化,有效提高了收斂速度.Li等[17]提出基于增強選擇策略的更新機制. 通過切比雪夫聚集函數(shù)值、有利權(quán)重的切比雪夫值和隨機選擇三種方式,自適應(yīng)切換聚集函數(shù)值,加強局部搜索. Ali與Khan[18]提出了基于綜合學(xué)習(xí)策略的方法. Cheng等[19]基于動態(tài)加權(quán)聚合函數(shù)進行最優(yōu)粒子的動態(tài)選擇.
有些方法不是以適應(yīng)度函數(shù)為粒子優(yōu)先權(quán)的評估機制,而是基于指標衡量解的價值,進行最優(yōu)粒子的選擇. 比較典型的評價指標有:超體積指標[20],R2指標[21]. Wu等[22]基于虛擬帕累托前沿對粒子進行評估. Li等[23]基于R2指標進行外部存儲的維護以及最優(yōu)粒子的選擇.
基于Pareto排序的方法也是一類較為常用的優(yōu)化方法. 小生境方法[24]是一種行之有效的多目標優(yōu)化方法. Qu等[25]將物種形成策略[26]融入粒子群優(yōu)化算法,所提出物種形成機制根據(jù)鄰域結(jié)構(gòu)生成多個小生境,采用并行方式搜索帕累托最優(yōu)解. 自組織策略能夠在加速小生境形成的同時避免子群之間的交叉. 仿真實驗結(jié)果表明,該算法能夠保持決策空間和目標空間中解的多樣性,使得解分布更加均勻. 文獻[27]基于密度聚類的思想進行領(lǐng)導(dǎo)粒子選擇. 文獻[28]將代理輔助策略與標準粒子群算法以及社會學(xué)習(xí)粒子群算法相結(jié)合,利用改進的帕累托存檔學(xué)習(xí)方法來提高外部存儲集當(dāng)中候選解的質(zhì)量,輔助最優(yōu)粒子的選擇,從而加速收斂. 文獻[29]將代理輔助策略融入帕累托主動學(xué)習(xí)方法,以粒子群算法為數(shù)據(jù)知識庫生成機制,構(gòu)建虛擬空間中的代理模型代替適應(yīng)度函數(shù),根據(jù)改進的帕累托主動學(xué)習(xí)策略預(yù)先將粒子分類. 該方法基于解的預(yù)判斷輔助優(yōu)化,有利于節(jié)約計算成本,提高效率.
一些研究人員采用兩種方式相結(jié)合的策略,共同進行最優(yōu)粒子的選擇. Liu等[30]融合了R2指標與分解的思想,Li等[17]提出將基于R2指標[31]和L2范數(shù)的分層R2排序算法和有利權(quán)重的切比雪夫聚集值相結(jié)合的外部檔案更新策略. 李飛等[32]以R2指標和目標空間分解兩種策略為衡量標準提出雙層檔案維護策略. 文獻[33]基于解分布指標和超體積指標,將多目標優(yōu)化問題轉(zhuǎn)化為二目標問題,設(shè)計了將解集和解集中的解分層處理的粒子群算子. 實驗結(jié)果表明,該方法能夠獲得良好的分布性和收斂性. Moubayed等[34]將分解與支配關(guān)系相結(jié)合,根據(jù)偏好進行排序,用分解方式將多目標問題轉(zhuǎn)化為聚合問題,利用非支配關(guān)系進行外部存儲集中最優(yōu)粒子的選擇.
有些文獻通過改進排序方法來提高精英庫中備選粒子的質(zhì)量. Li等[35]提出了一種將綜合排序策略與目標空間中基于切比雪夫距離的粒子密度信息相結(jié)合的最優(yōu)粒子選擇機制. Tang等[36]將非支配解存儲后,將精英保留與循環(huán)排序方法相結(jié)合,以獲得高質(zhì)量的帕累托前沿.
粒子群算法在追求收斂速度快、搜索效率高的同時,往往會以多樣性的缺失為代價,而影響最終的優(yōu)化結(jié)果. 因此,研究人員從多個角度提出保持種群多樣性的策略,并取得了顯著的效果.
一些文獻使用空間劃分策略來保持多樣性.這類方法主要是將目標空間分割為多個區(qū)域,根據(jù)個體在分割區(qū)域的分布情況,一邊引導(dǎo)種群中的其它個體向某一區(qū)域“靠攏”,以加速收斂;一邊保留其它區(qū)域的個體“特征”,以獲得分布均勻、覆蓋率廣的Pareto前沿. 比較有代表性的方法主要有:網(wǎng)格劃分法[37]和角度劃分法[8]. 本團隊提出了一種自適應(yīng)角度劃分法[38],結(jié)合非支配解在角度區(qū)域中的動態(tài)分布,加強“低密度”區(qū)域或“無分布”區(qū)域相鄰區(qū)域的探索,同時刪除“高密度”區(qū)域多余粒子;同步實現(xiàn)gbest和pbest的選擇,有利于保持種群多樣性.
還有一些文獻是基于種群劃分的思想. 這類方法是將整個種群劃分為多個子群,子群根據(jù)各自的引領(lǐng)者并行引導(dǎo)種群更新,共享外部存儲集信息. Zhan等[39]將整個種群劃分為相等規(guī)模的子群,每個子群體只針對一個目標進行優(yōu)化,并根據(jù)目標確定每個子群的適應(yīng)度,各子群間會以外部存儲集為平臺,共享各子群間信息,同時將精英學(xué)習(xí)機制融入外部存儲集以增強多樣性. 然而,通過研究發(fā)現(xiàn)[40],這種策略有可能會導(dǎo)致選擇壓力的增加,并且增加時耗. Yang等[41]將整個種群動態(tài)劃分為主群和多個子群,每個子群擁有各自的非支配解、子群擁擠距離以及指定目標,各子群為并行搜索,通過非支配排序和歸一化結(jié)合機制選擇出最優(yōu)粒子. Luo等[42]將種群劃分為子群并建立各子群的概率模型,分別使用粒子群算法和分布估計算法對概率模型進行更新,在解決復(fù)雜的多目標問題時表現(xiàn)出良好的能力. Yao等[43]采用競爭與合作技術(shù)促進子種群間的協(xié)同進化,有利于獲得多樣性良好以及分布均勻的Pareto前沿. Zhang等[44]提出在決策空間中基于歐氏距離進行種群劃分的聚類策略,有利于種群多樣性的保持. Liang等[45]將自組織機制引入決策空間中進行多峰多目標優(yōu)化,將相似解置于鄰域中,并從構(gòu)建鄰域中選擇相應(yīng)的領(lǐng)導(dǎo)者,以保證更好的種群多樣性.
基于分解的優(yōu)化方法有利于維護良好的種群多樣性. 文獻[46]采用基于分區(qū)的分解策略求得分布均勻的解. Dai等[47]從分解角度進行解的多樣性維護,將目標空間分解為子區(qū)域,并采用相應(yīng)的多樣性保持策略. Qi等[48]基于分解方法在目標空間中自適應(yīng)調(diào)整權(quán)值,使得每個子區(qū)域都有一個保證種群多樣性的解.
Albaity等[49]將量子理論與粒子群算法的結(jié)合,以便幫助粒子產(chǎn)生全局最佳位置,提高種群多樣性的同時,還保證了粒子群算法的全局收斂效果. Liu等[50]將文化理論算法與量子行為粒子群優(yōu)化算法相融合,多次從信念空間知識中提取種群個體的測量信息,并根據(jù)歷史知識設(shè)計了一種局部搜索算子,利于保持種群多樣性. Pan等[51]基于速度的決策變量分析方法提出多樣性增強策略,有效提高了優(yōu)化過程中種群多樣性.
Li等[52]采用全局邊緣排序策略,同時結(jié)合種群粒子在目標空間中的個體密度信息,有利于多樣性的維護. Cheng等[53]提出基于混合教學(xué)的循環(huán)擁擠排序方法,周期性調(diào)用教學(xué)階段和學(xué)習(xí)階段算法,利用種群中心值提高種群的整體搜索性能,同時加強粒子之間的信息交互,獲得良好的收斂性的同時保持多樣性.
喻金平等[54]基于博弈機制,通過精英粒子之間的博弈,確定最優(yōu)粒子. 最優(yōu)粒子從精英粒子中隨機選擇,有利于保持多樣性,而外部存儲集的省略,有助于提升收斂速度. Zhang等[55]提出基于競爭機制的學(xué)習(xí)策略. 首先,根據(jù)經(jīng)典的非支配排序和擁擠距離篩選精英粒子. 其次,基于成對競爭策略的更新機制,精英粒子中競爭成功的粒子為當(dāng)前種群中粒子引導(dǎo)更新方向. 最后,粒子通過向競爭贏家學(xué)習(xí),更新位置和速度. 該算法不再使用廣泛應(yīng)用的外部檔案存儲和更新策略,取而代之的是基于精英粒子競爭以及學(xué)習(xí)策略的更新機制.
另外,變異操作是進化算法中多樣性保持或增加的重要方式. 單目標優(yōu)化中比較經(jīng)典的變異策略,經(jīng)過改進后用于進行多目標優(yōu)化,如:快速下降法[56]、精英學(xué)習(xí)策略[57]、柯西變異[58]等,取得了良好的效果. Liu等[30]采用多項式變異進行外部檔案中多樣性維護,此外,當(dāng)粒子個數(shù)未能滿足所設(shè)定的更新條件時,應(yīng)用高斯變異策略對種群個體的位置以及速度進行重新初始化. 張偉與黃衛(wèi)民[59]根據(jù)收斂性能指標將種群進行區(qū)域劃分,分別采取不同的變異策略. Yu等[28]使用混合變異采樣策略增強解的多樣性,提高了搜索效率.
楊景明等[60]根據(jù)不同階段對收斂性的不同要求,應(yīng)用多項式變異策略,以相鄰兩次迭代的最優(yōu)解集得到的世代距離為自適應(yīng)變異規(guī)模調(diào)整機制,分階段進行變異操作. 韓敏與何泳[61]設(shè)計了一種高斯混沌變異策略,根據(jù)粒子個體與gbest間的距離自適應(yīng)調(diào)整高斯變異幅度,引入Logistic混沌映射值,增加遍歷性. 為了提高多樣性,Moslemi與Zandieh[62]引入變異算子來保持群體的多樣性,并且將網(wǎng)格與擁擠距離相結(jié)合進行全局最優(yōu)粒子的選擇. 多尺度混沌變異策略[58]被用來幫助算法“跳出”局部最優(yōu). 王學(xué)武等[63]基于三種變異算子設(shè)計變異策略,并根據(jù)隨機數(shù)的值進行選擇,以增強所得解的多樣性.
雖然粒子群算法進行單目標優(yōu)化時,在收斂性能方面具有顯著優(yōu)勢,但是用于多目標優(yōu)化時,由于目標數(shù)目和維度的增加,會導(dǎo)致解的數(shù)量急劇增多,為了能夠既不失多樣性,又快速獲得最優(yōu)解集,需要提高算法的收斂性能,有利于提高算法效率.
為了加速收斂,Peng等[64]設(shè)計了一種跟隨非線性慣性權(quán)重系數(shù)變化的動態(tài)學(xué)習(xí)因子. Li等[65]采用島嶼模型將整個種群進行劃分,生成的子群以并行運行方式提高算法的收斂速度. Xu等[66]以間隔迭代方式將多目標二分法線性搜索方法融入MOPSO算法,加強了局部搜索能力,以促進種群向真實帕累托前沿的收斂. Cheng等[67]基于局部最優(yōu)粒子策略引導(dǎo)種群快速向帕累托最優(yōu)前沿逼近.
聚類策略的引入,有利于提高種群的搜索速度. 于慧等[68]基于動態(tài)聚類思想劃分種群,提高收斂速度的同時減少了種群多樣性損失. Liu等[69]將種群劃分后,通過子群間共享信息的協(xié)同進化方式提高收斂速度,以應(yīng)對實際應(yīng)用時環(huán)境變化快速的動態(tài)優(yōu)化問題. Han等[70]采用多目標梯度方法,通過計算每個粒子全部單位方向的加權(quán)和確定多梯度下降方向,以加速收斂.
通常情況下,我們希望在全局開發(fā)階段,重視多樣性的同時加速收斂,以提高搜索效率;另一方面,在局部搜索階段,加強收斂性能的同時能夠減少多樣性損失,以避免算法過早收斂. 無論哪一階段,都應(yīng)對收斂性和多樣性兩個性能指標進行兼顧,以確保高效、精準的優(yōu)化結(jié)果.
研究人員提出了多種策略對優(yōu)化過程進行狀態(tài)評估,自適應(yīng)調(diào)整收斂性和多樣性的權(quán)重,從而達到動態(tài)協(xié)調(diào)兩個性能指標的目的. 平衡適應(yīng)度估計策略[71]能夠幫助實現(xiàn)外部存儲集中非支配解的選擇,并在外部檔案上進一步運行進化搜索,加強了精英個體之間信息交換. 該策略由收斂性距離和多樣性距離兩部分構(gòu)成,根據(jù)二者的權(quán)重系數(shù)動態(tài)平衡多樣性與收斂性之間的關(guān)系. 合理的最優(yōu)粒子選擇機制可以協(xié)調(diào)整個搜索過程中收斂性和多樣性的關(guān)系. 優(yōu)化過程中,為了能夠確??焖偈諗康耐瑫r多樣性得以維護,Hu與Yen[72]基于非支配解的分布熵進行環(huán)境估計,采用新穎的自適應(yīng)動態(tài)方式,將最優(yōu)粒子選擇、外部存儲集維護、參數(shù)調(diào)節(jié)以及擾動等環(huán)節(jié)均融于平行單元坐標系中.
設(shè)定參考點有利于減輕選擇壓力[73],Wu等[74]以預(yù)定義的參考點為主要標準,以相鄰粒子間歐幾里德距離為附加選擇標準,提高算法性能. 還使用估計策略識別進化狀態(tài),動態(tài)調(diào)整最優(yōu)選擇機制,加強開發(fā)階段的收斂速度,維護探索階段的多樣性,通過平衡開發(fā)和探索之間關(guān)系的方式達到動態(tài)協(xié)調(diào)收斂性和多樣性的目的. Figueiredo等[75]采用搜索過程中的目標空間超平面上的動態(tài)參考點以及聚集方法,促進多目標優(yōu)化過程中收斂性和多樣性之間的平衡關(guān)系.
此外,為了協(xié)調(diào)快速開發(fā)和深入探索之間的關(guān)系,Lin等[76]提出多搜索策略多目標粒子群算法,將收斂性和多樣性作為兩個不同目標,基于預(yù)設(shè)閾值分別采用不同的粒子速度更新策略. Hu等[77]提出偏重收斂性和多樣性的兩階段策略,第一階段基于聚合原理,第二階段基于平行單元坐標系理論,以便在不同階段針對性提高算法的收斂性和多樣性. 受到鳥類覓食時線性和圓形行為的啟發(fā),Meza等[78]基于粒子群體的旋轉(zhuǎn)和平移運動方式提出渦旋多目標粒子群優(yōu)化算法. 線性運動幫助種群收斂,而圓形運動有助于個體分散搜索;參數(shù)選擇基于粒子的動態(tài)行為,兼顧了收斂性和多樣性. Pan等[79]采用增量熵方法設(shè)計自適應(yīng)因子,調(diào)節(jié)收斂性和多樣性之間的動態(tài)平衡關(guān)系,基于離散解耦策略分解目標,構(gòu)建子群,通過協(xié)同進化實現(xiàn)多目標優(yōu)化. 還有一些文獻基于分解思想來權(quán)衡開發(fā)和探索之間的關(guān)系. Liu等[80]將瓶頸目標學(xué)習(xí)策略融入分解機制,Moubayed等[34]將Pareto支配與分解兩種優(yōu)化策略進行融合,用于權(quán)衡收斂性和多樣性.
為了提高粒子群算法的性能,一些文獻還提出從迭代公式、參數(shù)整定以及拓撲結(jié)構(gòu)等方面進行改進.
迭代公式改進方面,Lin等[71]增加粒子個體朝向全局最佳粒子的引領(lǐng)搜索項,使得粒子在搜索過程中有可能獲得更多擾動. Yao等[43]增加了子群最優(yōu)粒子的信息,同時還融入了相鄰粒子信息.Pan等[51]提出了將認知學(xué)習(xí)部分刪除,能夠保證算法的收斂以及有效學(xué)習(xí).
進化算法進行優(yōu)化時,通常需要針對問題選擇和調(diào)整算法[81]. 參數(shù)校正方面,Han等[82]提出了一種自適應(yīng)飛行參數(shù)調(diào)節(jié)機制,利用多樣性信息和種群速度信息,對全局探索和局部開發(fā)之間的關(guān)系進行平衡. 該算法的新穎之處就在于能夠結(jié)合解分布熵同步完成飛行參數(shù)的調(diào)節(jié)以及全局最優(yōu)粒子的選擇. 夏立榮等[83]基于層次分析方法,設(shè)計出一種進化因子,通過度量進化狀態(tài)自適應(yīng)調(diào)節(jié)參數(shù). Liu等[84]應(yīng)用強化學(xué)習(xí)理論中的Q-Learning方法,以目標空間中Pareto前沿的粒子數(shù)量、決策空間中粒子間距為狀態(tài),以粒子群算法中3個主要參數(shù)— —慣性權(quán)重系數(shù)和兩個認知加速度系數(shù)為動作,建立三維Q表,自適應(yīng)調(diào)整算法參數(shù).Hu等[85]通過改變參數(shù)來提高算法的魯棒性,雖然可以防止算法陷入局部最優(yōu),收斂精度也有所提高,但大量“新”變量的引入有可能會增加計算復(fù)雜度[86]. Ding等[87]應(yīng)用田口方法作為響應(yīng)值來調(diào)整參數(shù). Tang等[36]以保證收斂性能為參數(shù)選擇原則,以開發(fā)和挖掘的不同偏好為目標設(shè)計了自適應(yīng)參數(shù)調(diào)節(jié)機制,并且討論了參數(shù)對收斂性能的影響.
拓撲結(jié)構(gòu)方面,Yue等[88]提出的基于環(huán)形拓撲和特殊擁擠距離的多目標粒子群優(yōu)化算法,在決策空間中,引入無需參數(shù)的環(huán)形拓撲結(jié)構(gòu)幫助形成穩(wěn)定的小生境,有利于減少多樣性損失. 高海軍與潘大志[89]采用星型拓撲結(jié)構(gòu),在收斂速度方面表現(xiàn)出一定的優(yōu)勢. Zhang等[44]對劃分的子種群采用環(huán)形拓撲結(jié)構(gòu),有利于信息交互和保持多樣性.
本文主要就多目標粒子群算法中最優(yōu)粒子選擇,多樣性保持,收斂性提高,多樣性與收斂性之間的平衡,以及迭代公式、參數(shù)、拓撲結(jié)構(gòu)等改進措施進行了系統(tǒng)分析. 近幾年來,算法自身性能得以提升,應(yīng)用領(lǐng)域不斷拓展,涌現(xiàn)出大量行之有效、獨特新穎的先進成果. 然而,隨著信息科學(xué)和計算技術(shù)的高速發(fā)展,多目標粒子群算法在優(yōu)化效果上仍具有一定的提升空間. 今后的研究工作,可以從以下幾個方面開展:
(1)多目標粒子群算法基礎(chǔ)理論的研究. 目前的研究大多集中于算法性能改善以及應(yīng)用范圍推廣,由于相關(guān)數(shù)學(xué)理論不夠完備,與算法相關(guān)的收斂性、穩(wěn)定性、參數(shù)魯棒性以及計算復(fù)雜度等研究有待深入開展;
(2)動態(tài)環(huán)境評估機制的完善. 更新過程中,個體當(dāng)前狀態(tài)的反饋信息都將作為下次迭代如何實施的重要因素,這就要求能夠客觀、準確地對環(huán)境狀態(tài)進行估計,而單一的評價指標難以全面衡量環(huán)境情況. 因此,多指標融合的動態(tài)環(huán)境評價策略尚需進一步改進;
(3)種群個體自學(xué)習(xí)、自組織能力的提高. 作為一類元啟發(fā)式算法,隨機性有利于多樣性卻不利于收斂,而高速的收斂又容易導(dǎo)致早熟,難以保證穩(wěn)定的優(yōu)化結(jié)果. 為了削弱算法中不確定因素的影響,獲得高效、準確的優(yōu)化效果,往往會對種群中個體加以引導(dǎo),而引導(dǎo)策略大多是人為規(guī)定且基于主觀偏好,缺乏客觀性和有效性,因此,基于機器學(xué)習(xí)、深度學(xué)習(xí)、強化學(xué)習(xí)等先進理論的種群個體自學(xué)習(xí)、自組織能力的算法亟需進一步探究;
(4)自適應(yīng)方法的拓展. 優(yōu)化過程中不同階段對探索能力和挖掘能力的需求有所不同,不同多目標優(yōu)化算法在收斂速度和多樣性能方面的表現(xiàn)也各有利弊. 單一策略或固定模式的算法融合很難適用于所有優(yōu)化問題. 因此,為了促進算法對優(yōu)化問題的適應(yīng)性,基于進程估計和策略選擇的自適應(yīng)調(diào)整機制仍需不斷優(yōu)化.