程美英,錢 乾,倪志偉,朱旭輝
(1.湖州師范學(xué)院經(jīng)濟(jì)管理學(xué)院,浙江湖州 313000;2.浙江省教育信息化評價(jià)與應(yīng)用研究中心,浙江湖州 313000;3.湖州師范學(xué)院教師教育學(xué)院,浙江湖州 313000;4.合肥工業(yè)大學(xué)管理學(xué)院,合肥 230009)
(?通信作者電子郵箱02550@zjhu.edu.cn)
自組織遷移算法(Self-Organized Migrating Algorithm,SOMA)[1]是一種新型基于群體的智能優(yōu)化算法,自2004 年提出至今已得到廣泛研究,現(xiàn)有成果主要集中于兩方面:1)改進(jìn)SOMA,彌補(bǔ)易陷入局部最優(yōu)、收斂速度慢、求解精度低等缺陷。文獻(xiàn)[2]引入機(jī)會(huì)策略產(chǎn)生擾動(dòng)向量,提供比基本SOMA更多的位置選擇來增強(qiáng)個(gè)體尋優(yōu)能力;文獻(xiàn)[3]在SOMA 中引入自適應(yīng)參數(shù)控制、領(lǐng)導(dǎo)個(gè)體選擇及給最優(yōu)個(gè)體建立外部檔案等策略提高種群多樣性;文獻(xiàn)[4]在每次迭代過程中按照與領(lǐng)導(dǎo)者的歐氏距離均勻選擇粒子進(jìn)行移動(dòng),提高SOMA 收斂速度和精度等。2)將SOMA 應(yīng)用于解決實(shí)際優(yōu)化問題。文獻(xiàn)[5]在可重構(gòu)制造業(yè)中引入SOMA 最小化機(jī)器模塊變化;文獻(xiàn)[6]將SOMA 用于機(jī)器人躲避動(dòng)態(tài)障礙物并抓取移動(dòng)目標(biāo);文獻(xiàn)[7]引入SOMA解決多層次圖像閾值分割問題等。
基于群體的智能優(yōu)化算法通過個(gè)體之間的協(xié)作能“涌現(xiàn)”出智能行為,實(shí)則具有隱含并行性,而這種并行性表現(xiàn)在兩方面:一是算法的內(nèi)在并行,即本身適合大規(guī)模并行;二是算法的內(nèi)涵并行性,群體智能算法采用種群的方式組織搜索,因而可以搜索解空間內(nèi)的多個(gè)區(qū)域,并相互交流信息,具備很強(qiáng)的多任務(wù)優(yōu)化能力(多任務(wù)優(yōu)化指在某一時(shí)刻同時(shí)處理多個(gè)不同的優(yōu)化問題[8])?;谌后w智能算法的多任務(wù)優(yōu)化[9]概念開創(chuàng)了將具有“隱”并行性的進(jìn)化算法應(yīng)用于多任務(wù)處理的新局面。文獻(xiàn)[9]首次探索多因子遺傳機(jī)制,提出多任務(wù)處理多因子進(jìn)化算法(MultiFactorial Evolution Algorithm,MFEA),在多層次多任務(wù)優(yōu)化[10]、多目標(biāo)多任務(wù)優(yōu)化[11]等領(lǐng)域中均得到較好應(yīng)用;文獻(xiàn)[12]在MFEA 基礎(chǔ)上,引入擬牛頓迭代、重新初始化部分適應(yīng)值較差解、自適應(yīng)選擇策略,提高M(jìn)FEA 求解多任務(wù)性能;文獻(xiàn)[13]通過實(shí)驗(yàn)證明MFEA 可保持種群的動(dòng)態(tài)多樣性,但MFEA 的本質(zhì)在于有效信息傳遞;文獻(xiàn)[14]以數(shù)據(jù)驅(qū)動(dòng)獲取任務(wù)之間的相關(guān)信息,自適應(yīng)實(shí)現(xiàn)任務(wù)之間的信息傳遞;文獻(xiàn)[15]基于閉式解自動(dòng)降噪編碼器顯示實(shí)現(xiàn)多任務(wù)之間映射;文獻(xiàn)[16-17]首次將自然界生物種群中的協(xié)同進(jìn)化機(jī)制與粒子群算法相結(jié)合,子種群間按一定概率或連續(xù)停滯若干代后交互信息,實(shí)現(xiàn)多任務(wù)優(yōu)化;文獻(xiàn)[18]引入等級因子、標(biāo)量因子和技能因子構(gòu)造多任務(wù)環(huán)境,每次讓最合適的粒子求解最合適的任務(wù)。
現(xiàn)有SOMA 關(guān)注點(diǎn)主要集中在單個(gè)任務(wù)優(yōu)化上,在多任務(wù)優(yōu)化領(lǐng)域研究甚少,且現(xiàn)有關(guān)于在多任務(wù)優(yōu)化領(lǐng)域如何避免無關(guān)信息共享造成“負(fù)遷移”現(xiàn)象的研究成果并不多?;谏鲜鰡栴},本文的主要工作為:通過有效探索SOMA 的“隱并行性”,共享和協(xié)調(diào)種群中有效信息,實(shí)現(xiàn)多任務(wù)優(yōu)化,然后引入信息篩選機(jī)制有效遏制多任務(wù)負(fù)遷移消極影響,提出信息篩選多任務(wù)優(yōu)化自組織遷移算法(SOMA for Multi-task optimization with Information Filtering,SOMAMIF)。仿真實(shí)驗(yàn)以一組函數(shù)優(yōu)化問題和一組離散優(yōu)化問題為例驗(yàn)證了SOMAMIF的有效性。
SOMA 的社會(huì)生物學(xué)基礎(chǔ)是社會(huì)環(huán)境下群體的自組織行為,如一群動(dòng)物在尋找食物時(shí),若某一個(gè)體率先發(fā)現(xiàn)食物,則成為群體領(lǐng)先者,其他個(gè)體通過改變自身運(yùn)動(dòng)方向遷移至領(lǐng)先者附近,在搜索過程中某個(gè)體若比先前領(lǐng)先者更為成功,則它成為群體中新的領(lǐng)先者,其他個(gè)體再次改變運(yùn)動(dòng)方向遷移至該新領(lǐng)先者所在位置,直至達(dá)到或接近全部最優(yōu)解。SOMA基本步驟如下:
步驟1 初始化種群中個(gè)體位置和所有參數(shù)。
步驟2 計(jì)算所有個(gè)體適應(yīng)值。
步驟3 比較得出當(dāng)前領(lǐng)先者位置。
步驟4 按式(1)得出參數(shù)PRTVector。
步驟5 按式(2)更新個(gè)體位置。
步驟6 判斷是否滿足循環(huán)結(jié)束條件,若不滿足,轉(zhuǎn)步驟2。
步驟7 輸出全局最優(yōu)解。
PRTVector依賴于PRT:若隨機(jī) 數(shù)rand小 于PRT,則PRTVector取值1,否則為0,如式(1)所示。
為形象描述多任務(wù)環(huán)境中的信息遷移模式,這里僅以同時(shí)求解極小函數(shù)優(yōu)化問題f1和f2為例,如圖1 所示。假設(shè)f2全局極值點(diǎn)位于B點(diǎn),在AB區(qū)域,函數(shù)f1和f2的單調(diào)趨勢相反,當(dāng)f1傳遞信息給f2,必會(huì)使得f2偏離極值點(diǎn)(信息負(fù)遷移);而在BC區(qū)域,當(dāng)f1傳遞信息給f2,必會(huì)加速f2收斂至極值解(信息正遷移)。若能利用BC區(qū)域的有效信息,將任務(wù)f1和f2綁定同時(shí)求解,必能同時(shí)加速f1和f2的收斂速度并提高二者的求解質(zhì)量。
圖1 多任務(wù)信息遷移Fig.1 Multi-task information transfer
多任務(wù)環(huán)境中不同任務(wù)一般處于不同的維度,構(gòu)建統(tǒng)一多任務(wù)搜索空間,使得不同維度的任務(wù)仍然可以傳遞有效信息。假設(shè)需要同時(shí)處理K個(gè)任務(wù)T1,T2,…,TK,任務(wù)Ta(a=1,2,…,K)的搜索空間和維數(shù)分別設(shè)為ψa和da,令多任務(wù)統(tǒng)一搜索空間Ψ=ψ1∪ψ2,…,∪ψK,維 數(shù)D=max{d1,d2,…,dK},對Ta解碼時(shí),只需取D的前da維。
在多任務(wù)環(huán)境中,無關(guān)的信息共享可能傷害多任務(wù)處理性能,即出現(xiàn)信息“負(fù)遷移”[8],進(jìn)而抑制干擾多任務(wù)優(yōu)化性能,這是目前尚未完全解決的難題之一,本文引入信息篩選機(jī)制有效遏制“負(fù)遷移”消極影響。
假設(shè)需要同時(shí)處理K個(gè)任務(wù),則隨機(jī)產(chǎn)生K個(gè)SOMA 子種群,子種群Pa(a∈{1,2,…,K})用于處理任務(wù)Ta。各子種群在執(zhí)行基本SOMA 的同時(shí),實(shí)施如下的信息篩選和遷移過程,具體步驟如下:
步驟1 信息交互愿望(需求)。當(dāng)任務(wù)Ta連續(xù)若干代停滯進(jìn)化時(shí),子種群Pa產(chǎn)生信息交互需求,即達(dá)到信息交互節(jié)點(diǎn)γ。
步驟2 信息獲取來源。自然界中的物種并非彼此孤立,生活在同一環(huán)境中的物種/種群通過交互信息達(dá)到共同進(jìn)化。當(dāng)任務(wù)Ta產(chǎn)生信息交互需求時(shí),其他K-1個(gè)任務(wù)(或子種群)成為任務(wù)Ta獲取信息的主要來源,即:(T1,T2,…,TK) →Ta。
步驟3 信息篩選。選擇所有信息來源中對自己有用的信息,過濾無用信息,可在一定程度上保證信息的正向遷移。這里根據(jù)同時(shí)處理的任務(wù)個(gè)數(shù)選擇不同的信息遷移來源:
a)當(dāng)K=2 時(shí)。若任務(wù)T1停滯進(jìn)化,將任務(wù)T2中個(gè)體適應(yīng)值快速排序,取排名前30%的個(gè)體位置作為信息遷移來源。
b)當(dāng)K>2 時(shí)。采用基于概率的信息選擇模式,隨機(jī)產(chǎn)生[0,1]的隨機(jī)數(shù)rand,當(dāng)rand≤時(shí),選擇任務(wù)T1作為信息遷移源,若Ta連續(xù)在λ代內(nèi)不能改變進(jìn)化停滯現(xiàn)象(即信息負(fù)遷移),則繼續(xù)按概率從剩余K-2 個(gè)任務(wù)中選擇信息遷移來源,如圖2所示。
圖2 多任務(wù)信息來源選擇示意圖Fig.2 Schematic diagram of multi-task information source selection
步驟4 信息遷移。假設(shè)t時(shí)刻,任務(wù)Ta停滯進(jìn)化產(chǎn)生信息交互愿望,選中任務(wù)Tk作為信息遷移來源。按式(3)將任務(wù)Tk所在種群個(gè)體位置與任務(wù)Ta種群中的所有個(gè)體位置進(jìn)行交叉。信息遷移不是單純的信息增加,而是遷移信息后,種群結(jié)構(gòu)的重新調(diào)整。
多任務(wù)SOMAMIF偽代碼如下:
1) 隨機(jī)產(chǎn)生K個(gè)子種群Pa(a∈{1,2,…,K})用于同時(shí)處理K個(gè)極小優(yōu)化問題。
2) 初始化子種群Pa(t=0)(a∈{1,2,…,K})中個(gè)體位置和參數(shù)。
3) 計(jì)算種群Pa(t=0)領(lǐng)先者fbesta(t=0)。
4) while(未滿足循環(huán)結(jié)束條件)
5)t=t+1;
6) for(對任意子種群Pa)
7) for(對任意個(gè)體i,i∈Pa)
8) 按式(1)~(2)更新個(gè)體i位置;
9) 計(jì)算個(gè)體i適應(yīng)值;
10) end for
11) 比較得出子種群Pa當(dāng)前領(lǐng)先者
13)counta=counta+1
14) end if
15) if(counta==γ)
16) 子種群Pa產(chǎn)生信息交互需求;
17) 按圖2選擇信息來源;
18) 按式(3)實(shí)施信息遷移,并評價(jià)個(gè)體適應(yīng)值;
19)counta=0
20) end if
21) 比較子種群Pa全局極值解;
22)end for
23)end while
24)輸出K個(gè)任務(wù)全局最優(yōu)解。
這里僅以同時(shí)處理2 個(gè)任務(wù)(即K=2)為例。設(shè)子種群P1和P2規(guī)模分別為m,最大迭代次數(shù)為Maxiter,任務(wù)T1維數(shù)為d1,任務(wù)T2維數(shù)為d2,假設(shè)d1>d2,則多任務(wù)搜索空間維數(shù)為D=max{d1,d2}=d1,當(dāng)計(jì)算任務(wù)T2適應(yīng)值 時(shí),取d1中 的前d2維。
2.3.1 時(shí)間復(fù)雜度分析
SOMAMIF 同時(shí)優(yōu)化2 個(gè)任務(wù)的時(shí)間復(fù)雜度等于求解任務(wù)T1時(shí)間復(fù)雜度Q1和T2時(shí)間復(fù)雜度Q2之和。其中:
1)優(yōu)化任務(wù)T1時(shí)間復(fù)雜度Q1分析。
a)子種群P1運(yùn)行時(shí)間復(fù)雜度包括:初始化子種群P1中m個(gè)個(gè)體位置時(shí)間復(fù)雜度為O(m·d1);初始化參數(shù)s、PRT時(shí)間復(fù)雜度為O(1);計(jì)算個(gè)體適應(yīng)值時(shí)間復(fù)雜度為O(m·d1);比較得出當(dāng)前領(lǐng)導(dǎo)者位置時(shí)間復(fù)雜度為O(m);計(jì)算參數(shù)PRTVector時(shí)間復(fù)雜度為O(1);更新個(gè)體遷移后位置時(shí)間復(fù)雜度為O(m·d1);更新子種群P1領(lǐng)先者位置時(shí)間復(fù)雜度為O(d1)。經(jīng)過Maxiter次迭代后得=O(Maxiter·m·d1)。
b)子種群P1篩選信息、P2向P1遷移信息復(fù)雜度包括:假設(shè)在整個(gè)算法Maxiter次迭代過程中,子種群P2向P1傳遞了θ1次信息,每次產(chǎn)生信息交互需求時(shí),將子種群P2個(gè)體適應(yīng)值進(jìn)行快速排序時(shí)間復(fù)雜度為O(mlogm),每次信息遷移產(chǎn)生新位置的時(shí)間復(fù)雜度為O(m·d1),計(jì)算新位置適應(yīng)值時(shí)間復(fù)雜度為O(m·d1),比較得出新領(lǐng)導(dǎo)者位置時(shí)間復(fù)雜度總時(shí)間為O(m),總體復(fù)雜度為O(θ1·m·d1);其他操作時(shí)間復(fù)雜度常數(shù)次O(1)。綜合分析,得=O(θ1·m·d1),則Q1==O(Maxiter·m·d1)+O(θ1·m·d1)。
2)優(yōu)化任務(wù)T2時(shí)間復(fù)雜度Q2分析。
優(yōu)化任務(wù)T2的過程與T1相似,也包括兩部分:
a)子種群P2運(yùn)行時(shí)間復(fù)雜度包括:初始化子種群P2中m個(gè)個(gè)體位置時(shí)間復(fù)雜度為O(m·d1);初始化參數(shù)s、PRT時(shí)間復(fù)雜度為O(1);計(jì)算個(gè)體適應(yīng)值時(shí)間復(fù)雜度為O(m·d2);比較得出當(dāng)前領(lǐng)導(dǎo)者位置時(shí)間復(fù)雜度為O(m);計(jì)算參數(shù)PRTVector時(shí)間復(fù)雜度為O(1);更新個(gè)體位置時(shí)間復(fù)雜度為O(m·d1);更新子種群P2領(lǐng)先者位置時(shí)間復(fù)雜度為O(d2)。綜合上述分析,因d1>d2,經(jīng)過Maxiter次迭代后得Q12=O(Maxiter·m·d1)。
b)子種群P2篩選信息、P1向P2遷移信息復(fù)雜度包括:假設(shè)在整個(gè)算法Maxiter次迭代過程中,子種群P1向P2傳遞了θ2次信息,每次產(chǎn)生信息交互需求時(shí),將子種群P1個(gè)體適應(yīng)值進(jìn)行快速排序時(shí)間復(fù)雜度為O(mlogm),每次信息遷移產(chǎn)生新位置的時(shí)間復(fù)雜度為O(m·d1),計(jì)算新位置適應(yīng)值時(shí)間復(fù)雜度為O(m·d2),比較得出新領(lǐng)導(dǎo)者位置時(shí)間復(fù)雜度總時(shí)間為O(m),總體復(fù)雜度為O(θ1·m·d1);其他操作時(shí)間復(fù)雜度常數(shù)次O(1)。綜合分析,得=O(θ2·m·d1)。則Q2==O(Maxiter·m·d1)+O(θ2·m·d1)。
因θ1<Maxiter,θ2<Maxiter,綜 合1)和2),得 出SOMAMIF 求解兩個(gè)不同優(yōu)化任務(wù)的時(shí)間復(fù)雜度如式(4)所示:
2.3.2 空間復(fù)雜度分析
1)任務(wù)T1所需存儲(chǔ)空間包括如下兩部分:
a)子種群P1所需存儲(chǔ)空間:存儲(chǔ)子種群P1中m個(gè)個(gè)體位置所需空間為m·d1;存儲(chǔ)P1領(lǐng)先者位置所需空間為d1。
b)子種群P1篩選、遷移信息所需存儲(chǔ)空間:存儲(chǔ)新位置所需存儲(chǔ)空間為m·d1。
2)任務(wù)T2所需存儲(chǔ)空間包括如下兩部分:
a)子種群P2所需存儲(chǔ)空間:存儲(chǔ)子種群P2中m個(gè)個(gè)體位置所需空間為m·d1;存儲(chǔ)P2領(lǐng)先者位置所需空間為d2。
b)子種群P2篩選、遷移信息所需存儲(chǔ)空間:存儲(chǔ)新位置所需存儲(chǔ)空間為m·d1。
因d1>d2,綜合1)和2),得出SOMAMIF 求解兩個(gè)不同優(yōu)化任務(wù)的空間復(fù)雜度如式(5)所示:
由式(4)~(5)可知:本文多任務(wù)SOMAMIF 求解兩個(gè)不同任務(wù)的時(shí)間和空間復(fù)雜度均為多項(xiàng)式。
將本文算法與文獻(xiàn)[16]算法、文獻(xiàn)[18]算法進(jìn)行對比分析,設(shè)置相同迭代次數(shù)Maxiter、種群規(guī)模m、最大搜索空間維數(shù)d1。文獻(xiàn)[16]的協(xié)同多任務(wù)粒子群優(yōu)化(MultiTasking Coevolutionary Particle Swarm Optimization,MT-CPSO)算法同時(shí)處理兩個(gè)不同任務(wù)時(shí)間和空間復(fù)雜度分別為O(Maxiter·m·d1)、O(m·d1)。
當(dāng)種群規(guī)模m小于等于函數(shù)維數(shù)d1,即m≤d1時(shí),文獻(xiàn)[18]的信息交互多任務(wù)粒子群優(yōu)化(Information Exchange Particle Swarm Optimization for Multitasking,IEPSOM)算法同時(shí)求解兩個(gè)不同任務(wù)的時(shí)間和空間復(fù)雜度分別為O(Maxiter·m·d1)和O(m·d1);當(dāng)m>d1時(shí),文獻(xiàn)[18]算法同時(shí)求解兩個(gè)不同任務(wù)的時(shí)間和空間復(fù)雜度分別為O(Maxiter·m2)和O(m2)。
綜合上述對比分析可知,本文多任務(wù)SOMAMIF的時(shí)間復(fù)雜度和空間復(fù)雜度與MT-CPSO算法、IEPSOM算法相當(dāng)。
本節(jié)以8 個(gè)經(jīng)典benchmark 函數(shù)優(yōu)化問題為例,如式(6)~(13),按函數(shù)和維數(shù)構(gòu)造不同多任務(wù)組合,在同一時(shí)刻處理3 個(gè)優(yōu)化問題,以驗(yàn)證SOMAMIF 求解多任務(wù)性能。為強(qiáng)調(diào)SOMAMIF多任務(wù)環(huán)境中信息篩選機(jī)制的優(yōu)異性能,這里采用消融法比較信息篩選前后算法性能差異,若信息篩選前后涉及到相同的參數(shù),則設(shè)為一致。
為方便描述,將上述8 個(gè)函數(shù)名稱進(jìn)行簡寫,并給出函數(shù)全局最優(yōu)值,如表1所示。
表1 函數(shù)簡稱及最優(yōu)值Tab.1 Function abbreviation and optimal value
當(dāng)SOMA 中未引入信息篩選機(jī)制處理50 維Sphere 函數(shù)優(yōu)化問題時(shí),將其標(biāo)簽設(shè)為50S;若采用多任務(wù)SOMAMIF 同時(shí)處理50 維Sphere function、50 維Ackley function、50 維Rastrigin function,則將其標(biāo)簽設(shè)為(50S,50A,50R),依此類推,將上述8個(gè)函數(shù)分成如下6個(gè)多任務(wù)組:
F1={50S,50A,50R,(50S,50A,50R)}
F2={50S,50G,50Q,(50S,50Q,50G)}
F3={50SD,50SS,50Z,(50SD,50SS,50Z)}
F4={100S,100A,100R,(100S,100A,100R)}
F5={(100S,100G,100Q,(100S,100G,100Q)}
F6={(100SD,100SS,100Z,(100SD,100SS,100Z)}
F1、F2、F3、F4、F5、F6分別用于比較在SOMA 中引入信息篩選機(jī)制前后,50S、50A、50R、50G、50Q、50SD、50SS、50Z、100S、100A、100R、100G、100Q、100SD、100SS、100Z的求解性能。
算法參數(shù)設(shè)置如下:多任務(wù)組合F1、F2、F4、F5搜索空間設(shè)為[-30,30],F(xiàn)3、F6搜索空間均設(shè)為[-10,10],子種群規(guī)模為50,迭代次數(shù)為500,步長step=0.08。同時(shí),多任務(wù)SOMAMIF中的信息遷移節(jié)點(diǎn)γ=10。多任務(wù)組合F1、F2、F3、F4、F5、F6單獨(dú)運(yùn)行30次求平均值實(shí)驗(yàn)結(jié)果如表2所示。
表2 引入信息篩選機(jī)制前后本文算法求解多任務(wù)高維函數(shù)優(yōu)化問題的實(shí)驗(yàn)結(jié)果Tab.2 Experimental results of proposed algorithm solving multi-task high-dimensional function optimization problems before and after introducing information filtering mechanism
當(dāng)SOMA 中未引入信息篩選機(jī)制求解50 維函數(shù),如50S、50A、50R、50G、50Q、50SD、50SS、50Z時(shí),最優(yōu)適應(yīng)值分別為0.101 681、0.208 711、5.755 48、0.108 872、1、1.6E-11、0.000 708 014、66.539 5,平均適 應(yīng)值分別為1.837 051、1.275 379、54.948 31、0.247 349、11.5、44.9、0.166 966、96.012 77,而引入信息篩選機(jī)制的多任務(wù)SOMAMIF 求解任務(wù)(50S,50A,50R)、(50S,50Q,50G)、(50SD,50SS,50Z)組合時(shí),50S、50A、50R、50Q、50G、50SD、50SS、50Z最優(yōu)適應(yīng)值均達(dá)到了全局極值解0,平均適應(yīng)值也遠(yuǎn)遠(yuǎn)優(yōu)于未引入信息篩選機(jī)制的SOMA。當(dāng)上述8 個(gè)函數(shù)維數(shù)上升到100 維時(shí),多任務(wù)SOMAMIF 所得結(jié)果也明顯優(yōu)于SOMA,這說明本文提出的多任務(wù)算法通過子種群之間的信息篩選和遷移能顯著提高解的質(zhì)量。
表3 將本文多任務(wù)SOMAMIF 運(yùn)行結(jié)果與文獻(xiàn)[16]的多任務(wù)MT-CPSO 算法、文獻(xiàn)[18]的多任務(wù)IEPSOM 算法進(jìn)行對比,本文算法和MT-CPSO算法、IEPSOM算法在求解上述50維和100 維函數(shù)時(shí),實(shí)驗(yàn)結(jié)果基本相當(dāng),但本文算法在求解100R、100SS、100Z時(shí)性能優(yōu)于MT-CPSO 算法,且除了求解50SD、100SD這兩個(gè)函數(shù)時(shí)稍劣于IEPSOM 算法外,本文算法求解其他函數(shù)結(jié)果均優(yōu)于IEPSOM 算法。這些結(jié)果在SOMAMIF 和MT-CPSO 算法、SOMAMIF 和IEPSOM 算法威 爾克森符號秩檢驗(yàn)結(jié)果中得到了進(jìn)一步證實(shí)(設(shè)置信度水平為0.05),結(jié)果如表4所示。
表3 不同算法求解多任務(wù)高維函數(shù)優(yōu)化問題的平均適應(yīng)值對比Tab.3 Average fitness comparison of different algorithms in solving multi-task high-dimensional function optimization problems
表4 不同算法求解多任務(wù)高維函數(shù)優(yōu)化問題威爾克森符號秩檢驗(yàn)結(jié)果Tab.4 Wilcoxon signed-rank test results of different algorithms in solving multi-task high-dimensional function optimization problems
圖3 進(jìn)一步給出信息篩選前后,高維函數(shù)50S、50A、50R、50Q、50G、50SD、50Z、100S、100A、100R、100G、100Z單獨(dú)運(yùn)行30 次的平均收斂曲線。由圖3 可知,當(dāng)SOMA 中未引入信息篩選機(jī)制時(shí),上述50維或100維函數(shù)收斂速度緩慢,均停滯在局部極值解附近,而SOMAMIF能明顯同時(shí)加速多個(gè)任務(wù)的收斂,使其快速收斂至全局最優(yōu)解。
圖3 信息篩選前后高維函數(shù)平均收斂曲線圖Fig.3 Average convergence curves for high-dimensional functions before and afterinformation filtering
2020 年一場突發(fā)疫情席卷全球,不可避免地對中國乃至世界經(jīng)濟(jì)造成較大沖擊,企業(yè)穩(wěn)崗壓力增大,一些企業(yè)裁員數(shù)上升,勞動(dòng)力市場需求“縮水”,失業(yè)人員增加。2020 屆全國普通高校畢業(yè)生874 萬,比上一年增加了40 萬人,增量、增幅均為近年之最,這讓原本嚴(yán)峻的就業(yè)形勢雪上加霜。盡管地方政府出臺(tái)了一系列措施,積極鼓勵(lì)大學(xué)生返鄉(xiāng)創(chuàng)業(yè)就業(yè),但收效甚微。有效識(shí)別制約大學(xué)生返鄉(xiāng)關(guān)鍵因素,可為地方政府鼓勵(lì)和引導(dǎo)大學(xué)生返鄉(xiāng)就業(yè)政策制定、調(diào)整提供科學(xué)參考依據(jù)。因影響大學(xué)生返鄉(xiāng)因素眾多,并可能存在多重共線性,冗余因素的存在不僅導(dǎo)致計(jì)算效率低下,還在一定程度上干擾辨識(shí)過程。
大學(xué)生返鄉(xiāng)關(guān)鍵制約因素挖掘過程實(shí)質(zhì)上是一個(gè)特征選擇過程,屬于典型的二元離散優(yōu)化問題。本節(jié)以SOMAMIF為搜索策略,將種群中粒子位置通過Sigmoid 函數(shù)轉(zhuǎn)換成1 或0,1或0分別表示該因素是或否被選擇為返鄉(xiāng)關(guān)鍵制約因素,分形維數(shù)作為子集評估度量準(zhǔn)則,同時(shí)提取戶籍所在地分別為縣及以下和三線以上城市的大學(xué)生返鄉(xiāng)關(guān)鍵制約因素。
目前計(jì)算數(shù)據(jù)集分形維數(shù)的方法較多,這里采用盒計(jì)數(shù)法。假設(shè)數(shù)據(jù)集指標(biāo)個(gè)數(shù)為L,數(shù)據(jù)點(diǎn)落在邊長為r的L維格子中,其關(guān)聯(lián)分形維數(shù)如式(14)所示:
其中:s(r)=Cr,w為落入第w個(gè)格子的數(shù)據(jù)點(diǎn)數(shù);r為格子半徑,[r1,r2]為數(shù)據(jù)集無標(biāo)度空間。數(shù)據(jù)集中數(shù)據(jù)點(diǎn)每維采用十進(jìn)制實(shí)數(shù)表示,根據(jù)點(diǎn)坐標(biāo)值和盒子半徑統(tǒng)計(jì)該半徑下每個(gè)盒子中落入點(diǎn)數(shù)的平方和,根據(jù)不同半徑r得到一系列不同點(diǎn)對(lnr,lns(r)),擬合后所得直線斜率,即為關(guān)聯(lián)分形維數(shù)。
3.2.1 數(shù)據(jù)集描述及數(shù)據(jù)預(yù)處理
仿真實(shí)驗(yàn)以高校學(xué)生為研究對象,將受訪學(xué)生分成兩組:
①戶籍所在地為縣及以下高校學(xué)生;
②戶籍所在地為三線及以上城市高校學(xué)生。
涉及到的返鄉(xiāng)因素共14 個(gè),分別為:1)所在大學(xué)類型;2)學(xué)歷;3)家庭情況;4)學(xué)習(xí)成績;5)當(dāng)前就業(yè)形勢;6)自身求職競爭力;7)父母是否支持返鄉(xiāng);8)家鄉(xiāng)薪資待遇;9)家鄉(xiāng)生活成本;10)回鄉(xiāng)就業(yè)優(yōu)惠政策;11)家鄉(xiāng)生活節(jié)奏工作壓力;12)對家鄉(xiāng)未來發(fā)展環(huán)境滿意度;13)對家鄉(xiāng)基礎(chǔ)設(shè)施滿意度;14)對家鄉(xiāng)居住環(huán)境滿意度。返鄉(xiāng)意愿有兩種:愿意返鄉(xiāng)就業(yè)/不愿意返鄉(xiāng)就業(yè)。
構(gòu)建基于SOMAMIF的多任務(wù)組:
1)任務(wù)T1:挖掘戶籍所在地為縣及以下高校學(xué)生返鄉(xiāng)關(guān)鍵制約因素。
2)任務(wù)T2:挖掘戶籍所在地為三線及以上城市高校學(xué)生返鄉(xiāng)關(guān)鍵制約因素;
其中任務(wù)T1實(shí)例數(shù)為383,任務(wù)T2實(shí)例數(shù)為43。
3.2.2 多任務(wù)高校學(xué)生返鄉(xiāng)關(guān)鍵制約因素提取結(jié)果分析
按式(14)分別計(jì)算任務(wù)T1和T2原始數(shù)據(jù)集分形維數(shù)為2.713 13、4.185 62,然后向上取整得任務(wù)T1返鄉(xiāng)關(guān)鍵制約因素個(gè)數(shù)為3(即,任務(wù)T2返鄉(xiāng)關(guān)鍵制約因素個(gè)數(shù)為5(即。
將子種群規(guī)模設(shè)為50,迭代次數(shù)為20,信息遷移節(jié)點(diǎn)γ=3。采用本文多任務(wù)SOMAMIF結(jié)合分形維數(shù)同時(shí)求解任務(wù)T1和T2后,得到戶籍所在地為縣及以下高校學(xué)生返鄉(xiāng)關(guān)鍵制約因素為:父母是否支持返鄉(xiāng)、家鄉(xiāng)薪資待遇和家鄉(xiāng)居住環(huán)境滿意度;戶籍所在地為三線及以上城市高校學(xué)生返鄉(xiāng)關(guān)鍵制約因素為:父母是否支持返鄉(xiāng)、家鄉(xiāng)薪資待遇、家鄉(xiāng)生活成本、家鄉(xiāng)生活節(jié)奏工作壓力、對家鄉(xiāng)基礎(chǔ)設(shè)施滿意度,約簡率分別為78.57%和64.29%。
進(jìn)一步采用支持向量機(jī)(Support Vector Machine,SVM)計(jì)算得出返鄉(xiāng)關(guān)鍵制約因素提取前后數(shù)據(jù)集的平均分類準(zhǔn)確率,任務(wù)T1和T2原始數(shù)據(jù)集的平均分類準(zhǔn)確率分別為72.913 65%和82.226 18%,最優(yōu)返鄉(xiāng)關(guān)鍵制約因素平均分類準(zhǔn)確率分別為73.262 31%和82.824 75%,平均分類準(zhǔn)確率分別提高了0.348 66個(gè)百分點(diǎn)和0.598 57個(gè)百分點(diǎn)。
圖4 和圖5 分別給出了引入信息篩選機(jī)制前后算法單獨(dú)運(yùn)行30 次時(shí),不同戶籍高校學(xué)生返鄉(xiāng)關(guān)鍵制約因素的平均分類準(zhǔn)確率收斂曲線。
圖4 信息篩選前后任務(wù)T1平均收斂曲線Fig.4 Average convergence curves for task T1 before and after information filtering
圖5 信息篩選前后任務(wù)T2平均收斂曲線Fig.5 Average convergence curves for task T2 before and after information filtering
由圖4~5 可知,多任務(wù)(T1,T2)的收斂速度明顯優(yōu)于T1和T2,能顯著縮短返鄉(xiāng)關(guān)鍵制約因素的提取時(shí)間。
表5 進(jìn)一步給出了不同戶籍高校學(xué)生返鄉(xiāng)關(guān)鍵制約因素提取前后威爾克森符號秩檢驗(yàn)結(jié)果,設(shè)置信度水平為0.05,由表5可知,T1和(T1,T2)、T2和(T2,T1)的差距顯著。
表5 返鄉(xiāng)關(guān)鍵制約因素提取前后威爾克森符號秩檢驗(yàn)結(jié)果Tab.5 Wilcoxon signed-rank test results before and after key home returning constraints extraction
本文通過挖掘自組織遷移算法的“隱并行性”,在基本SOMA 中基于信息遷移機(jī)制在同一時(shí)間內(nèi)有效求解多個(gè)不同優(yōu)化問題,并引入基于概率的信息選擇方法,在一定程度上保證了信息的正向遷移,能顯著提高多任務(wù)的求解質(zhì)量并加速各優(yōu)化問題的收斂,為多任務(wù)優(yōu)化提供了一種新穎的高性能計(jì)算模型。本文從全新視角研究SOMA,既拓寬了SOMA 的知識(shí)內(nèi)涵,也為后續(xù)研究推廣到其他群智能算法實(shí)現(xiàn)多任務(wù)處理,奠定了理論和實(shí)驗(yàn)基礎(chǔ)。