邱云飛,于智龍,郭羽含,劉雨詩,呂 爽
(1.遼寧工程技術(shù)大學(xué) 軟件學(xué)院,遼寧 葫蘆島 125105;2.遼寧工程技術(shù)大學(xué) 工商管理學(xué)院,遼寧 葫蘆島 125105)
隨著全球工業(yè)化進(jìn)程的深度融合,可持續(xù)指標(biāo)在供應(yīng)鏈網(wǎng)絡(luò)中得到了廣泛普及和應(yīng)用[1-2]。作為資源消耗[3]、環(huán)境污染[4]、促進(jìn)社會(huì)環(huán)保意識提升[5]的重要責(zé)任主體之一,可持續(xù)供應(yīng)鏈網(wǎng)絡(luò)的設(shè)計(jì)優(yōu)化成為了世界各國關(guān)注的焦點(diǎn)問題。同時(shí),政府和消費(fèi)者日益關(guān)注可持續(xù)指標(biāo)的實(shí)施效果,這對供應(yīng)鏈網(wǎng)絡(luò)中各層級企業(yè)的自身經(jīng)濟(jì)效益、決策能力、環(huán)境責(zé)任、社會(huì)責(zé)任都提出了更高的要求[6]。如何構(gòu)建更為平衡、高效且能覆蓋更多可持續(xù)指標(biāo)的供應(yīng)鏈網(wǎng)絡(luò)模型受到了學(xué)術(shù)界的高度重視。
可持續(xù)供應(yīng)鏈網(wǎng)絡(luò)設(shè)計(jì)(Sustainable Supply Chain Network Design, SSCND)作為供應(yīng)鏈網(wǎng)絡(luò)中的頂層戰(zhàn)略決策,需要對網(wǎng)絡(luò)中各層級進(jìn)行設(shè)施選擇、成本預(yù)估、物流分析等統(tǒng)籌設(shè)計(jì)[7],協(xié)調(diào)各層級間可持續(xù)指標(biāo)的參數(shù)選擇和優(yōu)化。目前,眾多學(xué)者已經(jīng)對這一方向展開了諸多研究,CHALMARDI等[8]考慮供應(yīng)鏈網(wǎng)絡(luò)經(jīng)濟(jì)效益和環(huán)境保護(hù)的平衡,建立了一個(gè)通過政府提供財(cái)務(wù)激勵(lì)措施,鼓勵(lì)企業(yè)決策者使用更清潔的技術(shù)指標(biāo)優(yōu)化的可持續(xù)供應(yīng)鏈網(wǎng)絡(luò)模型;YADAV等[9]將多渠道分銷指標(biāo)納入可持續(xù)供應(yīng)鏈網(wǎng)絡(luò)設(shè)計(jì)中,提出一種多渠道分銷供應(yīng)鏈網(wǎng)絡(luò)模型,在保證經(jīng)濟(jì)效益的基礎(chǔ)上,將網(wǎng)絡(luò)銷售與本地零售的分銷網(wǎng)絡(luò)整合在了一起;ZHEN等[10]設(shè)計(jì)了一種考慮CO2排放和總運(yùn)營成本指標(biāo)的雙目標(biāo)優(yōu)化模型,提供了在不確定需求下開發(fā)綠色和可持續(xù)供應(yīng)鏈網(wǎng)絡(luò)的集成視角;ESKANDARPOUR等[11]考慮在具有多層設(shè)施和運(yùn)輸方式?jīng)Q策的供應(yīng)鏈網(wǎng)絡(luò)中,將物流成本及碳排放降至最低,設(shè)計(jì)了一個(gè)雙目標(biāo)的混合整數(shù)線性規(guī)劃模型。
可以看出,多數(shù)研究聚焦在對供應(yīng)鏈網(wǎng)絡(luò)中經(jīng)濟(jì)類與環(huán)境類指標(biāo)的優(yōu)化,對供應(yīng)鏈的社會(huì)影響考慮略顯不足,但也有相關(guān)研究著重考慮了社會(huì)類指標(biāo)對可持續(xù)供應(yīng)鏈網(wǎng)絡(luò)的影響,如STRANIERI等[12]調(diào)查企業(yè)社會(huì)責(zé)任活動(dòng)的實(shí)施在食品供應(yīng)鏈內(nèi)縱向關(guān)系重組中的作用;LIU等[13]設(shè)計(jì)了一個(gè)在政府支持下由零售商主導(dǎo)并考慮企業(yè)社會(huì)責(zé)任的供應(yīng)鏈決策問題,建立了由政府,主導(dǎo)零售商和n個(gè)供應(yīng)商組成的三階段Stackelberg博弈模型。KHOSROSHAHI等[14]著重考慮了制造商的透明度對供應(yīng)鏈成員的利潤和客戶滿意度的影響,提出了新的消費(fèi)者滿意度指數(shù)作為企業(yè)社會(huì)責(zé)任指標(biāo)。同時(shí),也有相關(guān)研究考慮了多項(xiàng)指標(biāo)協(xié)同整合后對可持續(xù)供應(yīng)鏈網(wǎng)絡(luò)的影響,如HAJIAGHAEI-KESHTELI等[15]設(shè)計(jì)了一種多指標(biāo)下著重考慮運(yùn)輸成本中折扣因素的多目標(biāo)可持續(xù)供應(yīng)鏈網(wǎng)絡(luò)模型;ARAMPANTZI[16]等提出一種多目標(biāo)混合整數(shù)線性規(guī)劃模型,模型考慮了可持續(xù)供應(yīng)鏈中涉及的多項(xiàng)重要指標(biāo),包含經(jīng)濟(jì)成本指標(biāo)、環(huán)境指標(biāo)、社會(huì)指標(biāo),并對三者通過ε約束實(shí)現(xiàn)有效折衷;郭羽含等[17]在文獻(xiàn)[16]的基礎(chǔ)上,將CITI(corporate information transparency index)評價(jià)指標(biāo)[18]納入可持續(xù)供應(yīng)鏈網(wǎng)絡(luò),同時(shí)考慮經(jīng)濟(jì)效益、環(huán)境污染和社會(huì)責(zé)任,提出了制造業(yè)可持續(xù)供應(yīng)鏈的綜合優(yōu)化模型;NAYERI等[19]設(shè)計(jì)了一個(gè)主要考慮優(yōu)化經(jīng)濟(jì)、環(huán)境和社會(huì)影響的可持續(xù)閉環(huán)供應(yīng)鏈網(wǎng)絡(luò)模型,并根據(jù)模糊魯棒優(yōu)化(Fuzzy Robust Optimization, FRO)應(yīng)對不同業(yè)務(wù)環(huán)境變化對網(wǎng)絡(luò)模型帶來的不確定性。此類建??紤]了許多對可持續(xù)供應(yīng)鏈具有影響的指標(biāo)類型,伴隨模型復(fù)雜度的提升和某些指標(biāo)間的互相矛盾,如何對多目標(biāo)問題進(jìn)行協(xié)調(diào)整合,也是建模過程需要考慮的重點(diǎn)。
此外,由于可持續(xù)供應(yīng)鏈網(wǎng)絡(luò)中的閉環(huán)物流[20]重視正向物流[21]與逆向物流[22]的統(tǒng)一規(guī)劃,通過資源的回收再利用讓本來處于供應(yīng)鏈網(wǎng)絡(luò)末端的消費(fèi)者變成了新循環(huán)的起點(diǎn),并在網(wǎng)絡(luò)各層級間實(shí)現(xiàn)了信息的有效溝通,可以大大減少環(huán)境污染與能源消耗,實(shí)現(xiàn)供應(yīng)鏈網(wǎng)絡(luò)中各項(xiàng)資源的優(yōu)化配置。姚鋒敏等[23]設(shè)計(jì)了針對由一個(gè)制造商、兩個(gè)競爭零售商和一個(gè)第三方回收商組成的閉環(huán)供應(yīng)鏈,分別在兩個(gè)競爭零售商公平中性和公平關(guān)切下構(gòu)建了閉環(huán)供應(yīng)鏈的決策模型;景熠等[24]設(shè)計(jì)了一個(gè)三階段閉環(huán)供應(yīng)鏈網(wǎng)絡(luò),建立了回收—生產(chǎn)—分銷三層協(xié)同的計(jì)劃模型;李伯棠等[25]綜合考慮供應(yīng)鏈網(wǎng)絡(luò)中的模糊性、碳排放和響應(yīng)能力問題,建立了閉環(huán)物流網(wǎng)絡(luò)模糊混合線性規(guī)劃模型;張鑫等[26]以對成本和環(huán)境影響最小、社會(huì)影響最大為目標(biāo),設(shè)計(jì)了帶模糊參數(shù)的多目標(biāo)閉環(huán)可持續(xù)供應(yīng)鏈網(wǎng)絡(luò)模型。
對可持續(xù)供應(yīng)鏈模型中的混合整數(shù)線性規(guī)劃(Mixed Integer Linear Programming, MILP)求解是典型的NP-Hard問題,為高效求解包含越來越多復(fù)雜指標(biāo)的模型,各類求解器的性能也在逐步提升,例如Cplex、Gurobi、Xpress、SCIP等求解器都在緊密迭代,并添加各種新特性。但隨著算例規(guī)模擴(kuò)大、模型指標(biāo)復(fù)雜度提升,求解器的求解效率普遍降低,如何高效優(yōu)化求解此類問題仍是一個(gè)挑戰(zhàn)。分支定界法(Branch and Bound, BB)是一種整數(shù)規(guī)劃的精確算法框架[27],核心思想是將NP難問題分解為一個(gè)個(gè)線性規(guī)劃問題,并在求解的過程中實(shí)時(shí)追蹤原問題的上界(最優(yōu)可行解)和下界(最優(yōu)線性松弛解),該方法作為混合整數(shù)規(guī)劃的精確解法,廣泛應(yīng)用于組合優(yōu)化問題[28]。如CAO等[29]為減少各種損失并提高災(zāi)害響應(yīng)效率,提出一種可持續(xù)的應(yīng)急組織分配優(yōu)化策略模型,針對多個(gè)目標(biāo)設(shè)計(jì)了分支定界方法和處理策略進(jìn)行求解;DAVARI等[30]為解決機(jī)會(huì)受限資源受限項(xiàng)目調(diào)度問題,提出一種分支定界算法和混合整數(shù)線性規(guī)劃公式,對于所提出的分支定界算法,引入了2種不同的分支方案和8種不同的優(yōu)先級規(guī)則。隨著機(jī)器學(xué)習(xí)(Machine Learning, ML)、深度學(xué)習(xí)(Deep Learning, DL)的普及和應(yīng)用,在分支定界法中引入相應(yīng)概念和方法也成為了提升算法效率的重要方式。HE等[31]在分支定界的基礎(chǔ)上,基于模仿學(xué)習(xí)(Imitation learning, IL)設(shè)計(jì)了一種用于學(xué)習(xí)分支定界法中處理不同類別問題的自適應(yīng)節(jié)點(diǎn)搜索方法;KHALIL等[32]提出一個(gè)用于MILP中可變分支的機(jī)器學(xué)習(xí)框架,通過收集強(qiáng)分支所做的決策,通過機(jī)器學(xué)習(xí)中的學(xué)習(xí)排序方法(learning to rank)得到了一個(gè)易于評估的代用函數(shù);BALCAN等[33]通過機(jī)器學(xué)習(xí)來確定分支定界實(shí)例分配中分區(qū)過程的最佳權(quán)重,為分支定界的算法配置提供了樣本復(fù)雜度保證;ETHEVE等[34]將強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)的思想應(yīng)用于“分支和邊界”設(shè)置中,提出一種最小化子樹大小的擬合方法(Fitting for Minimising the Subtree Size, FMSTS),使得局部價(jià)值函數(shù)和整體價(jià)值度量之間獲得了很好的一致性。
基于以上可持續(xù)供應(yīng)鏈網(wǎng)絡(luò)面對的問題和現(xiàn)有的改進(jìn)思路,本文力求建立一個(gè)多目標(biāo)、多層級的可持續(xù)閉環(huán)供應(yīng)鏈網(wǎng)絡(luò)模型,主要貢獻(xiàn)在于:①采用最新《CITI評價(jià)指南7.0》中的5項(xiàng)重要指標(biāo)針對本文研究的可持續(xù)閉環(huán)供應(yīng)鏈網(wǎng)絡(luò)建立了一種多目標(biāo)體系結(jié)構(gòu);②提出層次分析加權(quán)綜合評價(jià)(Anolytic Hierarchy Process-Weighted Comprehensive Criterion Method, AHP-WCCM)模型對上述多目標(biāo)體系結(jié)構(gòu)進(jìn)行協(xié)調(diào)整合,構(gòu)建了五位一體可持續(xù)閉環(huán)供應(yīng)鏈網(wǎng)絡(luò)模型;③為了更高效地求解上述網(wǎng)絡(luò)模型,使用蒙特卡洛樹搜索(Monte Carlo Tree Search, MCTS)改進(jìn)了分支定界方法,提出一種蒙特卡洛樹搜索分支定界算法(MCTS_BB),通過分支選擇策略、隨機(jī)模擬搜索策略和剪枝策略對分支定界中的滿二叉樹進(jìn)行非對稱、自適應(yīng)的高效搜索,由此加快搜索速度并增強(qiáng)了算法跳出局部最優(yōu)解的能力,提升求解效率;④參考企業(yè)真實(shí)數(shù)據(jù)設(shè)計(jì)了多個(gè)算例對模型與算法進(jìn)行仿真實(shí)驗(yàn)和對比分析,驗(yàn)證了模型與算法的可行性與實(shí)用性,并根據(jù)實(shí)驗(yàn)結(jié)果為供應(yīng)鏈網(wǎng)絡(luò)中的各層級企業(yè)實(shí)現(xiàn)可持續(xù)發(fā)展戰(zhàn)略提供決策參考。
本文所考慮的多層級可持續(xù)閉環(huán)供應(yīng)鏈網(wǎng)絡(luò)由供應(yīng)商、制造/回收企業(yè)、配送中心、處置中心和客戶群組成,網(wǎng)絡(luò)可分為正向物流與逆向物流,網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。在正向物流中,制造/回收企業(yè)從供應(yīng)商處采購相應(yīng)的原材料組織生產(chǎn),產(chǎn)品生產(chǎn)后被運(yùn)送到相應(yīng)的配送中心,再根據(jù)客戶群的訂單詳情進(jìn)行產(chǎn)品配送;在逆向物流中,客戶群將有回收利用價(jià)值的老舊產(chǎn)品交予配送中心,再由配送中心統(tǒng)一按規(guī)格與型號運(yùn)送到處置中心進(jìn)行檢測,將檢測通過的產(chǎn)品拆分后運(yùn)送至制造/回收企業(yè)進(jìn)行回收再利用,檢測未通過的產(chǎn)品進(jìn)行統(tǒng)一填埋銷毀。為了節(jié)約成本,配送中心兼具回收產(chǎn)品的分揀職能,處置中心兼具回收產(chǎn)品的檢測職能與拆分職能,拆分后的回收產(chǎn)品可由制造/回收企業(yè)進(jìn)行再生產(chǎn)。
網(wǎng)絡(luò)設(shè)計(jì)中,依據(jù)五位一體可持續(xù)指標(biāo),將經(jīng)濟(jì)成本、合規(guī)整改與節(jié)能減排、綠色供應(yīng)鏈、推動(dòng)公眾綠色選擇、供應(yīng)鏈溝通與透明5項(xiàng)指標(biāo)根據(jù)網(wǎng)絡(luò)模型細(xì)化。為簡化數(shù)學(xué)模型,將二氧化碳作為供應(yīng)鏈網(wǎng)絡(luò)中的主要溫室氣體,將運(yùn)輸過程中產(chǎn)生的碳排放歸因于運(yùn)輸工具的能源消耗,對5項(xiàng)指標(biāo)做如下釋義:
(1)經(jīng)濟(jì)成本 包括原材料成本及原材料運(yùn)輸成本,產(chǎn)品/再生產(chǎn)品制造成本,產(chǎn)品/再生產(chǎn)品運(yùn)輸成本,各設(shè)施建設(shè)成本,各設(shè)施固定運(yùn)營成本,配送中心對回收產(chǎn)品的分揀成本,處置中心對回收產(chǎn)品的檢測成本,處置中心對檢測合格回收產(chǎn)品的拆分成本,處置中心對報(bào)廢產(chǎn)品的銷毀成本。
(2)合規(guī)整改與節(jié)能減排 包括設(shè)施計(jì)劃環(huán)境合規(guī)表現(xiàn)總數(shù),設(shè)施計(jì)劃合規(guī)整改總數(shù),設(shè)施計(jì)劃完成能源與溫室氣體減排目標(biāo)的數(shù)目、設(shè)施計(jì)劃完成資源消耗與污染物減排目標(biāo)的數(shù)目。
(3)綠色供應(yīng)鏈 包括原料/產(chǎn)品/回收產(chǎn)品在各設(shè)施間運(yùn)輸?shù)奶寂欧?,建設(shè)各設(shè)施的碳排放,制造/回收企業(yè)組織生產(chǎn)/再生產(chǎn)的碳排放、廢氣排放、廢水排放和固體廢物排放(包含危險(xiǎn)廢物),處置中心銷毀產(chǎn)品產(chǎn)生的碳排放。
(4)推動(dòng)公眾綠色選擇 包含設(shè)施計(jì)劃改善環(huán)境表現(xiàn)的工作數(shù)量,設(shè)施計(jì)劃引導(dǎo)公眾關(guān)注供應(yīng)鏈的環(huán)境表現(xiàn)并作出綠色選擇的工作數(shù)量。
(5)供應(yīng)鏈溝通與透明 包含設(shè)施計(jì)劃無法解決的問責(zé)與溝通數(shù)量,設(shè)施計(jì)劃不公開披露的供應(yīng)鏈信息數(shù)量。
依據(jù)文獻(xiàn)[35]和《CITI評價(jià)指南7.0》設(shè)置本文供應(yīng)鏈網(wǎng)絡(luò)中各指標(biāo)對應(yīng)的權(quán)重比例。
根據(jù)本文供應(yīng)鏈網(wǎng)絡(luò)模型建立的實(shí)際情況和研究的方便,作出以下假設(shè):
(1)因?yàn)楣?yīng)商所在地和自身?xiàng)l件資質(zhì)不同,提供給制造/回收企業(yè)的原材料采購成本有所不同。
(2)因?yàn)橹圃?回收企業(yè)所在地的勞動(dòng)力價(jià)格、原材料成本、自身生產(chǎn)能力不同,不同制造/回收企業(yè)的生產(chǎn)成本有所不同,同時(shí),制造/回收企業(yè)的碳排放、廢氣排放、廢水排放和固體廢物排放(包含危險(xiǎn)廢物)也有所不同。
(3)客戶群的位置相對固定,客戶群對各類產(chǎn)品的需求較為平均。
(4)回收產(chǎn)品為用戶棄用的老舊產(chǎn)品,無需向用戶支付回收費(fèi)用。
(5)從客戶群回收產(chǎn)品的回收率已知,回收產(chǎn)品通過配送中心的逆向物流進(jìn)行回收和處置。
(6)因?yàn)榕渌椭行乃诘睾妥陨碣Y質(zhì)條件不同,不同配送中心對客戶群的配送成本有所不同。
(7)各層級正向物流與逆向物流距離相等。
(8)回收產(chǎn)品的報(bào)廢率已知,若回收產(chǎn)品檢測通過,拆分后一定可以投入再生產(chǎn)。
(9)處置中心采用填埋的方式進(jìn)行報(bào)廢處理,不會(huì)產(chǎn)生廢氣、廢水和固體廢物排放(包含危險(xiǎn)廢物)。
(10)回收再利用產(chǎn)品逆向物流的運(yùn)輸成本小于產(chǎn)品再制造可以節(jié)約的生產(chǎn)成本。
(11)因?yàn)楣?yīng)網(wǎng)絡(luò)的不同層級間可選擇不同運(yùn)輸方式,每種運(yùn)輸方式的運(yùn)輸成本和碳排放有所不同。
(12)由于不同制造/回收企業(yè)所在地政策與生產(chǎn)成本不同,設(shè)置能源與溫室氣體減排目標(biāo)和資源消耗與污染物減排目標(biāo)有所不同。
(13)由于不同制造/回收企業(yè)所在地政策、企業(yè)戰(zhàn)略、企業(yè)自身資質(zhì)不同,企業(yè)計(jì)劃改善環(huán)境表現(xiàn)的工作數(shù)量、計(jì)劃引導(dǎo)公眾關(guān)注供應(yīng)鏈的環(huán)境表現(xiàn)并作出綠色選擇的工作數(shù)量有所不同。
(14)由于不同制造/回收企業(yè)所在地政策、企業(yè)戰(zhàn)略、企業(yè)自身資質(zhì)不同,加之不同地區(qū)公眾對供應(yīng)鏈關(guān)注程度不同,企業(yè)計(jì)劃無法解決的公眾問責(zé)與溝通的數(shù)量和不主動(dòng)公開披露供應(yīng)鏈的信息數(shù)量有所不同。
(15)各設(shè)施對計(jì)劃量參數(shù)的預(yù)計(jì)偏差在[-5%,5%]之內(nèi)。
(16)各設(shè)施的計(jì)劃量參數(shù)在供應(yīng)鏈網(wǎng)絡(luò)中的觀測周期為1個(gè)月。
(17)若在供應(yīng)鏈網(wǎng)絡(luò)中實(shí)際觀測到的計(jì)劃量參數(shù)偏差過大,則需要對相應(yīng)設(shè)施做出整改。
為建立供應(yīng)鏈網(wǎng)絡(luò)的數(shù)學(xué)模型,定義符號和變量如表1和表2所示。
表1 多目標(biāo)可持續(xù)供應(yīng)鏈模型下標(biāo)符號及其含義
表2 多目標(biāo)可持續(xù)供應(yīng)鏈模型變量及其含義
續(xù)表2
續(xù)表2
依據(jù)問題描述及以上模型假設(shè)與符號說明,本文建立的可持續(xù)閉環(huán)供應(yīng)鏈網(wǎng)絡(luò)模型的目標(biāo)函數(shù)可以描述為:
(1)經(jīng)濟(jì)成本目標(biāo)函數(shù)(ECOF)由設(shè)施固定成本(FC)、運(yùn)輸成本(TC)、設(shè)施職能成本(FNC)及固定節(jié)約成本(FSC)組成。其中,F(xiàn)C為各制造/回收企業(yè)、處置中心、配送中心的固定建設(shè)成本及固定運(yùn)營成本之和;TC為供應(yīng)鏈網(wǎng)絡(luò)中各層級間的正向物流與逆向物流的運(yùn)輸成本之和;FNC為各供應(yīng)商的原料采購成本,各制造/回收企業(yè)的生產(chǎn)/再生產(chǎn)成本,各配送中心的分揀成本,各處置中心的檢測/拆分/填埋銷毀成本之和;FSC為上文中提到的配送中心與處置中心因?yàn)榧婢叻謷c檢測職能所節(jié)約的固定成本之和。
minECOF=FC+TC+FNC-FSC。
(1)
式中:
(2)合規(guī)整改與目標(biāo)減排目標(biāo)函數(shù)(CRTEROF)由企業(yè)整改(CR)與企業(yè)減排(CER)組成。其中:CR表示制造/回收企業(yè)計(jì)劃環(huán)境合規(guī)表現(xiàn)總數(shù)與制造/回收企業(yè)計(jì)劃合規(guī)整改總數(shù)、處置中心計(jì)劃環(huán)境合規(guī)表現(xiàn)總數(shù)與處置中心計(jì)劃合規(guī)整改總數(shù)、配送中心計(jì)劃環(huán)境合規(guī)表現(xiàn)總數(shù)與配送中心計(jì)劃合規(guī)整改總數(shù)之和;CER表示企業(yè)計(jì)劃完成能源與溫室氣體減排目標(biāo)數(shù)目與企業(yè)計(jì)劃完成資源消耗與污染物減排目標(biāo)數(shù)目之和。
maxCRTEROF=CR+CER。
(2)
式中:
(3)綠色供應(yīng)鏈目標(biāo)函數(shù)(GSCOF)由運(yùn)輸碳排放(TCE)、建設(shè)碳排放(BCE)、設(shè)施職能碳排放(FCE)、企業(yè)生產(chǎn)有害物排放(CPHE)組成。其中:TCE為各設(shè)施間正向物流與逆向物流的碳排放量之和;BCE為建設(shè)各設(shè)施產(chǎn)生的碳排放量之和;FCE為制造/回收企業(yè)生產(chǎn)/再生產(chǎn)的碳排放量,配送中心分揀回收產(chǎn)品產(chǎn)生的碳排放量,處置中心檢測回收產(chǎn)品/拆分檢測合格產(chǎn)品/填埋銷毀檢測不合格產(chǎn)品產(chǎn)生的碳排放量之和;CPHE為制造/回收企業(yè)生產(chǎn)/再生產(chǎn)過程中廢氣、廢水、固體廢物(包含危險(xiǎn)廢物)的排放量之和。
minGSCOF=TCE+BCE+FCE+CPHE。
(3)
式中:
(4)推動(dòng)公眾綠色選擇目標(biāo)函數(shù)(PPGCOF)由設(shè)施改善環(huán)境表現(xiàn)(IEP)與設(shè)施引導(dǎo)公眾關(guān)注供應(yīng)鏈環(huán)境表現(xiàn)(LPE)組成。其中:IEP為制造/回收企業(yè)計(jì)劃改善環(huán)境表現(xiàn)的工作數(shù)量與處置中心計(jì)劃改善環(huán)境表現(xiàn)的工作數(shù)量之和;LPE為制造/回收企業(yè)計(jì)劃引導(dǎo)公眾關(guān)注供應(yīng)鏈環(huán)境表現(xiàn)并作出綠色選擇的工作數(shù)量與配送中心計(jì)劃引導(dǎo)公眾關(guān)注供應(yīng)鏈環(huán)境表現(xiàn)并作出綠色選擇的工作數(shù)量之和。
maxPPGCOF=IEP+LPE。
(4)
(5)供應(yīng)鏈溝通與透明目標(biāo)函數(shù)(SCCTOF)由公眾問責(zé)與溝通(CCP)與未公開披露的供應(yīng)鏈信息(DIP)組成。其中:CCP為制造/回收企業(yè)Mj計(jì)劃無法解決的問責(zé)與溝通數(shù)量與配送中心Dk計(jì)劃無法解決的問責(zé)與溝通數(shù)量之和;DIP即為制造/回收企業(yè)Mj計(jì)劃不主動(dòng)公開披露供應(yīng)鏈的信息數(shù)量與配送中心Dk計(jì)劃不主動(dòng)公開披露供應(yīng)鏈的信息數(shù)量之和。
minSCCTOF=CCP+DIP。
(5)
為整合上述5個(gè)目標(biāo)函數(shù),本文提出一種層次分析加權(quán)綜合評價(jià)(AHP-WCCM)模型。該模型結(jié)合了層次分析法[36](AHP)與加權(quán)綜合評價(jià)方法[37-38](WCCM),按照目標(biāo)間的相互關(guān)聯(lián)影響及隸屬關(guān)系進(jìn)行組合,構(gòu)建一個(gè)多層次的分析結(jié)構(gòu)模型,使多目標(biāo)函數(shù)在標(biāo)準(zhǔn)化處理后按相對重要權(quán)值進(jìn)行線性組合,簡化為單一目標(biāo)函數(shù)。旨在使用較少的定量信息使決策的思維過程數(shù)學(xué)化,從而為多目標(biāo)、多準(zhǔn)則或無結(jié)構(gòu)特性的復(fù)雜決策問題提供簡便的決策方法。
整合步驟具體如下:
(1)依據(jù)上文對模型各層級指標(biāo)的權(quán)重設(shè)置,計(jì)算本文模型中5個(gè)目標(biāo)函數(shù)的權(quán)重向量W=(w1,w2,w3,w4,w5)T,W的各分量由各項(xiàng)指標(biāo)的權(quán)重參數(shù)(θ,α,β,χ,ε,δ,φ,γ,η,λ,μ)組成,其中w1=θ,w2=α+β,w3=χ+ε+δ+φ,w4=γ+η,w5=λ+μ,對W進(jìn)行歸一化,可以得到歸一化后的目標(biāo)函數(shù)權(quán)重向量W′:
(6)
(2)根據(jù)歸一化后的權(quán)重向量W′構(gòu)造成對決策矩陣A=(aij)n×n,A的元素aij表示第i個(gè)目標(biāo)函數(shù)對于第j個(gè)目標(biāo)函數(shù)的權(quán)重比較結(jié)果,aij=N,aji=1/N,N∈[1,9]。aij的具體標(biāo)度由表3的1~9標(biāo)度方法[39]計(jì)算得出。
表3 1~9標(biāo)度方法表
(3)由成對決策矩陣A滿足AWh=λA,根據(jù)A計(jì)算最大特征值λmax對應(yīng)的權(quán)向量Wh并作一致性檢測。為了保證權(quán)重比較結(jié)果的協(xié)調(diào)一致,在成對決策矩陣A不為嚴(yán)格的一致陣時(shí),用最大特征值λmax對應(yīng)的特征向量Wh作為比較目標(biāo)影響程度的權(quán)向量,其不一致程度越大,引起的判斷誤差越大,由此引入平均隨機(jī)一致性指標(biāo)RI,如表4所示。
表4 平均隨機(jī)一致性指標(biāo)RI
(4)將本節(jié)中定義的多目標(biāo)整數(shù)線性規(guī)劃模型分為5個(gè)單目標(biāo)子問題,采用加權(quán)綜合評價(jià)方法將5個(gè)目標(biāo)函數(shù)合并簡化為單一目標(biāo)函數(shù)。
(7)
(8)
(9)
(10)
(11)
式(7)~式(11)表示單目標(biāo)函數(shù)ECOF、CRTEROF、GSCOF、PPGCOF、SCCTOE與其對應(yīng)的最優(yōu)值之間的相對變化,其中:ECOFmin、CRTEROFmax、GSCOFmin、PPGCOFmax、SCCTOEmin是在忽略其他目標(biāo)函數(shù)的約束下,通過優(yōu)化當(dāng)前目標(biāo)函數(shù)得到的最優(yōu)值。將上文計(jì)算出的權(quán)向量Wh作為相對權(quán)重乘以標(biāo)準(zhǔn)化后的目標(biāo)函數(shù),通過線性組合簡化為單一目標(biāo)函數(shù):
(12)
根據(jù)供應(yīng)鏈網(wǎng)絡(luò)的條件假設(shè),本文模型的約束條件如下:
(13)
(14)
(15)
(16)
(17)
(18)
(19)
(20)
(21)
(22)
(23)
(24)
(25)
(26)
(27)
(28)
(29)
(30)
(31)
(32)
(33)
(34)
(35)
(36)
(37)
scMj,scDk,scTp∈{0,1};
(38)
(39)
(40)
其中:?i∈S,?j∈M,?p∈T,?k∈D,?l∈C,?c∈P;式(13)~式(17)表示網(wǎng)絡(luò)各層級間正向與逆向物流能力約束;式(18)表示客戶群需求約束;式(19)~式(20)表示配送中心回收與分揀能力約束;式(21)~式(23)表示處置中心檢測能力/拆分能力與報(bào)廢約束;式(24)~式(27)表示制造/回收企業(yè)生產(chǎn)/再生產(chǎn)產(chǎn)品數(shù)量約束;式(28)~式(31)表示制造/回收企業(yè)最大生產(chǎn)產(chǎn)能與再生產(chǎn)產(chǎn)能約束;式(32)~式(34)表示制造/回收企業(yè)、配送中心、處置中心的最大碳排放約束;式(35)~式(37)表示制造/回收企業(yè)在生產(chǎn)過程中廢氣、廢水、固體廢物(包含危險(xiǎn)廢物)的排放約束;式(38)表示對應(yīng)的決策變量為0-1;式(39)~式(40)分別表示對應(yīng)的決策變量為非負(fù)整數(shù)。
本文模型整合了可持續(xù)供應(yīng)鏈網(wǎng)絡(luò)中的5類重要指標(biāo),包含8個(gè)整數(shù)決策變量和3個(gè)0-1整數(shù)決策變量,整數(shù)決策變量描述閉環(huán)供應(yīng)鏈網(wǎng)絡(luò)中的產(chǎn)品數(shù)量流動(dòng),0-1整數(shù)決策變量描述閉環(huán)供應(yīng)鏈網(wǎng)絡(luò)中設(shè)施的建設(shè)狀態(tài)。對文中構(gòu)建的混合整數(shù)線性規(guī)劃模型求解是典型的NP-Hard問題,若問題規(guī)模較小,可采用諸如CPLEX、Gurobi、LINGO等求解器進(jìn)行求解,但若問題規(guī)模隨著決策變量的增多變的越來越大,求解器往往無法在較短時(shí)間求出最優(yōu)解。由此,本文設(shè)計(jì)了一個(gè)由蒙特卡洛樹搜索改進(jìn)的分支定界算法進(jìn)行求解。
蒙特卡洛樹搜索[40](Monte Carlo Tree Search, MCTS)是一種強(qiáng)化學(xué)習(xí)中基于模擬搜索思想的搜索算法,將隨機(jī)模擬的普遍性與樹搜索的準(zhǔn)確性相結(jié)合,執(zhí)行一種非對稱、自適應(yīng)的樹結(jié)構(gòu)增長搜索模式。算法具體步驟如下:
(1)選擇操作,從根節(jié)點(diǎn)R遞歸選擇最佳子節(jié)點(diǎn),直到選擇到葉子節(jié)點(diǎn)L。
(2)擴(kuò)展操作,如果L不是終止節(jié)點(diǎn),則創(chuàng)建一個(gè)或多個(gè)新的子節(jié)點(diǎn)并選擇其中一個(gè)節(jié)點(diǎn)C作為當(dāng)前節(jié)點(diǎn)。
(3)隨機(jī)模擬搜索操作(rollout),從C節(jié)點(diǎn)開始向下進(jìn)行隨機(jī)模擬搜索直到達(dá)到停止條件,并返回一個(gè)結(jié)果集。
(4)反向傳播操作,回溯隨機(jī)搜索結(jié)果集用以更新所選節(jié)點(diǎn)C及其父系節(jié)點(diǎn)的節(jié)點(diǎn)信息。
MCTS算法執(zhí)行過程如圖2所示。
圖2中,紅色節(jié)點(diǎn)表示在此選擇階段中選擇到的路徑節(jié)點(diǎn)和當(dāng)前選擇的操作節(jié)點(diǎn);綠色節(jié)點(diǎn)表示通過擴(kuò)展操作擴(kuò)展出的新節(jié)點(diǎn);藍(lán)色節(jié)點(diǎn)表示通過隨機(jī)模擬搜索得到結(jié)果集并進(jìn)行反向傳播的所需節(jié)點(diǎn)。MCTS針對搜索空間拓?fù)涞脑鲩L執(zhí)行非對稱樹調(diào)整,將搜索時(shí)間花費(fèi)在更相關(guān)的樹部分中,從而比傳統(tǒng)樹搜索方法更為高效。
本文提出的MCTS_BB算法采用了MCTS的搜索策略,使用分支定界法將需要求解的NP-Hard問題分解為一個(gè)個(gè)線性規(guī)劃問題,同時(shí)高效率的搜索該滿二叉樹,通過樹節(jié)點(diǎn)的隨機(jī)模擬獲取回溯結(jié)果集,反向傳播更新當(dāng)前所選節(jié)點(diǎn)及其父系節(jié)點(diǎn)的節(jié)點(diǎn)信息,達(dá)到算法停止條件后停止搜索,得到模型最優(yōu)解。本文對MCTS的使用遵循了文獻(xiàn)[41-42]中的方法,采用高可信度邊界(Upper Confidence Bounds, UCB)策略來平衡算法期間的搜索與更新。
MCTS_BB算法中,開始分支定界前要先將原問題(MILP)轉(zhuǎn)化為原問題的松弛問題(LP),以求解最小化問題為例,如式(41)和式(42)所示。
s.t.
Ax≤b;
l≤x≤u;
x∈p×n-p。
(41)
s.t.
Ax≤b;
l≤x≤u;
x∈n。
(42)
其中:c∈Rn為原始MILP問題的價(jià)值系數(shù),A∈Rm×n為約束條件矩陣的約束系數(shù),b∈Rm為右邊項(xiàng)約束系數(shù),l,u∈Rn為變量的上界與下界,整數(shù)變量的個(gè)數(shù)p≤n,x∈p×n-p為原始MILP問題的最優(yōu)解,x∈n為MILP問題經(jīng)過松弛得到LP問題的最優(yōu)解,原始MILP問題的最優(yōu)解一定不小于LP問題的最優(yōu)解,可稱為原問題的下界??紤]到本文模型中存在0-1整數(shù)決策變量,若模型中有t個(gè){0,1}變量,則在原問題的首層0-1節(jié)點(diǎn)解空間中就會(huì)存在一個(gè)有2t個(gè)葉子節(jié)點(diǎn)的二叉樹,令這t個(gè)變量在滿足{0,1}約束的前提下求出一個(gè)可行解,該解可能不是最優(yōu)解,但原問題的最優(yōu)解一定不大于該可行解,可稱為原問題的上界。
傳統(tǒng)分支定界法中滿二叉樹的節(jié)點(diǎn)呈指數(shù)增長,若出現(xiàn)最壞的情況,則需要不停分支定界迭代求解,直至完全遍歷二叉樹中的每一個(gè)節(jié)點(diǎn)才能得到最優(yōu)解,而在本文提出的MCTS_BB算法中,采用MCTS隨機(jī)模擬搜索的特點(diǎn),摒棄了簡單蒙特卡羅搜索對當(dāng)前狀態(tài)St每個(gè)動(dòng)作都要進(jìn)行K次模擬采樣的做法,而是總共對當(dāng)前狀態(tài)St進(jìn)行K次采樣,可類比為對當(dāng)前選中的節(jié)點(diǎn)Ct進(jìn)行K次隨機(jī)分支定界,在獲取回溯結(jié)果集后更新原問題的上下界與最優(yōu)解,并在算法內(nèi)部設(shè)置迭代終止條件,這樣做大大降低了分支定界的次數(shù)和搜索計(jì)算的復(fù)雜度。在MCTS_BB中,動(dòng)作集A只存在選擇LEFT分支和RIGHT分支兩個(gè)動(dòng)作,R表示通過隨機(jī)模擬搜索得到的回溯結(jié)果集,基于強(qiáng)化學(xué)習(xí)模型Mr和模擬搜索策略π,當(dāng)前選擇節(jié)點(diǎn)Ct對應(yīng)的完整節(jié)點(diǎn)選擇序列如下:
(43)
MCTS_BB使用原問題的變量規(guī)模建立MCTS搜索樹,并通過選擇、擴(kuò)展、隨機(jī)模擬搜索、反向傳播4項(xiàng)基本步驟持續(xù)優(yōu)化樹內(nèi)策略,算法具體步驟如算法1所示。
算法1蒙特卡洛樹搜索分支定界算法(MCTS_BB)。
輸入:根節(jié)點(diǎn)S0的上界UB、S0的下界LB、S0的可行解X、S0的訪問次數(shù)N_S0,迭代停止參數(shù)k;
輸出:MILP問題的最優(yōu)解。
Start
初始化樹結(jié)構(gòu)并創(chuàng)建根節(jié)點(diǎn)S0
ITERATION=0
while UB/ITERATION-LB/ITERATION<=k do
if S0不是葉子節(jié)點(diǎn)then
function node_expand(S0)
擴(kuò)展節(jié)點(diǎn),添加到樹中
計(jì)算節(jié)點(diǎn)UCB值,選擇當(dāng)前節(jié)點(diǎn)St=UCB值最大的子節(jié)點(diǎn),
使用單純形法計(jì)算St的最優(yōu)解與函數(shù)值
if有可行解then
if為整數(shù)解then
比較更新最優(yōu)函數(shù)值為其全部父系節(jié)點(diǎn)的UB,更新原問題整數(shù)解=當(dāng)前整數(shù)解
if UB/ITERATION-LB/ITERATION<=k then
end while
return最優(yōu)整數(shù)解
else
剪支St,不再訪問,當(dāng)前節(jié)點(diǎn)=另一子節(jié)點(diǎn)
end if
else
break
end if
else
剪支St,不再訪問,當(dāng)前節(jié)點(diǎn)=另一子節(jié)點(diǎn)
end if
return擴(kuò)展后的樹節(jié)點(diǎn)
node_expand(S0)
else
if N_St== 0 then
ROLLOUT
得到ROLLOUT返回的結(jié)果集
if haveAns == 1 then
比較更新結(jié)果集中的函數(shù)值=當(dāng)前節(jié)點(diǎn)St及其父系節(jié)點(diǎn)的UB
若新UB<歷史最小UB,更新原問題最優(yōu)整數(shù)解=當(dāng)前結(jié)果集中的最優(yōu)整數(shù)解
更新當(dāng)前節(jié)點(diǎn)St及其父系節(jié)點(diǎn)的訪問次數(shù)N_Sn=N_Sn+1
ITERATION=ITERATION+1
else
更新當(dāng)前節(jié)點(diǎn)St及其父系節(jié)點(diǎn)的訪問次數(shù)N_Sn=N_Sn+1
ITERATION=ITERATION+1
end if
else
node_expand(St)
end if
end while
return最優(yōu)整數(shù)解
End
算法1中,基于UCB的分支選擇策略及隨機(jī)模擬搜索(rollout)策略,將在后續(xù)章節(jié)詳細(xì)說明,算法總體流程如圖3所示。
算法中的分支選擇策略基于下上限置信區(qū)間算法(Upper Confidence bounds for Trees, UCT),即從樹的根節(jié)點(diǎn)S0開始,遞歸計(jì)算分支子節(jié)點(diǎn)的UCB值,在樹節(jié)點(diǎn)每一層分支中選擇具有最大UCB值的子節(jié)點(diǎn)St,直至搜索到樹的葉子節(jié)點(diǎn)。UCB計(jì)算公式如下:
(44)
本文算法中,對UCB的計(jì)算方式進(jìn)行了改進(jìn):
(45)
算法2下上限置信區(qū)間分支選擇算法(UCT_BB)。
輸入:根節(jié)點(diǎn)S0;
輸出:最優(yōu)子節(jié)點(diǎn)St。
Start
初始化樹結(jié)構(gòu)并創(chuàng)建根節(jié)點(diǎn)S0
function UCT_BB(S0)
while達(dá)到迭代停止條件do
St←BranchSelectionPolicy(S0)
return St
function BranchSelectionPolicy(St)
while St不是終止節(jié)點(diǎn)do
if St并未擴(kuò)展分支then
return Expand(St)
else
end if
St←OptimalBranchNode(St,ψ)
return St
function Expand(St)
隨機(jī)選取St的一個(gè)非整數(shù)變量xn
將St分支為xn≤?xn∪xn≥xn?
在樹中添加兩個(gè)對應(yīng)節(jié)點(diǎn),St=[St-L,St-R]
return St
function OptimalBranchNode(St,ψ)
End
隨機(jī)模擬搜索策略(rollout)即為對當(dāng)前選中的擴(kuò)展節(jié)點(diǎn)St進(jìn)行隨機(jī)探索的方法。從St開始,向下隨機(jī)模擬選擇分支,每到達(dá)一個(gè)分支子節(jié)點(diǎn),通過松弛單純形法計(jì)算該節(jié)點(diǎn)的最優(yōu)解與函數(shù)值,直至探索到整數(shù)解或非可行解節(jié)點(diǎn)時(shí),搜索停止,當(dāng)前節(jié)點(diǎn)為St+n,反向傳播回溯結(jié)果集用以更新當(dāng)前選擇節(jié)點(diǎn)St及其父系節(jié)點(diǎn)的上下界、最優(yōu)解及訪問次數(shù)。其中,定義解向量為OI,函數(shù)值為OV,回溯結(jié)果集B={OI,OV,haveAns},haveAns=1表示通過隨機(jī)模擬搜索探尋到整數(shù)解,haveAns=0表示通過隨機(jī)模擬搜索探尋到非可行解,haveAns=-1表示通過隨機(jī)模擬搜索探尋到非整數(shù)可行解,具體步驟如算法3所示。
算法3隨機(jī)模擬搜索算法(rollout)。
輸入:當(dāng)前選擇節(jié)點(diǎn)St;
輸出:回溯結(jié)果集B。
Start
function ROLLOUT
haveAns=-1
while haveAns==-1 do
對當(dāng)前選擇節(jié)點(diǎn)St分支
隨機(jī)選取分支方向,RIGHT OR LEFT
選取新的節(jié)點(diǎn)St+1
將分支條件加入松弛單純形法,對該節(jié)點(diǎn)進(jìn)行求解
定義結(jié)果集B={OI,OV,haveAns}
if haveAns==1 or haveAns==0 then
剪枝
return B
end if
end while
End
由于MCTS_BB算法在訪問已經(jīng)達(dá)到搜索停止條件的節(jié)點(diǎn)時(shí),會(huì)帶來不必要的時(shí)間浪費(fèi),在樹搜索中設(shè)計(jì)了一種有效的剪枝策略,以剪掉不符合約束條件的節(jié)點(diǎn)。算法分兩部分考慮剪枝策略:①在節(jié)點(diǎn)選擇階段,通過將分支條件加入松弛單純形法中計(jì)算當(dāng)前最大UCB值子節(jié)點(diǎn)St的解向量M與函數(shù)值V,用以判斷其是否符合剪枝條件,若符合則剪枝St及其所有子節(jié)點(diǎn);②在隨機(jī)模擬搜索(ROLLOUT)中,對于已經(jīng)達(dá)到搜索停止條件的節(jié)點(diǎn)St+n,根據(jù)其回溯結(jié)果集確定是否符合剪枝條件。此外,標(biāo)記樹的根節(jié)點(diǎn)flag(S0)=false,并在每一次擴(kuò)展分支后,標(biāo)記子節(jié)點(diǎn)flag(St)=false,剪枝后標(biāo)記當(dāng)前已被剪枝的節(jié)點(diǎn)flag(St)=ture,以防止節(jié)點(diǎn)被重復(fù)訪問,減少搜索次數(shù)。
為了求解文中的整合供應(yīng)鏈網(wǎng)絡(luò)模型,定義其根節(jié)點(diǎn)S0的初始下界LB是對式(38)~式(40)松弛后通過單純形法求解minf的最優(yōu)值,根節(jié)點(diǎn)S0的初始上界UB是在滿足{0,1}約束的條件下,對式(39)、(40)松弛后通過單純形法求解minf的任一可行解。松弛后的決策變量如下式,剪枝策略如圖4所示。
scMj,scDk,scTp∈[0,1];
(46)
(47)
(48)
在第①種策略中,若子節(jié)點(diǎn)St的解向量M為非可行解,標(biāo)記flag(St)=true,切換分支繼續(xù)迭代;若子節(jié)點(diǎn)St的解向量M為整數(shù)解,標(biāo)記flag(St)=true,使用St的函數(shù)值V與S0的初始上界UB進(jìn)行比較,若V UBst,當(dāng)樹中每層子節(jié)點(diǎn)均被選擇,比較同層各節(jié)點(diǎn)的函數(shù)值,函數(shù)值最小的更新為新下界LB;第②種策略中,St+n為已經(jīng)達(dá)到搜索停止條件的ROLLOUT節(jié)點(diǎn),若回溯結(jié)果集B中haveAns=0或1,標(biāo)記flag(St+n)=true,haveAns=1時(shí),使用St+n的函數(shù)值OV與S0的上界UBst進(jìn)行比較,若OV 為證明本文模型及算法的有效性,實(shí)驗(yàn)中設(shè)置了8個(gè)規(guī)模不同的算例,并運(yùn)用GUROBI 9.0和MCTS_BB算法在Python 3.7下對各算例進(jìn)行求解,最后對實(shí)驗(yàn)結(jié)果進(jìn)行分析。仿真運(yùn)行環(huán)境為Intel(R)Core(TM)i5-5257u CPU @2.7 Hz,8 GB RAM,macOS 10.13.6。 依照《CITI評價(jià)指南7.0》及文獻(xiàn)[43-44],選取國內(nèi)某電子零部件制造產(chǎn)業(yè)為研究對象,分別設(shè)置不同算例中供應(yīng)商、制造/回收企業(yè)、配送中心、處置中心、客戶群的數(shù)目,并對該電子零部件制造產(chǎn)業(yè)在不同規(guī)模下的供應(yīng)鏈網(wǎng)絡(luò)系統(tǒng)中進(jìn)行分析,其中1~3為小規(guī)模算例,4~6為中等規(guī)模算例,7~8為大規(guī)模算例。根據(jù)企業(yè)的調(diào)研數(shù)據(jù),利用均勻分布隨機(jī)生成各確定參數(shù)值,算例具體規(guī)模如表5所示,具體參數(shù)設(shè)置如表6所示。 表5 算例規(guī)模 表6 算例參數(shù)設(shè)置 續(xù)表6 續(xù)表6 對于算例中的碳排放指標(biāo),根據(jù)文獻(xiàn)[45-48],開設(shè)規(guī)模在3 000 m2到5 200 m2的制造/回收企業(yè)生產(chǎn)與再生產(chǎn)的碳排放系數(shù)ωa服從[0.000 035,0.000 055]t/個(gè)區(qū)間的均勻分布,開設(shè)規(guī)模在2 000 m2到3 200 m2的處置中心進(jìn)行產(chǎn)品銷毀的碳排放系數(shù)ωb服從[0.000 025,0.000 033]t/個(gè)區(qū)間的均勻分布;原材料及產(chǎn)品在各設(shè)施間運(yùn)輸?shù)奶寂欧畔禂?shù)ωc服從[0.000 4,0.000 9]噸/公里區(qū)間的均勻分布;制造/回收企業(yè)與處置中心的最大碳排放限制分別服從[11,15]萬噸與[6,9]104t區(qū)間的均勻分布。處置中心對單位回收產(chǎn)品的報(bào)廢率ωd服從[0.25,0.32]區(qū)間的均勻分布,配送中心對產(chǎn)品的回收率ωe服從[0.26,0.44]區(qū)間的均勻分布。 4.2.1 算法比較與分析 實(shí)驗(yàn)中,為了測試模型及算法的有效性,分別選取GUROBI 9.0求解器(GUROBI)、文獻(xiàn)[44]的三步驟分層級啟發(fā)式算法(TSHA)、分支定界算法(BB)、文獻(xiàn)[49]的迭代加深分支定界算法(IDBB, 2019)及蒙特卡洛樹搜索分支定界算法(MCTS_BB)對上文設(shè)置的所有算例進(jìn)行求解。設(shè)置GUROBI 9.0優(yōu)化器的TimeLimit=5;在TSHA的步驟1中用GUROBI 9.0求解子問題初始解,步驟3中用GUROBI 9.0求解MILP逼近最優(yōu)解;在BB及MCTS_BB中使用GUROBI 9.0求解松弛問題的單純形法;設(shè)置MCTS_BB中根節(jié)點(diǎn)S0的初始訪問次數(shù)N_S0=0,初始迭代次數(shù)ITERATION=0,迭代停止參數(shù)k=0.5,UCB平衡因子ψ=2。模型實(shí)驗(yàn)參數(shù)如表7所示,各算法執(zhí)行20次后對求解結(jié)果取均值,具體求解質(zhì)量如表8所示,求解時(shí)間如表9所示。 表7 模型實(shí)驗(yàn)參數(shù) 表8 各算法對本文模型的平均求解質(zhì)量 表9 各算法對本文模型的平均求解時(shí)間 表8中,使用GUROBI求解器的求解結(jié)果作為最優(yōu)參考標(biāo)準(zhǔn),其余各算法的比對差距均為與GUROBI求解結(jié)果相比所得。從表8和表9可以看出,對于規(guī)模較小的算例1~3,MCTS_BB算法與GUROBI求解器求得的最優(yōu)解間的平均比對差距為0.954 4%,小于TSHA及IDBB的1.380 1%和1.449 8%,且算法的平均求解時(shí)間較TSHA、B&B及IDBB降低了35.182 4%、60.861 5%及24.415 3%,但較GUROBI求解器高48.192 6%;對于規(guī)模中等的算例4~6,MCTS_BB算法與GUROBI求解器求得的最優(yōu)解間的平均比對差距為1.476 2%,小于TSHA及IDBB的2.393 9%和2.047 2%,算法的平均求解時(shí)間較TSHA、B&B及IDBB降低了20.209 1%、74.917 8%及23.976 3%,同時(shí)也較GUROBI求解器降低了13.358 4%;對于模較大的算例7~8,MCTS_BB算法與GUROBI求解器求得的最優(yōu)解間的平均比對差距為3.461 6%,比TSHA及IDBB低5.549 0%及4.193 1%,平均求解時(shí)間較GUROBI、TSHA和IDBB下降了41.698 7%、37.323 8%、34.175 9%。求解質(zhì)量及求解時(shí)間對比如圖5所示。 從圖5可以看出,在對小規(guī)模算例求解時(shí),GUROBI的求解效率遠(yuǎn)高于另外3種算法,并且能夠計(jì)算得到精確的最優(yōu)目標(biāo)值,但當(dāng)算例規(guī)模增大時(shí),GUROBI的求解效率則越來越低;相比之下,MCTS_BB在求解小規(guī)模算例時(shí),求解得到的最優(yōu)解精度較好,但由于在ROLLOUT過程中花費(fèi)時(shí)間較多,算法整體求解時(shí)間略高于GUROBI,但隨著算例規(guī)模的增大,求解時(shí)間得到了相應(yīng)的減少,更適合應(yīng)用于規(guī)模較大的算例。此外,B&B雖然可以在較小規(guī)模算例中求得最優(yōu)解,但是求解過程極為緩慢,并在求解大規(guī)模算例時(shí)由于超出時(shí)間限制無法得到最優(yōu)解,而MCTS_BB因?yàn)閷Ψ种渌阉鞑呗缘母倪M(jìn),相比于B&B,算法效率得到了極大提升。同時(shí),在相同算例規(guī)模下,MCTS_BB比啟發(fā)式算法TSHA和分支定界的另一改進(jìn)算法IDBB的求解收斂過程更快,計(jì)算結(jié)果更為準(zhǔn)確。通過上述分析可知,MCTS_BB算法的求解精度較優(yōu),針對不同規(guī)模算例,算法收斂時(shí)間增長較為平緩,并對求解較大規(guī)模算例具有很大優(yōu)勢。 4.2.2 多目標(biāo)優(yōu)化下的模型指標(biāo)分析 本文提出的五位一體可持續(xù)閉環(huán)供應(yīng)鏈網(wǎng)絡(luò)模型主要考慮供應(yīng)鏈網(wǎng)絡(luò)中的經(jīng)濟(jì)成本(指標(biāo)1)、合規(guī)整改與節(jié)能減排(指標(biāo)2)、綠色供應(yīng)鏈(指標(biāo)3)、推動(dòng)公眾綠色選擇(指標(biāo)4)、供應(yīng)鏈溝通與透明(指標(biāo)5)5項(xiàng)優(yōu)化指標(biāo)。當(dāng)采用本文提出的MCTS_BB算法對模型求解時(shí),對比只考慮單一優(yōu)化指標(biāo)、未經(jīng)AHP-WCCM模型整合的5項(xiàng)優(yōu)化指標(biāo)和五位一體優(yōu)化模型,選取4.1節(jié)中的較小規(guī)模算例1、中等規(guī)模算例4、6及較大規(guī)模算例8進(jìn)行求解,具體實(shí)驗(yàn)結(jié)果如表10所示。 表10 對比只考慮單一指標(biāo)與5項(xiàng)指標(biāo)的模型求解結(jié)果 由表10可知,算例1中,單一指標(biāo)優(yōu)化模型的各項(xiàng)優(yōu)化效果比五位一體優(yōu)化模型分別高3.89%、2.23%、2.87%、1.21%、0.41%,五位一體優(yōu)化模型比單一指標(biāo)優(yōu)化模型求解另外4項(xiàng)指標(biāo)參數(shù)的平均優(yōu)化效果分別提升了7.34%、7.49%、7.60%、9.42%及10.44%;算例4中,單一指標(biāo)優(yōu)化模型的各項(xiàng)優(yōu)化效果比五位一體優(yōu)化模型分別高2.64%、3.36%、5.94%、2.38%、4.72%,五位一體優(yōu)化模型比其求解另外4項(xiàng)指標(biāo)參數(shù)的平均優(yōu)化效果分別提升了10.05%、12.29%、12.40%、12.91%、13.54%;算例6中,單一指標(biāo)優(yōu)化模型的各項(xiàng)優(yōu)化效果比五位一體優(yōu)化模型分別高4.64%、1.04%、1.75%、2.06%、6.06%,五位一體優(yōu)化模型比其求解另外4項(xiàng)指標(biāo)參數(shù)的平均優(yōu)化效果分別提升了14.10%、16.43%、11.03%、15.78%、15.36%;算例8中,單一指標(biāo)優(yōu)化模型的各項(xiàng)優(yōu)化效果比五位一體優(yōu)化模型分別高2.50%、3.96%、3.17%、3.58%、3.86%,五位一體優(yōu)化模型比其求解另外4項(xiàng)指標(biāo)參數(shù)的平均優(yōu)化效果分別提升了10.77%、9.43%、9.74%、12.93%、10.15%。 對于所有算例,單一指標(biāo)優(yōu)化模型比五位一體優(yōu)化模型對于單一指標(biāo)的優(yōu)化效果最高提升了5.94%,最低提升了0.41%,平均提升3.11%;而五位一體優(yōu)化模型比單一指標(biāo)優(yōu)化模型對于其余指標(biāo)的優(yōu)化效果最高提升了16.43%,最低提升了7.34%,平均提升11.46%。五位一體優(yōu)化模型的構(gòu)建,使得在傳統(tǒng)供應(yīng)鏈網(wǎng)絡(luò)中不被關(guān)注的推動(dòng)公眾綠色選擇及供應(yīng)鏈溝通與透明指標(biāo)取得了較大提升,平均優(yōu)化效果提升了11.32%及15.30%,并在經(jīng)濟(jì)成本、合規(guī)整改與節(jié)能減排和綠色供應(yīng)鏈指標(biāo)中也同樣取得了較好的優(yōu)化效果,平均提升了7.94%、8.56%及10.35%。各算例針對不同優(yōu)化指標(biāo)類型的實(shí)驗(yàn)結(jié)果對比如圖6所示。 由圖6可知,未經(jīng)AHP-WCCM整合的優(yōu)化模型整體優(yōu)化效果平平,雖然各項(xiàng)指標(biāo)比單一指標(biāo)優(yōu)化模型略有提升,但提升有限,且在求解特定單一指標(biāo)時(shí),與單一指標(biāo)優(yōu)化模型求得的最優(yōu)解差距較為明顯,平均相差7.28%、13.08%、14.27%、9.13%;但其整體求解能力稍好于單一指標(biāo)優(yōu)化模型,對各算例分別平均提升了0.19%,0.24%,1.57%,2.07%;在與經(jīng)過AHP-WCCM整合的五位一體優(yōu)化模型的對比中,五位一體模型的各項(xiàng)指標(biāo)參數(shù)較其最高提升了10.02%,最低提升了5.53%,平均提升了7.84%。未經(jīng)整合的優(yōu)化模型雖然考慮了5項(xiàng)指標(biāo),但其求解波動(dòng)仍較為劇烈,不能得到供應(yīng)鏈網(wǎng)絡(luò)中的較優(yōu)結(jié)果,而五位一體優(yōu)化模型所求出的最優(yōu)解波動(dòng)較為平緩,可以更好協(xié)調(diào)各指標(biāo)間的差異,模型性能更為出色。 4.2.3 模型參數(shù)靈敏性分析 在本文的模型參數(shù)中,選取重要參數(shù)進(jìn)行靈敏性分析,以便能夠?qū)δP瓦M(jìn)行更細(xì)微、更準(zhǔn)確的優(yōu)化調(diào)整。通過參數(shù)優(yōu)化,對模型進(jìn)行分析修正,提升網(wǎng)絡(luò)的整體效率和準(zhǔn)確度。分別從五位一體指標(biāo)中選取重要模型參數(shù),并對同一類別參數(shù)進(jìn)行整合,在保持其余參數(shù)不變的情況下,對各參數(shù)的取值在[-20%,20%]范圍內(nèi)進(jìn)行步長為5%的取值變化,選擇4.1節(jié)中的算例5,分別計(jì)算模型的目標(biāo)函數(shù)值,重要參數(shù)選擇如表11所示,模型參數(shù)靈敏性計(jì)算結(jié)果如表12所示。 表11 重要參數(shù)選取 表12 模型參數(shù)靈敏性計(jì)算結(jié)果 由表12可知,在對各重要參數(shù)進(jìn)行靈敏性計(jì)算的過程中,通過改變參數(shù)取值范圍,目標(biāo)函數(shù)值確有提升或下降,針對供應(yīng)鏈網(wǎng)絡(luò)模型中每項(xiàng)指標(biāo)的具體參數(shù),可以對5項(xiàng)指標(biāo)的靈敏程度進(jìn)行劃分。經(jīng)過計(jì)算,在經(jīng)濟(jì)成本指標(biāo)對應(yīng)的參數(shù)中,最大靈敏度為9.27%,最小靈敏度為2.78%,平均靈敏度為6.30%;在合規(guī)整改與節(jié)能減排指標(biāo)對應(yīng)的參數(shù)中,最大靈敏度為3.50%,最小靈敏度為1.58%,平均靈敏度為2.63%;在綠色供應(yīng)鏈指標(biāo)對應(yīng)的參數(shù)中,最大靈敏度為11.49%,最小靈敏度為2.50%,平均靈敏度為5.44%;在推動(dòng)公眾綠色選擇指標(biāo)對應(yīng)的參數(shù)中,最大靈敏度為4.96%,最小靈敏度為4.49%,平均靈敏度為4.73%;在供應(yīng)鏈溝通與透明指標(biāo)對應(yīng)的參數(shù)中,最大靈敏度為5.53%,最小靈敏度為5.35%,平均靈敏度為5.44%。 可以看出,經(jīng)濟(jì)成本與綠色供應(yīng)鏈指標(biāo)下的模型參數(shù)對取值范圍的變化更易產(chǎn)生波動(dòng),模型對其較為敏感,對于該類參數(shù)的選取需要更加精準(zhǔn),在仿真中根據(jù)實(shí)驗(yàn)結(jié)果進(jìn)行調(diào)整的權(quán)重較高;供應(yīng)鏈溝通與透明和推動(dòng)公眾綠色選擇指標(biāo)下的參數(shù)靈敏度變化較為平緩,但模型在其參數(shù)取值變化的過程中,目標(biāo)函數(shù)值也有較為明顯的上浮和下落,在根據(jù)實(shí)驗(yàn)結(jié)果進(jìn)行參數(shù)調(diào)整時(shí),該類參數(shù)的選取需要調(diào)整,但調(diào)整權(quán)重較經(jīng)濟(jì)成本指標(biāo)下的參數(shù)略低;合規(guī)整改與節(jié)能減排指標(biāo)下的參數(shù)靈敏度較低,模型對其敏感度較弱,該類參數(shù)的選取范圍不需要非常精準(zhǔn),調(diào)整權(quán)重最低。 本文以多目標(biāo)可持續(xù)閉環(huán)供應(yīng)鏈網(wǎng)絡(luò)為研究對象,在《CITI評價(jià)指南7.0》的基礎(chǔ)上,針對多設(shè)施、多層級、多目標(biāo)的供應(yīng)鏈網(wǎng)絡(luò)模型,提出了考慮經(jīng)濟(jì)成本、合規(guī)整改與節(jié)能減排、綠色供應(yīng)鏈、推動(dòng)公眾綠色選擇及供應(yīng)鏈溝通與透明五位一體的模型優(yōu)化指標(biāo),并為此設(shè)計(jì)了AHP-WCCM層次分析加權(quán)綜合評價(jià)模型對各指標(biāo)進(jìn)行統(tǒng)一整合及標(biāo)準(zhǔn)化處理,建立了整合多目標(biāo)可持續(xù)閉環(huán)供應(yīng)鏈網(wǎng)絡(luò)模型,為多目標(biāo)、多準(zhǔn)則的復(fù)雜供應(yīng)鏈網(wǎng)絡(luò)決策問題提供了簡便的決策方法。同時(shí),為了對模型進(jìn)行高效求解,提出了一種采用蒙特卡洛樹搜索改進(jìn)的分支定界算法MCTS_BB,算法針對搜索空間拓?fù)涞脑鲩L執(zhí)行非對稱樹調(diào)整,著重搜索與最優(yōu)解更相關(guān)的樹空間,提升求解效率。仿真實(shí)驗(yàn)中,根據(jù)企業(yè)相關(guān)數(shù)據(jù),通過對國內(nèi)某電子零部件制造產(chǎn)業(yè)在8個(gè)不同規(guī)模算例下的求解分析可見,MCTS_BB在求解精度、算法效率、準(zhǔn)確性等方面均有較為明顯的優(yōu)勢,有效驗(yàn)證了模型的可行性和算法的實(shí)用性。 此外,通過對多目標(biāo)優(yōu)化下的模型指標(biāo)分析可以發(fā)現(xiàn),當(dāng)求解只考慮某項(xiàng)優(yōu)化指標(biāo)時(shí),該指標(biāo)和其余指標(biāo)對應(yīng)的目標(biāo)函數(shù)求解質(zhì)量具有較大差距,而當(dāng)采用本文提出的五位一體整合優(yōu)化模型求解時(shí),5項(xiàng)指標(biāo)對應(yīng)的目標(biāo)函數(shù)求解質(zhì)量均較為出色,有效調(diào)節(jié)了各指標(biāo)間的相對差異。對于本文所研究的可持續(xù)閉環(huán)供應(yīng)鏈網(wǎng)絡(luò)而言,五位一體優(yōu)化模型的提出,可以更好地協(xié)調(diào)供應(yīng)鏈網(wǎng)絡(luò)中各層級間的相互決策,完善正向物流與逆向物流間的有效溝通,促進(jìn)各層級決策者對所在層級需要注意的模型指標(biāo)進(jìn)行統(tǒng)籌管理,例如供應(yīng)商的運(yùn)輸碳排放,生產(chǎn)/回收企業(yè)的生產(chǎn)成本、污染物排放,配送中心的問責(zé)與溝通等等。同時(shí),通過對模型各指標(biāo)下重要參數(shù)靈敏性的對比,將5項(xiàng)指標(biāo)進(jìn)行了敏感程度劃分,可以有效針對不同指標(biāo)進(jìn)行模型參數(shù)調(diào)整,也可以幫助決策者作出更加完善、更加靈活的決策方案。 下一步研究會(huì)將重心落在考慮模型參數(shù)的不確定性及模糊性處理,通過加入此類參數(shù)完善現(xiàn)有模型,建立可以應(yīng)對更多復(fù)雜情況的模糊規(guī)劃模型。特別將加深推動(dòng)公眾綠色選擇及供應(yīng)鏈溝通與透明不確定性因素的延伸探討,立足于二者的社會(huì)性、熱點(diǎn)性和實(shí)效性,致力于構(gòu)建一個(gè)更為完善的可持續(xù)供應(yīng)鏈網(wǎng)絡(luò)體系模型。4 實(shí)驗(yàn)仿真
4.1 算例及參數(shù)設(shè)置
4.2 算例仿真結(jié)果分析
5 結(jié)束語