鄭 飛,葉智勇,鄧?guó)P珠 (佛山開(kāi)放大學(xué),廣東 佛山 528000)
面對(duì)復(fù)雜的市場(chǎng)競(jìng)爭(zhēng)和動(dòng)態(tài)的市場(chǎng)需求,紡織服裝企業(yè)之間被視為競(jìng)爭(zhēng)對(duì)手關(guān)系,因而在進(jìn)行生產(chǎn)與銷售時(shí),往往僅從本企業(yè)出發(fā)追求自身利益的最大化,未考慮上下游企業(yè)之間的協(xié)調(diào)關(guān)系,從而造成紡織服裝供應(yīng)鏈各節(jié)點(diǎn)在資源或利益方面的沖突,協(xié)商是解決供應(yīng)鏈中節(jié)點(diǎn)沖突的有效方法。在人工智能領(lǐng)域的多Agent系統(tǒng)因其主動(dòng)性、交互性、自主性等特點(diǎn)而廣泛應(yīng)用于多個(gè)領(lǐng)域,將多Agent技術(shù)應(yīng)用于服裝供應(yīng)鏈協(xié)商中,能確保服裝企業(yè)供應(yīng)鏈系統(tǒng)靈活、敏捷,同時(shí)降低成本,提高產(chǎn)品質(zhì)量。
在服裝供應(yīng)鏈各節(jié)點(diǎn)的協(xié)商過(guò)程中,由于信息不對(duì)稱以及動(dòng)態(tài)的市場(chǎng)環(huán)境等因素增加了協(xié)商的難度,導(dǎo)致協(xié)商成功率低、協(xié)商時(shí)間長(zhǎng)、效果不理想。本文提出的基于多Agent服裝供應(yīng)鏈并發(fā)協(xié)商模型,通過(guò)建立多Agent的服裝供應(yīng)鏈協(xié)商模型框架,以單個(gè)服裝經(jīng)銷商和多個(gè)服裝制造商為研究對(duì)象,為提高服裝經(jīng)銷商和服裝制造商之間協(xié)商的效率,增大服裝經(jīng)銷商和服裝制造商協(xié)商成功的可能性提供了可靠的理論依據(jù)。
假設(shè)服裝供應(yīng)鏈?zhǔn)怯煞b經(jīng)銷商和服裝制造商組成的協(xié)同網(wǎng)絡(luò),服裝制造商提供服裝,服裝經(jīng)銷商購(gòu)買服裝,一個(gè)服裝經(jīng)銷商Agent和多個(gè)服裝制造商A-gent進(jìn)行并發(fā)協(xié)商模型框架如圖1所示。
圖1 多Agent服裝供應(yīng)鏈并發(fā)協(xié)商模型框架
由圖1可見(jiàn),服裝經(jīng)銷商與服裝制造商都具有各自獨(dú)立的協(xié)商信息。服裝經(jīng)銷商Agent由協(xié)調(diào)器和多個(gè)子服裝經(jīng)銷商Agent構(gòu)成。根據(jù)服裝制造商Agent的數(shù)量,協(xié)調(diào)器創(chuàng)建相同數(shù)量的協(xié)調(diào)線程,并提出相應(yīng)的協(xié)商策略對(duì)各個(gè)子服裝經(jīng)銷商Agent進(jìn)行調(diào)控,實(shí)時(shí)處理協(xié)商線程信息和其他子服裝經(jīng)銷商Agent的及時(shí)更新。協(xié)調(diào)線程由子服裝經(jīng)銷商Agent和與之對(duì)應(yīng)的服裝制造商Agent構(gòu)成,保留了服裝經(jīng)銷商Agent的協(xié)商信息,接收、拒絕提議或生成反提議。
如圖2所示為單個(gè)線程的協(xié)商過(guò)程。在協(xié)商的過(guò)程中,根據(jù)服裝制造商Agent的個(gè)數(shù),協(xié)調(diào)器對(duì)協(xié)商線程進(jìn)行初始化,為每個(gè)協(xié)商線程設(shè)置初始參數(shù)(如議題保留值、最大協(xié)商時(shí)間以及協(xié)商策略參數(shù)等),創(chuàng)建初始提議,發(fā)出協(xié)商請(qǐng)求,并由制造商A-gent做出響應(yīng)。在進(jìn)行下輪提議前,對(duì)協(xié)調(diào)器發(fā)送來(lái)的提議進(jìn)行評(píng)估,看是否為最佳提議,若不是,按協(xié)商策略提出反提議,若是,則按流程進(jìn)行相應(yīng)的處理。無(wú)論子服裝經(jīng)銷商Agent與服裝制造商A-gent協(xié)商結(jié)果如何,每個(gè)線程都會(huì)將協(xié)商結(jié)果送到協(xié)調(diào)器,保證所有協(xié)商線程連續(xù)進(jìn)行。
圖2 單線程協(xié)商過(guò)程
令:
T:Agent a截止時(shí)間;
Tm、Tri:分別表示服裝制造商Agent和服裝經(jīng)銷商Agent協(xié)商截至?xí)r間;
ωai:Agent a對(duì)議題i的權(quán)重,且
A:協(xié)商響應(yīng),且A∈ {接受提議,拒絕提議,提出提議};
Ag:表示一個(gè)經(jīng)銷商Agent r與多個(gè)制造商Agent mi(i=1,2,…,)的集合,即Ag={r,m1,m2,…,mn},且 a∈Ag;
S:協(xié)商策略;
C:協(xié)調(diào)策略;
U:效用函數(shù)。
則議題vi可以用直線公式求得其評(píng)價(jià)函數(shù)uavi(),議題的整體效用函數(shù)為:
于是,最終效用函數(shù)可表示為:
其中:Ur、Um分別表示服裝經(jīng)銷商Agent的效用和服裝制造商Agent的效用。
所以,多Agent供應(yīng)鏈并發(fā)協(xié)商模型可表示為:
提議策略由提議評(píng)價(jià)策略和提議生成策略組成。為了進(jìn)行下一輪協(xié)商決策,必須對(duì)協(xié)商對(duì)手的提議做出評(píng)價(jià),因此需要相應(yīng)的協(xié)議評(píng)價(jià)策略。隨著協(xié)商環(huán)境的變化,根據(jù)當(dāng)前協(xié)商策略生成反提議的工作由提議生成策略來(lái)完成。提議生成策略又分為讓步型和學(xué)習(xí)型兩種。
1.3.1 提議評(píng)價(jià)策略
對(duì)單個(gè)協(xié)商線程而言,提議評(píng)價(jià)流程如圖3所示。
在時(shí)刻t,服裝經(jīng)銷商Agent r收到某服裝制造商Agent m的提議時(shí),判斷是否超過(guò)協(xié)商時(shí)間:若在有效期內(nèi),則將本提議的效用與該服裝經(jīng)銷商Agent r準(zhǔn)備發(fā)送的提議的效用進(jìn)行比較,若前者大于后者,表明服裝經(jīng)銷商Agent r接受服裝制造商Agent m的提議,協(xié)商成功,將協(xié)商結(jié)果發(fā)送給協(xié)調(diào)器;否則,在截至?xí)r間以前,服裝經(jīng)銷商Agent r向服裝制造商Agent m提出反提議。
1.3.2 提議生成策略
圖3 提議評(píng)價(jià)流程
為了對(duì)多個(gè)并發(fā)協(xié)商線程進(jìn)行管理,在協(xié)調(diào)器中要嵌入提議生成算法,尋找最優(yōu)提議,同時(shí)協(xié)調(diào)器進(jìn)行確認(rèn)并發(fā)送給未完成協(xié)商任務(wù)的協(xié)商線程,從而更新服裝經(jīng)銷商Agent的協(xié)商策略,提高協(xié)調(diào)器工作效率。
提議生成策略分為讓步型提議生成策略和學(xué)習(xí)型提議生成策略兩種。
讓步型提議生成策略是提議生成策略中較為基礎(chǔ)但很有效的策略。由Farantin提出的基于時(shí)間的讓步策略認(rèn)為時(shí)間是決定讓步幅度的因素之一;人們根據(jù)Parzen窗估計(jì)法提出了基于對(duì)手議題保留值估計(jì)的提議策略。這兩種策略具有一定互補(bǔ)性,為了彌補(bǔ)彼此的不足,人們采用動(dòng)態(tài)線性加權(quán)的方法提出了線性加權(quán)的提議策略。下面重點(diǎn)介紹一類學(xué)習(xí)型提議生成策略:粒子群優(yōu)化的協(xié)調(diào)策略。
粒子群優(yōu)化(PSO)算法是1995年由美國(guó)學(xué)者Kennedy和Eberhart提出的,由于參數(shù)少、記憶性好以及收斂快等特點(diǎn),受到廣泛關(guān)注。該算法屬于進(jìn)化算法的一種,其思想源于鳥(niǎo)群捕食,通過(guò)對(duì)適應(yīng)度的評(píng)價(jià)來(lái)獲取解的質(zhì)量。最優(yōu)化問(wèn)題的解被抽象為一些無(wú)質(zhì)量與體積的微粒,通過(guò)群體行為尋找整個(gè)搜索空間的最優(yōu)解。粒子群算法如下:
D維空間中,有N個(gè)粒子,適應(yīng)值函數(shù)為f(·);粒子i的位置為xi=(xi,1,xi,2,…,xi,n),將xi代入適應(yīng)函數(shù)f( xi)求適應(yīng)值;粒子 i的速度為 vi= ( vi,1, vi,2,…,vi,n),粒子i經(jīng)歷過(guò)的最好位置為pbesti=(pi,1, pi,2,…,pi,n),種群所經(jīng)歷過(guò)的最好位置為gbesti= ( gi,1, gi,2,…,gi,n)。則粒子i的速度和位置更新公式分別為:
其中:j=1,2,…,n;ω為慣性權(quán)重,調(diào)節(jié)搜索范圍,本文取1;c1,c2為加速度常數(shù)或?qū)W習(xí)因子,調(diào)節(jié)學(xué)習(xí)最大步長(zhǎng);r1,r2為[0,1]區(qū)間的隨機(jī)數(shù),以增加搜索的隨機(jī)性。
通過(guò)式(4)和式(5)的迭代,比較相鄰粒子的適應(yīng)值,求出粒子的局部最優(yōu)解,然后對(duì)所有局部最優(yōu)值進(jìn)行比較,其中的最小值即為當(dāng)前的全局最優(yōu)值。即:
為將粒子群優(yōu)化算法應(yīng)用于服裝供應(yīng)鏈并發(fā)協(xié)商模型中,就服裝經(jīng)銷商Agent而言,令協(xié)商線程為粒子,線程間的相互提議為粒子的當(dāng)前位置,則某個(gè)線程協(xié)商成功的提議即是粒子的個(gè)體最優(yōu)解,全局最優(yōu)解就是當(dāng)前所有協(xié)商成功的線程中效用最大的那個(gè)提議,效用函數(shù)Ur為適應(yīng)度函數(shù),提議值的變化量是速率。根據(jù)圖3,基于粒子群的服裝供應(yīng)鏈并發(fā)協(xié)商過(guò)程如下:
Step1:根據(jù)服裝經(jīng)銷商Agent的數(shù)量,協(xié)調(diào)器創(chuàng)建相應(yīng)的線程,對(duì)協(xié)調(diào)線程的提議策略及PSO的參數(shù)進(jìn)行初始化,如服裝制造商Agent的數(shù)量n,議題個(gè)數(shù)N,制造商Agent對(duì)議題的權(quán)重協(xié)商截至?xí)r間T,對(duì)第i個(gè)議題的最小值和最大值及讓步率β,算出當(dāng)前最佳提議并發(fā)送到其他子服裝制造商Agent。
Step2:初始時(shí)刻,服裝經(jīng)銷商Agent與服裝制造商Agent分別采用基于時(shí)間的協(xié)商策略進(jìn)行協(xié)商。
Step3:子服裝經(jīng)銷商Agent收到的協(xié)商結(jié)果的效用若比己方提議效用值小則保留,否則調(diào)整讓步策略。若協(xié)商成功,則轉(zhuǎn)入下一步,否則繼續(xù)Step3。
Step4:若協(xié)商活動(dòng)的結(jié)果為成功,協(xié)調(diào)器會(huì)對(duì)從協(xié)商線程收到的協(xié)商成功結(jié)果進(jìn)行評(píng)估,看是否為最佳提議,若是,將此提議發(fā)送給其他協(xié)商線程,否則保持,直到其他進(jìn)程協(xié)商結(jié)束。
在服裝生產(chǎn)與銷售環(huán)節(jié),服裝生產(chǎn)商與經(jīng)銷商常會(huì)對(duì)生產(chǎn)——銷售情況進(jìn)行協(xié)商。就佛山服裝生產(chǎn)商而言,在其生產(chǎn)能力限度內(nèi),往往追求訂單充裕、交貨時(shí)間合理、價(jià)格合理、產(chǎn)品新穎、型號(hào)齊全等,而經(jīng)銷商往往期望存貨少、交貨及時(shí)、款式新穎、價(jià)格適中等,代表消費(fèi)能力。本文以一個(gè)服裝經(jīng)銷商Agent和n個(gè)服裝制造商Agent i( i=1,2,…,n)為仿真實(shí)驗(yàn)對(duì)象,對(duì)N個(gè)議題的協(xié)商(這里對(duì)產(chǎn)品價(jià)格、訂購(gòu)數(shù)量和交貨時(shí)間3個(gè)議題進(jìn)行協(xié)商,即N=3)。實(shí)驗(yàn)參數(shù)的設(shè)置及協(xié)商議題如表1、表2所示。
根據(jù)粒子群算法,得到制造商Agent從5到35時(shí),聯(lián)合效用、協(xié)商時(shí)間和協(xié)商成功率如表3所示。
從表3可以看出,在不咯率成本的情況下,隨著制造商的增多,效用值也增大,說(shuō)明和越多制造商進(jìn)行協(xié)商,所得效果越好,同時(shí)隨著制造商數(shù)量的增多,平均協(xié)商時(shí)間縮短,協(xié)商成功率增長(zhǎng)速率降低。
在服裝供應(yīng)鏈環(huán)境中,以服裝經(jīng)銷商和服裝制造商為對(duì)象,建立了多Agent供應(yīng)鏈并發(fā)協(xié)商模型,利用PSO優(yōu)化算法求出最佳提議,并通過(guò)協(xié)調(diào)器將其發(fā)送給其他線程,結(jié)合基于時(shí)間的讓步策略和基于Parzen窗對(duì)手議題保留值估計(jì)的提議策略,對(duì)不同數(shù)量制造商時(shí)的聯(lián)合效用、平均協(xié)商時(shí)間以及協(xié)商成功率進(jìn)行了分析,證明模型與實(shí)際系統(tǒng)基本相符。以后的研究重點(diǎn)將是Agent之間的信任關(guān)系以及供應(yīng)鏈外部環(huán)境對(duì)協(xié)調(diào)結(jié)果的影響。
表1 實(shí)驗(yàn)參數(shù)的設(shè)置
表2 協(xié)商議題及取值范圍
表3 不同數(shù)量制造商Agent時(shí)的聯(lián)合效用、平均協(xié)商時(shí)間與協(xié)商成功率
[1] 蔣國(guó)瑞,等.多Agent制造業(yè)供應(yīng)鏈管理[M].北京:科學(xué)出版社,2013.
[2] Trelea I.The particle swarm optimization algorithm:convergence analysis and parameter selection[J].Information Processing letters,2003,85(6):315-317.
[3] 路健,等.供應(yīng)鏈環(huán)境下產(chǎn)能優(yōu)化配置問(wèn)題的混合粒子群算法[J].計(jì)算機(jī)集成制造系統(tǒng),2012,18(11):2537-2545.
[4] 劉小華,林杰.基于遺傳粒子群混合算法的供應(yīng)鏈調(diào)度優(yōu)化[J].控制與決策,2011,26(4):501-506.
[5] 鄭飛.閉環(huán)供應(yīng)鏈環(huán)境下紡織服裝業(yè)組織運(yùn)作模式[J].物流技術(shù),2015,34(7上):224-226,284.
[6] 汪胡林,馬金平.基于多Agent的BTO供應(yīng)鏈的動(dòng)態(tài)構(gòu)建方法研究[J].物流工程與管理,2013,35(6):123-127,155.
[7] 金坤,薛耀文.供應(yīng)商參與產(chǎn)品創(chuàng)新的供應(yīng)鏈協(xié)調(diào)研究[J].物流科技,2012,35(2):12-17.
[8] 馬慧民,等.基于粒子群算法的供應(yīng)鏈生產(chǎn)、配送集成計(jì)劃研究[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(30):206-209.
[9] 蘇生,等.供應(yīng)鏈協(xié)商調(diào)度模型與算法[J].軟件學(xué)報(bào),2014,24(1):12-24.
[10]董晴,戴更新.競(jìng)爭(zhēng)模式下利他偏好的供應(yīng)鏈協(xié)調(diào)[J].物流科技,2017,39(9):114-117.
[11]鄧汝春.服裝業(yè)供應(yīng)鏈管理[M].北京:中國(guó)紡織出版社,2005.
[12] Kennedy J,Eberthart R C.A discrete binary version of the particle swarm optimization[J].Proceedings of the Conference on System,Man and Cybernetics,1997,97:4104-4109.
[13]楊以雄.服裝物流管理教程[M].上海:東華大學(xué)出版社,2013.
[14]胡小建,陳啟萍.面向供應(yīng)鏈基于博弈的并發(fā)協(xié)商模型研究[J].中國(guó)機(jī)械工程,2013,24(2):163-168.