王運(yùn)志,胡耀光,張瑞君
(1. 北京理工大學(xué) 機(jī)械與車(chē)輛工程學(xué)院,北京 100081;2. 中國(guó)人民大學(xué) 商學(xué)院,北京100872)
基于博弈方法的產(chǎn)品組合資源配置決策研究
王運(yùn)志1,胡耀光1,張瑞君2
(1. 北京理工大學(xué) 機(jī)械與車(chē)輛工程學(xué)院,北京 100081;2. 中國(guó)人民大學(xué) 商學(xué)院,北京100872)
在制造業(yè)全球化、集群化和信息化的發(fā)展趨勢(shì)下,制造企業(yè)信息化應(yīng)用已從運(yùn)營(yíng)支持層轉(zhuǎn)而向管理和決策層的方向發(fā)展,我國(guó)制造業(yè)在全球市場(chǎng)競(jìng)爭(zhēng)中也面臨著在快速變化的商務(wù)環(huán)境中合理配置企業(yè)資源、實(shí)現(xiàn)價(jià)值增值的敏捷反應(yīng)與科學(xué)決策的需求。當(dāng)前制造企業(yè)經(jīng)常需要面臨的制造決策問(wèn)題是在產(chǎn)品制造過(guò)程中,通常需要在有限的資金、設(shè)備等資源條件下,使獲得的資源能夠得到最大限度利用以滿(mǎn)足制造要求,實(shí)現(xiàn)最優(yōu)的生產(chǎn)狀態(tài)。
產(chǎn)品組合生產(chǎn)中的制造資源優(yōu)化配置問(wèn)題即是當(dāng)企業(yè)在在不確定的技術(shù)、原材料和市場(chǎng)需求約束下進(jìn)行多種產(chǎn)品制造時(shí),需要選擇最優(yōu)的產(chǎn)品生產(chǎn)組合,使每一產(chǎn)品的生產(chǎn)都能達(dá)到最理想的資源配置。在傳統(tǒng)最優(yōu)化理論、遺傳算法等研究中通常以企業(yè)整體收益、運(yùn)營(yíng)指標(biāo)、設(shè)備利用率、市場(chǎng)需求滿(mǎn)意度等作為優(yōu)化的目標(biāo)。但在現(xiàn)代制造企業(yè)中,產(chǎn)品不僅需要滿(mǎn)足企業(yè)短期盈利的目標(biāo),在企業(yè)決策者對(duì)某種產(chǎn)品沒(méi)有偏好的情況下,決策應(yīng)保證各產(chǎn)品在資源競(jìng)爭(zhēng)中都能夠獲得最優(yōu)的資源配置和最大的收益,從企業(yè)的戰(zhàn)略決策角度更能滿(mǎn)足企業(yè)長(zhǎng)期發(fā)展的需要。近來(lái)有很多研究采用新的方法來(lái)更好地解決產(chǎn)品組合資源配置決策問(wèn)題,例如進(jìn)化方法[1]和約束理論方法[2]等。本文采用完全信息下的靜態(tài)博弈的方法,建立多維決策模型,將產(chǎn)品作為資源競(jìng)爭(zhēng)的主體,以每一產(chǎn)品都選擇最優(yōu)的資源配置,最大化本產(chǎn)品的收益為目標(biāo),選擇在給定的約束條件下資源分配的均衡解,達(dá)到每一產(chǎn)品的最優(yōu)生產(chǎn)狀態(tài)。
任何產(chǎn)品的生產(chǎn)行為都是在特定的生產(chǎn)條件(如技術(shù)、資源等)下進(jìn)行的,這種特定的生產(chǎn)技術(shù)關(guān)系決定了一個(gè)生產(chǎn)過(guò)程的投入和產(chǎn)出的數(shù)量上的對(duì)應(yīng)關(guān)系,描述這種對(duì)應(yīng)關(guān)系的工具就是生產(chǎn)函數(shù)[3]。
生產(chǎn)函數(shù)是一種經(jīng)驗(yàn)研究方法,是以數(shù)據(jù)為樣本,通過(guò)數(shù)學(xué)方法的擬合、檢驗(yàn)和修正得到的。在決策研究中,可以采用生產(chǎn)函數(shù)作為決策效用函數(shù),以益損值為橫坐標(biāo),以效用值為縱坐標(biāo)來(lái)表示兩者關(guān)系。同時(shí),決策的預(yù)見(jiàn)性要求效用曲線能夠反映決策者的偏好和對(duì)風(fēng)險(xiǎn)態(tài)度,因此需要根據(jù)決策者對(duì)相同的益損問(wèn)題(獲取收益或避免損失)的反應(yīng)對(duì)生產(chǎn)函數(shù)進(jìn)行修正,把決策戰(zhàn)略者對(duì)風(fēng)險(xiǎn)態(tài)度的變化在此坐標(biāo)系中描點(diǎn)而擬合成一條曲線。效用曲線有保守型、激進(jìn)型、中間型和混合型等類(lèi)型,可以采用指數(shù)擬合、Cobb-Douglas生產(chǎn)函數(shù)或前沿生產(chǎn)函數(shù)等。
在組合產(chǎn)品生產(chǎn)函數(shù)的構(gòu)建過(guò)程中,首先要識(shí)別決策問(wèn)題中的變量和這些變量與目標(biāo)函數(shù)之間的定量關(guān)系。通常情況下,制造過(guò)程變量包括:資源變量、技術(shù)參數(shù)和決策要素等;變量關(guān)系主要分析決策變量與生產(chǎn)績(jī)效變量的可控制變量之間的關(guān)系。例如,Norden提出一套制造決策定量化分析的方法,將決策分析過(guò)程分為4類(lèi)基本事件:計(jì)數(shù)、分類(lèi)、連接和比較,然后通過(guò)測(cè)量、連接、比較、建模的過(guò)程建立一個(gè)可以描述問(wèn)題的目標(biāo)、約束和其他關(guān)系的模型[4]。
利用企業(yè)已有的制造信息化系統(tǒng),如ERP系統(tǒng)等,可以表述產(chǎn)品的費(fèi)用-收益函數(shù)如下:
其中:物料成本:ΣC*Cq (C 為物料的標(biāo)準(zhǔn)價(jià),Cq為該物料的定額用量)
資源消耗費(fèi)用:ΣRr*Rq(Rr為資源標(biāo)準(zhǔn)費(fèi)率,Rq為資源標(biāo)準(zhǔn)用量)
資源管理費(fèi)用(制造費(fèi)用):ROr (Ror為資源管理費(fèi)用)
物料的管理費(fèi)用:MOr (MOr 為采購(gòu)件的管理費(fèi)用)
外協(xié)費(fèi)用:ΣRPr
對(duì)擬合后的產(chǎn)品收入(效用)和產(chǎn)品成本(資源投入)關(guān)系曲線,在預(yù)測(cè)的最大銷(xiāo)售量 和最小可行產(chǎn)量的決策空間范圍內(nèi),選擇合理區(qū)間離散處理后,作為一個(gè)有限博弈的策略空間和支付。
博弈論研究存在外部經(jīng)濟(jì)條件下的個(gè)人選擇問(wèn)題,在應(yīng)用博弈論方法進(jìn)行混合產(chǎn)品選擇問(wèn)題的研究中,產(chǎn)品本身作為資源競(jìng)爭(zhēng)的決策主體,參與人主動(dòng)選擇行動(dòng)(或戰(zhàn)略)以最大化產(chǎn)品的效用,即產(chǎn)品的收益水平。博弈論的基本概念包括參與人、行動(dòng)、信息、戰(zhàn)略、支付(效用)、結(jié)果和均衡。
假設(shè)博弈G有N個(gè)博弈方,第n個(gè)博弈方的可行戰(zhàn)略集為Kn(n =1,2,...,N)。記博弈方n 的戰(zhàn)略為kn∈Kn,則博弈G的支付向量u=(u1,u2,...,uN)T可以定義為笛卡兒乘積空間K=K1×K2×...×KN到N維實(shí)數(shù)空間RN上的映射,即u:K→RN,從而博弈方n 在戰(zhàn)略組合為k =(k1,k2,...,kn-1,kn,kn+1,...,kN) 時(shí)的支付為:
式中:[ . ]n表示支付向量的第n個(gè)分量。
在傳統(tǒng)(classic)的博弈描述方式中,博弈的戰(zhàn)略式表述在參與人較多時(shí)難以表示,而擴(kuò)展式表述不適合用于計(jì)算。從表示形式上,博弈G的的支付向量u即為一個(gè)N維實(shí)數(shù)集合,因此可以采用多維數(shù)據(jù)庫(kù)來(lái)表示一個(gè)博弈結(jié)構(gòu)。
在博弈的多維結(jié)構(gòu)描述中,參與人、戰(zhàn)略和支付是描述一個(gè)博弈所需要的必須要素,因此一個(gè)博弈多維模型的基本維度可定義為:
其中:
1)N個(gè)參與人的策略空間維度:每個(gè)參與人作為一個(gè)維度,維度成員為該參與人的策略空間;
2)參與人維度:博弈的參與人集合作為一個(gè)維度,維度成員為每個(gè)參與人;
3)支付維度:表示參與人的效用水平,維度成員可以對(duì)應(yīng)決策者在不同的偏好和對(duì)風(fēng)險(xiǎn)態(tài)度下的效用表示;
4)結(jié)果維度:博弈模型的求解結(jié)果,維度成員可以是不同種類(lèi)型的博弈結(jié)果。
另外,在該模型上擴(kuò)展其他博弈要素可以解決類(lèi)型,例如增加行動(dòng)要素維度,可以通過(guò)決策中的行動(dòng)順序來(lái)解決動(dòng)態(tài)決策問(wèn)題;增加信息集要素維度,可以支持不完全信息決策問(wèn)題的描述。
在應(yīng)用多維博弈模型解決混合產(chǎn)品資源配置問(wèn)題時(shí),將每一競(jìng)爭(zhēng)資源的產(chǎn)品作為博弈參與人,可選的資源投入作為每一產(chǎn)品的戰(zhàn)略空間,產(chǎn)品效用函數(shù)作為支付維度。在多維數(shù)據(jù)庫(kù)系統(tǒng),例如ESSBASE中建立博弈模型后,可利用多維數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘、搜索等技術(shù)對(duì)模型進(jìn)行求解。
應(yīng)用博弈論進(jìn)行決策的核心問(wèn)題是求解博弈模型,即尋找博弈的均衡。本文在基于多維數(shù)據(jù)模型描述的博弈決策問(wèn)題基礎(chǔ)上,提出均衡結(jié)果的求解方法。
博弈的純策略納什均衡解,可以根據(jù)Nash均衡的存在性定理Ⅱ判定解的存在性:
在n人戰(zhàn)略式博弈中,如果每個(gè)參與人的純戰(zhàn)略空間Si是歐氏空間上一個(gè)非空的、閉的、有界的凸集,支付函數(shù)ui(s)是連續(xù)的且對(duì)si是擬凹的,那么這一對(duì)策中存在純策略納什均衡。
但是Debreu 等給出的純策略納什均衡存在性定理是在十分嚴(yán)格的條件下的充分性定理,對(duì)于制造資源的配置決策問(wèn)題,參與人的支付函數(shù)可能是有限策略組合的離散點(diǎn)集,而且不是連續(xù)且擬凹的。唐小我等給出有限戰(zhàn)略博弈純戰(zhàn)略納什均衡解的搜索算法[5]:
定義函數(shù)fn為博弈方n采用戰(zhàn)略kn時(shí)的支付最大化判別函數(shù),即給定其他博弈方的戰(zhàn)略k-1= (k1,k2,...,kn-1,kn+1,...,kN),如果kn∈arg max{Un},則 fn=1 ,否則 fn=0。
戰(zhàn)略組合k=(k1,k2,...,kN)∈K是純戰(zhàn)略納什均衡的充分必要條件為F(k)=N,因此F(k)= N可以用來(lái)判斷一個(gè)博弈的純戰(zhàn)略納什均衡。如果知道博弈的支付組合,則可以通過(guò)博弈方支付最大化函數(shù)對(duì)可能成為納什均衡的戰(zhàn)略組合作標(biāo)記,然后,檢查支付組合的標(biāo)記次數(shù)是否等于參與博弈的博弈方的個(gè)數(shù)來(lái)判斷相應(yīng)的戰(zhàn)略組合是否是一個(gè)納什均衡。
在基于ESSBASE構(gòu)造的多維數(shù)據(jù)庫(kù)模型中,使用該方法求解純戰(zhàn)略納什均衡的算法腳本可以表示為:
最后,通過(guò)對(duì)每一戰(zhàn)略組合在參與人維度上判斷所有參與人的標(biāo)記次數(shù)F(k)=N,即可判定戰(zhàn)略組合是否為純戰(zhàn)略納什均衡。
假定某企業(yè)生產(chǎn)A、B、C3種產(chǎn)品,雖然產(chǎn)品的生產(chǎn)規(guī)模和收益不同,但每一種產(chǎn)品對(duì)企業(yè)都非常重要。企業(yè)決策者選擇將一部分資金分配到3中產(chǎn)品中,使每一種產(chǎn)品都盡可能得到達(dá)到最大收益所需的資金,并使企業(yè)有盡可能高的投資收益。
首先,分析企業(yè)現(xiàn)有制造信息系統(tǒng)中的制造數(shù)據(jù),得到該三種產(chǎn)品在過(guò)去8個(gè)月中的生產(chǎn)成本與收益如表1所示。
表1 過(guò)去8個(gè)月中的產(chǎn)品的費(fèi)用-收益 (單位:百萬(wàn)元)
并考慮未來(lái)市場(chǎng)需求和企業(yè)規(guī)模等因素,預(yù)計(jì)未來(lái)的資金投入量范圍如表2所示。
表2 計(jì)劃投入資金 (單位:百萬(wàn)元)
然后,對(duì)每一產(chǎn)品的生產(chǎn)函數(shù)采用多項(xiàng)式擬合后,并考慮決策者的風(fēng)險(xiǎn)偏好等因素,修正后的產(chǎn)品效用曲線如圖1所示。
圖1 產(chǎn)品效用曲線
根據(jù)上述產(chǎn)品收益-成本關(guān)系曲線,在預(yù)測(cè)的每一產(chǎn)品最大和最小資源投入范圍內(nèi),選擇以1 個(gè)單位(百萬(wàn)元)為區(qū)間做離散處理后,3個(gè)產(chǎn)品的資源配置戰(zhàn)略集合和支付如表3所示。
表3 產(chǎn)品戰(zhàn)略和支付(單位:百萬(wàn)元)
建立多維博弈模型,并求解模型的均衡解。分析當(dāng)企業(yè)最大投入資金分別為380和350時(shí),博弈模型的均衡解及整體投資收益比率如表4所示。
表4 多維博弈模型的均衡解 (單位:百萬(wàn)元)
根據(jù)以上計(jì)算結(jié)果,當(dāng)企業(yè)最大投資為380時(shí),三種均衡解都是戰(zhàn)略組合(105, 232, 35),是最優(yōu)資源配置決策;當(dāng)企業(yè)最大投資為350時(shí),不存在占優(yōu)戰(zhàn)略均衡和重復(fù)剔除的占優(yōu)戰(zhàn)略,存在多個(gè)純策略納什均衡,結(jié)合將整體投資收益比率作為資源配置效率指標(biāo),戰(zhàn)略組合(105,211,34)是最優(yōu)資源配置決策。
本文研究了使用非合作博弈理論進(jìn)行產(chǎn)品組合資源配置決策研究的方法,將制造資源效用和戰(zhàn)略組合進(jìn)行定量化描述,作為博弈分析的要素來(lái)構(gòu)建多維博弈模型。相比于其他以資源配置整體收益為優(yōu)化目標(biāo)的算法,本文采用求解博弈模型的均衡解作為決策結(jié)果,避免了忽視單一產(chǎn)品收益的缺陷。應(yīng)用示例說(shuō)明了本算法的實(shí)用性。由于純戰(zhàn)略納什均衡解的不唯一性,本研究方法還需要進(jìn)一步研究戰(zhàn)略的混合納什均衡解和非確定環(huán)境下的決策問(wèn)題求解。
[1]Ioannis G.Tsoulos,Pandian Vasant,“Product mix selection using an evolutionary technique,”P(pán)ower Control and Optimization,2009:240-247..
[2]RAINER SOUREN, HEINZ AHN and CHRISTIAN SCHMITZ,“Optimal product mix decisions based on the Theory of Constraints”,International Journal of Production Research,2005,43(2):361-374..
[3]孫巍.生產(chǎn)資源配置效率-生產(chǎn)前沿面理論及其應(yīng)用[M].社會(huì)科學(xué)文獻(xiàn)出版社,北京:2000:83-93.
[4]Norden, P.V.,“Quantitative techniques in strategic alignment,”IBM Systems Journal,1993,32:180-197.
[5]唐小我,倪得兵.有限戰(zhàn)略式博弈純戰(zhàn)略均衡求解的新算法[J].管理工程學(xué)報(bào),2006,20(2):137-140.
A game theoretic approach to product-mix resource allocation
WANG Yun-zhi1, HU Yao-guang1, ZHANG Rui-jun2
本文針對(duì)有限資源下的產(chǎn)品組合資源配置決策問(wèn)題,提出了基于博弈理論的解決方法。應(yīng)用定量化分析方法來(lái)表示制造資源效用和配置戰(zhàn)略,將產(chǎn)品作為資源競(jìng)爭(zhēng)的主體,使用定量化的決策要素作為維度來(lái)構(gòu)造一個(gè)多維博弈模型,求解博弈模型得到資源配置決策的最優(yōu)解。
產(chǎn)品組合資源配置;多維博弈模型;定量化決策
王運(yùn)志(1974 -),男,遼寧大連人,博士,研究方向?yàn)橹圃熨Y源配置、商務(wù)智能。
TP274
A
1009-0134(2011)4(上)-0072-04
10.3969/j.issn.1009-0134.2011.4(上).23
2010-10-29
國(guó)防科技基礎(chǔ)研究基金項(xiàng)目(C172009C001)