亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

廣義納什均衡問題類乘子算法研究

2023-04-29 00:00:00楊迪

科技資訊 2023年10期

摘要：近年來，許多學(xué)者致力于運(yùn)用精確罰函數(shù)法對廣義納什均衡博弈進(jìn)行研究。該文針對既有等式約束，也有不等式約束的廣義納什均衡問題，根據(jù)拉格朗日乘子法思路，給出相同結(jié)構(gòu)類拉格朗日函數(shù)，設(shè)計了一個類乘子算法，在較弱的情況下，進(jìn)行可行性和收斂性的分析證明，在具體的數(shù)值實(shí)驗(yàn)中，該文給出的算法與經(jīng)典的PHR算法相比較，在時間和迭代步數(shù)上都呈現(xiàn)較好的效果，說明算法的有效性。

關(guān)鍵詞：廣義納什均衡"類乘子算法"拉格朗日算法"精確罰函數(shù)

中圖分類號：O225"""""""文獻(xiàn)標(biāo)識碼：A

Research"on"the"Multiplier-like"Algorithm"for"the"Generalized"Nash"Equilibrium"Problem

YANG"Di

（Shiyuan"College"of"Nanning"Normal"University，"Nanning，"Guangxi"Zhuang"Autonomous"Region，"530000"China）

Abstract：In"recent"years，"many"scholars"have"been"studying"the"generalized"Nash"equilibrium"game"by"using"the"exact"penalty"function"method."Aiming"at"the"generalized"Nash"equilibrium"problem"with"both"equality"constraints"and"inequality"constraints，"this"paper"gives"a"Lagrange-like"function"of"the"same"structure"according"to"the"idea"of"the"Lagrangian"multiplier"method，"and"designs"a"multiplier-like"algorithm"to"analyze"and"prove"the"feasibility"and"convergence"under"weak"conditions."In"specific"numerical"experiments，"compared"with"the"classical"PHR"algorithm，"the"algorithm"presented"in"this"paper"presents"better"results"in"time"and"iteration"steps，"indicating"the"effectiveness"of"the"algorithm.

Key"Words：""Generalized"Nash"equilibrium;"Multiplier-like"algorithm;"Lagrange"algorithm;"Exact"penalty"function

近年來，隨著經(jīng)濟(jì)的發(fā)展和市場競爭的日趨激烈，越來越多的學(xué)者研究納什均衡博弈的拓展形式——廣義納什均衡博弈。在非合作博弈當(dāng)中，局中人會根據(jù)自己的情況來選擇策略，如果只考慮自身的情況（局中人本身受到的約束），完全不考慮其他局中人已選策略，不一定得到在大環(huán)境下的最優(yōu)策略。在真實(shí)情況下，局中人在選擇策略的時候，應(yīng)該充分考慮其他局中人已選或者必選的優(yōu)勢策略。只有在這種情況下，自己的優(yōu)勢策略和其他局中人的優(yōu)勢策略才更可能得到一個均衡，減少自己的不必要的損失。這意味著，在實(shí)際情況量化后，局中人的策略集不是只依賴自身決策變量的一個集合，而是充分依賴其他局中人的決策。

該文是圍繞廣義納什均衡問題（Generalized"Nash"Equilibrium"Problem，GNEP）和罰函數(shù)方法來展開論述的。

用罰函數(shù)方法來逼近GNEP最初是由Pang和Fukushima[1，2]提出的。他們提出了一系列的罰函數(shù)來逼近GNEP的解并求解其中可微發(fā)問題的一個無限序列。近年來對求解GNEP方面已有了一些研究。FACCHINEI"F等人[3]提出了一個求解一般GNEP的精確罰函數(shù)方法。這個方法有很好的數(shù)值效果，"同時能夠切實(shí)求解具有不同性質(zhì)的GNEP。FACCHINEI"F等人[4]設(shè)計了“偏”罰函數(shù)系統(tǒng)，保持獨(dú)立約束，不把它納入“罰”項(xiàng)。文獻(xiàn)[3，4]的方法很大程度上依賴這樣的一個事實(shí)：利用模

來定義精確罰函數(shù)，其中。這里取的模在任意不可行點(diǎn)都是可微的。這是一個很明顯的優(yōu)勢，而文獻(xiàn)[3，4]都要求。

在現(xiàn)有的廣義納什均衡問題的求解方法中，大多是罰函數(shù)算法、數(shù)值算法、下降算法等，其中罰函數(shù)算法中，大多采用精確罰函數(shù)算法，從而得到原問題的精確解。而近年運(yùn)用拉格朗日乘子法去求解問題上，多運(yùn)用在矩陣填充問題和改進(jìn)的經(jīng)典增廣拉格朗日方法來處理多目標(biāo)優(yōu)化問題。羅美菊，吳歐[5]在經(jīng)典增廣拉格朗日乘子算法的基礎(chǔ)上，"通過定義混合型奇異值閾值算子，"得到了一種求解矩陣填充問題的新的混合型增廣拉格朗日乘子算法。張艷芬[6]提出一種部分增長拉格朗日乘子算法在雙層規(guī)劃問題求解中的應(yīng)用改進(jìn)。王俊霞等人[7]以奇異值閾值方法為基礎(chǔ)，"針對符號矩陣填充提出了修正的增廣Lagrange乘子法。文獻(xiàn)[8-11]"是通過改進(jìn)經(jīng)典增廣拉格朗日方法來處理多目標(biāo)優(yōu)化問題。目前對乘子法等在廣義納什均衡問題中的應(yīng)用未見過多涉及。在此方面具有一定的研究價值。該文目的是，根據(jù)Lagrange乘子法的思想，設(shè)計了一個類乘子法，由此給出算法來求解廣義納什均衡問題，得到其精確解。一般的乘子法是以增廣拉格朗日函數(shù)為基礎(chǔ)，要求約束條件為等式約束，對不等式約束也采用轉(zhuǎn)換為等式約束后再討論的方法。與一般的乘子法不同，該文設(shè)計的類乘子法是基于類增廣拉格朗日函數(shù)，針對具有不等式約束和等式約束的混合約束的情況，同樣給出相同結(jié)構(gòu)類拉格朗日函數(shù)，提出一個類乘子算法，同時進(jìn)行可行性和收斂性的分析證明，最后給出數(shù)值實(shí)驗(yàn)說明算法的優(yōu)越性。

1"預(yù)備知識

假設(shè)在非合作博弈當(dāng)中，一共有個局中人，每一個局中人都會從自己的策略集中選取一個策略。會得到個局中人的一個策略組合．本文為強(qiáng)調(diào)，記，其中表示除以外其他局中人的策略。策略組合形成的集合為局中人策略集的笛卡爾積，即."我們稱為策略組合集。令為局中人的目標(biāo)函數(shù)，并假設(shè)對為凸。則向量稱為一個納什均衡（NE），如果滿足對，

上述問題就是納什均衡問題（NEP）。

在實(shí)際中博弈，經(jīng)常出現(xiàn)每個局中人的策略會與其他局中人的策略相關(guān)的情況，為表示相關(guān)性，每個局中人的策略集表示為，并定義相關(guān)策略組合即為。那么向量稱為一個廣義納什均衡（GNE），如果滿足對，

上述問題就是廣義納什均衡問題（GNEP）。

顯然，GNEP是NEP的拓展形式，其中每個參與者的策略可能依賴于競爭對手的策略。

在實(shí)際問題中，博弈中的局中人擁有共同的一些資源，比如政策、市場環(huán)境等，這樣共有的資源可以量化為共享約束來表現(xiàn)。在共享約束中，根據(jù)實(shí)際情況，分為等式約束和不等式約束。這種帶有共享約束的廣義納什均衡問題，是廣義納什均衡問題的重要形式。

2"問題等價分析

對約束條件既有等式組，也有不等式組的混合約束的GNEP，該文的目的是通過類乘子法來求解GNEP，考慮可行即為

這種最一般的情況。不等式組，和等式組，為局中人的依賴約束，并且對為凸。那么該文所要解決的局中人問題就變?yōu)?/p>

其中，的維數(shù)為。對所有，同樣地，針對原問題（1）作以下假設(shè)：

（1）為連續(xù)可微，對為凸；

（2），連續(xù)可微，并且對為凸。

針對混合約束，該文對每個局中人的廣義納什均衡問題設(shè)計了類增廣Lagrange函數(shù)：

得到了增廣Lagrange罰函數(shù)：

同樣地，對不同的局中人具有不同的乘子和罰參數(shù)，為了書寫簡便，統(tǒng)一去掉標(biāo)記，并記。"因此類增廣Lagrange罰函數(shù)問題可等價地表示為

稱問題（4）為類乘子罰問題。

現(xiàn)在分析和證明問題（1）與問題（4）等價。

顯然有，

注意到，，"具有模同樣的性質(zhì)，在不可行點(diǎn)處是連續(xù)可微的。并且有，"。

定理1"若為原問題（1）的局部極小值點(diǎn)，為相應(yīng)的乘子，若二階條件成立，即

則存在，當(dāng)時，為的最優(yōu)解。反之，若為原問題（1）的可行點(diǎn)，且為的極小點(diǎn)，則為原問題的最優(yōu)解，其中為相應(yīng)的乘子。

證""必要性。由

其中，，可知

從而

因?yàn)樵瓎栴}（1）的局部極小值點(diǎn)，所以，.又因二階條件成立，必有

而

故為的最優(yōu)解。

充分性．因?yàn)闉樵瓎栴}（1）的可行點(diǎn)，滿足，，且為的極小點(diǎn)，那么對任意靠近的可行點(diǎn)，，，有

從而為原問題（1）的最優(yōu)解。

3"算法和收斂性分析

為了得到算法的收斂性，在這里有如下定義：

定義1""定義

定義2""若，，。則稱在點(diǎn)上滿足約束規(guī)。

定理2"假設(shè)條件成立，為的最優(yōu)解必為原問題（1）的最優(yōu)解。

證明"根據(jù)定理1，只要證明為原問題的可行點(diǎn)就行。假設(shè)存在和的解序列是原問題的不可行點(diǎn)，即，且。不失一般性，設(shè)。而連續(xù)可微，滿足

即

易知時，

，

上式成立必有，。

這顯然與條件矛盾，所以為原問題的可行點(diǎn)。由定理1，"為的最優(yōu)解必為原問題（1）的最優(yōu)解。命題得證。

現(xiàn)在我們考慮的是乘子的迭代。可知

我們得到乘子的修正公式為

假設(shè)1"對乘子和罰函數(shù)，

的解存在。

下面給出具體的算法。

算法1

歩0"給出初始值，，，誤差，，。

歩1"求出，令．"若，停止。

歩2"令，對每個，若

（6）

轉(zhuǎn)歩3；否則使罰參數(shù)加倍（）。

歩3"利用（5）式計算，令，，轉(zhuǎn)歩1。

下面證明算法1的收斂性。

定理3"原函數(shù)（1）滿足條件，設(shè)為算法1產(chǎn)生的序列，乘子集有界，則算法有限歩終止，序列的極限點(diǎn)為原函數(shù)的解。

證"根據(jù)定理2可知算法產(chǎn)生的序列的極限點(diǎn)為原函數(shù)的解。假設(shè)算法不有限歩終止，即存在。不妨假設(shè)在每個迭代點(diǎn)都更新，并且有。因在處連續(xù)可微，根據(jù)算法歩2有

因目標(biāo)函數(shù)的連續(xù)性，乘子集的有界性以及，有

，

即，"。

由的定義有，，顯然與假設(shè)條件成立矛盾，因此算法有限歩終止。定理得證。

4"數(shù)值結(jié)果

本節(jié)將用例子來說明本章所提算法的可行性和有效性。cm表示罰因子增加的倍數(shù)，s.p.表示初始點(diǎn)，T表示運(yùn)算的時間（單位為秒），表示誤差容忍度，term為相關(guān)的終止條件，iter表示算法迭代次數(shù)。對算法的歩1，我們?nèi)圆捎脭M牛頓法來計算。初始罰參數(shù)統(tǒng)一設(shè)置為，初始乘子為。

首先考慮的是約束為不等式約束的GNEP。接下來運(yùn)用Matlab"7.12.0（R2011a）來完成算法1和經(jīng)典的PHR算法對下列的計算。

例1""考慮的博弈：

局中人有一個決策變量，局中人有一個決策變量。他們有共同的等式約束。

由于這兩個算法在同樣的誤差內(nèi)所得的最優(yōu)點(diǎn)是一樣的，在數(shù)據(jù)上不進(jìn)行對比，僅比較它們的迭代步數(shù)和運(yùn)行時間。算法1和經(jīng)典的PHR算法得出的實(shí)驗(yàn)結(jié)果如表1，其中phr和yphr分別表示經(jīng)典的PHR算法和算法1。從表1的測試數(shù)據(jù)可以看出，算法1在迭代步數(shù)要優(yōu)于經(jīng)典的PHR算法，而相對地，在運(yùn)行時間上，算法1比經(jīng)典的PHR算法要更短。同時也可以看出，當(dāng)要求的精確度越高時，算法1的優(yōu)勢就越明顯（如時，PHR算法的迭代歩是14歩，算法1的只為10歩，而當(dāng)時，PHR算法的迭代歩是20歩，算法4.1的只為9歩）。

例2""考慮，約束條件為等式的博弈：

算法1和經(jīng)典的PHR算法針對例2得出的實(shí)驗(yàn)結(jié)果如表2。從前兩組數(shù)據(jù)可以看出算法1在迭代步數(shù)和時間上比經(jīng)典的PHR算法更優(yōu)越。但是若是改變了罰因子的倍數(shù)或是增大容忍度（如后兩組數(shù)據(jù)），雖然PHR算法的時間很短，但是它的迭代步數(shù)仍是比算法1要多，而且它的最后迭代點(diǎn)不是精確最優(yōu)點(diǎn)。這說明就精確度來說PHR算法對多個因素敏感，而算法1則較為穩(wěn)定。

例3""考慮，一般情形的博弈：

算法1和經(jīng)典的PHR算法得出的數(shù)值結(jié)果如表3。從第二組數(shù)據(jù)可看出，算法1對罰因子的增長倍數(shù)有一定的要求，但效果與PHR算法不相上下。而第一組和第三組數(shù)據(jù)表明算1在迭代步數(shù)和時間上確實(shí)比經(jīng)典的PHR算法要優(yōu)越。

5"總結(jié)與展望

該文主要是利用罰函數(shù)方法來求解廣義納什均衡問題，分別對各種約束條件下的目標(biāo)函數(shù)進(jìn)行討論。通過研讀相關(guān)文獻(xiàn)，分別針對不等式約束，等式約束和混合約束，在新提出的類拉格朗日函數(shù)模型的基礎(chǔ)上，仿效乘子法的思路得到類乘子法，并證明它們在適當(dāng)條件下的全局收斂性。數(shù)值結(jié)果表明三個算法是可靠有效的。

廣義納什均衡問題在各個領(lǐng)域應(yīng)用的增多，意味著我們需要解決具有各式各樣要求的問題?，F(xiàn)有求解GNEP的罰函數(shù)算法都具有一定的局限性，與實(shí)際應(yīng)用還存在一定的距離。往后，我們的研究方向仍有很多。比如對罰因子的選取，要提出一個更為有效的方法；對更一般目標(biāo)問題，像目標(biāo)函數(shù)不為凸函數(shù)或約束函數(shù)不是凸函數(shù)的情況，還可提出對不是凸規(guī)劃的算法等。

參考文獻(xiàn)

[1]"PANG"J"S，F(xiàn)UKUSHIMA"M."Quasi-variational"Inequalities，"Generalized"Nash"Equilibria"and"Multi-leader-follower"Games[J]."Computational"Management"Science，"2005，"2（1）："21-56.

[2]"PANG"J"S，F(xiàn)UKUSHIMA"M.Quasi-variational"Inequalities，"Generalized"Nash"Equilibria，"and"Multi-leader-follower"Games[J].Computational"Management"Science，2009，6（3）：373-375.

[3]"FACCHINEI"F，KANZOW"C."Penalty"Methods"for"the"Solution"of"Generalized"Nash"Equilibrium"Problems"[J]."Society"for"Industrial"and"Applied"Mathematics，"2010，20（5）：2228–2253.

[4]"FACCHINEI"F，LAMPARIELLO"L.Partial"Penalization"for"the"Solution"of"Generalized"Nash"Equilibrium"Problems[J]."Journal"of"Global"Optimization，"2011，"50（1）："39-57.

[5]"羅美菊，吳歐．求解廣義納什均衡問題的增量罰算法[J]．純粹數(shù)學(xué)與應(yīng)用數(shù)學(xué)，2012，28（5）：599-603.

[6]張艷芬.部分增長拉格朗日乘子算法在雙層規(guī)劃問題求解中的應(yīng)用改進(jìn)[J].北京工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報，2020，19（3）：24-27.

[7]王俊霞，申倩影，王川龍.符號矩陣填充的修正增廣拉格朗日乘子算法[J].工程數(shù)學(xué)學(xué)報，2021，38（3）：343-352.

[8]"WANG"X"Y，WANG"Y"J，WANG"G."An"Accelerated"Augmented"Lagrangian"Method"for"Multi-criteria"Optimization"Problem[J]."Journal"of"Industrial"amp;"Management"Optimization，"2018，"16（1）"："1-9.

[9]孫月明.約束多目標(biāo)優(yōu)化問題的罰函數(shù)方法及其應(yīng)用[D].重慶：重慶郵電大學(xué)，2021.

[10]"LIANG"Y"C，YE"J"J."Optimality"Conditions"and"Exact"Penalty"for"Mathematical"Programs"with"Switching"Constraints[J]."Journal"of"Optimization"Theory"and"Applications，2021，190（1）：1-31.

[11]COCCHI"G，LAPUCCI"M."An"Augmented"Lagrangian"Algorithm"for"Multi-objective"Optimization[J]."Computational"Optimization"and"Applications："An"International"Journal，"2020，"77（1）"："29-56.

科技資訊2023年10期

科技資訊的其它文章: 相變蓄熱裝置強(qiáng)化換熱技術(shù)研究進(jìn)展; 基于內(nèi)置SiC-MOSFET的AC/DC準(zhǔn)諧振變換器研制; 基于無人機(jī)傾斜攝影測量的土地利用變化監(jiān)測研究; 關(guān)于芻議電力系統(tǒng)中的電氣二次及繼電保護(hù)探討; 高烈度區(qū)中小跨徑城市矮墩高架橋梁地震響應(yīng)分析; 商業(yè)建筑弱電與智能化設(shè)施的設(shè)計與實(shí)施