王秋茸
(西安體育學(xué)院 網(wǎng)絡(luò)管理中心,陜西 西安 710068)
現(xiàn)代競技體育對博弈論已經(jīng)有了相當(dāng)?shù)闹匾?,中國最早的博弈論可以追溯到?zhàn)國時期的“田忌賽馬”,甚至如今仍然成為一個競速模型而被發(fā)揚,比如就有基于“田忌賽馬”的博弈模型研究競速機(jī)器人比賽的決策問題的實例[1]。1928年,馮·諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。從理論上來說,博弈論是研究相互依賴、相互影響的主體理性決策行為以及這些決策的均衡結(jié)果理論,互為依賴并且相互影響的決策行為及其結(jié)果的組合則被稱為博弈[1]。博弈論是信息科學(xué)研究的一個重要方向,對于競技中的博弈現(xiàn)象通過抽象可以建立較為完備的邏輯體系。在現(xiàn)代競技中,由于體系規(guī)模對壘的出現(xiàn),不但需要立足于博弈論,更需要重視平臺內(nèi)部主體間的協(xié)同。
樸素的古希臘文明指出協(xié)同是關(guān)于合作的科學(xué)。亞里士多德用“整體大于部分之和”的論斷評價了協(xié)同的重要意義,時至今日,這一觀點仍在社會生活中受到人們的普遍認(rèn)可和重視,系統(tǒng)科學(xué)研究領(lǐng)域“新三論”中德國理論物理學(xué)家Hermann Haken 提出的協(xié)同學(xué)更是把協(xié)同的研究作為一門專門的學(xué)科來指導(dǎo)生產(chǎn)實踐?,F(xiàn)代體育中,競技體育是一項協(xié)同運動,尤其是以體系對壘的競技體育中存在大量的戰(zhàn)術(shù)協(xié)同,包括活動協(xié)同與信息協(xié)同,體現(xiàn)了開放系統(tǒng)的一種涌現(xiàn)現(xiàn)象。比如籃球、棒球等球類比賽,個體能力再強(qiáng),也無法單獨取得比賽的勝利,只有全隊間的協(xié)作配合,才能有取勝的可能。因此在進(jìn)攻時,擊球員不能只為自己考慮才如何擊球,而要從全隊的利益出發(fā)考慮應(yīng)如何擊球,如果本隊在壘上有跑壘員的話,就要想到那個跑壘員怎樣能進(jìn)到下一壘,或者是怎樣才能讓他得分等。這些問題的思考與解決的過程正是一個協(xié)同工程的實施。而這些理論的應(yīng)用與表達(dá)在實際中經(jīng)驗成分較多,科學(xué)的信息模型較為欠缺,信息技術(shù)的發(fā)展使得仿真這些戰(zhàn)術(shù)協(xié)同具備可行性,文中旨在通過提出一個一般的競技體育的協(xié)同模型來解決平臺博弈中的多主體競技中的協(xié)同戰(zhàn)術(shù)模擬。
體育競技中存在著若干協(xié)同關(guān)系,基本分為角色聯(lián)盟與角色平臺,即可以是角色內(nèi)(同一角色不同主體之間)協(xié)同、角色間(不同角色主體之間)協(xié)同。
在軍事學(xué)中,現(xiàn)代戰(zhàn)爭必須貫徹的原則之一就是“協(xié)同作戰(zhàn)”,實際上協(xié)同競技更像是協(xié)同作戰(zhàn)的訓(xùn)練和實驗。協(xié)同可以分為相同主體間的協(xié)同和不同主體間的協(xié)同。如在體育競技中有擔(dān)任賽場的同一角色不同主體間的協(xié)同,以及不同角色之間的協(xié)同。同一角色的不同主體可以通過協(xié)同形成技術(shù)聯(lián)盟以更強(qiáng)大的執(zhí)行力完成一個任務(wù),而不同角色的不同主體通過協(xié)同形成互為補(bǔ)償?shù)木C合執(zhí)行平臺來完成單個主體無法勝任的任務(wù)。
現(xiàn)代系統(tǒng)論中的協(xié)同學(xué)說指出,開放系統(tǒng)在遠(yuǎn)離平衡態(tài)情形下,在一定條件的子系統(tǒng)間的相互作用和協(xié)作中,這種系統(tǒng)會形成有一定功能的自組織結(jié)構(gòu),在宏觀上產(chǎn)生時間結(jié)構(gòu)或空間結(jié)構(gòu),或者時間—空間結(jié)構(gòu),從而達(dá)到新的有序狀態(tài)?,F(xiàn)代體育競技是一個開放系統(tǒng),即使是單主體參與的比賽仍舊具有平臺參與的特點,用于實施競技前端的主體要受到若干后臺主體甚至若干保障子系統(tǒng)的支撐。沒有支撐子系統(tǒng)之間的良好協(xié)同,無法成功地完成一次競技。比如一個競技平臺通常由運動員、教練員、替補(bǔ)、后勤保障等組成。
在現(xiàn)代運動訓(xùn)練體系的架構(gòu)環(huán)境中,為滿足專項競技需要而逐步專項化的運動員機(jī)體,本身就是一個逐步遠(yuǎn)離自然平衡狀態(tài)的多重復(fù)雜系統(tǒng)[2]。競技平臺的競技能力由預(yù)備狀態(tài)向目標(biāo)狀態(tài)轉(zhuǎn)移的實現(xiàn)過程,毫無疑問地要緊密依賴于具有自組織功能的競技團(tuán)體和具有非平衡系統(tǒng)特性的運動訓(xùn)練體系內(nèi)部多重子系統(tǒng)間的相互作用和協(xié)作。
如何基于平臺實現(xiàn)靈活資源配置? 如何協(xié)同使用能力互補(bǔ)? 如何構(gòu)成執(zhí)行協(xié)同任務(wù)的“能力支持系統(tǒng)”? 這些是協(xié)同競技關(guān)注的研究課題。
智能體(Agent)是一個物理的或抽象的實體,它能作用于自身和環(huán)境,并能對環(huán)境做出反應(yīng)。是一類在特定環(huán)境下能感知環(huán)境并能自治地運行的計算實體。它接受從環(huán)境中感知的信息,并產(chǎn)生相應(yīng)的動作作用于環(huán)境,這種交互過程可以是一個循環(huán)連續(xù)的過程[3-4]。
智能體具有以下特性:
1)自治性,即智能體能在沒有操作人員和其它智能體的影響控制的情形下,對特定環(huán)境做出響應(yīng),并根據(jù)感知的信息調(diào)整自己的狀態(tài)和行為;
2)反應(yīng)性,智能體不但可以通過感知信息對環(huán)境做出被動反應(yīng),而且可以根據(jù)自身的需求對環(huán)境主動做出動作,調(diào)整環(huán)境要素來適應(yīng)自身更好的發(fā)展;
3)社會性,如同人是社會的成員一樣,智能體也是眾多智能體形成的交互社團(tuán)的一員.它在自主運作的同時與外部環(huán)境和其它智能體交互協(xié)作,并可以積極協(xié)商消除沖突;
4)主動性,智能體在與環(huán)境和其它智能體的逐漸交互過程中具有學(xué)習(xí)能力,能不斷更新自己的知識庫,提高了環(huán)境適應(yīng)能力和系統(tǒng)行為能力。
作為競技主體的人可以跟智能體一一對應(yīng),比如眼睛、耳朵等作為傳感器子系統(tǒng),手、足、口及身體的其他部位作為執(zhí)行器。因此通過Agent 可以模擬一個理性的主體。
通常Agent 在解決某一問題時,其能力是單一的,但若干個Agent 通過通信和協(xié)同,形成一個Agent 聯(lián)盟或綜合體,卻可以解決非常復(fù)雜的問題,完成困難的任務(wù)。這種聯(lián)盟或綜合體就稱其為多智能體系統(tǒng)。
多智能體系統(tǒng)MAS(multi-agent systems)是指由多個Agent 組成的一個較為松散的多Agent 聯(lián)盟,這些Agent 成員之間相互協(xié)同,相互服務(wù),共同完成一個任務(wù)。各Agent 成員的活動是自制和獨立的,其自身的目標(biāo)和行為不受其它Agent 成員的限制,它通過競爭或磋商等手段協(xié)調(diào)和解決各Agent 成員的目標(biāo)和行為之間的矛盾和沖突。
在RN 理論中,角色是一系列職責(zé)和權(quán)力的集合,角色的職責(zé)定義了該角色的執(zhí)行實體在實現(xiàn)某一目標(biāo)時應(yīng)進(jìn)行的活動;角色的權(quán)力定義了角色的執(zhí)行實體對哪些資源具有使用權(quán)限,即為了使其順利完成任務(wù)系統(tǒng)需為其提供相關(guān)數(shù)據(jù)、知識、運行環(huán)境等。角色具有下述特征[4]:
1)職責(zé)規(guī)定性,角色的職責(zé)由一活動序列的執(zhí)行來實現(xiàn);
2)事件驅(qū)動性,角色可以接收來自其它角色或系統(tǒng)外部的事件,并進(jìn)行相應(yīng)處理有選擇地做出應(yīng)答;
3)業(yè)務(wù)描述性,業(yè)務(wù)通過角色之間的交互描述;
4)概念集合性,角色概念描述了一類參與者個體的行為,具有集合性;
5)個體獨立性,角色是相互獨立的,但他們之間通過交互進(jìn)行通信。
將RN 理論與Agent 技術(shù)結(jié)合可以形成多Agent 協(xié)同業(yè)務(wù)流程?;诮巧軌蚪⒒?RN 理論的業(yè)務(wù)流程(RNBP)模型,為了基于Role 技術(shù)建立Agent 協(xié)同業(yè)務(wù)流程ACBP 設(shè)計模型,需要建立RNBP 模型到Agent 協(xié)同網(wǎng)絡(luò)模型的映射,包括角色與Agent 之間映射,以及角色屬性與Agent 屬性之間映射。該模型為建立具有柔性化自動化智能化的業(yè)務(wù)流程模型提供了一種有效方法。
在一個一般的體育競技中,描述協(xié)同MAS 系統(tǒng)需要建立的Agent 可以分為情境感知Agent,決策Agent 和執(zhí)行Agent。
實際操作中,在某些情形下,一個平臺運作的競技系統(tǒng)具備可重構(gòu)性。基于以上觀點可給出下面的Agent 模型。
一個角色Agent 可以表示用一個六元組表示為
其中:A 是Agent 的標(biāo)識集合;S 是Agent 的內(nèi)部狀態(tài);E是Agent 面臨的外部環(huán)境,S 和E 構(gòu)成Agent 推演和作動的基礎(chǔ);R 是Agent 能擔(dān)任的角色集合;T 表示Agent 的計劃,即面臨的任務(wù);K 是Agent 的知識系統(tǒng),包括任務(wù)分解方法以及Agent 之間目標(biāo)、意圖和推理機(jī)制等的沖突消除。
平臺競技任務(wù)通常具備多種能力構(gòu)成,一個平臺任務(wù)T可以通過向量表示為
其中ci(1≤i≤n)為一個整數(shù)表示的值,代表任務(wù)的能力構(gòu)成強(qiáng)度。
一個MAS 模型是一個二元組S=(UAR,T),其中UARi為MAS,T=(UCT)為協(xié)同任務(wù),U為對象集合的論域,CT為任務(wù)能力域。
通過不同角色扮演,及對應(yīng)知識系統(tǒng),角色Agent 可以實例化為情境感知Agent、決策Agent 以及功能Agent。一個角色Agent 的S 可以表達(dá)實例Agent 的可調(diào)度能力構(gòu)成,角色R 可以表達(dá)基本的能力需求,而T 則代表了當(dāng)前情境下Agent 的作動序列。
對于實例化的Agent 狀態(tài)表達(dá)可以通過能力構(gòu)成來進(jìn)行如下表達(dá):
圖1 競技MAS 協(xié)同過程Fig.1 Collaborative process among sports MAS
其中:A 表示一個Agent 實例,ai(1≤i≤n)為一個布爾值表示的變量,代表Agent 的可用性情況。
競技平臺可以通過一個多Agent 系統(tǒng)來表示,從能力構(gòu)成考慮,競技平臺可以表示為角色Agent 實例的線性表示。設(shè)系統(tǒng)智能體集為{A1/m1,A2/m2,…,Ax/mx},其中Ai為第i 種角色的智能體實例,mi為對應(yīng)的擁有數(shù)目,i=1,2,…,x。那么S={L=λ1*A1,S+λ2*A2,S+…+λx,S}。在競技任務(wù)執(zhí)行的一個時刻,不同的配置坐標(biāo)(λ1,λ2,…,λx)則代表了不同的多智能體配置(λ1,λ2,…,λx)。在一次競技中,因為個別智能體的作用喪失,競技平臺可能會經(jīng)歷若干次重組。而好的重組算法會使得競技平臺在當(dāng)前能力許可范圍內(nèi)總處于應(yīng)對任務(wù)的最優(yōu)化狀態(tài)。
在平臺運作中,如果出現(xiàn)Agent 實例發(fā)生功能障礙,則可以通過面向任務(wù)的系統(tǒng)重組產(chǎn)生一個新的競技配置,從宏觀角度上能夠看到平臺的暫歇。因為操作上要經(jīng)歷一個尋優(yōu)的過程,即通過綜合比較多個配置坐標(biāo),權(quán)衡得出最優(yōu)化的一個。這個問題可以通過一個線性規(guī)劃來表達(dá)。為了尋優(yōu),為平臺重組引入一個代價函數(shù)Cp,設(shè)Agent 實例代價用函數(shù)向量表示為w=(w1,w2,…,wx),其中wi=fi(i),i=1,2,…,x。那么平臺總競技代價為:
則問題可以描述為:
約束條件:λi≤mi,i=1,2,…,x
對于線性規(guī)劃標(biāo)準(zhǔn)型,若存在可行解,則必然存在一個基可行解;若存在一個最優(yōu)可行解,則必然存在一個最優(yōu)基可行解。令K 是滿足約束條件的所有n 維向量X 所組成的凸多胞形,那么向量X為K 的一個極點的充分且必要條件是X為約束方程的基可行解。只要找到約束條件所組成的凸多胞形的極點,就可以從中找到最優(yōu)解。關(guān)于問題求解過程則是另外一個命題,其本身與協(xié)同競技相關(guān)性不大,這里通過圖2 給出求解流程。
圖2 求解的算法流程圖Fig.2 The flow chart of resolving algorithm
在多Agent 協(xié)同中,易出現(xiàn)過于靈活而可控制性不足的問題,為了提高M(jìn)AS 系統(tǒng)的凝聚力和系統(tǒng)可控性,為競技平臺增加動態(tài)約束和調(diào)整系統(tǒng)行為的策略是必要的。通過引入政策導(dǎo)向型多Agent 協(xié)同可以用來增強(qiáng)系統(tǒng)的可控性。
在傳統(tǒng)體育訓(xùn)練中,協(xié)同競技的模擬手段通常受制于實際條件。文中引入信息科學(xué)中的研究方法針對平臺體系對壘的體育競技提出一種協(xié)同競技模型,通過角色Agent 建立情境感知Agent、決策Agent 和功能Agent 實例組織的多Agent系統(tǒng),形成綜合競技平臺模型。彌補(bǔ)了傳統(tǒng)經(jīng)驗體育中協(xié)同實驗的不足。該模型可以用于評估競技個體對整體的影響作用,輔助訓(xùn)練決策,以及競技個體之間相互學(xué)習(xí)的能力結(jié)構(gòu)調(diào)整引起的競技平臺演進(jìn)。從而通過基于多Agent 的協(xié)同手段,為現(xiàn)代體育競技訓(xùn)練培育綜合競技平臺。
[1]楊萍,史小星,李堯.競速機(jī)器人比賽的博弈策略研究[J].機(jī)械設(shè)計,2011,28(3):1-2,5.YANG Ping,SHI Xiao-xing,LI Yao.Research on game stratefies of robots’racing competition[J].Journal of Machiine Design,2011,28(3):1-2,5.
[2]張英波.體能主導(dǎo)類快速力量性項群運動員競技能力狀態(tài)轉(zhuǎn)移的時空協(xié)同理論[J].體育科學(xué),2000,20(4):24-28.ZHANG Ying-bo.The space-time synergy theory in the state transition of athlete’s competitive ability in speed-strength sports group[J].Sport Science,2000,20(4):24-28.
[3]陳志偉.基于Agent的協(xié)同開發(fā)體系[J].東北林業(yè)大學(xué)學(xué)報,2008,36(8):90-91.CHEN Zhi-wei.Cooperative development system based on agent[J].Journal of Northeast Forestry University,2008,36(8):90-91.
[4]劉繼山,王延章.RN理論支持的多Agent協(xié)同業(yè)務(wù)流程建模[J].計算機(jī)應(yīng)用與軟件,2011,28(4):12-16.LIU Ji-shan,WANG Yan-zhang.Multi agent collaborative business processes modeling based on rntheory[J].ComputerApplications and Software,2011,28(4):12-16.
[5]胡軍,李正通.政策導(dǎo)向型多agent 協(xié)同系統(tǒng)研究[J].計算機(jī)應(yīng)用研究,2010,27(8):3009-3012,3015.HU Jun,LI Zheng-tong.Study on policy-oriented multi-agent cooperation system[J].Application Research of Computers,2010,27(8):3009-3012,3015.
[6]呂超,黃炎焱,遲少紅,等.基于MAS的海軍裝備協(xié)同作戰(zhàn)仿真模型[J].江蘇科技大學(xué)學(xué)報:自然科學(xué)版,2010,24(3):273-277.LV Chao,HUANG Yan-yan,CHI Shao-hong,et al.Simulation model of naval equipment cooperative combat based on multi-agent system[J].Journal of Jiangsu University of Science and Technology:Natural Science Edition,2010,24(3):273-277.
[7]史德嘉,王璞.基于MAS協(xié)同的動態(tài)資源優(yōu)化調(diào)度策略研究[J].計算機(jī)應(yīng)用研究,2009,26(11):4063-4065.SHI De-jia,WANG Pu.Research on resource allocation algorithm based on MAS cooperative bidding game [J].Application Research of Computers,2009,26(11):4063-4065.
[8]夏慶軍,張安,張耀中.戰(zhàn)斗機(jī)編隊協(xié)同作戰(zhàn)效能評估研究[J].系統(tǒng)仿真學(xué)報,2010,22(9):2182-2184,2189.XIA Qing-jun,ZHANG An,ZHANG Yao-zhong.Study on effectiveness evaluation of fighter plane formation cooperative combat[J].Journal of System Simulation,2010,22(9):2182-2184,2189.