朱旭光, 徐真英
(浙江師范大學 體育與健康科學學院,浙江 金華 321004)
籃球比賽是在籃球競賽規(guī)則允許下,雙方教練員通過賽前“偵察謀劃、進行決策”,賽中“調兵遣將、運用策略”[1],場上場下密切溝通配合,上演的一場兵對兵、將對將,力爭在掌控制勝因素的各個方面或主要方面超過或抑制對手,在執(zhí)行制勝策略過程中取得最大或最佳效益的集體對抗行為的過程.博弈是研究人們在一定的環(huán)境和規(guī)則下,如何選擇行為和策略,以期達到最優(yōu)的結果[2].博弈的任務主要是研究策略和行為的選擇問題,因此,把博弈的原理運用到籃球比賽教練員的決策中就顯得十分有意義.再者,籃球比賽是一個多因素、長時間、多起伏、多變數(shù)的對弈過程,教練員在臨場比賽中決策的細微失誤都有可能導致整場比賽的失利.如,在斧山亞運會上,中國隊與韓國隊的比賽中,中國隊上半時領先20多分,下半時一路低迷,最后輸?shù)袅吮荣?相反,若教練員能在臨場比賽中正確地使用戰(zhàn)術決策,就有可能使原本處于不利的態(tài)勢變?yōu)橛欣膽B(tài)勢.在籃球比賽中教練員臨場決策的科學性、準確性及戰(zhàn)術運用的精細化都顯得非常重要.目前,很多教練員在臨場指揮中憑經驗和感覺進行戰(zhàn)術決策和調兵譴將,經常會發(fā)生戰(zhàn)術決策失誤.為了使籃球比賽臨場的決策科學合理,減少決策失誤,筆者試圖從博弈論的理論和原理出發(fā),闡述籃球比賽的決策問題,為教練員科學地臨場指揮提供參考.
“博弈”是一個中國古已有之的特有名詞.清人劉寶楠說:“博,百戲也,弈,圍棋也,博以擲采,而后行棋.后人不行棋而擲采,遂稱擲采為博”.“博,古代的一種棋戲,后來泛指賭博;弈,指圍棋或下棋”.博實際上是一種按一定的規(guī)則要求來區(qū)分勝負的活動,也包含著游戲中的策略選擇[3].
我國古代有一個非常有名的運用計謀的故事“齊威王與田忌賽馬”[4].主要是講田忌的謀士孫臏如何運用計謀幫助田忌以弱勝強戰(zhàn)勝齊威王的故事.規(guī)則是:雙方各出3匹馬,一對一比賽3場,每一場的輸方要賠500 kg銅給贏方.齊威王的3匹馬和田忌的3匹馬按實力可分為上、中、下3等.由于齊威王的上、中、下3匹馬都分別比田忌的3匹馬略勝一籌,因此田忌每次都是連輸3場,要輸?shù)? 500 kg銅.實際上,田忌的上馬雖不如齊威王的上馬,但比齊威王的中馬和下馬都要好;同樣,田忌的中馬要比齊威王的下馬要好一些.田忌的謀士孫臏給田忌出了個主意,即:用下馬對齊威王的上馬;上馬對齊威王的中馬,中馬對齊威王的下馬.這樣,雖然第1場田忌必輸無疑,但后2場田忌都贏,2勝1負,這樣田忌反而贏500 kg銅[3].這個例子說明,在實力和條件不如對手時,利用有利條件和對自己實力的巧妙和周密的部署和調度,常常會出現(xiàn)與常規(guī)相反的結果.
博弈就是競爭雙方的對抗與算計.如兩人下棋就屬于博弈,雙方每走一步,都要分析預測對方可能應對的招數(shù),分析招數(shù)越多,預測得越準確,就越有可能在競爭中取勝.博弈包括3個因素:第一,博弈的參與者即博弈方;第二,各博弈方選擇的行為和策略;第三,博弈方在博弈的各種局勢下所獲的得益[2].非合作型博弈研究對象大部分是零和博弈,即兩人博弈,這一方贏一招,就意味著另一方輸一招,雙方的凈得益為零.納什均衡是指當參與人選定某種行動時,其選擇行動所產生的結果優(yōu)于選擇其他任何行動所得的結果,那么,其所選定行動產生的結果就為納什均衡[2].
首先,籃球比賽是雙方球隊在籃球場上的競爭過程,一方進攻成功意味著另一方防守失??;一方防守成功意味著另一方進攻失敗,雙方的利益是對立的.根據(jù)博弈方的利益是否相同可分為合作與非合作博弈,籃球比賽雙方球隊之間的博弈屬非合作博弈.其次,根據(jù)博弈方在博弈中所獲得的信息多少分為完全信息博弈和不完全信息博弈.完全信息博弈為博弈方所獲得的信息完全相同,即雙方之間信息為透明.不完全信息博弈為博弈方所獲得信息不相等,即雙方之間信息為不透明;籃球比賽雙方教練員所獲得的信息是不對等的,屬不完全信息博弈.第三,在一場40 min或48 min的籃球比賽中,教練員根據(jù)比賽的態(tài)勢針對性地布置戰(zhàn)術、不停變換戰(zhàn)術,以求保持比分領先或改變被動的比賽局面.教練員在比賽中的戰(zhàn)術決策,是根據(jù)臨場比賽的時間進程、本隊和對方隊的技戰(zhàn)術的運用效果等因素為依據(jù)而制定的,雙方教練員在比賽中的斗智過程是在動態(tài)中進行的屬動態(tài)博弈.可見,籃球比賽是一種非合作、不完全的信息動態(tài)博弈.
斗獸游戲中“克星循環(huán)”是象、獅、虎、豹、狗、狼、貓、鼠各種動物,象能吃獅、虎、豹、狗、狼、貓,但卻被鼠吃;獅能吃虎、豹、狗、狼、貓、鼠,但要被象吃等.這是一種很古老的中國傳統(tǒng)的斗獸游戲,大象可以戰(zhàn)勝其他一切動物,然而卻斗不過老鼠,老鼠斗不過其他一切動物,卻能戰(zhàn)勝大象.就實力來講,大象最強而老鼠最弱,而老鼠能戰(zhàn)勝大象[4].在籃球比賽中這種弱隊戰(zhàn)勝強隊的現(xiàn)象不勝枚舉,其原因無外乎教練員運用了正確的決策.雖然籃球比賽是以實力制勝的,運動員在臨場比賽中通過教練員布置的策略和戰(zhàn)術發(fā)揮已具有的競爭實力,但是在臨場比賽中教練員的決策往往成為比賽取勝的關鍵因素.如果強隊在比賽中教練員決策錯誤,全隊競爭實力就會大打折扣.反之弱隊在比賽中決策正確會使全隊的競爭實力提升,就會出現(xiàn)“老鼠吃大象”的現(xiàn)象.如在2005年東亞運動會籃球半決賽中,中國隊以60比68負于日本隊,無緣進入決賽.從預賽的戰(zhàn)績看,中國隊預賽成績是6戰(zhàn)全勝,而日本隊6場比賽是3勝3負,中國隊在預賽中以70比57輕松戰(zhàn)勝日本隊,說明日本隊與中國隊在實力上有一定差距.中國隊負于日本隊的原因從表面上看有隊員心理上輕視、技術發(fā)揮失常等原因,其實質是中國隊教練員在臨場戰(zhàn)略戰(zhàn)術決策上失誤造成的.更重要的是日本隊在臨場比賽中戰(zhàn)術運用合理正確,把握了制勝中國隊的一些關鍵因素的結果.
決策是在各種備選策略中選擇一個最符合實際情況、最可能達到利益最大化、又最能體現(xiàn)決策者目標的一個判斷與決定過程[3].在具體的決策中有2種決策方式:一種是盲目決策,盲目決策是當決策者面臨一個待決策的問題時,決策者憑直覺、主觀臆斷等因素確定出一個方案;另一種是理性決策,理性決策是決策者對他所面臨的各個方案進行周密的分析、計算并比較各個策略帶來的后果及實現(xiàn)這些后果的可能性,從中選擇出能夠給決策者帶來最大好處的策略.在瞬息萬變、錯綜復雜的籃球臨場比賽指揮中,教練員的決策是理性決策占主導地位.根據(jù)籃球比賽的規(guī)律,教練員在籃球比賽中可分為賽前決策和賽中決策.賽前決策是教練員根據(jù)對手的各種情況,包括運動員的競技狀況、技戰(zhàn)術使用情況、運動員的體能、心理等,再根據(jù)本隊的比賽任務和目標,經過教練員的分析、判斷等確定比賽方案.賽中決策是教練員根據(jù)雙方球隊的當前比賽態(tài)勢及比賽的發(fā)展狀況而確立的下一步比賽方案.
2.2.1 貝葉斯博弈原理在籃球比賽賽前對對手首發(fā)陣容預測的分析
籃球比賽賽前對對手信息的獲取是制定本隊戰(zhàn)略戰(zhàn)術的基礎,通過獲取的信息用貝葉斯公式進行計算可以準確地預測對手的重要信息.貝葉斯原理是在不完全信息的情況下,利用部分已知事件發(fā)生的概率,用貝葉斯公式對發(fā)生事件的概率進行修正,最后估算事件發(fā)生的概率.也就是用先驗概率通過貝葉斯公式估算事件的后驗概率.先驗概率是根據(jù)經驗及有關材料推測出的概率;后驗概率是用已知的先驗概率通過貝葉斯公式進行計算后得到的概率.2個事件的貝葉斯公式為
其中:p(g/dg)為發(fā)生G事件的后驗概率;p(g)為G事件的先驗概率;p(dg/g)為發(fā)生G事件的參數(shù);p(b)為B事件的先驗概率;p(db/g)為發(fā)生B事件的參數(shù).在籃球比賽賽前決策中,教練員對對手的信息掌握顯得極為重要,是確立本場比賽的策略、戰(zhàn)術打法的基礎.良好的開端是成功的一半,比賽的開局戰(zhàn)術打法反映了教練員對整場比賽策略的定位和思路.比賽的開局戰(zhàn)術打法首先反映了首發(fā)陣容的確定,因為不同的陣容代表著不同的戰(zhàn)術打法.預知對手的首發(fā)陣容就意味著掌握對手整場比賽戰(zhàn)術策略信息,為本隊制定戰(zhàn)術對策有著極其重要的意義.
例如,雅典奧運會上中國隊與塞黑隊的比賽,這場比賽是中國隊的第5場比賽,是中國隊在小組賽的最后一場比賽,雙方球隊在小組賽中都是3負1勝,誰贏得比賽誰就進入前8名,無論對于中國隊還是塞黑隊都是非常關鍵的比賽.中國隊在前4場比賽中的首發(fā)陣容分別是:與西班牙隊比賽是姚明、劉偉、李楠、朱芳雨、易建聯(lián);與新西蘭隊比賽是姚明、劉偉、李楠、朱芳雨、莫科;與阿根廷隊的比賽是姚明、劉偉、李楠、朱芳雨、易建聯(lián);與意大利隊比賽是姚明、劉偉、李楠、朱芳雨、莫科.前4場比賽中國隊首發(fā)陣容中姚明為4場,劉偉為4場,李楠為4場,朱芳雨為4場,易建聯(lián)為2場,莫科為2場.前4場比賽姚明、劉偉、李楠、朱芳雨首發(fā)概率100%.也就是第5場比賽的先驗概率為100%,如果沒有意外的情況(如受傷、生病等)發(fā)生,根據(jù)公式,第5場比賽首發(fā)的后驗概率也為100%.第5場比賽姚明、劉偉、李楠、朱芳雨為首發(fā)是肯定的.那么,莫科和易建聯(lián)那一個為首發(fā)?根據(jù)貝葉斯公式:
莫科成為首發(fā)的先驗概率為p(g)=0.5,易建聯(lián)成為首發(fā)的先驗概率為p(b)=0.5,再通過莫科和易建聯(lián)成為首發(fā)的參數(shù),就可以求出2隊員成為首發(fā)的后驗概率.2隊員成為首發(fā)的參數(shù)可用前4場比賽中2隊員的上場比賽的時間和比賽總時間的比值來表示.因為2隊員為同一位置,哪位運動員實力強或對本隊的貢獻大,該隊員上場比賽的時間就多.用聯(lián)賽中隊員上場比賽的時間為公式中的偏好參數(shù)符合籃球比賽實際情況.莫科4場比賽的總時間為99′58″,占總時間的62.5%,易建聯(lián)為58′37″,占總時間的36.2%.用貝葉斯公式可求出莫科成為首發(fā)的后驗概率為0.63,易建聯(lián)為0.37,莫科成為首發(fā)隊員的后驗概率大于易建聯(lián).實際上第5場與塞黑隊的比賽,中國隊的首發(fā)陣容為姚明、劉偉、李楠、朱芳雨、莫科,計算與實際相符合.
2.2.2 精煉貝葉斯均衡原理在籃球比賽賽中教練員戰(zhàn)術決策的運用分析
籃球比賽的賽中是教練員不斷發(fā)現(xiàn)對手的弱點和尋找制勝對手辦法的過程,精煉貝葉斯均衡就是在博弈中最優(yōu)策略的產生過程[2].精煉貝葉斯均衡是不完全信息動態(tài)博弈的均衡,動態(tài)博弈的特點是后行動者能觀察到前行動者的行動,了解前行動者所有信息.均衡也稱納什均衡,是當博弈參與人在博弈中采用最優(yōu)策略時博弈就達均衡.精煉貝葉斯均衡是完全信息動態(tài)博弈的子博弈均衡與不完全信息靜態(tài)博弈的貝葉斯均衡的結合.具體地說,精煉貝葉斯均衡是所有博弈參與人信念和戰(zhàn)略的一種結合.它滿足2個條件:第一,在所有的博弈參與人的戰(zhàn)略類型信念中,該參與人的戰(zhàn)略類型選擇是最優(yōu)的;第二,所有的博弈參與人的戰(zhàn)略類型可用貝葉斯法則(原理)預測到[2].如“黔驢技窮”是一個典型的精煉貝葉斯均衡的例子.貴州省的老虎從來沒有見過驢子,不知道驢子到底有多大本事,老虎采取的方法是不斷接近驢子進行試探,通過試探不斷修正自己對驢子的看法,從而根據(jù)試探的結果選擇自己的策略,老虎見驢子沒有什么反映,認為驢子本領不大,接著聽見驢子大叫,又認為驢子本領很大.老虎通過進一步的試探,發(fā)現(xiàn)驢子的最大本領是踢踢腳而已.最后,老虎通過不斷地試探,認為驢子沒有什么本領,就選擇沖上去把驢子吃掉的策略,這顯然是老虎的最優(yōu)策略.從老虎與驢子的博弈中發(fā)現(xiàn),開始老虎對驢子是不了解的,不知道驢子的本事,它們之間的博弈是不完全信息的博弈.老虎通過不斷地行動嘗試逐步了解驢子的狀況,也就是老虎和驢子雙方之間不斷地進行行為和策略的博弈,老虎在不斷獲得驢子的各種信息中,逐步認識了驢子,從而不斷地修正自己的行動和策略,最終選擇吃掉驢子的最優(yōu)策略,使老虎和驢子之間的博弈達到均衡.
籃球比賽雙方球隊之間的博弈是教練員之間策略的對抗過程.籃球比賽是由比賽的開局階段、中間階段和最后階段組成.中間階段由比分領先、相持和落后階段組成[5].在比賽的開局階段,教練員通常通過觀察并逐步了解對方球隊的各種狀況,包括戰(zhàn)術、隊員的實力、競技狀況、教練員的指揮風格等.教練員通過觀察比賽和了解對手,逐步形成戰(zhàn)勝對手的理念,并不斷修正,初步形成取勝的決策;在比賽的中間階段,根據(jù)雙方比分的狀況、及雙方隊員的競技狀況、技戰(zhàn)術的使用效果等,不斷完善策略;在比賽的最后階段即比賽的關鍵時刻,教練員經常會形成戰(zhàn)勝對手的最優(yōu)策略,達到博弈的精煉貝葉斯均衡.總之,教練員的臨場指揮是教練員不斷尋找戰(zhàn)勝對手的策略,通過運動員在比賽中不斷實施反饋,教練員不斷修正策略,最終獲得戰(zhàn)勝對手的最優(yōu)策略.
在通常情況下,教練員根據(jù)比賽的態(tài)勢通過各種戰(zhàn)術策略的變化,獲得戰(zhàn)勝對手的策略.在比賽中,我們經常會觀察到某隊不論在第3節(jié)、第4節(jié)還是最后階段都有一個“小高潮”出現(xiàn),比賽的勝負就沒有懸念.比賽“高潮”的出現(xiàn)說明某隊戰(zhàn)術效果的最優(yōu)化.比賽中如果觀察到某隊在同一場比賽中出現(xiàn)幾個“高潮”,則從博弈理論上解釋,博弈出現(xiàn)了幾個納什均衡,也就是說籃球比賽的博弈不止是一個最優(yōu)策略;如果一場籃球比賽沒有出現(xiàn)一個“高潮”,那么,從博弈理論上解釋,博弈可能沒有納什均衡,也就是說博弈也有可能沒有最優(yōu)策略.但在籃球比賽中教練員也可能未獲得最優(yōu)策略,他們之間的博弈未達到精煉貝葉斯均衡.
2.2.3 博弈中的最大最小化原則在臨場指揮戰(zhàn)術選定中的運用
籃球比賽中教練員之間的戰(zhàn)術博弈,不管教練員采用什么戰(zhàn)術行動,都將使其選擇的行動對對方損失盡可能地大,也就是本方戰(zhàn)術效果最優(yōu)化,并且使自己損失盡可能小.這就是博弈中的最大最小化原則[2].在籃球比賽中要使戰(zhàn)術產生最大化原則,首先,是球隊擁有足夠多的戰(zhàn)術和陣容變化,且有非常好的戰(zhàn)術質量和實際運用效果;第二,對對方隊的戰(zhàn)術質量和戰(zhàn)術弱點有足夠的認識和了解,使本隊戰(zhàn)術使用具有針對性;第三,對比賽場上比賽態(tài)勢的認知及比賽的進程和發(fā)展有清醒的認識,避免戰(zhàn)術選定發(fā)生差錯,這樣才能使教練員在選定戰(zhàn)術和變換陣容時,使本隊的戰(zhàn)術效果達到最大化.最小化原則主要是對本隊的戰(zhàn)術和陣容的細微弱點準確認識,使本隊在戰(zhàn)術變化中避免戰(zhàn)術的弱點,使本隊戰(zhàn)術使用的損失達到最小.再者善于捕捉引起比賽態(tài)勢變化的微小信號,才能使本隊在戰(zhàn)術選定和使用的效果最優(yōu)化,而使本隊戰(zhàn)術選定和使用的損失達到最小,才能掌控比賽的局勢.
為使自己的戰(zhàn)術行動達到最大最小化的效果,教練員對比賽的進程、雙方運動員在比賽時的競技狀況、比賽的態(tài)勢、雙方球隊的戰(zhàn)術使用特點等等與比賽有關的各種信息都要全面地掌握和判斷,并進行評估和決策,才能使選定的戰(zhàn)術得益達到最大化.如在第14屆世界男籃錦標賽南斯拉夫隊和阿根廷隊冠亞軍決賽中,南斯拉夫隊和阿根廷隊在前4節(jié)比賽中兩隊比分打平,進入決勝期比賽,南斯拉夫隊在決勝期的比賽中判若兩隊,防守戰(zhàn)術改用縮小半場人盯人防守,進攻采用控制節(jié)奏,能快則快,陣地進攻打成功率,進攻成功率和防守成功率明顯提高,在決勝期的比賽中打出12比4的比分,掌控了比賽的局面,輕松戰(zhàn)勝阿根廷隊,而阿根廷隊的進攻和防守戰(zhàn)術和第4節(jié)一樣沒有變化,阿根廷隊的進攻成功率和防守成功率明顯降低,打出了4比12的比分.按照博弈的最大最小化原理,南斯拉夫隊的戰(zhàn)術行動使自己獲得了極大的得益12,使自己產生極小的損失4.反之,阿根廷隊的戰(zhàn)術行動的得益為4,損失為12.
博弈的得益是參加博弈的各個博弈人從博弈中所獲得的利益[2].它是各博弈方對行為和策略進行選擇和獲得實施的效果,也就是各博弈方在博弈的各種局勢下的收益.籃球比賽的博弈得益是雙方球隊使用進攻、防守戰(zhàn)術所得的利益[6],它標志著球隊戰(zhàn)術和策略的使用效果,反映著球隊戰(zhàn)術和策略使用時機是否正確;它也標志著隊員技術合理運用及隊員間相互配合的結果,反映著球隊隊員間戰(zhàn)術配合的質量,關系著球隊在比賽中主動權的掌握.
首先,籃球比賽是雙方球隊的對抗過程,比賽的勝負與球隊的戰(zhàn)術策略的使用密切相關.如果球隊使用的策略戰(zhàn)術符合比賽的實際情況,具有針對性,球隊就會得到較好的戰(zhàn)術效果;反之,如果球隊使用的策略戰(zhàn)術不符合比賽的實際情況,球隊就會得到較差的戰(zhàn)術效果.第二,根據(jù)零和(非合作兩人)博弈得益原理,兩博弈人的得益之和為零.在籃球比賽雙方球隊的博弈中,球隊一方的進攻成功率較高,意味著對方防守成功率較低;同樣一方的防守成功率較高,意味著對方進攻成功率較低.第三,籃球比賽的結果是以球隊雙方進攻、防守的成功率來衡量的;進攻的成功率就是進攻戰(zhàn)術的得益,防守的成功率就是防守戰(zhàn)術的得益,進攻和防守效果的好壞就是全隊策略的優(yōu)劣.得益大于對方說明策略或戰(zhàn)術使用效果優(yōu)于對方,得益小于對方說明戰(zhàn)術使用效果劣于對方.籃球比賽博弈的得益包括進攻得益、防守得益和戰(zhàn)術總得益,具體見表1.表1中:a為本方進攻戰(zhàn)術得益,a0為對方進攻戰(zhàn)術得益;b為本方防守戰(zhàn)術得益,b0為對方防守戰(zhàn)術得益;r為本方總戰(zhàn)術得益,r0為對方總戰(zhàn)術得益.
表1 籃球比賽戰(zhàn)術得益情況及戰(zhàn)術調整一覽表
注:表1是根據(jù)戰(zhàn)術的得益狀況來研究是否調整戰(zhàn)術,也就是在2隊實力相當,隊員狀態(tài)相近,比分較接近的情況下研究戰(zhàn)術調整問題.如在特殊的情況下,要采用特殊的戰(zhàn)術調整(特殊情況下戰(zhàn)術調整本文暫不研究).
籃球比賽是雙方教練員的博弈過程,籃球比賽的博弈是非合作不完全信息動態(tài)博弈;在比賽中只要掌握了制勝對手的關鍵因素,弱隊是可以戰(zhàn)勝強隊的.在籃球比賽的賽前準備中用貝葉斯公式可以預測對手首發(fā)陣容,從而能使教練員在賽前獲得準確和充分的信息;在賽中運用精煉貝葉斯均衡原理可以提升教練員戰(zhàn)術決策的有效性;用最大最小化原理有助于教練員戰(zhàn)術策略的準確性;用博弈的得益原理有助于教練員改變和調整戰(zhàn)術.
參考文獻:
[1]曹冬.《再論孫子兵法》與籃球比賽臨場指揮理念[J].北京體育大學學報,2003,26(3):181-182.
[2]馬丁J.博弈論教程[M].奧斯本,魏玉根,譯.北京:中國社會科學出版社,2000.
[3]潘天群.博弈思維[M].北京:北京大學出版社,2005.
[4]李益群,謝亞龍.體育博弈論[M].北京:北京體育大學出版社,2002.
[5]全國體育學院教材編審委員會.籃球[M].北京:人民體育出版社,1991.
[6]徐真英,朱旭光.籃球隊隊員之間協(xié)作的博弈分析[J].浙江師范大學學報:自然科學版,2005,28(1):88-91.