楊嬌
博弈,本論棋之然也。博弈之道,貴乎謹嚴。法曰:“寧失一子,勿失一先?!痹娫疲骸般枫沸⌒模缗R于谷?!鞭恼撸粻幎员U叨鄤?,務殺而不顧者多敗。因敗而思者,其勢進;戰(zhàn)勝而驕者,其勢退。求己弊不求人之弊者,益;攻其敵而不知敵之攻己者,損。
以弈度人,人生而靜,其情難見;感物而動,然后可辨。
人是世界上最復雜的動物,人和其他動物的最大區(qū)別在于人會真正意義上的思考,人腦的運作機理遠比世界上最精密的儀器還要復雜萬倍。如何理解人的行為,則是比物理、化學、生物這些自然科學更為困難的問題。博弈論就是一門專門解釋和預測人的行為的科學。它不同于心理學,心理學以人的行為動機為研究著眼點,博弈論則立足于人的行為本身,通過建立數學模型解析個體間的相互作用,在考慮別人可能行為的同時,研究自身的最優(yōu)策略,為復雜場景下的決策提供合理的科學依據。
“傳統(tǒng)博弈論一般更多關注個體的行為,并且假設人的行為完全理性,也就是說人們總是基于利益最大化原則進行決策。作為傳統(tǒng)博弈論的進一步發(fā)展,我們的研究是從真實個體的行為出發(fā),以有限理性為基礎,研究宏觀系統(tǒng)的變化規(guī)律?!北本煼洞髮W數學科學學院副教授張博宇這樣向記者解釋道。張博宇從事博弈論研究多年,他的主要研究是將演化博弈方法和實驗經濟學方法相結合,分析不同激勵機制對合作的促進作用以及社會網絡結構對個體和群體行為的影響。
當初的選擇 如今的扎根
有些選擇一旦決定便為人生埋下了種子。張博宇與北京師范大學的緣分由來已久。自小學起,他就在北京師范大學參加奧林匹克數學學習,高考第一志愿進入北京師范大學后,于2006年在數學科學學院獲學士學位,2009年在數學科學學院獲應用數學碩士學位。碩士畢業(yè)后,他被國家公派至奧地利維也納大學數學系進行博士學習。2012年獲博士學位后,他便又回到北京師范大學數學科學學院工作,且在2015年被破格晉升為副教授,成為學院最年輕的副教授。同樣,出于對人類行為研究的興趣,張博宇接觸博弈論后逐漸深入其中,進而將其確立為主要研究方向,決意一探究竟。在博弈論研究過程中,張博宇由聚而發(fā),由點到面,將研究范圍擴大化,在實驗經濟學、復雜網絡和生物數學等多方向均有涉及,曾先后在PNAS, Games and Economic Behavior, Experimental Economics, Journal of Mathematical Economics等國際著名學術期刊上發(fā)表論文30余篇。
近年來,張博宇更是在博弈論和實驗經濟學研究中取得了多項有意義的成果,如激勵機制對合作行為的影響,其他機制對合作行為的促進,帶網絡結構的演化動態(tài),帶有決策隨機性的演化動態(tài),從眾行為的演化,公平行為的演化等。從理論和實驗多角度論證了在促進合作方面,制度性懲罰優(yōu)于制度性獎勵;比較了個體間懲罰和制度性懲罰的效率和穩(wěn)定性,從中理解政府機構如何在人類社會中被自發(fā)建立起來;研究討論了決策方式為帶隨機性的最優(yōu)反應均衡時的均衡選擇問題,給出非對稱協(xié)調博弈中不同決策誤差函數下,均衡選擇的一般性判據;分析了不同網絡結構上不同學習模型對應的演化動態(tài),考察了網絡結構特征對行為演化的影響……一系列的發(fā)現、發(fā)展讓當初埋下的種子發(fā)芽生根并深深地扎入土壤。
枯燥、反復的數學推導難免會陷入行為思維僵化,對科研人員的思路創(chuàng)新產生阻礙。談及遇到瓶頸時如何突破,張博宇回答的是理論和實驗相結合,“理論研究遇到了困難就去做實驗,正好用實驗去驗證理論方法是否正確”。博弈行為實驗的被試對象大都是具有相似背景的在校大學生,實驗地點也一般選取在學校的機房。實驗通過計算機網絡平臺實現,每名被試者都需要使用計算機打開網頁,登陸實驗系統(tǒng)完成一系列模擬真實場景的簡單游戲。在游戲中不同的選擇被賦予不同的分值,被試者的選擇直接影響其得分情況,且最后會根據實驗中的得分獲得相應的金錢報酬。分析實驗數據,提取行為特征,建立理論模型,調整相關參數,再次實驗驗證,直至達到預期效果。張博宇坦言,這種實驗和理論間的互動似乎已經成為研究常態(tài)。
一項工作從事久了很容易對思維模式產生影響,例如與數據打交道會對數字的敏感度高,文字工作者則表現在對語言表達的準確方面比較較真。有關人類行為的研究工作帶給生活的變化,張博宇是這樣答記者問的:“生活中會思考更多的人們行為和制度的設置的合理性,比如說上下班高峰期的出行選擇、學校的績效激勵機制設置,我都會從博弈的角度想想是否合理?!笨蒲兴坪醺褚环N習慣,融入了他的生活。
理論與實際的結合
科學研究的終極目的是解決實際問題,理解人們行為的最終目的是提出方案或建議使人類社會變得更加美好。能否成功預測真實人群的行為是張博宇對研究工作最功用、最具指導意義的評判標準。只有具備了準確的預測能力,才能夠將理論和實驗研究中得到的成果在現實中進行應用和推廣。
張博宇及其所在團隊主要采用實際數據和理論方法相結合的方式,來完成研究工作。研究路線大致分為三步:首先,通過實驗和實證方法得到真實個體的行為數據,根據這些數據建立起個體的決策模型;然后,基于個體決策模型推導出群體的宏觀演化規(guī)律,找到影響宏觀系統(tǒng)演化的關鍵參數;最后,通過調整這些參數來引導人們優(yōu)化自身行為,進而實現社會收益最大化。以如何合理設立獎懲機制促進合作為例,張博宇給出了細致的實驗布局:最初是通過實驗檢驗人們不同情境下對不同獎勵或懲罰的反應,識別出幾類典型的行為特征;進而建立起群體面對不同激勵時的宏觀演化模型,提出理論上效果最好的激勵參數;最終經過實驗和實證檢驗修正后的激勵機制,確定其在實際中能否更加有效的促進合作。
要使研究更有意義,更貼近現實,就需要在模型中盡可能多的考慮進真實因素。例如,以往對群體行為的研究一般假設參與人均勻混合,不同個體間進行博弈的機會均等。但是在真實社群中,不同人之間的相互作用機會并非完全均等,并且一些人的社會關系會明顯多于其他人。一般意義下這種特征可以通過復雜網絡方法表示。張博宇在國家自然科學基金項目中,以具有網絡結構的演化博弈動力學為研究課題,分析了社會關系網絡、經濟關系網絡、信息傳播網絡等如何對個體和群體的行為演化產生影響,構建了包含不同類型網絡結構的演化博弈動態(tài)模型,深入分析了網絡結構特征對宏微觀系統(tǒng)的影響。這些結果對博弈理論的完善和發(fā)展做出了極具意義的貢獻,同時也為解釋網絡時代的經濟現象提供了新的理論視角和分析方法。
此外,張博宇還在多項實際應用類項目中擔任負責人的角色。例如在承接中體彩科技發(fā)展有限公司的體育彩票分析項目中,對不同類型的彩票游戲中海量的購買信息進行了數據挖掘,提取出了人們的投注行為特征,然后以此為基礎模擬了不同彩票游戲在不同銷量情況下的期望收益,并評估了可能存在的風險。而在另一項衛(wèi)生行業(yè)專項基金中,根據近幾十年來的生境和種群監(jiān)控數據,張博宇參與建立了多個疫源地的動物鼠疫預測模型,提出了關鍵預警指標以及風險分級和風險控制方案。
無論是博弈論的基礎研究還是在其他行業(yè)實際應用中,張博宇都能找準自己的位置。十年磨一劍,求學至今,他沒有過多的感慨,對目前的工作狀態(tài)尚還滿意,但求今后穩(wěn)扎穩(wěn)打地走好每一步。科研的博弈,人生的博弈,穩(wěn)中求勝。