本刊記者 楊 嬌
博引數(shù)理之長 踐析現(xiàn)下之意
本刊記者 楊 嬌
張博宇
博弈,本論棋之然也。博弈之道,貴乎謹(jǐn)嚴(yán)。法曰:“寧失一子,勿失一先?!痹娫疲骸般枫沸⌒?,如臨于谷?!鞭恼撸粻幎员U叨鄤?,務(wù)殺而不顧者多敗。因敗而思者,其勢進(jìn);戰(zhàn)勝而驕者,其勢退。求己弊不求人之弊者,益;攻其敵而不知敵之攻己者,損。
以弈度人,人生而靜,其情難見;感物而動,然后可辨。
人是世界上最復(fù)雜的動物,人和其他動物的最大區(qū)別在于人會真正意義上的思考,人腦的運(yùn)作機(jī)理遠(yuǎn)比世界上最精密的儀器還要復(fù)雜萬倍。如何理解人的行為,則是比物理、化學(xué)、生物這些自然科學(xué)更為困難的問題。博弈論就是一門專門解釋和預(yù)測人的行為的科學(xué)。它不同于心理學(xué),心理學(xué)以人的行為動機(jī)為研究著眼點(diǎn),博弈論則立足于人的行為本身,通過建立數(shù)學(xué)模型解析個體間的相互作用,在考慮別人可能行為的同時,研究自身的最優(yōu)策略,為復(fù)雜場景下的決策提供合理的科學(xué)依據(jù)。
“傳統(tǒng)博弈論一般更多關(guān)注個體的行為,并且假設(shè)人的行為完全理性,也就是說人們總是基于利益最大化原則進(jìn)行決策。作為傳統(tǒng)博弈論的進(jìn)一步發(fā)展,我們的研究是從真實(shí)個體的行為出發(fā),以有限理性為基礎(chǔ),研究宏觀系統(tǒng)的變化規(guī)律?!北本煼洞髮W(xué)數(shù)學(xué)科學(xué)學(xué)院副教授張博宇這樣向記者解釋道。張博宇從事博弈論研究多年,他的主要研究是將演化博弈方法和實(shí)驗(yàn)經(jīng)濟(jì)學(xué)方法相結(jié)合,分析不同激勵機(jī)制對合作的促進(jìn)作用以及社會網(wǎng)絡(luò)結(jié)構(gòu)對個體和群體行為的影響。
有些選擇一旦決定便為人生埋下了種子。張博宇與北京師范大學(xué)的緣分由來已久。自小學(xué)起,他就在北京師范大學(xué)參加奧林匹克數(shù)學(xué)學(xué)習(xí),高考第一志愿進(jìn)入北京師范大學(xué)后,于2006年在數(shù)學(xué)科學(xué)學(xué)院獲學(xué)士學(xué)位,2009年在數(shù)學(xué)科學(xué)學(xué)院獲應(yīng)用數(shù)學(xué)碩士學(xué)位。碩士畢業(yè)后,他被國家公派至奧地利維也納大學(xué)數(shù)學(xué)系進(jìn)行博士學(xué)習(xí)。2012年獲博士學(xué)位后,他便又回到北京師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院工作,且在2015年被破格晉升為副教授,成為學(xué)院最年輕的副教授。同樣,出于對人類行為研究的興趣,張博宇接觸博弈論后逐漸深入其中,進(jìn)而將其確立為主要研究方向,決意一探究竟。在博弈論研究過程中,張博宇由聚而發(fā),由點(diǎn)到面,將研究范圍擴(kuò)大化,在實(shí)驗(yàn)經(jīng)濟(jì)學(xué)、復(fù)雜網(wǎng)絡(luò)和生物數(shù)學(xué)等多方向均有涉及,曾先后在PNAS, Games and Economic Behavior,Experimental Economics, Journal of Mathematical Economics等國際著名學(xué)術(shù)期刊上發(fā)表論文30余篇。
近年來,張博宇更是在博弈論和實(shí)驗(yàn)經(jīng)濟(jì)學(xué)研究中取得了多項(xiàng)有意義的成果,如激勵機(jī)制對合作行為的影響,其他機(jī)制對合作行為的促進(jìn),帶網(wǎng)絡(luò)結(jié)構(gòu)的演化動態(tài),帶有決策隨機(jī)性的演化動態(tài),從眾行為的演化,公平行為的演化等。從理論和實(shí)驗(yàn)多角度論證了在促進(jìn)合作方面,制度性懲罰優(yōu)于制度性獎勵;比較了個體間懲罰和制度性懲罰的效率和穩(wěn)定性,從中理解政府機(jī)構(gòu)如何在人類社會中被自發(fā)建立起來;研究討論了決策方式為帶隨機(jī)性的最優(yōu)反應(yīng)均衡時的均衡選擇問題,給出非對稱協(xié)調(diào)博弈中不同決策誤差函數(shù)下,均衡選擇的一般性判據(jù);分析了不同網(wǎng)絡(luò)結(jié)構(gòu)上不同學(xué)習(xí)模型對應(yīng)的演化動態(tài),考察了網(wǎng)絡(luò)結(jié)構(gòu)特征對行為演化的影響……一系列的發(fā)現(xiàn)、發(fā)展讓當(dāng)初埋下的種子發(fā)芽生根并深深地扎入土壤。
枯燥、反復(fù)的數(shù)學(xué)推導(dǎo)難免會陷入行為思維僵化,對科研人員的思路創(chuàng)新產(chǎn)生阻礙。談及遇到瓶頸時如何突破,張博宇回答的是理論和實(shí)驗(yàn)相結(jié)合,“理論研究遇到了困難就去做實(shí)驗(yàn),正好用實(shí)驗(yàn)去驗(yàn)證理論方法是否正確”。博弈行為實(shí)驗(yàn)的被試對象大都是具有相似背景的在校大學(xué)生,實(shí)驗(yàn)地點(diǎn)也一般選取在學(xué)校的機(jī)房。實(shí)驗(yàn)通過計(jì)算機(jī)網(wǎng)絡(luò)平臺實(shí)現(xiàn),每名被試者都需要使用計(jì)算機(jī)打開網(wǎng)頁,登陸實(shí)驗(yàn)系統(tǒng)完成一系列模擬真實(shí)場景的簡單游戲。在游戲中不同的選擇被賦予不同的分值,被試者的選擇直接影響其得分情況,且最后會根據(jù)實(shí)驗(yàn)中的得分獲得相應(yīng)的金錢報酬。分析實(shí)驗(yàn)數(shù)據(jù),提取行為特征,建立理論模型,調(diào)整相關(guān)參數(shù),再次實(shí)驗(yàn)驗(yàn)證,直至達(dá)到預(yù)期效果。張博宇坦言,這種實(shí)驗(yàn)和理論間的互動似乎已經(jīng)成為研究常態(tài)。
一項(xiàng)工作從事久了很容易對思維模式產(chǎn)生影響,例如與數(shù)據(jù)打交道會對數(shù)字的敏感度高,文字工作者則表現(xiàn)在對語言表達(dá)的準(zhǔn)確方面比較較真。有關(guān)人類行為的研究工作帶給生活的變化,張博宇是這樣答記者問的:“生活中會思考更多的人們行為和制度的設(shè)置的合理性,比如說上下班高峰期的出行選擇、學(xué)校的績效激勵機(jī)制設(shè)置,我都會從博弈的角度想想是否合理。”科研似乎更像一種習(xí)慣,融入了他的生活。
科學(xué)研究的終極目的是解決實(shí)際問題,理解人們行為的最終目的是提出方案或建議使人類社會變得更加美好。能否成功預(yù)測真實(shí)人群的行為是張博宇對研究工作最功用、最具指導(dǎo)意義的評判標(biāo)準(zhǔn)。只有具備了準(zhǔn)確的預(yù)測能力,才能夠?qū)⒗碚摵蛯?shí)驗(yàn)研究中得到的成果在現(xiàn)實(shí)中進(jìn)行應(yīng)用和推廣。
張博宇及其所在團(tuán)隊(duì)主要采用實(shí)際數(shù)據(jù)和理論方法相結(jié)合的方式,來完成研究工作。研究路線大致分為三步:首先,通過實(shí)驗(yàn)和實(shí)證方法得到真實(shí)個體的行為數(shù)據(jù),根據(jù)這些數(shù)據(jù)建立起個體的決策模型;然后,基于個體決策模型推導(dǎo)出群體的宏觀演化規(guī)律,找到影響宏觀系統(tǒng)演化的關(guān)鍵參數(shù);最后,通過調(diào)整這些參數(shù)來引導(dǎo)人們優(yōu)化自身行為,進(jìn)而實(shí)現(xiàn)社會收益最大化。以如何合理設(shè)立獎懲機(jī)制促進(jìn)合作為例,張博宇給出了細(xì)致的實(shí)驗(yàn)布局:最初是通過實(shí)驗(yàn)檢驗(yàn)人們不同情境下對不同獎勵或懲罰的反應(yīng),識別出幾類典型的行為特征;進(jìn)而建立起群體面對不同激勵時的宏觀演化模型,提出理論上效果最好的激勵參數(shù);最終經(jīng)過實(shí)驗(yàn)和實(shí)證檢驗(yàn)修正后的激勵機(jī)制,確定其在實(shí)際中能否更加有效的促進(jìn)合作。
要使研究更有意義,更貼近現(xiàn)實(shí),就需要在模型中盡可能多的考慮進(jìn)真實(shí)因素。例如,以往對群體行為的研究一般假設(shè)參與人均勻混合,不同個體間進(jìn)行博弈的機(jī)會均等。但是在真實(shí)社群中,不同人之間的相互作用機(jī)會并非完全均等,并且一些人的社會關(guān)系會明顯多于其他人。一般意義下這種特征可以通過復(fù)雜網(wǎng)絡(luò)方法表示。張博宇在國家自然科學(xué)基金項(xiàng)目中,以具有網(wǎng)絡(luò)結(jié)構(gòu)的演化博弈動力學(xué)為研究課題,分析了社會關(guān)系網(wǎng)絡(luò)、經(jīng)濟(jì)關(guān)系網(wǎng)絡(luò)、信息傳播網(wǎng)絡(luò)等如何對個體和群體的行為演化產(chǎn)生影響,構(gòu)建了包含不同類型網(wǎng)絡(luò)結(jié)構(gòu)的演化博弈動態(tài)模型,深入分析了網(wǎng)絡(luò)結(jié)構(gòu)特征對宏微觀系統(tǒng)的影響。這些結(jié)果對博弈理論的完善和發(fā)展做出了極具意義的貢獻(xiàn),同時也為解釋網(wǎng)絡(luò)時代的經(jīng)濟(jì)現(xiàn)象提供了新的理論視角和分析方法。
此外,張博宇還在多項(xiàng)實(shí)際應(yīng)用類項(xiàng)目中擔(dān)任負(fù)責(zé)人的角色。例如在承接中體彩科技發(fā)展有限公司的體育彩票分析項(xiàng)目中,對不同類型的彩票游戲中海量的購買信息進(jìn)行了數(shù)據(jù)挖掘,提取出了人們的投注行為特征,然后以此為基礎(chǔ)模擬了不同彩票游戲在不同銷量情況下的期望收益,并評估了可能存在的風(fēng)險。而在另一項(xiàng)衛(wèi)生行業(yè)專項(xiàng)基金中,根據(jù)近幾十年來的生境和種群監(jiān)控?cái)?shù)據(jù),張博宇參與建立了多個疫源地的動物鼠疫預(yù)測模型,提出了關(guān)鍵預(yù)警指標(biāo)以及風(fēng)險分級和風(fēng)險控制方案。
無論是博弈論的基礎(chǔ)研究還是在其他行業(yè)實(shí)際應(yīng)用中,張博宇都能找準(zhǔn)自己的位置。十年磨一劍,求學(xué)至今,他沒有過多的感慨,對目前的工作狀態(tài)尚還滿意,但求今后穩(wěn)扎穩(wěn)打地走好每一步??蒲械牟┺模松牟┺?,穩(wěn)中求勝。