張若楓
(中國(guó)人民公安大學(xué),北京 100038)
“博弈”的英文原意是“游戲”(game),指豐富多彩的對(duì)抗性游戲。博弈論研究的是如何在“策略互動(dòng)”的局勢(shì)中尋找到局中人的最佳行為方式,使其獲得最大收益。[1]偵查人員應(yīng)當(dāng)是一名“理性的”博弈參與者,在訊問(wèn)過(guò)程中的每一步行動(dòng),都從犯罪嫌疑人的實(shí)際利益出發(fā),分析其在目前所處的情境下有哪些策略可以選擇,這些策略的后果將帶給他多少效用,并據(jù)此推測(cè)和影響訊問(wèn)對(duì)象將會(huì)做出的選擇。博弈論可以提供一種理性的、科學(xué)的訊問(wèn)方法,如果在實(shí)踐中加以推廣,便可以和其他訊問(wèn)策略一樣起到提高訊問(wèn)效率、減少非法訊問(wèn)的作用。
博弈規(guī)則(rule)是對(duì)博弈如何進(jìn)行所做的完整定義,它包括三個(gè)關(guān)鍵點(diǎn):行為、時(shí)間與信息。[2]筆者認(rèn)為,博弈規(guī)則相比其他要素(博弈參與者、博弈結(jié)局與博弈效用)具有更強(qiáng)的動(dòng)態(tài)性和影響力,明確其投射在偵查訊問(wèn)活動(dòng)中的特殊規(guī)定性是建模分析前的必要準(zhǔn)備,即厘清參與人有什么樣的行動(dòng)可供選擇,其行動(dòng)順序如何,以及每個(gè)參與人行動(dòng)時(shí)所依據(jù)的信息。
偵查訊問(wèn)中的博弈參與人(偵查人員與嫌疑人)都是可以獨(dú)立做出決定的實(shí)體,在訊問(wèn)中的某一時(shí)刻,他們有兩個(gè)以上的行動(dòng)可供選擇,所有這些選擇就構(gòu)成了一個(gè)行動(dòng)集(action set),即全部行動(dòng)的集合。
對(duì)于偵查人員而言,其行動(dòng)集可能包含的元素有:各種合法訊問(wèn)手段、進(jìn)行非法訊問(wèn)、收集有關(guān)證據(jù)、放棄訊問(wèn),甚至包括與嫌疑人“合作”。我國(guó)刑事訴訟法對(duì)于偵查人員的這些選擇做出了嚴(yán)格規(guī)范和限制。比如,對(duì)訊問(wèn)人員的人數(shù)、時(shí)間、地點(diǎn)、程序等的規(guī)定,這些規(guī)定加大了訊問(wèn)人員采取違規(guī)行為可能產(chǎn)生的不利后果。一般而言,偵查人員的博弈結(jié)果無(wú)非是獲得口供與未獲得口供。在獲得口供的結(jié)果下,偵查人員成功完成任務(wù),并給結(jié)案、移送起訴提供了重要證據(jù),其所得效用=口供的價(jià)值-為了獲取口供而付出的偵查、訊問(wèn)成本。在未獲得口供的結(jié)果下,偵查人員的所得效用=0-偵查訊問(wèn)成本-其他相關(guān)損失(如社會(huì)評(píng)價(jià)降低等)。因此有的偵查人員選擇永續(xù)付出偵查成本,希望最終能獲得口供以抵消自己的損失;有的偵查人員選擇盡早的不作為,為的是把損失控制在一定范圍內(nèi);還有少部分的偵查人員選擇與嫌疑人勾結(jié),用個(gè)人私利的擴(kuò)大來(lái)平衡自己在工作中的損失。
對(duì)于嫌疑人而言,其行動(dòng)集當(dāng)中包含的元素主要有供認(rèn)和抵賴。供認(rèn)是基于如實(shí)供述意愿下的陳述,包括自認(rèn)和自白;抵賴是為了逃避罪責(zé)而做出的非真實(shí)供述,包括否認(rèn)、謊供、沉默等。相應(yīng)的,嫌疑人采取上述行動(dòng)產(chǎn)生的博弈結(jié)果可能有:“供認(rèn)—被從輕處罰”“抵賴—被處罰”“抵賴—被釋放”。我國(guó)尚未賦予嫌疑人沉默權(quán),嫌疑人任何形式的“抵賴”行動(dòng)都是不被法律認(rèn)可的。此外,“坦白從寬,抗拒從嚴(yán)”的刑事政策和認(rèn)罪認(rèn)罰從寬制度也承諾,如果嫌疑人供認(rèn)罪行,其獲得的效用將大于抵賴。這些都是推動(dòng)嫌疑人選擇供述的“激勵(lì)”。但是,仍有很多嫌疑人選擇“抵賴”,這是因?yàn)樗麄冋J(rèn)為在偵查人員獲取的證據(jù)并不確實(shí)、充分的情況下,他的“抵賴”可能被偵查人員誤判為一種正當(dāng)?shù)摹盁o(wú)罪辯解”,或者案件可能由于口供的缺失而不了了之,自己由此得以釋放,免于刑罰處罰。這種“抵賴—被釋放”的結(jié)局當(dāng)然能夠?yàn)槠鋷?lái)最大化的效用。但是,一旦在沒(méi)有口供的情況下定案,嫌疑人的效用將會(huì)從最大值跌至谷底,他將因抵賴行為而承擔(dān)更加不利的后果,這是嫌疑人選擇抵賴需要承擔(dān)的風(fēng)險(xiǎn)。
各個(gè)參與人的行動(dòng)相互結(jié)合就構(gòu)成了行動(dòng)組合(action profile),如果偵查人員在行動(dòng)集當(dāng)中選擇了合法訊問(wèn),嫌疑人選擇了供認(rèn),那么這個(gè)行動(dòng)組合就是(合法訊問(wèn),供認(rèn))——這也是對(duì)于偵查人員而言最理想的博弈結(jié)果。但是訊問(wèn)實(shí)踐遠(yuǎn)非如此簡(jiǎn)單,參與人的各個(gè)行動(dòng)之間往往相互依存、復(fù)雜曲折、連續(xù)發(fā)生,這樣,訊問(wèn)中的行動(dòng)組合就可能存在無(wú)限多個(gè)。
博弈有靜態(tài)與動(dòng)態(tài)之分,靜態(tài)博弈的特點(diǎn)是參與者一次性的同時(shí)采取行動(dòng),或者雖有先后,但他們?cè)谛袆?dòng)時(shí)并不知道其他參與人采取的行動(dòng)。比如,嫌疑人之間在不知道同伙所選行動(dòng)的條件下做出決策,這可以被視為沒(méi)有先后順序的靜態(tài)博弈。而博弈往往是多輪、反復(fù)、漸進(jìn)的。在每次交鋒之后,各參與人所掌握的信息狀態(tài)都會(huì)有所變化,他們將會(huì)根據(jù)這些新掌握的信息調(diào)整各自的行動(dòng)、做出下一步的選擇。在偵查訊問(wèn)中,偵查人員與嫌疑人之間動(dòng)態(tài)博弈的行動(dòng)順序可以抽象為以下幾步:
①偵查人員首先責(zé)令嫌疑人就案件進(jìn)行陳述。
②嫌疑人按照事先計(jì)劃的利益最大化方案進(jìn)行應(yīng)對(duì)。
③偵查人員根據(jù)嫌疑人的陳述,尋找、揭露其中的矛盾,對(duì)其進(jìn)行進(jìn)一步訊問(wèn)。
④嫌疑人根據(jù)偵查人員的問(wèn)題,推測(cè)其對(duì)案件的偵查進(jìn)度,根據(jù)自身利益最大化原則,重新調(diào)整自己的防御體系,做出回應(yīng)。
⑤偵查人員根據(jù)嫌疑人的新反應(yīng),調(diào)整訊問(wèn)方案,返回步驟③。
訊問(wèn)實(shí)踐中的情況是復(fù)雜的,嫌疑人抵賴手段和偵查人員訊問(wèn)方法的多樣性可能會(huì)打破二者的行動(dòng)順序。一般狀態(tài)下,訊問(wèn)中的行動(dòng)順序就是雙方交替行動(dòng)、螺旋式的動(dòng)態(tài)進(jìn)行的。
博弈信息是參與者關(guān)于博弈中各種變量值的“知識(shí)”。在博弈信息中有一類被稱為“公共信息”——這類信息是每個(gè)參與人都知道的,而且每個(gè)參與人都知道其他參與人都是知道的。在訊問(wèn)中,公共信息主要包括理性和法律規(guī)定?!袄硇浴笔侵覆┺牡膮⑴c人都知道彼此是理性的,即嫌疑人的最大利益是逃避或減輕刑罰,偵查人員所追求的是千方百計(jì)獲取口供?!胺梢?guī)定”是指國(guó)家公開(kāi)宣布的、普及率較高的規(guī)定,如對(duì)于罪與非罪的界定等。
然而,在博弈中能夠改變參與人收益的只有私人信息,即只有部分參與人知道或根本無(wú)人知曉的信息。如果參與人對(duì)某個(gè)變量值的“知識(shí)”是確切的,那么他便擁有完美信息,反之則稱為不完美信息。例如,對(duì)于作案工具的藏匿地點(diǎn)這個(gè)變量,如果偵查人員明確的知道具體地點(diǎn)在哪兒,那么他在這個(gè)方面的信息就是完美的,如果他對(duì)此毫無(wú)頭緒或者在幾個(gè)地點(diǎn)之間進(jìn)行猜測(cè),那么他擁有的就是不完美信息。博弈中大量存在的是不完美信息,各參與人都會(huì)試圖讓自己的信息完美化,由此得以在博弈中占據(jù)更大的優(yōu)勢(shì)。
在每個(gè)博弈人的心中都有一個(gè)行動(dòng)指南,它詳細(xì)列出了通往目標(biāo)的每一步可能出現(xiàn)的情況及在這些情況下應(yīng)該采取的行動(dòng)。具體而言,偵查人員在每一次訊問(wèn)前都需要考慮嫌疑人對(duì)于偵查進(jìn)度的了解程度、他會(huì)有哪些可能的反應(yīng),這些反應(yīng)會(huì)給其帶來(lái)怎樣的效用。相對(duì)應(yīng)的,嫌疑人面對(duì)訊問(wèn)做出反應(yīng)前也在推測(cè)偵查人員對(duì)案件的偵查進(jìn)度、可能采取的訊問(wèn)方法及其后果。
構(gòu)建偵查訊問(wèn)的博弈模型,能夠簡(jiǎn)潔直觀地展現(xiàn)訊問(wèn)中的各類博弈行為的實(shí)質(zhì)。為此,有學(xué)者引用“囚徒困境”的經(jīng)典模型,構(gòu)建了共犯和對(duì)合犯之間的博弈模型[3];有學(xué)者基于辯訴交易的視角推導(dǎo)出偵查機(jī)關(guān)與被訊問(wèn)人之間的靜態(tài)博弈支付矩陣[4];另有學(xué)者提出了犯罪嫌疑人與法律道德之間的博弈情形[5]??梢?jiàn)先前研究成果主要集中在靜態(tài)博弈行為的建模上,而筆者將“靜態(tài)”視為“動(dòng)態(tài)”的片段,試圖完整呈現(xiàn)偵查人員與犯罪嫌疑人之間依次輪流行動(dòng)的動(dòng)態(tài)博弈過(guò)程。
偵查人員與嫌疑人之間的整個(gè)博弈過(guò)程一般是多輪的、動(dòng)態(tài)的,但如果單獨(dú)對(duì)其中某一次交鋒進(jìn)行研究的話,它又可以被看成是靜態(tài)的。博弈論中,通常使用策略式的建模方法描述多個(gè)參與人同時(shí)、一次性的決策問(wèn)題,也有學(xué)者把它稱之為“規(guī)范式”或“戰(zhàn)略式”博弈。
在訊問(wèn)博弈中,理性的嫌疑人總是會(huì)選擇抵賴,但是,在實(shí)踐中,嫌疑人抵賴到底的情況并不多見(jiàn),“坦白從寬,抗拒從嚴(yán)”的刑事政策及其配套的法律制度就是重要原因之一,它使嫌疑人愿意為自己的現(xiàn)實(shí)利益走一步保守的棋——以供述換取較輕的刑罰。同時(shí),這也促使偵查人員選擇“承諾從寬”,理性的偵查人員不會(huì)無(wú)謂地?cái)U(kuò)大訊問(wèn)成本,這也體現(xiàn)了偵查效率與刑罰之間在適度范圍內(nèi)進(jìn)行互換的法理原意。
如表1支付矩陣所示,如果嫌疑人要求只有給自己從寬量刑才能供述,偵查人員同意給予從寬,則可以得到口供,獲利為10,同時(shí)嫌疑人獲得從寬,效用為-5;偵查人員不同意給予從寬,雙方效用都降到最低值:嫌疑人未獲得從寬,效用為-10,偵查人員得不到口供效用為0。因此“只要嫌疑人要求,就給予從寬”是偵查人員的優(yōu)勢(shì)行動(dòng)。如果嫌疑人沒(méi)有要求從寬而供述,不論偵查人員是否預(yù)備給予從寬,結(jié)果都是嫌疑人沒(méi)有獲得從寬,效用為-10;偵查人員獲得了口供,獲利為10。由此可見(jiàn)嫌疑人從寬的要求“不提白不提”,“要求供述從寬”是嫌疑人的優(yōu)勢(shì)行動(dòng)。所以(要求供述從寬,從寬)就成為了這個(gè)博弈的納什均衡行動(dòng)組合(在矩陣中用下劃線標(biāo)注出來(lái))。這種“討價(jià)還價(jià)”的現(xiàn)象在訊問(wèn)中其實(shí)并不罕見(jiàn),嫌疑人提出供述的條件,如果在法律允許的范圍內(nèi),偵查人員的最佳行動(dòng)就是給予滿足,這樣的行動(dòng)組合就可以帶來(lái)納什均衡,雙方的得利也都能達(dá)到最優(yōu)。
表1 偵查人員與嫌疑人的博弈支付矩陣
在整個(gè)訊問(wèn)過(guò)程中,偵查人員與嫌疑人之間的決策往往有先有后,交替進(jìn)行,如果采用之前的矩陣表示法,就難以體現(xiàn)博弈的順序和各時(shí)點(diǎn)的行動(dòng)及其效用,所以在研究中通常采用“博弈樹(shù)”來(lái)演繹此類動(dòng)態(tài)博弈。在博弈樹(shù)中,各個(gè)結(jié)點(diǎn)代表參與人必須做出行動(dòng)時(shí)的位置,初始結(jié)點(diǎn)是博弈的開(kāi)始,用空心圓點(diǎn)表示,其他結(jié)點(diǎn)用實(shí)心圓點(diǎn)表示;每個(gè)箭頭代表參與者可以選擇的行動(dòng),這是博弈樹(shù)的分支;數(shù)字向量代表博弈的結(jié)束和各參與者的收益。這種描述方法被稱為“展開(kāi)式”或“擴(kuò)展式”。
筆者將偵查人員與嫌疑人在訊問(wèn)中的對(duì)決回合加以抽象,得到以下模型(如圖1所示)。在這個(gè)模型中,“犯”代表嫌疑人,“警”代表偵查人員,數(shù)字向量中的第一個(gè)數(shù)字代表嫌疑人的收益,第二個(gè)數(shù)字代表偵查人員的收益。博弈是從嫌疑人采取行動(dòng)開(kāi)始的,對(duì)于偵查人員而言,最大效用為10,即嫌疑人一開(kāi)始就自愿供述了罪行,案件順利了結(jié),偵查人員幾乎沒(méi)有付出成本就完成了任務(wù);而此時(shí)嫌疑人也會(huì)因供述態(tài)度好而受到從輕處罰,所得為-5。但是,大多數(shù)嫌疑人在訊問(wèn)剛開(kāi)始時(shí)都會(huì)為了逃避刑罰而選擇抵賴,如果這時(shí)偵查人員選擇不作為,案件不了了之,那么他工作失利,所得為-5,而嫌疑人卻將因此被釋放,得到了最大收益10。偵查人員如果選擇繼續(xù)偵查,那么將會(huì)導(dǎo)致兩種可能:一是通過(guò)偵查獲取了定案的充分證據(jù),這時(shí)嫌疑人再選擇抵賴,就會(huì)因“抗拒從嚴(yán)”政策而被從重判刑,所得效用為-10,如果嫌疑人轉(zhuǎn)而供述了罪行,將會(huì)獲得-8。偵查人員在這種情況下無(wú)論如何都會(huì)成功結(jié)案,所得為正,但是由于其付出了一定的偵查成本,所以收益由10降到了8。第二種可能是,偵查人員沒(méi)能獲取充分證據(jù)而放棄了繼續(xù)偵查,嫌疑人便會(huì)無(wú)罪釋放,所得為8,偵查人員之前的偵查投入付之東流,所得為-8。在訊問(wèn)中還有一類較常見(jiàn)的現(xiàn)象,即翻供。事實(shí)上,翻供可以被看成嫌疑人再次選擇了抵賴,結(jié)果又陷入了偵查人員是選擇不作為還是選擇繼續(xù)偵查的循環(huán)。
圖1 偵查人員與嫌疑人的動(dòng)態(tài)博弈模型
由這個(gè)動(dòng)態(tài)模型圖可以看出,當(dāng)嫌疑人選擇供述時(shí),偵查人員應(yīng)盡快固定證據(jù)并結(jié)案,以免嫌疑人翻供,這是偵查成本最小化的選擇。而面對(duì)嫌疑人的抵賴,偵查人員不會(huì)輕言放棄,因?yàn)橹挥谐晒善瓢讣拍転槠鋷?lái)正收益,而且,隨著偵查工作的深入,偵查人員就越發(fā)不傾向于放棄,因?yàn)樗麄儾辉赋惺苤巴度朕D(zhuǎn)換為純負(fù)收益的得不償失。相應(yīng)的,犯罪嫌疑人也明白偵查人員肯定不會(huì)善罷甘休,原則上講,只要偵查投入足夠大,就能夠收集到充分的證據(jù),因此與其承擔(dān)接受從嚴(yán)處罰的巨大風(fēng)險(xiǎn),不如盡早地用供述折抵應(yīng)受的刑罰。
博弈支付矩陣中的數(shù)字代表著參與人在所選策略下將獲得的利益,獲利的大小很有可能改變均衡解的位置,主導(dǎo)整個(gè)博弈的結(jié)局。因此,偵查人員應(yīng)當(dāng)從嫌疑人的利益著眼,將其供述和抵賴兩種策略下的支付函數(shù)向著有利于訊問(wèn)進(jìn)行的方向調(diào)整。
1.優(yōu)化嫌疑人對(duì)各種策略現(xiàn)實(shí)收益的評(píng)價(jià)
在訊問(wèn)中,嫌疑人最關(guān)心的還是所判刑罰的輕重。偵查人員不是法官,無(wú)法決定量刑大小,但是法律也賦予了其一定的控制力,主要體現(xiàn)在自首、立功等刑事政策等。這些法律、政策規(guī)定得以在訊問(wèn)中充分發(fā)揮作用的關(guān)鍵在于其可信性,嫌疑人只有相信偵查人員所宣講的規(guī)則,才能真正調(diào)整自己的利益分配格局。甚至有學(xué)者提出,偵查人員和犯罪嫌疑人之間的信任危機(jī)是將導(dǎo)致博弈論運(yùn)用受限[5],為了解決這個(gè)問(wèn)題,一方面,偵查人員要在法定范圍內(nèi)給出承諾或威脅,否則會(huì)損害偵查人員的權(quán)威,強(qiáng)化嫌疑人背離供述策略的動(dòng)機(jī);另一方面,法律和政策的可信性可以依靠執(zhí)行反饋機(jī)制來(lái)證明,政策如約兌現(xiàn)的真實(shí)案例會(huì)形成一種潛在的“口碑效應(yīng)”,最終影響本案嫌疑人對(duì)此抱有的信任程度,因此,偵查人員應(yīng)從長(zhǎng)遠(yuǎn)利益出發(fā),努力促成各項(xiàng)承諾或威脅的兌現(xiàn)。
2.優(yōu)化嫌疑人對(duì)各種策略心理收益的評(píng)價(jià)
傳統(tǒng)經(jīng)濟(jì)學(xué)認(rèn)為“理性人”是現(xiàn)實(shí)的、自私的,把為了江湖義氣而拒絕供述等“感情用事”的行為歸于不理性,但是人與人之間的情感、在某個(gè)群體中的地位、以及實(shí)現(xiàn)自己的“理想”也可以作為一種行為動(dòng)機(jī)。這種特殊的動(dòng)力機(jī)制是通過(guò)某種需要缺失所帶給自身的不平衡感而驅(qū)動(dòng)人采取某種活動(dòng)的。嫌疑人如果不肯供述團(tuán)伙的作案信息,可能是因?yàn)樗枰ㄟ^(guò)這種“寧死不屈”來(lái)維持自己對(duì)于所在團(tuán)伙的情感平衡,出賣(mài)朋友反而會(huì)造成不安。這種心理上的平衡與不平衡,與刑期多少等現(xiàn)實(shí)利益一樣,都是嫌疑人的“得與失”,同樣可以成為其效用的一部分,筆者稱其為“心理支付函數(shù)”。為此,偵查人員應(yīng)采取相應(yīng)的對(duì)策,削弱嫌疑人對(duì)各種亞文化情感的心理預(yù)期,同時(shí)喚醒被其忽視淡漠的主流道德情感,比如揭露黑幕、夸大團(tuán)伙內(nèi)部矛盾;又如,共同回憶嫌疑人早年的事跡和榮譽(yù)、例舉與其情況相似的例子,必要時(shí)可動(dòng)用家庭和社會(huì)的力量進(jìn)行規(guī)勸,等等。
除了情感因素,采取供述或抵賴的“心理支付函數(shù)”還取決于說(shuō)謊帶來(lái)的焦慮以及供述產(chǎn)生的尊嚴(yán)貶低。國(guó)外的理論實(shí)踐就此提出了一些具體的操作方法,如偵查人員說(shuō)出自己對(duì)嫌疑人實(shí)施該犯罪行為的原因的推測(cè),從而為嫌疑人提供一個(gè)可以在道德上為自己開(kāi)脫的理由;又如偵查人員通過(guò)加強(qiáng)與嫌疑人的目光交流,從而強(qiáng)化嫌疑人的心理壓力以及想要擺脫這種局面的渴望,等等[6]。
3.引導(dǎo)嫌疑人在優(yōu)化后的利益結(jié)構(gòu)下進(jìn)行理性推理
上述這些宣講法律政策和實(shí)施心理策略的對(duì)策僅可以從“實(shí)體”上優(yōu)化嫌疑人對(duì)供述和抵賴兩種策略的利益評(píng)價(jià),偵查人員還需要在“流程”上推動(dòng)嫌疑人在這種優(yōu)化了的利益結(jié)構(gòu)下,進(jìn)行理性推理。建構(gòu)推理時(shí),偵查人員可以建議嫌疑人跳出自己的處境,以旁觀者的眼光審視自己,并把可選策略作為單獨(dú)的情形分別進(jìn)行分析:如果選擇供述將會(huì)得到什么;如果選擇抵賴將會(huì)得到什么。這樣,更有助于嫌疑人進(jìn)行客觀分析,做出理性決策。
理性的嫌疑人在決策前會(huì)縝密地分析偵查人員在沒(méi)有口供的情況下是否能夠定案,即其他證據(jù)是否已掌握的確實(shí)、充分。有學(xué)者把嫌疑人對(duì)于證據(jù)的認(rèn)識(shí)概率引入博弈,即假定其確信證據(jù)已經(jīng)充分的可能性為A%,認(rèn)為只有當(dāng)“供述的效用*A%-抵賴的效用*(1-A%)>0①”時(shí),嫌疑人才會(huì)選擇供述[7];還有的學(xué)者認(rèn)為,只有當(dāng)“對(duì)坦白從寬政策的信賴度*被從寬處理的獲利+定罪證據(jù)可獲得性*被從重處罰的損失-(1-定案證據(jù)可獲得性)*被釋放的獲利>0②”時(shí),嫌疑人就會(huì)選擇招認(rèn)[8](②式中“定罪證據(jù)可獲得性”即為①中的A%)。這是有一定道理的,但是很多研究都證明,人是“厭惡損失”的。嫌疑人在面臨可能被判處刑罰這種重大損失進(jìn)行決策時(shí),不一定會(huì)保持嚴(yán)格的理性,即①式和②式中左邊的部分即使等于零或小于零,嫌疑人也很有可能選擇供述。所以,筆者認(rèn)為引入概率未必能得出模型的精確解,但是,嫌疑人對(duì)于定案概率的估計(jì)值確能影響其決策:估計(jì)值越大,對(duì)供述的傾向性越強(qiáng)。從這一點(diǎn)著眼,偵查人員可以采取以下對(duì)策:
其一,加大取證投入,掌握優(yōu)勢(shì)信息。取證確實(shí)會(huì)增大偵查人員的成本投入,不如直接依靠口供完善其他證據(jù)所得的效率高,但是,理性的偵查人員必須承認(rèn),取證成本的投入必然提高訊問(wèn)效率,尤其是在嫌疑人僥幸心理較強(qiáng)、訊問(wèn)陷入僵局的情況下,把工作重心向收集其他證據(jù)上轉(zhuǎn)移無(wú)疑是上策。一個(gè)極端的情況就是,如果偵查人員對(duì)證據(jù)的掌握程度達(dá)到可以“零口供定案”的標(biāo)準(zhǔn),那么其在訊問(wèn)中的優(yōu)勢(shì)地位則是絕對(duì)的:只需要將證據(jù)一一出示,造成泰山壓卵之勢(shì),促使獲取嫌疑人供述如探囊取物一般。
其二,充分發(fā)揮證據(jù)對(duì)訊問(wèn)的作用,減少博弈成本。偵查人員的博弈智慧主要體現(xiàn)在其如何能使證據(jù)效用最大化,即以較少的證據(jù)獲得最多最真實(shí)的口供。為了提高證據(jù)使用的效率,偵查人員要隱藏證據(jù)“底牌”,多用雙關(guān)語(yǔ)、含蓄詞匯、反襯語(yǔ)、反話正說(shuō)、體態(tài)語(yǔ)等,暗示嫌疑人,精選使用證據(jù)的時(shí)機(jī)[9],捕捉嫌疑人說(shuō)辭與證據(jù)矛盾的內(nèi)容,揭穿其謊言。
其三,制造“證據(jù)已經(jīng)確實(shí)充分”的錯(cuò)覺(jué)。即便在證據(jù)欠缺的情況下,偵查人員同樣可以通過(guò)情境、語(yǔ)言等方面的策略,使嫌疑人形成“鐵證如山”的判斷,從而做出供述。比如,偵查人員經(jīng)過(guò)周密部署,安排數(shù)輛警車(chē)開(kāi)道、多家媒體云集,“大排場(chǎng)”地將嫌疑人押解到訊問(wèn)地點(diǎn),訊問(wèn)過(guò)程中偵查人員沉著堅(jiān)定,同時(shí)進(jìn)行全程錄音錄像。在這樣的情境下,嫌疑人將很可能因此感到罪證確鑿,而迅速做出供述的決定。
納什均衡是一種非合作博弈的解,在納什均衡的策略組合下,任何參與人單獨(dú)改變策略都會(huì)遭受損失,因此是一種相對(duì)穩(wěn)定的狀態(tài),博弈的目的即是為了達(dá)到納什均衡。訊問(wèn)中的納什均衡點(diǎn)落在嫌疑人選擇供述的結(jié)局上,既有其必然性,又有產(chǎn)生的規(guī)律性。偵查人員應(yīng)當(dāng)相信,有效的對(duì)策和持續(xù)的投入終將獲得嫌疑人的供述,對(duì)于納什均衡點(diǎn)應(yīng)本著尊重其規(guī)律、靜候其出現(xiàn)的態(tài)度。但與此同時(shí),納什均衡點(diǎn)的出現(xiàn)又有一定的“可控性”,偵查人員應(yīng)當(dāng)充分發(fā)揮主觀能動(dòng)性,進(jìn)行捕捉和控制。
首先,敏銳觀察嫌疑人在訊問(wèn)中的細(xì)微變化。處于“臨界狀態(tài)”的嫌疑人必定在心理上進(jìn)行著異常激烈的斗爭(zhēng),并通過(guò)相應(yīng)的外部表現(xiàn)顯露出來(lái),如呼吸急促、肌肉抽動(dòng)、額頭冒汗、吞咽唾液、語(yǔ)音低而顫等,這些都是納什均衡點(diǎn)出現(xiàn)前的典型征兆,如果偵查人員捕捉到了這些細(xì)節(jié),那么說(shuō)明嫌疑人的心理防線已經(jīng)接近崩潰邊緣,稍微加大攻勢(shì)便可獲得“均衡”。
其次,運(yùn)用已有證據(jù)和邏輯推導(dǎo),尋找嫌疑人“辯解”中的矛盾點(diǎn)。揭露嫌疑人的謊言是打擊其拒絕供述心理的有效方法之一,謊言被揭穿的一刻也就是嫌疑人形成供述“臨界狀態(tài)”之時(shí)。揭露謊言要從尋找嫌疑人口供中的矛盾點(diǎn)入手,常見(jiàn)的有口供前后的矛盾、口供與其他證據(jù)的矛盾,以及口供與客觀事實(shí)的矛盾。[10]
再次,選擇突破口,設(shè)計(jì)納什均衡方案。前面兩種方法是被動(dòng)的發(fā)現(xiàn)、尋找納什均衡出現(xiàn)的跡象和條件,而設(shè)計(jì)均衡方案則是主動(dòng)出擊,創(chuàng)造條件“刺激”嫌疑人,逼迫其陷入臨界狀態(tài)。制定均衡方案的關(guān)鍵是選擇突破口,即能夠深深觸動(dòng)嫌疑人,使其由此放棄抵賴的事物,可以是嫌疑人最擔(dān)心的事實(shí)和情節(jié),也可以是其最放心、認(rèn)為最保險(xiǎn)的事實(shí)和情節(jié),甚至可以是對(duì)其有特殊意義的一個(gè)日期,等等。
誠(chéng)然,實(shí)踐中的訊問(wèn)活動(dòng)復(fù)雜多變,博弈論難免存在局限性。比如,博弈論的前提是,要求參與者們專門(mén)為己、唯利是圖,還要求其精打細(xì)算、永不出錯(cuò),始終保持清晰的頭腦,這顯然是很難達(dá)到的。而且,訊問(wèn)是一門(mén)藝術(shù),依靠的是偵查人員豐富的經(jīng)驗(yàn)和敏銳的直覺(jué),單靠循規(guī)蹈矩地應(yīng)用博弈論的操作規(guī)范無(wú)法達(dá)到訊問(wèn)的最高境界。由此可見(jiàn),博弈論并非萬(wàn)能寶典,博弈對(duì)策與其他訊問(wèn)策略、方法一樣,只是獲取口供的眾多路徑之一。