□ 卓 翔 崔世群
2018年10月,習近平總書記在中共中央政治局第九次集體學習時強調,人工智能具有多學科綜合、高度復雜的特征。我們必須加強研判,統(tǒng)籌謀劃,協(xié)同創(chuàng)新,穩(wěn)步推進,把增強原創(chuàng)能力作為重點,以關鍵核心技術為主攻方向,夯實新一代人工智能發(fā)展的基礎。人工智能與司法證據推理的結合是未來的一大發(fā)展趨勢,也是司法人工智能的核心業(yè)務領域。司法證據推理是分析證據基本屬性、運用證據認定案件事實的推理活動。整體而言,證據推理大致分為兩個階段:其一是獲得和分析證據,其二是證成和證明待證事實。(1)張保生編:《證據科學論綱》,經濟科學出版社2019年版,第150頁。一般而言,在司法過程中,法律事實認定就是證據推理的過程。自上世紀威格莫爾《司法證明科學》一書出版之后,為其他學科進入司法證明領域打開缺口,司法證據與證明問題的跨學科研究風起云涌,人工智能與證據推理的結合適逢其會。本文對于證據推理的研究將限定在證成和證明待證事實的部分,但也會對證據信息提取這一證據推理的基礎性環(huán)節(jié)進行探討,因為這一基礎性環(huán)節(jié)決定了證據推理本身是否能夠有效保證公正、準確、無偏見。
人工智能正由淺入深地介入司法裁判之中,從輔助性查詢、審核等簡單、重復性工作,逐漸向具備預測性、決策性、創(chuàng)造性特征的司法證據推理這一人類思維“深水區(qū)”過渡。隨著司法人工智能的發(fā)展,人工智能參與證據推理的底層邏輯,逐漸從人工智能單向輔助司法人員轉向證據推理層面二者之間的交互,“理性交互”是當前與未來人工智能介入司法證據推理的基本定位。本文從人工智能證據推理的司法現狀、技術現狀出發(fā),首先從技術上分析人工智能參與證據推理工作中的“能”與“不能”,繼而基于人工智能的技術特點與司法裁判、證據推理的一般規(guī)律,總結出人工智能輔助司法證據推理的基本原則與具體適用路徑,明確人機“理性交互”的內部運行邏輯和外部邊界。
1970年,布坎南和海德力克共同發(fā)表了《關于人工智能和法律推理的幾點思考》一文,揭開了人工智能與法律推理、司法證據推理等問題交叉研究的新篇章。(2)B. Buchanan,T. Headrick,“Some Speculation about Artificial Intelligence and Legal Reasoning”,Standford Law Review,vol.23,no.40(November 1970),pp.40-62.在美國,人工智能與證據推理的結合研究成為當前證據法學研究領域的顯學,而我國理論界與實務界對人工智能證據推理問題的探索與研究也蓬勃開展。在《國務院關于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知》中重點闡述:“建設集審判、人員、數據應用、司法公開和動態(tài)監(jiān)控于一體的智慧法庭數據平臺,促進人工智能在證據收集、案例分析、法律文件閱讀與分析中的應用,實現法院審判體系和審判能力智能化?!?3)《國務院關于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知》(國發(fā)〔2017〕35號)。人工智能與司法證據推理的交叉研究形成了國內外、政府與民間、司法實踐與理論研究多方聯動的發(fā)展局面。當前,人工智能在證據推理的效率性、準確性、公正性保障方面既有其獨特的優(yōu)勢,也存在短期內難以解決的缺陷和劣勢。因此,在當前階段,仍需明確證據推理中人類法官的主導性地位和人工智能的輔助性定位。
人工智能是計算機科學的一個分支,也是思維科學的應用分支,屬于多學科綜合研究領域,涉及哲學和認知科學、數學、神經生理學、心理學、計算機科學,信息論、控制論、不定性論等學科。人工智能的定義包含“人工”與“智能”兩個部分:“人工”即由人設計,為人創(chuàng)造、制造;(4)鐘義信:《高等人工智能原理: 觀念·方法·模型·理論》,科學出版社2014年版,第39-50頁?!爸悄堋奔慈祟惥衲芰?,大體包括邏輯、語言、空間、音樂、肢體運作、人際與自然探索。(5)“智能”一詞并非沒有爭議,比如,H·加登納在《智能的架構》(Frames of Mind)一書中將人類的“智能”概括為8個范疇:邏輯 (logical)、語言文字(linguistic)、空間(spatial)、音樂(musical)、身體動覺(kinesthetic)、自我認知(intra-personal)、人際(inter-personal)、自然認知(naturalist)。參見H·加登納:《智能的結構》,光明日報出版社1990年版,第81-374頁。綜合而言,人工智能通過將“人類智能”的本質與計算機科學相結合,使智能機器能以“人類智能”相同或相似的方式作出反應,并應用于人類社會的諸多領域。其中,司法領域就是人工智能應用的一大重要領域,例如,司法人工智能通過司法大數據學習和知識圖譜建構,建立量刑預測模型,為刑事案件量刑提供參考,推送以往相似度較高的已決案例,為法官對相似案件的裁判提供參考。(6)胡佳:《人工智能輔助刑事審判的限度》,《政法學刊》,2022年第3期。人工智能司法應用最為核心也是最具挑戰(zhàn)性的部分就是參與司法證據推理。人工智能與證據推理的結合有其必然性。其一,人工智能與證據推理均屬于多學科綜合研究領域,在學科應用范疇上存在廣泛的交叉地帶,包括但不限于心理學、認知科學、數學、思維科學、語言學等,這使二者在研究上具有契合性。其二,人工智能與證據推理具有相同的本質,即揭示、認知、遵循人類思維的規(guī)律與方法,具有認識論層面的一致性,這使二者的結合具備了可行性。其三,人工智能參與證據推理對于司法裁判極具裨益,或可在糾正人類法官思維認知偏差、統(tǒng)一證據標準、提升司法裁判效率、促進公正司法等方面打開新的局面。
支撐人工智能參與司法的底層技術主要包括自然語言識別、邏輯架構設計、知識圖譜構建、大數據訓練等技術,但在當前,上述底層技術的完全實現皆存在較大的技術困境和現實阻礙,例如非結構性、半結構性證據信息識別能力不足,知識圖譜、邏輯架構覆蓋案件類型有限。
這些技術性局限導致了人工智能在司法證據推理中的定位只能是輔助性而非主導性。這也與當前對人工智能的基本認知和普遍定位相一致。輔助性定位具有不同層面的原因:一是在技術層面。目前正處在“弱人工智能”階段,“弱人工智能”不具備完全的自主意識,仍受限于人類控制,難以具備獨立的表意能力和自主意識,因此不具備法律主體資格。(7)孫占利:《智能機器人法律人格問題論析》,《東方法學》,2018年第3期。二是在法理層面。人作為唯一主體是法律存在的前提和基礎,而弱人工智能由于獨立意思表示能力的缺乏和法律倫理的要求,決定了它的非主體性。(8)付其運:《人工智能非主體性前提下侵權責任承擔機制研究》,《法學雜志》,2021年第4期。非主體性的人工智能和主導性裁判者之間自然也存在尚難以逾越的鴻溝。三是在法律實踐層面,民航局印發(fā)的《輕小型民用無人機飛行動態(tài)數據管理規(guī)定》中闡明了運行無人機之相關單位、個人是權利、義務與責任主體,從反面否定了無人機的法律主體地位。在司法實踐中,無論是全國首例人工智能生成文章作品糾紛案——騰訊訴盈訊科技侵害著作權一案,(9)龍衛(wèi)球:《騰訊訴盈訊科技侵害著作權糾紛案——首例人工智能生成文章作品糾紛案》,《人民法院報》,2021年1月9日第4版。還是美國聯邦法院的相關判決,均否定了人工智能的著作權主體資格。
塞爾在《心靈、大腦與程序》(1980年)中提出:弱人工智能只是對認知過程的模擬,程序本身并不具有理解、認知的能力,并無“心智”。強人工智能則是具備“心智”,其具有智力、理解、感知、信念和其他通常歸屬于人類的認知狀態(tài)。在塞爾看來,機器是否具有理解、意識 (自我意識),是衡量人工智能“強”與“弱”的唯一標準。但在之后的發(fā)展過程中,不管是大眾還是人工智能領域的專家,都在借用強人工智能與弱人工智能分類的基礎上,代之以新的標準:弱人工智能就是對人的局部模仿,強人工智能就是對人的全部模仿。(10)梅劍華:《理解與理論:人工智能基礎問題的悲觀與樂觀》,《自然辯證法通訊》,2018年第1期。實則,新標準下的強人工智能既包括計算機要像人一樣做所有的事情,它還須具有塞爾對于強人工智能的定義,即其要具備人類之意識。無論是塞爾的標準,還是新標準,目前的人工智能對于人類技能與自我意識均無法實現完整模擬,仍屬弱人工智能體。
2016年7月中共中央辦公廳、國務院辦公廳印發(fā)并實施的《國家信息化發(fā)展戰(zhàn)略綱要》中提出:服務民主法治建設;實施“科技強檢”,推進檢察工作現代化。建設“智慧法院”,提高案件受理、審判、執(zhí)行、監(jiān)督等各環(huán)節(jié)信息化水平,推動執(zhí)法司法信息公開,促進司法公平正義。根據《國家信息化戰(zhàn)略發(fā)展綱要》要求,最高人民法院與最高人民檢察院提出“智慧法院”與“智慧檢務”建設的行動規(guī)劃,全國各地方法院正如火如荼地推進智慧法院建設,“法律+AI”的發(fā)展趨勢日漸突出。目前,人工智能在智慧法院建設中的運用貫穿整個訴訟過程,人工智能正逐漸深入地介入到案件司法證據推理中來。自2017年始,人工智能與司法裁判、司法證據推理的結合實踐在全國范圍內鋪開,上海“206系統(tǒng)”便是標志性成果,“206系統(tǒng)”根據控辯審三方的發(fā)問,通過對語音信息的識別理解,自動抓取和展示相關證據材料,并可實現證據校驗、證據鏈審查判斷,對案件審理中顯示的證據瑕疵、證據矛盾等進行重點審查。隨后,全國各地司法人工智能系統(tǒng)如雨后春筍般迅速發(fā)展,例如:最高人民法院聯合北京高院推出的“睿法官”智能研判系統(tǒng),通過大數據分析和人工智能對案件證據信息進行整合和分析,對證據分析、證據鏈審查提供輔助性指引與預測。廣州白云區(qū)法院建立起“六智一中心”“三網一平臺”的智慧法院格局,具備了線上證據信息獲取、同類案件分析收集、裁判結果預測指引、裁判文書生成等功能。與公安機關執(zhí)法辦案相結合的“TRS智能輔助辦案系統(tǒng)”,為基層辦案民警提供證據鏈指引、案件分類指引、案件分段指引、案件分情指引,在不同類型、不同階段、不同情形下,均能夠提供證據采集、文書制作等智能化輔助指引,同時,基于圖譜化的數據,根據案件實體進行語義推理,實現案件深層次邏輯校驗、完整性綜合分析,如分析發(fā)現證據不完備、結論存疑、存在矛盾甚至偽造證據等問題。
2018年10月,習近平總書記在十九屆中央政治局第九次集體學習時的講話指出,要加強人工智能同社會治理的結合,開發(fā)適用于政府服務和決策的人工智能系統(tǒng),促進人工智能在公共安全領域的深度應用,加強生態(tài)領域人工智能運用,運用人工智能提高公共服務和社會治理水平。在此指引下,人工智能技術呈梯度性地不斷介入司法裁判、司法證據推理之中。
在人工智能與司法證據推理的結合中,隨著二者的深度融合,人工智能司法證據推理所影響的價值范疇也從低階到高階漸次性地展現出來,這種影響包含優(yōu)勢和劣勢兩個方面。
第一階,效率性方面。計算機的運算速度非人腦所能比擬。比如,2016年3月,世界四大會計師事務所之一的德勤與人工智能企業(yè)Kira Systems合作聯盟,將人工智能引入會計、稅務、審計等工作中,代替人類閱讀合同和文件,將人類律師12個小時的閱讀量縮短為15分鐘。在 2018 年全國檢察機關科技裝備展中,貴州省檢察院展示了通過“案件證據數據化+標準化”系統(tǒng)的運行,辦案時間平均縮短為 8 天,辦案效率提升約19%。(11)劉品新:《數據化的統(tǒng)一證據標準》,《國家檢察官學院學報》,2019年第2期。同時,人工智能推動司法審判流程再造,促進審判高效有序運行,對刑事訴訟而言,可形成公檢法上下聯動、內外貫通,借助現代信息技術優(yōu)化流程,提升效率。但也有學者在調研中發(fā)現,人工智能由于算法的僵化會要求辦案法官作出一些無謂的解釋,導致效率降低,甚至增加不必要的工作量,與其降低司法成本和負累的初衷相違背。(12)謝澍:《人工智能如何“無偏見”地助力刑事司法》,《法律科學》(西北政法大學學報),2020年第5期。
第二階,準確性方面。人工智能在準確性方面具備人類法官所沒有的天然優(yōu)勢。一方面,人工智能具備海量數據整合優(yōu)勢,通過對海量法律信息的深度學習與整合,其“大腦”中的法律數據要遠超人類法官,同時具備強大的數據篩選、精確定位、綜合分析的功能,在數據整合和運算精確性這一層面上,人工智能在司法證據推理上具有鮮明優(yōu)勢。另一方面,人工智能司法證據推理建立在數學邏輯之上,比人類的模糊性思維方式具備更高的精確性。但是,人工智能在司法證據推理中仍然存在技術上的不成熟,難以對當前所有法律數據進行完整學習,其所根基的數據庫難以完整涵蓋不同地域、不同時期的所有不同類型的案件。同時,證據推理的邏輯不僅僅是數學邏輯,其中的直覺思維和靈感思維是人工智能所不具備的。這就導致了當前人工智能在證據推理準確性上仍存缺陷。
第三階,公正性方面,人工智能在保障公正性方面主要有兩點優(yōu)勢:一是人工智能司法證據推理可規(guī)避人類法官徇私的可能,同時也可規(guī)避來自外界的不合理的非法律因素干擾,如請托送禮、領導指示、輿論壓力等,能夠推進獨立審判、中立審判的改革進程與裁判公正性的實現。二是統(tǒng)一裁判,這種統(tǒng)一裁判建立在形成統(tǒng)一證據標準與證明標準的基礎上,通過達成同一性的證據標準、證明標準適用效果,輔助實現同案同判,既可以通過“關聯數據”分析實現與過去案件司法證據推理的一致性,也可通過“衍生數據”運用形成未來的同一類案件中司法證據推理的一致性。但需要警惕的是,人工智能可能反映,甚至放大刑事司法系統(tǒng)數據中的固有偏見。用于訓練人工智能的數據可能傾向于某些人群,或某一時期某些地區(qū)的特定利益考量。因此,它可能把過去的不公正掩蓋在計算機生成的客觀性的外衣下,有可能形成公正性盲區(qū)。
2016年,美國法院便承認人工智能參與量刑裁判的正當性,人工智能開始越來越深入地介入到司法證據推理之中。(13)State of Wisconsin v. Eric L.Loomis,2016 Wis.68,881 N.W.2d.749 (2016).但值得注意的是,人工智能雖然具備上述三階優(yōu)勢,當前仍處于“弱人工智能”時代,人工智能不具備完全的自主意識和完備的思維能力,仍受限于人類控制,在法律人工智能實現司法效率性、準確性、公正性等方面,相較于人類法官仍存在諸多明顯劣勢,比如證據信息提取不完備、經驗邏輯欠缺。在輸入可供分析的數據、對數據進行整合生成、表達運算結果并完成輸出這三個環(huán)節(jié),尚存在許多技術漏洞留待未來不斷完善。有關人工智能在證據推理中的不足之處會在下文進行詳細分析。
限于當前的技術階段,無論是官方機構還是學術界,對于人工智能在司法裁判中的角色多定性為一種“輔助性”工具。而在司法輔助性人工智能的發(fā)展過程中,形成了梯次性發(fā)展格局:第一階段是輔助法律信息檢索工作。1983年,龔祥瑞和李克強就在借鑒西德JURIS資料系統(tǒng)(14)1977年,西德政府要求在記述罪犯和犯罪時,按照標準的格式把犯罪的時間、地點、活動、方式、人物特征、犯罪情況以及有關事實的來龍去脈通通載明。這些情報都要提供給警察信息系統(tǒng),以期逐步地建立一個關于西德刑事犯罪案件的全面文獻系統(tǒng)。轉引自龔祥瑞、李克強:《法律工作的計算機化》,《法學雜志》,1983年第3期。的基礎上,提出建立以計算機技術為核心的法律智能檢索系統(tǒng)以輔助司法審判,(15)龔祥瑞、李克強:《法律工作的計算機化》,《法學雜志》,1983年第3期。1985年“北大法寶”的前身便被打造出來,之后涉外法律數據智能檢索系統(tǒng)的建設工作次第展開。輔助司法證據推理的人工智能技術在這一階段雖初露端倪,但仍未具有直接性、實質性的輔助作用。第二階段是輔助證據采集指引與逆向證據鏈矛盾審查。這一階段便是我國人工智能系統(tǒng)所處的發(fā)展階段,無論是上?!?06系統(tǒng)”還是北京法院“睿法官”等司法人工智能系統(tǒng)都基本具備輔助檢查證據質與量的瑕疵,證據鏈的矛盾的功能,向法官提供證據可能存在的不完備之處,證據推理結論的疑問、矛盾,對于法官司法證據推理進行前置性的證據采集指引,以及后置性的證據推理過程與結論的矛盾性檢討及逆向否定性建構。第三階段是輔助正向司法證據推理建構與形成決策。當前司法人工智能正由第二階段向第三階段進行過渡,例如上海“206系統(tǒng)”初步具備了正向司法證據推理建構與形成決策的功能,能夠初步生成判決意見,但是由于諸多人工智能技術問題尚未被攻克以及機器學習不足,準確性保證尚付闕如,“206系統(tǒng)”雖處于相對性的世界領先水平,但距離形成證據信息全采集——證據推理全仿真——司法證據推理結果準確形成與輸出這樣一種全過程、高準確度的人工智能司法證據推理系統(tǒng)還存在相當一段歷程。
在政治適當性和法哲學層面上,由于人工智能司法證據推理完全建立在數學運算的基礎上,而特賴布教授反對數學審判的理由之一是在諸如給無辜者定罪風險之可接受水平等問題上,量化分析在政治上是不適當的。(16)Laurence H. Tribo, “Trial by Mathematics: Precision and Ritual in the Legal Process”, Harvard Law Review,Vol. 84, No6 (April 1971), pp. 1329-1393.政治適當性在于只能由一個依法設立的獨立而無偏倚的法院,經過公正、公開的審判,才能給一個人定罪。(17)張保生:《人工智能法律系統(tǒng):兩個難題和一個悖論》,《上海師范大學學報》(哲學社會科學版),2018年第6期。在倫理層面上,人工智能進行司法證據推理是算法進行計算的結果,如果由算法主導司法證據推理與裁判的結果,司法裁判將由“人裁判人”轉向“算法裁判人”,人面臨著“客體化”的危險。在技術層面上,雖然人工智能技術迅猛發(fā)展,人工智能在司法領域應用廣泛且前景廣闊,但司法人工智能技術仍然處于起步階段,在技術層面人工智能無法獨立準確進行司法證據推理,相對于人類法官,人工智能在司法證據推理中只能處于輔助性地位。
基于司法人工智能在證據推理中輔助性地位的基本判斷,當前理論研究和司法實踐的重點應當放在司法人工智能如何有效輔助證據推理,或者說,“人工智能輔助證據推理的基本限度在哪里”這一命題之上。在技術層面,人工智能介入司法證據推理的三個主要環(huán)節(jié)分別為:提取可供分析的數據、對數據進行分析整合生成、表達運算結果并完成輸出。(18)栗崢:《人工智能與法律事實認定》,《法學研究》,2020年第1期。在這三個環(huán)節(jié)中,影響最大的,也是當前存在最大技術難題和理論爭議的,便是前兩個環(huán)節(jié),即提取可供分析的數據、對數據進行分析整合生成。通過分析這兩個技術環(huán)節(jié)中司法人工智能的“能”與“不能”,可以明確其在證據推理中的輔助性限度和具體定位。
證據信息的充分提取和轉化是人工智能進行司法證據推理的第一步。證據信息的提取是認識案件事實的唯一橋梁。證據信息的提取轉化是人工智能進行司法證據推理的起始點。同時,對于提取的證據還需要進行數據化改造,改造成計算機所能識別、運算、分析的機器語言。證據的提取轉化涉及諸多法學、計算機技術、語言學、思維科學的問題。關于證據信息的收集與轉化,涉及以下幾個基本問題。
證據信息紛繁復雜,人工智能在證據信息提取分析中需要分類別進行。例如在刑事案件中,人工智能進行司法證據推理的前提是,根據特定刑事罪名的構成要件對龐雜的證據信息進行分類別提取,而這種提取的方向與內容則是提前設計在算法與邏輯模型之中的。這種分類提取主要分兩個環(huán)節(jié)進行,第一個環(huán)節(jié)是針對案情按照刑法分則的不同章節(jié)不同罪名對證據信息進行梯次性初步分類,第二個環(huán)節(jié)是針對不同構成要件對符合該要件要求的詞匯、圖像等信息進行數據化歸類提取。有學者提出,對這兩個技術環(huán)節(jié)的實現可通過計算機實驗法檢驗邏輯架構設計的合理性與可靠性,并且通過更加大量的裁判文書的文本關鍵詞集合提取與分析的途徑,進一步提升其準確度。(19)馬皚、宋業(yè)臻:《人工智能“法官”的一種實現路徑及其理論思考》,《江蘇行政學院學報》,2019年第2期。
同時,證據信息還需要依據不同證據種類進行分類提取。一般分為兩個大類對證據信息進行提取。第一大類是對文字類證據信息的提取。對于書證、證人證言、視聽資料這一類圖文材料中的語言文字,主要運用OCR技術( Optical Character Recognition,光學字符識別)進行處理,OCR技術傳統(tǒng)上是指對圖像進行處理及分析,識別出圖像中的文字信息,廣義的OCR技術是指所有圖像文字檢測和識別技術(簡稱圖文識別技術),包括自然場景文字識別技術(Scene Text Recognition,STR)。(20)牛小明、畢可駿、唐軍:《圖文識別技術綜述》,《中國體視學與圖像分析》,2019年第3期。第二大類是非文字類證據信息的提取。如物證信息的提取,對于物證信息的提取是當前人工智能技術的一個瓶頸,物證作為“塊結構”的證據包含著豐富的證據信息,而對于這些非文字的證據信息,如何拆解這些信息?如何從中提取有用的信息?如何運用計算機可理解的語言將 “塊結構” 擊破打散,形成數字化、可識別的結構性數據,以識別并提取其中的有效信息?(21)栗崢:《人工智能與法律事實認定》,《法學研究》,2020年第1期。這些都是當前亟待解決的問題,當前以“人臉識別”為代表的“智能識別技術”蓬勃發(fā)展,例如以生物大腦神經元為原型的ANN神經元模型,以信號處理(內部強度默認)——樹突P(強度權重)——傳遞函數之間的關聯搭建了完整結構,結合相關硬件技術訓練圖像、轉化圖像格式數據。(22)李環(huán):《人工智能中人臉識別技術的應用分析》,《電子測試》,2021年第1期。這一類“智能識別技術”都為非文字類信息的識別與提取提供了可能。
不可否認,上述兩大類證據信息的提取技術現在都不完善,除了總體面臨的數據“結構化”改造問題,還包括在對文字類證據的提取過程中,缺乏對語言文字背景、動機的提取,以及對于被告人、證人的心理狀態(tài)、情緒、微表情等人性化細節(jié)的經驗性、隨機性、直覺性捕捉。同時,物證識別目前不具備比肩“人臉識別”的強大數據庫。此外對物證信息提取的關鍵是選取能為法律要件所涵攝的證據信息,如“剎車痕的長度”“刀上的鮮血”“傷口與兇器的吻合度”等,但在不同案件的不同物證中存在個性化差異,往往需要依靠控辯審三方的經驗與直覺,而沒有一定之規(guī),這對固定了算法和邏輯模型的人工智能而言,不得不說是一項莫大的考驗。
有學者認為,應當從三個層次來理解人工智能語言。最基礎的層次是我們所謂的“機器語言”和 “程序語言”(23)哈羅德·埃布爾森、杰拉爾德·杰伊·薩斯曼、朱莉·蘇斯曼:《計算機程序的構造與解釋》,裘宗燕譯,中信出版社2004年版, 第249頁。,這兩種語言是機器運行和程序設計所用到的指令和符號。第二層次是人工智能自然語言處理(Natural Language Processing),是通過機器對人類自然語言的學習實現人與機器相溝通,因此涉及了人類的語言知識。而第三層次的語言即人工智能不是簡單地模仿人類語言,而是自己能夠生成語言,實現機器“自主化”“自動化”語言表達。(24)陶鋒:《人工智能語言的哲學闡釋》,《南開學報》(哲學社會科學版),2020年第3期。在司法領域中,人工智能進行證據信息的提取主要圍繞在前兩個層次展開。
第一層面的人工智能語言問題,如何將證據信息轉化為機器所能理解的機器語言或程序化語言,使非結構化數據實現結構化改造。非結構化數據是指數據結構不規(guī)則或不完整,沒有預定義的數據模型,不方便用數據庫二維邏輯表來表現的數據。書證、物證、視聽資料、證人證言等證據中所包含的文本、圖片、XML、 HTML、各類報表、圖像和音頻/視頻等信息都是以非結構化數據的形態(tài)存在。第二層面的人工智能語言問題,人工智能需借助成熟的自然語言處理技術對具有法律意義的證據信息進行提取。自然語言處理技術的實質是讓人工智能能夠從法律文書的法律語言中(自然語言的一種狀態(tài))準確提取相應情節(jié)。(25)王祿生:《司法大數據與人工智能開發(fā)的技術障礙》,《中國法律評論》,2018年第2期。法律條文中構成要件語言表述經過高度的凝練與概括,如“自首”“認罪認罰”“緊急避險”等,甚至是一些概念化的專用法律術語,如“法律行為”“意思表示”“無因管理”等。根據高度專業(yè)化、抽象化、凝練化的法律語言抽取屬于這一類表述的紛繁復雜的證據信息存在困難,而這一類證據信息往往以一種日常用語、形象化語言、俚語、方言等形式存在。對于這一類語言的識別與提取是證據信息提取的關鍵,只有進行證據信息全面、充分、準確的提取與解讀才能實現準確的司法證據推理。
當前的語言識別提取技術,有基于模版匹配的案件要素自動提取技術(26)張德:《自然語言處理技術在司法過程中的應用研究》,《信息與電腦》,2017年第17期。,還有知識圖譜的構建技術。知識圖譜是結構化的語義知識庫(27)張德:《自然語言處理技術在司法過程中的應用研究》,《信息與電腦》,2017年第17期。,知識圖譜的架構包括知識圖譜自身的邏輯結構,以及構建知識圖譜所采用的技術(體系)架構。(28)劉嶠、李楊、段宏、劉瑤、秦志光:《知識圖譜構建技術綜述》,《計算機研究與發(fā)展》,2016 年第3期。但無論是要素提取技術還是知識圖譜建構技術,面對語言難題時都無法做到全面準確的識別、提取與轉化,原因在于:第一,法律語言固有的抽象性、專業(yè)性、多義性、模糊性導致了語言識別、提取、轉化的困難;第二,法律語言的語詞、語義過于浩繁,人工標注與知識圖譜構建難免有所遺漏,不全面的證據信息識別、提取、轉化使人工智能主導司法證據推理的可靠性大打折扣;第三,信息雙重轉化加大信息失真的風險,人類語言需要轉化成機器語言形成輸入,繼而機器語言再轉化為人類語言完成輸出,一次轉化信息便有失真的風險,兩次轉化這種風險則形成了疊加。
前文有述,無論是從政治適當性、法哲學、倫理學的層面,還是從技術的層面看,人工智能在司法證據推理中在實然和應然的層面上均定位為輔助性。但是人工智能的輔助性定位如何具體界定,如何在實踐中合理地、具體地輔助證據信息提取仍需進一步深化研究。
本質上,人工智能對證據信息提取轉化是法官和人工智能之間對證據信息進行交互的過程。人工智能進行司法證據推理的前提就是證據提取與信息數據化轉化,沒有形成全面而準確的證據信息識別提取與結構性數據轉化,司法證據推理就可能會出現偏差。但當前證據提取與轉化技術仍存在諸多不足:一方面,語言文字類證據信息識別、提取和轉化技術面臨語言難題。另一方面,非語言文字類證據信息識別、提取和轉化存在著“塊結構化數據”向“結構化數據”轉化的不足。人工智能進行證據信息轉化是證據推理準確開展的起點,這一環(huán)節(jié)的失誤造成的后續(xù)不良影響是巨大的。(29)See Citron, “Technological due Process”, Washington University Law Review, vol.85, no.6 (November 2008), pp. 1249-1314.
證據信息的提取與轉化是人工智能進行司法證據推理時所需要扣好的“第一??圩印保沁M行準確司法證據推理的必要條件。雖然證據信息提取轉化技術存在不足,人工智能在法律事實認定與證據推理中實現“主導性”尚存一段距離,但將人工智能在證據信息轉化中定位為輔助性角色卻可以為現行司法提供極大助益。因此,“輔助性”應當是人工智能在證據信息提取乃至司法證據推理中的一個“合理定位”。在證據提取轉化技術有限性的背景下,人工智能“輔助性”定位應當做如下理解:一是人工智能對證據的缺失進行預警,人工智能通過廣泛的大數據學習,對類案所需具備的普遍性證據具有相對完整的了解,通過證據缺失預警機制可以有效彌補人類法官在證據提取上的疏忽。比如,上海的“206系統(tǒng)”成功研發(fā)出社會危險性證據模塊,假如公安機關未在偵查階段收集標注社會危險性證明材料,則系統(tǒng)就會自動向公安機關發(fā)出提示,通知其補正。二是人工智能輔助人類法官檢視證據信息要點提取的完整性與準確性,法官通過主動比照人工智能自動提取的證據信息與自己所提取之信息要點之間的差異,實現進一步修正和補充證據信息。同時輔助檢視證據能力所要求的形式性材料是否齊全, 如對于勘驗檢查筆錄的程序、形式要求是否滿足,物證、書證是否附有必要的筆錄、清單,在提取、保管的各個環(huán)節(jié)是否有適格人員簽字蓋章等進行檢視。三是人類法官輔助完善人工智能所提取的證據信息,使人工智能最大程度地實現法律事實認定的科學性、準確性,讓人工智能在司法證據推理中的輔助性功能得到更大程度的發(fā)揮,通過人類法官和人工智能的協(xié)作實現優(yōu)勢互補。
人工智能在信息識別、提取、轉化過程中的技術正在發(fā)生日新月異的變化,通過大量語言的學習與知識網絡的構建進行符號信息的組合調度,逐漸建立起集合神經網絡、復雜系統(tǒng)、遺傳算法等技術的新型人工智能信息識別轉化系統(tǒng)。人工智能在證據信息識別轉化中代替人類法官逐漸掌握主導地位,在不遠的將來或可預期。
當前人工智能在證據推理環(huán)節(jié)的一般模式是,依照法定證明標準類型化地建構不同案件的證據推理模型,首先將法定的統(tǒng)一證據標準嵌入到司法機關的智能化辦案系統(tǒng)中去,其次劃分不同的案件類型,依照各自特點建構證據推理的知識圖譜和模型算法。以具有代表性的上?!?06系統(tǒng)”為例,把盜竊模型按照證據數量和種類的不同,分為當場抓獲型、重要線索型和網絡犯罪型三種類型,分別建構證據屬性校驗、證據印證和證據之間邏輯判斷的算法模型。一套人工智能證據推理系統(tǒng)大抵建基于三點:專家經驗、海量學習、模型算法。而人工智能在證據推理中的不足也恰恰產生于此:經驗指引的偏狹、深度學習的不充分、算法模擬的不完整。有學者在調研中發(fā)現,在一起盜竊案中,上海“206系統(tǒng)”識別出證據鏈建構中缺少鑒定意見,但盜竊的是人民幣,這是不需要鑒定的。(30)謝澍:《人工智能如何“無偏見”地助力刑事司法》,《法律科學》(西北政法大學學報),2020年第5期。這種僵化的機器結論根源在于當前人工智能在深度學習和算法建構方面的局限性,因此,探尋人工智能系統(tǒng)在司法證據推理中的不足和適用邊界是當前研究的重點。
思維模擬,是用機械的、電子的方法模擬和復制人類的思維,是人工智能的技術核心和發(fā)展方向。人具有形象 (直感)思維、抽象(邏輯)思維和靈感(頓悟)思維三種思維方式。(31)馬林:《思維科學知識讀本》,中共中央黨校出版社2009年版,第125頁。參見田運:《思維科學》,浙江教育出版社1988年版,第32頁。司法證據推理中主要涉及兩種思維,即邏輯思維和靈感思維。自由心證下司法證明的邏輯思維包括演繹推理、似真推理與非單調推理,以及印證推理、假說演繹推理與溯因推理等歸納主義邏輯路徑。人工智能在邏輯推理,數學演算等方面的模擬訓練成果顯著,但其他類型的人類思維模擬仍待跨越式突破。
抽象思維,即邏輯思維,主要依靠邏輯來進行思維,邏輯思維過程表現為一個線性過程 ,容易形式化,借助于概念實施嚴格的邏輯推理從某一前提出發(fā)一步接一步地推論下去,直至結論。(32)劉泉寶、劉永清:《從思維科學看人工智能的研究》,《計算機科學》,1994年第5期。司法裁判中的證據推理與法律事實認定具有基礎的邏輯性,而這種邏輯,既包含形式邏輯,也包含非形式邏輯,且主要以非形式邏輯為主。(33)張保生編:《證據科學論綱》,經濟科學出版社2019年版,第158頁。非形式邏輯主要包含印證推理、假說演繹推理與溯因推理等歸納主義邏輯。人工智能與邏輯思維的結合最初是在演繹推理、似真推理、非單調推理領域內展開,而未完全深入到以歸納推理、溯因推理為代表的“非形式邏輯”的領域。(34)周慕涵:《證明力評判方式新論——基于算法的視角》,《法律科學》(西北政法大學學報),2020年第1期。當前人工智能結合生物科學和計算機科學的方法,立足邏輯運算和符號操作,實現對形式邏輯思維的模擬,并逐步深入到對非形式邏輯思維的模擬。
“靈感”思維,又稱“直覺”思維,是基于大量實踐和認識經驗的積累,以潛在性的意識結構為依據,在潛意識當中孕育成熟,在一定條件刺激下,瞬間性、突然性地涌現于意識成為靈感。(35)張保生編:《證據科學論綱》,經濟科學出版社2019年版,第158頁。司法過程中直覺的主要功能在于發(fā)現各種初始結論(36)李安:《司法過程中的直覺及其偏差控制》,《中國社會科學》,2013年第5期。,為證據推理提供大致的方向。(37)張保生編:《證據科學論綱》,經濟科學出版社2019年版,第152頁。人工智能對于“靈感”思維的模擬體現為一種“啟發(fā)式算法”,2013年,帝金數據普數中心數據研究員S.C.WANG開發(fā)了一種新的數據分析方法,該方法導出了研究函數性質的新方法,新數據分析方法給計算機學會“創(chuàng)造”提供了一種方案。但當前人工智能對人類的“靈感”思維依舊無法形成完全模擬,與證據推理過程中的跳躍式“直覺”思維仍相去甚遠。
建立在思維模擬基礎上的人工智能司法證據推理,限于當前的人工智能技術短板與圖靈機所固有的技術“天花板”,同時一套算法便構成一套獨立的信息處理體系(38)Batya Friedman, Helen Nissenbaum, “Bias in Computer Systems”, ACM Transactions on Information Systemss,vol.14, no.3(July 1996), pp.332-345.,其往往存在一定的認知偏差,導致在實現司法證據推理準確性過程中還存在這樣幾項障礙:一是對人類思維的不完全模擬,當前無論是對邏輯思維的模擬還是對直覺思維的模擬都是不完整的,造成在司法證據推理過程中只能得到“盲人摸象”般的結果;二是客觀世界的知識具有復雜性,并非所有知識都能轉化為形式化、規(guī)則化的算法;三是當前思維科學未窮盡對思維世界的全部認識,人類思維的運行是一個極其龐雜的系統(tǒng),一個思維認知結果往往是形象思維、邏輯思維、直覺思維階段性、部分性、交錯性、偶發(fā)性綜合作用的結果,人工智能思維模擬建立在不充分思維科學認知的基礎上,其認知結果也必然是難以盡善盡美。
法律事實認定是一個證據推理的過程,是法律事實認定者在經驗基礎上理解、運用證據認定案件事實的一個經驗推論活動。經驗是理解證據內涵的背景知識,也是證據相關性推論的基礎和證明力的評價尺度。(39)張保生編:《證據科學論綱》,經濟科學出版社2019年版,第150-154頁。經驗來源于社會知識庫與個人知識庫,作為社會知識的經驗是對眾多個別現象通過“歸納概括”得出的一般知識,而作為個人知識的經驗主要包括個人生活經歷、審判經驗、直覺甚至是偏見。(40)張保生編:《證據科學論綱》,經濟科學出版社2019年版,第151-152頁。
一般而言,人工智能要獲取人類經驗的途徑只能通過“機器學習”。機器學習( Machine Learning,ML)一般被定義為計算機程序可以在給定某種類別的任務T和性能度量P下學習經驗E,如果其在任務T中的性能恰好可以用P度量,其性能則隨著經驗E的積累而提高。以上?!?06系統(tǒng)”為例,提供機器學習的知識庫包括法律庫、經驗庫和判例庫,通過輸入法律法規(guī)、案卷材料、詢問/訊問筆錄、庭審筆錄等樣本數據,結合法官的經驗常識完成對關鍵要素的抽取與深度學習,使其囊括業(yè)務法官(專家)經驗、法律法規(guī)、專門知識、常識性知識。(41)張保生編:《證據科學論綱》,經濟科學出版社2019年版,第168-176頁。
但是,對于司法證據推理經驗性的人工智能化仍需保持謹慎,人工智能對于經驗的深度學習尚存不足,總結而言:其一,樣本數據嚴重不足。一方面是輸入計算機的案卷材料、庭審筆錄規(guī)模尚小,經驗的高度普遍性與高度蓋然性有待加強;另一方面,法律決策過程中的關鍵行為如形成決策的內部討論往往是高度非文字化、非數據化的,如合議庭、審委會的討論、決策過程(42)左為民:《關于法律人工智能在中國運用前景的若干思考》,《清華法學》,2018年第2期。,同時還有大量“不入卷材料”潛在性甚至決定性地影響著最終裁判結果,而樣本數據難以包含這些信息,必然會導致“機器學習”的最終結果出現偏差。其二,人類經驗難以統(tǒng)計?!敖y(tǒng)計學”意義上的經驗難以等同于包含社會知識與個人知識的人類經驗,人工智能所能獲得的數據相對于人類生活來說畢竟是有限的,人類經驗是綜合了民族、地方、歷史、習慣、價值等因素的混合體,這些都是人工智能難以學習的。(43)縱博:《人工智能在刑事證據判斷中的運用問題探析》,《法律科學》(西北政法大學學報),2019年第1期。其三,“機器學習”的方式難以避免“偏見”。以案卷材料、詢問/訊問筆錄、庭審筆錄等為樣本數據進行“統(tǒng)計學”意義上的歸納概括,在學習人類經驗的同時,也對樣本數據中的“偏見”進行歸納與使用,且因為樣本數據的嚴重不足,可能導致這樣一種“偏見”在司法決策中的影響力進一步放大。例如,美國一些州的刑事法官在評估被告或被定罪者的再犯風險時,在審前拘留、判刑或提前釋放的決定中,使用COMPAS系統(tǒng)進行評估,使用了犯罪記錄和137個問題的調查問卷中的數據,其中包括:“饑餓的人可以偷竊嗎?強烈反對,不同意等等?!比欢?,這個工具也有它的缺陷。通過使用過去的數據,它系統(tǒng)地高估了非裔美國被告的累犯率。因此,通過機器學習實現在證據推理中應用經驗邏輯,較難規(guī)避偏見的風險。
人工智能由于以“圖靈機”作為硬件基礎,人工智能也只能如同“圖靈機”一樣,以數學化的“機械推導”為主要的運行邏輯。(44)馬兆遠:《人工智能之不能》,中信出版社集團2020年版,第217-218頁。所以,人工智能在進行邏輯推理時,只能將用于邏輯推理的元素轉化為數據值,并在元素與元素之間通過數學的方法(如“概率”)建立起數理關系。(45)栗崢:《人工智能與法律事實認定》,《法學研究》,2020年第1期。無論是人工算法還是進一步發(fā)展出來的“生物算法”都是基于概率化的數學運算建立起來的,而人工智能進行經驗學習也是建立在概率化的數學方法之上的。
數學與概率論在人類思維的定性分析與人工智能的定量分析之間架起了相互溝通的橋梁。但是進行概率化的數學運算不能代替證據推理的全貌,法律事實認定與證據推理離不開數學的輔助,人工智能證據推理依靠概率運算開展,但是證據推理本質不僅是概率運算,更為重要的是要依靠因果推論開展,因而他們無法實現完全數學化。(46)See Jason Millar,Ian Kerr, Delegation,“Relinquishment and Responsibility: The Prospect of Expert Robots”, SSRN Electronic Journal, vol.14, no.5(March 2013), pp.532-534.
原因可總結為四點:第一,形式化的概率論無法完全實現司法證明的非形式化推理。以貝葉斯分析為代表的概率論對于司法裁判可以起到“化繁為簡”之功效,但是我們面對的現實世界充滿了偶然性、非線性,必須在有限時間內應對不可計數、變化多端的人類社會復雜性,正如艾倫教授所言,司法證明需要運用包括概率論在內的多種認知工具以輔助似真推理,但歸根結底,它不能被簡化為數字和數學公式。(47)羅納德·J·艾倫:《司法證明的性質:作為似真推理工具的概率》,汪諸豪、戴月、柴鵬譯,《證據科學》,2016年第3期。第二,人工智能無法通過數學的方法實現對人類思維的完全模擬。司法證據推理中,無論是相關性、真實性、合法性還是證明力的判斷,主要涉及兩種思維,即邏輯思維和靈感思維,但無論是邏輯思維中的“非形式化推理邏輯”還是以“直覺”為主要表達方式的靈感思維,當前的人工智能技術都無法通過數學運算實現全仿真,甚至很多技術尚處于無法付諸實踐的試驗性階段。第三,人工智能難以對主觀概率和客觀概率實現準確轉化。在傳統(tǒng)的證據法學理論中,有兩種表達信念概率性的方式,第一種方式是使用日常語言表達信念的概率性,第二種方式就是使用數學語言表達信念的概率性,對某種信念狀態(tài)進行精確的數字賦值(48)樊傳明:《證據評價論——證據法的一個闡釋框架》,中國政法大學出版社2018年版,第146-149頁。,但是如何在精確性數字與主觀性模糊概率之間轉化是當前人工智能無法很好解決的問題。第四,數學概率運算導致法定證據制度之弊。人工智能在司法證據推理中通過對不同證據證明力設定不同的等級,并設定不同的法律效果,規(guī)定各種證明力的相加方式,從而得出最終的司法證據推理結果,這本質上就是一種法定證據主義的算法設計。
證據推理在訴訟程序的語境下,特定司法場域之特殊構造中訴訟參與各方的理性交互的結果,是法庭認識論的一部分。(49)卞建林編:《刑事證明理論》,中國人民公安大學出版社2004年版,第13頁。司法證明系交互理性之下的他向證明,也是不同譜系知識相互作用與規(guī)制的過程,正如數學、心理學、哲學也在不斷給予司法證明某種指引。(50)See Richard Lempert, “The New Evidence Scholarship: Analyzing the Process of Proof”, Boston University Law Review, vol.66, no.3 (May 1986), pp.439-477.人工智能與人類法官在證據推理這一問題上的交互受到???Michel Foucault)的微觀權力支配理論的影響,相互之間受到彼此的知識性“規(guī)訓”。根據美國學者的一項實驗,在刑事司法領域中,計算機生成結果對于法官的決策結果會形成明顯影響。(51)See STARRSB, “Evidence-based Sentencing and the Scientific Rationalization of Discrimination”, Stanford Law review, vol.66, no.4 (July 2014), pp.867-869.當前人工智能技術的蓬勃發(fā)展,使人工智能介入到證據推理之中的角色已不僅僅是一種工具性的輔助,還是人類法官的法庭認識論層面的交互對象。而對于人工智能證據推理的規(guī)制,需要將這種交互行為納入到理性主義的軌道中,以交互理性建構其在證據推理環(huán)節(jié)的適用邊界。
司法證據推理,無論是相關性、合法性、真實性還是證明力的判斷,均要求形象(直感)思維、抽象(邏輯)思維和靈感(頓悟)思維三種思維方式的綜合性、完整性運用,要求經驗推理在特定時空下具有一貫性、妥當性與全面性。然而綜合上述分析,當前人工智能技術在思維模擬、經驗學習等方面仍存在諸多不足。在思維模擬上將司法證據推理的處理大量建立在數學運算的基礎上,這與司法證據推理的思維模式在底層邏輯上存在一定程度的齟齬。在經驗推理上,具有前后裁判一貫性上的優(yōu)勢,但在妥當性和全面性上仍與人類法官存在較大差距。因此,單從技術視角看,人類法官所組成的審判法庭在司法證據推理中仍處于主導性地位,這是當前人工智能所無法有效取代的。但是,人工智能在輔助司法證據推理中的作用和價值是十分巨大的,需要有效的規(guī)則設計和制度引導。實現交互上的理性主義,制度核心是明確人工智能和人類法官各自的“能”與“不能”,有效預防各自的隱形偏見(52)See L. Song Richardson, “Systemic Triage: Implicit Racial Bias in the Criminal Courtroom”, Yale Law Journal,vol.126, no.3(January 2017), p.862.,建立恰如其分的優(yōu)勢互補。
人工智能在證據推理中的理性功能范疇可分為兩個方面。第一,前置性指引。通過人工智能系統(tǒng)對海量大數據的深度學習能力,人工智能系統(tǒng)擁有更為清晰、準確、全面的案例數據庫和相關知識儲備,司法事實認定過程中所依據的專業(yè)知識和日常知識,人工智能系統(tǒng)均能提供大量的數據指引。人工智能在大量形式性、重復性、格式化的證明工作上具有高于人類法官的精確性和公正性。人類法官可借助人工智能系統(tǒng)在事實認定環(huán)節(jié)實現“由點到面”的指引性輔助,在“點”上,可提供對單個證據證明力的輔助判斷,在“面”上,可綜合所有在案證據提供全面的事實認定參考。第二,后置性糾錯。一方面是進行證據證明力審查校驗,提出與人類法官在證據證明力判斷上的不同之處,比如,證據是否存在真實性疑點,證據之間是否存在明顯矛盾無法形成印證,證據認知與常識不一致等;另一方面是進行整體事實認定的審查校驗,對法官作出的司法證據推理過程和結果進行整體逆向性勘誤,檢查是否符合邏輯規(guī)律,是否符合經驗法則,是否做到了同案同判的一致性。同時,在司法實踐過程中,法官的終局裁判結果也是反哺人工智能的關鍵學習材料,通過深度學習對既往算法查漏補缺,建立更為高效的預測、指引、糾錯乃至正向建構功能。
上述所提到的無論是前置性指引還是后置性糾錯,在規(guī)則和制度層面可對人類法官的事實認定產生制約,為人工智能在事實認定中的輔助性定位附加強制力。隨著人工智能技術的逐漸發(fā)展,機器深度學習的逐漸豐富,思維模擬的逐漸成熟是必然性趨勢,比如人工智能的形象思維、靈感思維正在取得突破性的發(fā)展。在可以預見的將來,人工智能輔助事實認定的范疇將會越來越廣,對人類法官的制約也將越來越強。甚至有觀點認為,人工智能可能會成為訴訟參與者與法庭裁判者。(53)See Andrea Roth, “Trial by Machine”, Georagetown Law journal,vol. 104, no.5 (June 2016), p.1304.
根據人工智能技術在司法證據推理中的應用現狀和技術優(yōu)勢與缺陷,需要在外部對人工智能參與司法證據推理建立起基本的適用原則予以制約,使進入司法領域的技術在法領域內依據法律原則與基本法律規(guī)定而行。人工智能司法證據推理需要納入到法治框架下予以規(guī)制,而司法規(guī)制的底層邏輯便是接受司法價值的約束和引領。人工智能活動需要堅持基本的倫理原則,2019年4月,歐盟發(fā)布《可信人工智能倫理指南》(Ethics Guidelines for Trustworthy AI),提出了四項倫理準則:尊重人的自主性(Respect for Human Autonomy)、防止損害(Prevention of Harm)、公正(Fairness)和可解釋(Explicability)準則。在法律領域中,人工智能參與司法證據推理,最為核心和基礎的倫理準則就是公正,公正是人工智能程序性治理的最終目的,是司法人工智能運行的根本依據,是提振群眾對司法系統(tǒng)整體信心的必由之路。(54)See Andrew D. Leipold, “Objective Tests and Subjective Bias: Some Problems of Discriminatory Intent in the Criminal Law”, Chicago-Kent Law Review, vol. 73, no.2(November 1998), p.559.人工智能司法證據推理的公正性準則可具體細化為以下四項基本原則。
第一,智能審判實質化原則。人工智能司法證據推理需要通過有效參與庭審,輔助法官在庭審中發(fā)揮其查明事實、認定證據、保護訴權、公正裁判的作用,來落實以審判為中心的訴訟制度改革。因此,需要人工智能的運行以審判程序為嵌套、以審判標準為指向、以審判實踐為素材,使人工智能有效落實到以審判為中心的語境當中去。其一是堅持全面參與庭審,以審判為中心重在實現庭審的實質化,保障控辯有效對抗和當庭質證,實現訴訟證據質證在法庭、案件事實查明在法庭、訴辯意見發(fā)表在法庭、裁判理由形成在法庭,人工智能進行司法證據推理的證據材料應當在法庭上以人工輸入或者智能圖文、語音識別技術進行重新采集,當庭進行司法證據推理并生成認定結果,供控辯審三方參考。其二是實現證據標準的統(tǒng)一,完善證據制度、統(tǒng)一證據標準,是推進以審判為中心的刑事訴訟制度改革的核心任務。(55)秦宗文:《證據標準的雙維分析:基準與動力》,《中國刑事法雜志》,2021年第3期。將統(tǒng)一的證據標準嵌入到司法人工智能的算法之中,通過人工智能司法證據推理系統(tǒng)為偵查、審查起訴、審判提供統(tǒng)一化的證據收集指引與證據標準指引,使被嵌入到數據化程序系統(tǒng)中的證明標準實現一定程度的具體化,在實現數據化的同時也實現統(tǒng)一化。(56)劉品新、陳麗:《數據化的統(tǒng)一證據標準》,《國家檢察官學院學報》,2019年第2期。其三是在算法設計與樣本數據學習中要規(guī)避“以案卷為中心”“以口供為中心”的實踐樣態(tài),進而保障庭審實質化,要注意提供機器學習的樣本數據不要僅僅局限于案卷與口供,需要提供包括案卷材料在內的詢問/訊問筆錄、庭審筆錄等多元化樣本數據,以及除口供之外的種類不同、來源不一的多種證據信息。
第二,算法公開原則。算法公開原則要求法院的人工智能參與的審判活動從參與流程到算法內容都應當向社會公開,使得人工智能的參與行為和相應算法受到社會公眾的廣泛監(jiān)督,這是審判程序公正的基本保證。在機器學習的具體應用過程中,由于算法存在黑箱,模型機器學習在司法證據推理的可解釋性等方面受到質疑。要保證人工智能司法證據推理的內容在一定程度上可以公開透明,這既是保障公正的需要,也是接受檢驗保障準確性的有效途徑。用于構建算法模型的知識圖譜具有強大的實體關系表達能力,其知識方法與人類認知模式一致,與自然語言表達語義的方式相一致,是人工智能建立證據要素關聯,進行邏輯推理的基礎,對于該知識圖譜需要向控辯雙方甚至是全社會予以公開,以監(jiān)督審判權、檢察權的合法有序運行,保障辯護權的有效行使。
第三,算法平等原則。刑事訴訟基本職能分為控訴、辯護和審判,控訴職能和辯護職能進行平等對抗,并貫徹于偵查、審查起訴、審判之始終是現代刑事訴訟的基本理念。(57)陳光中編:《刑事訴訟法》(第六版),北京大學出版社、高等教育出版社2016年版,第15-16頁。人工智能在介入司法證據推理時需要遵守控辯平等的原則。一方面是保證算法理念的平等,在算法設計時要保證運算過程與運算結果對控辯雙方不偏不倚,通過對樣本數據的仔細遴選去除樣本數據中蘊含的“有罪推定”“口供中心”“案卷中心”的實踐弊病(58)謝澍:《人工智能如何“無偏見”地助力刑事司法》,《法律科學》(西北政法大學學報),2020年第5期。,防止出現有違“控辯平等”的算法偏見。另一方面是保證人工智能算法資源的平等配置,當前司法人工智能系統(tǒng)的人力物力投入巨大,主要由國家進行主導,并交由國家機關使用,在控辯關系中,無疑強化了控方的資源配置,使原本相對失衡的控辯關系進一步向控方進行優(yōu)勢傾斜。所以要在司法人工智能的語境下實現控辯平等原則,除了算法平等,還要保證人工智能資源在控辯雙方間實現平等配置。
第四,機器有限制約原則。在司法裁判與司法證據推理領域引入人工智能系統(tǒng),除提升司法裁判效率外,還需對訴訟運行過程中法官自由心證形成一定程度的監(jiān)督與制約。制約性方面,正如有學者認為:“人工智能……其積極影響包括但不限于: 第一,人工智能可以對偵查階段即存在的主觀臆斷或傾向性意見進行有效提示,利用相對客觀中立的監(jiān)控,對認知偏見進行干預; 第二,人工智能可以對證據的似真概率進行推算,避免辦案人員片面相信或否定某一證據之證據能力或證明力; 第三,人工智能可以對訴訟過程中的不規(guī)范行為進行監(jiān)控,避免人為因素干擾程序公正與實體公正的兌現?!?59)謝澍:《人工智能如何“無偏見”地助力刑事司法》,《法律科學》(西北政法大學學報),2020年第5期。但制約原則需要保證有限性:一方面是制約范圍有限,因為當前人工智能技術尚存較大缺陷,需要區(qū)分人工智能在司法證據推理中的優(yōu)勢領域,將人工智能對司法權的制約性限定在其優(yōu)勢領域。另一方面是制約權限有限,限于技術不足、司法倫理規(guī)范,當前司法人工智能只能賦予其輔助性地位,對司法裁判、司法證據推理提供輔助性審查指引,而不能賦予其最終決策權。
1.人工智能輔助的梯度性
當前,人工智能正由淺入深地介入到證據推理工作中。由低階到高階梯度性建構起人工智能司法證據推理體系,使人工智能在不同程序階段、不同類型案件中合理輔助司法證據推理。
人工智能在司法證據推理中的輔助性內容應當由低階到高階分為四個梯度:第一梯度,輔助獲取證據信息。一方面建立起大數據資源庫,對于證據標準的具體適用、辦案經驗、罪名要件、案件信息、電子卷宗、裁判文書、指導案例等進行結構化數據改造并存儲,以供法官查詢;另一方面,利用智能圖文識別系統(tǒng)、智能語音識別系統(tǒng)參與到庭審中,對審判信息進行全場景獲取與記錄,以供控辯審三方隨時調用。第二梯度,輔助提供證據指引。一方面對某一類案件需要哪些證據做出清單式規(guī)定,另一方面在不同訴訟階段,分別列舉證據標準,根據證據標準,從證據鏈條、待證事實及證據印證方面對證據收集的種類、數量作出指引。第三梯度,輔助審查司法證據推理錯誤。一方面是進行單一證據校驗,以上?!?06系統(tǒng)”為例,對于收集到的每一項證據均從程序、形式和內容三個方面進行比對校驗,生成審查結論,做出瑕疵證據補正或說明的指引;另一方面,對于法官作出的司法證據推理過程和結果進行整體逆向性勘誤,檢查是否符合邏輯規(guī)律,是否符合經驗法則,是否做到了同案同判的一致性等。第四梯度,輔助正向司法證據推理?;谌斯ぶ悄芟到y(tǒng)的基礎數據庫,結合全場景獲取與記錄的審判中的信息,利用人工智能算法、智能圖文識別系統(tǒng)、智能語音識別系統(tǒng)對于司法證據推理的過程與結果進行正向建構,并依據法律規(guī)定與具體書寫規(guī)范完整生成法律文書中的司法證據推理部分。
圖1 人工智能參與司法證據推理的梯度體系
2.司法人工智能梯度性輔助體系的建構
人工智能在司法證據推理中的輔助性地位,在不同類型案件、案件的不同階段,機器輔助的梯度性和制約性應當有所區(qū)分。
第一, 在不同復雜程度的案件中,區(qū)分機器輔助的梯度性。簡單案件和復雜案件的區(qū)分應當以人工智能的技術特點為標準,當前的人工智能技術長于形式邏輯推理,但由于“統(tǒng)計學”基礎上的大數據學習存在有限性和偏見,以及缺乏對人類直覺思維、形象思維的有效模擬,人工智能并不擅長司法證據推理中的價值權衡與經驗應用領域,當案件涉及這一領域,應當定性為疑難案件從而減少人工智能作為輔助工具的參與范圍和對法官的制約性。在簡單案件的審理中,應當讓人工智能更加廣泛地輔助法官進行司法證據推理,使人工智能全方位地參與證據信息獲取、司法證據推理結果證成,讓人工智能從第一梯度到第三梯度全面參與到司法證據推理中來。同時賦予人工智能司法證據推理一定的制約性,當人工智能在司法證據推理中與人類法官產生差異,應當建立起有效的分歧解決機制。但在復雜案件審理中,囿于當前人工智能的技術有限性,人工智能在輔助的廣泛性和制約性上應當有所限縮,例如僅進行第一梯度和第二梯度層面上的證據信息的輔助獲取以及證據收集指引工作,在復雜案件中應樹立人類法官在司法證據推理中的絕對權威,保證訴訟公正與訴訟效率最大化,避免對法官的錯誤性誘導。
第二, 在民事和刑事案件中,區(qū)分機器輔助的梯度性。在案件司法證據推理中,民事案件的“優(yōu)勢證據”證明標準低于刑事案件的“排除合理懷疑”的證明標準,這導致了三項差異:其一是民事案件證明難度相對更低,其二是民事案件對于司法證據推理錯誤的容忍度相對更高,其三是民事案件對于經驗推理的概然性要求相對更低。比較而言,當前的人工智能司法證據推理精度不高的技術特點更加契合民事案件的證明特點,在民事案件中的輔助性定位應當高于刑事案件,賦予人工智能系統(tǒng)更大的參與性與制約性。
第三, 在刑事案件的不同階段,區(qū)分機器輔助的梯度性。在程序運行的具體層面,偵查、審查起訴以及審判程序中的一審、二審、再審程序,對于人工智能輔助辦案的梯度性使用應當有所區(qū)分。首先,在偵查、審查起訴程序當中,人工智能在法律事實方面的輔助性工作應當僅限于輔助性獲取證據信息、輔助性提供證據指引,而不適于利用人工智能系統(tǒng)進行司法證據推理正向建構的工作,即只進行第一第二梯度的輔助。一方面由于公檢法往往所使用的是同一套人工智能系統(tǒng),提前讓人工智能完全介入司法證據推理會沖擊審判中心主義和庭審實質化的基本要求,另一方面也會給法官造成不當的暗示與引導,使法官機械裁判以制造與已經生成的人工智能司法證據推理結果的耦合。其次,如果人工智能已經介入了一審審判的司法證據推理之中,在二審與再審過程中應當排除人工智能的使用,司法人工智能系統(tǒng)往往由高院統(tǒng)一發(fā)布與管控,其下各級法院的人工智能算法基本一致,如果放任同一套算法的人工智能系統(tǒng)反復介入司法裁判的司法證據推理之中并對審判人員形成影響,會導致當事人審級利益難以得到保障。最后,司法人工智能系統(tǒng)參與司法證據推理應當在庭審調查結束之后,根據錄入的案卷與庭審信息對法官的判決進行逆向性勘誤與糾偏,而非在法庭調查之前前置性地形成司法證據推理結果,這既可能導致庭審流于虛置,也會對法官心證造成不合理引導,放大當前人工智能算法缺陷與不足所帶來的危害。當前,由于人工智能技術的不足以及政治適當性的考慮,應當將第四梯度的人工智能輔助規(guī)避在訴訟程序全過程之外。
3.人工智能輔助事實認定的程序性保障
人工智能參與事實認定就程序保障方面而言,首先要貫徹公開審判原則,公開審判過程。在刑事司法人工智能時代,在技術正當程序理論中,透明不僅包括程序公開,更涵蓋司法數據的公開以及算法的開源,更多地指向算法黑箱問題。(60)李訓虎:《刑事司法人工智能的包容性規(guī)制》,《中國社會科學》,2021年第2期。針對算法不透明所造成的程序不公正問題,公開計算機程序的源代碼,釋放更大的透明度以幫助外部研究人員進行研判,幫助訴訟各方增加對系統(tǒng)的知情權,使人工智能進行事實認定的過程和結果具有可論證性、可辯護性、可預測性。
重點在于保障人工智能事實認定結果的“可審查性”,建立“信息存檔”機制,所謂“可審查性”與“信息存檔”是指保存從證據收集到最終事實認定的所有機器信息,以便在遇到正當程序挑戰(zhàn)時訪問這些信息進行信息審查,這些信息既包括人工寫入的代碼,也包括機器自動生成的代碼(即“代碼編寫的代碼”),即將實現算法的完整代碼集進行存檔,供審查時過程重現與性能檢視。(61)See John Villasenor , Virginia Foggo, “Artificial Intelligence, Due Process and Criminal Sentencing”, Michigan State Law Review, vol.2020, no.2(May 2020), pp.295-354.對于信息存檔載體,應當在技術進步的今天,拋棄實物載體,如計算機存儲、硬盤存儲等,走向云存儲,提升存儲效率與便捷性,建立起司法區(qū)塊鏈存檔機制,利用簽名驗簽、電子身份認證、數據加解碼技術,結合區(qū)塊鏈技術的“去中心化”的特點,實現安全防護、數據防篡改以及審計留痕。(62)See John D. Gregory, “The Authentication of Digital Legal Records”, EDI Law Review, vol.47, no.6(April 1999), pp.47-72.
隨著人工智能技術的高速發(fā)展,人工智能技術與司法裁判的結合也正如火如荼地展開,從輔助性查詢、審核等簡單性、重復性工作,逐漸向具備預測性、決策性、創(chuàng)造性特征的司法證據推理輔助這一人類思維“深水區(qū)”過渡。(63)栗崢:《人工智能與法律事實認定》,《法學研究》,2020年第1期。人工智能長于形式邏輯和數學運算,但短于非結構化數據的提取與識別,在運用經驗思維、靈感思維方面尚存諸多不足。而司法證據推理需要邏輯思維、經驗思維以及靈感思維的綜合靈活運用。當前人工智能在證據推理中的定位應當限定為輔助性角色。在人工智能與司法裁判中司法證據推理工作的結合過程中,需將人工智能、人類思維與司法證據推理的特點進行異同分析,在對照的基礎上,使人工智能在合理限度之內輔助司法證據推理活動,梯度性地介入到不同類型、不同性質的案件及案件的不同階段當中。既最大程度發(fā)揮人工智能技術特點,提升司法證據推理效率,制約法官恣意裁判,也要守住司法裁判底線,全面貫徹公正、公開、以審判為中心等基本司法原則。人工智能深度且有效地介入司法裁判與法律事實裁判當中,需要技術發(fā)展與制度創(chuàng)新形成合力,辨析技術之應與實踐之需,建立起人工智能分階段、分層級的司法證據推理輔助的梯度模式,更好彰顯數字之治的價值與優(yōu)勢?!?/p>