□ 楊繼文 范彥英
內(nèi)容提要 大數(shù)據(jù)時代到來,對證據(jù)和事實的關(guān)系需要重新審視。中國新時代司法體制改革的急迫性和必要性,在司法實踐中突出地表現(xiàn)為以電子證據(jù)為核心的大數(shù)據(jù)證據(jù)新時代訴求。大數(shù)據(jù)證據(jù)是一種電子證據(jù),具有特殊的事實認定機制,大數(shù)據(jù)的良好應(yīng)用可以提升審判體系中事實認定的能力。以大數(shù)據(jù)和電子證據(jù)為主要特征的新證據(jù)時代變革,需要重點關(guān)注大數(shù)據(jù)證據(jù)的事實認定基本原理。在事實認定能力提升的目標要求下,大數(shù)據(jù)證據(jù)的良好應(yīng)用有利于提高事實裁判者的司法認知能力,逐步形成從人工到智能的事實認定路徑,但需要注意大數(shù)據(jù)在證據(jù)與事實關(guān)系之間的限度和保障機制。在新證據(jù)時代背景下的大數(shù)據(jù)事實認定機制,強調(diào)更新事實認定思維、重構(gòu)事實認定過程、完善證據(jù)體系和優(yōu)化電子證據(jù)采信規(guī)范應(yīng)用。
在當(dāng)今社會,科技的發(fā)展和信息技術(shù)的進步已經(jīng)日益影響到人類的生產(chǎn)和生活活動。在信息爆炸的天文學(xué)和基因?qū)W等學(xué)科中,逐步產(chǎn)生和發(fā)展出了人類目前所日益期許的“大數(shù)據(jù)”概念①和“領(lǐng)域大數(shù)據(jù)”理論②。大數(shù)據(jù)時代的到來,使得我們的動作、行為、位置乃至每一個人的身體變化表現(xiàn)等構(gòu)成了可以被分析和計算的數(shù)據(jù),③應(yīng)用計算機技術(shù)檢索史料、收集信息,使得對史料的獲取和把握與傳統(tǒng)考據(jù)學(xué)時代大為不同,業(yè)已帶來史學(xué)方式的革新。④為了適應(yīng)和發(fā)展互聯(lián)網(wǎng)大數(shù)據(jù)時代的發(fā)展,我們的法律理念、法律行為和法學(xué)研究應(yīng)該進行一體融合的構(gòu)建。⑤我國的司法體制改革呈現(xiàn)出信息時代的背景和科技性特點,目前疫情期間的線上訴訟⑥更加促使“司法主動擁抱大數(shù)據(jù)和人工智能”,并成為我國司法體制改革迭代發(fā)展和證據(jù)學(xué)轉(zhuǎn)型升級的基本路徑之一。例如,司法部、最高法以及相關(guān)司法案例中,都已經(jīng)體現(xiàn)了大數(shù)據(jù)對傳統(tǒng)審判體系和事實認定方式的革命性重構(gòu)特征。在“奇虎訴騰訊”⑦一案中,人民法院肯定了大數(shù)據(jù)分析結(jié)果作為證據(jù)使用的合法性。
進而,在大數(shù)據(jù)時代審判體系的證據(jù)學(xué)應(yīng)用中,傳統(tǒng)意義上的片面數(shù)據(jù)、抽樣數(shù)據(jù)乃至局部數(shù)據(jù)的證據(jù)材料,將可能發(fā)生技術(shù)迭代和轉(zhuǎn)變更新。⑧證據(jù)研究和司法裁判一般通過經(jīng)驗法則、 邏輯推理和法律真實價值觀進行事實認定。⑨而大數(shù)據(jù)證據(jù)一般都是大樣本的證據(jù)數(shù)據(jù)和案件信息,并且可以通過建立智能模型以及介入案件事實認定,⑩來對案件當(dāng)事人的各種信息和數(shù)據(jù)進行“電子畫像”和可視化呈現(xiàn)?,從而發(fā)現(xiàn)犯罪線索、證據(jù)信息或者犯罪嫌疑人。?“線上電子方式作為一種訴訟載體,對當(dāng)事人、訴訟權(quán)利、訴訟程序、訴訟階段等其他訴訟活動組成部分產(chǎn)生影響,應(yīng)在影響力分析基礎(chǔ)上構(gòu)建電子訴訟適用的共性規(guī)則?!?在當(dāng)前逐步發(fā)生并發(fā)展著的大數(shù)據(jù)證據(jù)應(yīng)用,并基于大數(shù)據(jù)特征創(chuàng)新的證明與事實認定規(guī)則?,形成了以大數(shù)據(jù)和電子證據(jù)為主要特征的新證據(jù)時代變革。大數(shù)據(jù)視域下的電子數(shù)據(jù)有迥異于傳統(tǒng)實物證據(jù)的特征,并突出表現(xiàn)在高度依賴性、高科技性以及變動無跡性等方面。?例如,大數(shù)據(jù)分析技術(shù)的出現(xiàn),通過對海量數(shù)據(jù)進行篩選、匯總、提煉、形成結(jié)論并作為證據(jù)在職務(wù)犯罪案件監(jiān)察調(diào)查、審查起訴、審判中使用,緩解職務(wù)犯罪案件“口供中心主義”的調(diào)查慣習(xí)對被調(diào)查人權(quán)利造成的威脅?。
本文在智能法學(xué)?背景下重點關(guān)注大數(shù)據(jù)證據(jù)的事實認定問題。大數(shù)據(jù)證據(jù)及其事實認定機制研究,是國家治理現(xiàn)代化的時代要求,是司法現(xiàn)代化的現(xiàn)實要求,也是科學(xué)司法的內(nèi)在規(guī)律要求。大數(shù)據(jù)證據(jù)的良好應(yīng)用,有利于更新事實認定路徑。以電子證據(jù)為核心的大數(shù)據(jù)證據(jù)的分析算法將從“因果分析”發(fā)展到“關(guān)聯(lián)分析”,體現(xiàn)為從規(guī)范型到實證型、 從主觀型到客觀型和從相對型到確定型的事實認定模式轉(zhuǎn)變。最終,在證據(jù)與事實關(guān)系之間的連接限度和保障適用背景下,大數(shù)據(jù)證據(jù)是一種電子證據(jù),并具有較為特殊的事實認定原理,主要包括大數(shù)據(jù)證據(jù)的屬性定位、事實認定技術(shù)邏輯、模式轉(zhuǎn)型與路徑依賴。
一般認為,大數(shù)據(jù)證據(jù)的基礎(chǔ)是大樣本意義上的海量數(shù)據(jù),并通過這些數(shù)據(jù)信息對案件事實進行判斷、證明和認定,在司法實踐中主要體現(xiàn)為大數(shù)據(jù)分析報告等基本形式。理論界和實務(wù)界對大數(shù)據(jù)證據(jù)存在著不同的理論爭論和實務(wù)處理,如書證說、鑒定意見說、證人證言說、電子證據(jù)說以及獨立證據(jù)說等。例如,有學(xué)者認為:“考慮到大數(shù)據(jù)證據(jù)具有專業(yè)性和科學(xué)性,中國現(xiàn)實的便宜選擇是將其納入鑒定意見的證據(jù)法定形式?!?還有學(xué)者認為:“面對大數(shù)據(jù)證明及其技術(shù)方法,我國的《司法鑒定程序通則》規(guī)定進行細化,使大數(shù)據(jù)證據(jù)和建模等新興技術(shù)方法得以合規(guī)合法地進入司法鑒定領(lǐng)域并發(fā)揮其應(yīng)有的價值。”?還有學(xué)者認為:“在司法實踐中的資金大數(shù)據(jù)偵查,本質(zhì)上是進行了模型分析和電腦算法應(yīng)用,與靜態(tài)意義的電子數(shù)據(jù)存在明顯的區(qū)別。我認為應(yīng)當(dāng)將這種大數(shù)據(jù)分析納入司法鑒定范疇?!?有學(xué)者認為,大數(shù)據(jù)證據(jù)的證據(jù)屬性,以“綜合性”和“重方法”作為其與傳統(tǒng)證據(jù)種類的區(qū)別點,應(yīng)當(dāng)視為獨立的證據(jù)種類。
筆者認為,對證據(jù)和事實關(guān)系的大數(shù)據(jù)分析,在新時代司法體制改革中具有急迫性和必要性,在司法實踐中突出地表現(xiàn)為以電子證據(jù)為核心的新證據(jù)時代訴求?!霸谖磥淼淖C據(jù)法當(dāng)中,大數(shù)據(jù)分析報告有必要單列出來作為獨立的證據(jù)種類,而大數(shù)據(jù)中那些跟案件相關(guān)的數(shù)據(jù)信息,可以納入‘電子數(shù)據(jù)’這一既有的法定證據(jù)種類范疇。”本文認為,大數(shù)據(jù)證據(jù)本質(zhì)上是一種電子證據(jù),具有特殊的事實認定機制,主要理由包括以下幾個方面的內(nèi)容。
第一,大數(shù)據(jù)促使電子證據(jù)的迭代發(fā)展和新證據(jù)時代變革。在當(dāng)今證據(jù)法學(xué)的新時代,案件中的各種當(dāng)事人信息、 數(shù)據(jù)載體和生活軌跡等日常生產(chǎn)生活行為都被數(shù)據(jù)化了。這些數(shù)據(jù)和信息,在智能算法和關(guān)聯(lián)比對中進行串聯(lián)溝通,形成證據(jù)法學(xué)所日益期許的信息資源與數(shù)據(jù)庫,這將有利于克服證據(jù)法學(xué)中的信息數(shù)據(jù)資源稀缺的根本矛盾,如圖一。這從技術(shù)上有力地回應(yīng)了學(xué)界所強調(diào)的“證明資源有限”之基本矛盾。這種大數(shù)據(jù)證據(jù)的算法分析與事實認定,可以獲得比神示證據(jù)時代、 人證證據(jù)時代和物證證據(jù)時代等都要明顯的技術(shù)優(yōu)勢和競爭能力。因此,基于大數(shù)據(jù)信息分析而形成的報告,雖然具有鑒定意見意義上的專業(yè)性和科學(xué)性,但它只是這種證據(jù)材料的具體表現(xiàn)載體和形式之一,實質(zhì)意義上是與案件具有關(guān)聯(lián)性的信息數(shù)據(jù),因而是一種基于關(guān)聯(lián)數(shù)據(jù)性的證據(jù)材料,可以作為一種獨立的證據(jù)種類。
圖一 事實認定的大數(shù)據(jù)分析進路
第二,大數(shù)據(jù)證據(jù)是電子證據(jù)的一種體現(xiàn)。在大數(shù)據(jù)時代的證據(jù)材料,較為鮮明地體現(xiàn)為“線上” 的各種數(shù)據(jù)和信息,人們的生產(chǎn)生活方式在“線上”往往體現(xiàn)為“電子鏡像”和各種數(shù)據(jù)資源。而這種“電子鏡像”是案件當(dāng)事人“人物畫像”中的“數(shù)據(jù)畫像”表現(xiàn)載體之一?!皵?shù)據(jù)畫像”則體現(xiàn)為案件中電子證據(jù)的迭代升級和大數(shù)據(jù)分析的結(jié)果。也就是說,基于電子證據(jù)的“數(shù)據(jù)畫像”,與案件中的其他證據(jù)材料進行關(guān)聯(lián)算法時,將產(chǎn)生越來越重要的案件事實判斷和認定價值,形成大數(shù)據(jù)時代的電子證據(jù)新載體。
第三,大數(shù)據(jù)證據(jù)作為電子證據(jù),具有特殊的事實認定框架和原理。一方面,作為電子證據(jù)的大數(shù)據(jù)證據(jù),有利于司法案件中的事實認定經(jīng)驗推論過程的可視化。事實作為證據(jù)法的邏輯起點,包含著事實認定中各種問題的胚芽,其固有特性特別是經(jīng)驗性之歷史展開,則塑造了證據(jù)的基本屬性,也決定了事實認定必然是一個經(jīng)驗推論過程。例如,大數(shù)據(jù)的直接運用模式是將其原始載體或等量復(fù)制數(shù)據(jù)直接作為證據(jù)使用,而間接運用模式是將篩出的“小” 數(shù)據(jù)或分析結(jié)論作為證據(jù)使用。另一方面,對電子證據(jù)及其所要證明的事實進行大數(shù)據(jù)分析,將豐富和發(fā)展我國證據(jù)制度和證據(jù)體系的基本知識和概念結(jié)構(gòu),有利于中國證據(jù)法學(xué)者提出新的學(xué)術(shù)命題和具體應(yīng)用相關(guān)證據(jù)規(guī)則體系,進而實現(xiàn)我國證據(jù)法學(xué)乃至司法科學(xué)的轉(zhuǎn)型升級。例如,在互聯(lián)網(wǎng)法院審判過程中,對司法中的證據(jù)和事實進行大數(shù)據(jù)分析,將提高對案件證據(jù)材料和數(shù)據(jù)信息的利用程度,實現(xiàn)證據(jù)材料收集的全覆蓋、證據(jù)相關(guān)數(shù)據(jù)的抽象化、證據(jù)材料的數(shù)據(jù)清洗、 證據(jù)與事實之間的多維數(shù)據(jù)庫建模等,在事實認定機制中實現(xiàn)證據(jù)與事實的可視化操作,最終能夠較為精確而完整地反映互聯(lián)網(wǎng)案件發(fā)生當(dāng)時的事實情況,有利于司法工作人員科學(xué)而全面地認定案件事實。
通過大數(shù)據(jù)提升事實認定能力,是深化司法改革的迫切要求,也是信息時代我國審判體系和審判能力更新和完善的重要契機之一。一方面,通過大數(shù)據(jù)來聯(lián)結(jié)證據(jù)與事實之間的關(guān)系,不僅能夠?qū)崿F(xiàn)案件證據(jù)與事實的統(tǒng)一認定,而且能夠在一定程度上使當(dāng)事人在司法過程中被平等地對待,有利于實現(xiàn)類案比對和同案同判。大數(shù)據(jù)證據(jù)及其事實認定機制研究,是司法現(xiàn)代化的現(xiàn)實要求。大數(shù)據(jù)時代的司法,需要重點關(guān)注的是同案以及案件事實的同判及其類案比對問題。也就是通過判例等大數(shù)據(jù)的分析和云計算,將案件事實的類案進行比對,進而達到統(tǒng)一適用法律和認定案件事實的目的。而且,通過大數(shù)據(jù)的實證分析,有利于提升信息時代法官事實認定能力,有利于提高我國司法的公信力和權(quán)威性。例如,在涉及證據(jù)的概率認定問題和原理中,需要明確的是這種概率證據(jù)是一種可以重復(fù)的驗證過程,并通過樣本空間的過程檢測和觀察來獲得。這鮮明地體現(xiàn)在司法裁判過程中的貝葉斯推理中。大數(shù)據(jù)在這些概率證據(jù)體系的事實認定和貝葉斯推理方面,具有積極的可能性和可重復(fù)性。通過大數(shù)據(jù)分析和實驗,可以使得任何特定“實現(xiàn)”都會在樣本空間中產(chǎn)生一個特定的結(jié)果,這是一個可以檢驗的、理性的和可以被理解的事實認定過程。而審判體系完善和審判能力提升的關(guān)鍵環(huán)節(jié)是事實認定問題,其提升和完善,有助于法院合理運用證據(jù)確定案件事實,更有利于各方當(dāng)事人解決糾紛和矛盾,進而推進國家治理中的各方主體之間的協(xié)調(diào)關(guān)系,有利于維護社會穩(wěn)定和司法良好秩序。
另一方面,大數(shù)據(jù)證據(jù)及其事實認定機制研究,是科學(xué)司法的內(nèi)在規(guī)律要求。在當(dāng)前我國深化司法體制改革的關(guān)鍵時期,通過大數(shù)據(jù)來提升事實認定能力,有利于司法實踐中的證據(jù)裁判和量刑事實等環(huán)節(jié)達到或者逐步達到“科學(xué)司法”的目的,這正如日本所謂的“精密司法”一樣,追求的價值是“無限接近”的個案公平正義。進而,大數(shù)據(jù)證據(jù)分析是一種“互聯(lián)網(wǎng)+”時代的證據(jù)方法和事實認定機制。首先,傳統(tǒng)法院審判中的事實認定機制,主要依賴的是案件證據(jù)與事實的因果關(guān)系思維,注重的是邏輯推理和前因后果關(guān)系分析。而事實認定的大數(shù)據(jù)分析則是基于關(guān)聯(lián)關(guān)系分析的“互聯(lián)網(wǎng)+”時代的一種嶄新事實認定機制,是一種各種信息整體意義上的“數(shù)據(jù)統(tǒng)治者”,獲得的是基于各種待證數(shù)據(jù)和信息的案件整體證明結(jié)果。其次,事實認定機制的大數(shù)據(jù)分析,是一種將證據(jù)電子化、信息化和數(shù)據(jù)化的智能證據(jù)方法,有利于解決目前司法實踐中的科學(xué)證據(jù)和電子證據(jù)適用等難點問題。再次,事實認定機制的大數(shù)據(jù)分析和云計算,將更新事實認定—事實認知—證據(jù)認知的體系,將會提高預(yù)測事實認定的精準程度,為案件事實的裁判提供精準決策。這正如有學(xué)者所言:“大數(shù)據(jù)與云計算是一個問題的兩面: 一個是問題,一個是解決問題的方法。通過云計算對大數(shù)據(jù)進行分析、預(yù)測,會使得決策更為精準,釋放出更多數(shù)據(jù)和信息的隱藏價值。”
一般認為,事實存在案件事實與法律事實的類型劃分,也涉及已經(jīng)生效的司法裁判與法律適用的關(guān)系問題。而在以大數(shù)據(jù)為背景知識的新證據(jù)時代,通過大數(shù)據(jù)提升的事實認定能力中的事實,主要界定為案件事實,因此與現(xiàn)實生活的事實及客觀真實存在一定的差距,這也符合認識論的原理要求。大數(shù)據(jù)提升事實認定能力的目標體系有主要目標和終極目標兩種。前者強調(diào)的是通過大數(shù)據(jù)來進行事實認定,主要目標在于無限地還原案發(fā)現(xiàn)場的事實狀態(tài),如案件發(fā)生時人的狀態(tài),行為人、被害人、第三人、證人的基本情況;行為的樣態(tài)與結(jié)果的關(guān)系; 案件發(fā)生時的時間和地點等五核要素。由于案件事實是已經(jīng)發(fā)生的歷史事件,通過大數(shù)據(jù)和云計算將無限地接近于案發(fā)當(dāng)時的狀況,有利于法官等事實認定者以現(xiàn)在的眼光來認定過去的案件。而且,從技術(shù)上來看,大數(shù)據(jù)分析將突破原來的三維空間,通過大數(shù)據(jù)的云計算,即通過所謂大數(shù)據(jù)的2.0 版來實現(xiàn)。這正如有學(xué)者所認為的,基于語義理解和高度智能化的“大智慧”信息系統(tǒng),將人類的思維推進到四維空間,有利于保存案件發(fā)生進程的原始事實狀態(tài),將已經(jīng)發(fā)生的三大類糾紛,調(diào)取至云計算的信息或者數(shù)據(jù),并從技術(shù)上“還原”案件的事實狀態(tài)。后者則表現(xiàn)為:通過大數(shù)據(jù)來進行事實認定,不僅使得以電子證據(jù)為核心的證據(jù)體系日益科學(xué)和精確,而且它的終極目標在于通過大數(shù)據(jù)來推進和實現(xiàn)社會公眾的法治信仰。
在大數(shù)據(jù)時代,大數(shù)據(jù)與司法的關(guān)系問題,本質(zhì)上是科技與法律、 人工與智能的關(guān)系問題。因此,通過大數(shù)據(jù)提升事實認定能力,關(guān)鍵在于掌握從人工到智能的技術(shù)節(jié)點和應(yīng)用規(guī)律,進而實現(xiàn)審判體系事實認定的相對準確性。因此,事實認定路徑可以從是否適用大數(shù)據(jù)和云計算等技術(shù)工具為標準,區(qū)分為人工型事實認定路徑和智能型事實認定路徑。
一方面,人工型事實認定路徑可能存在一定的主觀模糊性,在某種意義上難以為雙方當(dāng)事人所接受和認同,難以實現(xiàn)社會公眾共同的法治信仰。而這種人工型的事實認定機制,同時還存在一定的不確定性,“英美法系國家的排除一切合理懷疑,以及大陸法系國家的內(nèi)心確信無疑,一般都需輔之以相關(guān)法律規(guī)則保障手段和技術(shù)保證機制”。
另一方面,以大數(shù)據(jù)分析為代表的智能型事實認定路徑具有特殊的科技視角和一定的可檢驗性、相對確定性、還原性、可視化和多維性等特征。大數(shù)據(jù)證據(jù)的事實認定基礎(chǔ)在于數(shù)據(jù)與事實之間實現(xiàn)關(guān)聯(lián)和共享。而在事實認定路徑過程中,基于大數(shù)據(jù)證據(jù)共享分析的“數(shù)據(jù)經(jīng)驗”在一定程度上有利于填補人類對繁雜信息的認知能力不足問題,能夠在一個更完整的故事框架中解決案件的爭議焦點,有利于避免前述貝葉斯理論中主觀概率計算的參考類選擇難題?!按髷?shù)據(jù)相關(guān)性強調(diào)數(shù)據(jù)間的關(guān)聯(lián),基于全量數(shù)據(jù)分析,規(guī)?;瘮?shù)據(jù)處理能力是人的經(jīng)驗和理性無法勝任的任務(wù),強調(diào)法律人的經(jīng)驗和邏輯理性的證據(jù)相關(guān)性規(guī)則將被取代?!?/p>
一般認為,司法認知主要涉及事實裁判者根據(jù)有限的證據(jù)信息進行事實判斷決策的過程,在認知心理結(jié)構(gòu)上來看是直覺心智、 算法心智和反思心智的互動結(jié)果。事實裁判者在認定案件事實時,往往應(yīng)用自己的經(jīng)驗法則進行司法認知,但是容易出現(xiàn)所謂的“認知偏差”問題。這突出地體現(xiàn)為經(jīng)驗的“限制性”。在大數(shù)據(jù)證據(jù)的司法認知判斷過程中,即使是在純粹的關(guān)于計算機的技術(shù)實現(xiàn)問題的工作中,也是隱含的,這種限制的表現(xiàn)形式是每當(dāng)數(shù)據(jù)機器被設(shè)計得能做“智能的” 工作時,關(guān)于任務(wù)結(jié)構(gòu)的經(jīng)驗事實以及人類對于任務(wù)類的理解,就被偷偷地放了進去。法官作為“人”,難免受到人類思維活動的影響而出現(xiàn)“錨定效應(yīng)”式的先見偏見和“決策慣性”式的后見偏見等。因此,在大數(shù)據(jù)證據(jù)與司法認知的關(guān)系方面,通過數(shù)據(jù)以及算法分析一定程度上能夠改善經(jīng)驗推定的偏見弊端,尤其是體現(xiàn)在對法官進行統(tǒng)計學(xué)和決策理論的訓(xùn)練方面。
而在大數(shù)據(jù)證據(jù)的具體應(yīng)用過程中,需要重點考量數(shù)據(jù)機器思維與事實認定者司法認知之間的關(guān)系問題。如果事實裁判者將人類的認知偏見,通過數(shù)據(jù)統(tǒng)計以及算法分析轉(zhuǎn)移給大數(shù)據(jù)證據(jù)材料及其人工智能產(chǎn)品,可能會形成“認知偏見”意義上的“數(shù)據(jù)偏見”與“算法偏見”。因此,大數(shù)據(jù)證據(jù)的司法適用,需要在保證司法認知“無偏見”的背景下,進行案件事實認定的判斷和證明,充分發(fā)揮大數(shù)據(jù)證據(jù)的輔助證明作用和整體主義判斷思維,提高事實裁判者的司法認知能力。在人類主導(dǎo)的底線要求下不得動搖人類作為司法決策者的主體地位,接受來自算法的支持而非支配,避免隱藏在人工智能產(chǎn)品中的“認知偏見”對司法實踐帶來難以控制的負面效應(yīng)。
一方面,大數(shù)據(jù)證據(jù)事實認定有其內(nèi)部限度。首先,數(shù)據(jù)的收集、計算處理等存在技術(shù)限制。在新證據(jù)時代,由電子數(shù)據(jù)和電子證據(jù)所形成和完善的全樣本意義上的法律大數(shù)據(jù)存在一些內(nèi)部限度問題和困難。例如,“數(shù)據(jù)采集方式有待提高,數(shù)據(jù)的完整程度不夠高和數(shù)據(jù)不開放、不貫通?!边€可能出現(xiàn)數(shù)據(jù)信息認知的偏差問題以及信息傳遞和傳導(dǎo)過程的可靠性問題等。其次,數(shù)據(jù)技術(shù)發(fā)展的滯后性,需要不斷推進技術(shù)更新和完善,否則無法進行精確的類案比對。再次,數(shù)據(jù)處理系統(tǒng)與法律語言知識體系之間存在隔閡。也就是說,在技術(shù)與法律、系統(tǒng)與法律之間存在一定的不匹配??傮w上看,這種大數(shù)據(jù)事實認定的內(nèi)部局限性,“需要我們予以高度重視。這是因為,我們比想象中更容易受到數(shù)據(jù)的統(tǒng)治——讓數(shù)據(jù)以良莠參半的方式統(tǒng)治我們。其威脅就是,我們可能會完全受限于我們的分析結(jié)果,即使這個結(jié)果理應(yīng)受到質(zhì)疑。我們會形成一種對數(shù)據(jù)的執(zhí)迷,因而僅僅為了收集數(shù)據(jù)而收集數(shù)據(jù),或者賦予數(shù)據(jù)根本無權(quán)得到的信任”。
另一方面,大數(shù)據(jù)證據(jù)事實認定存在外部限度。首先,需要明確的是大數(shù)據(jù)與全數(shù)據(jù)的偏差問題。例如,這種偏差或者偏差系數(shù)是否屬于合理的范圍。其次,需要的是全數(shù)據(jù)對大數(shù)據(jù)的檢驗與糾錯,防止司法實踐中的以偏概全。再次,現(xiàn)代智能法學(xué)背景下的計算法學(xué)和電子證據(jù)應(yīng)用,還是沒有擺脫大數(shù)據(jù)事實認定機制智能化的技術(shù)瓶頸。例如,電子數(shù)據(jù)和電子證據(jù)的大數(shù)據(jù)分析和智能算法,需要對案件各種事實進行分詞運算和結(jié)構(gòu)化數(shù)據(jù)分析,而目前的技術(shù)水平難以達到司法適用的智能化程度。最后,前述所強調(diào)的法律語言與計算機術(shù)語存在語義理解和編譯原理的根本性差異,這將導(dǎo)致大數(shù)據(jù)智能運算分析難以進行對應(yīng)解釋,法律規(guī)范中的上下文與案件事實多樣性之間難以對答和模仿。這是因為,大數(shù)據(jù)的數(shù)據(jù)標準是結(jié)構(gòu)化的,類似于現(xiàn)實生活中的各種表格與具體內(nèi)容,因此它是精確的;而現(xiàn)實生活中的司法案件和各種事實,是非結(jié)構(gòu)化地呈現(xiàn)在司法者和大數(shù)據(jù)系統(tǒng)面前的,它是模糊的。此外,大數(shù)據(jù)證據(jù)的良好應(yīng)用,需要構(gòu)建大數(shù)據(jù)證據(jù)提升事實認定能力的保障機制,需要完善數(shù)據(jù)全量保障機制、數(shù)據(jù)管理與鑒真機制等。
在大數(shù)據(jù)與人工智能快速發(fā)展的智能法學(xué)背景下,以電子證據(jù)為核心的大數(shù)據(jù)證據(jù)的分析算法將從“因果分析”發(fā)展到“關(guān)聯(lián)分析”。在證據(jù)學(xué)的事實認定方面,大數(shù)據(jù)證據(jù)與其他社會科學(xué)的數(shù)據(jù)一樣都被要求以交互表格的形式進行組織和關(guān)聯(lián)分析。例如,在社會學(xué)方面,教育水平和職業(yè)的關(guān)系存在性別差異、社會網(wǎng)絡(luò)中的友誼模式、擇偶中的跨國因素和時間變化;而在心理學(xué)方面,存在關(guān)于刺激識別和刺激類化的實驗數(shù)據(jù)。因此,盡管我們所關(guān)心的是探索它們的因果性質(zhì)和系統(tǒng)性聯(lián)系,但是有時應(yīng)用的這種統(tǒng)計分析工具在理解證據(jù)與事實關(guān)系的意義及其復(fù)雜性方面卻存在困難,基于大數(shù)據(jù)的關(guān)聯(lián)分析和交互結(jié)構(gòu)才是向前看的事實認定組織體系。進一步來看,大數(shù)據(jù)分析在證據(jù)和事實的認定方面,主要是基于數(shù)據(jù)和計算的關(guān)聯(lián)分析模型。這種關(guān)聯(lián)模型需要在功能、形式和維度方面進行交互和整合。對于若干證據(jù)類型和電子數(shù)據(jù)的提取以及線性方程分析,可以使得事實認定者了解案件事實信息的數(shù)據(jù)增量和單向時間發(fā)展關(guān)系。而通過混合式的多維度形式計算和大數(shù)據(jù)分析,使得案件中的證據(jù)與事實之間形成一種所謂的立體式的“交互模式”,將單向關(guān)系發(fā)展為可以表現(xiàn)體系性的證據(jù)信息數(shù)據(jù)的關(guān)聯(lián)模型,進而可以使得事實認定者能夠在復(fù)雜而難以被認知的案件證據(jù)材料當(dāng)中,尋找到證據(jù)與事實之間的恰當(dāng)?shù)捻樞蚺帕小?/p>
在涉及法律和司法應(yīng)用的大數(shù)據(jù)研究中,人們關(guān)注的是研究者和事實認定者是否僅是依據(jù)樣本數(shù)據(jù)而非整個總體而做出判斷和裁決。在證據(jù)與事實的復(fù)雜關(guān)系中,針對某一案件信息變量的電子證據(jù)數(shù)據(jù)分析和測算推斷,將會受到比簡單隨機抽樣情況下更復(fù)雜的抽樣變異的影響。而且,“當(dāng)案件的證據(jù)信息樣本規(guī)模較小的時候,線性化方法及其漸近假定可能是有問題的?!币虼?,在大數(shù)據(jù)背景下的證據(jù)制度和法學(xué)研究,也將如數(shù)據(jù)的指數(shù)增長一樣呈現(xiàn)出從傳統(tǒng)證據(jù)形式種類轉(zhuǎn)變?yōu)閿?shù)字化的電子證據(jù)形式?!艾F(xiàn)在幾乎所有數(shù)據(jù)的產(chǎn)生形式,都是數(shù)字化的。”而證據(jù)法學(xué)中的證據(jù)種類、 證據(jù)規(guī)則體系和證明路徑選擇也將不可避免地與大數(shù)據(jù)發(fā)生聯(lián)系。大數(shù)據(jù)證據(jù)的變革與發(fā)展,將隨著數(shù)據(jù)的爆炸、高清晰度的視頻以及傳感器的增加而逐步凸顯出來。
一方面,法官思維的大數(shù)據(jù)分析應(yīng)用和陪審員思維的大數(shù)據(jù)分析,是一種主導(dǎo)思維。在大數(shù)據(jù)時代,法官以及陪審員的事實認定的思維需要擴展,需要增加一種基于智能的輔助認定事實系統(tǒng)。這種大數(shù)據(jù)事實認定者在思維意義上的大數(shù)據(jù)思維,本質(zhì)上是一種關(guān)聯(lián)思維,具有查詢和輔助事實認定的機能,目的是使法官的事實認定思維更加精確。而通過大數(shù)據(jù)對于證據(jù)與事實關(guān)系的間接分析,廢除了因果類型歸屬思維的異質(zhì)性和歧義性,使我們獲得了能夠較為統(tǒng)一地理解證據(jù)與事實之間的關(guān)系方法。另一方面,事實認定的云計算思維和大數(shù)據(jù)思維,是一種輔助思維和參照思維。它的重要依托有兩個方面的內(nèi)容,一是大數(shù)據(jù),二是云計算。它的本質(zhì)在于智慧法學(xué)時代背景下的大數(shù)據(jù)事實認定的關(guān)聯(lián)思維和類比思維。這突出地表現(xiàn)在通過大數(shù)據(jù)來引導(dǎo)證據(jù)法學(xué)發(fā)展,也就是在討論物理世界時極其倚重自然科學(xué)的方法,并且采取某些影響深遠的“類比”,這些“類比”即便在最無關(guān)宏旨和最具個別性的問題上,也會引導(dǎo)現(xiàn)代法學(xué)。
“遵循大數(shù)據(jù)時代的關(guān)系思維進路,應(yīng)避免簡單的因果思維方式,尋求與事實裁判之確定直接相關(guān)的多種要素或數(shù)據(jù)?!蓖ㄟ^大數(shù)據(jù)在證據(jù)與事實之間產(chǎn)生關(guān)聯(lián)關(guān)系,主要運作的原理在于科學(xué)化事實認定思維,即通過法官+人民陪審員+智能計算機系統(tǒng)來進行事實認定的處理和運算。事實認定能力和思維與人類的認識能力密切相關(guān)。而在司法實踐中,事實認定的能力又與人類認識的原始思維、經(jīng)驗思維和邏輯思維產(chǎn)生關(guān)聯(lián),這種前因后果式的線性思維,本質(zhì)上是一種線性推理思維和維度。而在大數(shù)據(jù)證據(jù)事實認定機制中,存在的思維不是前因后果式的追溯性分析,而是基于關(guān)聯(lián)關(guān)系的互動性推理和分析。這需要將人工事實認定思維與智能大數(shù)據(jù)事實認定思維進行互動整合。
第一,從規(guī)范型事實認定模式到實證型事實認定模式。從傳統(tǒng)事實認定的模式來看,法律規(guī)范解釋性質(zhì)的規(guī)范型事實認定模式居于主導(dǎo)地位。它的基礎(chǔ)在于案件事實與證據(jù)之間的關(guān)系。而大數(shù)據(jù)分析性質(zhì)的實證型事實認定模式,基礎(chǔ)在于大量數(shù)據(jù)的統(tǒng)計和云計算的智能分析,具有實證的特征和思維,體現(xiàn)為對案件事實真實性的數(shù)據(jù)證實和信息檢驗,形成基于數(shù)據(jù)規(guī)模、樣本檢驗和關(guān)聯(lián)分析的大數(shù)據(jù)證據(jù)分析的意識和思維。
第二,從相對型事實認定模式到確定型事實認定模式。傳統(tǒng)審判體系中的事實認定模式是一種相對型的事實認定模式,具有一定程度的不確定性。而大數(shù)據(jù)事實認定模式,具有一定的數(shù)據(jù)確定性,是一種科學(xué)性的事實認定模式,因而具有可檢驗性。前者所謂的相對型事實認定模式,主要是從人工和經(jīng)驗的角度進行分析,法官等司法主體的事實認定,具有相對性的如證據(jù)材料、 自由心證、證據(jù)規(guī)則、經(jīng)驗法則、司法前見等要素影響。而從相對型到確定型的事實認定模式,主要是從證據(jù)視角的轉(zhuǎn)變來審視的,其能夠基本實現(xiàn)法律規(guī)則所要求的“基本的可信度”,這是由大數(shù)據(jù)和智能系統(tǒng)云計算挖掘而產(chǎn)生的較為科學(xué)的事實認定機制。
第三,從主觀型事實認定模式到客觀型事實認定模式。由于傳統(tǒng)事實認定模式主要依賴的是法官以及其他事實認定者的經(jīng)驗法則、 司法前見等主觀因素,因而具有典型的主觀性。而大數(shù)據(jù)的事實認定模式,具有前述所講的智能性、可視性、還原性,因而具有相當(dāng)大的客觀性和科學(xué)性,是一種客觀型的事實認定模式。這種客觀型事實認定模式集中地體現(xiàn)為事實認定和司法裁判的可預(yù)測性。而大數(shù)據(jù)的科學(xué)化事實認定過程,就使得人們準確而精確地預(yù)測案件結(jié)果成為了可能,體現(xiàn)為法律中的心理強制力而非主觀邏輯的推演。
通過大數(shù)據(jù)提升事實認定能力,一方面從證據(jù)視角能夠?qū)崿F(xiàn)從證據(jù)分析到大數(shù)據(jù)分析,有利于輔助案件事實認定; 另一方面能夠彌補傳統(tǒng)證據(jù)體系的不足,實現(xiàn)事實認定過程中科技與法律的良好互動關(guān)系。
首先,大數(shù)據(jù)證據(jù)的事實認定分析,能夠構(gòu)建證據(jù)推理結(jié)構(gòu)的大數(shù)據(jù)模型。傳統(tǒng)的證據(jù)推理結(jié)構(gòu),主要依賴的是經(jīng)驗和邏輯,如艾倫所主張的經(jīng)驗推論模型、威格莫爾所強調(diào)的圖式體系。這些證據(jù)推理結(jié)構(gòu)都是一種因果關(guān)系性質(zhì)的邏輯推演,而大數(shù)據(jù)證據(jù)體系的證據(jù)推理結(jié)構(gòu),主要為關(guān)聯(lián)性類案比對模型,它不是一種回溯性推理,而是多維的、向前看的關(guān)聯(lián)的立體推理。同時,大數(shù)據(jù)證據(jù)推理結(jié)構(gòu),能夠?qū)崿F(xiàn)證據(jù)推理和決策的計算模型,進而統(tǒng)一乃至預(yù)測事實認定的標準和尺度。
其次,大數(shù)據(jù)證據(jù)的事實認定分析,能夠促使證據(jù)規(guī)則完善及其應(yīng)用。第一,有利于證據(jù)制度的升級換代,實現(xiàn)從神示證據(jù)、法定證據(jù)、自由心證證據(jù)制度到所謂的“以電子證據(jù)為核心的新證據(jù)制度”。第二,有利于證據(jù)概念與證據(jù)屬性等基本理論的更新和完善。對證據(jù)概念進行更新,由材料說更新到數(shù)據(jù)說、信息說。在大數(shù)據(jù)證據(jù)制度的證據(jù)屬性方面,從大陸法系國家的證據(jù)能力理論發(fā)展到具有技術(shù)性的電子證據(jù)資料和方法,對其證明力尤其是對證據(jù)材料的證明力進行量化分析,有利于較為準確地進行事實認定。而在我國證據(jù)屬性理論中的三性能夠在大數(shù)據(jù)時代得到進一步發(fā)展,如真實性通過大數(shù)據(jù)進行檢測;相關(guān)性可以通過大數(shù)據(jù)進行數(shù)據(jù)關(guān)聯(lián)及其層級的分析和研判等。第三,對證據(jù)分類理論的發(fā)展。如對于傳統(tǒng)意義上的直接證據(jù)和間接證據(jù)分類,可以使得證據(jù)之間的印證關(guān)系發(fā)展到關(guān)聯(lián)關(guān)系; 再如有利于完善證據(jù)種類體系,提升電子證據(jù)的應(yīng)用能力等。第四,對于證據(jù)調(diào)查制度的完善。例如,對于取證—質(zhì)證—認證的大數(shù)據(jù)分析,有利于切實實現(xiàn)審判中心和庭審實質(zhì)化。
在以電子證據(jù)為核心的新證據(jù)時代,不僅需要重視的是大數(shù)據(jù)分析和人工智能的應(yīng)用,而且需要在智能法學(xué)的背景下對電子證據(jù)以及采信應(yīng)用原理進行科學(xué)化和精確化的審視。而在這其中,需要重點強調(diào)的是,越來越普遍的電子證據(jù)的采信原理以及標準化適用,體現(xiàn)為大數(shù)據(jù)證據(jù)應(yīng)用中的電子證據(jù)路徑依賴問題。這是因為,大數(shù)據(jù)證據(jù)作為電子證據(jù)的一種載體,具有證據(jù)法學(xué)和科學(xué)技術(shù)的雙重要求,需要以復(fù)雜而大量的科學(xué)研究為基礎(chǔ),并進行簡便化操作和應(yīng)用,使得司法人員和每一個公眾能夠理解和接受。例如,在大數(shù)據(jù)證據(jù)的電子證據(jù)(數(shù)據(jù))屬性方面,電子數(shù)據(jù)收集、提取與技術(shù)偵查程序適用的關(guān)系較為復(fù)雜,在“大數(shù)據(jù)”時代,“網(wǎng)絡(luò)技術(shù)不斷發(fā)展,取證方法也在創(chuàng)新,需要在有效取證和保證權(quán)利之間達成平衡”。再如,大數(shù)據(jù)技術(shù)中的區(qū)塊鏈等在杭州互聯(lián)網(wǎng)法院的司法實踐中得到應(yīng)用,法院認可了原告采用區(qū)塊鏈作為電子數(shù)據(jù)的存證方式,從而認定了侵權(quán)的案件事實。
從大數(shù)據(jù)時代的主要載體和基本原理來看,大數(shù)據(jù)證據(jù)的電子證據(jù)屬性具有系統(tǒng)性、 穩(wěn)定性和多元性特點,它主要涉及的是三大類型的數(shù)據(jù)基礎(chǔ)和證據(jù)信息。一是指計算機中尤其是硬盤中所存儲的電子證據(jù)和相關(guān)數(shù)據(jù)。最為突出地表現(xiàn)為電子表格、多媒體數(shù)碼檔案、應(yīng)用程序、文檔資料以及數(shù)據(jù)庫資料等。二是在計算機運行過程中,系統(tǒng)和服務(wù)器所記載的記錄日志。例如,服務(wù)器的數(shù)據(jù)庫記錄、網(wǎng)頁服務(wù)器瀏覽等操作的記錄日志、電腦防火墻的記錄日志、電子檔案傳輸(FTP)中的服務(wù)器記錄日志等。三是由互聯(lián)網(wǎng)經(jīng)過計算機、手機等電子設(shè)備所傳遞的數(shù)據(jù)信息。
在大數(shù)據(jù)技術(shù)、 區(qū)塊鏈運行和事實認定過程中,需要注意應(yīng)用哈希值(HASH)的驗證機制。在電子數(shù)據(jù)和電子證據(jù)的取證過程中,較為常見的的HASH 種類為MD5;它是對電子數(shù)據(jù)內(nèi)容的一個校驗,即內(nèi)容一致哈希值相同。從計算機技術(shù)角度來看,在特殊情況下哈希值可以通過查密碼表來進行破解。具體來看,應(yīng)用哈希值驗證電子數(shù)據(jù)和電子證據(jù)的克隆以及鏡像原理方法,是基于計算機技術(shù)中的哈希值原理要求的。也就是說,任何文件都可以在散列算法中創(chuàng)建一個哈希值。一般認為,兩個內(nèi)容完全一致的文件其HASH 值相同;兩個同名文件內(nèi)容稍有差異HASH 值不同; 具有不可逆性,不能通過HASH 值恢復(fù)源文件內(nèi)容。這種哈希值廣泛應(yīng)用于涉及電子數(shù)據(jù)和證據(jù)的電子簽名、數(shù)據(jù)安全、文件一致性檢驗等領(lǐng)域。
例如,區(qū)塊鏈技術(shù)背景下的“智能合約”,將證據(jù)與事實進行一種“虛擬融合”,使得計算機系統(tǒng)能夠執(zhí)行當(dāng)事人之間的合約。這種電子數(shù)據(jù)性質(zhì)的合約就是基于大數(shù)據(jù)的區(qū)塊鏈程序。一旦合約上傳,便永遠存在區(qū)塊鏈里。智能合約將自動執(zhí)行基金賬戶,如果發(fā)生糾紛,智能合約將會在特定的救濟程序中將合約過程的事實情況上傳至開放應(yīng)用程序編程接口(API),合約的基本情況將一目了然。這時,大數(shù)據(jù)帶來事實認定和取證的新變化,體現(xiàn)為快捷發(fā)現(xiàn)線索、拓展證據(jù)思維、創(chuàng)新案件審理方式和提高事實認定效率等。也就是說,如果在基于哈希值和無法篡改的區(qū)塊鏈上通過密碼技術(shù)記錄土地登記、 機密文件等權(quán)利和個人信息,那么即使不通過國家或者企業(yè)等信賴的第三方機關(guān),也能夠證明特定權(quán)利與數(shù)據(jù)的存在。同時,區(qū)塊鏈上的權(quán)利轉(zhuǎn)移不會遺漏任何數(shù)據(jù)的變更記錄,可以實現(xiàn)徹底的追蹤功能。
從事實認定模式和證據(jù)學(xué)的歷史發(fā)展階段來看,整個證據(jù)世界可能在事實認定方面可以被類型化為“無數(shù)據(jù)時代”、“小數(shù)據(jù)時代”和“大數(shù)據(jù)時代”。而在證據(jù)的無數(shù)據(jù)時代,人們期盼的是減少錯誤和依據(jù)神之意志的“測量過去”程式;在證據(jù)的小數(shù)據(jù)時代,以天文學(xué)家為代表的空間和時間研究,采用了更為精確的、允許一定范圍內(nèi)經(jīng)驗偏見的量化世界方式,形成了著名歷史學(xué)家阿爾弗雷德·克羅斯比所謂的“測量現(xiàn)實”;而當(dāng)歷史車輪走到了當(dāng)前以電子證據(jù)為核心的大數(shù)據(jù)時代,司法大數(shù)據(jù)和人工智能的學(xué)者們獲取世界的方式轉(zhuǎn)變?yōu)椤皽y量未來”的、可以重復(fù)結(jié)果的、向前看的能力。
在以電子證據(jù)為核心的新證據(jù)時代,大數(shù)據(jù)證據(jù)是一種電子證據(jù),證據(jù)與事實之間存在大數(shù)據(jù)分析與智能算法應(yīng)用,事實認定思維、事實認定過程以及證據(jù)體系完善需要更新和完善。最終在電子證據(jù)采信應(yīng)用的規(guī)范化路徑下實現(xiàn)司法應(yīng)用和具體操作,構(gòu)建能夠應(yīng)用于審判體系的具體類型案件事實認定模型。
注釋:
①Krish Krishnan,Data Warehousing in the Age of Big Data,New York: Elsevier Inc.,2013,p.5.
②王祿生:《論法律大數(shù)據(jù)“領(lǐng)域理論”的構(gòu)建》,《中國法學(xué)》2020年第2 期。
③Kord Davis,Ethics of Big Data,Cambridge: O’Reilly Media,Inc.,2012,p.118.
④秦蓁:《相知與定名:人工智能(AI)時代的圖像、文獻與歷史》,《學(xué)術(shù)月刊》2017年第12 期。
⑤錢寧峰:《走向“計算法學(xué)”:大數(shù)據(jù)時代法學(xué)研究的選擇》,《東南大學(xué)學(xué)報(哲學(xué)社會科學(xué)版)》2017年第2 期;馬長山:《智能互聯(lián)網(wǎng)時代的法律變革》,《法學(xué)研究》2018年第4 期。
⑥左衛(wèi)民:《中國在線訴訟: 實證研究與發(fā)展展望》,《比較法研究》2020年第4 期。
⑦參見奇虎訴騰訊濫用市場支配地位判決書,訪問地址:http://www.court.gov.cn/wenshu/xiangqing-7973.html,訪問時間:2019年11月2 日。
⑧左衛(wèi)民:《邁向大數(shù)據(jù)法律研究》,《法學(xué)研究》2018年第4 期。
⑩栗崢:《人工智能與事實認定》,《法學(xué)研究》2020年第1 期。
?郭哲:《大數(shù)據(jù)時代查辦職務(wù)犯罪偵查模式認識論》,《政法論叢》2019年第3 期。
?程雷:《大數(shù)據(jù)偵查的法律控制》,《中國社會科學(xué)》2018年第11 期。
?高翔:《民事電子訴訟規(guī)則構(gòu)建論》,《比較法研究》2020年第3 期。
?王燃:《大數(shù)據(jù)時代偵查模式的變革及其法律問題研究》,《法制與社會發(fā)展》2018年第5 期。
?柳永:《大數(shù)據(jù)背景下電子數(shù)據(jù)行刑銜接機制研究》,《行政法學(xué)研究》2018年第5 期。
?豐葉:《職務(wù)犯罪大數(shù)據(jù)證據(jù)研究》,《科技與法律》2020年第1 期。
?智能法學(xué),主要探究法律與大數(shù)據(jù)、人工智能的良性互動關(guān)系,體現(xiàn)為法律信息化建設(shè)的新階段,表現(xiàn)為法學(xué)研究與法律應(yīng)用的數(shù)字化、網(wǎng)絡(luò)化和智能化。具體請參見高晉康、楊繼文主編:《迎接智能法學(xué)的到來》,法律出版社2019年版,第1 頁。
?劉品新:《論大數(shù)據(jù)證據(jù)》,《環(huán)球法律評論》2019年第1 期。