王 培 王 何 許 陽
江蘇警官學院,江蘇 南京 210031
二十世紀,大數(shù)據(jù)時代初現(xiàn)模型。由美國芝加哥大學商學院教授詹姆斯·麥肯錫最早提出“大數(shù)據(jù)”時代到來的概念,他給后人留下的觀點也印證了大數(shù)據(jù)以及時代的發(fā)展:數(shù)據(jù),滲透到每個行業(yè),所有領域,各個業(yè)務。數(shù)據(jù),是當之無愧的生產(chǎn)因素。同時,他對大數(shù)據(jù)做出新的定義,總結了大數(shù)據(jù)具有數(shù)據(jù)規(guī)模海量、數(shù)據(jù)流轉快速、數(shù)據(jù)類型多樣和價值密度較低四大特征,而數(shù)據(jù)的來源決定了它的特點。如果將社會比喻成一個超大的數(shù)據(jù)庫,那么我們每個人都是這個數(shù)據(jù)庫的數(shù)據(jù)來源。所有聯(lián)網(wǎng)的物品信息:電腦、手機、平板電腦、智能手環(huán)……包括我們?nèi)艘彩菙?shù)據(jù)的來源。
大數(shù)據(jù)證據(jù)的來源是萬維網(wǎng)記錄儲存的各類無序,分散,雜亂的數(shù)據(jù),與其他網(wǎng)絡信息,云數(shù)據(jù)一樣,此時的大數(shù)據(jù)不具備法律意義上的證明資格,還不具備證明能力,因此。大數(shù)據(jù)證據(jù)不是嚴格意義上的證據(jù)。在其通過相對客觀完整的數(shù)據(jù)采集基礎上,通過一系列復雜繁瑣的數(shù)據(jù)處理技術的連接、整合、運算和分析,讓大數(shù)據(jù)成為一種規(guī)律并能提供有價值的分析方向。這些科學復雜的技術是賦予它能夠證明案件事實的證據(jù)資格的重要條件。與傳統(tǒng)證據(jù)相比,大數(shù)據(jù)證據(jù)不僅具有傳統(tǒng)的證據(jù)的客觀性,關聯(lián)性,合法性,還必須具備數(shù)據(jù)內(nèi)容的提煉性、數(shù)據(jù)來源的復合性、數(shù)據(jù)處理技術的科學性等特點。
首先,數(shù)據(jù)內(nèi)容的要有提煉性。從整個萬維網(wǎng),云數(shù)據(jù)中剝離隱藏的潛在有用的信息、線索并形成完整可靠確定的數(shù)據(jù)信息和證據(jù)。這是一個比較復雜提煉的過程,但也是因為其步驟的完善性、可靠性與系統(tǒng)性,使得大數(shù)據(jù)證據(jù)的數(shù)據(jù)內(nèi)容更具提煉性。提煉同時要確保數(shù)據(jù)完整,這是作為證據(jù)的首要條件,根據(jù)完整數(shù)據(jù)作出的分析結果才具有真實有效的證明力。其次,數(shù)據(jù)來源的復合性不容忽略。大數(shù)據(jù)不是從單一來源中形成證據(jù)的,大數(shù)據(jù)到證據(jù)的轉變需要針對具體事項和目標的需要,通過對多個不同來源的數(shù)據(jù)庫或信息相互關聯(lián),從中多維分析挖掘才能夠實現(xiàn),這是一個復雜的分析挖掘復合形成的過程①。傳統(tǒng)的統(tǒng)計學關注的是大量個體在偽相互作用下所形成的宏觀統(tǒng)計規(guī)律性,它并不關注微觀個體之間的差異性。然而,唯有異質性的個體之間才會發(fā)生真相互作用,這就意味著個體之間是具有可分辨性的,這同時也意味著數(shù)據(jù)庫中的數(shù)據(jù)也是具有可分辨性的。因此,保證大數(shù)據(jù)來源的復合性,分辨出不同復合來源的數(shù)據(jù),從而讓大數(shù)據(jù)證據(jù)具有了更高的可靠性。最后我們還要關注數(shù)據(jù)處理技術的科學性。如何在海量的,分散的、無形的大數(shù)據(jù)中中獲取有價值的大數(shù)據(jù)證據(jù),必須借助科學有效的②大數(shù)據(jù)處理技術。包括:大數(shù)據(jù)的采集、大數(shù)據(jù)的預處理、大數(shù)據(jù)存儲和管理、大數(shù)據(jù)分析、大數(shù)據(jù)可視化等等。龐大的數(shù)據(jù)量,需要利用相關領域普遍認同的技術實踐,或加以驗證。目前,想要真正實現(xiàn)大數(shù)據(jù)技術的應用,數(shù)據(jù)處理技術是我們必須突破的一大難關。善用科學的數(shù)據(jù)處理方法,可以保證用這種方式得出的結論具有強大證明力,更加可靠。
大數(shù)據(jù)證據(jù)可以作為訴訟證據(jù)。我國在三部訴訟法中,對于證據(jù)的法律規(guī)定中都要求證據(jù)須經(jīng)“查證屬實”③,這種邏輯下,大數(shù)據(jù)只要“核實”,確定其真實性與可靠性,就可以與訴訟中的其他證據(jù)一樣具備證明能力。
證據(jù)的“可接受性”是一切證據(jù)面臨的問題。在18年新修訂的刑事訴訟法中,我國法律已經(jīng)明文規(guī)定了電子證據(jù)是訴訟證據(jù)的一部分,日益普及的新事物將在法律的一次次更新中體現(xiàn)。電子證據(jù)適用范圍、采信條件、采信原則、可接受的證據(jù)形式以及提交方式等在實踐中明確,應當獲得其應有的證據(jù)分量。當我們在評估一條數(shù)據(jù)消息是否具有證據(jù)分量,即是否具有足夠的證明力,我們需要對其進行多方面的考量與研究。例如,該大數(shù)據(jù)信息的生成、存儲或傳播過程中,是否存在人為篡改與消滅,信息提取過程中是否存在缺漏或意思曲解,以及信息來源與提供者的可靠性等一系列問題。我們所屬的是一個大數(shù)據(jù)時代,如果大數(shù)據(jù)證據(jù)不為法院和仲裁機關所接受,那不僅會影響證據(jù)收集的效率與證據(jù)鏈的完整性,同時也會為以數(shù)據(jù)信息商務交易的實體法保障埋下隱患,使電子商務交易演變成高風險的交易形式。
隨著移動互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)與人工智能等新技術、新業(yè)務和新生態(tài)的發(fā)展,目前我國在電子證據(jù)取證方面還不夠成熟,證據(jù)采信率較低、證據(jù)原件模糊、取證主體受限、成本高昂等困境始終沒有突破④。大數(shù)據(jù)證據(jù)作為電子數(shù)據(jù)的一種特殊形式,兩者具有天然的親和力。在進行大數(shù)據(jù)取證的同時,應同時進行常規(guī)的電子數(shù)據(jù)取證。司法偵查有關部門沒有自行開發(fā)的證據(jù)收集軟件,缺乏先進的電子數(shù)據(jù)測試、存儲和實驗設備,不能在短時間內(nèi)有效處理大量案件。只有當數(shù)據(jù)有作為證據(jù)資格的前提下,才有確定判斷⑤證據(jù)證明力的大小的意義。如果傳統(tǒng)的紙質證據(jù)可以通過整個事情呈現(xiàn)。如今社會,電子郵件、微信聊天記錄等“電子證據(jù)”已經(jīng)逐步在司法實踐被當事人采用,大數(shù)據(jù)證據(jù)成為了必不可少的證據(jù)形式。但在它的證明效力方面卻始終存在一定問題,大數(shù)據(jù)證據(jù)更容易通過剪輯、刪除、重組等手段更改成為“偽證”。
電子證據(jù)是否具有獨立證明力隨著法律的更新得到了解釋。原先的法律實踐中,電子數(shù)據(jù)不能單獨作為證據(jù)來證明案件事實,必須與其他證據(jù)加以結合形成完整的證據(jù)鏈才予以使用。由此可見,在新法出臺之前,電子數(shù)據(jù)予以使用最大的難度就是“孤掌難鳴”。此類電子證據(jù)是否被法院采納,與法官的理解和自由裁量具有很大關聯(lián)性和不確定性。大數(shù)據(jù)證據(jù)也如此。一般來說,大數(shù)據(jù)證據(jù)審計分析方面存在數(shù)據(jù)采集風險、數(shù)據(jù)存儲管理風險和數(shù)據(jù)分析質量風險等挑戰(zhàn)。近年來,隨著《最高人民法院關于修改<關于民事訴訟證據(jù)的若干規(guī)定>的決定》出臺,電子證據(jù)就作為類似書證、物證等證明力的證據(jù)出示,無需通過其他證據(jù)加以輔助,電子數(shù)據(jù)進一步獲得了獨立證明力,也由此降低了其審計分析的風險,提高了訴訟效率。
數(shù)據(jù)收集是審計分析的第一步,是大數(shù)據(jù)的重中之重。因為大數(shù)據(jù)技術進步的影響,大數(shù)據(jù)的數(shù)據(jù)來源得到優(yōu)化,其種類逐漸豐富并且類型多樣,為我們的采集提供了更加開闊的存儲與分析數(shù)據(jù)的環(huán)境。在數(shù)據(jù)收集工作中,主要面臨兩種風險。一是為了確保數(shù)據(jù)收集的真實性和完整性。缺乏有效驗證手段對被審計單位的數(shù)據(jù)進行驗證,導致數(shù)據(jù)的完整性和真實性得不到保證,只能通過后期的擴展調查驗證某些數(shù)據(jù)的真實有效性,收集到的數(shù)質量不高、紛雜無效的信息對數(shù)據(jù)分析的進度與質量影響可謂是致命的;二是數(shù)據(jù)采集過程中被審計單位的系統(tǒng)安全性存在被破壞的風險。數(shù)據(jù)采集是困難的。采集過程中易出現(xiàn)記錄或低效的人為錯誤。雖然單位引進了相關技術手段,應用了數(shù)據(jù)采集系統(tǒng),但是由于系統(tǒng)本身的原因。以及缺乏選擇最適合自己的數(shù)據(jù)采集系統(tǒng),無法實現(xiàn)信息采集的實時性、準確性和可擴展性管理,而且容易出現(xiàn)了信息斷層的現(xiàn)象,其安全性也難以保證。
從審計機關和人員那里收集大量數(shù)據(jù),在存儲和管理上面臨著兩大風險:首先,數(shù)據(jù)存儲風險大。大數(shù)據(jù)如何存儲,如何保證數(shù)據(jù)的完整性,可以要求檢察人員監(jiān)控分析。其次是數(shù)據(jù)管理的風險,數(shù)據(jù)審計機構包含大量的數(shù)據(jù)。對于人的基本信息,如何進行技術和系統(tǒng)的管理,保證數(shù)據(jù)不會泄露給社會是審計機構要規(guī)避的風險之一。數(shù)據(jù)存儲和管理涉及到許多行業(yè)的信息,這些重要信息的遺露、丟失和泄密會給相關單位造成巨大損失和權威性、公信力、可靠性等形象的全面下滑。如今,數(shù)據(jù)管理的風險主要來自于數(shù)據(jù)存儲設備的管理,類似于審計人員的計算機及移動存儲介質等發(fā)生丟失以及數(shù)據(jù)網(wǎng)絡加密不足等,這都是大數(shù)據(jù)存儲和管理風險防范規(guī)避的關鍵領域。
從大量數(shù)據(jù)檢索的審計單位獲得審計資格后,下一步是數(shù)據(jù)的整理分析。審計中發(fā)現(xiàn)可疑數(shù)據(jù)進行審計驗證,并生成審計證據(jù)。在數(shù)據(jù)分析過程中,審計人員將面臨一下審計風險:
首先,海量的數(shù)據(jù)與有限的審計時間之間的矛盾。在這一矛盾之中,審計人員因各種原因,無法在規(guī)定時間內(nèi)完整精細的對所有數(shù)據(jù)進行研究、整理、分析,因而容易忽視審計中的疑點,降低了整體審計質量。
其次,在分析數(shù)據(jù)過程中,審計人員極有可能只關注了數(shù)據(jù)分析,而忽視了對被審計單位信息系統(tǒng)的安全防范,導致因系統(tǒng)中存在的重大漏洞而對整個審計任務造成風險。
此外,審計人員技術水平參差不齊,對大數(shù)據(jù)證據(jù)的分析處理存在問題。在大數(shù)據(jù)時代,數(shù)據(jù)的處理方式是多種多樣的,因此審計人員的技術水平?jīng)Q定著他們能否從復雜大量的數(shù)據(jù)中提取到我們所需的證據(jù),當他們操作不當時,甚至有可能造成數(shù)據(jù)的丟失,導致關鍵證據(jù)無法被獲得。此外,當公安機關偵查人員遇到無法處理的問題時,只得求助于外部人員。但是外部人員并不清楚公安內(nèi)部對這些大數(shù)據(jù)證據(jù)規(guī)定或要求,因此得到的大數(shù)據(jù)證據(jù)很可能不具有法律效力,甚至都無法起到建議作用。同時,外部人員的保密問題也十分嚴重,是大數(shù)據(jù)證據(jù)在審計過程中最突出的風險問題。
最后,大數(shù)據(jù)本身具有無形性和脆弱性的特點。大數(shù)據(jù)證據(jù)不同于一般的紙質材料,沒有沒有實體性的存在形式,例如紙張、雕刻等,其存儲介質較為特殊,導致其內(nèi)容與載體可分離,復制不能改變其完整性與真實性,因此較難,直觀區(qū)分原始件與復印件,這使得它具有了無形性的特點。大數(shù)據(jù)證據(jù)的脆弱性,則是因其可以人為進行修改,且不易被察覺。在實踐中,存在著一定數(shù)量因人為篡改而導致大數(shù)據(jù)證據(jù)失去證明力、事實不清的案例,憑借現(xiàn)有的收集技術,審計人員很難對大數(shù)據(jù)證據(jù)的原始性進行確認。想要確保大數(shù)據(jù)生成證據(jù)的證明力,保證原始數(shù)據(jù)到最終審計證據(jù)的證據(jù)鏈完整性至關重要。
審計相關人員首先要提升自己的專業(yè)水平,更新技術觀念,在熟練掌握當今社會的主流數(shù)據(jù)處理與分析的方式之后,還應該多角度的對現(xiàn)有技術進行挖掘。大數(shù)據(jù)時代的數(shù)據(jù)以范圍廣、數(shù)量大、時間跨度長為特點,而現(xiàn)在的刑事案件偵破則是需要高效、快速、準確,因此想要將大數(shù)據(jù)證據(jù)廣泛的應用于司法過程中,相關審計人員便需要在短時間內(nèi),準確處理好問題,使得大數(shù)據(jù)證據(jù)能更及時的被加入到案件的處理過程中,這對于相關審計人員的業(yè)務能力提出來很高的要求。
在《民事訴訟法》的第64條中,規(guī)定了中國的證據(jù)收集制度包括了當事人自行收集并向人民法院提供與人民法院收集這兩種證據(jù)收集制度。多數(shù)情況下,收集與提供證據(jù)的任務是由當事人完成的(除法律規(guī)定的職權調查以外),原則上,法官無需承擔起證據(jù)調查與收集的責任。然而在現(xiàn)實實踐中,我國的證據(jù)收集制度卻常常因為不具備可操作性而產(chǎn)生混亂。
大數(shù)據(jù)證據(jù)作為一種最新型的證據(jù)形式,其受取證方式的影響較大。我國的證據(jù)保全制度盡管通過保全的形式,使得獲得的電子數(shù)據(jù)的證明力有所提高,極大程度的減少了當事人收集證據(jù)的壓力,然而其存在一個致命的問題,那就是申請時間較長。在長時間跨度的等待中,在大數(shù)據(jù)證據(jù)隨時可能出現(xiàn)損壞、消失等緊急情況,沒有專業(yè)的技術,損毀消失的大數(shù)據(jù)證據(jù)極難復原,即便復原,相較原始數(shù)據(jù),其證明力也可能有所降低。因此,我國現(xiàn)在的證據(jù)收集制度并不適用于大數(shù)據(jù)證據(jù)的收集,因其導致的時機貽誤,將會使得大數(shù)據(jù)證據(jù)難以發(fā)揮完全作用。
大數(shù)據(jù)證據(jù)中的電子數(shù)據(jù)通常具有極強的時效性,正因為它常常以數(shù)據(jù)流的形式存在,受時間因素影響大,因而留給我們的取證時間并不充足。所以我們需要對大數(shù)據(jù)證據(jù)的取證進行程序性立法,將大數(shù)據(jù)證據(jù)轉化為一種常見證物,規(guī)范大數(shù)據(jù)證據(jù)取證的過程同時,也能夠有效提高大數(shù)據(jù)證據(jù)取證的效率。
并且對其進行程序性立法,能夠提高大數(shù)據(jù)證據(jù)被人們的接受度?,F(xiàn)今,很多案件中已經(jīng)開始引入大數(shù)據(jù)證據(jù),但是在最后的審判中,大數(shù)據(jù)證據(jù)往往不被承認。因此,只有同時將大數(shù)據(jù)證據(jù)正式納入《刑事訴訟法》規(guī)定的證據(jù)類型之中,通過法律束縛將其規(guī)范化、統(tǒng)一化,才能使得大數(shù)據(jù)證據(jù)在今后的刑事司法過程中發(fā)揮更大的作用。
一個人的大數(shù)據(jù)信息在多數(shù)情況下存于多個計算機設備、多臺服務器上,獲取到的信息可能包含著他人的隱私,導致影響到對方。大數(shù)據(jù)的信息來源廣泛、自身數(shù)據(jù)量龐大,大數(shù)據(jù)下的電子數(shù)據(jù)已不僅僅局限于公民個人或是說用戶端,同時還關聯(lián)著技術供應端。在數(shù)據(jù)量龐大的基礎上,大數(shù)據(jù)數(shù)據(jù)采集不僅要注重保護公民個人的隱私權,還要將技術服務提供者的合法權益放在優(yōu)先考慮位置,例如自主經(jīng)營問題、技術專利問題等。在進行電子數(shù)據(jù)取證時,首先面對的是基數(shù)龐大的數(shù)據(jù)庫,如若沒有專業(yè)技術企業(yè)提供相對應的服務或者對數(shù)據(jù)產(chǎn)生源進行專業(yè)管理,取證工作將會寸步難行。然而,在取得大數(shù)據(jù)證據(jù)的過程中,經(jīng)常會獲得與案件無關的數(shù)據(jù),這就會對公民個人的隱私權造成威脅。如果沒有法律明文規(guī)定來劃定界限、明確過程、規(guī)范程序,可能會導致部分取證工作的失控,甚至出現(xiàn)侵害無辜群眾及訴訟當事人的合法權益的情形。
切實做到保障采集證據(jù)時的個人權益,才能使得我們所獲取證據(jù)的程序被人們所接受。但這是一個極其難以解決的問題,因為大數(shù)據(jù)證據(jù)和案件有關或者與案件無關的界限難以界定,通常都是依據(jù)審計人員的經(jīng)驗來進行,難以通過法律進行硬性規(guī)定。所以對于相關審計人員的保密意識的培養(yǎng),對其業(yè)務素養(yǎng)的提高,在這一時代刻不容緩。
從智能算法展示個性,到在線旅游平臺利用大數(shù)據(jù),顯示“成熟”,大數(shù)據(jù)應用不中立,機器學習還不成熟。信息不對等、雙方互不了解的大數(shù)據(jù)技術將會繼續(xù)發(fā)展,在綜合解析了消費者的支付能力、償還能力、消費偏好后,因地制宜,根據(jù)不同情況采取不同措施。例如,判斷需要票的話就提高價格。大數(shù)據(jù)的“純熟”不光違反了商業(yè)誠信的基本原則,而且還涉嫌違反了《反壟斷法》,不僅失去消費者信任,還構成了價格歧視。消費者每單位商品所支付的最高價格的差異,每單位產(chǎn)品的銷售價格形成一級價格歧視,大數(shù)據(jù)和人工智能算法,并利用每個用戶制定了全方位的一些圖像,分析預測為基礎,可以設定價格歧視。該辦法降低了消費者對互聯(lián)網(wǎng)商業(yè)場景的信任度,將原本方便百姓生活的大數(shù)據(jù)技術作為盈利手段,阻礙行業(yè)發(fā)展,阻礙技術進步。不僅如此,機器學習模式還可能引起種族、性別等歧視。從輸入數(shù)據(jù)到做出決策機器學習中間過程,甚至是更先進的自動學習,AI背后的代碼、算法存在著超越我們理解的“技術黑匣子”。發(fā)展非歧視性數(shù)據(jù)挖掘技術是有待解決的研究領域,當務之急,就是要提高大數(shù)據(jù)算法應用的信息披露義務,運用監(jiān)管科學技術手段升級監(jiān)管能力。
大數(shù)據(jù)是這個時代的新標簽。為了跟上時代的步伐,公安系統(tǒng)應加強大數(shù)據(jù)證據(jù)的規(guī)范化和應用,雖然現(xiàn)在有許多問題仍需探索,但大數(shù)據(jù)證據(jù)仍然有廣闊的前景。
注釋:
①李慧.大數(shù)據(jù)成為證據(jù)的新標準[J].人民法院報,2016-12-07.
②喬羽,孟彩霞.淺析大數(shù)據(jù)的處理技術[J].數(shù)碼世界,2018(3):265.
③我國《刑事訴訟法》規(guī)定,證據(jù)必須查證屬實才能作為定案依據(jù);《民事訴訟法》規(guī)定:一切證據(jù)必須查證屬實,才能成為認定事實的根據(jù);《行政訴訟法》規(guī)定:一切證據(jù)必須經(jīng)法庭審查屬實,才能成為定案的根據(jù).
④胡銘,王林.刑事案件中的電子取證:規(guī)則、實踐及其完善——基于裁判文書的實證分析[J].政法學刊,2017(1):79.
⑤唐舒欣.試探究刑事訴訟中影響證據(jù)證明力大小的因素[J].法制博覽,2019(26):217.