嚴劍漪
2017年7月10日,全國司法體制改革推進會在貴州省貴陽市召開,中共中央政治局委員、中央政法委書記孟建柱在會上強調(diào),要以習近平總書記系列重要講話精神為指南,更加積極主動擁抱大數(shù)據(jù)、人工智能新時代。與此同時,一個神秘的“206工程”也在此次大會上揭開面紗。
司改目標+智能革命
在貴州大會召開的這一天,上海肇嘉浜路308號,一場如火如荼的研發(fā)已經(jīng)悄然進行了整整154天。64位來自上海法院、檢察院、公安機關(guān)的業(yè)務骨干,215位科大訊飛公司的高精尖技術(shù)人員,夜以繼日埋頭研發(fā),這一切,都是為了一個未來法院人工智能系統(tǒng)的橫空出世——“上海刑事案件智能輔助辦案系統(tǒng)”,又名“206工程”。
2017年2月6日,中共中央政治局委員、中央政法委書記孟建柱來到上海高院調(diào)研,也就在這一天,中政委明確要求,由上海高院研發(fā)一套“推進以審判為中心的訴訟制度改革軟件”,該軟件后被定名為“上海刑事案件智能輔助辦案系統(tǒng)”。
“黨的十八大以來,人民法院依法糾正了34件重大冤假錯案,這些冤假錯案之所以發(fā)生的一個很重要的原因,就是事實不清、證據(jù)沒有做到確實充分。”上海高院黨組書記、院長崔亞東說,“現(xiàn)在我們研發(fā)這套系統(tǒng),一是要解決刑事案件辦案中存在的證據(jù)標準適用不統(tǒng)一、辦案程序不規(guī)范等問題;二是系統(tǒng)具有校驗、把關(guān)、監(jiān)督功能,可以及時發(fā)現(xiàn)證據(jù)中的瑕疵與矛盾,及時提示辦案人補正或作出說明,確保提請逮捕、移送審查起訴的案件符合法律規(guī)定的標準,提升辦案質(zhì)量和效率,實現(xiàn)防止冤假錯案、減少司法任意性、推進以審判為中心的刑事訴訟制度改革的目標”。
那為什么叫“206工程”呢?崔亞東笑著說:“因為交辦日期是2月6日,所以簡稱為‘206工程!”
2月中旬,上海高院成立了以崔亞東為組長的“206工程”領(lǐng)導小組及辦公室,辦公室下設業(yè)務組、技術(shù)組、綜合組和專家咨詢組。同時,經(jīng)上海市委政法委同意,“推進以審判為中心的訴訟制度改革軟件”工作聯(lián)席會議制度建立。
緊接著,上海確定了33家法院、檢察院、公安機關(guān)作為試點單位,8個區(qū)級司法局和上海市律協(xié)作為調(diào)研單位,同步推進專題調(diào)研、數(shù)據(jù)整理與制定證據(jù)標準工作。上海高院先后組織了34次專題調(diào)研,收集到78條意見、建議,132條需求,收集公檢法系統(tǒng)案件電子卷宗、裁判文書、庭審筆錄、審理報告、退查退捕說明等資料16.55萬份。
專家經(jīng)驗+模型算法
“人工智能最重要的三個環(huán)節(jié),是專家經(jīng)驗、模型算法和海量數(shù)據(jù)。”科大訊飛法院產(chǎn)品線產(chǎn)品部經(jīng)理金澤蒙所帶領(lǐng)的軟件研發(fā)技術(shù)組常常在上海高院“206工程”研發(fā)基地開會討論到凌晨。那么,如何讓機器來學習人類的法律思維呢?
“我們預定了機器學習的規(guī)則,從統(tǒng)一證據(jù)標準、制定證據(jù)規(guī)則、構(gòu)建證據(jù)模型三方面入手。”上海高院副院長、全國審判業(yè)務專家、“206工程”業(yè)務組負責人黃祥青介紹。
2月中旬,上海高院結(jié)合司法實踐,聚焦常見多發(fā)、重大、新類型等案件,選擇了7類18個具體罪名,逐項制定證據(jù)標準,計劃到2017年年底前分三批完成。
“證據(jù)規(guī)則,主要是針對單一證據(jù)而言,即按照證據(jù)‘三性的要求,在收集、固定、保存中所應遵循的規(guī)范?!秉S祥青進一步解釋,為了配合系統(tǒng)研發(fā),上海高院制定了上海刑事案件證據(jù)收集、固定、審查、判斷規(guī)則,對刑事訴訟法中的八類證據(jù),詳細規(guī)定了收集程序、規(guī)格標準、審查判斷要點,對量刑證據(jù)、程序證據(jù)的收集、固定作了明確。
2月下旬,第一批證據(jù)模型構(gòu)建小組也隨之建立。上海高院從高院、浦東、徐匯、虹口、長寧等法院抽調(diào)精兵強將,分別組成了命案組、盜竊罪組、電信網(wǎng)絡詐騙類案件組以及非法吸收公眾存款罪組4個組。上海浦東法院刑庭庭長、全國模范法官馬超杰是一位有著26年刑事審判經(jīng)驗的學者型法官,他負責電信網(wǎng)絡詐騙和非法吸收公眾存款罪兩個證據(jù)模型小組的工作。他展示了一份模型構(gòu)建材料,在密密麻麻的表格里,僅僅一個“電子數(shù)據(jù)”,就被細分為電話、電子文件、計算機日志、電子郵件、聊天記錄、網(wǎng)頁、IP地址、手機錄音、短信、第三方網(wǎng)絡支付平臺交易記錄等多種形式。
除了法院的專家團隊外,公安和檢察院的業(yè)務骨干同樣發(fā)揮了重要作用。
上海市檢察院偵查監(jiān)督處的陳漫卿已經(jīng)工作8年,對軟件開發(fā)很有興趣。2017年3月,她正式加入“206工程”,隨時與業(yè)務組、技術(shù)組溝通檢察院匯總的需求,其中文書導出、證據(jù)相似情況案件推送、辦案程序監(jiān)督、社會危險性審查、檢察監(jiān)督、量刑建議參考等需求功能被“206工程”采納。
智能識別+自動校驗
“目前,‘206工程主要由上海刑事案件大數(shù)據(jù)資源庫、上海刑事案件智能輔助辦案應用軟件、上海刑事案件智能輔助辦案系統(tǒng)網(wǎng)絡平臺三部分組成。”上海高院副院長、“206工程”技術(shù)組負責人郭偉清對人工智能技術(shù)已經(jīng)非常熟悉。
截至6月底,上海刑事案件大數(shù)據(jù)資源庫匯集了1695萬條數(shù)據(jù),其中案例庫案例9012個、裁判文書庫文書1600萬篇、法律法規(guī)司法解釋庫條文948384條、辦案業(yè)務文件庫各類規(guī)范性文件638件。與此同時,證據(jù)標準庫、電子卷宗庫將隨證據(jù)標準的制定及開發(fā)的案由同步更新。
“系統(tǒng)通過運用深度神經(jīng)網(wǎng)絡模型和圖文識別(OCR)技術(shù),基于對1.5萬余份卷宗材料的學習,初步實現(xiàn)了對各種證據(jù)的印刷體文字、部分手寫體文字、簽名、手印、簽章、表格、圖片等智能識別、定位和信息提取,對單一證據(jù)實現(xiàn)了自動校驗?!惫鶄デ逭f。隨著技術(shù)的不斷完善,未來的“206工程”將具備證據(jù)標準指引、單一證據(jù)校驗、逮捕條件審查、社會危險性評估、證據(jù)鏈和全案證據(jù)審查判斷、非法言詞證據(jù)排除等20項功能,其中13項已經(jīng)完成,還有7項功能正在開發(fā)中。
5月3日,“上海刑事案件智能輔助辦案系統(tǒng)”正式試運行,6家法院、6家檢察院、13家公安機關(guān)試點單位上線。
“我輸入一個卷宗后,系統(tǒng)馬上提示我沒有附物品勘察清單?!毙靺R公安分局漕河涇派出所民警俞昕體驗了一把“智能輔助”,“那個案子的犯罪嫌疑人是被群眾扭送到派出所的,作案工具同時被送到派出所,我是后到現(xiàn)場進行勘察,所以沒有關(guān)于作案工具的清單。我在備注欄里寫明情況,案子提交到了檢察院”。
徐匯檢察院公訴科檢察官許磊也有自己的用戶體驗:“過去我們拿到的是冷冰冰的卷宗,現(xiàn)在系統(tǒng)羅列出來的瑕疵可以幫助承辦人快速理清思路,找出辦案的關(guān)鍵點,這極大地提高了辦案效率,而且全程留痕,對落實司法責任制也有好處。”
截至6月底,“206工程”共錄入案件60件,錄入證據(jù)19316份,提供證據(jù)指引2622次,發(fā)現(xiàn)證據(jù)瑕疵點48個,提供知識索引查詢348次,總點擊量達5.6萬次。
“人工智能不是人的智能,當前人工智能的主流算法模型是深度神經(jīng)網(wǎng)絡模型,這個模型優(yōu)勢在于可以自學習,可以對學習過的知識聯(lián)想學習,但是訓練這個模型需要大量數(shù)據(jù)。目前,我們構(gòu)建了一個‘206工程的初始模型,還得有專家知識供機器學習,隨著系統(tǒng)不斷被應用,提供的數(shù)據(jù)越來越多,我相信機器表現(xiàn)會越來越好?!苯饾擅烧f。
據(jù)悉,為了讓“206工程”這個初生“嬰兒”慢慢學習,研發(fā)團隊已進入小規(guī)模數(shù)據(jù)的人工標注階段,公檢法三家的業(yè)務骨干們對掃入系統(tǒng)的卷宗內(nèi)容進行精細化標注。
法院的人工智能時代已經(jīng)到來,未來的“206工程”會替代法官嗎?
“創(chuàng)造性思維是電腦永遠無法模擬的,‘206工程只是輔助辦案,法官可以借助它的技術(shù)手段來幫助判斷,但不可能被替代?!瘪R超杰說。
“系統(tǒng)的定位是‘智能輔助辦案系統(tǒng),實際上是為法官、檢察官、偵查人員配備了一名‘智能辦案助手,不能理解為‘機器辦案,更不能理解為‘機器定案量刑?!贝迊問|說。