汪政輝
關(guān)鍵詞人工智能 類案推送 法律適用統(tǒng)一
中國(guó)的司法質(zhì)量及司法能力在不斷完善,但與此同時(shí),人民群眾最關(guān)心的還是審判是否公正,所謂的公正,即包含裁判是否穩(wěn)定。同樣的一個(gè)糾紛,是不是能夠得到穩(wěn)定的裁判輸出,當(dāng)權(quán)利受到侵害,或者說社會(huì)、企業(yè)團(tuán)體、人民群眾遇到同樣的問題,會(huì)不會(huì)每次都受到公平相同的裁判,執(zhí)法是否統(tǒng)一和穩(wěn)定。
對(duì)于類案的標(biāo)準(zhǔn)也需要站在具體的需求場(chǎng)景中去分析,類案的應(yīng)用在大部分場(chǎng)景中其實(shí)是為了保證司法辦案人員的心理確信,特別是較為復(fù)雜的案件。以民事案件為例,對(duì)難以把握裁判結(jié)果的案件,爭(zhēng)議焦點(diǎn)一致、案件標(biāo)的基本一致,參考程度更大;而針對(duì)需要審理思路的案件,則只需要爭(zhēng)議焦點(diǎn)基本相似即可,對(duì)于類似案件有一個(gè)判例審理經(jīng)驗(yàn)的共享。
刑事案件的出發(fā)點(diǎn)為定罪和量刑,即案件的具體罪名的構(gòu)成要素以及刑法總則中與量刑有關(guān)的要素信息,即刑法總則中有關(guān)量刑的要素及分則中對(duì)于罪名的犯罪構(gòu)成要素及不同罪名中的要素信息。如何判斷兩個(gè)刑事案件的類似性,基于不同的需求存在不同的場(chǎng)景區(qū)分。第一種需求:案情相似的案件查找。這種案件解決的基本問題為類似案件的量刑以及類似案件的首先需要案件罪名一致,這同時(shí)包含了一人或多人數(shù)罪多罪名的案件的罪名一致性;其次案件的總則量刑要素一致,例如兩個(gè)案件嫌疑人均是自首方式到案、且均是累犯,嫌疑人均是殘疾人;最后確定分則中不同罪名的犯罪構(gòu)成,即案情信息是否一致。這種方式可以較為精確的定位,但存在的問題是對(duì)于同案的罪名不同判的場(chǎng)景下,辦案人員在難以把握案由的情況下如何推送準(zhǔn)確的類案。第二種需求,案件裁判要旨一致的案件查找,針對(duì)某些特殊案件,難以查找到相似案例的情況下,需要基于案件的相似或者相同裁判要旨進(jìn)行檢索,推送類似案例,例如案件均涉及到詐騙罪與盜竊罪區(qū)分的問題,那么如何界定該案件是盜竊罪還是詐騙罪,對(duì)于此類此罪彼罪的問題尋找相似或者相同裁判要旨的案例,確定相似案件的法律適用情況及案件辦案思路。
目前,人工智能總體屬于發(fā)展階段,我國(guó)人工智能水平與國(guó)外相比,差距仍然不小,我國(guó)的人工智能建設(shè)起步晚,但是前景十分廣闊,追趕之勢(shì)十分迅猛。人工智能的感知智能技術(shù)目前相對(duì)于較強(qiáng),對(duì)于圖片文字印刷體的識(shí)別能力較強(qiáng),而對(duì)于中文的認(rèn)知技術(shù)能力,由于才剛剛起步,頂尖技術(shù)僅能做到語言內(nèi)容的查找,且大段信息識(shí)別的效果較差,需要將所識(shí)別的內(nèi)容要素碎片化才可達(dá)到可用的效果。
人工智能的優(yōu)勢(shì)在于輔助查找,以及替代人完成繁重重復(fù)的簡(jiǎn)單工作。目前感知智能應(yīng)用較為廣泛的目前有人臉識(shí)別、語音與文字的轉(zhuǎn)換、翻譯以及圖片轉(zhuǎn)文字的OCR能力。而自然語言處理技術(shù)需要集合真實(shí)的場(chǎng)景,以人的經(jīng)驗(yàn)和理解對(duì)機(jī)器進(jìn)行訓(xùn)練,從而輸出可以進(jìn)行自動(dòng)語義識(shí)別的模型,所以針對(duì)不同場(chǎng)景會(huì)輸出不同功能的模型,從這方面來說認(rèn)知智能技術(shù)難度要高于感知智能,不僅僅需要技術(shù)的積累,更需要對(duì)于場(chǎng)景的深入了解及細(xì)分。
目前人工智能技術(shù)在司法行業(yè)的應(yīng)用主要包括了紙質(zhì)卷宗的電子化,即將紙質(zhì)卷宗中的內(nèi)容轉(zhuǎn)換為可復(fù)制可粘貼的文本信息;案件信息識(shí)別,即將案件卷宗中犯罪嫌疑人信息、發(fā)破案情況、案件事實(shí)等信息進(jìn)行識(shí)別,輸出有關(guān)發(fā)破案經(jīng)過的輔助案件審查工作等等。在司法行業(yè)應(yīng)用較為成功的例子當(dāng)屬上?!?06工程”的證據(jù)校驗(yàn)功能,其能夠?qū)τ谧C據(jù)材料進(jìn)行識(shí)別,輸出證據(jù)中所存在的瑕疵及問題,輔助辦案人員進(jìn)行證據(jù)合法性審查,推動(dòng)司法規(guī)范化。
(一)類案應(yīng)用現(xiàn)狀分析
現(xiàn)有的類案在真實(shí)辦案中的使用情況不容樂觀。對(duì)于類案相關(guān)應(yīng)用產(chǎn)品的了解,主要基于兩個(gè)方面的信息點(diǎn):一是通過網(wǎng)上的相關(guān)發(fā)布消息及公司網(wǎng)站的推廣了解,進(jìn)行相關(guān)信息的調(diào)研及產(chǎn)品試用;二是深入各法院檢察院對(duì)檢察官法官的日常工作中,所使用的相關(guān)類案產(chǎn)品及類案檢索方式進(jìn)行了解?;谇捌诤芏嗾{(diào)研,及相關(guān)專利資料以及論文的內(nèi)容來看,目前類案的研究主要都是參與司法行業(yè)的企業(yè)所做的專利或者各法院研究室、各學(xué)者所做的關(guān)于類案推送的研究。其中應(yīng)用推廣現(xiàn)狀較好的,可提供較完整數(shù)據(jù)的,在辦案人員日常辦案或者專家學(xué)者、律師日常工作提供推送、檢索功能的主要有這幾個(gè)產(chǎn)品:法信類案推送(由司法大數(shù)據(jù)研究院主導(dǎo)建立,是中國(guó)首個(gè)法律知識(shí)和案例大數(shù)據(jù)融合服務(wù)平臺(tái),2016年3月31日在中國(guó)最高人民法院上線)、上海二中院C2J(由上海二中院自主研發(fā),上海全市推廣)、北大法寶類案推送(由北京大學(xué)法制信息中心與北大英華科技有限公司聯(lián)合推出的智能型法律信息一站式檢索平臺(tái))。
在對(duì)于整體市場(chǎng)情況及相關(guān)功能了解的基礎(chǔ)上,對(duì)相關(guān)產(chǎn)品進(jìn)行了試用,確定基礎(chǔ)上應(yīng)用情況闡述目前大部分廠商所做產(chǎn)品的推送的使用方式主要為:(1)用戶主動(dòng)輸入案情進(jìn)行相似案件檢索,一般在搜索框中輸入案件案情進(jìn)行檢索;(2)用戶選擇案件標(biāo)簽(例如自首、入戶盜竊、盜竊虛擬財(cái)產(chǎn)等與案情相關(guān)的標(biāo)簽)進(jìn)行檢索;(3)用戶輸入文書(目前主要為判決書、起訴書、起訴意見書),基于文書中的案情信息推送類似案件。
對(duì)以上的產(chǎn)品的類案推送的產(chǎn)品使用方式以及所推送的相關(guān)結(jié)果的維度及準(zhǔn)確度進(jìn)行分析,相關(guān)產(chǎn)品的后臺(tái)邏輯一般分為兩種:
第一種是依靠關(guān)鍵詞以及分類檢索的類案搜索功能,例如北大法寶、C2J。該種檢索邏輯僅僅只能根據(jù)判決書或者相關(guān)典型案例中所出現(xiàn)的關(guān)鍵字來進(jìn)行匹配搜索,而且一定要精確匹配上。例如輸入搜索“匕首”,只能搜到文中帶有“匕首”字詞的判決書,而“小刀”“水果刀”等兇器均無法輸出;搜索“到案后如實(shí)供述犯罪事實(shí)”并無法搜索出坦白的情節(jié),即使可以搜到也只能搜到判決書中明確提到“到案后如實(shí)供述犯罪事實(shí)”內(nèi)容的案情。
第二種是基于低級(jí)自然語言檢索能力進(jìn)行的全文匹配,例如法信、擎盾。即用戶主動(dòng)將案情全覽輸入進(jìn)行檢索或者用戶輸入某個(gè)文書(例如起訴書、判決書),基于對(duì)于案情的識(shí)別結(jié)果推送出相似的案件。但是經(jīng)過試用并不能得到相似的案情,目前相關(guān)案情的搜索都僅僅只能搜索出極為簡(jiǎn)單的案情描述,且推送的結(jié)果并不準(zhǔn)確。例如搜索“盜竊1000元”可以搜索出來與盜竊的價(jià)值1000元物品相關(guān)的案件,雖然搜索結(jié)果較粗;如果輸入的搜索內(nèi)容相對(duì)較為細(xì)致,例如“在2019年10月20日,王某某在上海市某小區(qū)入戶盜竊蘋果手機(jī),手機(jī)價(jià)值4000元”,則出現(xiàn)兩種情況,識(shí)別不出內(nèi)容或者推送內(nèi)容的關(guān)聯(lián)度較粗并不是辦案人員所需要的。
第三種是基于標(biāo)簽選擇式的案情檢索功能,例如法信,但此種檢索的方式標(biāo)簽的設(shè)置維度較粗。這種方式相對(duì)來說更為準(zhǔn)確一點(diǎn),選擇標(biāo)簽之后,以標(biāo)簽設(shè)置的維度為前提可以推送出與選擇的標(biāo)簽相關(guān)聯(lián)的案件的判決書。但仍然存在推送結(jié)果維度較粗的情況,所推送的內(nèi)容也并不能達(dá)到理想化的狀態(tài),即推送的內(nèi)容可以輔助進(jìn)行案件審查。實(shí)際并沒有推送和實(shí)際需要的類似案例。
綜上所述,目前市面上的類案推送的產(chǎn)品實(shí)現(xiàn)邏輯均存在效果不好的問題,所推送出來的案件并不是辦案人員需要的,案情的相似度并不高,仍然需要辦案人員去一個(gè)個(gè)查找;同時(shí)辦案人員從案件里面得到案件的辦案思路及案件具體的細(xì)節(jié)描述的需求并沒有得到滿足,法律適用的思路也極為有限,并沒有得到較好的應(yīng)用。
(二)現(xiàn)有問題及難點(diǎn)分析
以下就現(xiàn)有的類案推送產(chǎn)品及其在辦案場(chǎng)景下的應(yīng)用情況綜合來說主要存在以下問題
1.人工智能技術(shù)的不成熟
背景中已經(jīng)提及,目前人工智能技術(shù),特別是認(rèn)知智能技術(shù)才剛起步,現(xiàn)有的人工智能技術(shù)的認(rèn)知水平程度上來說也只有五六歲兒童的智力水平,人工智能技術(shù)尚在探索階段,技術(shù)并不成熟。同時(shí)目前針對(duì)人工智能技術(shù)中認(rèn)知技術(shù)的開發(fā)也是與實(shí)際的用戶場(chǎng)景緊密結(jié)合的,目前人們對(duì)于這塊的行業(yè)認(rèn)知程度的不同,也導(dǎo)致了技術(shù)落地的難度加大。
2.數(shù)據(jù)積累不全面
目前的數(shù)據(jù)積累的不全面主要體現(xiàn)在目前的類案產(chǎn)品所推送的案例僅僅只局限于判決書,即使是公報(bào)案例也只是提供一些簡(jiǎn)單的案件關(guān)鍵信息及裁判要旨,但對(duì)于具體的案例辦案思路及爭(zhēng)議焦點(diǎn)、學(xué)界意見相對(duì)是缺失的,而且很多案件對(duì)于案件走向極為關(guān)鍵的細(xì)節(jié)案情也并無提及。辦案人員實(shí)際需要的,其實(shí)是案件的整體走向,案件的爭(zhēng)議焦點(diǎn),案件的審判結(jié)論,學(xué)界意見等等。而對(duì)于辦案人員來說,推送案件的全面數(shù)據(jù),包括所推送案件的辦案思路,案件的爭(zhēng)議焦點(diǎn)歸納,相關(guān)學(xué)者的意見等等信息恰恰是能夠輔助案件審查的關(guān)鍵,提升辦案人員的心理確信。
3.數(shù)據(jù)質(zhì)量無保障
產(chǎn)品所推送的裁判文書數(shù)據(jù)來源并不確定,其次文書所涉及的案件的辦案質(zhì)量也無法保障。目前類案推送產(chǎn)品的文書資源來源基本來源于裁判文書網(wǎng)的判決書數(shù)據(jù)以及最高檢發(fā)布的指導(dǎo)案例及最高法、各省、直轄市、自治區(qū)高級(jí)人民法院、檢察院發(fā)布的典型案例。指導(dǎo)案例及典型案例相對(duì)質(zhì)量較高,但是裁判文書網(wǎng)的案件數(shù)據(jù)并沒有進(jìn)行篩選過,很多數(shù)據(jù)甚至存在錯(cuò)別字情況。
4.業(yè)務(wù)理解不充分
目前普遍存在一個(gè)問題,即對(duì)于司法辦案業(yè)務(wù)熟悉了解的人對(duì)于技術(shù)并不了解,而對(duì)于技術(shù)了解的人對(duì)于司法辦案業(yè)務(wù)及法律知識(shí)并不了解,現(xiàn)在很多高校已經(jīng)開設(shè)了人工智能法學(xué)專業(yè),為這方面的問題提供了一種解決思路。
對(duì)于目前所存在的問題,在智慧司法這一背景下,為了達(dá)到類案推送的實(shí)際作用,不僅僅是技術(shù)方面的推動(dòng),最重要的其實(shí)是底層的法學(xué)知識(shí)、法律資源及案件審查方法論的支撐,即類案推送的知識(shí)維度+推理模型構(gòu)建,這樣才能為司法所用,為辦案人員所用。如圖1所示,建立底層的基礎(chǔ)數(shù)據(jù)及知識(shí)庫(kù)顯得尤為重要,這就需要法律法規(guī)、裁判文書、案例庫(kù)以及法學(xué)知識(shí)的支撐,但只有基礎(chǔ)數(shù)據(jù)并沒有辦法實(shí)現(xiàn)有效的利用,如何在海量的數(shù)據(jù)中找到辦案人員所真正需要的,這時(shí)候就需要知識(shí)庫(kù)將數(shù)據(jù)進(jìn)行分類,碎片化,便于檢索、推送。建立類案的知識(shí)圖譜,將法律推理形式拆解為完整的制定法規(guī)則.案件事實(shí).裁判結(jié)論.裁判思路,在此論證結(jié)構(gòu)下類案同判的法律推理構(gòu)成要素為指導(dǎo)性案例中的裁判要點(diǎn)和裁判規(guī)則,形成了案件相似性判斷以及價(jià)值論辯的內(nèi)部證成以及外部證成過程。最后基于人工智能的底層能力基礎(chǔ)及計(jì)算機(jī)技術(shù)將知識(shí)與數(shù)據(jù)相結(jié)合,形成真正的應(yīng)用平臺(tái)。
(一)建立完備的法律大數(shù)據(jù)體系
數(shù)據(jù)的收集要保證足夠完整,不出現(xiàn)紕漏,保證法律資源數(shù)據(jù)的完整性與及時(shí)性。從文書數(shù)據(jù)方面來說,盡管最高人民法院2013年所建立的裁判文書網(wǎng)構(gòu)建裁判文書的統(tǒng)一收集渠道,但數(shù)據(jù)庫(kù)中所包含的文書主要是近幾年的,缺乏長(zhǎng)時(shí)間的驗(yàn)證及司法經(jīng)驗(yàn)的提煉,數(shù)據(jù)不完整,參考價(jià)值有限。從法律法規(guī)依據(jù)方面來說更新的法律法規(guī),司法解釋,指導(dǎo)意見等需要及時(shí)更新,在大數(shù)據(jù)及人工智能技術(shù)蓬勃發(fā)展的背景下,充分利用數(shù)據(jù)收集所帶來的紅利。
(二)形成完備的知識(shí)架構(gòu)體系
法律數(shù)據(jù)碎片化的質(zhì)量與程度決定了類案推送結(jié)果的質(zhì)量,只有建立完備的知識(shí)架構(gòu)習(xí)題,才能將法律科學(xué)技術(shù)與法律業(yè)務(wù)場(chǎng)景緊密結(jié)合起來,確定案件審查的邏輯,確定標(biāo)簽體系的合理性,類案推送的結(jié)果才能具有最佳的數(shù)據(jù)匹配效果。這就需要具有法律業(yè)務(wù)知識(shí)的人加入知識(shí)架構(gòu)體系的建立中,完善現(xiàn)有產(chǎn)品的知識(shí)架構(gòu)體系。
(三)技術(shù)快速迭代升級(jí)
認(rèn)知智能技術(shù)優(yōu)化程度決定了識(shí)別效果的準(zhǔn)確性,至少需要達(dá)到準(zhǔn)入門檻,這就需要基于所構(gòu)建的完備的知識(shí)架構(gòu)體系對(duì)模型進(jìn)行精確化訓(xùn)練。第一步,準(zhǔn)確識(shí)別所構(gòu)建標(biāo)簽體系的內(nèi)容,將判決書等文書進(jìn)行碎片化處理,形成一個(gè)個(gè)碎片化的審查依據(jù);第二步,將碎片化的審查依據(jù)基于知識(shí)的邏輯進(jìn)行重組排列并一一對(duì)應(yīng)起來,形成準(zhǔn)確的類案推送結(jié)果。
(四)確定統(tǒng)一的證據(jù)證明標(biāo)準(zhǔn)
在立法上利用補(bǔ)充詳細(xì)的司法解釋等手段來實(shí)現(xiàn)法律適用統(tǒng)一,明確法律適用的范圍以及證據(jù)證明標(biāo)準(zhǔn),基于辦案經(jīng)驗(yàn)及分析近年來的案件證據(jù)體系來確定案件的證據(jù)體系,輸出案件情形所需要的不同案件證據(jù)體系,明確各類案件情形證據(jù)的證明力及證明標(biāo)準(zhǔn),確定統(tǒng)一的規(guī)則,形成完整證據(jù)鏈條。通過明確事實(shí)認(rèn)定和情節(jié)認(rèn)定的證據(jù)體系依據(jù),增強(qiáng)辦案人員內(nèi)心確信,提升整體辦案質(zhì)量。
緩解人案矛盾以及統(tǒng)一法律適用是當(dāng)下檢法系統(tǒng)面臨的更加迫切的問題,已經(jīng)不斷有在這方面進(jìn)行探索的產(chǎn)品應(yīng)用的出現(xiàn),但在調(diào)研的過程中不斷會(huì)收到基層辦案人員對(duì)于科技手段運(yùn)用在辦案場(chǎng)景中表現(xiàn)出了極大的抵觸情緒和方案。如何緩解這一矛盾以及如何推動(dòng)法律適用統(tǒng)一成為了當(dāng)前比較迫切解決的問題之一。通過將大數(shù)據(jù)及人工智能技術(shù)融入司法辦案中,實(shí)現(xiàn)類案知識(shí)推送的精細(xì)化,是解決當(dāng)前問題的重要舉措。我相信在不久的將來,人工智能能夠融入司法辦案過程中,與司法辦案過程緊密結(jié)合,實(shí)現(xiàn)“讓人民群眾在每一個(gè)司法案件中感受到公平正義”。