鄒邵坤
如果要為人工智能(Artificial Intelligence,簡稱AI)發(fā)展列一個簡史,最初恐怕要追溯到英國小說家喬納森·斯威夫特(Jonathan Swift)出版的《格列佛游記》。他在書中描述了一臺名叫“Engine”的機器,斯威夫特描述稱:“運用實際而機械的操作方法來改善人的思辨知識,……最無知的人,只要適當(dāng)付點學(xué)費,再出一點點體力,就可以不借助于任何天才或?qū)W力,寫出關(guān)于哲學(xué)、詩歌、政治、法律、數(shù)學(xué)和神學(xué)的書來?!雹賉英]喬納森·斯威夫特:《格列佛游記》,白馬譯,江西教育出版社2015年版,第144頁。
1956年的達(dá)特茅斯(Dartmouth)會議上,與會專家在一份提案中首次提出“人工智能”這一術(shù)語,這次會議成為人工智能誕生的標(biāo)志,在后面的幾十年間,一代又一代的科學(xué)家投身于人工智能的研究?,F(xiàn)在,“人工智能”在維基百科上的解釋是:“由人工制造出來的系統(tǒng)所表現(xiàn)出來的智能。”②參考維基百科中文網(wǎng)站“人工智能”詞條,載“維基百科”,https://en.wikipedia.org/wiki/Artificial_intelligence,最后訪問時間:2018年12月26日。
從20世紀(jì)60年代到90年代再到21世紀(jì)的今天,從西洋跳棋到國際象棋再到圍棋,人工智能至少三次在公眾中引發(fā)熱潮,“人類是不是要被機器毀滅了”之類的話題早就超出了“科幻迷”的圈子,在普通人中流行開來。網(wǎng)上流傳著一幅有關(guān)“人工智能發(fā)展成熟度曲線”的漫畫,③該漫畫可參見李開復(fù)、王詠剛:《人工智能》,文化發(fā)展出版社2017年版,第42頁。形象地展示出了在此前兩次人工智能熱潮中,大眾從被人工智能在某些領(lǐng)域的驚艷表現(xiàn)震撼,到逐漸認(rèn)識到當(dāng)時的人工智能還有各種局限,以至于產(chǎn)生巨大心理落差的有趣過程。但正如科幻作家劉慈欣所言:“也許這就是真正的AI即將誕生的征兆,我們正處于一個AI種族的史前時代。”④參見劉慈欣:《最糟的宇宙,最好的地球——劉慈欣科幻評論隨筆集》,四川科學(xué)技術(shù)出版社2015年版,第223頁。只有先努力看清真實的當(dāng)下,才能對未來作出相對精準(zhǔn)的預(yù)測。
我們常說,要把法律女神的大腦武裝上技術(shù),讓法律女神的智慧更好地照耀法律行業(yè),讓當(dāng)中的每一個從業(yè)人員都更有智慧,但是卻很容易忘記人工智能行業(yè)的一句老話:“有多少人工,就有多少智能。”清華大學(xué)的一位老師曾在第二屆清華明理法治論壇上說,清華大學(xué)人工智能實驗室成立于1986年,在20世紀(jì)90年代,整個行業(yè)遇到了一個低谷期,申報課題都很困難,到最近幾年才又活躍起來。她的擔(dān)憂是,一個行業(yè)應(yīng)用人工智能的時候,能不能正視技術(shù)本身的優(yōu)勢以及它當(dāng)下的瓶頸。
2011年全美智力競賽,國際商業(yè)機器公司(IBM)的人工智能沃特森(Watson)高比分戰(zhàn)勝兩位全美智力冠軍,這無疑是AI的一個燦爛瞬間。⑤2011年,沃特森在美國最受歡迎的智力問答電視節(jié)目《危險邊緣》(Jeopardy)中亮相,一舉打敗了人類智力競賽的冠軍。參見“IBM官網(wǎng)”,http://www-31.ibm.com/ibm/cn/cognitive/outthink/watson/,最后訪問時間:2018年12月26日。Watson當(dāng)時采用的是一個多專家決策系統(tǒng)算法模型的變體,該算法早在1991年已經(jīng)公布,但其訓(xùn)練數(shù)據(jù)卻是基于維基百科、古登堡計劃860萬份文獻(xiàn)等大量資料。有科學(xué)家甚至提出了第三次人工智能技術(shù)的發(fā)展公式:從關(guān)鍵算法的提出到取得實質(zhì)進(jìn)步需要18年,而從關(guān)鍵數(shù)據(jù)集的出現(xiàn)到獲得相應(yīng)進(jìn)步只需要3年,兩者相差6倍。在谷歌研究院的最新進(jìn)展中,圖像識別(包括比較成熟的音頻識別)這兩年的突破也是在原有算法的基礎(chǔ)上通過對大量新數(shù)據(jù)的訓(xùn)練而實現(xiàn)的,⑥參見新智元:《李飛飛團隊最新成果:識別谷歌街景中汽車圖像,預(yù)測人口政治傾向》,載“百度百家號”,https://baijiahao.baidu.com/s?id=1585472724280054972&wfr=spider&for=pc,最后訪問時間:2018年12月26日。這是李飛飛博士⑦李飛飛(Fei-FeiLi),斯坦福大學(xué)計算機科學(xué)學(xué)院終身教授,斯坦福人工智能實驗室主任,谷歌云首席科學(xué)家。在國際上作為華裔科學(xué)家在人工智能領(lǐng)域獨占鰲頭的創(chuàng)造,也是華人對世界科學(xué)的貢獻(xiàn)。
以和法律幾乎同樣古老的醫(yī)療服務(wù)業(yè)為例,根據(jù)市場調(diào)研機構(gòu)對2017年在國內(nèi)醫(yī)療健康數(shù)據(jù)行業(yè)參與經(jīng)營的320家公司的統(tǒng)計報告顯示,2014年,我國醫(yī)療信息化總花費為223.12億元,2015年增至243.6億元,預(yù)計2020年將達(dá)到430.01億元,年復(fù)合增長率為11.1%;2014年,我國臨床信息化解決方案的市場規(guī)模約為20.64億元,2015年增至24.48億元,預(yù)計2020年將達(dá)到52.17億元,年復(fù)合增長率為16.71%。⑧參見埃森哲:《2017中國醫(yī)療信息化行業(yè)公司市場梳理報告》,載“搜狐網(wǎng)”,http://www.sohu.com/a/140043789_505782,最后訪問時間:2018年12月26日。這意味著,2014—2021年間,醫(yī)療服務(wù)的市場規(guī)模會實現(xiàn)從百萬級(Million)到十億級(Billion)的指數(shù)級跨越。如此大規(guī)模的投入之下,我們卻發(fā)現(xiàn),人們到醫(yī)院還是在排隊看病,并沒有出現(xiàn)去醫(yī)院看病時大夫都不見了,由機器人取而代之的場景。面對人工智能浪潮,法律圈也有人開這樣的玩笑:“有沒有這么一天,我們這些律師不再需要辦案子,而是打打高爾夫就可以了?”事實上這個問題至少有兩個層次:一方面,如果打高爾夫是獲取案源的主要途徑,那法律行業(yè)從業(yè)者可能有更多的時間去打高爾夫;另一方面,要弄清楚技術(shù)目前所起的是輔助作用還是替代作用。
人工智能與機器學(xué)習(xí)是人類為了克服自身肉眼凡胎的有限性所創(chuàng)造的工具。機器學(xué)習(xí)在本質(zhì)上來說是跨學(xué)科的,使用了計算機科學(xué)、統(tǒng)計學(xué)和人工智能以及其他對應(yīng)行業(yè)學(xué)科的知識。因此,無論是在目前的人工智能界還是在產(chǎn)業(yè)界,對于跨界掌握以上綜合技能的人才渴求度都非常高。據(jù)麥肯錫(Mc Kinsey)管理咨詢公司預(yù)測,到2018年,具備深度數(shù)據(jù)分析技能的大數(shù)據(jù)經(jīng)理和工程師,至少還有150萬人的缺口,而且這個數(shù)字還在飛速飆升。⑨參見麥肯錫:《大數(shù)據(jù):下一個創(chuàng)新、競爭和生產(chǎn)力的前沿》(Big Data:The Next Frontier for Innovation,Competition,and Productivity),載“百度文庫”,https://wenku.baidu.com/view/2e494d6d9b6648d7c1c746a7.html,最后訪問時間:2018年12月26日。這個行業(yè)最缺乏的不是原來單項培養(yǎng)的法律人才或者技術(shù)人才,缺少的是跨越式的復(fù)合人才。技術(shù)界公認(rèn),圖像識別和語音識別突破路徑上遇到的最大困難,也是如何打造一個跨專業(yè)專家團隊對標(biāo)準(zhǔn)數(shù)據(jù)集進(jìn)行標(biāo)注,以方便機器學(xué)習(xí)。
我們知道,法律邏輯的結(jié)構(gòu)是“大前提→小前提→結(jié)果”三段論,看似非常清晰簡單,這是否意味著機器能夠輕易學(xué)會?實際上完全不是。
在法律智能研發(fā)的最早期,也曾有人設(shè)想,法律是一個封閉的規(guī)則體系,系統(tǒng)可以自動按照三段論,基于法律規(guī)定(大前提),再輸入發(fā)生的案件事實(小前提),就能得到相應(yīng)的裁判結(jié)果。但在真實世界中,無論是私法領(lǐng)域,還是公法領(lǐng)域,某一法律問題的解決可能會存在多種學(xué)說、理論和處理結(jié)果,在直面具體的實務(wù)問題時,會存在千變?nèi)f化的事實要素、數(shù)不清的爭議焦點和難以預(yù)測的模糊地帶,絕非圍棋和德州撲克的規(guī)則那樣透明、清晰。目前,即使是國際上最先進(jìn)的技術(shù),也無法做到純粹靠機器的無監(jiān)督學(xué)習(xí)⑩機器學(xué)習(xí)可以簡單地分為有監(jiān)督學(xué)習(xí)(Supervised Learning)和無監(jiān)督學(xué)習(xí)(Unsupervised Learning)兩大類,有監(jiān)督學(xué)習(xí)的核心是使用已知正確答案的示例來訓(xùn)練智能系統(tǒng)和網(wǎng)絡(luò),無監(jiān)督學(xué)習(xí)則相反,設(shè)計者對問題的答案并不知曉,而是想讓機器通過分析每個問題(或事實)的特征信息,從而得出規(guī)律性的結(jié)論。實現(xiàn)“暴力突破”,或者單純憑借人工智能識別法律邏輯,即能夠讓機器像法官那樣思考。
法律認(rèn)知(或者法律人工智能)的核心并不是算法——法律人認(rèn)為可以通過機器實現(xiàn)法律邏輯,而計算機專家卻認(rèn)為做到這一點難于上青天,究其原因,計算機專家認(rèn)為計算智能是基于大量標(biāo)簽數(shù)據(jù),而非一個固定邏輯。如果系統(tǒng)被禁錮在固定邏輯基礎(chǔ)上無法進(jìn)行學(xué)習(xí)演進(jìn),一旦邏輯被寫死,系統(tǒng)就將無法匹配真實案件中變幻莫測的社會生活——當(dāng)社會生活發(fā)生一點細(xì)小的變化時,系統(tǒng)很可能必須整體推倒重寫,而這個成本極其高昂。邏輯推理在人工智能技術(shù)領(lǐng)域之所以比較難實現(xiàn),其原因是沒有一個法律事實會根據(jù)設(shè)定好的規(guī)則發(fā)生,法律的價值在于當(dāng)一個事實發(fā)生之后再進(jìn)行評價;計算智能則不然,它是通過對數(shù)據(jù)的標(biāo)簽化去尋找現(xiàn)實中的規(guī)律,用這種規(guī)律訓(xùn)練出的模型,會根據(jù)不同的數(shù)據(jù)迭代而自適應(yīng)改變?,F(xiàn)在的機器翻譯和語音識別實際上都是走的計算智能道路,并取得了巨大的突破,第一代專家智能法律系統(tǒng)早在1970年就已經(jīng)出現(xiàn),[11]可供參閱的相關(guān)討論刊載于《美國律師協(xié)會期刊》(American Bar Association Journal)1983年第1期。但幾乎并沒有給法律界帶來任何改變。
在法律人的實際工作場景金字塔中,處于第一層的是大量基礎(chǔ)性、程序性的工作,這也是當(dāng)前許多低年級律師和實習(xí)生正在做的事情;處于第二層的是需要高度經(jīng)驗性判斷和總結(jié)歸納的事務(wù);處于第三層的則是正義論和法哲學(xué)層面的問題。目前的法律人工智能仍處于要解決第一層事務(wù)性工作的階段,致力于搭建好基礎(chǔ)設(shè)施,讓散見于法、檢、律之間的數(shù)據(jù)能夠聯(lián)動、流通,用機器取代大量重復(fù)性、低附加值的工作,從而融合法律與科技,以大數(shù)據(jù)和人工智能來解放整個法律行業(yè)的生產(chǎn)力。在這個過程中,人工智能會不斷經(jīng)歷能力的進(jìn)階。
目前,法律智能的研發(fā)工作還有很多困難,其中最大的一個障礙可能是——這一點或許和整個計算智能行業(yè)面臨的問題相同——如何取得足夠?qū)I(yè)、大量的行業(yè)知識標(biāo)簽數(shù)據(jù)。要突破這個障礙,需要大量的法律行業(yè)專家和計算機算法專家,甚至非常可能是需要培養(yǎng)“法律+算法”的跨學(xué)科專家。谷歌學(xué)術(shù)翻譯更新算法的基礎(chǔ),也是組織了一個專門的團隊,針對標(biāo)簽數(shù)據(jù)進(jìn)行了大量訓(xùn)練,這才造就了谷歌翻譯“一騎絕塵”的驚艷效果。
可喜的是,中國的數(shù)據(jù)法學(xué)研究和法律科技應(yīng)該說是走在世界前端的,這在很大程度上得益于我們擁有全世界最豐富的數(shù)據(jù)礦藏——最高人民法院先后在2010年、2013年、2016年三次發(fā)布《關(guān)于人民法院在互聯(lián)網(wǎng)公布裁判文書的規(guī)定》,[12]《最高人民法院關(guān)于人民法院在互聯(lián)網(wǎng)公布裁判文書的規(guī)定》(法發(fā)〔2010〕48號,2014年1月1日廢止);《最高人民法院關(guān)于人民法院在互聯(lián)網(wǎng)公布裁判文書的規(guī)定》(法釋〔2013〕26號,于2013年11月13日由最高人民法院審判委員會第1595次會議通過,自2014年1月1日起施行);《最高人民法院關(guān)于人民法院在互聯(lián)網(wǎng)公布裁判文書的規(guī)定》(法釋〔2016〕19號,于2016年7月25日由最高人民法院審判委員會第1689次會議通過,自2016年10月1日起施行)。截至2018年12月26日,裁判文書公開總量超過5976萬篇,[13]基于中國裁判文書網(wǎng)首頁的實時更新數(shù)據(jù),參見“中國裁判文書網(wǎng)”,http://wenshu.court.gov.cn/,最后訪問時間:2018年12月26日。這為法律大數(shù)據(jù)研究和整個行業(yè)提供了非常好的數(shù)據(jù)資源。與此同時,一方面需要在法律服務(wù)領(lǐng)域進(jìn)行研發(fā)和資本的持續(xù)投入,通過提供法律智能服務(wù)、構(gòu)建法律科技生態(tài)圈的方式,提升法律行業(yè)的科技屬性;另一方面還需要通過對法律業(yè)務(wù)的不斷深入研究,將頂級法律專家團隊的知識“物化”為服務(wù)于全行業(yè)、提升行業(yè)專業(yè)能力的智能工具。這中間還有很長的路要走。
法律智能系統(tǒng)的研發(fā)進(jìn)度還體現(xiàn)在“機器學(xué)習(xí)”本身的基礎(chǔ)性制約上:首先,用于訓(xùn)練的標(biāo)簽數(shù)據(jù)必須對解決特定問題確實有效。比如,一位使用法律智能系統(tǒng)的律師如果嘗試模擬季節(jié)和法律服務(wù)費用之間的關(guān)系,很可能就是徒勞無功的,機器只能模擬學(xué)習(xí)實際存在的關(guān)系,即便這個關(guān)系隱藏得非常深,也不會構(gòu)成太多的困難;反之,對于那些人類學(xué)家無法手動用數(shù)據(jù)解決(或者關(guān)聯(lián)關(guān)系過于稀疏)的問題,機器也無法解決。其次,訓(xùn)練過程中必須盡可能窮盡有影響的因素。機器學(xué)習(xí)并非建立在所有對結(jié)論的影響因素都可知的前提下,但人類對客觀規(guī)律的認(rèn)知遠(yuǎn)比我們想象的要狹隘,因此在人類可知的范圍能盡可能的窮盡有影響的因素,會在很大程度上幫助機器走完人力難以企及的“最后一公里”。
與其追求高高在上的概念,不如回到真實的場景,從業(yè)務(wù)場景中尋找技術(shù)的落地點和結(jié)合點,而不是一味簡單追求高大上的專業(yè)名詞。這一點,在法律學(xué)術(shù)研究領(lǐng)域也是通用的。法律計算智能的產(chǎn)生基礎(chǔ),首先在于大數(shù)據(jù)領(lǐng)域的精深研究和科學(xué)路徑,然后通過在真實應(yīng)用場景中不斷構(gòu)建數(shù)據(jù)循環(huán),最終才能逐漸構(gòu)建起來。當(dāng)把數(shù)據(jù)“打通”之后,哪怕沒有高深的“機器學(xué)習(xí)”,也可以更好、更便捷地服務(wù)當(dāng)事人和法官。
我們可以用一個案例來示范:“5月9日22時32分,在北京市東城區(qū)東直門外大街十字坡路口東50米處發(fā)生交通事故,現(xiàn)場發(fā)現(xiàn)一輛北京牌照的白色英菲尼迪越野車與前方三輛車發(fā)生事故。經(jīng)檢測,肇事車駕駛員高某某每百毫升血液中酒精含量為243.04毫克,達(dá)到醉酒駕車標(biāo)準(zhǔn)三倍之高。”
這是一個很有意思的實驗,也曾經(jīng)在多所法學(xué)院校進(jìn)行過現(xiàn)場測試,測試者向法學(xué)生提問:“這段新聞報道里的事實構(gòu)成了什么法律關(guān)系?”大部分學(xué)生能夠答出“構(gòu)成危險駕駛罪”,少部分學(xué)生能夠答出“侵犯財產(chǎn)權(quán)”或“侵犯人身權(quán)”等。通過法律智能系統(tǒng)[14]實驗系統(tǒng)采用北京華宇元典信息服務(wù)有限公司基于“睿核”技術(shù)開發(fā)的智庫系統(tǒng)。分析,得出的推薦結(jié)果確實是“危險駕駛罪”;但從歷史數(shù)據(jù)來看,系統(tǒng)給出的推薦結(jié)果還包括“責(zé)任保險合同糾紛”和其他的財產(chǎn)損失糾紛案由。系統(tǒng)之所以能作出這樣的判斷,并非基于法律概念和邏輯的學(xué)習(xí),而是基于對歷史上大量的同類案件事實和裁判文書進(jìn)行識別,通過學(xué)習(xí)的機器像經(jīng)驗豐富的人類一樣判斷某個特定事實在當(dāng)下會構(gòu)成何種案由,甚至超越了一般法學(xué)畢業(yè)生。而且,由于審判規(guī)律、法官傾向以及“醉駕”的認(rèn)定標(biāo)準(zhǔn)也在發(fā)生改變,過5年、10年再看,可能結(jié)果呈現(xiàn)會完全不一樣,到那時,智能系統(tǒng)就可能基于對模型的重新學(xué)習(xí)而推薦出新的案由。
這套智能案由識別系統(tǒng)的開發(fā)團隊分享研發(fā)經(jīng)驗時談到,在案由識別的訓(xùn)練基礎(chǔ)上,系統(tǒng)還可以更進(jìn)一步實現(xiàn)對影響量刑情節(jié)的判斷。在2017年10月5日22時40分許發(fā)生的郎某某駕車致交通事故一案中,系統(tǒng)給出的預(yù)期量刑結(jié)果是“拘役3個月左右,不緩刑,罰金3000到5000元”。而最終法院宣判結(jié)果確實為拘役3個月,罰金人民幣4000元。這套智能量刑輔助系統(tǒng)在實務(wù)中被采用和認(rèn)可的原因,也正是用真實案件進(jìn)行具體量刑測試時得出的結(jié)論與承辦人根據(jù)專業(yè)和業(yè)務(wù)經(jīng)驗所做的判斷基本一致,這對彼此雙方都是一種很好的驗證。
最高人民檢察院于2017年公布的數(shù)據(jù)顯示,廣東省人民檢察院適用認(rèn)罪認(rèn)罰從寬程序辦理的案件,偵查階段平均用時39.19天,審查起訴平均用時16.1天,審判平均用時20.17天,均大幅低于普通案件平均用時,專業(yè)化、智能化辦案使司法工作的質(zhì)量和效率都大幅提升;而量刑決策過程中引入人工智能輔助系統(tǒng)軟件后,廣東地區(qū)的認(rèn)罪認(rèn)罰從寬案件量刑建議采納率達(dá)到94.46%,已判決案件中共有99人上訴,上訴率僅為0.63%,[15]參見《案件處理質(zhì)效提升 制度設(shè)計日趨完善——“認(rèn)罪認(rèn)罰從寬”試點效果不錯》,載《人民日報》(海外版)2018年2月26日。不僅在全國試點地區(qū)處于領(lǐng)先水平,也遠(yuǎn)高于一般刑事案件量刑建議采納率。
之所以能達(dá)到這樣相對精準(zhǔn)的結(jié)果,是因為開發(fā)團隊中的大量法律業(yè)務(wù)專家們把知識和經(jīng)驗?zāi)P拓暙I(xiàn)到了智能訓(xùn)練中,手把手幫助每一個年輕法律人避免經(jīng)驗上的缺失和短板,在堅實的分析基礎(chǔ)上,更確切地說,是在知識圖譜對歷史的精確定位上得出了分析模型和可能的預(yù)測結(jié)果。
知識圖譜是一種知識解析、知識發(fā)展進(jìn)程與知識間結(jié)構(gòu)關(guān)系的可視化呈現(xiàn),簡單地說,這是一種對于挖掘、分析、構(gòu)建、繪制和知識呈現(xiàn)及知識之間相互聯(lián)系的描述技術(shù)。法律知識圖譜是在法律這個專業(yè)領(lǐng)域的數(shù)據(jù)深耕和挖掘的基礎(chǔ)上對法律數(shù)據(jù)資源進(jìn)行的知識圖譜呈現(xiàn)。以故意殺人罪為例:從罪名的犯罪構(gòu)成入手,如果按照三階層犯罪構(gòu)成體系,可以依次從事實認(rèn)定、違法性、有責(zé)性三個層面進(jìn)行評價。其中的事實認(rèn)定需要確定行為人、行為對象等,違法性可能涉及正當(dāng)防衛(wèi)等違法阻卻事由,有責(zé)性可能涉及行為人的年齡或者精神狀態(tài)。如此不斷展開延伸,就會形成一個樹狀圖,這個樹狀圖會在數(shù)據(jù)庫里形成一個層級分布的模型。這是法律知識圖譜制作的第一步,也被稱作知識管理。接下來,還需要法律人和程序員密切合作,將法律知識轉(zhuǎn)化為機器可以認(rèn)知并學(xué)習(xí)的知識圖譜,為了完成這些基礎(chǔ)數(shù)據(jù)的處理制作,最初,法律研究員需要與程序員結(jié)對子,在電腦面前一行一行地敲代碼,而現(xiàn)在,已經(jīng)有了一套完整的生產(chǎn)平臺,讓法律研究員與程序員都有了更高效的分工,生產(chǎn)效率也得到非常大的提升。
但法律畢竟是一種高維度的復(fù)雜系統(tǒng),不太可能作出精準(zhǔn)預(yù)言,只能通過分析歷史規(guī)律中影響因素的關(guān)鍵定義,嘗試性地對歷史規(guī)律進(jìn)行側(cè)寫,把該規(guī)律客觀地呈現(xiàn)出來,包括分析的過程、同類案件有多少判處可能性、找到多少相似案例……將這一系列信息盡可能完整地呈現(xiàn)在使用者面前,從而提高使用者的決策效率。這絕對不是一個黑盒系統(tǒng),智能系統(tǒng)中的每一組數(shù)據(jù)都應(yīng)當(dāng)是透明的,同時也能看到真實案例。在這個基礎(chǔ)上,數(shù)據(jù)至少能解決一個困擾法律行業(yè)已久的問題,那就是當(dāng)一個法律問題存在爭議,而無論是裁判者、司法機關(guān)還是普通人,都想得到法律公正判決,如何為其提供一個客觀的比較標(biāo)準(zhǔn)。需要再次強調(diào)的是,基于這套理論構(gòu)建的智能系統(tǒng)所輸出的結(jié)果一定不是絕對的,如果把數(shù)據(jù)維度調(diào)到2010年之前,得到的結(jié)果可能截然相反,智能系統(tǒng)需要保證的是數(shù)據(jù)和分析結(jié)果真實且客觀。
再以法律檢索場景為例,在傳統(tǒng)的檢索工具上進(jìn)行檢索時,最早的技術(shù)是基于關(guān)鍵詞匹配,即檢索得到的答案是關(guān)鍵詞匹配的結(jié)果,如果關(guān)鍵詞本身設(shè)定得不夠準(zhǔn)確,答案也難如人意。我們知道,信息和知識是有區(qū)別的:“信息”是零散的,而“知識”則有體系與邏輯,利用法律智能系統(tǒng)對于法律概念的認(rèn)知能力和底層的知識圖譜,將傳統(tǒng)的“信息檢索”改造為“知識檢索”,幫助法律人在充滿碎片的世界里,融合完整、全面的視角,“在充滿答案的世界里,提出更好的問題”可能才是解鎖的關(guān)鍵。用一句通俗的話來形容,智能檢索技術(shù)應(yīng)該是為每位法律參與者“福爾摩斯”搭配一位能夠從碎片化數(shù)據(jù)中推演出完整場景的“華生”。比如以法院為維度,分析某一個法院在某一類案件中的裁判依據(jù),以法官為維度,判斷某一位法官在某一個案件中的裁判傾向和主要觀點。在學(xué)術(shù)研究范疇,把學(xué)者們的文章觀點碎片化,以某一個特定事實為小前提,在運行時不但給出實證的量刑結(jié)果,還推送學(xué)者對這個問題的觀點。這是一種全新的知識傳播形式,意味著學(xué)術(shù)研究不再需要一頁一頁地翻閱書山文海,也不再需要研究一整個復(fù)雜的體系性問題,在碎片化模式下,學(xué)術(shù)研究效率可能會得到大大提高,也能幫助年輕的法律人(法官、檢察官、律師、企業(yè)法務(wù)等等)加快學(xué)習(xí)知識的速度。而法律檢索智能的實現(xiàn),將不僅服務(wù)于司法機關(guān)、法律專業(yè)從業(yè)者、學(xué)術(shù)研究,也能夠服務(wù)于案件當(dāng)事人,每一個人都應(yīng)當(dāng)有權(quán)利知道是什么樣的人在審理自己的案件,這并不是應(yīng)對策略的需要,而是當(dāng)事人在信息上被公平、公正、對等對待的需要。
在傳統(tǒng)的庭審場景里,法律和技術(shù)還可以更深度地進(jìn)行結(jié)合。以語音識別技術(shù)為例,該項技術(shù)長期停留在相對簡單的轉(zhuǎn)錄層面,許多法院在使用該技術(shù)將庭審實況轉(zhuǎn)錄成書面文本時,由于機器并不會自主對庭審各方的口頭語言進(jìn)行歸納總結(jié),所以極易出現(xiàn)“庭審兩小時,筆錄五十頁”的情況。如果嘗試用語義歸納技術(shù),就有可能對機器轉(zhuǎn)錄的文本再進(jìn)行分析總結(jié),這是語音技術(shù)的其中一個使用場景。
對于在法庭質(zhì)證過程中三方信息傳遞不均衡的問題,語音識別技術(shù)和電子卷宗技術(shù)也有了最新融合成果,通過智能示證系統(tǒng)已經(jīng)可以實現(xiàn)根據(jù)質(zhì)證過程中每個證據(jù)所證明的事實,對證據(jù)進(jìn)行重新串聯(lián),以時間為維度還原可能的案件事實,這套技術(shù)能夠適用于所有案由。
更進(jìn)一步的探索也在邏輯性更強的部門法(如《刑法》)領(lǐng)域里發(fā)生,同樣以庭審質(zhì)證為例:在傳統(tǒng)場景下,庭審各方在質(zhì)證時常常無法判斷某一個爭議焦點到底有哪些對應(yīng)證據(jù),通過機器輔助,以構(gòu)成要件為邏輯框架,對證據(jù)進(jìn)行拆分、歸類,在庭審中通過語音指令對出示證據(jù)一方的電子卷宗進(jìn)行靈活調(diào)取,然后將需要出示的片段進(jìn)行放大展示,能夠有效提升傳統(tǒng)庭審過程中三方的質(zhì)證效率和透明度。智能示證系統(tǒng)還可依據(jù)庭審記錄中每份證據(jù)的證明事項不同,輔助法官根據(jù)時間線對現(xiàn)有證據(jù)進(jìn)行整理和補充。圖像識別和語義理解技術(shù)的綜合運用,將傳統(tǒng)的紙質(zhì)卷宗流轉(zhuǎn)成三方共享的智能示證形式,可以有效節(jié)約承辦人的時間、精力。
傳統(tǒng)的應(yīng)用系統(tǒng)開發(fā)多數(shù)著眼于業(yè)務(wù)流程軟件,而檢察院的業(yè)務(wù)流程和法院的業(yè)務(wù)流程截然不同,更不用說律師事務(wù)所、司法管理機關(guān)等其他機構(gòu)的個性化需求,雖然都是法律活動參與者,但很難共用一套底層平臺。但更新的研發(fā)思路認(rèn)為,只要是在同一個領(lǐng)域(比如刑事案件)里,無論是法院還是檢察院適用的都是同一套《刑法》和《刑事訴訟法》,也就是同一套邏輯規(guī)則體系,所以,計算機和法律最好的結(jié)合點首先應(yīng)該是在邏輯,當(dāng)機器能夠成功地通過部門法的邏輯訓(xùn)練的時候,這項技術(shù)所能支撐的就不再是一個行業(yè),而是一個領(lǐng)域。目前大多數(shù)法律智能技術(shù)之所以首先在刑事案件領(lǐng)域作出突破,也是因為該領(lǐng)域本身邏輯性非常強,構(gòu)成要件理論的研究也非常成熟,在民事案件和行政案件領(lǐng)域中還需要更多的探索。
讓機器逐漸習(xí)得法律認(rèn)知能力,在數(shù)據(jù)孤島間搭建連接的道路,將法律人的智慧轉(zhuǎn)化為機器智能,通過構(gòu)建更統(tǒng)一的法律智能平臺——對象不僅僅是法官、檢察官,還應(yīng)當(dāng)包括律師、企業(yè)法務(wù)和法律學(xué)者——能夠提升整個行業(yè)的科技感和技術(shù)力量,而不是單打獨斗、重復(fù)建設(shè),進(jìn)而形成進(jìn)化型的法律服務(wù)市場,這個市場不僅包括公共法律服務(wù),還應(yīng)該包括商業(yè)法律服務(wù),是從業(yè)者一直為之努力的法律智能愿景。
拿破侖在制定法國《民法典》的時候,希望能涵蓋當(dāng)下和此后很長時間內(nèi)的所有糾紛,歷史證明,他失敗了。中國政法大學(xué)的江平教授就此曾說,“再完善不過的民法典,也會因為‘風(fēng)車和磨坊’的規(guī)定失去了它的無所不包性”。[16]江平:《制訂民法典的幾點宏觀思考》,載《政法論壇》1997年第3期。如何解決法律的滯后性問題?判例法國家有各種各樣的配套制度,但是成文法國家呢?在社會契約論時代,人們可以通過法定成文讓渡部分權(quán)利實現(xiàn)每個人最大的自由,但無論是最近科技技術(shù)的爆發(fā),還是之前社會經(jīng)濟的高速增長,都在告訴我們:作為法律人,作為曾經(jīng)肩負(fù)起社會規(guī)則制定的一群人,我們的理性是有限的,很難想象下一步科技能夠帶來什么樣的迭代。
在《未來簡史》第11章“信數(shù)據(jù)得永生”的結(jié)尾處,尤瓦爾·赫拉利說:“我們無法真正預(yù)測未來,因為科技并不會帶來確定的結(jié)果。同樣的科技,也可能創(chuàng)造出非常不一樣的社會”,“人工智能和生物科技的興起肯定將改變世界,但并不代表只有一種結(jié)局”。[17]參見[以]尤瓦爾·赫拉利:《未來簡史:從智人到神人》,林俊宏譯,中信出版社2017年版,第359頁。這句話的語境是針對《未來簡史》一書中所描述的各種情境和可能性,人類的思想和行動通常會受限于當(dāng)前的意識形態(tài)和社會制度。這對于法律行業(yè)的人工智能發(fā)展也同樣適用。
在近10年的探索中,法律智能經(jīng)歷了從純粹的技術(shù)發(fā)展到技術(shù)結(jié)合行業(yè)深入發(fā)展的迭代過程,目前取得了階段性成果,其基礎(chǔ)邏輯依然來自于法哲學(xué)和法理學(xué),如果我們相信成文法的每一個規(guī)定都可投影在真實判決中,而每一個證據(jù)也都可以投影在判決事實中,那么這些投影相交的中間點就是那個我們還不知道如何命名的核心要素。這種核心既不是靠玄理,也不是靠任何實踐經(jīng)驗或者由誰拍腦袋靈光一現(xiàn)可以獲得的,它需要持續(xù)不斷地進(jìn)行人機交互、人機訓(xùn)練和人機互聯(lián)。
法律科技和智能系統(tǒng)的演進(jìn)并不是某一個人或團隊的事,而是整個法律行業(yè)人才、技術(shù)、資本的大迭代,除了需要建設(shè)足夠的標(biāo)簽體系,還要有足夠的監(jiān)督學(xué)習(xí)、深入學(xué)習(xí)技術(shù),以及足夠的數(shù)據(jù)回流平臺、專家經(jīng)驗的最初設(shè)定等等,需要所有這些一起構(gòu)成一個有機整體并進(jìn)行自主生態(tài)循環(huán),才有可能實現(xiàn)。我們希望借助技術(shù)的無限智能去突破每個法律人個體的有限理性,不僅是在經(jīng)驗上,也可能是在邏輯上實現(xiàn)法律與智能的真正結(jié)合。這正是在中國當(dāng)前經(jīng)濟環(huán)境和社會發(fā)展的關(guān)鍵節(jié)點上談?wù)摲扇斯ぶ悄艿臅r候,整個法律共同體所抱持的目標(biāo)和理念。