李弸
隨著大數(shù)據(jù)、人工智能的飛速發(fā)展,海量數(shù)據(jù)資源逐步成為國家層面最為重要的基礎(chǔ)性戰(zhàn)略資源之一。習近平總書記指出:“要運用大數(shù)據(jù)提升國家治理現(xiàn)代化水平,建立健全大數(shù)據(jù)輔助科學決策和社會治理的機制,推進政府管理和社會治理模式創(chuàng)新,實現(xiàn)政府決策科學化、社會治理精準化、公共服務(wù)高效化。”
黨的十九大報告明確,立法應(yīng)遵循科學立法、民主立法、依法立法的原則。大數(shù)據(jù)及人工智能在立法領(lǐng)域的應(yīng)用,為立法提供了全新的思路,對于更好實現(xiàn)以良法促進發(fā)展、保障善治,意義重大而深遠。
現(xiàn)實困境
早在2014年,天津市人大常委會就依托北大法寶法律數(shù)據(jù)庫,投入使用了全國首個運用人工智能輔助地方立法的法律應(yīng)用系統(tǒng)——規(guī)范性文件審查系統(tǒng)。此后,多個地方人大常委會陸續(xù)引進北大法寶智能立法平臺,將人工智能運用于地方立法。當前,人工智能在地方立法中的實踐應(yīng)用主要包括以下幾個領(lǐng)域:規(guī)范性文件備案審查、法規(guī)清理、法規(guī)文件制定。
盡管各地人大常委會漸次開展了有益探索,但總體而言,大數(shù)據(jù)在我國立法領(lǐng)域遠未得到應(yīng)有重視,尚處于起步階段,應(yīng)用范圍較窄,功能開發(fā)較少,整體推進速度較慢。
運用大數(shù)據(jù)技術(shù)進行分析預(yù)測的前提在于數(shù)據(jù)的完備,而我國目前的立法基礎(chǔ)數(shù)據(jù)庫存在以下問題:一是數(shù)據(jù)共享不足。當下,不同政府部門控制的數(shù)據(jù)并未實現(xiàn)開放共享,海量政府數(shù)據(jù)亟須“蘇醒”,尚未形成統(tǒng)一的數(shù)據(jù)開放格式,不利于數(shù)據(jù)的有效利用。二是數(shù)據(jù)價值密度偏低,很多地區(qū)可下載的數(shù)據(jù)存在碎片化、低容量等問題。三是大數(shù)據(jù)開放市場處于無序狀態(tài),重復(fù)建設(shè)、信息孤島、信息盲點、數(shù)據(jù)打架等現(xiàn)象大量存在。比如地方人大的信息網(wǎng)站與“一府一委兩院”、同級人大、上下級人大并未實現(xiàn)互聯(lián)互通。即使是同級人大,代表履職平臺、備案審查平臺、預(yù)算聯(lián)網(wǎng)監(jiān)督平臺也存在重復(fù)建設(shè)、各自為政的問題。
人工智能的本質(zhì)在于算法和數(shù)據(jù)處理,機器通過學習,對海量數(shù)據(jù)進行自動挖掘與預(yù)測,以形成統(tǒng)一的智能化算法或參考指引。而算法形成的關(guān)鍵在于深度學習,其中最主要的方法即為知識圖譜的構(gòu)建。所謂知識圖譜,是指知識間結(jié)構(gòu)關(guān)系的可視化呈現(xiàn),簡單來說,就是將人類的知識整合到機器中去,使其有效管理知識、規(guī)則和結(jié)論,從而形成類似人腦推理的知識圖譜。而法律語言的豐富多彩,使得“投喂”給人工智能的數(shù)據(jù)并不具備結(jié)構(gòu)化特征。以目前發(fā)展較為成熟的規(guī)范性文件備案審查人工智能舉例,對限制人身自由的表述包括“拘留”“強制關(guān)押”“扣留審查”“限制出境”“不得離開”等50多種。如果僅僅以“拘留”為敏感詞,則其他提法顯然回避了敏感詞詞庫。而此項工作,需要人工對立法數(shù)據(jù)進行清洗、標注和篩選分類,以形成機器能夠識別的結(jié)構(gòu)化數(shù)據(jù)——分詞詞庫,在此基礎(chǔ)上再讓機器深度學習,從而形成人工智能。而對浩如煙海的法律規(guī)范進行篩選、歸類、標簽設(shè)置,其工作量可想而知。
人工智能在立法領(lǐng)域的深度應(yīng)用,急需一大批精通法律和大數(shù)據(jù)分析知識的復(fù)合型人才。即使擁有豐富立法經(jīng)驗的立法者,在人工智能應(yīng)用于立法工作中時,也往往掣肘于欠缺計算機知識及數(shù)據(jù)應(yīng)用理念,無法實現(xiàn)立法需求與人工智能的深度融合。當前,大部分機構(gòu)多采用“法律人才+大數(shù)據(jù)人才”的方式開展工作,然而計算機人才對于法言法語的精準理解、法律人才對于機器語言的深度識別都存在鴻溝,知識背景的巨大差異使得溝通成本增加,易使項目偏離預(yù)設(shè)目標。
前景展望
盡管存在上述種種困境,但人工智能在立法領(lǐng)域的應(yīng)用前景仍然十分廣闊,在立法意見收集智能整理、立法決策量化論證、立法資料收集等方面大有用武之地。
一是立法意見智能整理。
開門立法、民主立法是對全過程人民民主最生動的詮釋,而人工智能在立法意見征集中的應(yīng)用,能夠最大限度傾聽民聲、匯聚民智,降低公眾參與立法的成本。
可拓寬公眾參與立法的廣度。過去,僅僅依靠立法調(diào)研、立法座談會、實地走訪等傳統(tǒng)形式征集意見,立法意見收集渠道較為單一,群眾參與立法的廣度和深度都十分有限。而互聯(lián)網(wǎng)、大數(shù)據(jù)的引入,使得公眾參與立法的廣度得以極大提升。
可高效智能分析篩選立法意見。立法意見匯集后,更重要的是對其進行分類篩選,依靠傳統(tǒng)人力進行整理匯總,工作量可想而知。以《民法典》為例,其編纂過程中共收到42.5萬人提出的102萬余條意見,對如此海量的意見進行收集整理,需要過濾無效意見、去除重復(fù)意見,十分耗時耗力。而處理海量信息恰恰是大數(shù)據(jù)的優(yōu)勢,依托語義理解、文本自動處理和深度學習,人工智能能夠?qū)κ占降臄?shù)據(jù)進行過濾,區(qū)分整體意見和分類意見,去除無效意見和重復(fù)意見,在短時間內(nèi)整理出對法規(guī)草案有益的立法信息。
二是立法決策量化分析。
為解決地方立法針對性和可操作性不強、立法初衷與最終效果相悖的弊病,必須努力強化立法決策量化論證,全面衡量各方利益訴求。大數(shù)據(jù)連接一切、去中心化、計算一切、可預(yù)測性等重要特征能夠有力彌合地方立法工作的痛點,為立法決策提供有力支撐,實現(xiàn)“讓數(shù)據(jù)說話,用數(shù)據(jù)決策”。
可助力科學編制立法規(guī)劃。全樣本是大數(shù)據(jù)的第一基礎(chǔ)特征,能夠全面、客觀、真實地反映各方主體的利益訴求,使立法者得以準確掌握社會治理現(xiàn)狀和人民真實意愿,真正實現(xiàn)民有所呼,我有所應(yīng)。
可助力科學作出立法決策。在獲取全樣本數(shù)據(jù)的基礎(chǔ)上,人工智能能夠利用大數(shù)據(jù)進行分析,繼而通過深度學習發(fā)現(xiàn)數(shù)據(jù)相關(guān)性。比如在立法項目論證中,人工智能能夠?qū)崿F(xiàn)對某一法規(guī)草案可能帶來的社會影響、相關(guān)效應(yīng)作出科學預(yù)測,輔助立法者篩選出立法成本最小、社會效益最高的立法方案。
可助力完善立法(后)評估。傳統(tǒng)立法(后)評估參與主體不夠廣泛,評估方式限于抽樣調(diào)查、座談走訪、專家評議。人工智能的引入,可極大拓展參與主體廣度,同時依托大數(shù)據(jù)深入挖掘海量數(shù)據(jù)資源、評估結(jié)構(gòu)化數(shù)據(jù)的優(yōu)勢,能夠使立法后評估的數(shù)據(jù)來源更加真實可靠,真實反映民意。
三是立法資料智能收集。
高質(zhì)量的地方立法離不開對國內(nèi)外相關(guān)法律法規(guī)、學術(shù)研究成果的海量檢索。在這方面,大數(shù)據(jù)處理海量數(shù)據(jù)資源的優(yōu)勢得以凸顯,立法工作者只需輸入關(guān)鍵詞,人工智能平臺就能在數(shù)據(jù)庫中自動搜索匹配相關(guān)資料。未來高階版的人工智能搜索引擎能利用分詞詞庫最大限度減少無關(guān)信息源,精準匹配目標數(shù)據(jù),大力提升立法資料收集質(zhì)量和效率。
路徑探析
當前,人工智能已經(jīng)上升到國家戰(zhàn)略層面,地方人大應(yīng)積極搭乘科技快車,運用大數(shù)據(jù)和人工智能,推動地方立法更加科學、民主、精細化。
一是充實立法數(shù)據(jù)庫。
當前,我國立法大數(shù)據(jù)資源嚴重匱乏,與大數(shù)據(jù)全樣本的要求相去甚遠,當務(wù)之急是從體量和規(guī)模上充實立法大數(shù)據(jù)庫。
首先,完善人大系統(tǒng)內(nèi)部數(shù)據(jù)資源的原始積累。以重慶市人大常委會為例,橫向?qū)用妫瑧?yīng)整合現(xiàn)有的門戶網(wǎng)站、公文辦理系統(tǒng)、規(guī)范性文件備案審查平臺、代表履職平臺、預(yù)算聯(lián)網(wǎng)監(jiān)督系統(tǒng)數(shù)據(jù)資源,實現(xiàn)不同平臺數(shù)據(jù)信息互聯(lián)互通;縱向?qū)用?,?yīng)對接區(qū)縣、鄉(xiāng)鎮(zhèn)人大已有數(shù)字資源,努力實現(xiàn)市與區(qū)縣信息化建設(shè)、規(guī)劃、使用一盤棋,避免平臺重復(fù)建設(shè)、資源浪費。更進一步,嘗試與全國人大、兄弟省市人大的立法資源實現(xiàn)深度關(guān)聯(lián),最大限度整合現(xiàn)有立法資源。
其次,要打破數(shù)據(jù)孤島,整合政務(wù)數(shù)據(jù)資源,安全有序開放數(shù)據(jù)共享。地方立法從來就不是地方人大常委會的獨角戲,政府部門本來就是地方立法起草的主要參與者。而立法活動中政務(wù)數(shù)據(jù)開放不足,必將制約立法大數(shù)據(jù)長足發(fā)展,應(yīng)打破部門間的數(shù)據(jù)壁壘,實現(xiàn)立法機關(guān)與政府部門、司法部門的數(shù)據(jù)共享。
二是構(gòu)建立法領(lǐng)域法律知識圖譜。
人工智能在立法領(lǐng)域的深度應(yīng)用,離不開法律知識圖譜的搭建。如前所述,盡管將立法領(lǐng)域法律知識圖譜的構(gòu)建直接運用于立法條文編撰還不太現(xiàn)實,但在規(guī)范性文件備案審查、立法意見征集匯總、立法決策量化分析中,法律知識圖譜卻大有用武之地。知識圖譜構(gòu)建的關(guān)鍵在于人工標注分詞詞庫,無論是備案審查系統(tǒng)中的“敏感詞詞庫”,還是立法意見收集、立法決策量化分析,都離不開分詞詞庫的構(gòu)建和人工標注。
立法領(lǐng)域的法律知識圖譜構(gòu)建尚在啟蒙階段。隨著各地立法機關(guān)對人工智能的重視,將會有更多的立法專家加入到“敏感詞詞庫”的標注工作中,各地立法工作者都來貢獻一些數(shù)據(jù),就能“喂養(yǎng)”出真正的“立法人工智能”。
三是完善人才融合與培養(yǎng)戰(zhàn)略。
將人工智能技術(shù)應(yīng)用到地方立法中,離不開既精通法律又知曉技術(shù)的人才。一要依托現(xiàn)有人才資源,努力實現(xiàn)法律人才和技術(shù)人才的融合。地方立法機關(guān)和政府職能部門的立法人才不僅具有豐富的立法實踐經(jīng)驗、精湛的立法技藝,同時還是法律知識圖譜清洗、標注、分類的主力軍。應(yīng)加強立法人才與技術(shù)人才的合作溝通,精準提出人工智能立法的法律產(chǎn)品需求,由技術(shù)人才轉(zhuǎn)化成AI語言,強化技術(shù)人才對立法人才的技術(shù)指導。加強對立法人才的培訓,將大數(shù)據(jù)、人工智能、法律知識圖譜構(gòu)建、神經(jīng)網(wǎng)絡(luò)、深度學習等課程作為立法人才必修課程。
二是培養(yǎng)“人工智能+法律”復(fù)合型人才。國務(wù)院2017年出臺的《新一代人工智能發(fā)展規(guī)劃》已經(jīng)明確了“人工智能+法律”復(fù)合型人才培養(yǎng)規(guī)劃。在此背景下,相關(guān)高校應(yīng)提供一套立體的人才培養(yǎng)方案,為人工智能立法提供生力軍。
(作者單位:重慶市人大常委會研究室)