【評(píng)論】劉品新:大數(shù)據(jù)司法的創(chuàng)新與實(shí)踐
2014年是中國(guó)的大數(shù)據(jù)元年。自此以后,“司法+大數(shù)據(jù)”就很快躍升為中國(guó)法治的一個(gè)大熱門(mén)。2016年5月,中央政法委舉行政法干部學(xué)習(xí)講座,講解了提升大數(shù)據(jù)時(shí)代運(yùn)用先進(jìn)科技打擊犯罪的探索和成效。10月21日,中央政法委再次舉行政法干部學(xué)習(xí)講座,邀請(qǐng)馬云講解“科技創(chuàng)新在未來(lái)社會(huì)治理中的作用”。2017年1月份中央政法工作會(huì)議上,孟建柱書(shū)記也多次談到了大數(shù)據(jù)在司法領(lǐng)域的深度應(yīng)用,他講話的兩個(gè)高頻詞是“新技術(shù)”和“大數(shù)據(jù)”。孟書(shū)記在談及打擊新型犯罪時(shí),表示要善于運(yùn)用大數(shù)據(jù)關(guān)聯(lián)嫌疑人行為軌跡;在提及訴訟制度改革時(shí),強(qiáng)調(diào)要大數(shù)據(jù)技術(shù)為推動(dòng)改革落地奠定基礎(chǔ)。隨后7月份的中央司法改革推進(jìn)會(huì)上,孟建柱數(shù)據(jù)再次強(qiáng)調(diào),要更加積極主動(dòng)擁抱大數(shù)據(jù)、人工智能新時(shí)代,把理念思路提升、體制機(jī)制創(chuàng)新、現(xiàn)代科技應(yīng)用和法律制度完善結(jié)合起來(lái),全面落實(shí)司法責(zé)任制及相關(guān)配套改革,深入推進(jìn)以審判為中心的刑事訴訟制度改革,推動(dòng)中國(guó)特色社會(huì)主義司法制度不斷完善發(fā)展,努力創(chuàng)造更高水平的社會(huì)主義司法文明。簡(jiǎn)要回顧這些正在發(fā)生的事件,給全國(guó)法律工作者的啟示是,每個(gè)人必須深刻認(rèn)識(shí)到現(xiàn)代科技對(duì)司法工作的巨大推動(dòng)作用,與時(shí)俱進(jìn)地轉(zhuǎn)變觀念。
什么是司法大數(shù)據(jù)?
大數(shù)據(jù)的存在和運(yùn)用都十分廣泛。2014年后,網(wǎng)上開(kāi)始出現(xiàn)廣告精準(zhǔn)推送,就是基于上網(wǎng)痕跡的大數(shù)據(jù)。具體來(lái)說(shuō),人們?cè)谑褂秒娔X或手機(jī)上網(wǎng)時(shí),網(wǎng)絡(luò)服務(wù)商都會(huì)提取有關(guān)使用者的位置信息、愛(ài)好習(xí)慣、關(guān)注點(diǎn)等數(shù)據(jù),匯聚而成海量數(shù)據(jù),再進(jìn)行商業(yè)開(kāi)發(fā)。在大數(shù)據(jù)時(shí)代,人們通常連自己產(chǎn)生和留下了哪些數(shù)據(jù)都不知道。美國(guó)前總統(tǒng)奧巴馬將大數(shù)據(jù)稱(chēng)為新的“石油”。
早期,人們認(rèn)為,大數(shù)據(jù)是指在互聯(lián)網(wǎng)行業(yè)中,互聯(lián)網(wǎng)公司在日常運(yùn)營(yíng)中生成、累積的用戶(hù)網(wǎng)絡(luò)行為數(shù)據(jù)。現(xiàn)如今,通常可以認(rèn)為大數(shù)據(jù)是由大交易數(shù)據(jù)、大交互數(shù)據(jù)以及大運(yùn)行數(shù)據(jù)構(gòu)成的。大交易數(shù)據(jù)是指在電子商務(wù)、電子政務(wù)中日常累積的電子數(shù)據(jù)。像阿里巴巴的天貓平臺(tái),2014年“11.11”一天的交易額為571億元(已經(jīng)超過(guò)沃爾瑪中國(guó)一年的銷(xiāo)售額),2015年“11.11”一天的交易額超912億元,2016年“11.11”一天的交易額更是高達(dá)1207億元,這就是大交易數(shù)據(jù);人們?cè)谌粘I钪惺褂梦⑿?、微博、QQ、郵件等電子通信工具,可以自由地表達(dá)意志和相互溝通,這就形成了大交互數(shù)據(jù);人們使用電腦、手機(jī)等電子設(shè)備,更會(huì)形成巨量的運(yùn)用和運(yùn)行痕跡,這可以稱(chēng)為大運(yùn)行數(shù)據(jù)。
檢察機(jī)關(guān)是一個(gè)擁有或者應(yīng)當(dāng)擁有大數(shù)據(jù)的部門(mén)。這主要是一些專(zhuān)門(mén)化的司法大數(shù)據(jù)。經(jīng)過(guò)調(diào)研,筆者認(rèn)為檢察機(jī)關(guān)的司法大數(shù)據(jù)主要包括以下內(nèi)容:
(1)以起訴書(shū)、裁判文書(shū)為代表的海量法律文書(shū)。最高法院在裁判文書(shū)網(wǎng)上發(fā)布了3000多萬(wàn)份裁判文書(shū)。據(jù)說(shuō),加上尚未發(fā)布的,裁判文書(shū)已經(jīng)高達(dá)約1.6億份的規(guī)模。全國(guó)檢察機(jī)關(guān)的大統(tǒng)一軟件系統(tǒng)也累積了1400多萬(wàn)份案件的法律文書(shū)。(2)海量的案卷資料。這主要是試點(diǎn)電子卷宗系統(tǒng)的部分省市累積的案卷資料。每份案卷的信息量遠(yuǎn)遠(yuǎn)大于法律文書(shū),可用于機(jī)器學(xué)習(xí)輔助辦案,能起到更好的效果。(3)海量的同步錄音錄像資料。在山東等地,檢察院要求訊問(wèn)中的同步錄音錄像,全部、同步上傳到省檢察院的機(jī)房進(jìn)行統(tǒng)一存儲(chǔ)。這就構(gòu)成了另類(lèi)的司法大數(shù)據(jù),可用于機(jī)器學(xué)習(xí),學(xué)會(huì)怎么甄別不當(dāng)審訊,未來(lái)學(xué)會(huì)怎么“機(jī)器代替人”審訊。(4)智能語(yǔ)音語(yǔ)料資料。去年高檢院在全國(guó)選了幾十個(gè)試點(diǎn)單位,部署科大訊飛的智能語(yǔ)音系統(tǒng),輔助審訊、庭審、會(huì)議、教培、雙語(yǔ)等,也積累各種語(yǔ)音語(yǔ)料資料。此外,隨著數(shù)據(jù)共享的展開(kāi),檢察機(jī)關(guān)還會(huì)接入公安法院數(shù)據(jù)、行政執(zhí)法機(jī)關(guān)數(shù)據(jù)、大數(shù)據(jù)公司數(shù)據(jù)等等。
檢察開(kāi)展“大數(shù)據(jù)司法”的場(chǎng)景
大數(shù)據(jù)在檢察系統(tǒng)的運(yùn)用是全方位的,可以區(qū)分為辦案、辦公和管理三大部分。其中,重中之重是檢察的大數(shù)據(jù)辦案,又可細(xì)分為大數(shù)據(jù)公訴、大數(shù)據(jù)偵監(jiān)、大數(shù)據(jù)民行檢察、大數(shù)據(jù)刑執(zhí)等。下面,對(duì)主要運(yùn)用場(chǎng)景進(jìn)行舉例說(shuō)明。
基于大數(shù)據(jù)的類(lèi)案推送
類(lèi)案推送是探索引入人工智能深度學(xué)習(xí)技術(shù),在完成要素信息抽取研究的前提下,實(shí)現(xiàn)依據(jù)案由、犯罪手段、量刑情節(jié)、刑罰、法院、地區(qū)、相關(guān)法條等多種關(guān)聯(lián)因素綜合檢索同類(lèi)案件的方法。
在2017年3月山東“辱母殺人案”持續(xù)發(fā)酵后,我們?cè)囍M(jìn)行了類(lèi)案搜索。具體做法是,對(duì)中國(guó)裁判文書(shū)網(wǎng)上100多萬(wàn)起故意傷害案,選擇反映案件獨(dú)特信息的關(guān)鍵詞如高利貸、辱母、警察在場(chǎng)等等,進(jìn)行技術(shù)搜索。結(jié)果共搜索到很多類(lèi)似的案件。研讀這些案件發(fā)現(xiàn)審判結(jié)果可以歸為兩類(lèi):一類(lèi)是輕判的,比如保定的一個(gè)案件認(rèn)定為正當(dāng)防衛(wèi),判了7年;一類(lèi)是重判的,比如安徽黃山的一個(gè)案件,沒(méi)有認(rèn)定為正當(dāng)防衛(wèi),判了死緩。兩種情況的差別在于是否認(rèn)定了正當(dāng)防衛(wèi)。這樣,可以繼續(xù)使用類(lèi)案搜索技術(shù)進(jìn)一步搜索“正當(dāng)防衛(wèi)”案件。這樣的高級(jí)搜索功能,可以快速找到同類(lèi)案件。如此進(jìn)行推送,就是類(lèi)案推送,可以起到促進(jìn)“同案同判”的作用,使得司法裁判更具有說(shuō)服力。