一、基本概念及相关理论阐述
(一)大数据的由来和定义
1.大数据的由来
自 2008 年国际刊物《Nature》首次刊载关于大数据(Big data),并就大数据的带来的机遇与挑战进行了讨论以来,大数据一词已在国际上引发广泛关注。大数据迅速被各国用于政府的建设,美国在奥巴马执政时期将大数据上升到国家研究的高度,建立了大数据研究与发展的专项计划;瑞士达沃斯经济论坛直接将大数据比作黄金,称赞大数据的价值如同黄金一样珍贵。2015 年我国国务院印发的《促进大数据发展行动刚要》,指出要在互联网经济的新形势下,建立适用我国市场资源优势的大数据发展模式,在工业、农业、创新创业等方面建立大数据资源共享平台的任务目标。[6]至此,大数据被正式列入我国的国家发展战略当中。
2.大数据的定义
那种认为“大数据”就是“海量数据”的说法是错误的。普通的数据,诸如文字、数字、图片、视频等都是广义上的“数据”,但“大数据”并非只是在“数据”上加上一个“大”字。与没有经过处理的海量数据相比,大数据是通过了技术加工,并形成了以人工智能为代表的数据应用技术。大数据能够通过经验的总结和机器的学习,预测数据中蕴含的未来规律和发展的趋势。正如麦肯锡公司所说,“大数据是大小超出常规,能够进行分析、储存、预测和管理的数据集合。”[7]大数据改变了传统的数据思维方式,同时也正在带来一轮新的时代变革。简而言之,大数据是应用统计学、数据分析学以及数据科学对海量的信息进行分析,通过互联网传播、并在互联网发展下不断丰富的信息总和。需要注意的是,大数据指的不是单纯信息量巨大的数据集合,而是一种分析数据和处理数据的技术。
......................
(二)司法大数据的定义
1.司法大数据的定义
四川大学法学院左卫民教授认为,我国司法界对于司法大数据研究的迫切和关注,标志着司法大数据时代的到来。[10]这种观点也得到了印证,根据最高人民法院在 2013 年发布的《关于人民法院在互联网发布裁判文书的规定》,除了涉及国家秘密以及个人隐私、未成年人违法犯罪的以及其他不便于公开的,所有生效的裁判文书一律在网上公开,2016 年 7 月 1 日起最高人民法院的所有公开庭审都在网上进行直播。[11]截止 2020 年 4 月,全国公布的法律文书已达约 9000 万份,庭审直播突破 1000 万场,海量司法数据的公开预示着我国司法大数据时代的到来。
那么本文讨论的司法大数据指的是什么?有学者认为,司法大数据是指由司法机关内外快速产生和流转的案件、数据、视频、音频等多样数据类型组成的超越常规的成熟和分析能力,且能够分析和预测未来的海量数据。[12]其具有以下几点特征:1.类型多样性;2.产生的快速性和数据的海量性;3.外联性;4.预测性。对于这一观点,有学者提出更进一步的归纳,如东南大学法学院王禄生教授认为,包括司法大数据在内的法律大数据,除了具备通用大数据的基本特征之外,基于法律领域的自身特性,在强调海量性数据的同时更注重数据的适配性,即数据的准确度比量大更为重要;在强调大数据高速性以及多样性的同时,更注重数据的正确性,即司法领域对于数据质量的要求较高,只有合格的样本数据才能生产符合法律要求的法律数据,供司法适用;在强调大数据价值性的同时,要意识到司法领域对于数据的适用具有易变性,即为大数据中的基本数据具有稳定性,可以反复挖掘使用,但是在司法领域当中,如果法律情景一旦改变了,数据将失去原有的价值并将不能再次适用。[13]目前学界对于司法大数据的定义及其特征存在一定的争议,但归纳其一般共性可以得出,司法大数据是建立在司法领域信息之上,具备通用大数据的一般特征,同时还具备适配性、正确性、易变性的数据集。
图 1-1
二、我国司法大数据在裁判中的应用价值
(一)提高司法效率
文章在分析我国当前司法大数据主要的应用模式时提到,当前的司法大数据智能办案系统能够为司法人员提供文书自动生成以及量刑辅助的分析等功能,这大大提高了司法人员办案的效力。据报道,截止 2018 年 5 月 23 日,人民法院通过司法大数据智能办案系统减少了约 14.4 亿次出行,节约出行成本高达 161 亿元。此外,通过这种无纸化办公的形式节省了纸张约达 549 吨;节省了群众以及司法干警的时间达到 30 亿小时,这些节约的时间相当于 149 万人全年的工作时间。不仅如此,当前的司法大数据智能辅助办案系统承当了 70%以上的文书生成工作,这节省了法官 75%的阅卷时间,并且还能够为法官提供高于 80%的量刑精准分析。
从这个角度来看,司法大数据智能办案系统能够通过其高效的文书筛选以及文书生成等帮助法官快速完成案件分析,避免了法官在海量的法律条文、司法解释、立法说明以及类似案件的寻找之中浪费的时间。当前法院案多人少的矛盾依然存在,通过司法大数据智能办案系统,能够在电子化平台完成许多琐碎性的司法工作,这是电子化数据平台所具有的独特的优势。在未来,随着司法大数据智能裁判系统的普及,涉及文书录入以及电子化阅卷等工作可以全部交给司法大数据在裁判中的应用大数据平台来完成。司法工作人员只需完成复核、修改、审阅等基础工作,这大大减轻了司法工作人员办案的压力也节约了司法资源。[30]司法大数据在裁判中的应用能够为法官提供大量类似的案例避免同案不同判的风险,基于这些类似的案例,能够让法官有更多的时间投入到事实以及法律之间的论证当中,提高司法裁判的权威性以及合理性。
我国司法大数据在裁判中的应用及其法律规制
........................
(二)统一裁判尺度
司法大数据在裁判中的应用,有助于提高法官裁判案件的融贯性,为法官实现同案同判,实现统一裁判尺度提供了更多的可能性。在我国之所以难以统一裁判的尺度,出现诸多“同案不同判”的现象,主要有以下几方面的原因。一是因为我国是成文法国家,判例对于我国的裁判不具有拘束力,与西方判例法相比,我国法院对于案件的裁判会因为法官主观认识的不同、法官法律素养的不同而形成不同的判决。二是法官对于法律与裁判的认识具有阶段性的过程,在法官自身成长的过程当中会呈现对法律不同的认识。三是法律的变迁,即便是同样类型的案件,也会因为法律自身的修改在不同的时期出现不同的判决。比如 2007 年我国《物权法》出台之后对于物权公示以及善意取得等方面的规定,会导致出台前后的案件判决大相径庭。此外,部分法律条文以及其司法解释本身存在矛盾,这就造成了法官在法律条文选择判断对于案件结果形成差异。第四是案件参与人自身法律素养的不同,也会造成案件裁判结果的差异。同样的案件,有的当事人会委托具有丰富经验与法律素养高的律师助于辩论,而有的当事人因为经济因素没有委托代理人或是仅仅凭借自身的社会认识进行对质,最终也会造成举证质量的差异,导致案件裁判结果的差距。司法大数据智能办案系统的出现,能够实现类案推荐、量刑辅助以及偏离预警功能,虽然我国不是判例法国家,但是司法大数据能够汇集全国类似案件给予法官全方位的参考。比如我国大多数的案件已经刊载在了中国裁判文书网,同时最高院也会定期公布指导案例,这些具有指导作用的案例也能够为法官在裁判的过程中收集到更加丰富的数据和案例,从而提供价值判断与选择的空间。其次,司法大数据通过发展已经实现对于案件办理全过程的追踪与留痕查询,对于案件的进展可以进行监管,通过查询案件办理的进度,可以清晰的知晓具体的办理人员以及证据的清单等。比如广州市中级人民法院上线的广州市中院大数据管理平台就实现了对案件的办案过程全记录,并且能够呈现同案判决趋势图,对于已做判决显示偏离预警等功能,为法官统一裁判的尺度提供了指引。[31]这也最大程度的避免了人为干预造成的案件裁判结果的差异,同时也有助于督促法官,避免裁决的任意性,减少因为同案不同判对司法权威的削弱。
.................................
三、我国司法大数据在裁判应用中存在的问题.....................................17
(一)司法研究和司法大数据开发的双向困境 ..................................17
1.司法研究对司法大数据的误解 ........................................17
2.司法大数据开发的困境 ...........................................18
四、我国司法大数据在裁判应用中的完善及法律规制 ........................................25
(一)对于司法大数据应用中双向困境的完善建议 ...........................25
1.注重司法人员数据能力的培养 ......................................25
2.司法大数据开发的发展建议 .......................................26
结语.............................32
四、我国司法大数据在裁判应用中的完善及法律规制
(一)对于司法大数据应用中双向困境的完善建议
1.注重司法人员数据能力的培养
法律人的惯性思维是喜欢用已有的法律以及熟悉的框架、体系来迎接新的挑战,但这种做法在算法的发展面前与其说是在力挽狂澜,不如说是在螳臂当车。正如 Facebook 创始人扎克伯格(Mark Elliot Zuckerberg)所说,我们正在进入算法而不是法律统治人的时代。因为算法会毫无保留的根据程序设计来完成计算和推理,而不是无私的服务于社会。所以更可取的做法应该是迎接这种新的挑战,并在不断的适应和接受的过程中寻找控制和应对的方法。正如驯服一匹马的正确做法是骑上它,而不是站在他的面前阻挡它。司法大数据技术之所以能够影响舆论的导向,是因为掌握了算法控制权的开发者的算法歧视在无形之中牵引着社会伦理的倾向,而回应社会公众的伦理质疑也是法律职业伦理的职责所在,作为法律职业者必须要掌握这一主动权。
首先,需要我们在培养法律人才的过程中,更加注重对于数据能力的培养。由于认知偏差,社会民众更愿意相信非理性的新闻报道,而不愿意相信所谓三段论的论证过程,但统计数据由于其具有直观性和实证性,往往能够具有更大的说服力。当下掌握了算法控制权的人更具有伦理的方向权力,但学习数据能力的初衷不是为了获得权力,而是更为主动的承当司法在新时代的责任,要使得论证过程更符合时代的要求,就需要完善法律论证的过程,通过数据搜索、分析、整理与归纳应用的能力,使得证据更具有信服力。
相反,对于先进的司法大数据技术,如果不能为我所用,那么将成为更大的阻碍和负担。法国在 2017 年进行分别在雷恩以及杜埃两个法院中进行的司法大数据软件测试表明,现有的司法大数据系统并不能辅助法官思考以及做出决策,这些程序存在许多的设计缺陷以及无法避免的错误结果。[45]人工智能无法进行价值判断,诸如无法判断该案当中哪条法条应该作为主导。算法程序仅仅是遵循开发者设定的规则与逻辑推理形式,根据案件情节进行固有的逻辑推理,这种推理形式虽然符合一般法律形式的要求,但由此得出的算法结论,无法回答的是在根据算法程序作出法裁判中,法律条文之间的解释和法律规制之间的价值逻辑。学习数据能力更进一步的目的,是将法律职业伦理嵌入到司法大数据系统的算法当中,掌握价值引导与决策的能力,主动获得价值评价的控制权与监督权。
............................
结语
当前我国的司法大数据还处于初步阶段,法律人工智能的发展也处于弱人工智能的阶段,但对于未来司法大数据的发展的问题发觉和对策的设想是有必要的。我们正在进入大数据时代,未来无论是司法领域还是整个法律领域,都将受到技术发展带来的更大的挑战,而正确的做法就是面对挑战,并且寻找积极应对挑战的策略。法律常常滞后于科技的发展的,但是科技的发展需要法律不断的进步。算法虽然是黑箱,但是在黑箱之下,我们需要的是从法律伦理、法律规制的层面寻找一条破解黑箱操作的方法,而不是被算法黑箱困于其中。当下对于司法大数据和算法程序,我们还有许多的未知数,贸然的通过宪法和民法的角度来保护公民的隐私和对算法进行规制恐怕会造成不可估量的法律难题,故而我们需要的是司法界和学界共同出台行业限制,同时在程序设计的过程中进行行业规范,通过学界和司法人员的共同参与,制定出面对当下司法大数据发展的行业规范,通过行业自律来完成监督和发展。
人类处于社会规则制定的顶层,无论是法官还是立法者,都不会放纵法律人工智能、算法来统治人类。但是面对人工智能的深度学习的能力以及司法大数据发展带来的速度与风险,司法界不得不重新审视当下司法大数据作出的判决,是否应该承担责任?正如德国人工智能自动驾驶技术的发展,就规定了若在人工智能操作之下出现意外,则由出厂商担责;若是自动驾驶系统请求人工协助无果,出现意外则由驾驶员担责。那么经过了深度学习的司法大数据辅助裁判系统,拥有了匹敌法官智慧的法律人工智能,需要对自身的裁判结果承担怎样的责任?这是司法大数据未来发展可能会涉及到新的法律难题。但无论如何,法官拥有的主观能动性和社会经验、人的价值判断以及对社会风土人情的阅历,都是人工智能所无法取代的。当下的司法大数据在裁判中的应用技术,在技术上还很稚嫩,但随着法律自然语言处理技术的发展,这些问题都在逐步得到解决。对于司法大数据时代的到来,不必过分的忧虑,因为技术会在人的可控范围内得到光明的发展。
参考文献(略)