一 大数据及法律大数据相关概念概述
(一)大数据及大数据时代
对于大数据的定义,至今尚没有一个正式和统一的解释,目前运用最广的定义就是“用传统方法或工具不能处理或分析的数据”,意即“这个可以不用随机分析法(抽样调查)而采用巨量数据的方法,就是当前业界所说的大数据”①。
但是,其实早在 1980 年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”②。在专业领域,杂志《Nature》于 2008 年 9 月第 4 期发表了“Big Data:Science in the Petabyte Era”③一文。该文由问题“怎样处理不断产生的海量数据?”为切入点,以维基百科的成功证明对公开且免费的数据或信息进行编辑或处理已经是一项成功的事业为案例,以存储数据技术的发展为基础,首次提出了“大数据”这个概念。同期的《大数据:从数据中挖掘价值》④一文论证了数据需要正确地分类与整理,大数据可视化具有巨大的经济潜力与现实意义。大数据不仅是科技进步的里程碑,其也会促进新学科的产生,这些新学科需要人们用新的透镜来观察。此后,“大数据”这个词在世界范围内得到广泛传播与使用。
对于数据的这种发展态势,高德纳咨询公司有着非常到位的认识。在其 2001 年所发布的一份研究报告中,它将这股来势汹汹的数据洪流,描述为“三维”体,这“三维”具体为:
第一个“维”度为数量,在高德纳看来,数量主要表现在数据量的快速增大。据统计,2013 年,世界上存储的数据已经达到约 1.2 泽字节。这是个什么概念呢?一部完整的数字电影大致可以压缩成 1GB 的文件,10 亿这样的电影相当于一个艾字节,而 1024 艾字节才相当于一个泽字节。总之,这是一个非常庞大的数量。为了更为形象地说明这个概念,我们可以来举个例子,如果将这些数据全部印制成书,那么,这些书足以可覆盖整个中国多达 52 次;如果将它存储在只读光盘上,这些光盘可堆成五垛,且每垛都可伸到 384401 公里之外的月球之上。
第二个“维”度为速度,其主要表现在数据增长的速度在加快。在网络出现之前,历史上真正推动人类进步的事有两件:一是文字;二是印刷术。文字的出现让人类告别蛮荒时代步入了文明时代;而印刷术的改进则使受教育不再是贵族特权,进而推动了文艺复兴,为现代文明奠定了知识的基础。①据记载,在 15 世纪中叶,德国人约翰内斯·古登堡,这位被称为“西方的毕昇”发明了印刷机。他的发明导致了一次传播媒介革命,由于受教育人群的不断扩大,迅速地推动了西方科学和社会的大发展。历史学家伊丽莎白·爱森斯坦的研究发现,1453-1503 年这 50 年间,在欧洲约有 800 万本书籍被印刷出来,比 1200 年以来整个欧洲所有的手抄本还要多。②换句话说,在当时,欧洲的信息存储量花了 50 年才增长了一倍,而现在大约每三年就能够增长一倍。
法学方法论论文怎么写
(二)法律大数据的特征
相较于传统的法律数据处理模式与存储数量,法律大数据具有规模效应、高速性和数据样本多样性等特征。
法律大数据具有规模效益,其主要体现在法律数据的存储量和计算量巨大。根据权威部门研究报告显示:预计到 2020 年,全世界的数据总量将会增长 44 倍,整个社会的数据存储量将高达 35.2 泽字节,现在的数据容量在以指数级增长。那么,具体到法律大数据的存量规模,主要来自于两方面的增长,一是数字化办公模式的推行和开展,现阶段,按照最高院的要求,所有的审判文书必须上网公开,那么在未来,不单单是审判、判决文书,除开一些涉及隐私和机密的文本和文档,所有的司法文件都有可能数据化,并且向所有的公众开放,这是程序合法的正当要求;二是整个社会的互联网化导致法律相关的数据会大量增加,例如电子证据、可视化图表、法律数据库等等,这些都将给法律大数据的发展助力,同时也对我们法律界提出了更高的要求,我们必须有大数据的计算能力。
面对如此大规模的法律大数据,利用这些数据,同时与其他学科结合,进行跨学科的研究势在必行。法律大数据不是单独出现的,任何法律现象的产生往往伴随着政治、经济、文化和教育等方面问题的出现,通过大数据的相关性分析,我们可以抽丝剥茧,立体式的去展示某一法律现象产生背后的真正原因,同时也可以基于相关性的分析与科学预测法律现象的产生,从而实施制裁与规避。
法律大数据的另一特征是高速性。高速性一方面是指法律数据的增长速度快,数据的传输速度快,另一方面是指处理数据的速度迅速。在这一点上,谷歌、阿里巴巴等专注于人工智能的公司所开发的机器人已经可以通过训练对特点的事件或者项目进行实时预测和分析。例如在美国的很多城市,公安机关利用大数据分析软件对于案件发生的时间、地点以及其他相关联的因素进行实时收集和分析,从而对可能产生的犯罪进行预测,利用这种方式,警方可以更加科学的分配警力,对于可能发生犯罪的区域提前进行预防和部署。但是,现阶段的大数据技术只能对于可能的犯罪区域进行预测,随着更海量的数据的产生与收集,技术的发展有可能实现对于具体犯罪个体的锁定。
..................................
二 大数据对传统法律思维的挑战
(一)基于开放共享的法学研究新模式
“‘研究模式’指在某一学科建设中所遵循的学术原则、理论体系的立足点、研究的视野和言说方式、基础理论的主攻方向、所运用的研究方法、研究者应具备的学识和素质等一整套范式和要求。”①本文所说的法学研究模式既包含了法学研究者的合作模式,同时也包含了法学研究者在研究学术问题时所采用的研究方法与观察视角。
1.传统法学研究者的研究模式
在当今中国法学界,法学研究者以个体作业为主,不管是在课题申报、论文写作还是在学生培养上。法学界较为一般的现象是单独的研究人员针对自己想研究的问题收集学术资料、分析法律问题、撰写研究报告和发表学术论文等,在做研究的过程中,其很少走出去和其他的研究人员进行合作。我们可以看到在很多高校都建立了所谓的某某法研究中心,这些中心要么依托于学校的历史积淀,要么依托于某位灵魂人物的在学术界的核心影响往往可以聚集一批研究方向相对统一的学者,部分中心的人数还相当多。但是,就算是有这些所谓的中心作为一个统一的平台和管理机构,甚至是有固定的规章制度,但是在实际的工作模式和研究过程中,其仍然是以个体作业为主导,其所谓的合作也就是定期开展一些讨论、座谈或者日常会议,真正能够形成团队合作的中心几乎没有,因此其研究成果也很难形成一个系列或者集群。我们可以预见,这样的研究模式在大数据时代将越来越阻碍法学研究的发展。因为大数据时代最大的特征就是数据的海量与繁杂,在面对如此海量的数据时,我们如果单凭个体的力量是很难进行收集、整理和分析工作的。另一方面,个体的知识范围与认知水平肯定是有限的,而社会是瞬息万变的,在如此海量的数据面前,个人的能力往往显得举步维艰和微不足道,因此,开放共享的研究模式显得尤为重要。
..............................
(二)经验决策向数据决策的转变
大数据给法律思维带来的强大变革还在于由经验决策向数据决策的转变。基于数据的决策模式或者说范式一直以来都是受到人们认可和重视的,但是由于信息量以及信息处理技术的阻碍,使得人们在过去的决策过程中往往凭借自身的经验和直觉,在某些时候,这种决策确实起到了证明的作用,因此,很多领导者对于这种决策模式甚至产生了依赖和高度的认可。但是,从概率论上来说,这种决策范式,就如黑夜里凭借感觉在悬崖峭壁处前行一样。天才型决策者固然可以凭借其异于常人的禀赋,来驾驭一切,轻松前行,但对于绝大多数的决策者而言,显然不可能具有这种天赋异禀,这就使得整个国家的经济,处以一种随时可能坠入万丈深渊的风险之中。但是大数据时代基于全样本数据的科学决策,无疑将有助于规避这种风险。
1.乔布斯的大数据治疗方案
传奇企业家、苹果公司创始人史蒂夫·乔布斯与癌症斗争的过程,就是一个数据决策的案例,其诊断方法值得我们参考和借鉴。在与癌症斗争的过程中,乔布斯采用了一种与传统治疗截然不同的方式,因而成为世界上第一个对自身所有 DNA 和肿瘤 DNA 进行排序的人。通过运用最先进的基因技术对 DNA 排序,医生所得到的不只是一系列标记的样本,而是包括乔布斯整个基因密码的数据文档。在传统的癌症治疗过程中,医生只能期望病人的 DNA 排序与试验中所使用的样本尽可能相似,但是乔布斯的医生却能够基于他的特定基因组成,按各基因实际所需的效果精准用药。虽然,乔布斯最终还是因为癌症离世,但我们也应注意的是,乔布斯所罹患的胰腺癌死亡率极高,一般情况下,患者从出现症状到死亡的时间仅为 9 个月,而 5 年的生存率更是低至 2%以下,乔布斯就是通过大数据技术开发出来的个性化药物,从而将生命延长了好几年。
法学方法论论文参考
..........................
三 大数据对法学实证研究的影响........................21
(一)抽样调查在传统法学实证研究中的运用 ........................21
(二)抽样调查与全样本分析的比较 ...................................22
四 大数据对立法活动的影响..............................27
(一)大数据有效解决立法的滞后性 ..............................27
(二)大数据促进立法活动的民主性 ................................29
五 大数据对司法活动的影响.........................33
(一)大数据对法官断案的优化与评判 .........................33
(二)大数据对法律监督的作用 ....................................36
五 大数据对司法活动的影响
(一)大数据对法官断案的优化与评判
1.同案不同判下的悲剧
2016 年 2 月 26 日,北京市昌平区法官马彩云在住所遭到歹徒枪击,抢救无效死亡,据称,行凶者是马彩云法官所审理的一起离婚案件的一方,因对审判结果不满而行凶;2015 年 9 月 9 日,湖北省十堰市中级人民法院四名法官遭到刺伤,据称行凶者是一起案件的上诉人。近年来,我们发生了多起法官遇袭事件。华中科技大学教授俞江在马彩云事件后发表了题为《司法统一之前搞法官独任制是一场灾难--评枪杀马彩云法官案》①的文章,该文认为法官独任制所产生的裁判标准不统一从而导致的同案不同判才是悲剧背后的原因。此前,2015 年 9 月 21 日,最高人民法院发布了《最高人民法院关于完善人民法院司法责任制的若干意见》,该意见提出“基层、中级人民法院可以组建由一名法官与法官助理、书记员以及其他必要的辅助人员组成的审判团队,依法独任审理适用简易程序的案件和法律规定的其他案件”“独任法官审理案件形成的裁判文书,由独任法官直接签署”。
诚然,每起法官遇袭背后的原因都是多方面的,但是在现行司法环境中,由于法官独任制带来的同案不同判,法院判决缺乏说服力,法律事实认定不清,法律适用错误的现象层出不穷。其中,最为著名的案件可能要数彭宇案,当事法官在判决书中说理不清,逻辑混乱,最终成为社会舆论攻击的目标,彭宇案甚至带来了中国道德的整体滑坡。在大数据时代,基于数据的开发、收集、整理、分析,将所有的法律数据进入数据库,从而构建出一套案件判决的智能模型,似乎有可能成为现实。那么,我们可以预见,在未来,当法官将即将宣判的判决书输入系统,人工智能机器人可以对具有明显错误或者缺陷的判决进行纠错和提醒,这是不是可以在一定程度上弥补因为法官自身水平而造成的司法错误呢。
..........................
结论
2016 年 3 月 9 日至 16 日,韩国棋手李世石九段与谷歌开发的智能机器人阿尔法狗进行了一场人机围棋大战,结果李世石以 4:1 的成绩败给了机器人阿尔法狗。这场比赛向人们展示了人工智能机器人通过模拟人类神经元的网络进行学习的能力和在几何级数的变量中寻找最优解的能力,谷歌借助云数据系统为阿尔法狗提供了大数据支持,使阿尔法狗能够对千差万别的围棋奕法作出正确分析判断,制定制胜策略,并根据对手的变化不断调整,最终获得胜利的结果。
那么,法律人有没有可能在未来被机器人所代替呢?人们一直是持否定态度的,因为法律人要处理的是非标准化的事情,每个案件都有其特殊性。最重要的是,法律规定往往粗线条的,但是每个案件的最终判决却需要从具体的适用和社会平衡上去考虑,因此对于法官、律师的经验依赖特别强。但是阿尔法狗的出现让我们认识到机器人在某些方面取代法律人不是不可能的事情。因为机器人对于语言、复杂逻辑的处理能力,并不比人差,甚至于在处理一些日常法律合同、文本上,以及接受常规法律咨询等方面,机器人的效率和准确率可能会更高。
因此,每一位法律人已经不能对于我们所处的大数据时代无动于衷了。对于法学研究来说,大数据既是“道”,又是“术”。道是指我们需要有大数据思维。诚然,强调以法律文本为依据,“遵循逻辑与体系的要求,以原则、规则、概念等要素制定、编纂与发展法律以及通过适当的解释规则运用和阐释法律”①的研究路径依然受用,但是强调跨学科的研究,重视数据的收集和分析,并且借以观察真实社会关系的方法同样值得我们重视,合作共享、数据驱动以及全样本分析不应该仅仅成为自然科学的研究宗旨,法学同样需要有大数据思维。术是指我们法学界要充分运用大数据的分析方法以及研究成果。在实务界,可视化诉讼、大数据法律基础架构例如自动生成合同文本、人工智能机器人处理法律咨询、智能案例对比等已经得到了广泛运用;在法学研究领域,专家们也开始通过大数据去观察人类的真实行为方式、思维方式、决策方式,以及通过大数据去刻画法律的运行状态。这些实践都证明了大数据方法对于法学研究有着重大的理论与现实意义。作为新一代的法律人,我们有义务也有责任去寻求这种突破,因为,这对于中国的法学界,或许是一次弯道超车的机会。
参考文献(略)