欢迎您登陆邹城市人民法院门户网站2019年1月1日 星期一
您当前所在位置:首页 > 审判业务 > 业务探讨
【前沿问题】如何基于裁判文书网进行大数据法律研究?(一)
来源:   发布时间: 2020年06月23日

【中文摘要】以裁判文书网为主的司法公开平台的建设为法律实证研究提供了司法大数据这一新型资源,使得大数据法律研究空间更为广阔。目前基于裁判文书网的大数据法律研究存在着技术手段不成熟、研究缺乏学术深度及创新性的问题,原因在于技术门槛要求严格、已公开裁判文书不能反映出真实的司法实践全貌及研究者未能跳出现有法律理论的先验框架。未来的法律大数据研究应当继续推进统计科学、计算机科学在研究中的深度运用,谨慎对待数据的缺失问题,采用多元化的研究方式,同时充分认识并利用大数据资源的创新潜力。

【中文关键字】裁判文书网;司法公开;大数据;实证研究

【全文】

  在大数据来临的时代,实证法律研究路在何方是值得研究的问题。整体而言,实证法律研究是一种更多流行于域外的新型法学研究范式,以对数据的分析和阐释为基本特征,以经验性研究的样态区别于纯理论式的抽象观点构建。域外学者对实证研究方法论的探讨及方法的实际运用上都已相对成熟。透过美国实证法律研究会议和实证法律研究期刊的相关文章,可以看出其在研究中惯常使用全国范围内的抽样数据或者与研究主题相关的全数据,至少也是较大区域或范围内的局部数据或大样本数据。在中国法学研究领域中,虽然目前基于演绎的法教义学方法仍然占据着主流地位,但实证研究这种新的法学范式近年来也得到较多接受,专注于实证研究的出版物已经面世,以“中国法律实证研究年会”、“法律实证研究国际学术会议”为代表的实证研究学术会议也开始召开。然而,实证研究方法兴起之初,全国范围的、权威性的法律大数据尚未出现,国内研究者多倾向于自行收集特定范围内的小样本数据作为研究材料。

  随着数据时代的到来,海量数据得以迅速生成并且可被获取。在司法领域,得益于中国近年来对司法公开理念的大力贯彻,司法大数据这一新兴的研究资源应运而生,异于传统的实证研究新形式正在因法律大数据的出现而成为可能。中国特有的司法大数据主要来源于以裁判文书网为核心的司法公开平台。最高人民法院(以下简称“最高法”)为充分保障当事人和公众的知情权、监督权,通过司法公开平台对审判流程信息、执行信息、庭审直播信息、裁判文书信息等数据进行了较多公开。其中,裁判文书网所发布的海量裁判文书是对中国司法实践全面貌、原始面貌最为具体和客观的反映。

  毋庸置疑,大数据的到来为中国实证法律研究提供新的契机,有可能推动实证研究的跨越式发展。首先,大数据的可获得性大大地丰富了实证研究的基础资料,扩展了研究主题的范围和格局。其次,对大数据处理的技术需求也注定会推动实证研究方法的革新,使其更加多元化、科学化。相应地,大数据研究所得的研究结论也会更趋向精确和客观。然而,目前基于裁判文书网的大数据法律研究在诸多方面还做得不够完善,研究者需重视有关问题,积极寻找并及时采取对策。

  一、裁判文书网:大数据源泉

  中国法律大数据源自何时、何地是首先讨论的问题。在真正可被称为大数据的法律数据出现之前,传统的法律数据主要是由官方统一收集、发布并最后呈现出数字化、结构化形式的司法统计数据,这包括了中央及地方司法机关、统计部门的工作报告、法律年鉴、统计年鉴等。对此,易霏霏等在统计整理了2014年法院主动公开的国家和地方层面的司法统计数据公开情况后分析认为,司法统计数据存在着“数据不完整、数据公开渠道零散、统计口径不统一、数据公开不够连贯及时等问题,导致公开的数据无法形成相互贯通、可以互相比较的数据网络”。除上述不足外,司法统计数据对于开展数据研究的一大局限是其统计的基础数据如各种司法文书从未整体性地向社会公开,因此公布的统计数据实则缺乏中观、微观的个案数据源支撑,研究者难以得知数据的具体生成过程,这使得这些官方统计结果往往只能被用作宏观、粗略的趋势分析。加之官方制作的数据不可避免地带有一定的政治、社会治理及司法管理的考量,难以达到完全的客观中立。因此,上述缺陷造就了官方结构化数据与学术研究者所需的研究数据之间的差距,传统的司法统计数据难以充分满足学术研究对于数据客观性、严谨性、具体性等的需要。当然,最高法还通过指导案例的形式公开了部分个案信息。相比之下,指导案例虽然更接近案件的原始信息(包括基本案情、裁判理由及结果),但其仅是删减浓缩后的案件概述,可供研究者发掘、利用的数据信息极为有限。更重要的是,指导案例总体数量极少,迄今为止最高法只发布了100余例,对于数据研究者而言不过杯水车薪。

  需要指出,真正的法律大数据的出现与最高法的改革举措直接相关。基于司法公开的理念,自党的十八大以来,最高法建成了四大司法公开平台,包括审判流程信息公开网、执行信息公开网、庭审公开网以及影响最为广泛的裁判文书网。

  裁判文书网的建立与发展是最高法近年来大力推进裁判文书上网工作最为重要的成果。早在2009年3月25日,最高法便印发《人民法院第三个五年改革纲要(2009-2013)》(法发〔2009〕14号),提出要“研究建立裁判文书网上发布制度和执行案件信息的网上查询制度”。随后,最高法陆续发布了如《关于司法公开的六项规定》(法发〔2009〕58号)、《关于人民法院在互联网公布裁判文书的规定》(法发〔2010〕48号)等规范性文件,对法院在互联网公布裁判文书的原则、范围、程序等方面作出了具体规定,裁判文书网的建立工作启动。2011年12月30日,最高法召开司法公开工作领导小组第一次会议,提出制定建立全国统一裁判文书网的工作规划。2013年5月8日,最高法在广西柳州召开司法公开调研会,就建立全国统一裁判文书网的方案设计向全国部分法院进行调研。裁判文书网建设进入设计阶段。2013年5月22日,最高法党组审议通过了“关于建立中国裁判文书网的报告”,明确在互联网建立名为“中国裁判文书网”的网站平台,统一公布全国各级法院生效裁判文书。自此,中国裁判文书网建设进入具体实施阶段。最高法在2013年6月28日通过中国裁判文书网首批公布了本院生效裁判文书50份。值得一提的是,2013年7月1日,《最高人民法院裁判文书上网公布暂行办法》正式实施,这是最高法第一个专门规范自身裁判文书上网公布工作的制度性文件。依据该办法,除法律规定的特殊情形外,最高法发生法律效力的判决书、裁定书、决定书一般均应在互联网公布。更重要的是,2013年11月12日,党的十八届三中全会通过的《中共中央关于全面深化改革若干重大问题的决定》中提到要“增强法律文书说理性,推动公开法院生效裁判文书”,从而为裁判文书上网确立了极为重要的政治依据。

  在最高法统领下,各级法院也加入了推动裁判文书上网的队列。2013年11月13日,最高法审判委员会第1595次会议讨论通过新的《最高人民法院关于人民法院在互联网公布裁判文书的规定》(法释〔2013〕26号),要求自2014年1月1日起,法院生效裁判文书应当统一在中国裁判文书网公布,这是最高法第一次以司法解释的方式对各级法院在互联网公布裁判文书的工作进行全面规范。为了响应该司法解释的规定,2013年12月31日,全国四级法院开始同时在中国裁判文书网上传生效裁判文书,中国裁判文书网开始全面发挥统一公布全国法院生效裁判文书的平台功能。2015年6月,全国四级法院已经全部实现生效裁判文书上网公布,实现了案件类型全覆盖、法院全覆盖。随后,最高人民法院在2016年对原有裁判文书网上公开的意见进行修订并发布了《最高人民法院关于人民法院在互联网公布裁判文书的规定(2016修订)》(法释〔2016〕19号)。新规定将原规定“依法、及时、规范、真实”的原则调整为“依法、全面、及时、规范”,突出了“全面”。在具体制度层面,新规定进一步扩展了裁判文书网上公开的范围,同时规定“不在互联网公布的裁判文书,应当公布案号、审理法院、裁判日期及不公开理由”。

  由此观之,裁判文书网所公布的是除法定不公开或不宜公开的案件外,包括最高法在内的全国各级法院的全部生效裁判文书,包括了判决书、裁定书、决定书、通知书、支付令及小部分调解书。因此,裁判文书网的诞生与发展所带来的丰富的全国性数据与传统实证研究所使用的数据在数量级、广泛性上都不可同日而语。2017年8月23日,裁判文书网的总访问量突破了100亿次,当时累计公开裁判文书3247万篇。而约两年后,截至2019年8月12日,裁判文书网文书总量已达到7439余万份,访问总量已超过312亿次,文书总量及访问总量均成倍增长。

  需要指出,除裁判文书网外的其他公开平台中,审判流程信息公开网是主要面向案件当事人及其代理人公开的查询案件、联系法官、接受电子送达的平台,这一平台对于社会公众公开的内容只包括法院地址、开庭公告、审判委员会组成人员等法院公共信息,信息量稀少且研究价值有限。而庭审公开网和执行信息公开网主要面向社会公众公开,这两个平台所公开的信息虽不如裁判文书网一般全面、充分,但也都可能成为大数据研究的潜在挖掘对象,作为补充数据源。执行信息公开网主要公开全国法院失信被执行人名单信息。2013年10月1日起,《最高人民法院关于公布失信被执行人名单信息的若干规定》正式施行。该规定实施后,各级法院开始依职权作出将被执行人纳入失信被执行人名单的决定。2013年10月24日,全国法院失信被执行人名单信息公布与查询平台面向社会开通,此即是后来的中国执行信息公开网。截至2019年8月19日,执行信息网已公布了失信被执行人名单约1495万例。而庭审公开网则是实现全国法院庭审视频统一直播展示的最重要平台。2016年4月14日,最高法公布了修改后的《法庭规则》,其中规定以下三种依法公开进行的庭审活动人民法院可以通过电视、互联网或其他公共媒体进行图文、音频、视频直播或录播:(一)公众关注度较高;(二)社会影响较大;(三)法治宣传教育意义较强。2016年5月,最高法院长周强对《关于推进我院与全国法院庭审公开工作基本方案的请示》文件做出批复,要求各个地方法院依托全国统一庭审公开平台切实加大庭审公开力度。2016年7月,最高法率先示范常态化庭审公开。2016年9月27日,中国庭审公开网正式上线运行。自庭审公开网上线迄今接近三年的时间内,最高法累计直播3000余件,全国累计直播次数已达420余万次,访问总量超过183亿次。

  相较于传统数据资源,上述司法公开平台特别是裁判文书网具备以下特征:其一,数据的海量性。在裁判文书网投入运行之前,我国通过两高工作报告、指导案例、法律年鉴等形式公开的司法数据仅是我国司法全貌的冰山一角。而裁判文书网所公开的信息堪称空前之多。按照最高法相关规定,除了特定不能公开的案件外,其余案件都要在生效七天之内上网公开,且原则上是面向全社会公开。此种公开的力度是革命性的,在全世界范围内也不遑多让。例如从2014年裁判文书网刚开始启动一年的558万份,2015年约900万份,2016年约1000万份,截至2019年8月已超过7439万份。中国裁判文书网目前已经成为全球最大的裁判文书发布平台,可以预期未来的文书数据量也将非常可观。空前规模的文书数据量为基于数据挖掘的实证研究提供了广阔、全面的学术资源以反映中国司法特别是审判阶段司法面貌。其二,数据内容的丰富细致性。与传统法律数据粗疏、笼统的特点不同,裁判文书网等平台所提供的是以个案裁判为支撑的详细文本、视频数据,如案件的判决书、裁定书、完整庭审视频等,通过对案件原始信息的具体、充分的呈现使得多角度、深入化的数据研究成为可能。其三,数据的客观性和不反应性。相对于统计年鉴、工作报告等经过了“精细加工”、潜藏了数据发布主体自身价值偏好的结构化数据,裁判文书网的数据是由审判法院按照法律规定直接上传的案件原始文本,数据发布主体的价值偏好得以淡化,以此为基础的研究更能保持其客观本色。另外,裁判文书一旦上传就可供研究者自由选择下载,不会随着研究人员的观察而发生内容或形式上的改变,即裁判文书网的数据还具有不反应性。其四,数据的可生成性及相应数据研究的个性化。尽管裁判文书网、庭审公开网或执行信息公开网本身包含的信息并非严格意义上的数据或一些研究者所称的定量化的数据,研究者难以直接对其进行数理统计、分析。但是,研究者可以通过标签、编码等数据科学方法将判决文书、庭审视频中所包含的案件信息转化生成研究所用的定量化数据。研究者可以根据自己的研究思路、研究偏好有倾向地选取数据搜集的范围和方式,从而得出不同于官方数据、有别于官方角度的新型法律数据,进而为设计个性化、特色化的研究模型提供可能。

  笔者认为,以裁判文书网为载体的新型司法公开数据构成了当代中国法律大数据的基本源泉。这些数据载体的上线不仅推进了阳光司法,更为中国的实证法律研究创造了前所未有的机遇。中国的法律大数据研究的广泛展开也肇始于裁判文书统一集中上网:在裁判文书上网之前,中国极少有真正的法律大数据研究,法律实证研究基本上是基于“小数据”,即研究者局部范围或特定领域内所自行收集的数据而展开的“手工作坊式”研究。而裁判文书网这一全国性、公开、细颗粒的法律大数据平台的出现,使得研究者能够运用统计科学和计算科学手段将海量文书转化为数据,从而收获不同于官方大数据的新型法律大数据。这为中国法学研究打开了丰富的可能。

来源:北大法律信息网

关闭

版权所有:邹城市人民法院 ICP备案号:鲁ICP备13032396号

地址:山东省邹城市普阳山路996号 电话0537-5213281 邮编:273500