类案检索 | 如何更科学、精细、智能的运用信息技术
发布日期:2021-02-22 来源:法律出版社

0626.png

内容简介:为健全类案检索制度,深化司法体制综合配套改革,进一步统一法律适用,最高人民法院《关于统一法律适用加强类案检索的指导意见(试行)》于2020年7月31日起试行。包括法官、检察官、律师在内的法律工作者运用大数据开展类案检索,为裁判提供参考成为一项必备技能。本书分步骤讲解:类案的判断标准和检索方法、类案检索报告的制作方法、高效开展类案检索过程中案例分析方法的运用、大数据对于类案检索的支撑作用和局限性、技术人员在类案标识方面的工作重点。

 

类案检索必须建立在信息技术运用的基础上,信息技术运用的越科学、越精细、越智能,类案检索在审判中发挥的作用就会越大。

主动检索类案与类案智能推送
类案检索的操作模式包括主动检索类案模式和智能推送类案模式,在主动检索模式中需要人工在一定的数据库中开展关键词、法条等检索,该种检索模式依赖于数据库中的案例资源和检索者对于检索关键词、法条的确定。在主动检索类案模式下,检索者选取的关键词至关重要,关键词选取的越多,检索出来的案件数量相对越少,减少检索者二次比对的工作量;关键词选取的越少,检索出来的案件数量相对越多,将大幅增加检索者二次比对的工作量。如果检索者选取的关键词不够精准,或者选取的关键词与数据库中的案件对应性不强,则会影响到类案检索的结果,甚至可能无法检索出类案。

即便是相同的关键词在不同的搜索平台产生的结果也会是不同的,例如,在百度和谷歌两个搜索平台分别输入“人工智能”,从检索结果来看,谷歌更能够准确地理解用户的搜索“目的”,反馈中关于人工智能技术本身的信息要优先于关于人工智能的新闻和电影广告,而百度反馈更多的是电影及电影明星。在智能性的对比上,谷歌更胜一筹,这归功于谷歌公司基于用户检索行为的历史数据学习,形成了检索“知识图谱”。目前可行的方案是将通用知识图谱技术与行业场景结合,从行业起步构建不同场景下的知识图谱,使机器首先成为某一行业的“专家”而非具有一个真实的“人类智能”。关于知识图谱技术的运用和完善,在后文中还会进一步的阐述。

类案检索系统还可以引入智能搜索功能,系统可根据用户使用的关键词的含义并结合用户的检索历史,向用户推荐相关检索词,帮助用户选择到更优的检索词,提高检索效率。通过智能搜索功能中的信息加工模块,根据用户此次输入的搜索语,并结合该用户的搜索历史及兴趣偏好,在检索页面显示“当前检索词的相似词”“当前检索词的相关词”,从而向用户推荐检索词的同义词、近义词、与检索词相关的扩展词以及其他用户检索使用过的词,帮助用户寻找准确的检索词,避免出现检索不全、检索不到的情况。智能搜索功能完成了对用户进行交互式的导航,从而实现了对案例信息的深度检索。关键词在检索出的案件中的词频率越高,说明该关键词在案件中的重要性越大,该关键词往往就是整个案件的争议焦点,案件的裁判文书通篇都在围绕该关键词反映出的争议焦点进行论述。因此,可以将关键词在裁判文书中的词频率为参照指标,以其词频率的高低为标准将检索出来的裁判文书进行排序,供检索者比对案件时使用。

在智能推送模式中,需要检索者提供待决案件的基础材料,如果是一审案件一般包括起诉状、公诉书、答辩状等材料,如果是二审案件一般包括一审判决书、上诉状、答辩状等材料。在智能推送模式中,系统会依据上述材料向检索者自动推送类案,这种检索模式既依赖于系统中的案例资源,更依赖于系统自动进行的案件材料的智能比对。如果要做到智能推送类案的精准性,那这种智能比对应当是包括了基础事实、法律争点、法律适用等核心部分的比对,其比对的仍然是其中的主要部分或者说是关键词、法条等。那这就需要在将一系列典型案例列入数据库时将其“标签化”,将影响裁判结果的基础事实、法律适用、争议焦点贴上“标签”,以便于系统将数据库中的案例与待决案件比对时更能聚焦,保持智能推送的精准性。在智能推送相应类案之后,可以建立由检索者对于推送的类案进行评价的机制。对于推送的类案与待决案件匹配度高、论理充分、裁判结果妥当的,由检索者对类案给予不同的评价。最终,通过众多的检索者不断地评价指数较高的典型案件,在之后的检索过程中由系统优先推送给检索者。

| 壹 |体系建设和资源整合

学者认为,原则上可采用“一个系统、两级建库”的方式。“一个系统”是指最高人民法院只保留一个系统,把这项工作归于一个部门,以便于统一推进和管理;两级建库是指除最高人民法院外,各省级法院可通过选编本地判例形成省内判例库。如果两级判例库都形成了,且权威性、可信度较高,质量较差、数量较少的判例库自然会被逐步淘汰。

“一个系统”其作用和优势在于发挥数据的汇总和整合作用,但问题在于目前各省市法院采用的数据技术系统为不同的科技公司开发的不同的数据平台,可以想象的是其他准备或陆续开发数据系统的省市法院也将会采用不同的数据平台。这样不同的技术应用平台,为未来统一整合成一个系统带来的是较难克服的技术障碍和利益分配问题。“两级建库”是一种比较可行的运行模式,可以同时发挥最高人民法院和各省市法院的积极性,调动更广泛的资源共同建立案例库。在“两级建库”的模式下可以逐步在一定范围内统一法律适用。但是也要注意的是,不同省市法院之间编入的典型案例可能会发生法律适用分歧,包括最高人民法院内部不同部门之间编入的案例也可能会发生法律适用分歧。因此,对于这些同类案件裁判分歧应当畅通“及时发现——层报解决”的机制。其中,问题的发现往往是在司法实践中由中基层法院率先发现,而层报机制和法律适用分歧的解决最终还要取决于最高人民法院。

《最高人民法院类案检索意见》第12条规定:“各级人民法院应当积极推进类案检索工作,加强技术研发和应用培训,提升类案推送的智能化、精准化水平。各高级人民法院应当充分运用现代信息技术,建立审判案例数据库,为全国统一、权威的审判案例数据库建设奠定坚实基础。”《北京高院类案检索办法》第10条规定:“各法院在类案及关联案件检索中应当注重信息化建设,以裁判文书公开、电子卷宗随案同步生成和深度运用工作为依托,加强基本案例数据库和类案裁判标准库建设,逐步建立全市统一的类案及关联案件检索报告发布平台,完善对案例的深度加工分析,探索实现类案及关联案件精准智能推送。”第11条规定:“各法院应当积极构建当事人及诉讼代理人参与类案及关联案件检索机制,加强与律协及其相关专业委员会沟通,采用培训、研讨、座谈等形式,就开展类案及关联案件检索实践操作、存在问题等进行交流,充分发挥法律职业共同体解决类案裁判尺度统一问题的作用。”《江苏高院类案检索规定》第13条规定:“省法院加强类案检索技术的研发,探索建立统一的检索案例库,开发便捷的检索工具。”根据上述规定的有关内容,正在逐步形成最高人民法院积极推动、各地高级人民法院着手组建、当事人及律师积极参与的案例库建设格局,这种案例库建设的格局也呼应了理论界的相关建议和主张。

| 贰 |案例供给和技术加工

有学者认为,“借助人工智能的类案类判或许不应被赋予过高的地位与期望,司法解释或最高人民法院的指导性案例应当并且可以肩负起统一司法裁判尺度、维护司法权威公正的使命。或许更悲观一点,类案类判很难成为司法领域法律人工智能的下一个大突破口。原因在于,类案类判系统所能够提供的司法产品质量有限。中国法院正在使用的类案类判系统所提供的‘类案’更多的是一种质量不佳、缺乏权威、指导意义有限的案件。同时类案被摆送至法官案头的过程不同于指导性案例的层层选拔,次次挑选,经历了明确的淘汰机制与程序。而类案仅经过了‘搜索’‘推送’工序,筛选太不严格,质量令人担忧。”解决学者的上述疑虑,关键是要通过各级法院以及相关法律、科技人士的共同努力,增加高质量的案例供给,建设高质量的案例库。

◎ 典型案例的类型化、要点化以最高人民法院公布的案由为分类标准,以民商事案件为例,应尽量能够精准确定到四级案由。根据法律关系定性的不同,可以将案件区分为不同的类型和层级。这种类型和层级的划分一般都可以与《最高人民法院关于案由的规定》对接,同时也可以在相关案由下面继续进行精细化的区分。例如,不当得利可以细分为给付不当得利和非给付不当得利,前者又可以继续划分为自始欠缺目的、目的削减和目的不达等具体类型,后者有可以继续划分为权益损害不当得利、支付费用不当得利和求偿不当得利等具体类型。

明确典型案例的编写体例,突出典型案例的要点。典型案例的编写体例、编写水平是建设案例数据库的关键,也是实现精准的类案智能推送的关键。典型案例的编写体例一般包括以下几个部分:

一是标题。主标题简要概括本案法律适用的指导意义,副标题列明本案的当事人和案由。

二是关键词。以词或词组反映案例涉及的最关紧要的法律适用问题或者其他核心内容,标示次序可根据关键词的含义由大到小排列。

三是裁判要点。简要归纳和提炼具有指导意义的重要裁判规则、理念、方法,能够一目了然地反映出案件所涉及的主要法律问题及主要裁判观点。裁判要点的简要性、精炼性的特点,使检索者可以减少时间成本,提高检索的效率。“裁判要旨的编写方法,要尽可能指明所要阐释的法律、文字表述要全面准确提炼、尽量使用法律法规、司法解释中通行的概念和表述等方面提出正向提炼标准。”

四是相关法条。列明与裁判要点最密切相关的法律及其条文的序号,便于以争议法条进行类案检索和推送。

五是案件索引。由审级、审理法院、案号及结案时间组成。

六是基本案情。案情部分一般先准确概述控(诉)辩意见,再叙述法院经审理查明事实,也可以视情况直接叙述法院审理查明事实。其中控(诉)辩意见和具体证据,可以根据是否与裁判要点有联系而决定是否列出。与裁判要点相关的事实、情节和法律适用问题,要有针对性地详加阐明。在类案检索时,首先要进行基本案情的识别和比对。现有的案例体系中,案情介绍往往存在案情和关键词提炼不够、无效信息过多的问题。典型案例中的基本案情,应当是提炼之后的“要件实事”,即需要与当事人的诉辩意见和法律适用紧密结合的基本事实。

七是裁判结果。一审、二审和再审裁判结果不同的,要分别写明。

八是裁判理由。从法理、事理、情理等方面结合案情和裁判要点分析阐述裁判理由,做到法律效果和社会效果的统一。根据案例具体情况,可以针对诉辩意见论述,也可以列出裁判要点问题直接论述。

九是案例注解。具体内容一般包括但不限于:裁判要点所涉及的法律、司法解释内容和知识;本案所解决的法律争点问题;裁判的思路和方法;本案例的指导意义;类似案例及关联;本案例参照运用中应注意的问题等。

十是署名。写明案件合议庭、承办法官、编写人。

◎ 典型案例的标签化典型案例的标签化,就是对典型案例的裁判要旨和全文中的关键词“贴标签”。“在提高数据质量的前提下,分析统计的科学精准依赖标签体系的完备,而在目前技术下,裁判文书的标签体系仍需历经人工标签、专家经验、实践反馈、数据迭代、标签优化的循环流程,才可能实现数据清洁有效。”由于“贴标签”的过程是由人工完成,不同的人员对于同一案件中的关键词的理解是不同的,其“贴标签”的结果必然有所区别。因此,对于一个典型案例中“贴标签”的范围,需要在案例使用者不断反馈意见的基础上改进和完善。典型案例“贴标签”的情况,既影响类案检索的结果,也会影响案例库对于类案的比对和智能推送的结果。

对于裁判文书中案情相似度计算的任务,可以将其视为文本相似度计算的一类特殊情况,文本相似度计算方法主要包括基于统计的方法和基于语义的方法。“基于统计的方法主要是统计文本中各词项的出现频度,以词频信息为基础计算文本之间的相似度,如各类基于向量空间模型的文本相似度的计算策略。而基于语义的方法往往利用 WordNet、知网等语义词典中词项之间的层次结构关系,或是本体结构体系中概念之间的关系来计算文本之间的相似度,如基于由词汇资源所构建的图模型来评估文本之间的相关性。此外,随着深度学习技术在诸多领域逐步得到应用并表现出一定的实用性,研究者们也开始将其引入到文本相似度计算领域。”深度学习技术的应用,重点是对“贴标签”部分内容的学习,并在此基础上构建一定的逻辑关系。因此,典型案例标签化的过程,也会影响到深入学习技术在类案智能推送和分析方面的运用。

 

责任编辑:杨燕
本站系非盈利性学术网站,所有文章均为学术研究用途,如有任何权利问题请与我们联系。
^