听新闻
放大镜
以AI大模型赋能案件质量检查评查
2025-07-16 09:37:00  来源:检察日报-观点版  作者:隋莉莉 胡守鑫

  适应数字检察战略发展要求,各级检察机关应当积极探索AI大模型在案件质量管理中的应用路径——

  案件质量检查评查是检察管理的重要抓手。修订后的《人民检察院案件质量检查与评查工作规定(试行)》(下称《工作规定》)明确要求,在检察业务“大管理”格局下,构建了案件质量检查与案件质量评查相结合的案件质量“大检查”体系。然而,在实际操作中,案件质量检查评查工作面临着“人案矛盾”突出、容易产生形式化倾向以及评查标准不统一等难点。在数字时代的浪潮下,适应数字检察战略发展要求,各级检察机关应当积极探索人工智能(AI)大模型在案件质量管理中的应用路径,以科技赋能提升法律监督质效。

  AI大模型可以舒缓案件质量检查与评查工作中“人案矛盾”问题。所谓“人案矛盾”,是指在案件质量检查评查工作中,评查员数量少而待评查案件数量多,现有人力资源无法满足待评查案件数量需求而可能产生新矛盾。“人案矛盾”会影响案件质量检查评查工作效率,是亟须解决的难点。尽管可以通过引进外部专家等方法来扩充评查人员数量,但面对日益增长的待评查案件,无法从根本上解决问题。不过,在引入AI大模型后,该问题有望得到有效缓解。与传统人工评查相比,AI大模型可以不间断地执行案件质量检查评查工作任务。只要算力充沛,AI大模型评查的工作效率要显著高于人工评查。

  AI大模型能够应对案件质量检查评查工作中可能出现形式化问题。所谓评查形式化,是指评查员或碍于情面,或缺乏评查主动性,或缺乏对评查工作重要性的认识,导致案件质量检查评查工作流于表面,难以起到对案件质量把控把关的作用。案件质量检查评查是对案件的二次审查与全面体检。如何削弱“法外因素”对评查员的影响,不使评查沦为形式,继而提升评查工作质量,是亟须解决的另一难题。与人工评查相比,AI大模型不会受到“法外因素”的影响,只要评查员给出正确的指令,就能够高效完成相应的评查任务。

  AI大模型可以克服案件质量检查评查标准不统一的问题。根据《工作规定》要求,评查员围绕证据、案件事实、适用法律、办案程序、文书使用与制作、以案释法、办案效果以及全面准确落实司法责任制等方面进行评查。然而,由于评查员人数众多且评查员个体之间看待问题的角度与态度不尽相同,案件质量检查评查工作的标准并不统一。这不利于实现案件质量检查评查工作的制度目的。但在引入AI大模型后,该问题有望得到解决。以AI大模型中的知识蒸馏技术为例,其将已训练完善的模型作为教师模型,通过控制“温度”从大模型的输出结果中蒸馏出知识,用以训练学生模型,而学生模型在学习相应知识后,可以达到教师模型相同的表现。这意味着,只要教师模型掌握了案件质量检查评查工作中的要点,那么学生模型也将掌握相应的能力,如此便能实现案件质量检查评查工作标准的“全国一盘棋”。

  然而,即便AI大模型可以舒缓、应对以及克服人工评查中的种种弊端,但是其不能完全替代人工评查。事实上,完全将AI大模型应用于案件质量检查评查工作中,也可能会出现如下问题:

  一是AI大模型可能因算法偏见,使其评查结果与人工评查结果差异过大。AI大模型中的“大”主要体现在数据规模之上,其工作原理是通过海量数据训练一个能够自动捕捉语言或其他模态统计规律的数学函数。因此,AI大模型所得出的结论是建立在过往海量数据基础上的一种统计学上的判断。在AI大模型中的数据没有及时与现实社会保持一致时,所得结论就可能存在算法偏见的问题。在司法领域,算法偏见问题需要引起足够的重视。聚焦在案件质量检查评查工作方面,AI大模型数据库所储备的数据均是历史上的法律规范、办案共识等,这些数据在当下有可能是现行有效的,但也有可能已经无效或过时。如果不对数据库的数据及时更新或修正,则会出现AI大模型生成的评查结果可能与过去的规则、共识相一致,但已经与现行有效的法律规范不相符或背离了当前办案共识的算法偏见情况。

  二是AI大模型可能会因为“AI幻觉”而捏造案件质量评查结果。所谓“AI幻觉”,是指生成式人工智能模型在生成文本或回答问题时,表面逻辑和语法正确,但内容却包含虚构、不准确或与事实不符信息的现象。可能造成该现象的原因是,当输入的案卷资料内容无法与AI大模型数据库中储备的数据建立联系时,AI大模型虽不会拒绝相关指令,但会强行生成看似合理但又毫无关联的答案。所以,在利用AI大模型评查新型案件时,可能会出现AI大模型虽然能够生成评查结果,但完全错误的情形。

  三是AI大模型无法掌握全部伦理规范。高质效办好每一个案件、“努力让人民群众在每一个司法案件中感受到公平正义”是新时代新征程检察履职办案的基本价值目标,这便要求检察官在办案过程中,不能机械适用法律,而是要做到天理、国法与人情相统一。其中,人情是指社会中所运行的伦理规范。司法活动是人类最为复杂的思维活动之一,而检察官在个案中所运用的伦理规范各不相同。AI大模型虽具备超越人脑的学习能力,但其无法全面掌握所有伦理规范,并且每个案件所需的伦理规范和价值判断标准各异,故而,完全依赖AI大模型生成的评查结果可能并非真实所需。

  但是,将AI大模型应用于案件质量检查评查工作中已是不可阻挡的时代潮流,关键是充分发挥其优点,尽最大可能避免其缺点。为此,在案件质量检查评查工作中,可以构建如下人机协作模式:首先,量化案件质量检查评查工作标准。《工作规定》是检察机关开展案件质量评查工作的依据。然而,该规定仍有待细化。可以根据刑事诉讼法、民事诉讼法及行政诉讼法的规定进一步明确认定事实清楚、适用法律正确等评查标准,也可定期发布案件质量检查评查指导性案例以明确评查标准。其次,AI大模型需要学习、理解并执行上述标准。应将案件质量检查评查工作的标准及时转换为程序编码,并指令AI大模型进行学习、理解并执行。最后,在个案评查中,应由评查员负责发布具体评查指令,并结合案件实际情况对AI大模型评查结果进行修正与负责。评查员在案件质量检查评查工作中占据核心地位,主导整个检查评查程序,但评查员不能将AI大模型生成的评价结果当作最终的评查结果,并要对案件最终评查结果负责。

  (作者分别为辽宁省大连市人民检察院法律政策研究室主任、辽宁师范大学法政学院诉讼法教研室副主任)

  编辑:葛明亮