算法说是你做的:通过算法黑箱分析复杂的DNA证据
发布日期:2020-11-16 来源: 信息安全法律评论 作者:王玥 尹洁

THE ALGORITHM SAYS YOU DID IT: THE USE OF BLACK BOX ALGORITHMS TO ANALYZE COMPLEX DNA EVIDENCE

作者:Katherine Kwong

刊载于:Harvard Journal of Law & Technology

刊载时间:Fall 2017

主要内容:DNA可作为判定一个人有罪或无罪的可靠证据。但当出现涉及多个人的DNA混合样本时,该分析结果很大程度会出现错误。当前用于分析和解释复杂DNA样本的常用技术并不可靠,甚至会存在不当起诉或定罪的可能性。为了提高对复杂DNA样本分析结果的准确性,许多公司与组织正在开发一种算法系统来解释DNA分析的结果,但仍然引起人们对算法的科学有效性及透明度的担忧,无法确定由其得出结论的准确性与可靠性。由此,本文建议法院应严格审查分析DNA样本的算法系统是否进行科学验证、要求证据提交方提供算法的源代码与分析过程以及禁止大家对算法系统的源代码进行二次公开/披露或不当公开/披露等方式来建立一个更加公正的刑事司法系统。

一、背景介绍

刑事司法系统中对DNA证据的使用得到了人们的普遍认可。通过当前技术分析单一来源或简单的DNA样本是可以直接得出结论的,但是分析一份含有多个未知身份的DNA样本可能会出现问题。这些DNA样本被称为复杂混合物,包括混合血迹和多人遗留的DNA物质等。法医一般采用主观判断和样本处理技术相结合的方法来解释对复杂DNA样本的分析结果,但主观判断通常会带入个人的偏见或认知错误,加之法医缺少对案件细节的了解,由此对案件认定可能会产生不利影响。

许多公司试图开发出一种算法来解决如何对DNA分析结果进行主观判断的问题。此类算法分析程序依赖一种“概率基因分型” 技术,该技术会加快对复杂DNA样本的分析速度并具有较高准确率。当前使用较多的是TrueAllele程序,该程序得出的结论可直接用于确定犯罪嫌疑人从而无需我们进行主观判断,但该软件提供的证据也面临是否具有可靠性的争论。因为TrueAllele程序并未公布其源代码且法院也没有强制要求其披露,所以我们无法获知TrueAllele得出结论的过程,由此产生了对DNA证据真伪性的怀疑。

二、使用算法分析DNA样本的问题

通过算法程序对DNA进行分析存在着一些问题,该方法的科学有效性并不明确,加之TrueAllele等拒绝公开其代码,由此法官和陪审团只能依赖最终的结果进行审判而无法得知结果做出的过程,也无法质疑用于解释结果的方法之优劣。

不同的程序在有关如何解释样本数据的算法中有不同的选择,分析一份完全相同的DNA样本可能会产生不同的结果,在确认样本中存在多少个人的DNA时也可能会出现错误。当然,解释复杂DNA样本的算法也会存在一些代码错误,STRmix就公开承认其源代码中存在错误。TrueAllele的代码也可能存在一些错误,只是由于其拒绝将源代码提供给任何第三方,因此并未被知悉。电子隐私信息中心(EPIC)指出,由于算法透明度的重要性以及对开放政府和公平刑事司法系统的追求,我们应该获悉TrueAllele的源代码。同时,有学者认为获取代码本身对于全面评估TrueAllele是至关重要的。正如法院不会接受未被证明具有专家资格的证人的意见一样,法院也不应该在未确定该技术是否有资格进行分析的情况下就接受“数字专家”的结论。

鉴于不同的DNA图谱在解释的选择上具有差异性,如果算法缺乏透明度就可能会导致执法部门从不同的解释程序中寻找一个对自己最有利的结果。有人认为,当前最大的问题就是没有对TrueAllele等程序进行真正的独立评估,对程序运行的优缺点是无从得知的。程序之中的差异性可能会导致执法机关对不同的程序进行测试直到他们获得了支撑其案件的证据为止。由于这些问题可能会对认定犯罪嫌疑人产生潜在影响,甚至导致一些司法不公的事件,因此需要我们解决这些问题。

三、讨论与回应

概率基因分型算法为司法系统的工作提供了很多便利,因此不能简单地禁止使用该技术,我们需要解决的是该程序所面临的缺乏科学有效性和透明度的问题。NIST于2017年宣布对涉及DNA分析的法医学技术进行科学基础审查,这便于我们确认算法分析DNA样本的可靠性。同时,为保护宪法赋予被告人的辩护权以及维护正当程序,我们应要求公开用来分析DNA样本的算法代码。

复杂混合型DNA样本带来的挑战意味着刑事司法系统需要对这类法医证据进行更客观的分析。概率基因分型算法最终可能为各种类型的DNA证据提供客观、有效和可靠的结果。但就目前而言,由于分析DNA的算法缺乏经过独立验证的科学有效性证据及其代码缺乏透明度,这导致概率基因分型算法得出的结论可能有误。为解决这些问题,法院应严格审查某一特定算法系统是否得到了科学验证,还应该考虑通过一项规则,即禁止将对复杂混合物进行算法分析的结果作为案件的证据,除非证据提交方向辩护团队披露算法的源代码和分析过程。同时,通过禁止二次公开/披露或不当公开/披露代码的规则来保护公司的商业秘密和财产权,在维护司法公正的同时也保障公司的利益,以此建立一个更加公平公正的刑事司法系统。

责任编辑:徐子凡
本站系非盈利性学术网站,所有文章均为学术研究用途,如有任何权利问题请与我们联系。
^