我的位置: 区情 > 十二公民 > 文章详情
人工智能判案真的能超越福尔摩斯吗?
分享至:
 (1)
 (1)
 收藏
来源:上观新闻 作者:江隐龙 2017-07-23 06:41
摘要:机器判案与人类判案有什么本质上的区别?

随着人工智能与司法审判这一交叉学科的兴起,机器是否能够代替人类进行审判——尤其是针对刑事案件——成了继机器能否在围棋上战胜人类之后的第二个问题。其实从法理学的角度来看,这并不是一个能力问题,而是一个路径问题:机器判案与人类判案有什么本质上的区别?

 

这个问题的答案,隐藏在从古老的神判法到13世纪以降盛行的证据法定原则的演变史中。

 

神判法:人类对因果关系的追求

 

古老的神判法虽然蒙昧,但其定罪的过程却完全符合演绎推理的“三段论”。大前提是神会对人类是否犯罪做出“神示”,小前提是在个案中当事人的表现符合或不符合“神示”的指向,结论即是当事人有罪或无罪。

 

这一审判方式的谬误出现在大前提:因为是否存在神、神有否会对人类的犯罪行为作出“神示”都有争议,所以神判法也很难做出正确的结论。与此相似,在中国的法律神话传说中,人类的罪与非罪也取决于一只能够洞悉人心以“触不直”的神兽“獬豸”,这同样也是神判法。神判法在后人眼中似乎有些荒诞色彩,但支撑起神判法的演绎推理方式却是正确无误的——事实上,演绎推理支撑起的不仅仅是神判法,更是整个法律运行系统甚至是整个世界运行系统。

 

清朝学者钱大昕《观弈》中有一句经典论述:“理之所在,各是其所是,各非其所非,世无孔子,谁能定是非之真?”也就是说世人均有自己的价值观与判断标准,如果没有权威,是与非便无法判定。在法律的世界里,如果没有法律规则本身,就无法确定一个行为是否违法,这里法律规则便是大前提。要知道,如果没有被公认的法律规则这个大前提,法律系统便无法运行;但法律本身又由谁确定、如何确定呢?

 

古希腊哲学家对这种大前提给出的解释是“宇宙本身永恒、绝对、不变的标准”。这种解释投射到法学便是自然法,大体代表着关于正义最基本、最终极的原则,而这种原则是“不言自明”、无需论证的。有了这个初始的大前提,人们通过理性对其认识、表述而形成的法律也便有了大前提的属性,这就可以“定是非之真”了。

 

不要小瞧这种自然法理论,直到1776年《美国独立宣言》中还秉承了其精髓:

 

“我们以为这些真理是不言而喻的:人人生而平等,造物者赋予他们若干不可剥夺的权利,其中包括生命权、自由权和追求幸福的权利。”

 

显然,《美国独立宣言》中并没有解释为什么生命权、自由权和追求幸福的权利是不言而喻的,但这一说法显然被国民认可为“大前提”——正如神判法广为流传时人们对“神会对人类是否犯罪做出‘神示’”的认可一样。

 

自然法的意义在于,人们从此有了法律意义上公理,从而找法律行为之间的因果关系,从而对判罪量刑做出法定依据。不仅仅在法律领域内是这样,这一对因果——即演绎推理——的信奉同样也存在于世界的各个领域,以至于人类需要先找到一个普世的绝对真理,从而在此基础上构建庞大而复杂的逻辑帝国。

 

比如毕达哥拉斯提出了“万物皆数”、“有理数能解释一切自然现象”等公理,而当希帕索斯发现√2这一无理数直接影响到毕达哥拉斯的大前提时,第一次数学危机便爆发了。再如欧几里德提出的“整体大于部分”等公理沿用千年,直到众多“非欧几何”再次对欧几里德提出的大前提提出了挑战。从法律角度来看,或许世界上真的存在自然法,但当其表述为成文法时,很难确定人类的认知是准确无误的——问题在于,很多大前提无法论证,于是只能通过“不证自明”来确定其作为大前提的权威性。但“不证自明”本身在逻辑上站不住脚,所以才会有神判法这样极端的大前提出现。

 

 

 

同样是从法律角度来看,这一演绎推理式的逻辑并不是坏事,尤其是在刑事审判领域,这一逻辑要求在法律与事实两方面找到足够的因果关系才能定罪量刑。法律方面的因果关系体现在“法无明文规定不为罪、法无明文规定不处罚”,这相当于没有法律这个大前提,任何行为不得被认为是犯罪;事实方面的因果关系体现在“排除一切合理怀疑”,如果不能找到某一犯罪嫌疑人与某一犯罪行为之间排他性的因果关系,就不能宣告该犯罪嫌疑人有罪。

 

在法律领域追求因果关系是人类法律思想中最伟大的理念之一,这最大限度地预防了任意裁判。但在人类对世界认知能力较弱、认知成本较大的时代,要求对每一个案件都找出因果关系显然是非常困难的。在民事领域,因为后果并不严重,所以法律渐渐从“盖然性”要求过渡到“或然性”要求,但在刑事领域,要么任由罪犯逍遥法外,要么不可避免的出现刑讯逼供。从历史的发展来看,后一种情况出现的可能更多。

 

而这一困境的根本原因是,人类没有能力获得足够的数据,进行完整而严密的演绎推理。

 

证据法定:退而求其次的强关联性逻辑构架

 

无论是任罪犯逍遥法外,还是刑讯逼供,都很难被人接受。于是历史上的法学家与司法工作者渐渐在研究与实践中找出了一个过渡的证据法定原则。所谓证据法定原则,指的是法律将所有证据的证明力大小通过法律条文明确规定出来,审判时通过对比双方证据证明力的大小做出判决——显然,这种双方以证据对阵的方式从结果上来看要优于神判法,但从推理方式来看却未必。

 

从表面上来看,证据法定原则的弊端在于法律很难——或者说无法穷尽所有证据种类,严格以法定证据为大前提也便意味着法律规定之外的证据无法使用。而从深层次来看,通过双方证据证明力大小的“比拼”并不能得出证据与犯罪行为之间的因果关系,而只能得到一种强关联性。

 

换一种表达方式:证据法定原则让双方当事人就同一事件提出了各自的证据,但这些证据的要求并不是得到排他性的因果关系,而只是强于对方所提出的证据就可以了。在民事案件中这种原则相对公平:谁主张谁举证,想要法庭采纳自己的诉求就必须拿出相当的证据。而在刑事案件中,公诉方搜集证据的能力要明显优于被告人,就算排除刑讯逼供的可能,从双方证据“战斗力”的角度来看也是公诉一方占绝对优势,这就导致证据法定原则逐渐成为国家机器统治的武器。

 

在证据法定原则的运作下,审判活动所追求的事实上不是因果关系,而是强关联性。当然,为了限制这种强关联性的天马行空,证据种类本身由法律明文规定成为证据使用的大前提,所以证据法定原则兼具因果关系与强关联性两方面属性。证据与犯罪行为的强关联性并不能当然推导出两者的因果关系——比如,案发时犯罪嫌疑人出现在作案现场、凶器上有犯罪嫌疑的人指纹并不能当然推导出犯罪嫌疑人就是罪犯,但显然这种强关联性的准确率要比神判法的演绎推理要高得多。如果是以神判法来审理,其三段论将是如下:

 

大前提:如果犯罪嫌疑人杀了人,神会让他浮在湖面上而不是沉下去。

 

小前提:将他投入湖中后,他浮在湖面上了。

 

结论:他杀了人。

 

这个完全符合逻辑的推理过程之所以是错的,是因为大前提是错的。而大前提之所以是错的,是因为人类对世界的认识度不足,不能提出准确无误的公理。在这种情况下,通过常识和经验所做出的强关联性推理很明显要更为准确。

 

福尔摩斯迷们大约不会忘记,在《血字的研究》中福尔摩斯第一次见到华生时没有做通常意义上的问候与寒暄,而是说了这么一句话:“看得出来,您去过阿富汗。”当华生认为一定是别人告诉了福尔摩斯相关信息时,福尔摩斯略带一丝炫技地说:

 

 

“你有医务工作者的风度,却是一幅军人气概,显然是个军医。手腕上的皮肤又黑白分明,因为黝黑的脸色不是天生的肤色而是刚从热带回来所致。左臂受伤,现在还有些僵硬……一个英国的军医在热带地方历尽艰苦而且手臂受伤,这能在什么地方?只能是阿富汗了。”

 

事实上福尔摩斯并没有找出“华出的形象”与“华生去过阿富汗”之间的因果关系,他找的所有理由都只构成两者之间的强关联性。比如,华生有没有可能去的是埃及、苏丹或是伊拉克;甚至他只是做了一次热带探险,甚至只是恰好天生具有军人气概?当然是有的,只是可能性不大,而福尔摩斯在众多可能出现的选项中选择了最强关联性的一项,便是阿富汗。

 

福尔摩斯并不是要找到一个唯一的、排他的答案,而是要找到那个最优的答案。通过丰富的常识、经验与聪慧的大脑,福尔摩斯可以“十蒙九中”,但终究“智者千虑必有一失”。这个“失”并不是因为福尔摩斯不够聪明,而是他的常识与经验不可能涵盖世界上所有的数据——也就是说福尔摩斯的数据量不够。

 

欧洲有一个“黑天鹅理论”:在发现澳大利亚之前,欧洲人认为所有天鹅都是白色的,还常用“黑天鹅”来指不可能存在的事物——直到这个信念却随着第一只黑天鹅的出现而崩溃。显然,福尔摩斯也会随着这只黑天鹅的出现而犯错,比起那些平庸的侦探,福尔摩斯无非数据量更大、大脑更为聪明,因此推理得出的强关联性要更优,但也仅仅是更优而已。

 

然而凭借自身的数据对犯罪行为进行推理也有其理论基础。洛卡尔物质交换定律认为:犯罪行为人只要实施犯罪行为,必然会在犯罪现场直接或间接地作用于被侵害客体及其周围环境,会自觉或不自觉地遗留下痕迹。简而言之,便是每次接触都会留下痕迹,所以当一个足够聪明的人数据量大到能涵盖这些“痕迹”时,其做出的预测也一定会更准并无限趋于真实。当然,无限趋于真实和确信其就是真实,在本质上还是不一样的。

 

福尔摩斯的侦探手法,与证据法定原则在原理上其实是相同的,这在本质上不是推理而是在有限的数据库中找到最强关联。只是因果关系都具有强关联,具有强关联的却未必具有因果关系,证据法定原则与福尔摩斯都会有阴影,而阴影中势必隐藏着被盖棺定论的血泪。

 

大数据:当强相联囊括世界的一切可能

 

从理论上来讲,对强关联性的追求只是不停的在数据库中排除非最优选项,直到剩下最有说服力的一种。这种模式与演绎推理不同:在演绎推理中,只要大小前提正确,无论结论多么荒诞都能保证其正确性;而再强的强关联性,都可能出现最意想不到的反例……除非,这种强关联性所依托的数据,用最暴力的运算能力穷尽了世界的一切可能。

 

有这种可能性吗?刘慈欣在其《诗云》中描绘了这样一幕场景:面对一个持“技术万能论”的十一维超高等生命——且称之为神——时,人类认为其没有写出好诗的能力,更不可能超越李白,因为“技术是反诗意”的。对此不置可否的神于是与人类有了如下对话:

 

神:“到河边去有几种走法?”

 

人:“好像……只有一种。”

 

神:“不,是两种,我还可以向与河相反的方向一直走,绕整个星球一周,再从对岸过河,也能走到这个岸边,我甚至还可以绕银河系一周再回来,对于我们的技术来说,这也易如反掌。技术可以超越一切!我现在已经被逼得要走另一条路了!”

 

人:“就算是你有神一般的技术,我还是想不出超越李白的另一条路在哪儿。”

 

神:“很简单,超越李白的两条路是:一、把超越他的那些诗写出来;二、把所有的诗都写出来!我要写出所有的五言和七言诗,这是李白所擅长的;另外我还要写出常见词牌的所有的词!你怎么还不明白?我要在符合这些格律的诗词中,试遍所有汉字的所有组合!”

 

这一段科幻小说其实正是大数据的真实写照:只要数据量足够大,机器就可以穷尽世界的一切可能,也就意味着不需要考虑因果关系,只通过排除非正确选项的暴力方式就可以找到所有问题的答案——这就是大数据所能带来了技术革命。

 

然而这并不代表着拥有大数据的机器就能超越福尔摩斯,一个只能存贮数据的机器将会与一个只会记忆事件的人一样平庸。机器需要人类提供算法用以处理数据,这种算法就相当于人的神经网络,而人工智能也正是大数据与算法结合的产物。

 

有趣的是,从法律角度来看机器与人类的区别要远小于人类与神的区别——或者说,人类本来就是机器的神。人类提供的算法对于机器来说正是“不证自明”的自然法,机器不需要明白不会明白为什么算法是这样。这种基础性的算法通常基础而简洁,如同牛顿三大定律一样得以描绘机器世界的生态。著名的阿西莫夫机器人三定律事实上也是一种算法,其含义完全符合人类对于自然法的定义:

 

第一定律:机器人不得伤害人类,或者目睹人类将遭受危险而袖手旁观;

 

第二定律:机器人必须服从人类的命令,但不得违反第一定律;

 

第三定律:机器人要尽可能保护自己的生存,但不得违反第一、第二定律。

 

 

从另一个角度来看,如果阿西莫夫机器人三定律可以成为机器世界的“自然法”,那神判法中“神会对人类是否犯罪做出‘神示’”的想法似乎也并不奇怪。人类无法证明那些“不证自明”的自然法,正如机器无法证明人类给其设定的基础算法。

 

退回到法律领域,一旦有了相应的算法保障,并且有了大数据作为依托,能否找到因果关系就不能么重要了——从理论上来看,通过排除所有其它可能性之后,剩下的就是唯一正确的答案,即使无法证明这个答案是否吻合。

 

但理论终究只是理论。就算拥有了宇宙中所有的数据,就可以排除所有其它可能性吗?答案还是否定的。法律与下棋不同:棋类的规则是固定的,而法律所对应的社会是永恒变化的。通过大数据排除的方式只有在环境保持绝对不变、数据更新绝对及时的情况下,才能将答案的强关联性与因果关系完全吻合。社会变化越大,其答案的强关联性距离真正的因果关系也便越远。

 

机器通过既有的算法识别其提取的数据,一旦社会出现新型数据——在法律领域意味着出现新型犯罪,机器便无法通过既有的算法去识别。同时也很难说机器有能力对每一个数据的“合法性”进行判定:一个私人标注的“葛宇路”被高德、百度、谷歌等地图软件收录并以其为合法数据的事件恰恰证明,机器对于不具备逻辑错误的数据是缺乏怀疑能力的。

 

除去机器本身的局限性之外,大数据加算法准确的前提是世界绝对有序的运行。然而……万一上帝也会掷骰子呢?信息论中以“信息熵”来描述信源的不确定度,如果世界本身处于无序状态,数据本身又具有较大的不确定性,在这种情况下大数据加算法的组合从本质上来看也未必比证据法定原则更先进。

 

 

最后,算法之间也可能出现矛盾,而这种“自然法”之间的矛盾将使机器行为不可预测。在库布里克执导的《2001太空漫游》中,机器人哈尔正是为了实现其预设目标而对宇航员进行了谋杀,这不是机器之恶,而是算法之间出现矛盾使然,同样在沃卓斯基姐妹执导的《黑帝帝国》中,史密斯特工也正是因为系统算法出现了不可调和的“Bug”才演变成破坏力巨大的病毒——而人类,因为不以逻辑为生存运行的前提,所以对这些“Bug”反而有着更强大的容纳力。

 

结语

 

在《诗云》的结尾,神创造出了一片直径一百亿公里、包含着全部可能的诗词的星云。然而,神同时也感叹:“借助伟大的技术,我写出了诗词的颠峰之作,却不可能把它们从诗云中检索出来。”

 

的确对于机器来说,回答“是什么”容易,回答“为什么”难。机器可以通过大数据提取出在咖啡网站上投放信用卡和房贷的广告比较容易成功,却无法解释为何如此——除非人类以神之名再给机器世界制定一部新的“自然法”,将其中的逻辑阐述出来。

 

机器可以辅助人类搜集、比对证据,甚至对传统案件进行审判,但无法代替人类当法官。然而通过大数据与合理的算法,的确能快速锁定目标,极大减少司法成本。从强关联性与因果关系的角度来看,一个良好的司法办案流程应当是这样的:

 

公安机关负责查找强关联性,检察机关负责从强关联性中抽离出因果关系,而法院负责认可或不认可这一因果关系——机器夯实过去,而人类放眼未来。

 

题图来源:视觉中国 图片编辑:徐佳敏

上一篇: 没有了
下一篇: 没有了
  相关文章
评论(1)
我也说两句
×
发表
最新评论
快来抢沙发吧~ 加载更多… 已显示全部内容
上海辟谣平台
上海2021年第46届世界技能大赛
上海市政府服务企业官方平台
上海对口援疆20年
举报中心
网上有害信息举报专区
关注我们
客户端下载