首页 » 人工智能的进化 » 人工智能的进化全文在线阅读

《人工智能的进化》投机取巧不可行

关灯直达底部

由于在非正式对话中缺乏控制权,转而采用更加受控制的设置是很有必要的。这令伪造智能行为变得更加困难。

想象这样一个心理学实验:有一些需要回答“是/否”的问题,被试者只能通过按压按钮来回答问题,其中绿色按钮表示“是”,红色按钮表示“否”。虽然我们不想对专业知识(法律、医学、飞机操作、高中物理等)进行测试,但还是想设计一些被试者能够运用所知内容来回答的问题。为了考验常识,我们希望能够将问题置于全新的、陌生的环境中。

例如,思考这样一个问题:

鳄鱼能跑障碍赛吗?

假设这个问题的被试者知道鳄鱼和障碍赛分别是什么。(障碍赛是一种赛马形式,与普通的赛马过程类似,不同点在于马匹需要在比赛过程中跨越多道跨栏。这就像是马匹的跨栏比赛。)了解了这些,测试对象应该能够轻松地按下正确的红色按钮。(在这里,我们设想“理想”的被试者既能力突出,又积极性高。)

这个问题有趣的地方在于:尽管关于鳄鱼和障碍赛的言论和文章很多,但是很少有人会将这两种事物放在一起讨论。这也就说明了一个新的情况:回答问题不能通过搜寻套话来得出答案。在此,在线文本无法提供有效的帮助。换句话说,即使我们假设任何人说过、写过的内容都能在线搜索到,也不一定能找到问题的答案。(这样说也不对。我以前举过这个例子,因此可以在网上搜到我写的关于鳄鱼和障碍赛的文章。但这并没有说服力。)

再看另一个例子:

是否允许一支棒球队在帽子上粘上小翅膀?

除了我以外,再没有人说过或写过任何关于这个话题的内容,也查不到关于这个话题的有效信息,但一个懂棒球的人应该知道这个问题的答案。(在这种情况下,除非被试者担心这个问题有什么陷阱,否则答案是非常明显的。不过,这个问题当然没有陷阱。)

上述这个显而易见的问题也叫长尾现象。在第7章中,我们会详细分析长尾现象。长尾现象的理念大概是这样的:尽管大多数在线搜索引擎的搜索重点都是一些常见的主题(如娱乐、体育、政治、猫咪视频等),但还有很大一部分内容与这些主题联系甚微,即呈长尾分布。这部分包含的话题就非常罕见了。

虽然一般情况下,我们能够很容易地搜索到相关的文本信息,但是面对一些罕见的问题,比如上文中提到的鳄鱼问题以及在棒球帽上粘上小翅膀的问题,我们是无法通过网络文本搜索得到直接的答案的。

但是,人们还是能够正确地回答这些问题。

所以这能说,我们发现了一种需要利用知识的智能行为吗?不,这还不够严谨。尽管被试者无法搜索到问题的答案,但它们也有可能通过其他方式回答出问题。

鳄鱼问题的考查意图很明确。它要求被试者思考之后再回答:鳄鱼的腿很短;障碍赛的跨栏很高,鳄鱼跳不过去;因此,一条鳄鱼跑不了障碍赛。

但还有其他的回答方式,不需要你深入地理解这个问题。一种是使用所谓的封闭世界假设(closed-world assumption, CWA)。该假设如下所述:

如果没有证据证明某物的存在,我们可以认为其不存在。

我们就是用这种方式来回答“世界上有没有身高超过7尺的女性领导人”的,这个问题的答案不是被别人告知“没有”,而是我们自身认为“没有”。因为如果有这样一位女性领导人,我们肯定会听说过。对于上面提到的鳄鱼问题,被试者可能会说:“既然我从没听说过(例如,我搜不到任何与该问题相关的文本信息)能跑障碍赛的鳄鱼,那答案肯定是‘不能’。”故事就此结束。

请注意,在这里有一个小技巧:正是由于对问题的疑问,我们才得出了问题的答案。但如果将故事中的鳄鱼换成瞪羚,这样的思路就会得出错误的答案。不管怎么说,如果我们只关心如何正确地回答鳄鱼问题,这样的小技巧就足够了。

那么,我们是否能够改良心理测试,消除这样投机取巧的行为呢?

很遗憾,对于这个问题,我们很难回答。我们能做的就是更加谨慎地设置问题,并深入研究被试者会如何应答。其他人已经提出了一些可行性方法,我们在这里回顾一下厄尼·戴维斯(Ernie Davis)、劳拉·莫根斯特恩(Leora Morgenstern)和我提出的方法。