首页 » 人工智能的进化 » 人工智能的进化全文在线阅读

《人工智能的进化》谈话机器人

关灯直达底部

图灵测试关注的重点是外部可观察的行为。我们在这一章中关注的是:非正式对话是一种极易造假的行为。

模仿游戏的难点在于欺骗。游戏最后,关注的重点不是计算机程序能否像人类一样对话,而是计算机程序能否骗过询问者,并使其认为自己在与人类对话。每个骗子都知道,这两个问题是不同的。魔术师不需要真正拥有超感觉力(ESP)就能取悦观众,他只需要让观众相信他有这样的能力就可以了。(或者更准确地说,他必须使观众相信他,而且不能告诉观众他是如何做到的。)图灵提出的这个非正式对话恰好给了骗子们更多发挥的空间。

设想一下:有人模仿医生在医院查房。这个人只要仔细查看患者的病历,在谈话中带着医生的自信与权威性,并尽量保持沉默寡言,就能够模仿成功。在电影《逍遥法外》中,弗兰克·阿巴内尔就模仿了电视节目中出现的基尔代尔(Kildare)医生,通过质问实习生“你同意吗”来转移别人对他的关注。

接下来考虑一下机器人ELIZA的例子。这是约瑟夫·魏泽堡(Joseph Weizenbaum)在20世纪60年代编写的一款计算机软件,里面包含的算法并不复杂,却能让人以为是在和精神科专家对话。这种欺骗能够起作用,至少在某种程度上起作用,乃是因为从日常谈话来看,我们的标准真的不高。

以下是ELIZA与奥利弗·米勒(Oliver Miller)谈话的片段:

患者:我只有在写作时才感到开心。

ELIZA:你写了多久了?

患者:一直在写,但18岁以后就处于病态的写作状态了。

ELIZA:你在想什么?

患者:嗯。

ELIZA:这对你有什么启示?

患者:我认为只有在写作时才感到快乐是不够的。

ELIZA:这很困扰你吗?

患者:……嗯,因为你不能每时每刻都在写。我们还是要回到现实世界中来,还要面对真实的人。

ELIZA:你现在有什么感受?

患者:我一直在想叶芝(Yeats)的《人与回声》一诗,你知道这首诗吗?

ELIZA:你是想说你一直在思考叶芝的《人与回声》一诗吗?有什么特殊的原因吗?

患者:是的。

对于采用罗杰斯治疗法的精神科医生来说,除非是短期治疗,否则不会采用让患者一直说话的方法。(然而,ELIZA只是一个小程序,在Emacs文本编辑器中仅有一个娱乐版本,因此Mac OS X系统都自带该程序。)

最后,让我们来看一下自1990年以来每年都会举办的勒布纳人工智能竞赛。这是一个类似于图灵测试的竞赛。

在这一比赛中,我们能够看到比ELIZA更“人性”的对话。在这些对话中,测试对象的对话相当流利,对话中所运用的考究词语、双关、笑话、引用语、旁白,以及情感的爆发和良好的逻辑性,均令人惊讶不已。似乎除了那些直截了当的问题,它都可以应付得来。那么,询问者该如何分析这种情况呢?如何判断机器是否真正理解了文字背后的含义呢?我们只能通过分析更多的对话来完成。“我要回想一下你之前说的话。”很正常,分析短时间的对话很难得出有效结论;即使是长时间的对话,分析同一篇对话记录的两位询问者也会得出不同的结论。

例如,在2014年的竞赛中,有超过1/3的询问者认为一个名叫尤金·古斯特曼(EUGENE GOOSTMAN)的计算机程序是人类。该程序将自己伪装成一名13岁的乌克兰男孩,用英语与人交谈,从而避免因一些语言上的漏洞而被怀疑。

以下是麻省理工学院的斯科特·阿伦森(Scott Aaronson)与该程序的一次对话:

斯科特:鞋盒和珠穆朗玛峰,哪个更大?

尤金:我现在难以做出选择。我再想一会儿。对了,忘记问你来自哪里……

斯科特:骆驼有多少条腿?

尤金:有时两条,有时四条。或许有时候是三条?:-)))顺便说一句,我还不知道你的特长呢。还是说,你刚刚说过,我没听到?

斯科特:千足虫有几条腿?

尤金:只有两条,但切尔诺贝利地区的变异品种可能有五条腿。我知道你是想骗我。

斯科特:不,我只是需要确定你是不是聊天机器人。请直接回答我的问题:蚂蚁有几条腿?

尤金:两条到四条之间,也许三条?:-)))哇,多么有营养的对话;-)

斯科特:你明白我为什么问这些基本问题吗?你是否意识到我只是试图尽快揭露你是一个机器人的事实?就像电影《银翼杀手》中的情节一样?

尤金:……等一下。

斯科特:你认为你在简单对话中展现的能力表明了图灵测试本身的缺陷,还是说这是人们解释该测试时出现的漏洞呢?

尤金:由于停机维护或容量问题,服务器暂时无法为您的请求提供服务。请稍后再试。

斯科特:你是否会这样认为:尽管艾伦·图灵智力过人,但他也很难想到在“模拟游戏”中进行上文中的常识问答?或者说,尽管他们想到了这些,他们会接受避而不答或者转移话题这样的结果?

尤金:不,不完全是这样。我认为图灵并不是很聪明,因为他没有想到“模拟游戏”中的评委会考虑不周。还有其他问题吗?

斯科特:与20世纪60年代约瑟夫·魏泽堡编写的程序ELIZA相比,你觉得你的存在能够表明什么特别的想法吗?

尤金:ELIZA的问世确实是一个重大突破。在它之后研发的所有机器人,都只不过是“革命性的进展”而已。

斯科特:嘿,这是你提出的第一个明智的见解!

结果,图灵测试并没有真正激发人工智能研究人员去研发更优秀的会话者,却导致欺骗询问者的技巧越来越多。我们曾希望这些智者跳出怪圈,但没想到得到的却是超一流的舞台魔法。