观看肯·詹宁斯在《危险边缘》中精彩表现的人中,有一个叫查尔斯·力克(Charles Lickel)的,是IBM研究院的高级经理。怎么说他都算不上是《危险边缘》的忠实观众,但这个节目在2004年的夏天确实给人留下了深刻的印象。一天晚上,力克和他的团队在一家牛排餐厅吃晚餐。7点钟的时候,力克惊奇地发现餐厅空无一人,所有客人都放下了手中的牛排,聚集到餐厅吧台观看《危险边缘》。
和IBM的许多人一样,自从1997年象棋机器人“深蓝”(Deep Blue)打败世界冠军加里·卡斯帕罗夫(Garry Kasparov)以后,力克一直试图在人工智能领域实现新的突破。他觉得自己将在《危险边缘》中找到答案。《危险边缘》当然也有缺点,比如缺少科学严谨性使其很难吸引IBM的一些员工。他们认为《危险边缘》就是一个娱乐节目,而非衡量智力的严谨方法。但是,这些反对者的意见遭到了否定。
对于那些相信计算机也可以参加《危险边缘》的IBM员工来说,这一任务正因其不精确性才更加精彩。与有着严格的规则和限制的象棋不同,《危险边缘》的可预测性不强。问题五花八门,但通常依赖于复杂的文字游戏。选手必须在给定的线索下提供正确的“问题”,一个常见的例子就是:“作为一个形容词,它的意思是‘及时的’;在剧院中,它的意思是给演员提词。”正确的回答是:“‘prompt’这个词是什么意思?”为了给出答案,IBM的计算机首先必须将复杂的线索解码,这些线索常常涉及双关语。对计算机来说,双关语十分具有挑战性,因为它体现了语言的不确定性:实际上,我们经常将同一个词用在不同的场合,以表达不同的意思。对人类来说,这意味着我们并不需要一个有着数十亿不同字词的语言。对计算机来说,这意味着建立一个智力竞赛节目版的搜索引擎并不能解决问题。一个普通的搜索引擎能够根据关键词搜索统计学意义上的可能答案,回答《危险边缘》中30%的问题,但它对于剩下的70%问题就无能为力了。IBM的计算机需要更进一步。
参加《危险边缘》的计算机回答问题时所使用的原始数据有近两亿页,这些数据都是从各种各样的资源中提取出来的。这些数据必须本地存储,因为IBM的机器在“大挑战”期间无法访问互联网。为了进一步探讨并发现问题的正确答案,IBM使用了一个名为DeepQA的庞大的并行软件架构(一种高性能的计算,其中大量的计算会同时进行)。DeepQA能够使用自然语言处理技术找出《危险边缘》每条线索中包含的结构化信息。了解问题要问的是什么以后,DeepQA接下来会列出可能的答案,并根据信息类型、可靠性、答案正确的概率以及计算机本身学习到的经验为每个答案分配不同的权重。计算机会对这些可能的答案进行排序,排名第一的将成为计算机的正式答复。
该项目的发展逐渐加快。IBM内部将其称为“Blue J”,之后又以IBM第一位首席执行官托马斯·沃森(Thomas Watson)的姓氏命名,将名字改为“沃森”。它越来越擅长答题。在2006年的初次测试中,沃森从之前的《危险边缘》中得到500条线索,而它的正确率只有15%。到2010年2月,该系统已经被充分改进,经常能够打败人类选手。
2011年2月,沃森在一个系列电视特别节目中与肯·詹宁斯和《危险边缘》的另一位冠军布拉德·鲁特(Brad Rutter)对决。詹宁斯十分兴奋,当年“深蓝”打败加里·卡斯帕罗夫的时候他还在上大学,在他看来,终于有机会在人工智能的重要时刻当一把“卡斯帕罗夫”了,他十分确定自己能赢。“我上过人工智能的课,知道能够在《危险边缘》中打败人类的技术要几十年后才能出现。”他说,“至少我当时是这样认为的。”
在那场比赛中,“沃森”击败了詹宁斯和鲁特,赢得了100万美元的奖金。尽管人类选手的表现十分精彩,但谁才是比赛节目的真正赢家已毫无疑问。詹宁斯被深深震撼了。他承认:“输得那么惨真是令人吃惊。”
比赛结束时,战败的詹宁斯在答题板上胡乱写了一个短语,并将其面向摄像机。那是动画情景喜剧《辛普森一家》中的一句台词,但用在当时简直再恰当不过。
那就是:“欢迎新的机器人统治者。”