首页 » 人工智能:改变世界,重建未来 » 人工智能:改变世界,重建未来全文在线阅读

《人工智能:改变世界,重建未来》土耳其机器人的复仇

关灯直达底部

这些工作不仅涉及建造更大更好的人工智能系统,还包括人类要与这种人工智能系统合作的工作。后者有时被称作土耳其机器人工作,这是以沃尔夫冈·冯·肯佩伦(Wolfgang von Kempelen)在18世纪发明的“土耳其行棋傀儡”(The Turk)命名的。土耳其行棋傀儡游历了欧洲,打败了包括拿破仑·波拿巴和本杰明·富兰克林在内的众多象棋手。然而,人们后来发现,土耳其行棋傀儡根本算不上是一个机器,只是一个躲在秘密隔间里控制“机器人”傀儡的人类象棋师。如今的人工智能工具也是差不多的原理,它们看起来像是拥有机器智能,而实际上只是一种混合智能——每一步都需要人类和机器共同输入信息。土耳其机器人的工作可以是任何因为机器无法完成而分配给人类的工作。因此,这有时也被称作“人工的人工智能”(Artificial Artificial Intelligence)。

许多企业都进行了人工的人工智能方面的试验。最著名的就是亚马逊的机械特克(MTurk)平台,该平台允许个人和企业进行众包,完成人工智能无法独立完成的人类智能任务(HIT)。从在图片中找到物体并进行标记到转录音频,该任务涉及的范围十分广阔。

亚马逊并不是唯一的参与者。2015年8月,Facebook发布了一款基于文本的人工智能助理“M”,使用的技术与第四章中描述的类似。与Siri、Google Now和微软的Cortana不同的是,M同时使用人类和人工智能来回答用户的问题。如果人工智能没能给出满意的答案,人类将继续完成这一任务。

推特(Twitter)也雇用了大量合同工,他们被称为判定官,主要工作就是解释微博上不同检索词的意思。举例来说,2012年10月3日下午6点,美国推特上“大鸟”(Big Bird)一词的搜索量突然飙升。推特使用其人类判定官确定这个词指的是正在谈论政府对公共广播进行资助的米特·罗姆尼(Mitt Romney),而不是“芝麻街”。为什么人类能够比机器更好地完成这一工作?因为我们比机器更了解这些暗喻的含义。

推特工程师在博客中解释道:“收到判定官的回应后,我们会将信息推送到后台系统,这样下次有用户搜索这一信息的时候,我们的机器就能够使用这一附加信息。”

随着企业投资开发更大更好的人工智能系统,对这类土耳其机器人工作的需求会不断增加。例如,据称2011年亚马逊的机械特克平台有“来自190个国家的超过500 000名活跃工作者”。如今,这一数据可能变得更高。

土耳其机器人主要被诟病的是工作所得太少。即使是美国的土耳其机器人工作者每小时也只能赚1英镑左右,而且享受不到劳动保护和相关福利。这是因为人类从事的需要运用智能的任务尽管因其难度而让机器迷惑不已,但是以人类标准来看普遍是没有技术含量的,大多数人都能够熟练地完成这些工作。因此,全球能做这项工作的工人有很多,这就降低了成本。结果就是不止一位批判家曾经称之为“数码血汗工厂”。

这当然是对的,而且有些使当前的人工智能系统更加智能的工人根本得不到报酬。正如我们所知,目前许多成功的人工智能应用都依靠人类生成的数百万甚至数十亿数据。不成文的用户协议是,公司免费提供产品,前提是它们可以利用生成的数据做广告或使其人工智能系统更加智能。举例来说,就像我们之前提到的,谷歌的在线翻译服务看似是百分之百的机器智能,实际上,它是在人类用户提供的数据基础上工作的,它使用的单词和短语是人类在之前的翻译中就匹配好并且应用到所有文本中的。下次使用谷歌翻译的时候,你可以想一下这些土耳其机器人,它们的背后是经验丰富的人类译员,他们擅长不同语言,很多人都有博士学位。

与那些自愿报名参加土尔其机器人任务的人不同,这些译员永远不会收到报酬,也就是除了最初合同规定的工作之外的报酬。汉娜·吕岑(Hanna Lützen)将《哈利·波特》翻译成了丹麦语,因此她将收到挪威居伦达尔出版社的稿酬,而之后,如果谷歌使用这些加起来超过100万字的数据帮助你翻译一封来自女友的用丹麦语写的情书,谷歌不会给她一分钱。

这与现实世界中类似“取样”所涉及的法律问题不同。举例来说,在嘻哈文化中,音乐家们通常将其他人的作品分割开来再重新使用。如果这样做,他们必须为使用的部分支付费用。如果没能支付费用,对方可能提起法律诉讼。2006年法院判决美国嘻哈音乐人声名狼藉先生(Notorious B.I.G.)的专辑《准备死去》(Ready to Die)停止销售,因为专辑在没有获得适当许可的情况下引用了一首1972年的歌曲《清晨歌唱》(Singing in the Morning)。德国电子乐队“发电站”(Kraftwerk)在法庭上成功辩解称其音乐的最小片段(例如几小节鼓点)都受版权保护。

这与合法使用数据有什么关系呢?从某种意义上来说,我们每个人都是土耳其机器人,因为正是我们每天生成的数据使人工智能系统变得更加智能。无论是在Facebook上传照片还是输入验证码,我们都是在训练那些将接管我们工作的机器人。在不久的将来,我们需要就数据的价值展开一场严肃的对话。正如我们常说的,如果说数据是数字经济的原料,那么我们应当重视它。

虚拟现实领域的先驱杰伦·拉尼尔(Jaron Lanier)建议了一种方法,那就是使用一个通用的小额付款系统。拉尼尔举了几个例子。假设你报名参加了一个网上约会活动,你提供信息进行浪漫匹配,而公司会使用你的信息来完善其算法,进而吸引其他用户。Facebook可能会将你的照片放到广告里并将页面定向发送给你的朋友。另外一个例子就是,网飞公司(Netflix)可以使用你的浏览偏好来制作一部电视剧,就像在艾美奖上获奖的美剧《纸牌屋》一样,这部电视剧就是完全根据网飞公司的用户数据制作的。在这样的案例中,可以创建一个公式来确定数据的出处和这些数据对某些特定决策的重要性。这一计算要求公司对用户进行小额付款,就像有人引用音乐家的作品时需要支付版税一样。

这个想法听起来有些牵强,但是在过去的10年里,法律确实在追赶技术转移的步伐。欧盟针对谷歌的“被遗忘权”[2]这样的判例表明了法律仍在适应数字化新技术。在某种情况下,数据所有权的问题一定会经历详细审查。让我们回到音乐取样的例子中,早些时候,有很多违法取样的事件发生。后来,技术成为主流音乐的一部分,艺术家们突然发现自己因版权侵权面临着数百万美元的罚款。同样,人工智能带来的就业方式转变使土耳其机器人从事的这样的工作更加普遍,我们仍需探讨驱动人工智能系统的数据到底归谁所有。如果以正确的方式实施,这不仅能帮助个人,而且能够帮助企业。在21世纪,企业的实际价值是其持有的可分析数据。如果用户因提供数据而获得经济回报,那么他们使用产品时就更有动力。如果我们生成的所有数据都使用杰伦·拉尼尔提出的通用小额支付系统,可以想象,土耳其机器人每小时赚的薪水将从1英镑上涨到英国最低工资标准6.7英镑,甚至更高。这对创建一个数字框架来说是至关重要的一步,在这个框架中,人工智能系统将变得更加智能,但人类也可以共享创造的财富。