在上一章里,我们明白了为什么在就业竞争中,拥有创造力很可能是一个人类仍然会对机器保持优势的特质。就像风险资本家、软件工程师马克·安德森(Marc Andreessen)所认为的那样,在人工智能不断“蚕食世界”的过程中,那些需要人类创造力的工作很可能禁得起自动化浪潮的冲击。
然而,这不是说人工智能没有创造力。2015年6月,谷歌公布了Deep Dream项目。这家更关注工程而非美学的公司设立的这一研究项目十分迷人。Deep Dream是一个由人工智能驱动的图片生成程序,工作时它会利用谷歌耗时15年建立索引的图片库。几乎可以肯定地说,谷歌拥有最多归档了的数字化图片,这些图片被史无前例地汇聚在一起。2001年,谷歌已经拥有了2.5亿张建立了索引且可供用户搜索的图片。2005年,这个数字增至10亿,截至2010年,该索引数量再次飞跃,达到了100亿。时至今日,这个数字应该远胜以往。
在第二章里,我们看到谷歌利用深度学习神经网络,让机器智能地识别各个图片的内容。比如,为了识别什么是椅子,谷歌的程序员向神经网络展示了数百万张椅子的图片。接收了几百万张图片之后,神经网络已经可以确定什么是椅子,什么不是椅子。人们可能会想,看了这么多的椅子,如果它想的话,闭着眼睛都能画出一把椅子。
而这正是谷歌的计划。
谷歌通常使用自己的图片识别神经网络将图片归类,而不必由人工完成。比如,谷歌相册允许用户输入如“摩天大楼”或“毕业”等搜索关键词,随后其神经网络会立即开始查找高大的块状建筑或学位帽。利用Deep Dream,谷歌团队设想,通常用于分类和识别图片的流程也可以用于从无到有地生成图片。这个设想是这样的,在从每一个可能的角度查看了几十万把不同的椅子之后,谷歌的神经网络应该不仅能够识别椅子,而且还能再现一张完美的柏拉图式椅子:本·斯蒂勒(Ben Stiller)主演的《德里克·祖兰德》(Derek Zoolander)中的人物可能会将之称为“椅子的本质”。与其说这种再现是基于看到的某把具体椅子,不如说谷歌将其所知道的椅子的一切信息提炼后创造了一把新的椅子。
至少当时的设想是这样的。在Deep Dream项目中,谷歌工程师们实际上利用了生成图片的神经网络的一个有趣的怪癖。无人协助时,神经网络就会变得困惑:它从谷歌的100多亿张图片中发现了不寻常的关系,因而很难计算出物体的边界。因此,谷歌给柏拉图式物体(完美的椅子的本质)带上了一些不同寻常的附件,如从Deep Dream的理想化哑铃上垂下一条修长丰满的胳膊,看上去就像粉红色的长橡胶管。正如谷歌软件工程师亚历山大·蒙德维特塞夫(Alexander Mordvintsev)和迈克·泰卡(Mike Tyka)在博客里写的那样:“虽然图片上有哑铃,但是似乎没有肌肉发达的举重运动员把它们举起来的话,哑铃图片就显得不完整。在这种情况下,神经网络无法彻底提取哑铃的本质,或许它永远无法展示一个没有被手臂举着的哑铃。”
通常,谷歌会修正“这类训练事故”。但是对于Deep Dream,谷歌决定从相反的方向开始。其结果是带来了超现实的图景,而这似乎更应该感谢萨尔瓦多·达利(Salvador Dal)和H. P. 洛夫克拉芙特(H. P. Lovecraft),而不是谷歌的联合创始人拉里·佩奇和谢尔盖·布林。谷歌团队让神经网络重点关注其发现的所有异常现象。由于接到的指令是极度重视在每张图片中发现的元素,Deep Dream创造出了奇妙的梦幻之旅。神经网络收到图片,并按要求对其分类,随后再加入细节,就会陷入了一个陌生但迷人的反馈回路。Deep Dream让云与鸟相伴,并力图使图片更像“真正的鸟”。一张晴空的照片会很快被谷歌理想化的鸟儿所占据,仿佛世界上最强大的搜索引擎一夜之间决定成为一名涂鸦艺术家。同样的事会发生在你展示的所有图片上,仿佛谷歌的神经网络从虚无中创造了整个梦幻世界:大树变成了华丽的建筑,树叶变成了昆虫,而克罗地亚空阔的海洋变成了外星球的城市风光。
Deep Dream可能不会收到今年的特纳奖(Turner Prize)提名,但完全可以肯定的是:这就是创造力,谷歌风格!