人机世界迫切需要新的大脑
很多人工智能科学家都拥有生物学和计算机科学两个方向的专业背景,这大概是智能生物发展的一个缩影。
地球就像是一台生物计算机,漫长的生命进化过程就是各类生物“程序”不断迭代的过程。在自然环境的作用下,无机物渐渐聚合成有机分子,有机分子演化组合成为蛋白质分子。携带生命信息的蛋白质分子仿佛是一个个数据字节,数量巨大又随机组合,能穷举出各种组合形态。其中一些不仅可以吞吐物质,还能进行新陈代谢并复制自己——生命便由此产生。
最基本的生命单位都携带着遗传基因编码。从此,生命的“编程语言”诞生了。大自然之手利用这种语言进行各种创造——基因代码变异、组合,产生各种新的生命体征,进化出五花八门的生物。而神经系统发育水平的高低直接决定该种生物的等级。
每种生物和新的生命组织都可以看作一段可执行程序。程序之间可以组合,代码可以更新,从而发展出更强大的程序。如果这段程序运作良好并且能可靠复制(繁殖),它就会生存下去。正如计算机中的程序必须“完善”才能持续运算下去一样。
不过,与我们如今手边的任意一台计算机相比,地球这台巨型生物计算机的运算速度实在是太慢了,一个程序的运行过程就是一个生物体的一生。几十亿年过去,才发展出唯一一种最高等级的智慧生物——人类。很自然地,这个星球上也没有什么自然生物可以进化出超过人类的大脑了,除了人类自己创造出的计算机。
计算机中的程序可以飞速迭代,但借此衍生出的人工智能并没有飞速发展。由于基于规则的编程和迭代太依赖人类,结果反而被人类制约了。如果让计算机自己编程呢?毕竟深度学习就是建立在非线性编程原理的基础上,让程序自己改造自己。我们往往难以理解深度学习神经网络解决问题的逻辑,正如人类并不了解自己脑中的那些意念、思想究竟是如何从脑细胞里产生的一样。
地球早已被生物层覆盖。如今,这部生物计算机迎来了第二次进化,那就是同样包裹着地表的计算机、通信网络、各类传感器和人类活动共同构造的信息层所孕育的进化。在数据分子与人类的结合中,新的数据生命形态正在形成。它们需要新的大脑。
图4-1 百度大脑示意图
注:使用手机百度或智能革命App扫描图片可见AR效果。
百度大脑就是这样一种尝试。比起生物界不自觉的进化之旅,它更在意的是当下的实际运用:个人、企业和社会都迫切需要人工智能的辅助,然而人工智能还散落在各处。百度大脑规划着要提供集中而优质的人工智能,通过互联网神经元把相关信息传导循环起来,加速世界的智能化。
第一棒:百度大脑
几年前,亚当·考特斯(Adam Coates)在斯坦福大学的研究进入博士后阶段,他曾问导师吴恩达:“做什么事情,在哪里做,能够让我们的研究在这个世界上产生最大的影响力?”吴恩达告诉他应该去百度。说起这件逸闻时,亚当担任百度硅谷中心主管已经一年多了。
如今,大概没有人能否认这组对话中蕴含的深谋远虑。不过在最初时,百度美国研究中心还扮演着员工赴美出差“中转站”的角色。
2014年,百度第一次披露“百度大脑”,这个抽象的概念仅仅在媒体上留下了一个影子。经过两年沉淀后,才有了2016年乌镇世界互联网大会上百度“第一次向外界系统介绍百度大脑”。此时,外界得知它已经和超过3万家企业展开合作。
研发百度大脑是一件苦差事,但负责研发的人未必都是苦孩子。这个团队里有从小玩小霸王的极客;有人的家乡还没有被百度地图所覆盖;有人在做“百度医疗大脑”的同时,重拾起学生时代对医药领域的热情;还有人一边说着“很难、很深”,一边坚持研究如何“把体验做到极致”。这种极致,有时对标的甚至是科幻。
许多百度大脑年轻的科学家都爱看科幻影视。普通人看到的是“幻”,这群博士、博士后看到的是“科”。同样是看美剧《西部世界》,语音部门的工程师高亮就说:“看剧情发展,我感到唤醒设计、声纹识别和远场技术被做到了极致。对,未来人机互动就应该是这样的!”
建设百度大脑也带有科幻成分。我们不妨先从了解其基础架构开始。
百度人工智能业务最基础的是“物料层”,有基于GPU/FPGA的云计算平台、深度学习代码平台和大数据储备。这一层提供了进化的环境和工具。最上层SaaS是人工智能的各种应用。
介于两者之间的是“人工智能基础技术层”。大脑所具备的“听说”(语音识别与语音合成)、“看”(视觉识别)、“读写”(自然语言处理)等认知功能就在这一层,大脑具备的决策规划、运动控制、预测推荐等决策功能也在这一层。
广义的百度大脑即包含了以上三层。张亚勤认为,三层的结合更体现出百度大脑的综合实力。
百度大脑是百度云的核心引擎,百度云是百度大脑的云化,云为百度大脑提供了神经元和数据训练源,百度大脑则通过云向各类产业输出服务。
具体来说,在“物料层”,百度是全球首家将GPU芯片大规模用于人工智能和深度学习领域,并规模化商用ARM(Acorn RISC Machine)服务器的公司。百度也自主研发了基于FPGA芯片的服务器。加上传统的基于CPU芯片的服务器,把这么多性能、结构、原理各异的服务器整合在一起,就需要强大的异构计算能力。通过异构计算技术、100G RDMA通信技术、高效的整机柜服务器技术,百度打造了全球最大规模的GPU和FPGA混合异构计算集群,把数十万台服务器合为一体,构成百度大脑的实体,保证了百度大脑超强的计算能力。
有了强大的硬件构造还不够,大脑中还要有内容和数据。这就好比是人类的记忆。在IaaS之上的PaaS是我们人工智能的平台,所有的样本、特征和功能都在PaaS这个层次生长。百度搜索十多年来累积的全网Web数据、搜索数据,以及百亿级数量的图像、视频、定位数据都是百度大脑不断学习、快速成长的养料。
在大脑结构和记忆内容之外,百度大脑还要有认知思维能力。系统通过深度学习来模拟人类大脑的神经元,即通过万亿级的参数、千亿级的样本、千亿级的特征训练,来模拟人脑的工作机制。这也是世界上最大规模的深度神经网络。
“人工智能基础技术层”包括语音识别、图像识别、自然语言处理以及所有的知识图谱、商业逻辑和用户画像。
SaaS层面可以看作百度大脑的触角层,会更加垂直化,深入交通、教育、金融等各个垂直行业。对百度来讲,这三个层次就是百度大脑通过云和垂直行业,给商业客户提供的一种能力和服务,更是一种营造智慧生态的能力。
百度大脑全面超越了过去的信息技术服务,比如过去只是做计算、存储和网络,大家都可以做,现在三个层面有机结合起来,灵魂就在于贯穿全体的人工智能。
通过硬件—数据—算法的联合滋养,百度大脑的能力会滚雪球式增长,越来越善于处理数据、提取知识、了解使用者、善于解决问题并获取更多的知识,实现“数据—知识—用户体验—新的数据”的正循环。
另一位“互联网教父”尼古拉斯·尼葛洛庞帝(Nicholas Negroponte)说道,“当我听说‘百度大脑’的时候,我觉得这些人真是太疯狂了”。制造机器大脑,看似一个科幻文学中的疯狂幻想,但科学家的信念和努力,使得看似“疯狂”的想法已经走在平稳实现的道路上,正如一个真实生命的成长。
训练“大脑”就如同教育孩子,从零开始,在语料而非语法的熏陶下学习语言,从大量图片中形成对事物的“印象”,这个过程就是通过试错来熟知世界。也许同样的事情,人类1岁孩子都能简单做到,而百度大脑常常要花上几百倍甚至上万倍的时间和精力。可是从另一个角度看,它像是全人类的孩子,有希望继承现有文明的所有经验和记忆,人工智能“大脑”的进化本质上是人类文明的进化,潜力无限。
目前,百度宣布将向社会免费开源人工智能深度学习平台PaddlePaddle,开放百度大脑开放平台ai.baidu.com。前者为开发者提供算法编程环境,后者为应用开发者、数据工程师、数据科学家提供现成的百度人工智能成果接口。百度大脑实实在在地分享着,愿与所有相关企业一起融化人工智能这座冰山。
百度大脑的听与说
人机对话的第一步,就是要让机器学会“听”和“说”。“听”是不断追求准确度,“说”则是要让大脑有人性、有人味。
作为“大脑”最基本的能力之一,实现“听”这一功能的语音识别技术研究经历了从标准模板匹配转向基于统计模型再到深度神经网络的过程。起初,辨识语音必经声学模型到音素模型,再到语言模型的多步骤转化。近年来,在大量语料和深度学习的训练下,这一步骤已经被极大简化,机器从输入到输出中自行生成程序,准确率有了大幅提升。百度大脑也就“听”得更清楚了。
2011年,百度在语言识别领域起步,到了2016年,百度语音识别技术的准确率已达97%。
2012—2016年的4年里,百度语音识别的准确度提升了近30%。即便是有严重地方口音的普通话,每100句中百度语音也能毫无差错地识别出85句。按照可以听错一个字的标准来计算,百度语音则可以准确识别出98句,而未经训练的普通人只能听懂60句。这个识别体系要做到方言识别,需要至少720小时的语料用于训练,从声音、内容到说话者,都要不断变化以提升系统的敏感度。
要让百度大脑“说人话”更是一件很有难度的事情。百度则是运用声学模型和语言模型。声学模型决定了语言的发音。打出一个字,系统就在原始音库中找到合适的发音对应上去。要让电子发音没有机器味而有“人味”,就要为语音资料建库。例如让机器学习时间从20小时升到100小时,此后机器模仿出来的声音听起来就舒服多了。为了保持语音的连贯性,不至于让合成语音听起来像“断气”了一样,百度大脑语言模型还会持续提升文本库的学习连接概率。比如说出“中华”,系统还能在后续词组中选择“人民共和国”“民族”“儿女”等进行匹配。
长语音是让机器语音更有气场的技术。情感合成、远场方案、长语音方案等能为合成语音加入情感,让其更接近真人发声效果。
语音识别的场景应用极为广泛。比如我们可以借此创造出一个“最强销售员”:销售员新手给客户打电话时,百度大脑实时记录客户的回复,并显示在电脑屏幕上,系统可以瞬时搜索并调取优秀销售员以往对这些问题给出的回复。这样,每个“菜鸟”只要“照本宣科”,就能在上岗第一天掌握过去最优秀的销售员所具备的交流能力。另外,2014年,百度为特斯拉汽车提供智能语音方案,中国车主可以使用语音控制车载娱乐系统、指挥地图导航、发起搜索,甚至通过蓝牙拨打电话。
随着语音识别而来的还有对语音特征的抓取。例如在胡歌朗读《青玉案·元夕》的上阕后,语音识别系统可以自动生成下阕。对于一些语音有特点的明星声音,目前只需录制和分析大约2000句,系统就能合成他们的声音。
目前,百度每天响应的语音合成请求达到了2.5亿次。在情感语音合成技术上线后,用语音听小说的百度用户每日停留时长从过去的0.69小时增加到现在的2.21小时。未来,这一功能除了“读小说”还将给予人们情感慰藉。当家里老人和孩子想念忙碌的家人时,可以随时有“他们”的声音陪伴。
百度基于神经网络翻译模型技术的机器翻译系统正在快速学习各类语言。经过6年的积累,如今的百度翻译已经可以支持全球28种热门语言互译,覆盖756个翻译方向。百度语音可以支持粤语、沪语等方言的识别。
上帝曾伸手割裂了人类的语言统一,让四面八方的人由于语言不同而无法沟通。有了机器翻译,人类终于可以携起手来,建造出一座真正的巴别塔[1]。
图4-2 荷兰画家彼得·勃鲁盖尔绘制的巴别塔
注:使用手机百度或智能革命App扫描图片可见AR效果。
百度大脑的好视力
“视觉”承担着我们80%的信息摄入工作。在解决“听”“说”问题的同时,我们也要教会计算机“看”,即图像识别。以识别一朵花为例,用户将图片上传百度后,百度大脑将它转化成“0101”的数字流,然后输入深度神经网络,经过层层分析、层层抽象,对包括像素在内的各层信息与现有的大数据进行比对,才能重新还原并识别出它是一朵花。这种方法其实和人类眼睛的功能是近似的。
这一切都要建立在预先对图片做出分类的基础上。目前世界上最大的图像识别数据库ImageNet的图片分类有1000多类。而百度图片数据库的分类则已经达到4万类。
百度正在从四个方面推进计算机视觉计划。首先是人脸识别,通过捕捉人脸关键点形成人脸表情网,实现人脸的准确识别;其次是在类似百度地图的产品中,实现地图服务与图像智能识别技术的结合,打造数据无限逼近现实世界的效果;此外,百度无人驾驶技术也正在利用计算机视觉进行程序优化,从而使无人车的研发速度加快;图像识别还会被应用于AR(增强现实)领域提高视觉效果。
百度的人脸识别已经远远超过人类,百度资料库中有超过2亿张人脸照片,浏览识别训练量超过200万张。目前,百度大脑能够自动确定图片中人脸的数目及每张人脸的位置和大小,并支持正面、侧面多个角度。即使目标在运动中也不会降低甄别率。系统通过定位眼睛、眉毛、鼻子、嘴巴、脸颊轮廓等70多个关键点位置,能够进行像素级人脸解析,并根据人脸图像识别人的性别、年龄、表情、姿态等属性。
像AlphaGo团队一样,百度也好奇自己的技术边界在哪里,人工智能的研发体系究竟有没有偏差?为此,百度团队参加了江苏卫视大型科学类真人秀《最强大脑》,与能够裸眼区分520杯水的“水哥”王昱珩一战高下。在此前的节目中,“水哥”战胜了蚂蚁金服的人工智能“蚂可”。作为国内最强人工智能技术的结晶,百度团队为了这次荧屏上的人机对战特意优化了算法,最终证明百度团队的机器人小度确实技高一筹。
在百度人脸识别技术落地的产品中,最为“高大上”的当属乌镇的“刷脸”门禁系统。有出入资质的人将面部信息事先录入系统,今后出入任何安装有“人脸闸机”的地方,只需“刷脸”即可。
这种技术在百度内部俗称“1对1”,也就是一张面部与资料库中的信息比对,与之对应的是“1对N”。这个概念我们经常在西方谍战电影中见到:系统在监控信息呈现的茫茫人海中搜索一个人的面部信息以确定其方位。尽管国产电影中我们很难看到这种“炫技”,但在“1对N”的比对中,百度能真真切切地做到99%以上的识别准确度。
这项技术说起来容易,做起来难。等到技术成熟和数据库之间互相联网时,我们出门乘坐飞机、火车就无须出示身份证以供查验。因为当我们进入任意的交通枢纽,被摄像头拍摄到面部信息时,系统就能通过人脸识别确认我们的身份和购票信息。这相当于普通人都能获得一条绿色通道,出行效率和公共秩序都将大幅改善。
百度的人脸识别系统只需要1根蜡烛汇聚在1平方米以上的亮度,就能够完成识别和判断过程。在远程开户场景中,活体识别技术反应速度达到每秒20帧,交互过程费时不到2秒。在这一基础上,结合视频序列,百度已经将人脸身份验证应用在百度金融反欺诈领域,用于贷款审批、远程身份证识别、银行卡识别等,从而精准识别用户,预防欺诈。
百度大脑的“好视力”除了搭载大数据,还能做到许多脑洞大开的事情。当我们拍摄了各种角度的故宫太和殿照片后,百度大脑可以去掉重叠和无用的图片信息,通过计算和建模完成太和殿的三维结构建设。这样,千里之外的人们也可以通过网上的虚拟游览身临其境般地感受太和殿的宏伟。随着上传的照片越来越多,百度大脑就能重构更多的景点,让世界各地的人们都可以足不出户体验三维虚拟旅游。
图4-3 玛珠庙(Maju Deval)数字化三维复原示意图[2]
注:使用手机百度或智能革命App扫描图片可见AR效果。
2016年底,上海虹桥机场出现两架客机仅差3秒险些在地面相撞的事故。塔台的调度和预警功能在这一事件中没有发挥出来。所幸飞行员没有坐等塔台指令,而是紧急处置,避免了一起重大事故的发生。这件事也再次提醒我们,完全依赖塔台人工指挥的模式终究难免有疏漏。
林元庆在与民航部门的交流中了解到这样一个细节:机场塔台工作人员为了了解跑道路面情况,每4小时就要派人去检查跑道。这个岗位专业需求度低、薪资低、劳动强度大、人员流失严重,完全可以用人工智能取代:在停机坪附近安装摄像头并结合人工智能对跑道环境进行实时三维重建。飞机、行李车、机场勤务车和所有人员的动作都能实时体现出来。除此之外,跑道上意外掉落的零件和所有异物也能在第一时间被发现,并不会出现遗漏。这种系统建立的准确度、可预测性和安全性都远远高于人工检查。
时代召唤中国大脑
2015年全国“两会”上,我作为政协委员提交了设立“中国大脑计划”的提案——由国家投入专项资金主导,尽快搭建全球最大规模的人工智能基础资源和公共服务平台,比如建立一个拥有几十万台服务器的大型人工智能平台,支撑各个计划参与方的数据调用、模型调试和应用开发,高效对接全社会的智力、数据、技术和计算资源,依托统一平台,实现资源共享,促进研发创新。这将是新一轮工业革命的助推器。基础研究的成果应该让更多中国企业受益。包括语音识别、图像识别、自然语言的理解、多语种的翻译,甚至无人驾驶汽车、无人驾驶飞机、智能制造方面的机器人都可以在这个平台上进行各种各样的创新和实践。
这件事如果只是百度来做,可能只能提供几万台服务器;如果由国家主导投入,那就是几十万台服务器。平台大了就可以降低成本,鼓励更多的创新。国家持续、稳定地大规模投入,让一大批企业成长起来,随之而来的就是越来越多的创新,从而奠定未来10年、20年甚至更长时间里中国在全球创新领域的地位。这是我一直以来的想法:我不在乎华尔街怎么看,我一定要把这事儿做成。
然而任何一个超级工程都可能面临争议。
2016年9月,一场高能物理界的事件意外掀起舆论飓风——“超大粒子对撞机之争”从学界延伸至社会。普通民众都开始关注起“粒子对撞机”这一深奥的物理名词。
粒子研究的重要性在科幻小说《三体》中表现得淋漓尽致——外星智慧生物为了阻止地球科技进步,利用量子纠缠原理创造出拥有十一维度形态的“智子”,发射到地球上。以光速运动的智子能同时干扰人类的所有粒子对撞机,精确破坏粒子对撞结果,锁死人类的基础物理研究,将人类科技禁锢在一个较低的水平上。
“超大粒子对撞机之争”从两位局外人——美国数学家丘成桐和哈佛大学物理学博士王孟源的论战开始,历时3个月。还惊动了诺贝尔物理学奖得主杨振宁和中国科学院高能物理研究所所长王贻芳。
面对中国要不要建造超大型粒子对撞机的争论,反对者指出,建造对撞机需耗资数千亿美元,电能消耗堪比一座大城市,但收获的结果却极为不确定,可能沦为一台物理学者的“大玩具”——美国搁置了类似计划,欧洲大型强子对撞机[3]成果寥寥。所以中国为什么要开建?
支持者则认为,研究上帝粒子“希格斯玻色子”[4]非常重要,这将解开“宇宙如何诞生”的天问。美国和欧洲的放弃和无为正好为中国提供了机会窗口。作为崛起中的大国,中国理应承担理论物理前沿研究的责任。
最终,这场争论以超大粒子对撞机未获得“十三五”规划审批而暂告段落。
新中国成立半个多世纪以来,从不缺乏大计划。从改革开放初期的“863计划”中第一次提到“智能计算机”一词至今,中国科学家用40年的时间逐渐追赶上先进国家的步伐。鲜有人知的是,在没有超级计算机、没有大数据的年代,中国人工智能是从大学实验室录制音库起步的。正是前辈科学家的坚持,中国经济实力与科技实力的与日俱增,互联网企业才能在风调雨顺的中华大地上迅猛成长,集涓成流,浩然成势。
此时,百度建立于中美两国的人工智能研究室里,超过1300名不同族裔和国籍的研究人员正夜以继日地对数百个相关项目进行处理。他们的成果都将汇入百度大脑。这些研发者就像是当年“曼哈顿计划”中的1000多位科学家,像是今天欧洲核子研究中心的3000多位科研人员,他们做着超前于时代、暂不为人理解的工作。改进算法、建模升级和分析处理,百度大脑的研究人员正如粒子加速器中飞奔的粒子一样,酝酿着一场智能革命。
中国大脑计划不同于超大型粒子对撞机。后者占地巨大、能耗惊人(欧洲的粒子对撞机运行需要1200万千瓦电力),开发中国大脑却是一项自下而上、水到渠成的工程,国家无须豁出血本,需要的仅是方向与决心。
“规模经济”是中国产业成功的基本因素。在我们这个拥有超过13亿人口,7亿网民和数以千万计工程师、科学家的大国,海量的数据、充沛的人才、丰富的企业案例、各种各样的应用场景像流水一样奔腾。如果不能物尽其用,错过这一波智能浪潮,而将科技制高点乃至国家安全拱手相让,才是真正的“浪费”。正如互联网海量数据催生了Hadoop(由Apache基金会所开发的分布式系统基础架构)、Spark(加州大学伯克利分校的AMP实验室所开源的类Hadoop Map Reduce的通用并行框架)等流数据处理技术一样,人工智能已经在中国各地分散发展,犹如一个个神经节点,以其脑波促进中国大脑的到来,这是时代的召唤。
中国大脑,中国气派
斯坦福人工智能实验室负责人、全球著名图像识别数据库ImageNet创始人李飞飞这样描述:“从科学到科技再到产品,就像一个4×100的接力赛,每一棒都有它特别的功能,学术界应该算是这个4×100接力赛的第一棒,工业界和实验室是第二棒,产业化、投资是第三棒、第四棒。”
为了这最关键也最刺激的最后两棒,2013年1月,欧盟曾宣布投入10亿欧元,旨在用巨型神经网络计算机模拟整个人类大脑。2016年10月初,美国连发《国家人工智能研究与发展策略规划》和《为未来人工智能做好准备》两份报告,制定人工智能研究与发展策略规划。这一年,中国官方的报告中也频频涉及人工智能。2016年5月,国家发改委、科技部、工信部、中央网信办联合发布《“互联网+”人工智能三年行动实施方案》。2016年8月,国务院《“十三五”国家科技创新规划》发布,人工智能再次成为核心看点。
人工智能是普世的吗?当然。这是目标,但这种普世注定不是某个单一国家能给予的,人工智能的发展必然像生物进化一样充满多元竞争和地方特色。值得玩味的是,美国科技巨头在人工智能赛道上竞逐时,却意外地在中国遭遇水土不服。
2016年末,IBM的医疗机器人Watson落地山东。这个在美国大获成功的机器人,一来到中国“打工”就被语言绊住了。IBM在汉语素材上欠缺积累,让这次合作从一开始就出现了裂痕。Watson这位“技术大神”能够听懂世界上多种语言,却对上海话、广东话、闽南语无能为力。
这不是一个孤例,由东西方生活、思维、文化差异造成的隔阂,历史上从不罕见。
同样是搜索,中外网友的关注点全然不同。在2015年谷歌人物热搜榜上,排名第一的是NBA球星拉玛尔·奥多姆(Lamar Odom),第二名是女子格斗家隆达·罗西(Ronda Rousey),第三名是美国电视节目名人凯特琳·詹纳(Caitlyn Jenner)。这几个人物恐怕只会出现在极少数中国人的搜索框中。而在2015年百度人物热搜榜上,排名靠前的是金星、王思聪,顿时“接地气”许多。
在硬币的另一面,微软聊天机器人TAY在推特上玩耍了24小时,就学会满口脏话、种族歧视、性别歧视,这倒是非常的“美国特色”。
显然,在多元化的网络世界里,没有任何一个国家、机构能“独当一面”。只有不同文化、经济、政治背景的基因进行竞争,才能对网民的需求做出全面恰当的回应。
从国情来看,中国发展人工智能较欧美国家有着更强烈的内在驱动,这种驱动来自民间。百度搜索统计显示,有关“服务”的搜索请求数量始终在迅速增长:2014年比2013年增长了133%。2016年在基数更大的情况下,仍有153%的增长。
在移动互联网领域的应用上,中国比美国更普及。中国网民早已习惯于诉诸互联网寻求服务。如今中国每100张电影票中就有55张是通过网络下单预订的。与之对应的是,互联网服务在美国电影行业的渗透率只有20%,也就是说100张电影票中只有20张是网上订票。比如,中国餐饮行业的互联网渗透率是2%时,美国只有1%。
中国之大,之特殊,要高效实现中国网民的服务需求,人工智能创新就是一条必由之路。
驱动的另一个源头则是产业焦虑。中国制造业成本上升很快。放眼全球,工业越来越自动化和智能化,高端制造业可能会回到欧美,而低端制造业已开始流向越南等国。如果不在短时间内完成产业转型,中国制造业将面临“空心化”的困境:高端制造业、低端制造业都将流出中国——这个转型,能不依赖人工智能这一环吗?
尽管局势紧迫,但中国的实力值得看好。中国企业的执行力、中国政府的支持力度都是新兴产业的强力后援。
如果说网民的需求是“天时”,企业与政府的合作是“人和”,数据则是中国大脑发展必不可少的“地利”。在这一领域,中国更是得天独厚。
庞大的人口规模、复杂的社会环境和面向不同应用场景的互联网企业,汇合收集这个数据全集意义非凡。可以预见,不久的未来除了个人数据,依托于公共环境或者政府背景而产生和积累的数据,如汽车注册信息、学籍学历、犯罪记录等,将以加密的方式形成个人基础电子档案。企业与市场通过服务输出获取的数据,如信用卡账单、消费记录、网站浏览偏好、惯用手机品牌等,则将以用户授权的方式再次转化为服务回馈给使用者。
这里的“使用者”,不是会编码、能建模的“码农”博士,而是普通的公众群体。让更多的人也能便捷地使用智能设备才是真正意义上的科技福利。
当年,美国“阿波罗登月计划”带动大批企业成长创新,美国军方用于“冷战”对抗的ARPAnet(美国国防部高级研究计划局组建的计算机网)衍生出了互联网。中国大脑这个充满想象力的超级工程对中国经济的贡献,也远不止是涌现一批明星科技企业和科技成果,而是将切实为整个经济和社会的转型提供服务和动力。
2017年,百度获批筹建深度学习技术及应用国家工程实验室,由百度研究院院长林元庆、百度深度学习实验室杰出科学家徐伟,清华大学的张钹院士和北京航空航天大学的李未院士组成团队班子。百度将与清华大学、北京航空航天大学、中国信息通信研究院、中国电子技术标准化研究院等共建单位一起,将企业优势资源整合,建设“国内领先、世界一流”的深度学习技术及应用研究机构,从研究突破、产业合作、技术成果转让、人才培养等方面提升我国人工智能领域整体竞争力。
这将是创世纪的超级工程的开篇。
人文主义画家米开朗基罗完成了雄伟的壁画《创世纪》,其中有这样一幕:上帝之手触碰亚当指间的那一瞬,智慧的启蒙就此产生。这幅壁画中上帝的袍服宽大张扬,最近几十年,有人指出上帝袍服的形状其实是一个人类大脑的解剖图。在这幅壁画里,米开朗基罗悄悄藏进了启蒙的密码——上帝就在人类自己的大脑中,是人类自己启蒙了自己!
图4-4 《创世纪》局部图像
资料来源:http://baike.baidu.com/link?url=SyJFcW1lS-vbxAhPwGKX9xdyJ70q YAWrgzeQlQzWWP9-8mf6nTpA2ZjHdvOXtm4TqmWGR97VvSBWZiJ3VNwV61CISw9aC2eH_9ITjpBHq6FR-bmG6lb_LGVCK6J1rpkU
人类在自我劳作、自我启蒙中发展出自我的智慧。如今,深度学习神经网络也在自我运作、自我调试中创造新的“大脑”。这颗巨大的人工智能之脑将成为人类文明新的背景,它正是人类伟大活动的体现,并支持人类文明迈向更高阶段。
[1] 《圣经·旧约·创世记》第11章宣称,当时人类联合起来兴建能通往天堂的高塔;为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间无法沟通,计划因此失败,人类自此各奔东西。此故事试图为世上出现不同语言和种族提供解释。
[2] 2015年4月25日,尼泊尔发生强烈地震,不仅造成8000多人死亡,毁坏了成千上万的住房,还使许多历史建筑变为废墟。百度发起“See you again,加德满都”的行动,呼吁网民上传他们拍摄的历史古迹照片,以便百度利用自己的人工智能成像系统,以数字化方式重建这些文化遗产。活动中,百度共收到上传照片超过42000张,完成八个著名景点的数字重建,其中包括位于加德满都的玛珠庙。
[3] 欧洲大型强子对撞机是现在世界上最大、能量最高的粒子加速器,是一种将质子加速对撞的高能物理设备,英文名称为LHC(Large Hadron Collider)。
[4] 希格斯玻色子是粒子物理学标准模型预言的一种自旋为零的玻色子。物理学家希格斯提出了希格斯机制。在此机制中,希格斯场引起自发对称性破缺,并将质量赋予规范传播子和费米子。希格斯粒子是希格斯场的场量子化激发,它通过自相互作用而获得质量。