文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。





数智物语(公众号ID:decision_engine)出品

策划、编写:卷毛雅各布


数智物语本期推荐书目为《深度学习:智能时代的核心驱动力量》,作者为特伦斯·谢诺夫斯基,该书在国内已经由中信出版社出版发行。


image.png


01
作者介绍


作者特伦斯·谢诺夫斯基是世界十大AI科学家之一,美国四大国家学院在世仅3位的“四院院士”之一,全球人工智能顶级会议NIPS基金会主席。


微信图片_20190221140012.png


作为神经网络的先驱,早在1986年,特伦斯就与深度学习之父杰弗里·辛顿共同发明了玻尔兹曼机,把神经网络带入到研究与应用的热潮,将深度学习从边缘课题变成了互联网科技公司仰赖的核心技术。


1989年,特伦斯加入美国索尔克生物研究所,与DNA双螺旋结构的发现者之一弗朗西斯·克里克作为同事,共同研究神经网络科学。


2013 年,白宫宣布启动美国“BRAIN 计划”,开发创新的神经技术,以加速对大脑功能的理解。该计划能够帮助找到在未来治疗精神分裂症和阿尔兹海默症等衰弱性脑部疾病的方法,美国政府已经为“BRAIN 计划”注资50亿美元。特伦斯作为参与该计划研究的领军人物,为该计划的推动提供了非常多的研究和建议。


02
作者观点


美国科技媒体《The Verge》曾采访过特伦斯·谢诺夫斯基,与他讨论了“人工智能”“神经网络”“深度学习”“机器学习”究竟有何区别?为何“深度学习”突然变得无处不在,它能做什么?不能做什么?

以下是采访全文:


Q1:首先,我想问一下定义。


人们几乎可以互换地使用“人工智能”,“神经网络”,“深度学习”和“机器学习”等词语。但这些是不同的东西。你能解释一下吗?


答:人工智能可以追溯到1956年的美国,那时工程师们决定编写一个试图仿效智能的计算机程序。


在人工智能中,一个新领域成长起来,称为机器学习。不是编写一个按部就班的程序来做某事——这是人工智能中的传统方法——而是你收集了大量关于你试图理解的事物的数据。


例如,设想您正在尝试识别对象,因此您可以收集大量它们的图像。然后,通过机器学习,这是一个可以剖析各种特征的自动化过程,就可以确定一个物体是汽车,而另一个是订书机。


机器学习是一个非常大的领域,其历史可以追溯到更久远的时期。最初,人们称之为“模式识别”。后来算法在数学上变得更加广泛和复杂。


在机器学习中有受大脑启发的神经网络,然后是深度学习。深度学习算法具有特定的体系结构,其中有许多层数据流经的网络。


基本上,深度学习是机器学习的一部分,机器学习是人工智能的一部分。


人工智能1.gif


Q2: 有什么“深度学习”能做而其他程序不能做的吗?


答:编写程序非常耗费人力。在过去,计算机是如此之慢,内存非常昂贵,以至于人们采用逻辑,也就是计算机的工作原理,来编写程序。他们通过基础机器语言来操纵信息。计算机太慢了,计算太贵了。


但现在,计算力越来越便宜,劳动力也越来越昂贵。而且计算力变得如此便宜,以至于慢慢地,让计算机学习会比让人类编写程序更有效。在那时,深度学习会开始解决以前没有人编写过程序的问题,比如在计算机视觉和翻译等领域。


机器学习是计算密集型的,但你只需编写一个程序,通过给它不同的数据集,你可以解决不同的问题。并且你不需要是领域专家。因此,对于存在大量数据的任何事物,都有对应的大量应用程序。


Q3:“深度学习”现在似乎无处不在。它是如何变得如此主导潮流?


答:我可以在历史上精确地找到这一特定时刻:2012年12月在NIPS会议(这是最大的AI会议)上。


在那里,计算机科学家Geoff Hinton和他的两个研究生表明你可以使用一个名为ImageNet的非常大的数据集,包含10,000个类别和1000万个图像,并使用深度学习将分类错误减少20%。


通常,在该数据集上,错误在一年内减少不到1%。在一年内,20年的研究被跨越了。


这真的打开了潮水的闸门。


深度学习1.gif


Q4:深度学习的灵感来自大脑。那么计算机科学和神经科学这些领域如何协同工作呢?


答:深度学习的灵感来自神经科学。最成功的深度学习网络是由YannLeCun开发的卷积神经网络(CNN)。


如果你看一下CNN的架构,它不仅仅是很多单元,它们以一种基本上镜像大脑的方式连接起来。大脑中被研究的最好的一部分在视觉系统,在对视觉皮层的基础研究工作中,表明那里存在简单和复杂细胞。如果你看一下CNN架构,会发现有简单细胞和复杂细胞的等价物,这直接来自我们对视觉系统的理解。


Yann没有盲目地试图复制皮质。他尝试了许多不同的变种,但他最终收敛到的方式和那些自然收敛到的方式相同。这是一个重要的观察。自然与人工智能的趋同可以教给我们很多东西,而且还有更多的东西要去探索。


Q5:我们对计算机科学的理解有多少取决于我们对大脑的理解程度?


答:我们现在的大部分AI都是基于我们对大脑在60年代的了解。我们现在知道的更多,并且更多的知识被融入到架构中。


AlphaGo,这个击败围棋冠军的程序不仅包括皮质模型,还包括大脑的一部分被称为“基底神经节”的模型,这对于制定一系列决策来实现目标非常重要。有一种称为时间差分的算法,由Richard Sutton在80年×××发,当与深度学习相结合时,能够进行人类以前从未见过的非常复杂的玩法。


当我们了解大脑的结构,并且当我们开始了解如何将它们集成到人工系统中时,它将提供越来越多的功能,超越我们现在所拥有的。


Q6:人工智能也会影响神经科学吗?


答:它们是并行的工作。创新神经技术已经取得了巨大的进步,从一次记录一个神经元到同时记录数千个神经元,并且同时涉及大脑的许多部分,这完全开辟了一个全新的世界。


我说人工智能与人类智能之间存在着一种趋同。随着我们越来越多地了解大脑如何工作,这些认识将反映到AI中。


但与此同时,他们实际上创造了一整套学习理论,可用于理解大脑,让我们分析成千上万的神经元以及他们的活动是如何产生的。所以神经科学和人工智能之间存在这种反馈循环,我认为这更令人兴奋和重要。


神经科学3-1.jpg


Q7:你的书讨论了许多不同的深度学习应用,从自动驾驶汽车到金融交易。你觉得哪个特定领域最有趣?


答:我完全被震撼到的一个应用是生成对抗网络,或称GANS。使用传统的神经网络,你给出一个输入,你得到一个输出。 GAN能够在没有输入的情况下开展活动 - 产生输出。


是的,我在这些网络创建假视频的故事背景下听说过这个。他们真的会产生看似真实的新事物,对吧?


从某种意义上说,它们会产生内部活动。事实证明这是大脑运作的方式。你可以看某处并看到一些东西,然后你可以闭上眼睛,你可以开始想象出那里没有的东西。


你有一个视觉想象,当周围安静时,你闹钟声会浮现想法。那是因为你的大脑是生成性的。


现在,这种新型网络可以生成从未存在过的新模式。所以你可以给它,例如,数百张汽车图像,它会创建一个内部结构,可以生成从未存在的汽车的新图像,并且它们看起来完全像汽车。


03
书内观点


特伦斯·谢诺夫斯基在《深度学习:智能时代的核心驱动力量》这本新书中,以亲历者视角,前瞻性的提出了未来人工智能发展的8大重要预判:


观点1,人工智能不会导致失业,只会让你更聪明。


你无须担心人工智能将接管你的工作。


人工智能会让你更聪明,让你有能力实现的成就达到新的高度。


就像工业革命时期蒸汽机放大了物理能力一样,人工智能也会放大认知能力。


我们正迎来一个新的时代——信息时代。


我们进入的新世界不仅会使我们变得更聪明,还会让我们更清楚地认识自己。


未来,需要人类认知技能的工作将被自动化人工智能系统接管,那些能够创建和维护这些系统的人将会获得新的工作。


观点2,深度学习技术将全面影响未来商业变革,得数据者得天下。


深度学习技术是下一波商业浪潮的主要推动力,将全面影响未来商业变革。


到 2050 年,人工智能会拥有能和我们大脑相媲美的操作系统。


哪些人、哪些公司、哪些国家会掌握这种科技,取决于他们现在所做的投资和下的赌注。


而在机器学习中,谁拥有最多的数据,谁就是赢家,显然Facebook所拥有的关于人们点赞、好友和照片的数据让其他人只能望其项背。


利用所有这些数据,Facebook 可以创建我们的心理理论,并用它来预测我们的偏好和政治倾向,甚至有一天可能会比我们更了解我们自己。


你会觉得这是一个令人不寒而栗的前景,还是发现有一个能满足你需求的数字管家感觉很方便?


我们可能会问,Facebook 是否应该拥有这种权力,但在这个问题上,我们也许并没有多少发言权。


得数据的天下.gif


观点3,再过20年,无人驾驶将全面走入人类生活。


谷歌Waymo无人车于2018年第三季度投放商用,Uber在匹斯堡投放了一批自动驾驶汽车,苹果、百度以及传统汽车厂商也都早已布局自动驾驶领域。


自动驾驶汽车不久就会威胁到卡车司机和出租车司机的生计。


是否拥有汽车已经不重要,汽车产业将面临重大考验。


城市规划同样需要变革,城市内将不再需要那么多停车场。


谢诺夫斯基预计,卡车会在10年内实现自动驾驶,出租车要花上15年,15到25年后,客运无人车将全面走入人们的生活。


无人驾驶1.gif


观点4,你的iphone会比你自己更懂你。


如果去掉头发、首饰和第二性征,你能快速区分男女吗?


通过深度学习,机器可以实现通过细微的面部线索进行区分,如大多数男性的人中面积更大,男性眼睛周围区域较大,女性上颊较大。


通过监控面部44块肌肉的状态,机器能读懂你的情绪。


面部表情识别已经进入商业化,如监测选民的微表情来判断选举走势,研判未来哪部剧将大火。


未来,你的手机将会主动关心你的情绪,不但会问你为什么不高兴,还会帮你高兴起来。


人脸识别.gif


观点5,×××不再可怕,每一个人都将成为AI医疗的受益者。


基于大数据的深度学习将改变医疗行业,对疾病提供更快速、准确的诊断和治疗。


如果某人被诊断出×××,传统疗法(手术、化疗、放疗)手段都失败了,那最有可能的结果就是走到生命尽头。


在未来技术发展的某个阶段,人工智能可以对肿瘤进行基因排序,检测癌细胞变异和扩散状态,通过数据分析匹配适合个人的治疗药物,甚至设计出某一种新药专门针对这个人的×××治疗。


观点6,未来需要以家庭,而非以学校为基础的新教育体系。


传统的学校教育教给孩子太多的信息,太多的既有技能,而技术的发展可能让这些东西很快过时。


未来的人工智能将会改变传统教育现状。


成为终身学习者,才是不被时代淘汰的必备能力。


要做到这一点,我们需要一个以家庭,而不是以学校为基础的新教育体系。


与学校课程“要么太多,要么没有”的学习模式不同,慕课(在线公开课)更像是你随时可以挑选和阅读的书:


学习者们更倾向于“放养式”的学习方法,有针对性地选择符合他们迫切需求的课程。


人工智能时代,你需要的不是担忧和焦虑,而是成为更好的学习者,抓住每一分资源和机会,让自己成为更有价值的人。


观点7,如何证明你的朋友不是AI?


人工智能的发展改变了我们的社交方式,甚至是社交对象。


具有社交属性的人工智能已经成为我们生活中的一部分,比如智能音箱,或者苹果手机智能语音助手Siri和微软开发的小冰。


社交聊天机器人还可以在闲聊中帮助用户执行多种任务。


2014年5月微软发布小冰,之后她成为使用最广泛的社交聊天机器人。


她理解用户的情感需求,进行人际沟通,在对话中鼓励用户、吸引用户参与对话、逗用户开心。


这些对话使用户的情绪变得更加积极,为用户提供情感支持和社交归属感。


仿生人工智能.gif


观点8,跨文化交流将不再有障碍。


深度学习让语音识别和语言翻译融合在一起,涉及多种语言的跨国甚至跨文化交流将不再是问题。


早在1946年第一台计算机发明之初,就有科学家提出利用计算机自动进行语言翻译的设想。


经历70多年的发展,机器翻译先后涌现出多种方法。


近几年,随着深度学习技术被应用到翻译领域,翻译质量大幅跃升,百度、谷歌、微软等巨头公司相继发布了一系列基于最新人工智能技术的翻译系统和产品。


当语音识别和语言翻译结合到一起时,实时的跨文化交流将有可能实现。


《星际迷航》中那种万能翻译机将×××。


参考文献

(1)《5分钟读懂「深度学习」:智能时代背后的神秘力量》,中信出版集团公众号,2019年1月23日

(2)“AI奠基人”特伦斯新书《深度学习》解析智能时代的核心驱动力量,新华网,2019年01月18日

(3)《9102年了,该懂点深度学习通识了》,笔记侠公众号,2019年1月23日