今天,我们来聊聊「深度学习」。
深度学习是当前人工智能领域机器学习最热门的方法,最近这几年的发展可以说是日新月异。在讲这个主题的时候啊,我有一个感慨,我感觉时间过得真快,在你还没从上一次科技突破中缓过神来的时候,新的突破就又一次发生了。
阿尔法狗 3:0 完胜人类围棋冠军柯洁已经是一年多以前的事情了,当时举世惊叹,好多人纷纷感叹,深度学习技术攻下了人类最后的智力高地。然而就在不久前,曾经打遍天下无敌手的阿尔法狗,竟然输给了它的「弟弟」——阿尔法元,而且是 100:0,下一百局,阿尔法狗一局都没赢过。昔日的奇迹,成了今天的反面教材。
现在网上流传着一个段子,说有两个小孩,都是天才。
哥哥读遍天下秘籍,总共三千多万册,花了几个月的时间修炼,从此打遍天下无敌手。他的弟弟只靠白手起家,没看过一招一式,也没有一个人指点,从零开始,全凭自己参悟,用了三天,就把他哥哥给打败了。有点像《天龙八部》里学尽天下武学的慕容复,最后被半路出家的虚竹给打败了。然后虚竹念一句法号:「菩提本无树,明镜亦非台,本来无一物,何处惹尘埃。——我这才是真正的智能。」
其实这个段子不只是搞笑,它里面确实说出了深度学习领域的新的突破。
去年,阿法尔狗首次战胜了人类的围棋世界冠军,但其棋艺的精进,是用三千多万局人类的历史棋局,进行训练,最后才超越了人类。也就是说,这是一个青出于蓝而胜于蓝的故事。当时就有人说了,阿尔法狗再牛,不还是要人教它吗?没有我们的经验,它压根就学不会下棋。
结果没想到啊,仅仅一年的时间,科技的发展出乎了所有人的意料。阿尔法元的出现,不仅证明了「人类不教我也能学会」,还证明了,没有你们经验的误导,我能学得更好。
就像那句禅语里说的:「本来无一物,何处惹尘埃。」阿尔法元不需要任何人类的旧有经验,一盘棋谱也不看,给定了围棋的规则,靠自己左右互搏,三天,搞定一切。这可比阿尔法狗厉害多了,因为它不再被人类认知所局限,而能够发现新知识,发展新策略。
比较阿尔法元的下法和人类的下法,我们发现两者的开局和收官是差不多的,但是中盘差异非常大。主要的差异在于,人类的下棋方式往往都是追求局部最优,换句话说,人更计较一时得失,而阿尔法元的下法则更系统,更有全局观。对于阿尔法元来说,一时一地的损失不是最重要的,最重要的是从总体上规划出一个最优的策略。
阿尔法狗与阿尔法元竞争的输赢背后,是大数据与算法的 PK。之所以阿尔法元能做到从全局入手去思考,因为它不受心态干扰,也不受思维定势的干扰。就像《倚天屠龙记》里的张三丰问张无忌:「都忘了吗?」张无忌说:「忘了。」张三丰说:「忘得好。」
虽然人不是机器,做不到完全的不受心态和思维定势干扰。但这毕竟是一个方向,即使做不到那么极致,也可以让我们的判断更理智,更全面。
所以很有意思的是,深度学习是通过模仿人类的思维方式而发展起来的,但是现在它又能反过来给我们思维的启发。就像前不久上映的电影《银翼杀手 2049》里说的:「比人类更人性。」
刚刚我们讲到的是深度学习给我们的第一个启发:
全面思考,不要过度计较一时得失,而要做到这一点,做判断时就要尽量排除心态和思维定势的干扰。
其实心态和思维都是可以训练的,我下面就和大家分享一个真实的小故事。
我的一个朋友是在证券公司做操盘手的,他们时不时就要做一个训练,在一个模拟的系统里,给你一百万美金,要求你在一个星期内把它输光,如果全输光了,你就赢了,如果没输光或者赚了,你就输了。
看上去这很荒唐,但其实它的背后是有深意的。这种训练的目的就是为了锻炼人的心态,让他们不过多受情绪干扰,并且可以时不时地用另外一种角度看待自己的判断和行为。
深度学习给我们的第二个启发是要分享。
传统的机器学习之所以效率不如深度学习,很大程度上是因为它的每一个组件,也叫「神经元」,都是各自学习的。而在深度学习中,从数据中学到的经验可以共享,从而可以提高学习的效率。
在我们的生活中也是这样,把经验和理解互相分享,而不是各自孤军奋战,思考和学习的效率就会提高很多。
而深度学习给我们的第三个启发是反馈,对我们人来说,就是反思。我认为这一点特别关键。
深度学习这个词是 2006 年才被提出来的,但与之相类似的原理其实并不新,上个世纪七八十年代的时候,它就兴起过一段时间,只不过那时候人们管它叫神经网络。
当时兴起的时候,人们觉得这种技术很有前途,但是不久之后就发现它有一个严重的缺陷,那就是它不能直接自己进行学习和优化,所有的内容都需要人做大量的加工之后再教给它,算法才能理解。很大程度上是因为这个原因,当时一度很火的技术渐渐地无人问津了。
深度学习如今再度兴起,恰恰是解决了这个问题,人们发现用之前的方式不能好好学习的原因在于,输出的结果不能得到反馈,于是就不能通过这些反馈更好地修正自己。正是因为这样,就导致了它必须不断地由人来灌输。解决了这个问题,很多问题也就迎刃而解。
其实对于我们来说也是一样的道理:
在学习的时候,我们会经过四个阶段,
第一个阶段是获取信息和死记硬背的能力,这就像是计算机收集数据、与储存数据的能力,;
第二个阶段是消化和理解,知其然还要知其所以然,这就像是计算机处理数据,给出结果;
第三个阶段是反思和总结,如司马迁所说:「以人为镜,可以明得失,以史为镜,可以知兴替。」对过去的结果反思并从中学习是非常重要的,只有这样,我们才能不断进步,而不只是依赖于别人的灌输。对于计算机来说,这是深度学习技术的新突破,可以从自己产生的结果中学习,并不断进步;
第四个阶段是逻辑推演,可以掌握更抽象的底层规律,这样学到的知识才可以很好的迁移。而如何把学过的东西「迁移」到其他问题上去,也是当前深度学习中最热门的话题之一。
传统的死记硬背式的学习,往往只是停留在获取信息的阶段。并不是说死记硬背没有意义,但是光死记硬背不能消化,就无法获得任何技能。何况在这个层面上,人相比于计算机而言是毫无优势的。只停留在获取信息的层面上,就像老式的计算机一样,任何一点「进步」都需要外界的不断灌输。缺乏理解,没有反思,更谈不上迁移,这样的学习方式是毫无意义的。
我们可以这么看第二、三、四个阶段的意义,比如第二个阶段的消化理解可以让我们获得一个运用场景下的技能,那么第三个阶段的反思和总结,就可以让我们变成拥有运用于十个场景的技能包了,那么融汇贯通,变成对规律的底层理解,就是成百上千个技能包。从这个意义上说,慢就是快,也是为什么说深读一本书,抵得上走马观花的读十本书了。
深度学习的技术突破给我们的思维启示在于,必须要从结果中学习,不断反思,并把知识从旧问题迁移到新问题上去,只有这样才能不断优化自己的思维,在学习中实现真正的进步!
我们的节目也是抱着这样的目的,比起把知识和概念一股脑地灌输出去,我们更看重通过故事和线索进行启发,因为我们深信,只有自己思考出来的知识,才是最有价值的知识。当然,这是一个很难的目标,如果我们有做的不够好的,还希望大家多多批评指正,我们也会持续优化。
好了,言归正传,刚刚我和大家分享了深度学习对我们思维方式的启发。下面我们还要再谈一谈深度学习可能对我们生活造成的影响。
前段时间,BBC 基于剑桥大学的研究发布了一部纪录片,预测了各种职业在未来被替代掉的可能性。根据该研究的观点,像电话接线员、销售员、客服这类职业被代替的可能性高达 90% 以上,有些甚至高达 99%。就连摄影师这类职业都有 50% 的可能性被代替掉。
像金融这类传统意义上的金领职业,在未来反而是最容易被替代掉的职业之一。这种趋势甚至现在就开始了,通过人工智能技术,现在金融交易的速度已经进展到毫秒级,为了提高交易速度,纽交所甚至特意修建了跨太平洋的光缆,因为担心使用卫星的话,交易指令要发到卫星再发回地球,期间的传播距离太长。在这样高速的竞争里,人类与人工智能系统相比实在是缺乏竞争力。
那么很多人可能会觉得好奇了,什么类型的工作是最难被替代的呢?说出来大家可能会觉得惊讶——根据研究,BBC 预测:公关是最难以被替代的职业。这是一个需要高度的社交能力和情感互动能力的职业。而其它排在前几名的不容易被替代的职业还包括法官、律师、心理医生、保姆以及记者等。
表面上看起来这些职业好像没什么关系,但如果你仔细思考一下就会发现,它们都十分强调人的情感能力,从情感理解到情感互动,再到情与法之间的权衡,这些能力是最难被深度学习所替代掉的。BBC 预言道,从某种意义上来说,这种情感的能力将成为未来人类在工作中的核心竞争力。
除了情感之外,人类的优势还在于发现错误的能力。研究表明,在未来,作者被人工智能代替掉的概率要比编辑高 20 个百分点。这是因为随着人工智能和深度学习的发展,写出好的文章将不再是一件难事,但是确定哪些表达不得体,这种能力对机器来说则要困难得多。深度学习可以学会什么是该说的,但很难学会什么是不该说的。而与之相比,人类则更擅长发现错误,因此一些容易造成重大社会影响的职业很可能还是会需要人类来做最后的把关。
正如马云所说,30 年后大多数工作都将被替代,而如何使自己的未来变得不可替代,是我们每一个人都要认真思考的问题。
最后,我们来总结一下今天的重点:
第一. 深度学习给我们的启示是:全局思考,注重分享,注重反思。
第二. 要做到全局思考,就要尽量排除心态和思维定式的影响,不要过度计较一时得失。
第三. 情感能力和避免犯错误的能力是我们应当着重发展的能力,因为它们在未来将会变得越来越不可替代。
最后是今天的福利,今天我要给大家推荐的好书是《白话深度学习》,这本书用一种简明的方式,将深度学习领域的发展历史、重要概念和思维方式讲解的非常清晰,希望对这一突破性的技术成果有更多了解的朋友,这本书一定会让你学有所得!