“阿尔法狗”的厉害之处,在于能够自己快速学习。
机器分成两大类,一类是,人类研究出一些方法和学问,教给机器,机器也能学会做;另一类是,把原始素材丢给机器,机器自己琢磨琢磨,自己找出了对的方法。前者是师傅说先放油、再放肉、最后放菜,徒弟跟着学,一盘菜就炒好了;后者是师傅丢给徒弟一堆材料,徒弟自己试来试去,最后自己发明了更好吃的菜。
以前的计算机多半是前者,以“阿尔法狗”为代表的新一代人工智能基本上能实现后者。
如果只是跟着师傅做学徒,只学到师傅的招数,即便手脚麻利办事勤快,也不足为惧;而如果自己琢磨功夫,琢磨出来的功夫比师傅还厉害,发明了师傅都看不懂的招数,那岂非让人大大惊惧?
“阿尔法狗”就是这样的。人们并没有教它下棋的套路,只是丢给它以前的棋谱,让它自己观察,观察好了就自己跟自己对弈,最后再出来和高手过招。最终的结果就是它会下棋了,下的棋路与人类高手都不同,但人类下不过它。就好比把一个人丢在荒山野岭,无人问津,出山的时候却成了绝世高手。
你说这可怕吗?
听起来有点儿可怕。不过这种学习能力还能做别的吗?如果只能下围棋,那也不足为惧。
答案是,完全可以。这恰恰是关键所在。这一轮人工智能热潮之所以引起那么多人追逐,就是因为人们发现“阿尔法狗”所仰赖的学习算法,还能做很多很多别的事情。
下围棋只是一个典型的例子,用同样的算法,稍加改造,就能学会金融投资、看合同、销售策略、写新闻。还有很多别的事情。在短短几年里,就已经有各个行业领域的人工智能诞生出来。
什么?这是什么算法,有这样的魔力?
“阿尔法狗”究竟是如何做到自我学习的呢?
实际上机器学习并不是非常新的概念,从几十年前,人类就试图让机器自己学习事情,但受限于算法和当时的计算速度,机器学习的步子一直都不快。
“阿尔法狗”的算法叫“深度学习”,它的前身是“神经网络学习”,也是几十年前就诞生的算法,当时流行过一段时间,后来被一篇著名的论文打消了热度,再加之学习效果不算好,于是遭受冷遇几十年。在与“阿尔法狗”的创始人相遇之前,“神经网络”并不是众望所归。
“神经网络”是什么算法?“深度学习”又是怎样将其点石成金的?
“神经网络”是一种“民主投票”算法,效仿大脑的神经网络建成。大脑的神经网络是这样工作的:一个神经细胞接收很多个神经细胞的信号输入,一个刺激信号相当于赞成票,一个抑制信号相当于反对票,如果某个细胞收到的赞成票和反对票合起来大于某一个门槛,就算是通过了,会有一个信号发出去到下一个神经细胞。一路赞成的刺激信号就这样一程程传递下去。神经网络算法是数字版脑神经网,用数字连接形成网,而其中的投票机制和大脑相似。它可以让信号在整个学习网络里传播,比单路信号分析复杂很多,也智能很多。
“深度学习”是什么呢?“深度学习”是“深度多层神经网络学习”的简称。深度是指层次多,一层套一层的神经网络,构成整个算法的深度。层与层之间的关系,大致是这样:每层神经网络分析的精细程度不同,底层分析细节,上层做出判断。将一个整体任务分解成无数细节,给一个输入,底层神经网络会分析基础细节,然后将分析结果传给上一层网络,上一层网络综合之后再将结果传给更上一层的网络,而顶层网络综合层层传来的结果,做出判断。例如,想读出一个字,底层网络会判断字里有没有横竖撇捺,上一层网络会判断字里有没有直角,再上一层网络判断是不是由左右两部分拼成一个字,诸如此类,最上层的网络根据层层结果认出这个字。这种多层判别本身是效仿真实人类的大脑,人类大脑就是由一层层神经网络组成,每一层网络识别信号,再将处理结果传递到上一层。人类皮层大脑的神经网络层次大约有六层。“深度学习”网络可以有上百层。
换句话说,“深度学习”就是把从前的“神经网络”重叠了多层。
就是这样吗?仅仅把“神经网络”叠了多层,就从受人冷遇的小人物变成了江湖明星?故事有这么鸡汤吗?
当然不是这么简单。“深度学习”这次能焕发生机,也是生逢其时,有两阵不可忽略的东风送其上青云。
一阵东风是算力增强。计算机芯片的速度呈指数级增长,价格一路下跌,由游戏应用发展壮大的GPU(图形处理器)大大补充了从前CPU(中央处理器)引擎的计算能力,让人工智能计算更强大。“阿尔法狗”战胜李世石的时候启用了1920个CPU和280个GPU阵列运算,一秒就能自我对弈数百盘。
另一阵东风是大数据。事实上,这可能是这一轮人工智能热潮最重要的推动因素。人们赫然发现,原来不是算法的问题,而是以前用来训练的数据还远远不够多。这就好比让徒弟自学武功,却不给他足够多的对战机会。有了大数据,算法呈现的结果出现了惊人的进步,让人目瞪口呆。
于是,在算力和大数据的辅佐之下,升了级的“深度学习”算法如虎添翼,能够从海量数据中找到高超的战术规律,以人类无法看懂的方式战胜人类。
就是大数据辅助的“深度学习”,成为这一轮人工智能热的关键。
人们把很多很多大数据扔给机器,用多层神经网络进行“深度学习”,结果发现,机器在很多领域能力有了突飞猛进的提高。图像识别的正确率赶上了正常人,语音识别也过关了,把科学文献作为数据,短时间就能学习几十万份最新文献。金融、电力、能源、零售、法律,“深度学习”都能从大数据中学到优化的行为做法。人工智能的应用,能让这些领域变得高效、便捷、自动化。除了“深度学习”,也还有其他算法,包括后面要提到的决策树、贝叶斯等算法,各种算法的综合使用效果是最佳的。各种算法共同构成机器学习大家庭。
除了深度学习,“阿尔法狗”另一重武器叫作“强化学习”。“强化学习”是什么呢?简单点说,就是“无序尝试,定向鼓励”,就好比小朋友在屋里随机行动,走到数学教具旁边父母就说“好棒好棒”,后来小朋友就特别喜欢走到数学教具旁边(当然,这纯属假想的场景)。这种思维一点都不奇怪,在心理学中很早就已经应用到教学中,对大多数教学场景都有效果,尤其对一些发展迟缓的孩子做教学干预(但也有心理问题)。