alphago的神奇全靠它

关注:74 发布时间:2021-08-27 18:44:07

导语本文整理了alphago的神奇全靠它经验知识,帮助您全面了解,小白也能成为高手,跟随小编一起来看一看吧!

alphago不偏不倚击败围棋李世石,让他名扬天下。随着alphago的日益普及,人们不禁要问,到底是什么让alphago打败了人脑?alphago的核心依靠——人工神经网络。

什么是神经网络?

人工神经网络是模拟生物神经网络(动物的中枢神经系统,尤其是大脑)的结构和功能的数学模型或计算模型。神经网络是由大量的人工神经元计算出来的。在大多数情况下,人工神经网络可以在外部信息的基础上改变内部结构,是一个自适应系统。现代神经网络是一种非线性统计数据建模工具,常用于建模输入输出之间的复杂关系,或者探索数据模式。

神经网络是一种操作模型,由大量相互连接的节点(或“神经元”,或“”)组成。每个节点代表一个特定的输出函数,称为激励函数。每两个节点之间的连接代表通过连接的信号的加权值,称为权重,相当于人工神经网络的记忆。网络的输出根据网络的连接方式、权值和激励函数而变化。网络本身通常是算法或函数的近似,或者是逻辑策略的表达。

例如,用于手写识别的神经网络由一组输入神经元定义,这些输入神经元可以由输入图像的像素激活。经过一个函数(由网络的设计者决定)的加权和变换后,这些神经元被激活,然后转移到其他神经元。重复这个过程,直到比较后一个输出神经元被激活。这决定了要读的字。

它的构造思路是受人类或其他动物的神经网络功能的运作启发。人工神经网络通常是通过一种基于数理统计的学习方法来优化的,所以人工神经网络也是数理统计的一种实际应用。通过标准的数理统计方法,我们可以得到大量可以用函数表示的局部结构空间。另一方面,在人工智能的人工感知领域,通过数理统计的应用,可以做人工感知的决策问题(也就是说通过统计的方法,人工神经网络可以像人一样具有简单的决策能力和简单的判断能力),这种方法比形式逻辑推理演算更有优势。

人工神经网络是一个可以学习和总结的系统,也就是说它可以通过已知数据的实验应用来学习和总结。通过比较局部情况(而这些比较是基于不同情况下的自动学习和待解决问题的复杂性),人工神经网络可以推断并产生一个可以自动识别的系统。基于符号系统的学习方法不同,它们也有推理功能,但它们是基于逻辑算法的,也就是说,它们之所以能推理,是因为它们需要一套推理算法规则。

2二进制的原理可以追溯到顶部

alphago的原理

首先,alphago和玩家玩了15万个游戏,通过人工神经网络找到了这些游戏的模式。然后通过总结,就可以大概率的预测出玩家在位置都能表现出来的所有可能性。alphago的设计师通过反复对抗自己的早期版本来完善神经网络,让自己逐渐提高获胜几率。

广义而言,神经网络是一个非常复杂的数学模型,它的行为可以通过调整其数百万个参数来改变。神经网络学习是指计算机不断对其参数进行微小的调整,试图进行持续的微小改进。在学习的第一阶段,神经网络提高了模仿玩家下棋的概率。第二阶段,增加自我发挥和赢得比赛的概率。反复对极其复杂的功能做微小的调整听起来很疯狂,但是如果有足够的时间和快速的计算能力,实现一个非常好的网络并不难。这些调整是自动进行的。

经过这两个阶段的训练,神经网络可以很好的和围棋业余爱好者进行博弈。但是对于职业来说,还有很长的路要走。从某种意义上说,它不考虑每一手牌之后的招式,而是通过计算未来的结果来决定去向。为了达到专业水平,alphagp需要一种新的估算方法。

为了克服这个障碍,研究人员采用了让它反复与自己战斗的方法,以保持它估计胜利的能力。尽量提高每一步的胜算。(实际上alphago对这个想法做了稍微复杂的调整。然后alphago结合多线程使用这种方法下棋。

我们可以看到alphago的评价体系并不是基于对go的太多了解。通过分析无数游戏和无数自我格斗练习的现有分数,alphago的神经网络做了数十亿次微小的调整,哪怕每次都只是很小的增量提升。这些调整帮助alphagp建立了一套评价体系,类似于围棋手的直觉,对棋盘上的每一步棋了如指掌。

此外,alphago还采用了搜索和优化的思想,再加上神经网络的学习功能,两者都有助于在棋盘上找到更好的位置。这也是alphago目前能打出高水平的原因。

3神经网络的延伸和局限回到了顶端

神经网络的扩展与局限

神经网络的这种能力也可以用在其他方面,比如让神经网络学习一种艺术风格,然后将这种风格应用到其他图像上。这个思路很简单:首先让神经网络接触大量的图像,然后确定这些图像的风格,再将新的图像带入这个风格。

虽然这不是一门伟大的艺术,但它仍然是一个利用神经网络捕捉直觉并将其应用于其他地方的显著例子。

在过去的几年里,神经网络在许多领域被用来捕捉直觉和模式识别。许多项目使用神经网络,包括识别艺术风格或开发好的视频游戏策略等任务。但是网络模拟也有非常不同的直观例子,比如语音和自然语言。

因为这种多样性,我看到alphago本身并不是革命性的突破,而是作为一个极其重要的发展前沿:构建系统,捕捉直觉,学习识别模式的能力。计算机科学家之前已经做了几十年了,并没有取得很大的进展。但是现在,神经网络的成功已经大大扩展,我们可以利用计算机攻击范围内的潜在问题。

事实上,现有神经网络的理解能力很差。神经网络很容易上当。神经网络是一种很好的图像识别方法。但是实验表明,图像稍有变化就能被忽悠。例如,以下图像左侧的图像是原始图像。研究人员对中间的图像做了微小的调整后,神经网络无法区分,就显示了原始图像。

另一个限制是现有系统往往需要很多模型来学习。比如alphago从15万次战斗中学习。这是一笔巨款!在很多情况下,显然不可能提供这么庞大的模型案例。

猜你喜欢

热门互联网经验

360微商频道查询入口