阿尔法狗再进化有望突破人类知识限制自主学习

2018-05-16

字体:

大中小

浏览:

文章简介：10月19日消息,谷歌旗下人工智能研究部门DeepMind发布了新版AlphaGo(阿尔法狗)软件,它可以完全靠自己学习围棋.这款名为AlphaGo Zero的系统可以通过自我对弈进行学习,它利用了一种名为强化学习的技术.在不断训练的过程中,这套系统开始靠自己的能力学会围棋中的一些高级概念.经过3天的训练后,这套系统已经可以击败AlphaGo Lee,也就是去年击败韩国顶尖棋手李世石的那套系统,而且比分高达100比0.经过40天训练后,它总计运行了大约2900万次自我对弈,使得AlphaGo Z

10月19日消息，谷歌旗下人工智能研究部门DeepMind发布了新版AlphaGo（阿尔法狗）软件，它可以完全靠自己学习围棋。这款名为AlphaGo Zero的系统可以通过自我对弈进行学习，它利用了一种名为强化学习的技术。在不断训练的过程中，这套系统开始靠自己的能力学会围棋中的一些高级概念。

经过3天的训练后，这套系统已经可以击败AlphaGo Lee，也就是去年击败韩国顶尖棋手李世石的那套系统，而且比分高达100比0。经过40天训练后，它总计运行了大约2900万次自我对弈，使得AlphaGo Zero得以击败AlphaGo Master，比分为89比11。

结果表明，具体到不同技术的效果，人工智能在这一领域仍有很多学习的空间。AlphaGo Master使用了很多与AlphaGo Zero相同的开发技术，但它需要首先利用人类的数据进行训练，随后才切换成自我对弈。

值得注意的是，虽然AlphaGo Zero在几周的训练期间学会了一些关键概念，但该系统学习的方法与人类有所不同。另外，AlphaGo Zero也比前几代系统更加节能，AlphaGo Lee需要使用几台机器和48个谷歌TPU机器学习加速芯片。其上一代AlphaGo Fan则要用到176个GPU芯片。AlphaGo Zero只需要使用一台配有4个TPU的机器即可。

上一篇：凤囚凰第11-12集剧情预告粉黛求阁主再给自己三天时间

下一篇：男子嗑药后如丧尸僵尸毒品让其丧失意识弯腰弓背

免责声明： 本文仅代表作者个人观点，与魔女网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。