阿尔法狗为什么厉害 “阿尔法狗”为什么厉害?

2019-02-08
字体:
浏览:
文章简介:为什么对于人工智能而言,围棋的难度这么大?中国自动化协会副理事长.秘书长王飞跃说:"首先,围棋的可能性太多.围棋每一步的可能下法非常多,棋手起手时就有19×19=361种落子选择.一局150回合的围棋可能出现的局面多达10170种.阿尔法狗为什么厉害 "阿尔法狗"为什么厉害?其次,是规律太微妙,在某种程度上落子选择依靠的是经验积累而形成的直觉.此外,在围棋的棋局中,计算机很难分辨当下棋局的优势方和弱势方.因此,围棋挑战被称作人工智能的'阿波罗计划'."既然围棋对于人

为什么对于人工智能而言,围棋的难度这么大?中国自动化协会副理事长、秘书长王飞跃说:“首先,围棋的可能性太多。围棋每一步的可能下法非常多,棋手起手时就有19×19=361种落子选择。一局150回合的围棋可能出现的局面多达10170种。

阿尔法狗为什么厉害 “阿尔法狗”为什么厉害?

其次,是规律太微妙,在某种程度上落子选择依靠的是经验积累而形成的直觉。此外,在围棋的棋局中,计算机很难分辨当下棋局的优势方和弱势方。因此,围棋挑战被称作人工智能的‘阿波罗计划’。”

既然围棋对于人工智能来说这么难攻克,那么对于AlphaGo程序的设计者来说,是否也需要具备很高的围棋水平?

阿尔法狗为什么厉害 “阿尔法狗”为什么厉害?

“这个不需要,设计者们只需要懂得围棋的基本规则即可。AlphaGo背后是一群杰出的计算机科学家,确切地说,是机器学习领域的专家。科学家利用神经网络算法,将棋类专家的比赛记录输入给计算机,并让计算机自己与自己进行比赛,在这个过程中不断学习训练。某种程度上可以这么说,AlphaGo的棋艺不是开发者教给它的,而是‘自学成才’的。”王飞跃说。

阿尔法狗为什么厉害 “阿尔法狗”为什么厉害?

“阿尔法狗”怎样下棋?

用两个神经网络大脑——策略网络和估值网络,像人类棋手一样判断当前局面,推断未来局面

AlphaGo到底是如何下棋的呢?

AlphaGo通过蒙特卡洛树搜索算法和两个深度神经网络合作来完成下棋。在与李世石对阵之前,谷歌首先用人类对弈的近3000万种走法来训练“阿尔法狗”的神经网络,让它学会预测人类专业棋手怎么落子。然后更进一步,让AlphaGo自己跟自己下棋,从而又产生规模庞大的全新的棋谱。谷歌工程师曾宣称AlphaGo每天可以尝试百万量级的走法。

“它们的任务在于合作‘挑选’出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围内。在本质上,这和人类棋手所做的是一样的。”中国科学院自动化研究所博士研究生刘加奇说。