朴廷桓与柯洁围棋决赛 围棋统计学6:柯洁与朴廷桓(中)
在上一期中,从吻合度的角度探讨了柯洁和朴廷桓的异同。从吻合度的角度来分析,柯洁的布局有优势。但是吻合度的高低,并不能说明绝对的棋力高低,而且也是一个全盘性的分析,并不够细致,还需要进一步数据的探讨。
二、统计学数据分析
由于目前AI实力远超于人类,考虑人类每手棋与AI推荐选点之间的胜率差值,可以在一定程度上反应棋手水平的高低。一般来说,水平越低,每手棋相比AI推荐点之间胜率差值就会越大。将平均胜率差异定义为,一局棋中,对局者每手棋与AI推荐首选点之间胜率差值的平均值,并取绝对值。同时,计算该系列数值的方差,以反映该棋手本局每手棋发挥的稳定性。
为了方便理解,举一个简单的例子。
选手A的5手棋,与AI推荐点之间胜率的差值为:-1、-1、-1、-1、-1。则平均胜率差异为1,方差为0。而选手B的5手棋,与AI推荐点之间胜率的差值为:0、0、0、0、-5。则平均胜率差异同样为1,方差则高达5。
做方差-平均胜率差异的散点图,为了方便展示,纵横坐标均做对数处理,并以逆序展示。点越靠近右上角,表明棋局越平稳、完胜/完败倾向更高,越往左下角表明棋局越激烈、错进错出较多。其中蓝色的点为柯洁的对局,红色的点为朴廷桓的对局。
从点的分布来看,柯洁和朴廷桓十分接近。不过,朴廷桓位于右上角的点更多,说明完胜的对局更多一些。而在左下角,柯洁有一个明显的离群样本,龙星战不敌芝野虎丸的对局。
柯洁和朴廷桓两项数据,通过直方图能更好的对比。
两人方差的峰值,可以说十分的接近,这说明两名棋手在一盘棋中,每手棋发挥的稳定性程度上比较相似。不过两人仍有一个细微的区别,在低于10的极小方差中,朴廷桓有一个明显的峰值。这个细微的差别,还是一定程度体现了两人的差异:朴廷桓相比柯洁,完胜的对局多,安乐死的概率也大。
平均胜率差异的分布,柯洁和朴廷桓有着明显的不同。柯洁的峰值,要明显低于朴廷桓,大约有0.6的差距。也就是说,柯洁每手棋比朴廷桓少亏0.6个百分点,这是一个绝对不容忽视的差距。况且,柯洁今年的胜率要明显低于朴廷桓。
可以看到柯洁在胜败时,平均胜率差异和方差都有明显的差距。理论上来说,一名棋手胜利和失败时,平均胜率差异大概会有0.45左右的差距。柯洁的这个差值到了接近1.0,提示柯洁输棋的时候可能存在有大量的大恶手出现。
完全有理由这样说,柯洁每手棋的平均质量,要明显高于朴廷桓。不过有意思的是,优秀的招法并不能保证柯洁获胜,反而是每手棋不那么优秀的朴廷桓,在胜率上有着压倒性的优势。或许,对于人类的围棋,减少犯错可能更为重要。
除此之外,还有一个有趣的发现,两人平均胜率差异的分布形态是不同的。柯洁是对数正态分布,而朴廷桓则是更接近正态分布,这或许反映了两人落子心态的不同。柯洁追求的是最佳一手,而朴廷桓则是追求的是自己最能掌控的一手。
这是柯洁与朴廷桓按照黑白分类,方差的直方图。从峰值上来说,柯洁的白棋明显较小,朴廷桓的黑白与柯洁的黑棋差别不大。从分布的形态来看,朴廷桓相比柯洁,两极分化的现象更为严重,尤其是朴廷桓执黑的时候——方差在较小时,都有一个明显的峰值。
将平均胜率差异也按照黑白进行了对比。柯洁黑白棋的区别并不大,和朴廷桓的白棋也比较接近。朴廷桓的黑棋,很难做一个拟合,不过从绝对数量上说,位于3-4之间的样本是最多的,接近一半。这在一定程度上说明,朴廷桓黑棋的水平无法与白棋相提并论。
结合以上分析,我们可以得出几个结论:① 柯洁在棋上更追求精,朴廷桓更追求稳,从棋的内容上来说柯洁有优势;② 柯洁黑棋和白棋的水平有差异,更多是体现在白棋发挥更稳定上,而朴廷桓对黑白并不是十分敏感;③ 朴廷桓稳定性更好,完胜的对局多,但是也容易安乐死,尤其是执黑的时候,安乐死风险更大。