反过来错误的地方,如果他去理解计算机怎么想,机器会怎么做,有可能你的判断是错的,对计算机的理解不到位,反而机器不擅长引入复杂局或者做某种特定情况的搜索,可能会掉到一个陷阱里去。
以我对AlphaGo的判断,他们并不会对李世石做特别的判断,他需要大量的棋局样本去做,要拿三千万的棋局做训练,拿到李世石的棋局可能就是一千多盘,这样的数据规模是远远没法支撑AlphaGo的模型去支撑,如果他用李世石做训练,他也会掉到一个陷阱里去。
今天最好的状况是双方都有一颗平常心,AlphaGo也别讲李世石怎么样,就是提高他的棋艺,李世石也不要管AlphaGo的套路,尽力去下自己的棋。
电脑每秒钟的速度比以前AlphaGo的速度快了三万倍,以这个速度不断自我训练,同时开发两个脑左右互搏,不断地自己跟自己练。
自己跟自己下输的时候就马上总结教训,这个地方输掉了,拿着棋局怎么去做改进,自己当自己的老师,这样的方法能提升得非常快,也是在封闭的棋类游戏中机器迅速战胜人的精髓所在。
本文来源:不详 作者:佚名