随便谈谈alphago与人机大战

随便谈谈alphago与⼈机⼤战
3⽉16⽇历时8天的⼈机⼤战终于落下帷幕,alphago以4:1的⽐分击败了当年如⽇中天的李世⽯。这个结果让我这个围棋爱好者+计算机爱好者百感交集……
——⼀个时代落幕了,⼀个新的时代开启了。
这次⼈机⼤战包含了两⼤⽅⾯,⼀是围棋,⼀是算法,幸好我对这两⽅⾯都略有涉猎,就不妨简要谈谈我的看法。
(当然我围棋也只是业余5段,计算机⽅⾯更是被⼈随便虐,如有错误,欢迎指正)玉林柴油机
先从围棋⽅⾯说说吧,其实很多⼈都对这次结果⼤跌眼镜的,赛前很多职业选⼿都是⽀持李世⽯5:0获胜的,毕竟围棋是“⼈类最后的智慧堡垒”,虽然计算机已经在国际象棋,中国象棋上战胜了⼈类,但是围棋的复杂度远不是象棋所能⽐拟的。围棋很多地⽅,⽐如“形”、“味道”、“厚势”,除了⼈的直观感受似乎没有什么更好的做法。
但是,结果……
当然这也不能怪李世⽯了,能在0:3的情况下情况坚持下去并且还能拿下⼀城,这已堪称这个时代最优秀最伟⼤的胜负师。维加
但是输棋毕竟是有原因的,⾸先就李世⽯本⼈⽽⾔,年龄是⼀个不利因素。“⼩李”都已经30多了,已经过了巅峰期了,不论是精⼒还是运算能⼒都有所下滑。李世⽯和古⼒,他们是我学棋时最崇敬的对象,也是那时候最辉煌。⽽现在呢,则颇有“英雄迟暮”之感。(所以说就现在⽽论,击败李世⽯不等于完全击败⼈类,⽐如柯少侠就表⽰不服233)
再者很多⼈包括我⼀开始也认为,李世⽯的棋风被计算机克制。李世⽯的长处在于中后盘的搏杀搅局,特别是他赖以成名的“僵⼫流”,⽽布局却不是很擅长。⽽计算机呢,随着棋盘的缩⼩,计算机的搜索应该更准确。也就是说,计算机也擅长中后盘,那么如果李世⽯布局不能建⽴⾜够的优势,那么后半盘很容易被赶上来。⽽恰恰李世⽯并不擅长布局……
但实际上这个想法是有错误的,甚⾄可以说正是这个想法导致了李世⽯发挥失常,1:4落败。观看了五局棋,我发现alphago的棋⼒和原先的认识是有出⼊的。alphago的布局和⼤局观很好,⼏乎⽆懈可击⽽且很多地⽅颇值得借鉴(⽐如第⼆局的⿊13⼿脱先和⿊37⼿五路肩冲)⽽alphago中后盘的战⼒却没有⼈们想象中的那么强,很多地⽅与其说alphago中后盘太强不如说李世⽯下的太缓。虽然alphago也有⽐较厉害的地⽅(⽐如维持优势的能⼒以及第⼀局先⼿破空做活),但是在局部攻杀上却表现平平甚⾄有时⾮常糟糕。⽐如第四局应对“神之⼀⼿”的⽩78⼿,alphago的79、103的应对可以说⾮常糟糕(我就不说第四局⾥alphago⾥那些业余棋⼿都下不出来的招数了)。实际上第四局78⼿只是“年度骗招”⽽⾮“年度妙⼿”,事实这⾥上没有棋。⽐如⽹上流传的这张图
⼤家有兴趣可在把这⾥的变化在摆⼀下,有⼏个交换⽩棋正好不能同时⾛到,不能出棋。
还有第五局⾥右下⾓的变化,⽩棋也没有下出最强⼿,最强应如下图1~5(古⼒⽼师指出的妙⼿)实战把变化⾛尽还亏官⼦实在不是好棋。所以alphago的中后盘计算⼒也不是“算⽆遗策”,也是有很⼤漏洞的(原因之后再讲到),没有必要过分神话。
所以,我认为李世⽯最⼤的败因可能还是没有下出⾃⼰敏锐灵活的⼒战棋风。第⼀局优势下被逆转后,第⼆局明显保守,第四局⼀开始更是⽓势上被压制,若没有78的“神来⼀⼿”恐怕李世⽯就要4连败了。⽽第五局79⼿也太过保守,导致形势被逆转。⽽第三局倒是摆出了拼杀的架势,可惜⽤⼒过猛,导致提前落败。
我感觉,李世⽯在这5盘棋中并没有完全下出⾃⼰的棋风,感觉不是我当年熟悉的李世⽯。⼩李可能太相信计算机的计算能⼒了,有些地⽅该出击却没有出击,有些畏⾸畏尾;⽽有的地⽅⼜过于⽆理,没有了以往“稳、准、狠”的感觉。很长时间我都觉得李世⽯似乎“灵魂出
窍”了……
KINGXCON
说到底还是⼼态的问题。其实围棋的意义远远不⽌是棋盘上的变化那么简单。它考验的不仅是棋⼿的技艺,更是棋⼿的⼼态,胆略。李昌镐当年能独步棋界,除了的技艺滴⽔不漏以外,更重要的是他“不
动如⼭”的“⽯佛”之风。在盘外,任何情绪上的波澜都有可能导致昏招、恶⼿的发⽣。作为⼩李⼀⽣对⼿的古⼒⽼师就说:“李世⽯是最擅长捕捉对⼿⼼理变化的棋⼿,但这次他的对⼿换成了⼀台⼈⼯智能,没有情绪波动,反⽽是他的情绪波动造成了失误,被对⽅逮住了机会。”更糟糕的是,⽐赛的2⼩时制也对李世⽯⾮常不利。事实上除了第⼀盘以外,李世⽯的⽤时都超过了alphago,甚⾄进⼊读秒,⽽读秒是很容易影响⼈的计算和情绪变化的。⼩李赛前选定时间应该还是轻敌了,⽽第⼀局的失利更致使了⾃信受到冲击,导致后⾯⼀错再错,直到第四局后半段才恢复过来。⼩李作为当年我学棋的偶像之⼀,我觉得这次⽐赛结果对他来说还是⽐较遗憾的。毕竟顾虑的太多⼼态有些失衡了,这五盘棋中令⼈扼腕叹息的地⽅着实不少。倘若李世⽯就把对⾯当作⼀个普通的棋⼿,下出⾃⼰的棋风,我觉得“胜负之数,存亡之理,或未易量”。
说完了围棋⽅⾯,该谈谈算法⽅⾯了ncc
⾸先要恭喜alphago取得4:1的巨⼤胜利,这⼀成果肯定是要载⼊史册的。
我还依稀记得,我第⼀次接触⼈⼯智能是在奕城围棋上。那时候,奕城围棋推出了⼀个⼈⼯智能的功能。对于这个⼈⼯智能,我的唯⼀感觉就是虐得真爽,每次下完就看对⽅有⼏块活棋……当然在那时的⽔平围棋上的AI最强也只有跟我差不多的⽔平。虽然我知道计算机在确定规
则确定胜负的游戏上注定要打败⼈类的,但是我也没有想到这⼀天会来的这么快。这⼀切都要归功于
神经⽹络、深度学习和蒙特卡洛算法。
……好吧,其实我很不懂,但是蒙特卡洛算法我以前是听过的(好像是在全国冬令营上?)。
济南莱钢钢结构有限公司其⼤意就是:假设对弈双⽅都随机地落⼦,快速进⾏很多(⽐如1000000)盘,计算胜率作为局⾯估价,选择好的胜率落⼦。
这个算法的应⽤⾮常有意义的。之前很多围棋AI(我猜奕城的就是这样),都是笨拙的模仿⼈类的招法,录⼊定式和固定的布局啊等等(其实就相当于不断的打补丁&)。当⼈⼀变招计算机就傻了。⽽这个算法精妙在于,他很⽣动的模仿了⼈类下棋时计算—评估的过程。这个算法的应⽤使得围棋AI从⼊门⼀下提升到业余⾼⼿的⽔平,可以说是质的飞跃。⾄于从业余⾼⼿到职业⾼⼿,就需要结合神经⽹络、深度学习了。(由于我不懂,就不说了……,我猜⼤概就是不断⾃我对弈然后修正评估参数吧?)辉南四中
当然蒙特卡洛算法也有缺点,⽽且在这次⽐赛中也体现出来了。因为毕竟是随机,⽽有些棋在棋⼿对局中肯定是损棋,⽐如第四盘⿊97⼿挖(⽩78和⿊97挖形成鲜明对⽐233),稍有⽔平的⼈都会有相同且唯⼀的应法。⽽计算机是随机的,有些棋你⾛别的,那计算机就可能获得巨⼤的收益,从⽽会评估出⼀个较⼤的胜率。但这个胜率在实际职业对局这⼏乎是不切实际的。我觉得这⼤概就是第四盘alphago后⾯昏招迭出,下出各种损棋的原因吧!正因为如此蒙特卡洛算法常与⼀定程度的暴搜、启
发式搜索相结合。围棋可能性太多显然不能全部穷举,但在局部搜索某⼏步则可以使得胜率评估更加精细准确。另外,alphago特别喜欢把棋⼿习惯“保留”的地⽅⾛掉,我觉得这⼤概是为了减少不必要的随机来提⾼后续评估的准确性,未必真的符合棋理,没必要过分神话。
不过总的来说alphago真的算是⾮常⾮常强了,毕竟是被韩国棋院授予名誉九段的“狗”!世界排名第2的“狗”!
衷⼼祝愿AI能够更好的服务于今后⼈类的⽣活,也希望棋界能从alphago的招法中汲取经验更上⼀层楼。

本文发布于:2024-09-21 12:22:32,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/30359.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:计算机   围棋   没有   胜率   导致   评估
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议