JavaRush /Java 博客 /Random-ZH /AlphaGo人工智能程序已实现完全自学习

AlphaGo人工智能程序已实现完全自学习

已在 Random-ZH 群组中发布
今年和去年,AlphaGo程序多次击败了包括世界冠军李世石在内的中国职业围棋选手。在得出这一结果之前,我们对全球围棋协会成员的比赛进行了长期研究。之后程序就开始自己玩,同时分析所有的动作。正是这个算法促成了AlphaGo在与职业选手的比赛中取得绝对胜利。
AlphaGo AI 程序已实现完全自学习 - 1
AlphaGo 的表现甚至令专家感到惊讶:他们预计最迟在 2020 年也能取得类似的结果。最近,谷歌开发人工智能系统的部门推出了AlphaGo的下一个版本——AlphaGo Zero。更新后的应用程序以 100:0 的分数击败了其前身“dry”。新版本的程序不再需要人类“老师”;学习过程根据自己的步骤和分析独立进行。在获得绝对冠军的时刻之前,AlphaGo Zero在短短三天内完成了2900万局比赛;对于许多公认的高手来说,这需要几十年的时间。
之前版本的AlphaGo配备了两个独立的神经网络学习模块。第一个模块负责游戏板上的当前情况,第二个模块负责思考下一步行动。新程序有一个单一的神经网络,可以同时执行上述动作,因此其工作结果更加有效。另外,AlphaGo Zero 不再仅仅局限于人类知识,而是超越人类知识,通过自己独特的步骤进行思考。在智能发展史上,这一事实具有决定性意义。
评论
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION