AlphaGo Zero三天击败旧版本 比战胜柯洁还厉害的AlphaGo来了

采编:hyt15  来源:凤凰  发布时间:2017-10-19 14:18:00 

21天后,AlphaGo Zero达到了Master的水平。这也就是年初在网上60连胜横扫围棋界的版本。Master后来击败了柯洁。

40天后,AlphaGo Zero对战Master的胜率达到90%。也就是说,AlphaGo Zero成为寂寞无敌的最强围棋AI。

DeepMind主要作者之一的黄士杰博士总结:AlphaGo Zero完全从零开始,初始阶段甚至会填真眼自杀。AlphaGo Zero自学而成的围棋知识,例如打劫、征子、棋形、布局先下在角等等,都与人类的围棋观念一致。

“间接呼应了人类几千年依赖围棋研究的价值”,黄士杰写道。

技术细节

DeepMind的最新研究成果,已经全文发布在《自然》杂志上。这也是第二篇在《自然》杂志上发表的AlphaGo论文。

论文摘要

人工智能的长期目标是创造一个会学习的算法,能在特定领域中从一块白板开始,超越人类。最近,AlphaGo成为第一个在围棋游戏中打败世界冠军的程序。AlphaGo中的树搜索使用深度神经网络来评估位置、选择落子。这些神经网络用人类专家的棋谱来进行监督学习的训练,并通过自我对弈来进行强化学习。本文介绍了一种仅基于强化学习的方法,除了游戏规则之外,没有人类的数据、指导或者领域知识。AlphaGo成了它自己的老师:一个被训练来预测AlphaGo自己落子选择以及对弈结果的神经网络。这个神经网络提高了树搜索的强度,提高了落子质量、增强了自我对弈迭代的能力。从一块白板开始,我们的新程序AlphaGo Zero的表现超越了人类,并以100-10击败了以前曾打败世界冠军的AlphaGo版本。

关闭
金鸡奖:“最帅反派”谢霆锋落选,张小斐穿“红袜”带来鸿运
黄一山揭74岁高雄曾批评同剧演员,赞对方为人正气,遗憾从未合作
莫名其妙发烧,又凭空消失,《王牌部队》肖战戏份疑似被剪,实惨
46岁董卿现身会议显疲惫!腰椎疼痛走路缓慢,头发凌乱衬衫褶皱多
接连离巢!TVB新闻首席主播悄然离巢,结束6年新闻主播生涯
51岁咏梅罕晒近况!穿着朴素扎俏皮丸子头,发际线高额角秃一块
好莱坞72岁女星新作赤身出镜遭小李子反对,导演:最后用了替身
巨石再次确认不回归《速激10》,叫板范老大:别再消费保罗·沃克
年度终极盘点!2021年近70位明星翻车:8人违法乱纪,4人隐婚隐育
66岁陈道明给青年演员讲话!称干这行少染毛病,一众大牌立正鞠躬
去陌生人家里拍摄是一种什么样的体验?这部日综太暖了!
张庭、林瑞阳人生中的3次“暗度陈仓”
赵丽颖晒照优雅迷人似少女,认真研读剧本受期待,力破发福传闻
张小斐张译荣获金鸡奖影后影帝,于和伟张子枫落选,刘浩存陪跑
当年的人们为什么沉迷“小品”
前瞻|14台“跨晚”火拼!台网平台年度终极一战,谁能跨出新气象?
演员孙俪:大女主光环之外的世界丨抉择2021
涂松岩谈起儿子激动落泪!41岁得子把他宠上天,连保姆都不想请
跨年晚会超十档,央卫视进行大比拼
15岁黄多多染发后首晒自拍!穿白衬衫涂大红唇,眼神犀利变化太大
朱媛媛获金鸡奖最佳女配!贫嘴张大民的媳妇,在事业巅峰曾拒演潜伏
成为蜘蛛侠意味着什么?《蜘蛛侠:英雄无归》核心探讨
王牌部队:9年前的娘娘腔,如今变硬汉团长,肖战“与狼共舞”了
74岁施瓦辛格和妻子完成离婚!25年婚姻正式完结,离婚用了10年
8.3分爆火,它拍出了聪明女人恋爱该有的样子