AlphaGo Zero三天击败旧版本 比战胜柯洁还厉害的AlphaGo来了

采编:hyt15  来源:凤凰  发布时间:2017-10-19 14:18:00 

以前其他版本的AlphaGo,都经过人类知识的训练,它们被告知人类高手如何下棋。而最新发布的AlphaGo Zero使用了更多原理和算法,从0开始,使用随机招式,40天后成为围棋界的绝世高手。真真正正的自学成才。

新的AlphaGo Zero使用了一种全新的强化学习方式,从0基础的神经网络开始,与搜索算法结合,不断进化调整、迭代升级。AlphaGo Zero的不同之处在于:

除了黑白棋子,没有其他人类教给AlphaGo Zero怎么下棋。而之前的AlphaGo包含少量人工设计的特征。

AlphaGo Zero只用了一个神经网络,而不是两个。以前AlphaGo是由“策略网络”和“价值网络”来共同确定如何落子。

AlphaGo Zero依赖神经网络来评估落子位置,而不使用rollouts——这是其他围棋程序使用的快速、随机游戏,用来预测哪一方会获胜。

创新工场AI工程院副院长王咏刚用“大道至简”四个字评价新版的AlphaGo Zero。

上述种种,让AlphaGo Zero异常强大。

“人们一般认为机器学习就是关于大数据和海量计算,但是DeepMind通过AlphaGo Zero的案例发现,算法比计算或者数据可用性更重要”,AlphaGo团队负责人席尔瓦(Dave Silver)介绍说,AlphaGo Zero的计算,比之前的AlphaGo减少了一个数量级。

如上图所示,AlphaGo Zero也只用了4个TPU。

AlphaGo Zero到底多厉害,且看官方公布的成绩单:

3小时后,AlphaGo Zero成功入门围棋。

仅仅36小时后,AlphaGo Zero就摸索出所有基本而且重要的围棋知识,以100:0的战绩,碾压了当年击败李世乭的AlphaGo v18版本。

关闭
金鸡奖:“最帅反派”谢霆锋落选,张小斐穿“红袜”带来鸿运
黄一山揭74岁高雄曾批评同剧演员,赞对方为人正气,遗憾从未合作
莫名其妙发烧,又凭空消失,《王牌部队》肖战戏份疑似被剪,实惨
46岁董卿现身会议显疲惫!腰椎疼痛走路缓慢,头发凌乱衬衫褶皱多
接连离巢!TVB新闻首席主播悄然离巢,结束6年新闻主播生涯
51岁咏梅罕晒近况!穿着朴素扎俏皮丸子头,发际线高额角秃一块
好莱坞72岁女星新作赤身出镜遭小李子反对,导演:最后用了替身
巨石再次确认不回归《速激10》,叫板范老大:别再消费保罗·沃克
年度终极盘点!2021年近70位明星翻车:8人违法乱纪,4人隐婚隐育
66岁陈道明给青年演员讲话!称干这行少染毛病,一众大牌立正鞠躬
去陌生人家里拍摄是一种什么样的体验?这部日综太暖了!
张庭、林瑞阳人生中的3次“暗度陈仓”
赵丽颖晒照优雅迷人似少女,认真研读剧本受期待,力破发福传闻
张小斐张译荣获金鸡奖影后影帝,于和伟张子枫落选,刘浩存陪跑
当年的人们为什么沉迷“小品”
前瞻|14台“跨晚”火拼!台网平台年度终极一战,谁能跨出新气象?
演员孙俪:大女主光环之外的世界丨抉择2021
涂松岩谈起儿子激动落泪!41岁得子把他宠上天,连保姆都不想请
跨年晚会超十档,央卫视进行大比拼
15岁黄多多染发后首晒自拍!穿白衬衫涂大红唇,眼神犀利变化太大
朱媛媛获金鸡奖最佳女配!贫嘴张大民的媳妇,在事业巅峰曾拒演潜伏
成为蜘蛛侠意味着什么?《蜘蛛侠:英雄无归》核心探讨
王牌部队:9年前的娘娘腔,如今变硬汉团长,肖战“与狼共舞”了
74岁施瓦辛格和妻子完成离婚!25年婚姻正式完结,离婚用了10年
8.3分爆火,它拍出了聪明女人恋爱该有的样子