开学了,人工智能第一弹
当前位置:首页 > AI资讯 > 正文

谷歌DeepMind打造MuZero:能自主学习新规则的人工智

12-28 AI资讯

 Alphabet的人工智能技术公司DeepMind,宣布推出名为MuZero的人工智能系统,标榜在完全不了解规则情况下,可以快速熟悉围棋,西洋棋,将棋,或者57款Atari电子游戏游玩规则,并且取得更好游玩表现。

 
遵循DeepMind说明,MuZero的技术背后,代表可以通过人工智能技术也能感知到中复杂规则,或者事前无法确知规则的难题。
 
而现有的DQN,R2D2或Agent57人工智能技术,MuZero能够以转换效率纠正既有规则,并快速解决问题。规则,甚至面临全新的运算场景也能快速发现问题解决方式。
 
过去研究人员分别透过预先搜寻(lookahead search),以及基于现有运算模型规划能力,让人工智能能针对未知规则情况进行运算,但由于既有运算方式仍仰赖前期规则训练,因此必须花费更多时间才能顺利发现全新的运算环境对应规则,因此并不适合用于解决未知条件的运算需求,同时也难以解决条件相对复杂的运算情境。
 
因此,DeepMind在MuZero技术中采用不同的作法,或者让人工智能可循序地进行搜集资讯进行分析学习,转换为在变化的环境条件下所需的运算时间,其中包括当前的决策价值,最佳的运算方法,以及前一个决策执行成果,进行进行反覆学习,制服从中学习最佳规则执行决策能力。
 
在这样的运算模型执行下,将可让MuZero人工智能技术在围棋,西洋棋,将棋,或者57款Atari电子游戏发挥作用,甚至在棋艺能力比拟的AlphaZero,并且在Atari电子游戏执行成果更胜现有的人工智能技术。
 
同时,若允许MuZero以更连续进行“思考”,其在棋艺表现会有更显著的下子正确率,并且呈现更精湛的进攻方式,甚至可在电子游戏内容中具有更高的学习效率。
 
未来DeepMind团队预计利用MuZero技术解决更多人工智能前期学习与分析未知解法问题,预期未来也将带来更多机器人,自动驾驶汽车等经常处于未知判断条件的运算需求,能够在更短的时间内找到合适的执行方式。

版权保护: 本文由 首页 原创,转载请保留链接: http://www.sodoai.com/news/28.html