(资料图)
编imiqQkcC程客栈()8月25日 消息:谷歌DeepMind开发了一个集成系统AZ编程客栈db,将多个AlphaZero AI系统组合成一个“联盟”,以增强AI国际象棋能力并提高泛化能力。
DeepMind使用“行为多样性”和“响应多样性”技术,AZdb 的AI系统被训练以不同的方式下棋。根据Google Deepmind 的说法,行为多样性最大化了AI系统之间平均棋子位置的差异,而响应多样性则使AI系统面临针对不同对手的游戏。在实践中,这也意味着 AZdb 的AI系统将看到更多不同的位置,扩大分布数据的范围,这应该允许系统更好地泛化到看不见的位置。
研究python人员让AZdb与旧版AlphaZero下棋,结果显示AlphaZero Db的ELO评分提高了50分,在解决困难的国际象棋谜题时成功解题数是AlphaZero的两倍。
这证明了多AI集成的优势,AZdb可以考虑更多可能性,更好地推广到未知棋局。
Alp编程客栈haZero Db展现了更高的国际象棋水平和泛化能力,这是深度强化学习在游戏领域应用的一个重要进展。多样性的集成为AI的发展提供了新的思路。