Facebook推Other
作者 :瑶瑶酱 2020-03-11 11:17:05 审稿人 : admin
中文科讯网消息:Facebook AI研究院的学者提出一种名为Other-Play(OP)的新型学习算法,通过寻找更鲁棒的策略以及利用潜在问题中已知的对称性,该算法能够增强自我对决。他们从理论和实验两方面描述了OP算法的特征。研究者探究了合作型卡牌游戏花火(Hanabi),结果证明当OP智能体与其他独立训练的智能体放在一起时会取得更高的分数。此外,初步研究结果显示,与当前SOTA SP智能体相比,本该研究的OP智能体与人类玩家成对出现时也会取得更高的平均分数。相关研究论文《“Other-Play” for Zero-Shot Coordination》已发表。

在线下载列表
上一篇:联通沃云招募多领域SaaS服务商合作 下一篇:应对新冠肺炎疫情税费优惠政策指引