一种基于逆向强化学习算法在斗地主中的应用[发明专利]

专利名称:一种基于逆向强化学习算法在斗地主中的应用专利类型:发明专利
发明人:孔燕,史鸿远
申请号:CN202210329589.4
申请日:20220331
公开号:CN114669056A
公开日:
20220628
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于逆向强化学习算法在斗地主中的应用。涉及游戏与深度强化学习领域。首先对采集专家数据,获得专家数据集;然后,根据逆向强化学习和专家数据,学习到新的奖励函数;将学习到的奖励函数替换DQN算法中的奖励函数进行训练,比较两种框架的实验结果,以此来验证逆向强化学习在斗地主中的应用是否合理;最后,在RLCard平台对两种框架进行同样时间的训练,进行对比来验证新框架的效果。本发明能够通过较少的数据得到不错的结果,降低了对数据量的需求,减少了训练时间。
申请人:南京信息工程大学
地址:210044 江苏省南京市江北新区宁六路219号
国籍:CN
代理机构:南京苏高专利商标事务所(普通合伙)
代理人:曹坤

本文发布于:2024-09-21 04:20:11,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/416152.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:学习   专利   强化   南京   数据   训练   进行
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议