一种基于逆向强化学习算法在斗地主中的应用[发明专利]

专利名称：一种基于逆向强化学习算法在斗地主中的应用专利类型：发明专利

发明人：孔燕，史鸿远

申请号：CN202210329589.4

申请日：20220331

公开号：CN114669056A

公开日：

20220628

专利内容由知识产权出版社提供

摘要：本发明公开了一种基于逆向强化学习算法在斗地主中的应用。涉及游戏与深度强化学习领域。首先对采集专家数据，获得专家数据集；然后，根据逆向强化学习和专家数据，学习到新的奖励函数；将学习到的奖励函数替换DQN算法中的奖励函数进行训练，比较两种框架的实验结果，以此来验证逆向强化学习在斗地主中的应用是否合理；最后，在RLCard平台对两种框架进行同样时间的训练，进行对比来验证新框架的效果。本发明能够通过较少的数据得到不错的结果，降低了对数据量的需求，减少了训练时间。

申请人：南京信息工程大学

地址：210044 江苏省南京市江北新区宁六路219号

国籍：CN

代理机构：南京苏高专利商标事务所(普通合伙)

代理人：曹坤

本文发布于:2024-09-21 04:20:11，感谢您对本站的认可！

本文链接：https://www.17tex.com/tex/4/416152.html

上一篇：一种逆流串级浸出提取草木灰中钾盐的方法[发明专利]

下一篇：精选新版2020年《大学生创新基础》考核复习题库完整版(含参考答案...