(12)发明专利说明书 | ||
(10)申请公布号 CN 113779870 A (43)申请公布日 2021.12.10 | ||
权利要求说明书 说明书 幅图 |
本申请属于机器学习技术领域,具体而言,涉及一种并行化不完美信息博弈策略生成方法、装置、电子设备以及存储介质。该方法包括:利用非完全回忆聚类方法,对不完美信息博弈的原始特征空间进行压缩,得到抽象特征空间;利用MCCFR最小化方法,在所述抽象特征空间内,通过自我博弈,迭代生成蓝图策略;利用特征字符串的哈希算法,对蓝图策略进行分布式存储和更新。该方法使用非完全回忆进行特征空间抽象,提升策略鲁棒性;在MCCFR算法的基础上使用整体期望收益替代后悔值进行间隔更新,使用采样动作频数生成最终策略,结合特征映射和并行框架,提高算法收敛速度,缩短算法训练时间。 | |
法律状态公告日 | 法律状态信息 | 法律状态 |
2021-12-10 | 公开 | 公开 |
本文发布于:2024-09-24 00:28:27,感谢您对本站的认可!
本文链接:https://www.17tex.com/tex/4/411556.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |