并行化不完美信息博弈策略生成方法、装置、电子设备以及存储介质

(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 CN 113779870 A
(43)申请公布日 2021.12.10
(21)申请号 CN202110975035.7
(22)申请日 2021.08.24
(71)申请人 清华大学
    地址 100084 北京市海淀区清华园1号
(72)发明人 刘启涵 杨君 梁斌 芦维宁 陈章
(74)专利代理机构 11201 北京清亦华知识产权代理事务所(普通合伙)
    代理人 吴婷
(51)Int.CI
      G06F30/27(20200101)
      G06K9/62(20060101)
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      并行化不完美信息博弈策略生成方法、装置、电子设备以及存储介质
(57)摘要
      本申请属于机器学习技术领域,具体而言,涉及一种并行化不完美信息博弈策略生成方法、装置、电子设备以及存储介质。该方法包括:利用非完全回忆聚类方法,对不完美信息博弈的原始特征空间进行压缩,得到抽象特征空间;利用MCCFR最小化方法,在所述抽象特征空间内,通过自我博弈,迭代生成蓝图策略;利用特征字符串的哈希算法,对蓝图策略进行分布式存储和更新。该方法使用非完全回忆进行特征空间抽象,提升策略鲁棒性;在MCCFR算法的基础上使用整体期望收益替代后悔值进行间隔更新,使用采样动作频数生成最终策略,结合特征映射和并行框架,提高算法收敛速度,缩短算法训练时间。
法律状态
法律状态公告日
法律状态信息
法律状态
2021-12-10
公开
公开
权 利 要 求 说 明 书
【并行化不完美信息博弈策略生成方法、装置、电子设备以及存储介质】的权利说明书内容是......
说  明  书
【并行化不完美信息博弈策略生成方法、装置、电子设备以及存储介质】的说明书内容是......

本文发布于:2024-09-24 00:28:27,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/411556.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:策略   方法   特征   生成   博弈   信息   算法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议