(12)发明专利说明书 | ||
(10)申请公布号 CN 114139680 A (43)申请公布日 2022.03.04 | ||
权利要求说明书 说明书 幅图 |
本发明公开了一种基于深度强化学习的自动协商多智能体设计方法,首先,每个智能体使用强化学习算法独立地学习一个策略;其次,使用长短期记忆网络(LSTM,LongShort‑Term Memory)来学习SARSA(λ)中的Q函数,将难以处理的状态空间减少到可管理的特征数;最后,结合强化学习算法SARSA(λ)和神经网络LSTM来构建智能体代理,每个智能体代理各自学习,将学习到的对环境状态的观察结果映射到要采取的行动的策略上,通过在环境中与其他代理交互更新自己的策略,最终学习到一个适当的行为策略来进行自动协商。与现有技术相比,本发明构建的智能体代理能够在自动协商中进行更优的获胜联盟选择,从而提高自身在协商中获得的收益。 | |
法律状态公告日 | 法律状态信息 | 法律状态 |
2022-03-04 | 公开 | 发明专利申请公布 |
2022-03-22 | 实质审查的生效IPC(主分类):G06N 3/04专利申请号:2021113187482申请日:20211109 | 实质审查的生效 |
本文发布于:2024-09-22 12:34:34,感谢您对本站的认可!
本文链接:https://www.17tex.com/tex/1/404678.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |