分布式机器学习训练方法、装置、计算机设备和存储介质[发明专利]

专利名称:分布式机器学习训练方法、装置、计算机设备和存储介质
专利类型:发明专利
发明人:黎伟杰,陈飞,韩旭
申请号:CN201911028131.X
申请日:20191028
公开号:CN110852445A
公开日:
20200228
专利内容由知识产权出版社提供
摘要:本发明涉及一种分布式机器学习训练方法、装置、计算机设备和存储介质。该方法通过各节点对各自对应的初始参数集进行训练,并监测通讯环中是否出现故障节点,若出现故障节点,则所有节点停止训练初始参数集,并重新建立新的通讯环和新的参数集,然后基于新的通讯环,并将新的参数集替代初始参数集,返回执行各节点对各自对应的初始参数集进行训练,并监测通讯环中是否出现故障节点的步骤,直到新的通讯环中所有节点完成训练为止。上述训练方法可以自动重新建立新的通讯环和新的参数集,再进一步的以新的通讯环和新的参数集进行训练,以继续完成发生故障时的训练过程。本申请提供的训练方法极大的缩短了训练时间,以及提高了训练效率。
申请人:广州文远知行科技有限公司
地址:510000 广东省广州市中新广州知识城九佛建设路333号自编687室
国籍:CN
代理机构:广州华进联合专利商标代理有限公司
代理人:曹瀚青

本文发布于:2024-09-21 03:29:50,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/438036.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:训练   节点   训练方法   广州   参数   专利
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议