说话视频的生成方法、装置、电子设备、介质及产品[发明专利]

专利名称:说话视频的生成方法、装置、电子设备、介质及产品
专利类型:发明专利
发明人:刘永进,叶子鹏,温玉辉,孙志尧,常亚
申请号:CN202111404955.X
申请日:20211124
公开号:CN114245215A
公开日:
20220325
专利内容由知识产权出版社提供
摘要:本发明提供一种说话视频的生成方法、装置、电子设备、介质及产品,本发明提供的说话视频的生成方法、装置、电子设备、介质及产品,通过情绪语音模型可以根据说话音频的音频特征和情绪标签序列获得相应的人脸模型序列,并通过神经渲染模型根据人脸模型序列、情绪标签序列以及人脸背景序列获得视频帧序列,最后将视频帧序列与说话音频合成即可得到目标人物的说话视频,由于说话视频是基于情绪标签序列获得的,可以直观的表达目标人物的情绪变化,得到的说话视频更加真实。
申请人:清华大学,华为技术有限公司
地址:100084 北京市海淀区双清路30号清华大学
国籍:CN
代理机构:北京路浩知识产权代理有限公司
代理人:郭金梅

本文发布于:2024-09-20 20:28:15,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/406533.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:说话   序列   视频   情绪   模型   北京市   知识产权
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议