基于声音的视频动作分类方法及相关设备[发明专利]

专利名称:基于声音的视频动作分类方法及相关设备专利类型:发明专利
发明人:张华,李勇胜,涂腾飞,李吉帅,金正平,温巧燕申请号:CN202111636227.1
申请日:20211228
公开号:CN114529846A
公开日:
20220524
专利内容由知识产权出版社提供
声音设备
摘要:本申请提供一种基于声音的视频动作分类方法及相关设备,所述方法包括:获取待处理视频的音频数据;构建所述音频数据的声音纹理特征;将所述声音纹理特征输入至预先训练的第一动作分类网络中,输出第一动作分类结果;获取所述待处理视频的视频帧;将所述视频帧输入至预先训练的第二动作分类网络中,输出第二动作分类结果;利用加权平均的方式对所述第一动作分类结果和所述第二动作类结果进行融合,得到所述待处理视频对应的动作分类结果。本申请的方法,只需要增加少量参数,便能够提升动作分类任务的准确率。
申请人:北京邮电大学
地址:100876 北京市海淀区西土城路10号
国籍:CN
代理机构:北京风雅颂专利代理有限公司
代理人:陈莉

本文发布于:2024-09-21 15:53:31,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/349310.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:分类   动作   视频   结果   方法   声音   专利
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议