一种基于自动编码器的视频分类方法及装置[发明专利]

专利名称:一种基于自动编码器的视频分类方法及装置专利类型:发明专利
发明人:李睿凡,鲁鹏,芦效峰,周延泉,李蕾,袁彩霞,刘咏彬申请号:CN201510290451.8
申请日:20150529
公开号:CN104866596A
公开日:
20150826
专利内容由知识产权出版社提供
摘要:本发明实施例提供了一种基于自动编码器的视频分类方法及装置。该方法中,获得具有三种模态数据的目标视频的每一种模态数据的低级表示内容;将每一种模态数据的低级表示内容分别输入至堆叠的自动编码器组处理,获得每一种模态数据的高级表示内容;将每两种模态数据的高级表示内容的组合结果分别输入至双模态融合器处理,获得相应两种模态数据的双模态公共表示内容;将双模态公共表示内容的组合结果输入至三模态融合器处理,获得三模态公共表示内容;将三模态公共表示内容输入至有监督分类模型处理,以获得各个视频类别的类别标签,并确定目标视频所对应的视频类别。可见,通过本方案可以结合目标视频的三种模态数据对目标视频进行分类。
申请人:北京邮电大学
地址:100876 北京市海淀区西土城路10号
国籍:CN
代理机构:北京柏杉松知识产权代理事务所(普通合伙)

本文发布于:2024-09-23 02:32:05,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/435959.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:模态   内容   视频   数据
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议