用于通过文本的视频搜索的语义多感官嵌入[发明专利]

专利名称:用于通过文本视频搜索的语义多感官嵌入专利类型:发明专利
发明人:A·比安,T·E·J·门辛克,C·G·M·斯诺克
申请号:CN201680054406.5
申请日:20160803
公开号:CN108027834A
公开日:
20180511
专利内容由知识产权出版社提供
摘要:一种嵌入视频以供文本搜索的方法,包括从视频中提取视觉特征。视觉特征可例如包括外观信息、运动、音频和/或类似特征。词条向量由与视频相关联的文本描述确定。例如,文本可被包括在视频的标题中或被包括在视频内(例如,字幕)。基于所提取的视频特征计算特征投影,以及基于词条向量计算文本投影。通过联合优化语义可预测性和语义描述性,基于特征投影和文本投影来计算语义嵌入。
申请人:高通股份有限公司
地址:美国加利福尼亚州
国籍:US
代理机构:上海专利商标事务所有限公司

本文发布于:2024-09-20 13:31:05,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/811533.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:视频   特征   文本   专利   语义   投影
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议