专利名称:一种针对压缩视频的视频描述生成方法专利类型:发明专利 发明人:于长斌,朱铭健,段晨瑞,莫远秋,于长军
申请号:CN202010810293.5
申请日:20200813
公开号:CN112135200A
公开日:
20201225
专利内容由知识产权出版社提供
摘要:本发明公开了一种针对压缩视频的视频描述生成方法,包括如下步骤:步骤1)视频图像预处理阶段;步骤2)图像特征抽取阶段;步骤3)文本标注预处理阶段;步骤4)图像特征编码阶段;步骤5)文本解码阶段。本发明与现有技术相比,具有的有益效果是提升了对于视频所生成的描述句子的质量,使其更好;并有以下三点创新:1)视频描述生成方法直接针对压缩视频中的视频帧而非通常的解码后的视频帧进行描述;2)利用压缩视频帧中的Residuals帧去生成压缩视频帧中的I帧的注意力权重,使得模型能够关注I帧中的显著性区域,从而生成更好的特征;3)设计了一种门机制,这种机制能够使得模型对于信息中的噪声更具有鲁棒性。 申请人:南京众智未来人工智能研究院有限公司,杭州义顺科技有限公司
地址:211111 江苏省南京市江宁区秣陵街道秣周东路11号
国籍:CN
代理机构:杭州浙科专利事务所(普通合伙)
代理人:周红芳