基于3D卷积神经网络的视频哈希算法

收稿日期:2018 07 21;修回日期:2018 09 08  基金项目:国家自然科学基金资助项目(61871039,61571045,6180219,6190601);国家科技支撑计划资助项目(2015BAH55F03,015BAH55F03);北京市属高校高水平教师队伍建设创新团队建设提升计划资助项目(IDHT20170511);北京市自然科学基金资助项目(
4184088);北京联合大学领军人才资助项目(BPHR2019AZ01);北京市教委资助项目(KM201911417001,KM201711417005);智能贺驶大数据协同创新中心资助项目(CYXC1902);北京联合大学资助项目(WZ10201903)
作者简介:刘玉莹(1993 ),女,硕士,主要研究方向为数字图像处理;刘宏哲(1971 ),女(通信作者),教授,硕导,主要研究方向为语义计算、数字博物馆、分布式系统集成(liuhongzhe@buu.edu.cn);袁家政(1970 ),男,教授,博导,主要研究方向为图形图像处理、文物遗迹的数字化处理、数字博物馆等;李兵(1983 ),男,副研究员,硕导,主要研究方向为视觉认知计算、多媒体内容安全.
基于3D卷积神经网络的视频哈希算法
刘玉莹1,刘宏哲1
,袁家政2,李 兵3
(1.北京联合大学北京市信息服务工程重点实验室,北京100101;2.北京开放大学,北京100081;3.中国科
空气喷嘴学院自动化研究所模式识别国家重点实验室,北京100190)摘 要:针对目前相似性视频检索方法中快速性和准确性仍无法满足用户要求等问题,提出了一种基于3D卷积神经网络的视频快速检索方法。该算法将3D卷积神经网络与哈希学习方法结合应用于视频数据,既能快速学习视频时空特征表示,又能极大地缩短视频检索时间。在常用视频数据集上的实验结果表明,利用所提出的方法对视频进行相似性检索性能优于当前主流方法。关键词:深度学习;哈希算法;视频检索中图分类号:TP391 41   文献标志码:A   文章编号:1001 3695(2020)03 055 0887 04doi:10.19734/j.issn.1001 3695.2018.07.0664
Videohashalgorithmbasedon3Dconvolutionalneuralnetwork
LiuYuying1,LiuHongzhe1 ,YuanJiazheng2,LiBing
(1.BeijingKeyLaboratoryofInformationServiceEngineering,BeijingUnionUniversity,Beijing100101,China;2.BeijingOpenUniversity,Beijing100081,China;3.StateKeyLaboratoryofPatternRecognition,InstituteofAutomation,ChineseAcademyofSciences,Beijing100190,China)
Abstract:Inordertosolvetheproblemthatthespeedandaccuracyofthecurrentsimilarityvideoretrievalmethodsstillcan notmeettherequirementsofusers
,thispaperproposedanewsimilarityvideoquickretrievalmethod,whichcombinedthethree dimensionalconvolutionalneuralnetworkwiththehashlearningmethodandappliedtovideodata.Itcouldnotonlyquicklylearnthevideospatiotemporalfeaturerepresentation,butalsogreatlyshortenthevideore
trievaltime.Theexperimentalresultsonthesetshowthatthesimilarityretrievalperformanceofthevideousingtheproposedmethodissuperiortothecurrentmainstreammethods.Keywords:deeplearning;hashingmethod;videoretrieval
  近年来,随着移动互联网技术的快速发展,图像、视频等多媒体数据呈爆炸式增长。对于互联网用户来说,从海量的视频数据中快速地检索到对自己有用或者喜欢的视频非常重要;对互联网平台来说,为用户进行个性化的视频推荐或者相关视频广告的投放能够有效地提高用户体验以及产品的销量;对视频原创者来说,能够充分对其视频进行版权保护。因此,对相似视频检索技术的研究成为基于内容的视频检索、视频个性化推荐和原创视频版权保护等应用的关键点。相似视频检索的基本思想是将查询视频与视频数据库中的视频进行近似最近邻搜索,返回与之内容相似的视频。传统的方法是先提取视频特征,然后计算查询视频特征与视频数据库中视频特征的欧氏距离,并根据距离从小到大的顺序来返回相似的视频。但是随着互联网上视频数据的井喷式增长,传统的线性搜索方法需要的存储空间消耗大、计算复杂度高、检索速度慢。为了解决传统方法对存储空间和检索时间的局限,近来近似最近邻搜索技术发展迅猛,其中哈希技术作为一种代表性方法受到广泛关注。这种方法能够将视频数据的高维特征映射到低维空间,产生简洁的二值码表示,通过计算查询视频与数据库视频二值码
之间的汉明距离来进行相似度检索,能够显著降低计算开销并且提升检索性能。近几年,在许多关于计算机视觉的课题研究上运用深度学习技术都显著提升了性能,如目标检测、分类、分割
等,这些任务性能的提升都归功于深度卷积神经网络在特征表
示学习上的强大性能,但这些任务主要是针对图像作为输入进
行的,因此2D卷积[1]
能很好地对图像进行特征表示学习。而在视频作为输入的视觉任务中,2D卷积不能及时捕获视频数
据的时序信息,针对视频时序信息的表示,研究者们提出了3
加油站三次油气回收D卷积[2]
标准车当量数来同时提取视频数据的时间特征和空间特征,从而保证视频特征表示的连续性。本文基于深度学习和哈希技术,提
出了一种新的相似性视频快速检索方法,运用3
防冲撞护栏D卷积神经网络[2]
同时对视频进行时间特征和空间特征的提取与融合,利用哈希方法对融合后的视频时空特征进行量化编码,得到视频的哈希二值码,计算查询视频与大规模视频数据集的汉明距离,实现快速有效的视频检索。
1 相关研究
1 1 哈希学习中央空调通风管道
为了实现高效的近似最近邻搜索,哈希方法旨在将数据的高维特征编码为紧凑的二值码,同时能保持原始数据之间的相
似性。在数据层面可分为数据独立型[3~6]和数据依赖型[
7~24]
哈希方法。数据独立型哈希方法主要采用随机投影方法将数据映射为二值码,但是这种不依赖数据的哈希方法需要较多位
二维码访客系统
第37卷第3期2020年3月 计算机应用研究
ApplicationResearchofComputersVol 37No 3
Mar.2020

本文发布于:2024-09-22 04:20:28,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/168944.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:视频   方法   数据   检索   特征   研究   计算   资助
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议