一个面向大数据的智能图像搜索系统

1概述
二十一世纪是数据信息爆炸性增长的时代,作为继
资本和人力后的一种新的非物质生产要素,大数据已经成为支撑科学研究和各类应用服务不可或缺的战略资源。另外,图像是人类社会活动中最常用的信息载体,仅我国社交媒体上每天就有超过6亿张图片被分享。图像大数据已经成为一种用途极其广泛的大数据。如何在浩如烟海的图像库中快速、准确地检索到用户所需的图像,已成为大数据领域的研究热点。然而,针对海量图像的检索需求,传统的基于单节点架构的图像检索技术已经处于被淘汰的边缘。研发新的面向大数据的海量图像检索技术和方法势在必行。
针对大数据环境下海量图像的检索问题,深入研究图像检索关键技术和方法,结合CEDD 算法,对图像的特征进行综合全面的提取,生成索引文件,实现图像搜索的快速搜索和高准确率。面向大数据的智能图像搜索系统由软件注册工具和图像搜索软件两部分组成。本文所提出的智能图像检索系统具有以下优点:(1)界面友好、操作方便,通过多种防误操作措施,使得非计算机领域从业者也能够轻松上手。(2)通过验证机器码及控制运行时间等方式,保护
知识产权、实现商业化应用。
2
相关技术
2.1CEDD 算法
CEDD (Color and Edge Directivity Descriptor)算法[1]
pe附着力促进剂是当今较为主流的图像特征提取算法。本文所提出的智能图像搜索系统采用CEDD 算法实现对图像的建立索引和搜索。
CEDD 算法由提取图片颜信息特征的颜子算法
和提取图片纹理信息特征的纹理子算法组成,最终结合图片的颜及纹理特征信息,生成一个144位的图片直方图作为图片的特征信息。2.1.1颜子算法
颜子算法首先将基于RGB 颜空间的目标图片
映射到HSV 颜空间[2],其计算公式如下:
其中,m =MAX (r ,g ,b ),n =MIN (r ,g ,b ),r ,g ,b 是RGB 颜空间通过Z-score 标准化方法转换的值。
将转换后的基于HSV 颜空间的图片作为输入,
蜜饯LH
通过一个10bins 模糊过滤器,最终输出一个10维的颜信息直方图。将10维的颜直方图中的S 和V 的平均值作为24bins 模糊过滤器的输入,最终输出一个24维的颜直方图,作为图片的颜信息特征。2.1.2纹理子算法
纹理子算法首先将基于RGB 颜空间的目标图片
映射到YIQ 颜空间。然后利用5个数字边缘滤波器进行边缘检测,5个边缘滤波器的方向为垂直方向、水平方向、45°方向、135°方向和无角度方向。在对图片进行边缘检测时,会将图片分成16个分区分别进行检测。分别统计16个分区中每个方向的累计值,将其中的最作者简介:高天(1993-),男,硕士,研究方向:图像检索、深度学习、自然语言处理。
一个面向大数据的智能图像搜索系统
高天
(青岛科技大学数理学院,山东青岛266000)
要:现在已经进入了网络的大数据时代,在海量的图像库中方便、高效、准确地查询并检索到用
户所需的图像,已成为目前的研究重点。为此,采用CEDD (Color and Edge Directivity Descriptor )提取算法,提出了一个以Lire 框架为依托的智能图像搜索系统。该系统不仅有高效的搜索效率和准确率,并且具有安装方便、界面友好和操作简单等优点。关键词:图像检索;Java
语言;软件开发
图片类别图片数量检索次数查全率查准率乐器120312094.3%95.2%房屋104510095.5%96.0%飞机137413095.7%95.9%人类
950
90
94.2%
94.8%
大值进行规范化处理后作为该分区的图片边缘信息,最终将提取到一个6维的直方图。2.2欧氏距离
欧式距离[3]是目前较为流行的用来衡量高维空间中
点与点之间距离的方法。所提出的智能图像搜索系统使用欧氏距离来匹配检索图片与图片库中的图片的相似度,并且按照相似度高低进行输出。假设欲检索图片为L ,图片库为N ,且N
=[L 1,L 2,...,L n ]。利用CEDD 算法分别提取L 和∀L ∈M 的图片特征信息,获得对应的图片特征矩阵A 和A '。则欧式距离定义为:
其中,,。
根据欧氏距离计算结果,判断欲检索图片与图片库中图片的相似性。两张图片的欧式距离
越小,其
人脸识别考勤
相似度越高。遍历整个图片库,对图片欧式距离结果按照升序排列,选取排列在前的几张图片,作为检索输出。
3
系统设计及实现
3.1软件注册工具
软件注册工具通过对安装机器的CPU 码进行检测,
确保软件安装到已经授权的电脑中,同时软件注册工具还可以根据网络时间判断智能图像搜索软件在指定时间段内运行。如果超出指定时间,会弹出对话框提醒使用者续费购买。
3.2智能图像搜索软件主界面
智能图像检索软件提供了一个用户友好的操作界
面,让普通用户可以轻松实现生成图片库检索和图像检索等功能。该智能图像检索软件可以实现以下功能:
目标源设置:对指定文件夹中的图片进行特性特征提取,建立图片库索引。
上传图片:将欲检索的图片传输到智能图像检索软件,利用CEDD 算法提取图片的特征信息。
搜索:根据图像检索结果返回的图片库中的相似图片位置,从图片库中提取相似图片的访问路径等信息,并将检索到的相似图片按照相似度大小依次以缩略图的方式显示在软件界面中。3.3目标源设置
在首次检索图片前,用户需要通过点击目标源设置
按钮选择文件夹,而后智能图像搜索软件对该文件夹下的所有图片文件利用CEDD 算法创建索引。索引创建成功
后会显示索引建立成功界面。如果索引创建失败,将显示创建失败界面,并且提醒用户选择包含图片的文件夹。3.4图片上传及检索
用户通过点击智能图像搜索软件主界面的上传图片
按钮,可以在文件夹中选择欲检索的图片并且上传。随后点击搜索按钮,检索图片及相似图片将展示在搜索界面。用户可以通过勾选相似图片下方的复选框及另存为按钮,将相似图片保存到任意位置。图1分别展示了在以乐器和建筑为检索图片的检索结果。
4实验结果及评价
评价一个图像搜索系统的性能需要一个较大规模的
图片数据集。对于图像搜索系统而言,一个合理的图片数据集必须具有以下两个特点:
(1)
数据集规模比较
大,用于检验图像搜索系统对高维索引结构的可扩展性;(2)图片种类众多,以测试提取的图像特征的有效性和图片检索系统的性能。为了测试所提出的图像搜索系统的有效性,选择了包括乐器、房屋、飞
机、人类等在内的4572
张图片作为测试图片库。
文本利用在图像检索领域较为常见的两种指标查准率(Precision)和查全率(Recall)对检索结果进行评价。其计算公式如下:闪蒸器
所用的开发环境及测试环境如下:(1)硬件环境,AMD EPYC 7002,DDR432G,RTX2080TI;
(2)操作系
统,Windows1064位系统;(3)开发软件,NetBeans。
图1图片检索结果
表1图片检索查全率和查准率结果汽车覆盖件模具
(下转第146页)
摆渡穿越网络边界。各地市依托互联网/局域网建设小区数据汇聚平台,采用统一接口支持下级各小区管理平台/系统统一接入,也支持直接接入小区的视频、门禁、停车场等设备,实现一定区域范围内(如地市)的小区内门禁刷卡事件、车辆数据、物业数据的汇聚、存储,此类信息对公安治安与政府社会管理上都具有极大的价值。
4结语
构建智慧安防小区,可以提高社区安全治理水平,
从而提高城市的综合管理能力,它是构建智慧城市的基础,是构建和谐社会和平安社会的重要组成部分。积极推进智慧安防小区建设,有利于提高基础设施的集约化和智能化水平,有利于促进和扩大政务信息共享范围,增强行政运行效能,促进社区治理体系的现代化;有利于减轻社区基层的工作负担,提升社区服务和管理能力;有利于保障基础公共服务均等化,以高质量的公共服务满足人民众对美好生活的需求,增强人民众的安全感、获得感、幸福感。
所提出的智能图像搜索系统的查全率和查准率结果如表1表示。从测试结果可以得出,所提出的系统具有良好的检索效果。
5结语
综合运用图像处理、大数据、人工智能、信息检索
等众多科学技术,实现了一个面向大数据的智能图像搜索系统。基于LIRE 搜索引擎,利用边缘方向直方图、模糊过滤器以及数字滤波器等图像检索领域的主流方法,采用多特征融合提取算法,借助Color and Edge Directivity Descriptor (CEDD)算法对图像的特征进行综合全面的提取;对提取出的特征向量进行降维处理,得到具有代表性的低维特征向量;基于特征的欧几里得距离计算方法,对各图像之间相似度进行排序,分析得出检索结果,即用户所需的图像。本系统可以针对指定图像库进行特征提取,建立索引,然后检索到任意指定图像的相似图像,并保存到指定位置。
参考文献
[1]Chatzichristofis S A ,Boutalis Y S .CEDD:Color and
edge directivity descriptor:A compact descriptor for i⁃mage indexing and retrieval.[J]puter vision systems,2008,5008:312-322.
[2]金磊.基于SVM 的相关反馈图像检索技术研究[D].上海:华东师范大学,2006.
[3]陈纯.计算机图像处理技术与算法[M].北京:清
华大学出版社,
2003.
图1树莓派端与安卓端交互装置
的位置,以此获得最匹配的屏幕画面。除此之外还存在两端同步问题,开发中如何解决两端同步问题是极其令人头疼的,经过尝试多种点击方式,最终选择了使用电动手指头长按和短按手机屏幕来控制安卓端小鸟的飞行轨迹。
4结语
使用TensorFlow 框架,并基于强化学习进行训练,
在训练模型时使用了DQN 算法,同时在获取交互数据时使用了一些技术手段大大降低了数据之间的联系与干扰,会有更好的训练效果。可以让小鸟自动飞行通过管道,比玩家自己玩Flappy Bird 的效果会更好,得分同时也会更高。
高压配电盒将训练好的模型转成Lite 模型后嵌入Flappy Bird 的安卓端,更加贴合大众的使用习惯,也可以更好地展示模型的效果。树莓派端的开发过程采用了Python 语
言,部署到树莓派端又进一步验证了模型的准确性以及其通用性,使用的范围会更加的宽泛。
(上接第114页)
(上接第132页)

本文发布于:2024-09-23 16:23:06,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/292080.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:图像   图片   检索   数据   搜索   智能
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议