基于深度图像分割的场景物体识别与匹配

Development and Innovation  | 发展与创新 |
·219·
2019年第17期
基于深度图像分割的场景物体识别与匹配
左向梅,武  亮
(中国飞行试验研究院,陕西 西安 710089)
摘 要:场景物体识别与匹配是通过二维图像进行三维场景分析的重要步骤。针对现有的三维场景分析方法只是简单的将深度相机获取的图像点云数据进行配准得到原始场景的不足,通过对已进行图像语义分割的物体,利用一种改进的随机回归森林方法对物体区域进行识别,并与建立的数据库中模型匹配,根据深度信息将获得的三维模型变换到场景中,实现场景物体的识别与匹配。通过拍摄的实验数据,验证了本方法的可行性。结果表明,本方法能够获得较好的识别与匹配结果。
关键词:物体识别;图像分割;随机回归森林;模型匹配中图分类号:TP391.4    文献标志码:A    文章编号:2096-2789(2019)17-0219-03 作者简介:左向梅(1990—),女,硕士,工程师,研究方向:计算机图形图像处理。
随着深度相机、立体相机、结构光和激光扫描仪等各种三维图像传感器的广泛应用,场景识别技术得到迅速发展。文章的研究针对消费级的Kinect 深度相机,提出了适用的场景物体识别与匹配方法。该方法不是简单地将深度相机获得的多幅图像点云数据进行配准得到原始场景,而是对原始场景中的所有物体进行识别,并与建立的数据库中模型匹配,实现场景的语义重建。首先通过Kinect 深度相机拍摄真实场景的彩和深度(RGB-D )图像,对其进行分割,得到具有语义标签的物体区域。利用随机回归森林方法(RRF )对图像分割后的物体区域进行三维模型的识别与匹配,并根据深度信息将获得的三维模型变换到场景中,实现场景物体识别与匹配。
植物伟哥
1  交互式图像分割方法
在文章[1]中提出的交互式图像分割方法,经过分割后的图像,每个像素都带有语义标签。本文将详细描述如何使用带有语义标签的分割图像,从创建的模型库中准确匹配出对应的模型,用来进行三维场景物体识别与匹配。这个过程主要分为以下三步:(1)对获取的分割图像进行处理,得到有语义信息的像素集,称之为子块,其中每个子块代表了一个独立物体。(2)从数据库中获取训练图像,对随机回归森林进行训练得到分类器。(3)根据子块的特征信息,利用分类器对其进行测试,并从创建的数据库中得到物体的匹配模型及配准信息。1.1  数据库模型获取
文中使用的三维模型数据,是从互联网上下载得到的,并对其进行整理,建成数据库。在后续对随机回归森林进行训练时,使用的数据是由模型库中每个物体的深度图像渲染得到的。具体方法是对物体的深度图像以随机的方位角和距离参数进行采样。在模型匹配算法中,有很多参数可以控制随机回归森林的构建和训练过程,实验中对每一个森林总共训练15棵决策树,对每幅图像进行采样,得到大小为120×80的75个子块。这样对每个模型获得的训练子块总数目就为540×75。1.2  分割图像中物体子块提取
经过分割算法后,图像中每个像素都有一个类别标签,必须对属于相同类的像素进行聚合,得到一个有意
义的子块。首先,从分割结果中提取相连的且具有相同类标的像素集合。通常场景中的物体都是放在地面上或者平行于地面的平面上,将从二维图像中提取的连接区域依据它们的深度信息投影到地面上,并在这个维度上检测独立连通区域。进行这样的操作后,场景中大部分物体都能被正确检测。
经过上步操作,得到一些连通区域,里面可能会存在一些不可靠的物体或者是噪声误差引起的错误判断,为此,去除掉区域范围<3000个像素点的,以及区域平均最大类概率<0.5的。经过处理后提取的物体块如图1所示。从对比图中可以看出,场景中比较明显的物体被正确保留,而噪声和无效区域被消除了。
1.3  基于随机回归森林的场景物体识别与匹配
文章将模型匹配问题转化成一个模型实例识别问题。对于每一个分割物体子块,使用随机回归分类[2]来学习一个映射。将采样得到的物体子块映射到条件概率
p(m|P)
上,其中m 是模型实例标签,也就是模型在数据库中的索引, P
表示来自于物体深度数据的子块,概率最高的模型被认为是与分割物体最相似的。同时,也可以学习得到分割物体在场景中的方位与变换的映射。文章提出的匹配方法是在一般辨别型随机回归森林方法
基础上,进行了两点改动:(1)两类分类器被扩展到多类分类器。文章创建数据库中的模型实例标签,可以看作是随机回归森林的离散随机变量,并且修改了测试阶段构建决策树的熵和概率分布的计算。在实现中使用向量表示概率分布。(2)文章使用了不同的几何特征,
图1 分割图像的物体子块提取
(a)交互式图像语义分割结果;(b)物体子块提取结果
DOI:10.19537/jki.2096-2789.2019.17.102
| 发展与创新| Development and Innovation
·220·2019年第17期
比如子块区域的几何矩(geometry moment),旋转图像
(spin image)来改进识别精度。以下详细介绍本文匹配方
法的实施细节。
(1)训练。训练随机回归森林的数据是从数据库
中三维模型深度图像渲染得到,这些模型都带有模型类
别标签,方位角和与虚拟摄像机的距离信息。从训练深
度图像中随机采样得到子块集合,用这个集
合来创建森林 t
T={T}中的每棵树T。I i是从子块像素提取
的特征,是与子块 P i相关联的参
隧道隔音降噪施工>震动粉扑
数,其中是方位角,t是模型中心与摄像
机的距离,m i是子块所属模型的索引。
文章使用随机分裂选择策略[3]构建决策树。在每个
非叶子节点,对随机选择的I i特征通道进行大量的二进
制测试。经过测试以后,训练数据被分离为两个集合:
满足测试的子块被传递给右子节点,剩下的没有通过测
试的子块被传递到左子节点。在最终测试中选择能最大
化信息增益IG的二进制测试。
无水厕所(2)测试。在测试阶段,使用25个数据库模型的
深度图像来测试随机回归森林的识别精度,以不同的尺
儿童跷跷板
度和方位角对这些深度图像进行采样,得到测试子块集,
并传入森林中的每棵树中。通过存储在每个节点中的二
进制测试后,这些子块沿着树向下走,直到叶子节点。
用叶子节点l上的概率分布来评估子块的参数。
经过测试后,所有采样子块在参数空间形成大数目
的投票,需要将其整合得到最终结果。为了估计方位角
结片机
度,从所有的选票中取方位角度分布的均值,先用均值
漂移算法[4]对其进行聚类,设定内核半径为15。对于
那些以大点数落在集中的投票,平均它们的方位角度
和距离分布的均值,以得到最终的估计。摒弃随机变量
方差总和>0.3的叶节点,3个概率最高的模型作为被
分割对象的候选相似模型。执行模型放置过程,并选择
一个具有最高匹配分数的模型作为最终结果。
2  实验结果
为了测试训练精度,人为地决定数据库中与测试物
体最匹配的三个模型,如果经过测试后得到的前三个概
率最大模型在选出来的三个模型中,就认为匹配正确,
将成功匹配所占的百分数作为识别精度。采样子块数
与识别精度关系如图2所示,随着采样子块数的增加
精度也在提高,采样间隔与识别精度关系如图3所示,
显示了识别精度与测试阶段的采样间隔的关系。采样间隔越小,采样密度越大,测试阶段从深度数据中采样的子块数越多,获取数据丢失的信息就越少,识别精度自然就高。文章验证了决策树的最大深度对识别精度的影响,如图4所示。在实验中,设置最大深度为18m,这样可以在保持高识别精度的同时实现较好的方位角和尺度估计。
针对拍摄的场景图像,经过交互式分割后得到物体子块,使用上述匹配方法,从创建的数据库中检索出最相似的三个模型。基于随机回归森林的物体匹配结果如图5所示,其中(a)为交互式分割得到的物体子块,(b)为使用随机回归森林从数据库中匹配出的三个最相似模型。3  结束语
文章主要介绍了如何根据分割后的图像对场景中物体进行识别。为解决场景存在自遮挡现象问题,文章选择从创建的数据库中匹配出三维模型并置于重建场景中合适的位置,对传统的随机回归森林分类器进行几点改动,得到适合文章方法所需要的分类器。实验表明,该分类器能准确地从数据库中匹配出场景中物体的相似模型,并得到它们的对准信息,计算出模型在场景中的准确位置和姿态,实现场景物体识别与匹配。
参考文献:
[1]左向梅,赵振,苟婷婷.基于交互式条件随机场的RGB-D图
像语义分割[J].计算机应用与软件,2017
(3):152
.
图2 采样子块数与识别精度关系
图3 采样间隔与识别精度关系
图4 决策树深度对识别精度的影响
Development and Innovation  | 发展与创新 |
·
221·
2019年第17期
5 基于随机回归森林的物体匹配结果
(a)分割物体子块;(b)从数据库中匹配的最相似模型
[2]L.Breiman.Random forests[J].Machine Learning,2001,
45(1):5-32.[3]T.G.Dietterich.An experimental comparison of three
methods for constructing ensembles of decision trees:Bagging boosting, and randomization[J].Machine Learning,2000,40(2):139–157.[4]D.Comaniciu,P.Meer.Mean shift:A robust approach
toward feature space analysis[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002, 24(5):603-619.
(上接第214页)间,使得传动效率比较低,而履带内藏式行星减速器具有机械易通过、占用空间小、工作效率高等优势,在煤矿掘进工作中已经得到了广泛的应用,其中典型代表就是挖掘机[4]。
2  煤矿高效掘进技术的发展趋势
未来煤矿高效掘进技术的发展趋势将主要体现为掘锚一体化,现在美国和澳大利亚等国家在掘锚作业中都开始使用掘锚机进行平行作业。相比于在锚杆钻车和采煤机之间进行交叉换位施工,掘锚技术具
有更加广泛的应用范围,同时其支护效果也相对更高,在业内引起了广泛关注。除此之外,掘锚一体化技术还能在顶板条件不好的双巷或者单巷中掘进,并且掘进速度比较快。将循环的时间严格控制在半小时以内,每天进尺量可以达到40~50m ,在顶板暴露之后对其进行及时的安装,可以使支护的质量得到大幅度的提升,同时还能保证巷道的成型性,极大地改善了支护作业的环境[5]。
要想对煤矿高效掘进工作进行升级,掘锚一体化技术必将是未来的主要发展方向。其不但能够提升煤巷掘进的高效性,还能提升技术水平,在我国的发展前景比较好。根据当前我国的地质条件和工艺技术,深入研究掘锚一体化技术,能够为该技术的应用和推广创作条件。对于半煤岩巷掘进技术来说,需要不断对技术进行升级,提升悬臂式掘进机的工作性能,从而提升整机的自动化
工作能力,而悬臂式掘进机的未来发展方向也将向重型化和自动化方向发展。
3  结束语
综上所述,随着我国经济发展水平的提高,对煤的需求量不断增加,自然资源毕竟是有限的,这也使得煤炭开采环境越来越复杂。未来要更好地开展煤炭开采工作,提高生产效率,就需要对掘进技术进行升级,充分引进现代化技术,提升煤矿掘进的工作效率,不断实现自动化生产,促进煤矿行业的进一步发展,为我国国民经济发展作出更大的贡献。
参考文献:
[1]杨斌.煤矿巷道高效掘进技术现状及发展趋势[J].现代矿
业,2017,33(7):185-186.[2]安朝晖.我国煤矿巷道掘进技术和装备发展[J].煤炭科技,
2017(4):15-17.[3]张兴华.煤矿高效掘进技术现状及发展[J].机械管理开发,
2016,31(4):135-137.[4]李国辉,李基,吴婕萍.国内岩巷快速掘进技术发展现状及
其趋势[J].煤矿现代化,2015,6(8):108-110.[5]夏金刚.我国煤矿巷道掘进技术和装备的现状与发展[J].
黑龙江科学,2014,4(4):29-33.

本文发布于:2024-09-23 22:33:38,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/249525.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:物体   进行   模型   得到   场景   识别
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议