手势识别(二)--单目手势识别算法总结

⼿势识别(⼆)--单⽬⼿势识别算法总结
版权声明:随便转,取之于⽹络,⽤之于⽹络。。。 blog.csdn/App_12062011/article/details/52749196
本⽂参考: 做修改补充(其实主要是不⾼兴写这多么,了个差不多能表达意思的⽂章改改)
⼿势有三个主要特征:⼿型,⽅向,运动轨迹
⼀个基于视觉⼿势识别系统的构成应包括:图像的采集,预处理,特征提取和选择,分类器的设计,以及⼿势识别。其流程⼤致如下:
上⾯识别过程,再分解为:
数据监测其中有三个步骤是识别系统的关键,分别是预处理时⼿势的分割,特征提取和选择,⼿势跟踪,以及⼿势识别采⽤的。
不管是⼿势检测,或者⼿势跟踪,识别,特征提取和选择是关键:
⼿势本⾝具有丰富的形变,运动以及纹理特征,选取合理的特征对于⼿势的识别⾄关重要。⽬前 常⽤的⼿势特征有:轮廓、边缘、图像矩、图像特征向量以及区域直⽅图特征等等。
《基于计算机视觉的⼿势识别研究》中提到了多尺度模型,它就是采⽤此模型提取⼿势的指尖的数量和位置,将指尖和掌⼼连线,采⽤距离公式计算各指尖到掌⼼的距离,再采⽤反余弦公式计算各指尖与掌⼼连线间的夹⾓,将距离和夹⾓作为选择的特征。对于静态⼿势识别⽽⾔,边缘信息是⽐较常⽤的特征。
《基于⼏何特征的⼿势识别算法研究》中采⽤的HDC提取关键点的识别算法,基于⽤⼋⽅向邻域搜索法提取出⼿势图像的边缘,把图像的边缘看成⼀条曲线,然后对曲线进⾏处理。
《基于视觉的⼿势识别及其在⼈机交互中的应⽤》利⽤⽅向直⽅图作为⼿势识别的特征向量。虽然⽅向直⽅图具有平移不变性,但它不具有旋转不变性。同⼀⼿势图像,经过旋转后,直⽅图会不同。⽽且⽅向直⽅图不具有唯⼀性,即不同的⼿势图像可能会有相似的⽅向直⽅图。
在进⾏特征选取时我们可以考虑结合多种特征,在《基于计算机视觉的⼿势识别研究中》提出了多尺度模型与矩描绘⼦相结合的算法,将指尖和重⼼连线,采⽤距离公式计算各指尖到重⼼的距离,再采⽤反余弦公式计算各指尖与重⼼连线间的夹⾓,将距离和夹⾓作为选择的特征,从⽽提⾼了识别正确率,并减少了识别时间。《基于⼏何特征的⼿势识别算法研究》采⽤⼏何矩和边缘检测的识别算法,⼿势图像经过⼆值化处理后,提取⼿势图像的⼏何矩特征,取出⼏何矩特征七个特征分量中的四个分量,形成⼿势的⼏何矩特征向量。在灰度图基础上直接检测图像的边缘,利⽤直⽅图表⽰图像的边界⽅向特征。最后,通过设定两个特征的权重来计算图像间的距离,再对⼿势进⾏识别。
可以看出适当的采⽤多种特征结合的算法,可以在计算的复杂度以及精确度上有所提⾼。总体来说:
⼿势检测(⼿势分割):
主要受复杂背景,遮挡,直接光源的亮度变化,外部反射,
常见⼿部检测特征选取:
基于肤⾊,基于表观,基于模型三种⼿部检测。建议,先背景去除,在结合多特征,如肤⾊+纹理(类Harr)+ADABoost做⼿部检
单晶硅生产工艺
测,HOG+PCA(设计分类器,左⼿,右⼿,双⼿交叉)做左右⼿区分。
⼀般来讲,分割⽅法⼤致分为以下三类:
⼀是基于直⽅图的分割,即阈值法,通常取灰度直⽅图的波⾕作为阈值。(《hausdorff在距离在⼿势识别中的运⽤》采⽤了阈值法。)
⼆是基于局部区域信息的分割,如基于边缘和基于区域的⽅法;(《基于⼏何特征的⼿势识别算法研究》采⽤了边缘检测⽅法。)
三是基于颜⾊等⼀些物理特征的分割⽅法。(《复杂背景下基于单⽬视觉的静态⼿势识别》采⽤了基于颜⾊空间的肤⾊聚类法,《基于视觉的⼿势识别及其在⼈机交互中的应⽤》采⽤了肤⾊滤波法。)。
每种⽅法都有⾃⼰的优点,但也存在⼀定的问题,对于简单背景的图像,采⽤阈值法能达到不错的效
果,对于复杂的图像,单⼀的阈值不能得到良好的分割效果。采⽤边缘提取⽅法时,若⽬标物和背景灰度差别不⼤时,则得不到较明显的边缘。可以采⽤多种⽅法相结合的图像处理⽅法,例如对采集的图像先进⾏差影处理,然后进⾏灰度阈值分割,或者对图像按区域分成⼩块,对每⼀块进⾏设置阈值。
涤纶编织物浸水性能试验⼿势分割是⼿势识别系统中的关键技术之⼀,它直接影响系统的识别率,⽬前的分割技术⼤都需要对背景,⽤户以及视频采集加以约束。其受背景复杂度和光照变化的影响最⼤,可以在这些⽅⾯进⾏改进。
⼿势跟踪:
受快速运动,双⼿遮挡,⾮刚体,⾮线性,⾮⾼斯,多模态。通俗的讲,就是 ⼿势⾮刚体运动,受到缩放,形变,缺少,模糊,旋转,亮度,视⾓等因素影响,建议,基于肤⾊的SIFT+肤⾊(ROI)+HOG,采⽤MeanShift
常见跟踪算法选取:
粒⼦滤波,MeanShift,基于Sift特征,基于EKF,基于SVM,基于模板匹配,
⼿势识别:
受尺度,⾓度,光照,同⼀⼿势每次演⽰的差异,分静态,动态⼿势:
⽬前基于单⽬视觉的静态⼿势识别技术主要有三⼤类:
第⼀类为模板匹配技术,这是⼀种最简单的识别技术。它将待识别⼿势的特征参数与预先存储的模板特征参数进⾏匹配,通过测量两者之间的相似度来完成识别任务。《Hausdorff距离在⼿势识别中的运⽤》中利⽤Hausdorff距离模板匹配思想来实现⼿势的识别。将待识别⼿势和模板⼿势的边缘图像变换到欧式距离空间,求出它们的Hausdorff距离或修正Hausdorff距离。⽤该距离值代表待识别⼿势和模板⼿势的相似度。识别结果取与最⼩距离值对应的模板⼿势。
第⼆类为统计分析技术,这是⼀种通过统计样本特征向量来确定分类器的基于概率统计理论的分类⽅法。这种技术要求⼈们从原始数据中提取特定的特征向量,对这些特征向量进⾏分类,⽽不是直接对原始数据进⾏识别。在《基于计算机视觉的⼿势识别研究》中虽然也采⽤了Hausdorff距离算法,但并未提出模板⼿势,⽽是对于每幅图像提取出指尖和重⼼特征,然后计算出距离和夹⾓,对于不同⼿势分别进⾏距离和夹⾓的统计,得到其分布的数字特征,根据基于
最⼩错误率的贝叶斯决策得到⽤于分割不同⼿势的距离和夹⾓的值。得到分类器以后,对于采集的⼿势图像进⾏分类识别。⽂中的多尺度模型和矩描绘⼦相结合的算法也是运⽤了统计分析技术。
第三类为神经⽹络技术,这种技术具有⾃组织和⾃学习能⼒,具有分布性特点,能有效的抗噪声和处理不完整模式以及具有模式推⼴能⼒。采⽤这种技术,在识别前都需要⼀对神经⽹络的训练(学习)阶段。
其中⽐较常⽤的是BP神经⽹络。BP ( Error Back Propagation Neural Network 误差反向传播神经⽹络)由它是⼀种能向着满⾜给定的输⼊输出关系⽅向进⾏⾃组织的神经⽹络,当输出层上的实际输出与给定的输⼊不⼀致时,⽤下降法修正各层之间旧的结合强度,直到最终满⾜给定的输⼊输出关系为⽌,出于误差传播的⽅向与信号传播的⽅向正好相反称为误差反向传播神经⽹络。BP神经⽹络的理论认为:只要不断给出输⼊和输出之间的关系,则在神经⽹络的学习过程中,其内部就⼀定会形成表⽰这种关系的内部构造,并且只要使关系形成的速度达到实⽤值,那么BP的应⽤就不存在任何的困难. 《基于视觉的⼿势识别及其在⼈机交互中的应⽤》采⽤了基于⽅向直⽅图的BP(误差反向传播)神经⽹络⽅法。
可以看出若是基于⼏何分类法算法简单,与神经⽹络的⽅法相⽐,显⽰出了可靠性,其允许定义⼀个不同⼿势类别特点的特征集,估计⼀个局部最优的线性分辨器,根据⼿势图像中提取的⼤量特征识别相应的⼿势类别,但其学习的效率不⾼,随着样本量的不断增⼤,算法识别率的提⾼不明显。但BP神经⽹络需要⼀定的学习阶段,处理过程中可能存在着中间层神经元的个数庞⼤,学习时间太长,结合系数范围太宽等严重缺点。在BP神经⽹络的实际应⽤中应该合理考虑⽹络结构。
语音播放模块
如基于Sift 静态⼿势 识别,即采⽤基于肤⾊的Sift特征,⽤PCA降维,再⽤HOG特征表述⼿势,也做PCA降维,两种特征作为特征向量,训练分类器,⽣成静态特征识别库。
基于单⽬视觉的动态⼿势 识别技术:
基于神经⽹络,基于HMMs,基于CRFs.
巡线机器人
传统的动态⼿势识别,是基于HMMs,但HMMs是与观察⽆关的,也就是说,所有的情况在对模型训练时就必须要知道,否则就⽆法对这些未经训练的样本识别。实际中,我们不可能把所有的情况都考虑清楚,也不可能把所有的训练样本都训练。其次,观察⽆关还导致了标注偏
移。虽然MEMMS在⼀定程度上解决了观察⽆关问题,但还是存在标注偏移问题。
基于模糊的条件随机场FCRF可以避免观察⽆关与标注偏移问题。
由于⼿势序列包括内部⼦结构和⽤于区分不同⼿势的外部动态结构,因此,LDCRFs不但可以辨识内部结构,同时可以辨识外部结构,针对连续⼿势,修改隐函数为模糊函数,即FLDCRFs.
本⽂对针对基于视觉的⼿势识别算法,做⼀个简单总结。后续有改进再补充。
>锦纶6切片

本文发布于:2024-09-22 05:41:11,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/230661.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:识别   特征   图像   距离
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议