少数民族服饰图像分类检索技术综述

作者:王淳 逯洋
来源:《浙江纺织服装职业技术学院学报》2022年第03期
        摘 要:少数民族服饰图像分类检索技术的发展对少数民族服饰文化的保护和传承具有重要的影响。本文梳理现有领域内的研究成果,概述了少数民族服饰图像分类检索的方法,分析了基于传统图像内容的少数民族服饰的分类检索方法和基于深度学习的少数民族服饰的分类检索方法之间的差异和优缺点,梳理了当前研究中存在的问题。综述结果表明:传统的方法可以得到较高准确率,但是只适合分类类别数量少且分异度高的任务;基于深度学习的方法则适用于图像类别多且分异度低的分类检索任务。
        关键词:少数民族服饰图像;分类检索;深度学习
        中图分类号: TS941.17 文献标识码:A 文章编号:1674-2346(2022)03-0000-
        少数民族服饰很大意义上象征了每个民族的文化传承,也是中国传统文化中最宝贵的重要财富之一。由于文化发展的不同,形成了风格、习惯不同的民族。在风格各异的少数民族服饰中,人们容易混淆各个民族的类别。根据调查发现,少数民族服饰图像分类的方法稀少,一方面由于少数民族服饰文化随着时间的流逝,部分服饰元素消失在历史长河里,导致无法追溯;另一方面,从计算机的视角对少数民族服饰图像进行分类需要研究者对计算机领域和少数民族服饰文化领域均有所涉猎。少数民族服饰是民族文化的具象体现。不过随着社会科技化,大量需要传承的传统民族服饰逐渐趋向日常化,丧失了属于本民族的民族特元素,如何对少数民族服饰图像进行保护,值得深入研究。为了处理人工手动对少数民族服饰图像分类存在的误差与问题,越来越多的研究者采用图像处理技术来代替手动分类。
        少数民族服饰图像分类的实质是利用图像的形象特征来确定服饰所属的民族与类别,按图像的任务分类可以细分为民族种类分类(例如侗族、苗族、布依族等)以及民族服饰属性分类(比如纹样分类、颜分类、款式分类等)两种。分类基本流程如图1所示,首先对少数民族服饰的图像采取预处理操作,然后用传统或深度学习的方法提取处理后的图像中的图
像特征,可以得到特征向量。最后将获取到的特征向量准确输入到对应的分类器中,进行相对细化的分类,由此就可以输出少数民族服饰的类别。
        当前少数民族服饰图像的分类方式可以分为基于传统图像内容的少数民族服饰图像分类检索方法和基于深度学习的少数民族服饰图像的分类检索方法这两种。
        少数民族服饰图像分类方法的常用评估标准与服装图像分类方法相同,常用的评估标准有准确率(Accuracy)[1]、召回率(Recall)[2]、精准度(Precision)[3]和平均精度均值(mean Average Precision,mAP)[4]等。
        本文梳理了近几年来少数民族服饰图像的分类检索方法,并针对近几年少数民族服饰图像分类的方法做出了总结。
        1 基于传统图像内容的少数民族服饰图像分类检索方法
        基于传统图像内容的少数民族服饰图像分类检索方法所提取的图像特征中,包括局部特征和全局特征,有一定的局限性。局部特征是针对图像中的某个特定区域被提取出来的图像描述符,如尺度不变特征(Scale Invariant Feature Transform,SIFT)[5]。基于全局特征的
方法虽然可以描述整体属性,但是区分度不大,对部分特征具有局限性,如场景特征。全局特征可以分为纹理特征、颜特征和形状特征等。基于传统图像的内容,从全局特征和局部特征这两个方面,描述少数民族服饰图像的分类检索。
        1.1 基于全局特征的少数民族服饰图像分类检索
        1.1.1 基于纹理特征的少数民族服饰图像分类检索
        纹理特征属于全局特征,用来说明图像以及图像区域下所对应物体表面的性质,比如图像纹理的粗细、稠密等特征。研究图像纹理特征最早可以追溯到1962年Julesz[6]的工作。常见的纹理特征提取算法有Laws纹理能量测度算法[7]、灰度共生矩阵、局部二值模式(Local Binary Pattern,LBP)[8]等。
        贾学明等[9]针对彝族服饰,提出了一种基于图像纹理与统计概率分析的识别方法,通过对区域特点的不同,实现对图像的分割,提取出基础服饰的纹理,利用Laws算法的特性对基础图案纹理的能量进行提取,同时用矢量图统计相应纹理数量,并对向量统计的有效性与相似度进行分析,最后得到纹理差异比,验证了地域改变,会造成服饰之间的差异性。
        纹理特征通过计算少数民族服饰图像中局部重复出现次数的方式来描述对应图像,有较不错的旋转不变性,不过就算同一个地区或相邻的地区,其服饰的纹理也不尽相同。
        1.1.2 基于颜特征的少數民族服饰图像分类检索
        颜特征是全局特征的一种。颜特征提取方法有很多种,包含但不限于颜相关图和颜直方图等。颜直方图在衡量和比较图像全局差的方面具有优势。它具有旋转不变的特性,同时也具有很好的鲁棒性,但是传统的直方图没有空间信息因素。Shen等[10]通过对少数民族服装图像中定义的几个子块的颜直方图进行组合,将空间信息融入其中,并采用不同的量化数的RGB、HSV和LAB 3个颜空间来测试融入后的性能;文献[11-13]也运用了融合RGB颜空间下的颜直方图,以此为特征,从而进行后续的分类操作。
        1.1.3 基于形状特征的少数民族服饰图像分类检索
        形状特征描述了物体的形状,是全局特征的一种,相对稳定并且在鲁棒性方面较好[14]。常见的形状特征可以分为边界轮廓和内部区域特征两种。
        由于目前提出的单一类型的全局特征的算法,都存在一定的局限性,所以越来越多的研
究者采用多种全局特征融合的方法进行研究,力求提高准确率。文献[13]描述形状边缘,得到形状特征直方图,融合相似性度量公式,进行后续操作,从而实现对图像的检索。
        1.2 基于局部特征的少数民族服饰图像分类检索
        全局特征是针对少数民族的服饰图像特征的整体描述,所以对局部特征信息较为迟钝。但在一定条件下,提取到一定量的局部特征信息就可以完成少数民族服饰图像的分类。常用的局部特征描述子有快速鲁棒性尺度不变(speeded up robust features,SURF)[15]、尺度不变变换(Scale Invariant Feature Transform,SIFT)、方向梯度直方圖(Histogram of Oriented Gradient,HOG)[16]、梯度位置和方向直方图(Gradient Location and Orientation Histogram,GLOH)[17]和旋转不变特征变换(Rotation-Invariant Feature Transform,RIFT)[18]等。
        在局部特征描述子中,SIFT描述子具有代表性,并且应用广泛,该描述子具有较强的区分性,针对一定视角光照的变化、图像旋转以及尺度变化具有比较高的鲁棒性。SURF描述子采用的主要策略和SIFT描述子都是通过计算主方向本身及旋转方向来达到旋转不变性,不过SURF运用积分图以及海森矩阵行列式特征点检测的方法提高计算速度。陈金广等[19]人对
比了在噪声干扰、尺度变化和图像旋转等情况下,SIFT和SURF算法在民族服饰图案特征上所提取的匹配率,验证了某些情况下SIFT算法正确匹配率比SURF算法高,但相比之下SURF算法有较低的时间复杂度;Huo等[20]针对民族服饰分类任务提出了基于局部和特征相互融合的分类方法,在该方法中融入了SIFT特征,实现了对多个少数民族服饰图像的分类,并提高了准确率。
        HOG特征通过计算梯度方向出现的次数来实现统计,是较为常见的局部特征,基于该特征的分类方法更偏向形状方向的少数民族服饰图像分类。Zhang等[21]结合HOG和结构森林算法对少数民族服饰图像进行特征计算,得到了更强的适应性,并且具有较高的分类精度。
        1.3 基于多种特征的少数民族服饰图像分类检索
        提取单一类型的全局或局部图像特征进行分类,具有一定的局限性。为了扩大分类检索任务适用范围,需要融合多种特征的方法。
        Zhao等[22]人模糊颜形成多特征融合,有效地避免了简单分割算法导致的分割不准确
和复杂分割算法造成的计算复杂度高,同时,引入了区域权重因子抑制了复杂背景和干扰区域产生的负面影响,提高了算法的鲁棒性;周前前等[23]构建了一种全局-局部特征的提取模型,提出关于新的细粒度民族服饰的图像检索提取方法,实现了细粒度检索。然而,现有的各类方法难以针对少数民族服饰图像中细粒度属性特征来进行分类和检索,需要结合重排序完成细粒度检索任务。许多工作使用重排序方法提高检索准确率,Pedronette等[24]引入最短路径算法,对上下文图像进行了重定义和重排序,在算法的每一个步骤中根据检索列表的相似度更新图像之间的距离,完成图像重排序;Yu等[25]直接对全局特征以及局部特征进行了融合,根据模糊对象在特征空间中的邻域对其特征进行细化的相似度计算,得到了重排序的结果,但是没有考虑到在特征融合过程中,可区分的细粒度特征不能得到很好地表示,导致其检索准确率较低。
        1.4 少数民族服饰图像数据集
        少数民族服饰图像数据集是评估和衡量少数民族服饰分类性能的重要数据来源,但是关于少数民族的服饰图像的公共数据集较为稀少,大多数的少数民族服饰图像数据集都是来自线上图像库以及研究者自建的少数民族服饰图像数据集,因此权威性不足。自建少数民族服
饰图像数据集的原始数据来自实地拍摄、博物馆信息采集、网络搜索等多种途径,收集的图片格式不够系统,图片大小、格式也不统一,因此需要通过对原始图片进行格式大小、区域分割等一系列操作,才构成了各个自建的少数民族服饰图像数据集。
        上述基于传统的少数民族的服饰图像分类检索方法分别针对不同问题,各类传统图像内容的少数民族服饰图像分类检索方法的对比分析结果见表1。但是由于少数民族服饰种类不断增多,传统的方法进行前的预处理、匹配等过程耗时较长,不能详尽地描述复杂的分类任务。总的来说,传统的方法对某些分类任务具有局限性,过于依靠特征选择,适合分类类别数量少且区分度高的分类任务。
        2 基于深度学习的少数民族服饰图像的分类检索方法
        深度学习的快速发展,促进了各个领域的研究,在少数民族服饰图像分类领域中也出现了一些基于深度学习的少数民族服饰图像的分类检索方法。
        基于深度学习的少数民族服饰图像分类检索方法由神经网络自动学习获得。深度学习的方式有3种,分别是有监督学习、半监督学习和无监督学习,同时根据特征深度的不同,分为浅层特征和深层特征。
        2.1 基于神经网络的少数民族服饰图像的分类检索方法
        神经网络拥有大量的神经元,神经元之间互相连结搭成神经网络。神经网络由输入层、隐藏层和输出层3层构成。传统神经网络的模型如图2所示。
        常用的深度神经网络模型主要有卷积神经网络(Convolutional Neural Networks,CNN)[26]、全卷积网络(Fully Convolutional Network,FCN)[27]、概率神经网络(Probabilistic Neural Network,PNN)[28]以及径向基神经网络(Radial Basis Function,RBF)[29]等。

本文发布于:2024-09-22 04:17:51,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/449837.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:图像   服饰   特征   少数民族   分类   检索
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议