融合多特征与互信息选择集成多核极限学习机的影像分类方法

第36卷第1期2021年2月
遥感信息
Remote Sensing Information
Vol.36,No.1
Feb.,2021融合多特征与互信息选择集成多核极限
杨素妨,曾红春
(百学院,广西百533000)
人脸识别巡更系统摘要:针对影像分类结果的类间差异性与准确性难以平衡的问题,提出一种融合多特征与互信息选择集成多核极限学习机的影像分类方法。该方法首先利用最小噪声分离提取影像的光谱特征,考虑到高分辨率影像局部细节信息清晰,利用LBP算子提取影像的局部纹理信息,采用泛化性能好的核极限学习机训练多个弱分类器;然后,通过引入相关性准则描述准确性,冗余性准则描述差异性,将选择性集成多核
极限学习机问题转化为变量选择问题;最后,利用基于互信息的最大相关最小冗余准则,对生成的多核极限学习机进行选择,从而实现影像分类结果差异性与准确性的平衡。文章采用高分二号数据实验,总体分类精度和Kappa系数分别为92.03%、0.9。分析结果表明,该方法能够利用多种特征的分类优势,进而有效改善了高分二号影像的分类结果。
关键词:融合多特征;互信息;选择性集成;极限学习机;影像分类
doi:10.3969/j.issn.1000-3177.2021.01.009
中图分类号:TP751文献标志码:A文章编号:1000-3177(2021)01-0056-05
Image Classification Method Based on Multiple Kernel
Extreme Learning Machine Integrated by Multi
Features and Mutual Information Selection
YANG Sufang,ZENG Hongchun
(Baise University^Baise9Guangxi533000,C/izna)
Abstract:Aiming at the problem that the difference and accuracy of image classification results are difficult to balance,a new image classification method is proposed,which integrates multi-core learning machine with multi feature and mutual information selection.In this method,firstly,the spectral features of the image are extracted by the minimum noise separation, and the local texture information of the image is extracted by LBP Operator,considering that the local details of the high-resolution image are clear.Then,by introducing correlation criteria to describe the accuracy and redundancy criteria to describe the difference»the problem of selective integration of multiple kernel extreme learning machine is transformed into the problem of variable selection.Finally,use the maximum correlation minimum redundancy criterion based on mutual information to select the generated multiple kernel extreme learning machine,so as to achieve the balance between the difference and accuracy of image classification results.In this paper,GF-2data are used for experiments,and the overall classification accuracy and Kappa coefficient are92.03%and0.9,respectively.The analysis results show that the proposed method can utilize the classification advantages of multiple features,and improve the classification results of GF-2images effectively・
Key words:multiple feature fusion;mutual information;selective integration;extreme learning machine;image classification
0引言不断提高,影像数据量呈现爆发式增长,为国家数字城市规划、地理国情监测、智慧城市建设等提供数据
近年来,随着空间技术的发展,影像空间分辨率保障。仅利用影像的光谱特征进行影像分类,未能
收稿日期,2020-03-25修订日期=2020-05-23
基金项目:广西自然科学基金项目(2017GXNSFAA198746);广西高校中青年教师基础能力提升项目(2O2OKY19O21).
作者简介:杨素妨(1979-),女,硕士研究生,讲师,主要研究方向为影像分类、空间信息提取及3S技术应用。
E-mail:yangsh_79@163
56
引用格式:杨素妨,曾红春.融合多特征与互信息选择集成多核极限学习机的影像分类方法[J].遥感信息,2021,36(1):56-60.
充分挖掘影像的多种特征信息,因此影像的分类精度难以满足要求。而将影像的多种特征与高性能的机器学习分类器结合的方法,已逐渐成为目前主流趋势。
常用的分类器有决策树、支撑向量机(support vector matchine,SVM)、随机深林(random forest, RF)、极限学习机(extreme learning machine,ELM)等极限学习机具有训练简便、结构简单,不需要调整隐含层参数信息,仅通过控制最小化训练误差和输出权重实现极限学习机分类器的生成,克服了传统神经网络的容易陷入局部最小、训练速度慢的问题。楚恒等⑷提出多特征多核的ELM分类方法,该方法将影像对象的光谱、空间特征通过简单多种核加权组合的方式进行融合,未能充分体现出不同特征在不同影像对象上的表达优势。王明常等皈提出利用极限学习机对高分二号遥感影像进行分类,通过多种分类器分类结果的对比,分析极限学习机在高分二号遥感影像上的准确性能,结果表明该方法运行时间快、分类准确率高。Huang等⑷通过类比支持向量机的映射函数与极限学习机隐含层的特征映射,提出改进的核极限学习机分类器,为后续集成算法与极限学习机模型的结合提供一种思路。付琼莹等刀提出一种选择性极限学习机集成算法,提高了遥感影像的分类精度。韩敏等図提出基于互信息选择集成的核极限学习机分类方法,但该方法仅利用影像的光谱信息进行分类,缺少多纹理信息的考虑。
鉴于此,为了充分挖掘影像的多特征信息,提高影像分类结果准确性与差异性平衡问题,本文提出融合多特征与互信息选择集成多核极限学习机的影像分类方法。通过提取影像的光谱特征与局部纹理特征作为训练简单、泛化能力强的核极限学习机的输入,同时通过最大相关与最小冗余互信息准则对核
极限学习机选择性集成,确保最终集成的核极限学习机的输出结果与真实分类结果的整体准确性,较好地平衡类间差异性。
1多特征选择
1.1光谱特征
由于高分辨遥感影像波段间存在大量的冗余信息,采用最小噪声分离(minimum noise fraction,MNF)重新分配数据中存在的信息与噪声,通过数据变换的方式将有效信息集中少量波段数据中。MNF变换的本质是通过2次主成分分析(principal component analysis,PCA)[9]的叠加。为了进一步进行波谱处理,通过检查最终特征值和相关图像来判定数据的内在维数。通过MNF影像变换处理,数据空间被分为二类:一部分是与较大特征值和相对应的特征影像,其余部分是与近似相同的特征值相对应以及噪声占主导地位的影像。与PCA变换获得的影像相比,MNF 变换获得的特征影像能有效地保留影像的特征信息,避免因信、噪分离对特征影像质量的影响。
1.2纹理特征
由于影像分辨率的提高,影像上的相邻不同地物边界清晰。文献口0]研究发现,采用LBP纹理特征能够有效地表达地物边界信息。因此,本文采用LBP特征来表达影像的局部纹理信息。LBP特征通过计
算影像局部区域强度信息与中心点影像强度关系来表示该区域的局部纹理信息。由式(1)、式(2)计算LBP纹理特征。
式中:乩为影像中心像素强度值;SQ)为关于工的分段函数。本文在提取LBP纹理特征时采用3X3的局部邻域,g”为&相邻的8个方向的像素强度值。其中
pinsetLBP(gc)=
8
^2p S(g p—g c)
p=o
(1)
(1if无$0
SQ)=Io其他(2)
2基本原理
2.1核极限学习机
极限学习机由输入层、隐含层以及输出层3部分组成。对于给定的训练样本,通过不断地优化连接输入层与隐含层间的输入权重与偏置值,并在训练过程中保持不变。假定给定{卫,“}异=1, 2,…,N的训练样本集,其中,竝为训练样本的输入值为对应的输出值。设极限学习机存在人个隐含层节点,网络输出为/,g(*)为激活函数,则极限学习机的输入输出模型可以表示为式(3)。
h
=另7+5)=1,2,…,N(3)
i=i
温湿度控制系统式中:输入节点的输出权值与第z个隐含层节点用伦表示;第分个隐含节点的输入权值与输入节点用0表示;第亍个隐含节点的偏置值用6表示。
_g(wi关无1+彷)
g(Ct)l关力2+弘)
_g(CO1兴力n+弘)
H=
…g((WL关©+加)_
••• g(o)l杲兀2+)
・・•g(CO L兴Z n+"1)」NXL 0
LXl
A-
卩2
,T=
C2
A-LXl c L_
57
遥感信息2021年1期
输出权值即可以表示为式(5)。
3=H*T(5)
式中:为矩阵H的逆。
将支持向量机中的核函数映射的思路替换极限学
习机中的隐含层肌,则核极限学习机可以表示为式(6)。
minP elm=寺II II2+
因此,核极限学习机的输入输出模型为式(7)。
fCx)==7i(z)HT(吉+HffT)t(7)
苎麻纱
定义极端学习机核矩阵为式(8)。
f^ELM=HH T
flELMi.J=h(Xj)=K(X;,Xj)(8)
对应的输入输出模型可以表示为式(9)。
K(x,x2~) K(x,x N)(9)
/(z)=
隐含层的特征映射肛z)在核极限学习机中是未知的,但通常采用核K(“,》)(如K(“,》)= exp(-y H/z-vll2))进行计算,减少了因设置隐层节点数(特征空间的维数)不合理带来分类结果较差的影响。
因此,核极限学习机具有极限学习机与支持向量机有效分类的优点。
2.2最大相关最小冗余信息论准则
在影像匹配、影像分类中,可以利用互信息衡量2个向量间的相关性。
文献[12]提出利用互信息引导输入变量与极限学习机模型,通过最大相关最小冗余信息原则的方法优化学习算法,然后对优化的核极限学习机进行多核的选择性集成。
2.3融合多特征与互信息选择集成多核极限学
习机的影像分类方法
本文提出融合多特征与互信息选择集成多核极限学习机的影像分类方法,具体步骤如下。
步骤1:选取影像上的测试样本数据,提取影像的光谱特征与LBP纹理特征。为了保证像元的差异性,分别对光谱特征与LBP纹理特征进行归一化处理,构成影像的光谱■纹理复合特征。利用Bootstrap 算法将用于训练的样本数据随机分成”组样本量为L的训练样本子集。S={xi,k,yi,k}G R d, yi,k G R,i=1,2,,n,k=1,2,•••,L0
步骤2:利用训练样本数据集S,确定核函数以及对应的初始化参数,获得极限学习机核矩阵。
步骤3:通过核矩阵求解核极限学习机。
步骤4:迭代计算步骤2、步骤3,获得尬个核极限学习机分类模型。
步骤5:利用勿个核极限学习机分类模型,在检验样本数据上预测类别输出。
步骤6:根据实际样本值与m个核极限学习机分类模型,预测输出值,并计算二者间的最大相关最小冗余信息。
步骤7:依据每个弱分类器的最大相关最小冗余信息进行m个子核极限学习机排序。
步骤8:不断增加集成数量,对前加个子核极限学习机进行集成,通过投票算法获得最终的影像分类结果。
通过引入互信息的最大相关最小冗余准则进行多核极限学习机影像分类,可以增加影像分类结果与真实结果间的相关性,同时减弱多个弱分类器间的冗余信息,达到充分利用各个分类器间的差异。采用最大相关最小冗余信息准则使得影像分类结果与真实结果间的相关性最大而冗余性最小,即获得预测准确性高而相互间差异性较大的多核极限学习机,集成解决分类结果类间差异与分类精度不平衡问题,通过多种特征的融合充分挖掘影像的多种影像信息,提高最终的影像分类精度。
3实验与分析
本文采用武汉大学计算视觉与摄影测量研究组发布的高分遥感影像数据集(GaoFen image dataset, GID),该数据集收集60多个不同城市的150幅高质量的高分二号卫星影像,覆盖面积超过50000km\随机选取1组样本数据进行训练与分类。将训练好的模型在2018年6月18日高分二号卫星获取的某地遥感
影像数据上进行验证测试(图1)。该数据包含空间分辨率为1m的全影像数据与空间分辨率为4m的多光谱影像数据。
为验证本文提出算法的有效性,将本文算法与支撑向量回归(support vector regression,SVR)、极限学习机、核极限学习机(kernel extreme learning machine,KELM)的分类结果进行比较,对比不同算法的分类精度与Kappa系数。
在实际核极限学习机训练过程中,在GID数据集中进行样本数据的随机选取。选用核宽为10、正则化参数为10的高斯核为核极限学习机的核函数。训练样本的70%用于训练模型,剩下的30%作为检验样本,用于确定集成的核极限学习机个数。每次
58
引用格式:杨素妨,曾红春.融合多特征与互信息选择集成多核极限学习机的影像分类方法[J].遥感信息,2021,36(1):56-60.
图1高分二号影像
生成20个基核极限学习机进行选择性集成。
图2为核极限学习机在GID数据集的集成个数与分类精度的关系曲线。从图2可以看出,本文提出的融合多特征与互信息选择集成多核极限学习机的遥感影像分类方法对多个弱分类器进行排序,通过测试集成个数与分类精度的变化趋势可知:分类精度随着集成个数的增加先急速上升再缓慢下降最后趋于稳定,在个数为7时分类精度最高的为94.16%;由于前期参与集成的弱分类器与真实分类结果存在较大的相关性且不同弱分类器间的冗余性相对较小,所以分类精度呈急速上升趋势;随着集成弱分类器数目的增加,引起分类结果恶化现象,说明引入互信息选择集成多核极限学习机的优越性。通过与SVR、ELM、KELM算法对比,验证本文方法整体RMSE值较小,预测分类结果最好。集成个数在m=7时获得预测分类结果最好,因此本文集成个数设置为7,对高分二号数据进行分类,验证模型的准确性。
图2不同算法在GID数据集的集成个数与分类精度关系
为了进一步验证所提算法的优越性,将所提算法应用于某地拍摄的高分二号数据进行分类实验。分类结果见图3,每种地物的分类结果精度统计见表
图3高分二号分类结果
极限学习机分类精度%表1融合多特征与互信息选择集成多核类别制图精度用户精度错分精度漏分精度
未分类96.2697.81  1.83  2.54
建筑95.1484.9614.12  4.88
裸地91.0195.32  5.019.22
道路87.2292.89  5.9814.21
林区82.2197.56  2.5419.03
耕地94.5295.87  4.37  5.23
水体95.628&6111.61  5.46由表1可知,本文提出的分类模型对不同地物的分类精度较高。另夕卜,将SVR、ELM、KELM算法以及采用单一光谱特征方法进行对比实验,如表2所示。
表2高分二号测试数据不同分类方法精度对比
分类方法分类精度/(%)Kappa系数
SVR8&750.84
监控备用电源
ELM86.750.83
KELM90.560.88
单一光谱特征91.820.89
单一纹理特征89.480.86
本文方法92.030.90
由表2可以得出如下结论。
1)本文采用融合多种影像特征作为分类器的输入进行影像分类相比于单一光谱特征作为分类器的输入数据具有更高的分类精度。将光谱特征作为SVR.ELM分类器的输入进行分类,其中分类精度
59
遥感信息2021年1期
较高的SVR分类器的精度为8&75%,Kappa系数为0.84,本文分类方法比SVR高3.28%,Kappa系数高0.06,这是由于本文融合了光谱特征与局部纹理特征,在特征提取阶段充分利用影像分辨率高能够表现局部信息特点,通过引入LBP局部纹理信息能较好地表达相邻地物边界信息及区分不同地物边界,影像分类精度会有所提高。本文方法体现了多特征融合能充分挖掘遥感影像信息在分类应用上的优势。
2)从不同特征表现来看,采用单一的LBP特征进行分类的精度比采用经过MNF变换提取光谱特征的分类精度低2.34%、Kappa系数低0.03,仅使用LBP纹理特征时分类表现不好。就信息表达而言,局部纹理特征在处理边缘细节信息时效果较好,通过在光谱特征中引入局部纹理特征,分类精度明显较使用单一的光谱特征或单一纹理特征的效果好。从图3分类结果图可以看出,地物的边缘细节得到了有效区分。
3)本文互信息选择集成多核极限学习机分类模型,与KELM相比,分类精度高1.47%,Kappa系数高0.02;由于KELM缺少对多个弱分类器分类结果相关性的考虑,简单的将多个弱分类器进行组合,分类结果较差,而引入互信息的最大相关最小冗余准则可以增加影像分类结果与真实结果间的相关性,同时减弱多个弱分类器间的冗余信息,达到充分利用各个分类器间的差异解决分类结果类间差异与精度不平衡的问题,从而提高影像分类结果的正确率。
4结束语
针对遥感影像分类结果存在类间差异与分类精度不平衡问题,提出融合多特征与互信息选择集成多核极限学习机分类方法。该方法能够克服单一影像特征在高分二号影像上的分类局限性,充分利用LBP纹理特征区分不同地物边界;结合信息论中的最大相关最小冗余策略,获取与分类输出结果最相关而相互之间冗余度最小的多核极限学习机,采用平均方法进行选择性集成,科学地融合多个弱分类器的分类结果,提高影像的分类精度。但该方法缺少极限学习机不同核函数选择对分类精度影响的考虑,这也是下一步的研究方向。
参考文献
[1]CHEN Y,LI Y,ZHANG H,et al.Automatic power line extraction from high resolution remote sensing imagery based on
an improved radon trans£orm[J].Pattern Recognition,2016,49:174-186.
[2]谢福鼎,姚疏基于GANBPSO-SVM的高光谱影像特征选择方法[J].地理科学,2018,38(6):972-97&
[3]韩敏,刘贲.一种改进的旋转森林分类算法[J].电子与信息学报,2013,35(12):2896-2900.
[4]楚恒,蔡衡,单德明.高分辨率遥感影像的多特征多核ELM分类方法[J].计算机工程与科学,2019,41(10):1816-1822・
[5]王明常,张馨月,张旭晴,等.基于极限学习机的GF-2影像分类口丄吉林大学学报(地球科学版),2018,48(2):373-378.
[6]HUANG G,HUANG G B,SONG S,et al.Trends in extreme learning machines:a review.[J].Neural Networks,2015,
61:32-4&
[7]付琼莹,余旭初,张鹏强,等.联合空谱信息的高光谱影像半监督ELM分类[J].华中科技大学学报(自然科学版),2017,
45(7):89-93,121.
[8]韩敏,吕飞.基于互信息的选择性集成核极端学习机[J]■控制与决策,2015,30(11):2089-2092.
[9]ZHANG L,HUANG X.Object-oriented subspace analysis for airborne hyperspectral remote sensing imagery[J]・
Neurocomputing,2010,73(4):927-936.
[10]MARWAHA R,KUMAR A,KUMAR A S.Object-oriented and pixel-based classification approach for land cover using
airborne long-wave infrared hyperspectral data[J[.Journal of Applied Remote Sensing,2015,9(1):95-104.
[11]HUANG G B,ZHOU H,DING X,et al.Extreme learning machine for regression and multiclass classification]J].IEEE
Transactions on Systems Man and Cybernetics, 2012,42(2):513-529.
[12]韩敏,刘晓欣.一种基于互信息变量选择的极端学习机算法[J].控制与决策,2014,29(9):1576-1580.
[13]PENG H,LONG F,DING C・Feature selection based on mutual information:criteria of max-dependency,max-relevance,
蒸纱锅
and min-redundancyCM].[S.1.]:IEEE Computer Society,2005.
60

本文发布于:2024-09-22 15:34:11,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/253212.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:分类   影像   特征   学习机   集成
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议