基于HJ-1A CCD影像和ELM模型的太湖叶绿素a预测研究

第31卷第5期2020年10月
水资源与水工程学报
Journal of Water Resources &Water Engineering
Vol.31No.5Oct .,2020
收稿日期:2019-11-17;修回日期:2020-02-05
作者简介:樊广利(1975-),男,陕西富平人,教授,博士研究生,主要研究方向为地理学、灾害学等。通讯作者:徐晋(1976-)男,山东菏泽人,博士研究生,高级工程师,主要从事建筑环境研究。
DOI :10.11705/j.issn.1672-643X.2020.05.03
基于HJ -1A CCD 影像和ELM 模型
太湖叶绿素a 预测研究
樊广利1,2,曹红业3,徐晋
2
(1.西北大学城市与环境学院,陕西西安710127;2.西京学院土木工程学院,陕西西安710123;3.长安大学地质工程与测绘学院,陕西西安710064)
要:以典型二类水体———太湖为例,基于环境一号遥感影像,构建了基于ELM 模型的叶绿素a 浓度预测模型,
将预测结果与传统的BP 人工神经网络和支持向量机SVM 进行了比较。研究结果表明:ELM 模型预测值与实测值
之间的R 2高达0.9114,
而BP 和SVM 模型的R 2
分别为0.3663和0.7448,均方根误差RMSE 由BP 模型和SVM 模型的3.7288μg /L 和2.1324μg /L 降为ELM 模型的1.3270μg /L ,ELM 模型的平均相对误差MRE =2.65%,小于BP 模型的6.59%和SVM 模型的3.89%;与其他两种方法相比,
ELM 模型反演太湖水体叶绿素a 浓度精度更高,
ELM 模型参数选择简单,可以显著提高模型的学习速度,不易陷入局部最优值,具有更好的泛化性能;ELM 模型可以有效地应用于内陆水体叶绿素a 浓度的预测。
关键词:叶绿素a 预测;HJ -1A CCD 影像;极限学习机(ELM );内陆湖泊;太湖中图分类号:X832;X87
文献标识码:A
文章编号:1672-643X (2020)05-0016-07
Prediction of chlorophyll a in Taihu Lake based on HJ -1A CCD imagery and ELM model
FAN Guangli 1,2
,CAO Hongye 3,XU Jin 2
(1.College of Urban and Environmental Sciences ,Northwest University ,Xi ’an 710127,China ;2.College of Civil Engineering ,Xijing University ,Xi ’an 710123,China ;3.College of Geological
Engineering and Geomatics ,Chang ’an University ,Xi ’an 710064,China )
托尔斯泰的故事
Abstract :Taking Taihu Lake as an example ,a prediction model of chlorophyll a concentration based on extreme learning machine (ELM )model was constructed for the first time using the remote sensing ima-ges of Environment 1.The prediction results were then compared with those of the traditional BP artificial neural network and support vector machine (SVM )model.It was found that R 2of ELM model reached as high as 0.9114;however it only reached 0.3663of BP and 0.7448of SVM model.Root mean squared error (RMSE )of BP model and SVM model reduced from 3.7288μg /L and 2.1324μg /L to 1.3270
μg /L of ELM model.The mean relative error (MRE )of ELM model was 2.65%,which was lower than that of BP model (6.59%)and SVM model (3.89%).Compared with these two models ,the ELM model has higher accuracy in the back analysis of chlorophyll a concentration in Taihu Lake.The param-eter selection of ELM model is simple ,which can significantly improve the learning speed of the model.This model has better generalization performance and it is not prone to local optimum.The experiment re-sults show that ELM model can be effectively applied to the prediction of chlorophyll a concentration in inland lakes.
Key words :prediction of chlorophyll a ;HJ -1A CCD imagery ;extreme learning machine (ELM );in-land lake ;Taihu Lake
1研究背景
由于我国人口密度大和过度开采利用水资源,目前正面临极为严重的水资源问题[1],并且内陆湖泊水资源问题目前己经成为全球性的问题,水质监测和预警是水质评估和污染防治的主要依据[2-3]。传统方法需要现场布设大量观察站点,具有耗时、劳动强度大、成本高的缺点,并且由于传统方法仅限于时间尺度和空间尺度,采集的数据只是部分河段的水质数据,只能以点带面研究整体情况。对于内陆湖泊这样的大面积水域,传统的野外采样-实验室分析方法难以达到大范围、迅速、长时间序列的动态水质监测要求[4]。特别是对于太湖等水环境时空异质性较强的水体,传统方法的不足尤为突出。
由于遥感技术具有长期、实时和快速的水质监测的优势,甚至可以较为精确地探究传统方法不可解释的污染蔓延趋势[5]。基于水体中不同材料成分的光谱反射率的差异,以及远程传感器接收的特征信息的差异,利用此技术可掌握大范围水域中不同物质组成的时空分布及长时间变化规律[6]。
叶绿素a浓度是反映水体藻类关键的生物指标[7-9]。然而目前对于水质较为复杂的内陆湖泊,建立适用性强、精确度高的水体叶绿素反演模型总是困难的。目前,主要有3种方法用于遥感监测内陆水域的叶绿素a浓度,即分析模型、经验模型和半经验或半分析模型[10-12]。
叶绿素a浓度的遥感反演是一个具有大量不确定性的非线性过程[13-14]。目前一些机器学习算法
具有优秀的非线性近似等优点。被广泛应用于模式识别、特征提取、信号处理和非线性预测等领域,在水质遥感反演中具有一定的应用[15-22]。BP(back propagation)神经网络模型在水质参数反演等领域已经得到了很多应用,但是BP人工神经网络训练速度慢,参数选择困难,极容易陷入局部极值。极限学习机(extreme learning machine,ELM)是一种全新的单隐层前向神经网络方法的机器学习模型[23-24]。与传统的BP模型相比,ELM模型算法克服了传统模型训练时间长和过拟合等问题。同时,ELM的良好泛化能力也在实践中得到了验证。
环境一号(HJ-1)是我国首颗用于环境监测预警的遥感卫星,为水体叶绿素a浓度反演提供了巨大便利。但是目前利用HJ-1进行内陆水质监测的研究并不多,特别是水体叶绿素浓度遥感监测方面的应用更是较少。为了验证HJ-1卫星应用于内陆湖泊叶绿素a浓度预测的应用潜力,本文以内陆典型湖泊———太湖为例,基于ELM模型和HJ-1A CCD传感器进行太湖叶绿素a浓度的预测,并交叉对比传统BP模型和支持向量机(support vector machine,SVM)模型。同时,将ELM模型应用于大气校正后的HJ-1A影像上,获取整个太湖湖面叶绿素a浓度的空间分布图,并细致分析反演结果以验证模型有效性。
2研究区概况
太湖是我国第三大内陆淡水湖泊,整个湖面的面积为2427.8km2,横跨江浙两省,相邻较近的地市
为无锡、湖州和苏州等城市。本文选取太湖作为研究区域,主要考虑到:太湖水体的叶绿素含量很高并且变化较大,适合于反演模型的建立及验证;另外太湖的污染状况一直受到广泛关注,是一直以来的研究热点,并且积累了许多历史数据可供参考。研究区太湖地理位置及采样点分布见图1
图1研究区太湖地理位置及采样点分布图
3数据来源与预处理
3.1HJ-1A卫星影像介绍
HJ-1A卫星于2008年9月6日发射升空。卫星上搭载的传感器包含可见光和近红外光共4个波段,空间分辨率为30m,成像宽度为360kmˑ360 km,可以4d快速实现地球上同一位置的再次重访。HJ-1A CCD传感器参数及取值如表1所示。
3.2数据采集
分别于2016年7和10月组织人员对太湖水体
71
第5期樊广利,等:基于HJ-1A CCD影像和ELM模型的太湖叶绿素a预测研究
进行了2次实地采样,共采集了48个水样样本(采样点分布见图1),野外测量和记录的参数包括采样
点经纬度等信息,实验室采用分光光度法测试和分析样本叶绿素a浓度,各采样点叶绿素a浓度见表2。将48个有效地面采集点数据进行随机抽样,分为训练样本数据和测试样本数据,其中38个数据用于建模,其余10个用于评定模型精度。
表1HJ-1A CCD传感器参数及取值
参数取值
0.43 0.52
光谱范围/μm 0.52 0.60 0.63 0.69 0.76 0.90
空间分辨率/m30
幅宽/km360
重访周期/d4钢铁钒钛
表2太湖各采样点叶绿素a浓度
采样点序号经度/(ʎ)纬度/(ʎ)Chl-a/(μg·L-1)1120.042031.457255.7
2120.177631.459750.0
3120.345831.428135.4
4120.270431.371141.1
5119.976631.330754.0
…………
47120.271030.946648.0
48120.270730.946658.5
3.3遥感影像预处理
由于本研究直接获取的数据为几何粗校正的HJ -1A CCD影像,因此需要进行必要的数据预处理工作,主要包括几何精校正、辐射定标和大气校正。3.3.1几何精校正在湖面周边均匀选取明显地面控制点,采用二次多项式模型进行几何精校正(校正误差低于1个像元)。以消除或减弱影像成像过程中产生的几何畸变。影像的投影坐标采用UTM投影(通用横轴墨卡托投影)及WGS-84坐标系。
3.3.2辐射定标卫星地面接收站获取的是无量纲的HJ-1A CCD影像DN值,然而进行水质参数预测研究中使用的必须是绝对辐射亮度值。影像辐射定标的目的就是将DN值根据定标公式转换为绝对辐射亮度值。
L(λ)=Gain·DN+Bias(1)式中:L(λ)为卫星传感器入瞳处的绝对辐射亮度值,W/(m2·sr·μm);DN为卫星传感器的观测记
录值(无量纲),Gain和Bias分别为定标公式的两个系数,即增益值和偏移值。系数Gain和Bias的定标值如表3所示。
表3HJ-1A CCD传感器绝对辐射定标系数
卫星载荷波段Gain值Bias值
Band11.77157.3250
HJ-1A CCD
Band21.65546.0737
Band31.02813.6123
Band41.06421.9028 3.3.3大气校正由于大气分子和气溶胶散射等因素的影响,影像所反映的不是真实的地物信息,因此必须对影像进行大气校正处理[25]。本文利用ENVI5.2的FLAASH模型完成大气校正工作,获取大气校正后真实的反射率图像。
4ELM模型建立
4.1ELM基本原理
假设训练样本由N个不同的随机样本(x i,t i)组成,其中:
x
i
=[x
i1
,x
i2
,…,x
in
]T(x
i
∈R n)(2)
t
i
=[t
i1
,t
i2
…,t
im
]T(t
i
∈R m)(3)隐层节点数目为N
且激励函数为g(x)的神经网络模型为:
∑N
i=1
βi g i(x j)=∑
N
i=1
βi g(w i·x j+b i)=o j(4)
(j=1,2,…,N)
式中:w i=[w i1,w i2,…,w in]T为输入节点与第i个隐层节点之间的权值;βi=[βi1,βi2,…,βim]T为连接第i个隐层节点与输出节点之间的权值;w i·x j为权值w i与样本x j的内积;b i为第i个隐层节点的偏置值。
隐层节点个数为N
且激励函数为g(x)的神经网络模型可以完全逼近N个样本数据,即:
∑N
i=1
‖o j-t j‖=0(5)存在βi、w i和b i,得到:
∑N
i=1
tdc
βi g(w i·x j+b i)=t j(j=1,2,…,N)(6)也可以表示为如下矩阵形式:
Hβ=T(7)
81水资源与水工程学报2020年
式中:H 为网络的隐层输出矩阵,可表示为:
H (w 1,w 2,…,w N  ,b 1,b 2,…b 珘n ,x 1,x 2,…,x N
)=g (w 1·x 1+b 1)g (w 2·x 1+b 2)…g (w N  ·x 1+b N
g (w 1·x 2+b 1)g (w 2·x 2+b 2)…g (w N  ·x 1+b N
………g (w 1·x N +b 1)g (w 2·x N +b 2)…g (w N
·x N +b N
)N ˑN
(8)
由于通常情况下,隐层节点数目远远小于训练
样本数目,
医疗纠纷论文使得公式(6)的模型难以实现,则在该模型中应加上误差E ,即:H β=T +E (9)
式中:E =[e T
1,e T
gold miss2,…,e T
N ]T
N ˑm 。
本文定义一个平方损失函数J ,其表达式为:J =
∑(βj g (w i ,
b i ,x j )-t j )
(10)其矩阵形式可以表示为:J =(H β-T )T (H β-T )(11)
其中最优最小二乘解为β^
‖H β^
-T ‖=min β
‖H β-T ‖
(12)
当矩阵H 列满秩时,引入穆尔-彭罗斯广义逆
矩阵求解参数β^,
即:β^=arg min β
‖H β-T ‖=H *
T
(13)
其中H *=(H T H )-1H T
当矩阵H 不是列满秩时,可以通过奇异值矩阵
分解求解参数β^。4.2算法流程
ELM 算法通过如下步骤来进行网络权值的维度估计与判定:
(1)输入训练样本数据{(x i ,t i )}N i =1,并选择最佳隐藏层输出函数g (w ,
b ,x )和隐层节点个数L ;(2)模型可以根据步骤(1)随机确定隐层节点参数,
即权重值w 和隐层节点偏移值b ;(3)计算网络模型隐层输出矩阵H ;
(4)求解网络模型的最优最小二乘解β^
(5)根据由步骤(3)和(4)计算的矩阵H 和最
优最小二乘解β^
建立的最优模型算法预测测试样本数据。
网络输出权重值通过直接求解线性方程组来获得,
这正是ELM 算法简单、快速和高效的原因。5
结果与分析
5.1
ELM 模型构建与检验
建立用于遥感反演的神经网络模型首先确定反
演的影响因素,然后确定网络输入层中神经元的数量。ELM 模型中的激励函数主要包括Sigmodial 函
数、
Sine 函数、Hardlim 函数、Triangular Basis 函数和Radial Basis 函数。为了更有效地确定模型参数并选择激励函数,
本文分别对上述5个函数进行了分析,
并将隐含层节点的数量初始化为5,将循环增加至5次,
比较分析了不同激励函数和隐层节点数对水体叶绿素a 反演的影响程度,
其结果如图2所示
。图2
不同激励函数和隐层节点数对水体叶绿素a 反演的测试误差
由图2可知,在节点数为20之后,径向基函数
(radial basis )开始趋于稳定,在节点数为10之后,Sigmodial 函数和Sine 函数开始稳定,并且RMSE 随
着隐层节点数量的增加,
Hardlim 和triangular basis 函数的测试误差波动较大。并且径向基函数在节点数为20之后具有0.7ˑ10-4
或更小的测试误差,与其他函数相比误差最小。
本文选择38个采样点的HJ -1A CCD 波段比
值B4/B3作为ELM 模型的输入层,
叶绿素a 浓度作为输出层,
构建预测模型,利用该构建模型对剩余10个验证样本进行预测,得到预测结果如图3所
示。预测值与实测值的拟合程度R 2
高达0.9114,均方根误差RMSE 仅为1.3270μg /L 。
5.2模型对比
为对比验证ELM 模型的反演精度,分别利用传统BP 神经网络和SVM 模型进行叶绿素a 浓度反演。BP 模型相关参数参考相关文献[
26]设置:隐层节点个数为20,
学习率设定为0.01,计算步数最大值设定为1000次,
最小均方误差为10-8
,网络隐9
1第5期樊广利,等:基于HJ -1A CCD 影像和ELM 模型的太湖叶绿素a 预测研究
含层激活函数使用“Sigmoid ”函数,具体使用“logsig ”函数,训练时使用“trainlm ”函数;SVM 模型通过编写SVMcgForRegress 函数来查模型的最佳
参数。选取高斯函数作为其核函数,
核函数参数γ和回归惩罚系数均为1,终止判据设置为0.001。与ELM 模型反演过程相似,选择38个采样点HJ -1A CCD 波段比值B4/B3作为模型的输入层,叶绿素a 浓度作为输出层,构建预测模型。利用构
建的模型分别对剩余10个验证样本进行预测,得到其预测结果如图4、
5所示。由图4、5可知,BP 模型的预测值与实测值的拟合度R 2
仅为0.3663,均方根误差RMSE 为3.7288μg /L ;SVM 模型的拟合度
略高于BP 模型(R 2
=0.7448),
均方根误差比BP 模型略低(RMSE =2.1324μg /L )。总体来看,
SVM 模型的预测精度略高于传统BP 神经网络模型
的精度。
对3种模型叶绿素a 浓度反演结果的相对误差进行比较,
如表4所示。由表4可见,ELM 神经网络模型反演精度优于BP 和SVM 模型,
ELM 反演结果的最大相对误差为4.60%(序号4),
而BP 和SVM 神经网络模型的最大相对误差分别为19.04%和8.67%。另外,通过计算表明,
ELM 模型预测样本的平均相对误差MRE =2.65%,
小于SVM 和BP 模型的平均相对误差(BP 和SVM 模型的MRE 值分
别为6.59%和3.89%)。
不难得出如下结论,针对太湖区域叶绿素a 浓
度反演,
ELM 模型与BP 和SVM 模型相比较而言,其整体性能更优。BP 神经网络模型结构比ELM 模
型简单,
但预测精度不如ELM 模型,BP 模型算法的参数需要在运行过程中不断调整
图3ELM 模型的验证结果
图4BP 模型的验证结果图5SVM 模型的验证结果
表4
3种模型Chl -a 浓度反演结果的相对误差比较
序号实测值/(μg ·L -1)BP 模型
反演值/(μg ·L -1
)相对误差/%
SVM 模型
反演值/(μg ·L -1
往来业务核算)相对误差/%
ELM 模型
反演值/(μg ·L -1
)相对误差/%
140.038.34.2541.94.5338.83.09240.638.84.4341.21.4641.41.93343.541.54.6042.52.3543.01.16441.549.419.0443.13.7143.54.60544.044.10.2342.04.7642.14.51648.045.25.8347.60.8446.92.35746.848.43.4249.14.6848.8
4.10849.045.57.1450.02.0047.92.30948.150.95.8251.15.8747.90.421053.9
47.9
11.1349.6
8.6755.0
2.00平均值
6.59
3.89
2.65
5.3
太湖叶绿素a 浓度反演
本文基于ELM 模型结合HJ -1A CCD 影像反
演整个研究区域叶绿素a 浓度,
反演结果如图6所示。图6中绿区域为叶绿素高浓度分布区,
蓝区域为叶绿素低浓度分布区。不难发现,从空间分
布上看,
太湖的叶绿素a 浓度分布不均,其总体上呈现从北向南递减的趋势,
太湖的中南部湖区(图6中深蓝区域)是全湖叶绿素浓度最低的区域,连
02水资源与水工程学报2020年

本文发布于:2024-09-21 18:57:08,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/540702.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:模型   预测   太湖
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议