ANN_Krige方法及其应用

福建农业大学学报30(3):309-314,2001
Journal of F ujian A g ricultural U niv ersit y
文章编号:1006-7817-(2001)03-0309-06
ANN-Krige方法及其应用
洪 伟,吴承祯
(福建农林大学,福建福州350002)
摘要:地统计学是应用数理统计学的一门新分支,是研究空间相关性的一种有效方法.与传统统计学相比,它更注重于随机变量的空间过程,通过研究对象在空间上不同间隔距离的抽样点上的差异,定量地描述其空间变化规律.这一理论包括两方面研究内容:(1)半方差图;(2)空间局部内插理论.但其主要技术为半方差图模型的优化,这是空间局部内插理论的基础.本文提出应用人工神经网络方法建立半方差图模型,进而提出空间相关性分析新方法——A N N-K rige方法,并结合实例进行了应用研究.结果表明,本文所提出的方法是可行的,其空间内插效果比传统地统计学方法明显更优,从而丰富和发展了地统计学的方法与理论.
关键词:地统计学;人工神经网络;AN N-K r ig e方法;杉木种子原产地
中图分类号:T B114  文献标识码:A
ANN-Krige method and its application
HONG Wei,WU Cheng-zhen
闫德利
(F ujian A g riculture and Fo restr y U niv er sity,Fuzhou,F ujian350002,China)
Abstract:Geo st atistics is a br anch of applied mat hema tial stat istics,and it is an effective method t o st udy the spat ial cor relativit y.Compar ing with the tra dit ional statistics,the theor y and method o f g eostat istics fo cus on t he spatial pr ocess of random var iable.By studying the var iance o f the point s separ ated by different spacing in t he space o f the subject,the spatia l v ar iance laws a re described quantitatively.Geo stastistics theor y co nsist s o f tw o aspect s o f semi-var io ng r am and kr ig e.But its main technique is the optim izatio n of the semi-var iong ram,w hich is the basis of spat ial interpolating theor y.In t his paper,it w as put for w ard ho w t o apply t he a rtificial neur al netw o rk to establish semi-var io ng r am model,and a new analy sis method of spatial cor relativit y called AN N-K r ig e method wa s also point ed o ut.T he r esults show ed t ha t the applied effect was better than tr aditional geo statistics theor y and t he new method w as feasible,which enr iched and dev elo ped the g eo statist ics t heo r y.
Key words:geo statistics;art ificial neural netwo r k;A NN-Kr ig e method;Chinese fir pr o venance seed so urce M atheron在采矿学的研究中,将一些零散的统计学应用成果综合成为一门较为系统的理论,称之为局域化变量理论,并在此基础上进一步发展成为地统计学[1-3].20世纪80年代初,这一理论广泛应用于描述生态因子的空间自相关性[1]、绘制生态因子分布图[1-2]以及设计抽样方案[3],尤其是已系统地应用于森林经营中的空间变异性研究[4-11].但是在应用地统计学方法时需要以一个数学模型来拟合半方差图的变化趋势.半方差图的拟合不仅可以定量地确定研究对象的空间自相关性,而且可以用于空间内插的计算.因此,地统计学方法的应用效果如何,直接受半方差图模型的拟合效果的影响.选择何种模型去拟合一个样本半方差图是一个较为复杂的过程,一般是根据样本方差图的形状来选择,也可根据研究目的来确定模型的形式.为此,广大地统计学工作者提出了许多半方差模型,并在实际应用中取得了理想的效果.由于地统计学2点上的随机变量的半方差与2点间的距离(滞后)之间的关系并不是一种简单的线性或非线性关系,而是一种高度的非线性关系,在通常情况下是难以用一般的模型进行最优拟
收稿日期:2001-06-14
ox0000008e基金项目:福建省财政厅重大资助项目(96闽财农预字015).
作者简介:洪伟(1947-),男,教授.研究方向:森林生态学与森林培育学.
合的,因此前人提出的半方差模型在应用中难免受到一定的局限.人工神经网络理论(ANN )
则正是解决这种高度非线性映射关系的一种有效方法[12-15]
.本文针对地统计学研究中空间半方差模型具体拟合过程中的实际问题,提出应用人工神经网络理论拟合地统计学方法中的空间半方差模型,并在此基础上,提出空间异质性分析新方法——ANN -Krige 方法.
1 问题的提出
局域化变量理论是以空间上任一距离分隔的2点上随机变量的差异为基础,分析随机变量的空间自相关性.假设空间上2点p 和p +h ,p 和p +h 是以一维、二维或三维空间坐标表示的位置,h 通常称为滞后,即2点间的距离.如某一随机变量在2点上的取值分别为Z (p )和Z (p +h ),则这2点上随机变量的半方差用r (h )表示:
r (h )=[Z (p )-Z (p +h )]2
/2
(1) r (h )是点对间差异平方的一半,称为半方差.
根据(1)式可知,r (h )仅是滞后的函数,以r (h )为纵轴,h 为横轴绘制出的r (h )随滞后增加的变化曲线,称为半方差图.将r (h )和h 之间点绘成曲线或用数学公式拟合,就可得到空间半方差曲线.半方差图拟合模型不仅可以定量地确定出研究对象的空间自相关性,而且可应用于空间内插的计算.
空间半方差曲线有如下几种常见类型[7]:(1)幂函数形式:r (h )=ah b
(2)指数函数形式:r (h )=a [1-exp (bh )](3)高斯函数形式:r (h )=a [1-exp (bh 2)]
(4)球形函数形式:r (h )=(a /2)・[3h /b -(h /b )3
]  h ≤b ,或r (h )=a , h >b (5)直线形式:r (h )=c [1- (h )]+ah 式中:a 、b 和c 为待定参数, (h )是delta 函数.当h =0时, (h )=1;当h ≠0, (h )=0.而且根据半方差的定义,当h =0时,半方差等于0.
上述模型均假设各方向上随机变量的空间自相关是相同的,但在自然界中许多生物和生物因子的空间分布与方向有密切关系.因此对于此类问题又产生了相应的各向异性模型.选择何种模型去拟合一个样本的半方差图是一个复杂的过程,一般是根据样本方差图的形状来选择,也可根据研究目的来确定模型的形式.另外,依据相关系数的大小选择模型是一种直接和简便的方法.但是样本的半方差与滞后之间的关系是一种复杂的非线性关系,是一般非线性模型所无法拟合的.由于人工神经网络方法能有效地反映这种高度非线性映射关系,本文首次提出应用人工神经网络模型拟合半方差曲线,并在此基础上,提出地统计学的ANN -Kr ig e 方
法.
2 ANN -Krige 方法与原理
2.1 用于拟合半方差图的改进神经网络方法
哈姆雷特式人工神经网络是涉及生物学、医学、脑科学、认知学、信息论、计算机、数学及物理学等多学科的交叉学科,它的机理是在某种程度上模拟人脑功能的若干基本特征,如大规模并行处理、分布式存储、自适应过程等.目前这一方法在信号处理、模式识别、自动控制及最优化等方面得
到广泛的应用,其中应用最广的人工神经网络模型是前馈反向传播模型,即BP 模型[12,16]
.然而,由于BP 算法是一种梯度下降搜索算法,因而不可避免地存在固有的不足,如学习后期收敛速度慢、易于陷入误差函数的局部极小点等.基于上述观点,笔者提出引入改进单纯形法来训练BP 模型网络参数,即BP -M SM 混合算法[15].BP -M SM 混合算法训练步骤为:(1)选择一个3层前馈人工神经网络,确定输入层信息(作为训练的导师信息)、隐含层的神经元个数和输出层信息;(2)随机地给出各神经元之间的权系数以及神经元自身的触发阈值,作为网络的初
310・福建农业大学学报 2001年第30卷
始状态;(3)让网络作前向运算,并判别网络实际输出与期望输出之间的误差;(4)如果误差小于给定值,则终止训练;否则转第5步;(5)将误差反向传播,调整连接权值和阈值,转第3步,直到迭代过程收敛为止;(6)以第5步连接权值和阈值为初始值,应用改进单纯形法优化连接权值和阈值,直至达到最优.
应用改进神经网络方法拟合r (h )和h 之间高度非线性映射关系,即可得到空间半方差曲线的BP 模型,若绘制成图形则可得到空间半方差图.2.2 Krige 空间内插法
半方差图的人工神经网络模型的重要作用是用于空间上随机变量的估计或内插,即通过对某一生物或非生物因子在空间上已抽样的数据推测任一未抽样点上的数值,具体计算方法如下:
假设用p 表示所研究区域内任一点,而Z (p )是该点的测量值.在所研究的区域内共有N 个观测点,即p 1,p 2,p 3,…,p N ,那么未测地点p 0点的估计值可用这N 个测量点的线性组合来表示,即:
Z *
卷积核
(p 0)= N
i =1 i Z (p i )(2) 
式中: i 是权重系数.
根据无偏估计和方差最小2个假设条件,采用Lagr angian multiplier rule 可导出点内插Krige 的线性系统方程:
N
i =1 i r (p i ,p j )+!=r (p j ,p 0)(3)  N
i =1
i =1
(4) 
式中:r (p i ,p j )是观测点p i 与p j 之间的半方差;r (p j ,p 0)是半方差人工神经网络模型计算出的点p j 与内插点p 0之间的半方差数值;!是与方差最小化有关的拉格朗日乘数.
由Krige 系统方程可以确定权系数.权系数依赖于半方差图的计算以及样本点和内插点的设置.接近内插点的样本点具有较大的权系数,远离内插点的样本点上的权系数较小甚至等于零,即内插点的估计主要决定于邻近的样本点.因此,半方差改进神经网络模型的可靠性直接影响空间内插的精度.权系数确定后,即可利用(2)式求算内插点p 0的估计值,以回归离差平方和U 占总离差平方和T 的比值C =(U /T )
×100%来衡量拟合精度.将改进神经网络方法应用于半方差图的非线性拟合与Krige 空间内插技术相结合,称之为ANN-Krig e 方法.
3 ANN -Krige 方法在森林生态管理空间变异分析中的应用实例
3.1 试验材料
全国杉木种源试验于1979年在杉木分布区内按经纬度“网络法”布点,再结合流域、山系等情况作适当调整,定点采种,共收集南方15省(自治区)207个种源.1981年在15省(自治区)55个试验点进行全面杉木地理种源的全分布区试验,即IBI 设计
[17]
.本研究试验分析资料
来源于杉木地理种源试验中55个试点中的43个10年生种源的调查结果.在各试验点统计的基础上,计算各种源的总平均生长量(表1).杉木种源试验10年生胸径和树高进行空间变异性及其分形特征研究结果表明,在杉木种源地理变异评价中,以胸径为评价指标的效果最佳[18].因此,本文以各试验点调查结果测定出的全面的胸径生长性状为主要生长性状.
311・第3期  洪伟等:A N N -K r ige 方法及其应用
表1 43个杉木种源10年生平均生长量1)
T able 1 M ean grow th at ten years of 43Chinese fir provenance
种源经度/(°)纬度/(°)胸径/cm 不同半方差模型的预测值多项式模型[5]
人工神经模型
广西融水109.0725.1010.7110.8910.69贵州锦屏109.1826.6810.2610.3210.25江西铜鼓114.2528.6710.1910.2810.08广西那坡105.8323.3810.1010.2410.08福建大田117.8325.6710.2210.3710.22广东乐昌113.4725.0810.1910.3010.19福建建瓯118.5226.9710.1510.3110.15四川邻水106.9530.3310.0810.2210.07广西贺县111.5224.4210.0010.0610.01四川洪雅102.6729.929.8010.019.80福建南平117.9726.639.789.989.79云南西畴104.6723.479.629.819.60湖南会同109.7326.879.739.819.72广西浦北109.5222.259.799.949.81江西安福114.6727.509.799.939.78四川荥经105.5029.339.609.799.59广东信宜110.9322.359.699.869.69广东河源114.6823.409.689.939.68江西全南114.5224.759.599.739.58四川荣泾102.6729.839.559.789.56湖南江华111.7225.039.559.689.55江西武宁115.0829.309.449.51
9.45四川彭县104.0030.839.359.539.36福建长汀116.2325.839.389.569.36河南商城115.3331.509.329.489.31云南屏边103.6822.989.409.619.41云南罗平104.3224.989.249.449.23江西乐安115.8027.409.499.579.48河南新县114.7031.679.209.429.20湖北通山114.5029.589.249.739.22湖北恩施109.3730.359.189.369.17湖北鹤峰109.6729.779.189.269.18湖南安化111.2228.479.139.289.13湖南祁阳111.8326.629.179.419.16湖南永顺110.8329.029.119.249.12陕西南郑106.9232.808.959.218.95浙江开化118.2729.138.949.018.90安徽歙县118.4329.978.909.058.91贵州平坝106.2326.428.718.928.71浙江龙泉118.9727.978.688.838.67江苏句容119.1832.128.668.788.66云南会泽103.2826.428.398.568.39四川德昌
102.10
27.43
7.43华沙公约
7.63
7.43
 1)资料来源于文献[17].
3.2 结果与分析
3.2.1 空间半方差改进神经网络模型的建立 根据(1)式计算在空间上具有滞后h 的观测值
312・福建农业大学学报 2001年第30卷
的样本半方差,可取h 的某一范围内r (h )的平均半方差,将[h ,r (h )]点对值在坐标上绘制成散点图,并用人工神经网络方法最优拟合其关系.用BP 网络模型对杉木种源胸径生长的空间半方差进行模拟,根据BP 网络的映射原理,对样本集合输入量h i 和输出量r (h i ),可以假设其存在一映射F .
r (h i )=F (h i )   i =1,2,…,n
(5) 为了寻求F 的最佳映射值,BP 网络模型将样本集合的输入、输出转化为非线性优化,通过对简单非线性函数的复合,建立一个高度的非线性映射关系,实现F 值的最优逼近.对于杉木种源胸径生长的空间半方差变化的数学模拟,2点间滞后h 为输入节点,记为x ;空间半方差r (h )为输出节点,记为y ;隐含层节点数取3,构建3层前馈反向传播神经网络模型.以(1)式计算得到的具有滞后h 的观测值的样本半方差实际值为学习样本,在学习过程中,取学习速率∀为0.65,动量因子#为0.45,网络中权值和阈值的初值取(-1,1)之间的随机数.对网络输入、输出变量作如下归一化处理:
E i =[x i -(S min - )]/[(S max - )-S min ](6) 式中:S min 和S max 分别为样本序列中最小值和最大值, 取一小量,以保证变换后的E i 序列最大值略小于1和最小值略大于0.网络输出以(7)式来考核网络学习状况,并不断使H 趋于最小.
凤凰语文网H = N
i =1
(g i -d i )2
/2(7) 
式中g i 为网络归一化输出值,d i 为归一化目标值.学习25896次后全局误差H 趋于收敛,网络全局误差为0.0144.学习过程的BP 网络模型列于表2.按照神经网络BP 算法,即可计算不同滞后h 的相对应的空间半方差r (h ). 表2 半方差人工神经网络模拟模型
 Table 2 T he BP model of sem i-variance
项目
W i j 或∃j
隐含层阈值(∃)10.022544.982780.7012262
输入层与隐含层连接权值(W )
36.98026-25.06265-4.376127
输出层与隐含层连接权值(W )-8.132057-1.095932-6.276517输出层阈值(∃)-0.0104063.2.2 ANN -Krig e 方法的空间内插效果 利用所建立的半方差人工神经网络模型,计算43个杉木种源胸径生长地理位置间的空间半方差r (h )值.将r (p i ,p j )值代入(3)和(4)式,求出各点权系数 i .用(2)式对43个杉木种源各空间地理坐标点进行杉木种源10年生胸径生长量的空间内插,以检验本文提出的方法的科学性与合理性(表1).经计算,拟合优度C =(U /T )×100%=99.88%,相关指数为0.9994;而用趋势面分析研究杉木种源胸径生长地理变异,其最好模型拟合优度仅为81.8%,相关指数仅为0.90[17];用多项式拟合空间半方差图所建立的Kr ig e 系统方程所求解得到的空间内插优度仅为91.7%,其相应的相关指数为0.958[5].由此可见,本文提出的ANN -Krig e 方法是科学、合理的,可应用于森林空间变异性分析;它可反映森林空间变异性的绝大部分地理变异趋势信息,也可在森林异质性分析中广泛应用.
4 讨论
针对地统计学中空间半方差模型拟合方法的缺陷,本文提出应用神经网络方法拟合空间半方差图,并
在此基础上,首次提出ANN-Krig e 方法.该方法与传统地统计学方法相比,由于在空间半方差图的拟合方面具有更大的优越性,故在森林异质性分析时具有更大的准确性和科学性.将ANN-Krige 方法应用于杉木种源胸径生长地理变异趋势分析研究,结果表明,改进神经网络方法拟合空间半方差模型能得到理想效果,比常用模型明显更优.以此方法为基础的ANN-Krig e 方法空间内插效果明显比传统地统计学方法内插效果更好,优度更高,能充分反映杉木种源地理变异趋势的绝大部分信息,是研究生物与非生物空间变异的一种有效方法,
313・第3期  洪伟等:A N N -K r ige 方法及其应用

本文发布于:2024-09-21 19:34:46,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/17386.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:空间   方差   模型   方法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议