基于支持向量机理论的地下水水源地动态预测模型

基于支持向量机理论的地下水水源地动态预测模型
刘长生
(辽河石油勘探局水文地质研究所 辽宁・盘锦 124010)
提 要 盘锦市盘东地下水水源地是辽河油田工业和生活用水主要水源,长期观测资料分析表明开采量是影响水源地水位动态的主要因素,二者之间存在着显著的相关性。该文在介绍支持向量机基本原理和实现算法的基础上,探讨了如何合理选择核函数,建立支持向量机回归方法水源地水位动态预测模型。通过对比多项式核函数和径向基函数(R BF )核函数的训练和模拟结果,发现后者预测精度高。研究成果表明,相对于传统的回归分析方法,基于支持向量机回归方法的动态模型的模拟预测能力明显提高。该文中的动态模型方法在地下水位动态预测中具有广泛的应用前景。
关键词 水源地 动态 支持向量机 预测
G roundw ater Source Dynamic Prediction Model B ased on Support V ector
 Machines Theory
Liu Changsheng
(Institute of Hydrogeology ,Bureau of Liaohe Oil Investigation )
Abstract  Pandong groundwater s ource in Panjin city is the main water s ource of industry and life for Liaohe oil base ,through analyzing the long term observation data ,the exploitation quantity is the main factors that af 2fecting the groundwater level dynamic regime of water s ource ,There is a significant correlation between the groundwater level and the exploitation quantity.Based on the principles of support vector machines and im ple 2mentation alg orithm ,how to select kernel functions reas onably and establish the groundwater level prediction m odel are discussed by using support vector machines regression method.Through the results com paris on be 2tween polynomial kernel function and radial basis function ,it shows the latter has high accuracy.The analysis results show that the simulation predicted ability of dynamic m odel method has im proved obviously com paring with traditional regression method.The proposed dynamic m odel method has wide application prospect in dy 2namic prediction of groundwater regime.
K eyw ords  water s ource ;dynamic regime ;support vector machines ;predication
作者简介:刘长生(1968-),男,工程师,水文地质专业,现从事地下水开发管理方面的研究工作。收稿日期:2009-07-08
1 前言
由于地下水动态具有随机性和不确定性的特征,因而可用概率和数理统计方法来研究和分析其
特性。即对采集的一定量的观测数据,建立系统变量与其影响因素间的统计模型,主要方法包括回归分析方法、频谱分析和时间序列分析方法等。但是,统计分析方法在趋势外推受限制,一般不适合用于中长期预测。众多学者研究了神经网络方法在地下水动态预测中的应用。虽然神经网络方法能够有效
地处理非线性、不确定性等问题,但目前用神经网络来预测地下水动态通常是将影响地下水动态的因子作为输入因子,地下水位动态作为输出因子,并没有对各个影响因子进行并行预测,从而影响水位动态预测精度。王景雷等探讨了支持向量机模型方法在灌区地下水动态预测中的应用。本文讨论运用长系列地下水水位和开采动态数据,建立基于支持向量机方法的水源地地下水动态预测模型。
2 盘东水源地概况
辽河油田盘东水源地位于盘锦市盘山县城东北部至喜彬乡之间,中心在盘山县统一乡,距双台河7km 。盘东水源工程分两期,分别于1989年和1995
年底完成,共有水源井44口,产能达到6×104
m 3
Πd (图1),为辽河油田工业和生活用水主要水源
图1 盘东水源地开采井和观测井分布
本区在大地构造上属下辽河平原中生代断陷
次级构造单元———盘山断陷北半部。根据油井钻探资料,老的基底为侏罗—白垩系地层,下第三系分布在凹陷内,从下至上有沙河街组、东营组。上第三系广泛分布在下第三系之上,分馆陶组和明化镇组,也是本区水源开发的目的含水层。最上层为第四系咸水层,无供水价值。
馆陶组含水层埋深750m ,厚度100m 左右,岩性为中粗岩、砂砾岩、中粗砂岩,赋水条件好,在降深
15m 时单井涌水量1500m 3
非处方药目录
/d 以上。水质好,矿化度500~600mg ΠL ,各项指标符合饮用水标准,目前没有开采。明化镇组含水层本区广泛分布,埋深350m 以下,含水层厚度100~200m 。岩性为中细砂岩、砂岩和砂砾岩,赋水性好,在降深15m 时单井涌水量
可达2000m 3
/d ,水质较好,矿化度600~700mg ΠL ,其它指标满足生活用水标准。
根据地下水动态观测资料,在初期虽然开采量不大,但降落速率比较大,随着后期开采量的增加,降落速度减小,说明该区除开采弹性释放量外,还存在侧向补给量。从下辽河盆地地形与构造上看出,北高南低,地下水可通过地下径流向下游排泄。目前人工开采是主要排泄方式。
3 地下水动态特征
盘东水源是盘锦地区大型深层基岩裂隙水水源地之一。随着开采量的增加,地下水位逐渐下降,水位
埋深由开采初期的13158m 已下降到1998年底的27134m ,对比分析周围观测井水位,盘东水源水位最深,形成了以盘东水源地为中心的降落漏斗。
1998年底水源地地下水开采量达到5×10
4
m 3
Πd ,用水最高峰达到515×104
m 3
Πd 。地下水位平均
年降幅为1153m 。分析预测地下水动态,对于优化地下水开采方案和保护地下水具有十分重要的意义
图2 水源地多年地下水水位动态曲线
4 支持向量机回归分析方法原理
支持向量机是由Vapnik 与其领导的贝尔实验
室的研究小组一起开发出来的一种新的机器学习技术,是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以期获得最好的推广能力。支持向量机方法的几个主要优点有:1)它是专门针对有限样本情况的,其目标是得到现有信息下的最优解而不仅仅是样本数趋于无穷大时的最优值;2)算法最终将转化成为一个二次型寻优问题,从理论上说,得到的将是全局最优点,解决了在神经网络方法中无法避免的局部极值问题;3)算法将实际问题通过非线性变换转换到高维的特征空间,在高维空间中构造线性判别函数来实现原空间中的非线性判别函数,特殊性质能保证机器有较好的推广能力,同时它巧妙地解决了维数问题,其算法复杂度与样本维数无关。在S VM 方法中,只要定义不同的内积函数,就可以实现多项式逼近、贝叶斯分类器、径向基函数方法、多层感知器网络等许多现有学习算法。本文讨论支持向量机回归分析方法的应用。
支持向量机回归分析要解决的问题是:设样本为n 维向量,样本集为(x i ,y i ),i =1,2,…,k ,x i ∈
R n (R 为实数域):y i ∈R 。其中x i 为预报因子值,y i
为预报对象值,寻求一个反映样本数据的最优函数关系y =f (x )。与S VM 分类问题不同的是:S VM 回归的样本点只有一类,所寻求的最优超平面不是使两类样本点分得“最开”,而是使所有样本点离超平
面的“总偏差”最小。
用S VM 进行回归,其基本思想是通过一个非线性映射Φ:R N →R M (M >N )将输入空间映射到高维特征空间,在高维特征空间中进行线性回归。从几何意义上讲,就是寻一个最优拟合样本集的超平面。在线性情况下其超平面函数为f (x )=w ・x +b 。当映射到高维特征空间时,拟合样本集为{Φ(x i ),y i },(i =1,2,…,k )。这样,以向量形式的回归函数表达为
f (x ,w )=(w ・
工作辊φ(x ))+b (1)式中,w ,φ(x )为n 维向量,b 为阈值,(・
)表示内积。定义不灵敏函数ε作为误差函数,当所有样本点到所求超平面的距离都可以不大于ε时,寻求最优回归超平面的问题转化为求解如下一个二次凸规划问题,即
min w ,b R (w ,b )=1
2
w ・w
(2)约束条件:
y i -w ・巴格西
φ(x i )-b ≤ε,i =1,2,…,k -y i +w ・
φ(x i )+b ≤ε,i =1,2,…,k   同样,当个别样本点到所求超平面的距离大于
ε时,考虑到允许拟合误差的情况,引入正数松弛变
量ζ和ζ3
,寻求最优回归超平面的二次凸规划问题转化为带约束条件的优化问题,即
min w ,b ,ζ,ζ
3R (w ,b ,ζ,ζ3)=12w ・w +C ∑k
i =1ζi +ζ3
i
(3)
约束条件:
y i -w ・
φ(x i )-b ≤ε+ζ3i
, i =1,2,…,k
-y i +w ・φ(x i )+b ≤ε+ζi , i =1,2,…,k   ζi ≥0,
ζ3i ≥0式中,w ・w 代表模型的复杂程度,其作用将使函数
更为平坦,从而提高泛化能力。第二项则为减小误差,C 为惩罚因子,用于调整对超出拟合误差ε(ε>0)的惩罚程度。传统S VM 求解过程,即公式(3)的优化问题是典型的二次规划问题。引入拉格朗日(Lagrange )函数L (w ,b ,ζ,ζ3,α,α3,γ,γ3)。分
别用w ,b ,ζ,ζ3
对函数L 求最小化,构造式(1)的对偶形式,并解该凸函数的鞍点。可得非线性回归函数为
f (x )=
∑k
i =1零下八度电影
(αi
-α3
i
)(φ(x i
)・
φ(x ))+b (4)
核桃楸皮式中,α和α3
为Lagrange 乘子。直接确定非线性映
第三方物流方案设计
射Φ的形式是较困难的,且计算量随特征空间维数
增加呈指数递增。根据Hilbert -Schmidt 原理,处理
高维特征空间的计算问题可以避开求解空间映射φ的显式形式,即通过引入所谓核函核K (x i ,x )=(φ(x i )・φ(x )),将变换空间中的内积转化为原空间
中某个函数的计算,从而间接求解输入空间向高维特征空间的映射Φ,即
f (x )=
k
i =1
(αi -α3
i )K (x i ,x )+b
(5)
任意满足泛函Mercer 条件的对称函数均可作为核
函数,常用的核函数有:
1)多项式核函数
K (x i ,x j )=(x i ・x j +1)d ,d =1,2,…,;  2)径向基函数核函数
(RB F )K (x i ,x j )=exp -‖x i -x j ‖2Π2σ2
;
3)Sigm oid 核函数
K (x i ,x j )=tanh b (x i -x j )
+c ;等。
  构造形如式(5)映射函数的学习机器被称作支持向量机,它将构造输入空间的非线性映射函数转化为
构造高维特征空间的线性映射函数,而且通过把原问题转化为对偶问题,使得计算的复杂度不再取决于空间维数,而是取决于样本数,特别是支持向
量的个数。通常,式(5)中系数(α-α3
)只有一部分数目是非零值,它们所对应的数据点就是支持向量。
在支持向量机回归分析中,标准S VM 的结构形式上仍类似于一个神经网络。这时的隐层节点相当
于支持向量,网络权重变为(α-α3
),输出是隐节点的线性组合,b 相当于网络的阈值。这些量均可由算法自动产生,无需像神经网络构架网络过程中步步经验试算。
5 基于支持向量机回归理论的地下水位预测
利用LibS VM 软件实行上述的模型计算。LibS VM 是台湾大学林智仁等开发设计的一个简单、易于使用、快速、有效的S VM 模式识别与回归的软件程序,他不但提供了编译好的基于Windows 操作系统的执行文件,还提供了有关的软件程序源代码,方便改进、修改以及在其它操作系统上应用。该软件对S VM 所设计的参数调解相对比较少,提供了参数交互检验功能。S VM 用于模式识别或回归时,对
于S VM 的核函数及其参数的选择,目前国际上还没有形成一个统一的模式。也就是说,最优化S VM 算法中参数的选择还只能是凭借经验、试验对比、大范围的搜寻或者利用软件包提供的交互检验功能进行寻优。LibS VM 的输入数据有严格的格式。因此,在进行
S VM 计算前,先对数据样本进行转换并缩放到[-1,+1]范围内,变为满足LibS VM 输入数据的格式。
对盘东地区的地下水分析主要考虑开采量对地下水位的影响,将月开采量作为输入变量,地下水埋深作为输出变量,分别对3个观测井进行分析。其中,1990~2007年数据作为训练样本和检验样本。分别用多项式核函数和RBF 核函数进行训练和模拟,其中RBF 核函数拟合产生的误差相对较小,因此本文中采用RBF 核函数进行回归分析(图3)。S VM 的类型选择ε不敏感带的一维线性回归函数,选择不同的ε值和惩罚系数
C ,并通过试验进一步
优化参数。发现C =106
,ε=011时,对样本预测产
生的误差较小。
为验证支持向量机模型对该水源地地下水位与开采量关系分析的准确性,将上述分析结果与传统回归分析方法进行比较(表1)。S VM 方法的拟合样本的标准误差值分别为11579、11195、11286,而传统回归理论拟合的误差值分别为117025、113158、115791。这说明S VM 拟合能力优于传统回归分析方法。而且S VM 方法可以通过常数C 的调整,一方面使得误差尽可能小,另一方面使回归函数尽可能平滑,从而提高了它的预测能力。
图3 不同观测井计算和观测水位拟合情况表1 支持向量机模型地下水动态预测结果
观测井支持向量个数
偏置量b
R 2
标准误差
支持向量机模型传统回归理论
观1
214-901146901543811579117025观2186-381506701830111195113158观3
205
4716712
018646
11286115791
6 结论
辽河油田盘东水源地经过几十年的开采,已经导致
区域性地下水水位下降,形成地下水降落漏斗。水源地外围侧向径流补给缓慢,开采以消耗地下水静储量为主,开采量是影响地下水位动态的主要因素。本文提出的支持向量机回归方法在水源地动态预测结果表明,通过合理选择核函数进行支持向量机的回归分析,可以得到相对于传统的回归分析方法具有更高精度的预测结果,以径向基函数(R BF )为核函数进行模型训练和模拟可以得到理想效果。该方法可以推广到其他类型水源地的地下水位动态预测。
参考文献
1 平建华,李升,钦丽娟,等1地下水动态预测模型的回顾
与展望1水资源保护,2006(4):11~15
2 罗定贵,郭青,王学军.基于R BF 神经网络的地下水动态
模拟与预测.地球学报,2003,N o.5:475~478
3 张忠永,王明涛,贾惠艳.人工神经网络在地下水动态预
测中的应用.辽宁工程技术大学学报,2002(4):504~506
4 王景雷,吴景社,孙景生,等.支持向量机在地下水位预报
中的应用研究.水利学报,2003,49(5):122~128
5 卞建民,汤洁,李艳梅,等.辽河油田地下水资源优化利用
方案研究,水文地质工程地质,2006(5):99~102
6 Mutter K-R ,Sm ola A J ,Ra lath G,et al.Predicting time series with support vector machines.In :Proc.of IC ANN ’97,S pringer Lecture N otes in C om puter Science ,1997:999~10057 S teve G unn.Support Vector Machines for Classification and Re 2gression.ISIS T echnical Report ,1998,5
8 Vapnik V ,G olowich S ,Sm ola A.Support vector method for func 2tion approximation ,regression estimation ,and signal processing.In :M ozer M ,Jordan M ,Petsche T (eds ).Neural In formation Processing Systems.MIT Press ,1997,9
9 Cristianini N ,Shawe -T aylor J.支持向量机导论.李国正等
译.北京:电子工业出版社,2004.82~106
10 白鹏,张喜斌.支持向量机理论及工程应用实例.西安电
子科技大学出版社,2008.13~56

本文发布于:2024-09-24 19:21:30,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/570002.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:地下水   动态   回归   向量   预测   支持   水源地   函数
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议