基于机器学习与大数据技术的地球物理测井系统

基于机器学习与大数据技术的地球物理测井系统
程希; 程宇雪; 程佳豪; 孙柒零
DUTTAPHRYNUS MELANOSTICTUS
【期刊名称】《《西安石油大学学报(自然科学版)》》
【年(卷),期】2019(034)006
【总页数】9页(P108-116)
【关键词】智能测井; 数据流; 大数据
【作 者】笛卡尔坐标系程希; 程宇雪; 程佳豪; 孙柒零
【作者单位】西安石油大学地球科学与工程学院 陕西西安710065; 中国石油大学(北京)经济管理学院 北京102249; 中国石油大学(克拉玛依)石油工程学院 新疆克拉玛依102249; 中国石油集团测井有限公司 陕西西安710077
iis
【正文语种】中 文
【中图分类】TE19; P631.8
引 言
随着石油勘探开发技术的发展及勘探开发测试数据的积累,以海量性、高速性及数据格式多样性为特点的信息技术已应用到石油工业的油气勘探、开发、运输、加工、销售及管理的各环节。这引起国内学者的关注和兴趣,为机器学习技术的发展提供了机遇。许多学者基于信息技术进行特定领域的大数据机器学习模型研究,在岩性识别、储层评价、产能评价和非常规油气储层评价方面进行探索,使得复杂井眼、复杂地层的建模以及高效测井解释成为可能[1-7]。国外学者利用机器学习方法从流体识别、测井曲线标准化、页岩气甜点预测和自动解释进行了探索[8-14]。但是这些研究都局限在测井技术方面,没有充分利用测井技术形成的巨量数据。
目前,测井服务公司只是为完成油田公司的任务而使用特定的测井系列、形成特定的解释模型,只关注数据信息的收集和存储,没有关注测井解释的标准化处理和数据流的传递。另外,测井研究领域分散、数据成果格式多样、解释结果的后续利用几乎不再受到关注,这就导致服务公司与客户之间、服务公司部门之间缺乏数据共享。
本文基于大数据和机器学习技术建立一种以用户为核心,充分利用大数据,建立以机器学习为手段、以评价结果为导向的测井智能综合评价系统,该系统具有大量数据挖掘、解释结果自反馈、模型自优化和自学习的能力。该系统可用于测井数据融合、测井模拟响应分析以及多井评价。
1 智能测井系统设计
1.1 系统设计特点
地球物理测井技术通常涵盖测井新方法与模拟研究、测井仪器设计与制造、测井数据采集作业、测井资料处理与解释以及岩石物理实验测试。本系统的设计特点是打破方法研究、仪器设计、岩石物理分析、现场资料采集与校正、测井资料处理与解释部门之间的界限,基于大数据技术和机器学习方法,将测井历史数据、实时测井数据、岩石物理测试数据与专家经验有机结合,通过大数据平台实现资源和知识共享。
该系统实时地从井场数据源、建模计算库、仪器参数库与计算机预处理源等异源数据获取信息,以需求为对象,建立数据采集、数据预处理、建模方法、模型评价和模型学习等有
机组合且具有多学科特点的智能测井技术。在智能系统中,大数据技术架起了各信息源之间的桥梁,而知识积累和提升则依靠机器学习的方法来实现。
1.2 工作原理
1.2.1 大数据技术
icson测井智能系统采用数据流处理技术。数据流的概念来自通讯学,它是数据传输中代表信息或信号的数字编码序列。智能系统利用Hadoop数据库结构,通过高速并行机实时处理“动态数据”得到建立模型、修正模型的规律或预测潜在的事件,对复杂井况建模,进行探测器响应分析、规律总结,将探测器参数按物理参数、权值贡献和探测器工艺实现等进行定制储存,以备仪器设计制造应用。用户还可以通过搜索测井公司日常生产作业资料、钻井、录井、仪器设计与研发、岩石物理实验、仪器测试数据和报告等系统内部数据及外部互联网数据库获取解决具体问题的相关数据。这就能大大提高解决相关技术难题的效率。
应用大数据流所建的模型是与过程模型迭代比较而得到的结果。其优势是:过程变量之间的关系明确,具有持续处理、存储有限、响应迅速等特点。下面以岩石体积物理模型式(1)为例,说明求取问题参数的原理。
x=(x1,x2,…,xi,…,xm)T,
威廉加拉(1)
式中:i=1,2,…,m。x为多个岩石体积物理模型,xi为第i种不同测井方法测量的岩石体积物理模型。
测井岩石物理的物质平衡方程为:Ax=0。式中,A为测井特征参数特征矩阵,x为含m种测量方法的预测参数。
假设y=xm+e。式中,y为测井值向量,e为测井数据噪声向量。
1.2.2 测井数据机器学习技术
机器学习算法的主要用途就是分类、回归和预测。测井数据机器学习是在测井历史数据及现有成果的基础上,根据不同机器学习算法的特点提取特性参数,预测一段地层、一口井、一个区块,再到一个区域构造,甚至盆地的属性等,它能根据已有的测井成果,结合其他勘探开发数据,解决人类知识范围内的问题,发现和解决人类未能发现和预测的地质体属性问题,推理新关系、新属性(表1)。
表1 测井系统中的机器学习算法特性与适用性Tab.1 Characteristics and applicability of machine learning algorithms in well logging system算法预测精度拟合速度预测速度效率理论解释预测分类应用SVM高中不定不定不能不能岩性、测井、沉积相ANN不定快中高不能能分类、岩性识别NaïveBayes低不定不定不定能能分类、回归Tree低快快低能能分类、裂缝识别BoostedTrees高中中中不能能产能预测BaggedTrees高慢慢高不能能地质导向
机器学习实现思路是,首先输入数据、预处理与数据清洗,接着选择包括确定输入参数、标注参数、出确定输出参数的机器学习模型,再训练模型、测试模型响应和精度、确定模型参数、外部参数以优化算法,加速计算学习,输出特征曲线(ROC)等。从不同井段、不同井到区块学习推广,测井系统中机器学习数据流图如图1所示。
图1 数据流驱动下的测井系统机器学习框图Fig.1 Machine learning block diagram in intelligent logging system driven by data flow
2 智能测井系统硬件物理组成
测井大数据硬件是实现计算中心与外部系统进行数据交换的平台。系统通过安全边界设备
采集和增加新的数据资源,并在计算中心长期存储,通过端对端推送、FTP文件传输、移动介质拷贝等方式向用户提供数据。同时,硬件平台要预留相应接口,充分考虑系统的可扩展性,以备其他信息资源、其他网络数据的接入(图2)。
图2 集智能测井系统拓扑框图Fig.2 Topology block diagram of cluster intelligent logging system
在图2中,刀片式集控制CPU是智能测井系统的核心,由60个刀片式CPU箱体组成,拥有强大的计算和处理功能,可完成并行处理计算,其功能是在系统中完成不同领域、不同模块之间的沟通和计算处理。计算分析网络交换机用来分配和处理由模拟方法、仪器设计制造、岩石物理实验和综合解释评价部门发来的请求任务和返回处理结果。系统管理网络交换机根据效率优先原则,将反馈任务分配到机不同的节点来执行。系统管理节点用于给不同部门和人员分配权限以及反馈问题。大内存节点用来存储运算过程结果和暂时存放过程数据。测井数据库用来存储根据不同测井方法、不同途径、不同井位获取的数据和解释成果。存储系统用来存储大容量历史数据和现今数据流数据。
3 测井系统数据流设计原理
3.1 大数据的采集
在智能测井系统中,数据流贯穿了测井系统的始终。其数据采集采用数据库同步、文件同步、接口服务、文件拷贝采集等几种方式实施。
数据库同步采集方式指在源数据库和目标数据库之间采取实时或准实时的同步措施来获取数据。文件同步采集则是指在源文件服务器和目标文件服务器之间采取实时或准实时的同步措施来获取数据。接口服务用以接受第三方发至接口的远程服务请求、相关参数和获取结果信息。文件拷贝采集是信息提供方以文件拷贝的方式将外部数据导入到平台。这些测井数据格式通常是等间距或等时数据,而测试数据和岩石物理数据则是离散随机数据。因此,其所采用的采集方式可分为子集采样,顺序采样,类别采样。
3.2 大数据的预处理
数据的预处理是数据异常性分析和异常数据消除,包括数据清洗、数据转换、插值、建模、数据重构、存储。数据的转换包括等深、等频、等时、属性转换、小波转换。测井仪器在作业过程中,通常会有数据的重复和中断,也存在明显偏离其他值的异常值。采用数
据特征分析、数据分布和对比分析、不同模拟方法的结果比较、影响因子比较、交会图、直方图、一致性分析来消除这些错误值。
3.3 测井数据流模块
测井数据流模块通常包括:测井方法与模拟、测井仪器制造与刻度、测井作业、岩石物理分析与综合解释评价等。测井方法与模拟模块利用物理原理、数学方法以及计算机技术得到不同条件下仪器响应的曲线、测井影响因素规律性及校正方法,并提供仪器探测器参数优化设计方案及激励源与探测源之间的量级关系,为仪器的电路设计提供指导。测井仪器制造与刻度模块是依据方法研究提供的结果设计仪器的探测器机电参数、功能电路、刻度器设计,完成信号的发射、发射采集隔离、放大增益、信号分离与检测、传输与采集显示。测井作业模块根据测井任务设计,使用经过多次试验已经成熟的仪器,在仪器刻度后,在井中采集地层、井眼和井况等信息,这些结果通过网络或卫星上传到测井系统的采集模块。岩石物理分析模块,一方面是完成测井新方法的设计和验证,另一方面是完成测井解释参数的提取和测井解释数据的刻度,获得的数据存入相应的模块,以备其他部门查询和调用。测井综合解释模块是根据不同仪器的特性,建立相应的解释模型,同时根据所
南通虹桥医院
提供的校正公式或图版对测井数据作校正,并结合其他资料完成岩性识别、储层划分、储层评价、产能评价、力学评价、压裂评价、油藏监测等。数据流通过授权访问实现资源共享。
3.4 智能测井系统内部架构
智能测井系统由数据接入、分布式存储、服务组件与计算层、开放API和可视化交互桌面5层构成。第一层为数据接入。数据主要通过数字化设备等提供。数据接入采用文件传输、实时数据流、物理媒介、互联网等多种方式。第二层是分布式数据存储及数据纠错HDFS2 Erasure Code。它的实现是将一个文件拆分成多个Block并分别存储。第三层服务组件与计算层主要包括大数据生态圈中的通用计算模型、MapReduce模块、离线分布式批处理架构、Pig模块,是一种开源的Hadoop上的数据流执行引擎。使用Pig语言表达数据流,这样使Map/Reduce执行任务更简单。第四层开放API,对外为统一接口,提供服务与二次开发服务。第五层可视化交互界面,提供大数据的统一可视化平台。

本文发布于:2024-09-22 20:27:00,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/46703.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   系统   学习   解释   仪器   参数   物理
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议