讲5个方面的问题
一、地质数据的概念、类型及属性
二、地质数据的选择和整理
三、地质数据的预处理
四、地质数据的统计分布特征
五、与油气地质有关的分布函数
郭庚茂简历一、地质数据的概念、类型及属性
1 概念
地质信息的数、字母和符号的集合。
2 类型
◆观测数据——对研究对象直接进行观测和度量所获得的数据。
又分为定性和定量数据。
①定性数据——用代码或字符等来表示某一地质特征及其相互间关系的一种“数据”。
又分为名义型和有序型两种。
名义型数据通过鉴别区分不同的对象或个体并赋予不同代码后形成的数据。如:岩石的颜、结构、构造等。
有序型数据有次序的数码或代码并用次序来表示数码或代码间的一种单调升降关系的数据。如:生油岩的干酪根分成I,II,III级。又如:油气储量的级别等。
②定量数据——具有数量概念的数据。分为间隔型和比例型数据。
间隔型数据特点:不仅能比较其大小,而且能定量地表示数据间的差异;无自然零值,但有负值。
比例型数据特点:具有绝对零值而没有负值的间隔型数据。大多数定量数据都属比例型数据。
◆综合数据——由观测数据经有限次算术或代数运算后,并具有明确地质意义的数据。
如:甲烷系数、时间—温度指数值、平均值、均方差、相关系数等。
◆经验数据——根据大量实际观测值归纳出来或根据公式计算而得出的经验值。
如:单储系数、排烃系数等。
3 属性
(1) 统计规律性
随机变量的性质,一次观测具有偶然性,多次重复观测,则具有规律性。 农业实用技术(2) 函数规律性
当自变量给定,函数γ就完全确定了,如:原子核发生衰变时,即子元素数量公式为:
t
n e
λγ-=
式中:0n ——衰变开始时原子核的总数
t ——衰变时间 γ——时间t 后母元素的数量 λ——系数
二、地质数据的选择和整理
1 地质数据选择时应注意的问题
◆根据研究目的和要求选择数据
◆选择的数据反映指标的地质意义明确 ◆数据的水平要一致,可靠性要强
◆能对数据的统计和函数规律性作出描述、 ◆数量应能满足数学模型的要求 ◆数据的分布均匀、合理
2 数据的处理
(1) 原始数据矩阵,即
11
12
121
22
21
2
p
p
ij
n n np
n p x x x x x x X x x x x ⨯⋅⋅⋅⋅⋅⋅⎡⎤⎢⎥⋅⋅⋅⋅⋅⋅⎢⎥==⎡⎤⎣⎦⎢⎥⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⎢⎥⋅⋅⋅⋅⋅⋅⎢⎥⎣⎦
杨宗胜
对原始数据矩阵按一定的方法进行变换,使其满足数学模型的要求,这种经变换后形成的数据矩阵称为方法数据矩阵。
如对数变换、正规化变换等。
3 结构数据模型
通常把表示实体及实体之间联系的模型叫做结构数据模型。结构数据模型包括:
层次模型——用树形结构来表示实体之间联系的模型。
网络模型——用丛结构来表示实体之间联系的模型。
关系模型——用表格数据表示实体之间联系的模型。
三、地质数据的预处理
1 可疑数据的鉴别和处理方法
(1) 肖维纳(chauvent)检验法 步骤:
a. 计算观测数据的平均值x
b. 计算单次观测的概率误差Q
0.6745Q δ= 其中δ——标准差
c. 计算可疑数据与平均值之偏差D ,并求其与Q 的比值D Q
d. 根据所观测次数(n )以及其对应的D Q '
'之比值决定数据的取舍。如下表所示:
e. 若
D D Q ''>,则舍去这一观测值。
(2) 格罗伯斯(grubps)检验法 前提:当
X
按小到大排列
1
SHENKON
2
,,,,n
卷取机x x x ⋅⋅⋅⋅⋅⋅且服从正态分布时,构建检验统计量:
()()
n U x x δ=- 式中:δ当n U U α>时,则n
x
为外来值,舍去其值。
2 数据的简缩均匀化、缺值插补和删点
(1)数据网络化方法
公式为:1,2,,1,2,,1
j
j
ij
j
j m
i n j
i n
y x n
=⋅⋅⋅⋅⋅⋅=⋅⋅⋅⋅⋅⋅==∑
式中:j y ——第j 个网格内的网格化值。
ij
x
——第j 个网格内某地质变量第i 个观测值。
j
n
——第
j 个网格内的观测次数。
1
m
j j N n ==∑
(2)缺值插补和删点
删点:随机删去一些点,保持数据分布均匀。 插值:数据平均值或统计方法进行插值。
3 数据变换
(1)目的和要求
目的:
统一地质变量的量纲 使地质变量呈正态分布
使变量间的非线性关系转换为线性关系
由一种新的独立变量代替原有相关关系的变量
要求:
变换前后变量间的相关程度不变 防止数据产生有偏估计,丢失信息
(2)数据变换方法
①统一量纲的变换
a 标准化变换
公式 1,2,,1,2,,i j
i j
j
j
i n j p x x
x s
=-
=⋅⋅⋅⋅⋅⋅=⋅⋅⋅⋅⋅⋅
' 式中
j
s
=
(标准差)
性质:'0
1j j
x S ==' 变量的量纲一致。
ij
x
服从正态分布,ij
x '服从标准正态分布。
b 极差变换
公式
min
max min ()()
1,2,,1,2,,ij
ij
j j j i n
j p胡人半解弹琵琶
x x x
x x =--=⋅⋅⋅⋅⋅⋅=⋅⋅⋅⋅⋅⋅'
性质 数据量纲一致 01ij
x '≤≤
c 均匀化变换 公式
i j
i j
j
x x x ='
性质 数据量纲一致,数据都在1附近变化。
②使数据成正态分布的变换
a 对数变换
公式
l g ()x x c '=+ 式中 C —常数
性质 使数据服从正态分布
b 广义幂变换
③线性变换方法
a 幂函数方程
(0,0)
b
c x y cx
>>= 方法:两边去对数 l g l g l g y c b x
=+ 令 lg y y '=,lg a c =,lg x x '= 则
y a bx ''=+
b 指数函数方程 (0)bx
c y ce
>=
方法:两边去对数 l g l g l g
y c b x e =+ 令 lg y y =,lg a c =,X x = 则
y a bX =+
c 指数函数方程 (0)b x
c y c e
>=
方法:两边去对数 l g l g l g b
y c e
x =+ 令 lg y y =,lg a c =,1
X x
=
则 y a bX =+