计算机在地质学中的应用复习资料

计算机在地质学中的应用
一、名词解释:
1、定性地学数据: 定性说明地学现象的某种属性或者形态而没有数量概念的数据。
2、名义型数据: 又称类别数据,特点是没有量的概念,也不具有相对重要性,只有标识作用。其运算方式只能进行统计,不能进行常规的加减比较大小等运算。
3、有序型数据 特点是只具有顺序或者等级的概念,不同序级之间没有比例关系,在绝对数量方面也不相等。其运算方式只能对其排序。
4、逻辑型数据 特点是只能说明某种地学现象存在与否,不涉及大小和数量。
5、定量地学数据 又称数值型数据,这类数据不仅说明地学现象的属性和状态,而且有数量的概念。不仅能比较大小,还能表示差异。
6、空间自相关 空间上相邻样品在数值上具有相关关系。
7、区域化变量 是介于随机变量和确定性变量之间的变量,它描述的是地理分布现象,这类现象具有空间连续性,又具有空间不确定性。
8、变差函数 又叫变程方差函数,或变异函数,是地质统计学所特有的基本工具。它既能描述区域化变量的空间结构性变化,又能描述其随机性变化。
9、变程 指区域化变量在空间上具有相关性的范围。在变程范围之内,数据具有相关性;而在变程之外,数据之间互不相关,即在变程以外的观测值不对估计结果产生影响。
10、块金值 变差函数与Y轴的交点,在地质统计学中称为“块金方差”,表现为在很短的距离内的空间变异性,即无论h多小,两个随机变量的差异程度。它可以由测量误差引起,也可以来自矿化现象的微观变异性。在数学上,块金值C0相当于变量纯随机性的部分。
11、基台值 代表变量在空间上的总变异性大小。即为变差函数在h大于变程时的值,为块金值c0和拱高cc之和。
12、随机取样 即按随机性原则,从总体单位中抽取部分单位作为样本进行调查,以其结果推断总体有关指标的一种抽样方法。
13、分层取样 将总体中各个个体按某种特征分成若干个互相重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样。
14、系统取样 从总体中选取每第k个样品的方法。
15、丛状取样 随机抽取总体内的个体集合组成小样本,所有这些小样本合并成一个样本。
16、方便取样 在方便的时间和地点取样,又称偶遇取样。代价低,简单易行。
17、判别取样 研究者根据自己的知识和经验,主观决定取样总体的某个部位(时间和空间)。
关于发展社会事业和改善民生的几个问题18、配额取样 :与分层取样类似,也是对总体首先进行分层,并决定各层所占比例,然后与分层取样不同的是在每层中配额取样采用的是非概率取样方法。?
19、滚雪球取样 先选取合适的调查对象初步取样分析,根据调查分析结果进一步选取更多的样本,像滚雪球一样不断扩大研究区域。
20、相关分析: 相关分析通过图形和数值两种方式,有效地揭示事物之间相关关系的强弱
程度和形式。
21、因子分析 是一种降维、简化数据的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。
二、上海东亚地球物理勘查有限公司问答题
1、地学数据获取的不确定性有哪些?
数据固有的不确定性
数据获取过程中引起的不确定性
数据处理过程中引起的不确定性
数据转换过程中引起的不确定性
数据传输过程中引起的不确定性
数据提取和分类过程中引起的不确定性
数据应用不当引起的不确定性
2、对一元地学变量的描述方法有哪些?
沈阳市装备制造工程学校(1)一元地学数据的图形展示
    连续型数据的图形描述
        频率分布表、频率分布直方图、理论频率分布
    名义型数据的图形描述
        柱状图和饼图等
(2)一元地学数据的中心位置度量
    平均值、中位数、众数
(3)一元地学数据的离散度度量
极差、方差和标准差、四分位数间距
3、连续型数据中心位置的度量常用的统计量是什么?
(1)平均值(算数平均值、几何平均值、加权平均值)
(2)中位数:一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数)。中位数也可表述为第50百分位数,二者等价。
(3)众数:是一组数据中出现次数最多的数值,叫众数,有时众数在一组数中有好几个。
4、对一元地学数据的离散度度量常用的统计量是什么?
(1)极差:一组数据中的最大数据与最小数据的差。
(2)方差和标准差:方差是实际值与期望值之差平方的期望值。
                  标准差是方差平方根。
(3)四分位数间距:第三四分位数与第一四分位数的差距又称四分位数间距(InterQuartile Range, IQR)。 IQR=Q3—Q1
5、什么是标准变换,标准变换后的数据集有什么优点?
 
变换后的数据集,平均值为0,标准差为1。
6、箱线图的功能是什么?
A. 利用箱线图便于对多个样本数据的形状进行比较
B. 直观明了地识别数据批中的异常值
C. 利用箱线图判断数据集的偏态和尾重  
7、高维点数据的可视化方法有哪些?
可变散点图(Scatterplot with varying dots)
苏州蓝缨学校散点图矩阵(Scatterplot matrix)
多变量轮廓( Multivariate profiles )
星形图( Star picture )
安德斯绘图( Andrews’ Fourier transformations )
安德森绘图( Metroglyphs )
脸谱法( Chernoff’s faces )
8、高维点数据的可视化方法中的散点图矩阵的特征是什么?
  Histograms on diagonal(散点图矩阵的对角线为柱状图)
  Scatterplot on lower portion(散点图矩阵的下部分为散点图)
  Correlations on upper portion(散点图矩阵的上部分为相关系数)
9、三维域上的标量场可视化方法有哪些?
三维域上的标量场的可视化一般称为体可视化,方法:
(1)等值面
(2)编织图
(3)体绘制
10、变量之间的关系可归纳为哪两种大类,分别是什么?
函数关系:指变量之间的一种一一对应的关系。
相关关系(统计关系):指变量之间客观存在的不严格确定的依存关系(因果关系)。相关关系又分为线性相关和非线性相关。
11、相关关系和函数关系的区别和联系是什么?
a)区别
1 函数关系变量之间存在严格的依存关系,其关系是不对等的(因果关系)。相关关系则不确定,可以在一定范围内变动,变量之间的关系完全对等。
2 函数关系可以用方程表示出来,而相关关系则不能。
b)    联系
1 函数关系是相关关系的特例,函数关系是完全的相关关系。树状模式
2 由于测量误差的存在,函数关系往往通过相关关系表现出来。
3 相关关系常常借助于函数关系的形式进行描述。
12、相关关系的分类有哪些方法?
a)根据相关因素的多少分为:单相关(两个变量之间的关系)、复相关(多个变量之间的关系)和偏相关(在一个变量与多个变量相关时,假定其他变量不变,其中两个变量之间的相关关系)。
b)根据相关的表现形式分为线性相关和非线性相关。
c) 根据变量变化的方向分为:正相关和负相关。
d) 根据相关的程度分为:完全相关、不完全相关和不相关。
13、变量间的非线性相关关系分为哪两类,曲线估计是用来解释哪一类问题的?
14、Q型聚类分析常用距离来测量样品之间的相似程度,常用的距离有哪些?
a)明考夫斯基距离(绝对距离、欧氏距离、切比雪夫距离)
b)兰氏距离
c)马氏距离
15、应用欧氏距离进行聚类分析的缺陷是什么?
1)它没有考虑到子体的变异对“距离”远近的影响,一个变异程度大的子体可能与更多样品近些,既使它们的欧氏距离不一定最近;
2)另外,欧氏距离受变量的量纲影响,这对多元数据的处理是不利的。
3)如果变量之间存在相关性,则会对处理结果带来影响。
16、R型聚类分析中变量相似性的度量有哪几种方法?
从变量的方向趋同性或“相关性”考察变量间的相似性, 从而得到“夹角余弦法”和“相关系数”两种度量方法。
1、夹角余弦
    两变量Xi与Xj看作p维空间的两个向量,这两个向量间的夹角余弦可用下式进行计算
   
显然,∣cos  ij∣<= 1。
2.相关系数
    相关系数:度量变量间的相似性。变量Xi与Xj的相关系数定义为
                                                                                          显然也有,∣rij∣<=1。
17、根据类间距离的不同,系统聚类法可分为哪几种?
  常用的类间距离定义有8种之多,与之相应的系统聚类法也有8种:最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法和离差平方和法。
18、因子分析的步骤是什么?
1 )对原始数据进行标准化处理,建立变量的相关矩阵。
2 )利用雅克比行列式方法求解相关矩阵的特征值和特征向量
3 )因子提取,即选取一定的特征值,计算因子载荷以及公共因子方差
4 )因子旋转,为便于对主因子进行解释,一般需要对因子载荷矩阵进行旋转,达到结构简化的目的
5 )计算因子得分
19、因子分析中为什么要对分析结果进行因子旋转?
    因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。有时直接根
据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。例如,可能有些变量在多个公共因子上都有较大的载荷,有些公共因子对许多变量的载荷也不小,说明它对多个变量都有较明显的影响作用。这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很难对因子的实际背景进行合理的解释。
    这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小,至多达到中等大小。这时对于每个公共因子而言(即载荷矩阵的每一列),它在部分变量上的载荷较大,在其它变量上的载荷较小,使同一列上的载荷尽可能地向靠近1和靠近0两极分离。这时就突出了每个公共因子和其载荷较大的那些变量的联系,矛盾的主要方面显现出来了,该公共因子的含义也就能通过这些载荷较大变量做出合理的说明,这样也显示了该公共因子的主要性质。
20、使用经典统计学研究地学变量的局限性是什么?
>温峤娶妇

本文发布于:2024-09-22 07:38:48,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/53496.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   变量   关系   相关   进行   因子   取样
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议