聚类分析发法

聚类分析,亦称分析或点分析,是研究多要素事物分类问题的数量方法。其基本原理是,根据样本自身的属性,用数学方法按照某些相似性或差异性指标,定量地确定样本之间的亲疏关系,并按亲疏关系的程度对样本进行聚类(徐建华,1994)。
聚类分析方法,应用在地下水中,是在各种指标和质量级别标准约束条件下,通过样品的各项指标监测值综合聚类,以判别地下水质量的级别。常见的聚类分析方法有系统聚类法、模糊聚类法和灰聚类法等。
(一)系统聚类法
系统聚类法的主要步骤有:数据标准化、相似性统计量计算和聚类。
1.数据标准化
在聚类分析中,聚类要素的选择是十分重要的,它直接影响分类结果的准确性和可靠性。在地下水质量研究中,被聚类的对象常常是多个要素构成的。不同要素的数据差异可能很大,这会对分类结果产生影响。因此当分类要素的对象确定之后,在进行聚类分析之前,首先对聚类要素进行数据标准化处理。分水实验小学
假设把所考虑的水质分析点(G)作为聚类对象(有m个),用i表示(i=1,2,…,m);把影响水质的主要因素作为聚类指标(有n个),用j表示(j=1,2,…,n),它们所对应的要素数据可用表4-3给出。在聚类分析中,聚类要素的数据标准化的方法较多,一般采用标准差法和极差法。
表4-3 聚类对象与要素数据
对于第j个变量进行标准化,就是将xij变换为x′ij
(1)总和标准化
区域地下水功能可持续性评价理论与方法研究
这种标准化方法所得的新数据x′ij满足
区域地下水功能可持续性评价理论与方法研究
(2)标准差标准化
区域地下水功能可持续性评价理论与方法研究
式中:
由这种标准化方法所得的新数据x′ij,各要素的平均值为0,标准差为1,即有
区域地下水功能可持续性评价理论与方法研究
(3)极差标准化
区域地下水功能可持续性评价理论与方法研究
经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数值均在[0,1]闭区间内。
上述式中:xij企业网络营销策略为j变量实测值;xj永生的眼睛教学设计为j变量的样本平均值;sj为样本标准差。
2.相似性统计量
系统聚类法要求给出一个能反映样品间相似程度的一个数字指标,需要到能量度相似关
系的统计量,这是系统聚类法的关键。
相似性统计量一般使用距离系数和相似系数进行计算。距离系数是把样品看成多维空间的点,用点间的距离来表示研究对象的紧密关系,距离越小,表明关系越密切。相似系数值表明样本和变量间的相似程度。
(1)距离系数
常采用欧几里得绝对距离,其中i样品与j样品距离dij
区域地下水功能可持续性评价理论与方法研究
dij越小,表示i,j样品越相似。
(2)相似系数
常见的相似系数有夹角余弦和相关系数,计算公式为
1)夹角余弦
区域地下水功能可持续性评价理论与方法研究
在式(4-20)中:-1≤cosθij≤1。
2)相关系数
区域地下水功能可持续性评价理论与方法研究
式中:dij为i样品与j样品的欧几里得距离;cosθij为i样品与j样品的相似系数;rij为i样品与j样品的相关系数;xik为i样品第k个因子的实测值或标准化值;xjk为j样品第k个因子的实测值或标准化值;
为i样品第k个因子的均值,
为j样品第k个因子的均值,
中小学电脑报;n为样品的数目;k为因子(变量)数。
厦门px项目事件
3.聚类
在选定相似性统计量之后,根据计算结果构成距离或相似性系数矩阵(n×n),然后通过一定的方法把n个样品组合成不同等级的分类单位,对类进行并类,即将最相似的样品归为一组,然后,把次相似的样品归为分类级别较高的组。聚类主要有直接聚类法、距离聚类法(最短距离聚类法、最远距离聚类法)。
(1)直接聚类法
直接聚类法,是根据距离或相似系数矩阵的结构一次并类得到结果,是一种简便的聚类方法。它首先把各个分类对象单独视为一类,然后根据距离最小或相似系数最大的原则,依次选出一对分类对象,并成新类。如果一对分类对象正好属于已归的两类,则把这两类并为一类。每一次归并,都划去该对象所在的列与列序相同的行。经过n-1次把全部分类对象归为一类,最后根据归并的先后顺序作出聚类分析谱系图。
引擎

本文发布于:2024-09-21 21:49:33,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/344915.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:聚类   样品   相似   距离   分类   要素   系数   方法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议