多元统计分析简答题

1、欧式距离与马氏距离的优缺点:
欧式距离:优点:简单、易操作、广泛使用
缺点:每个坐标对欧式距离的贡献是同等的,当坐标轴表示测量值时,他们往往带有大小不等的随机波动。
    当各个分量为不同性质的量时,“距离”的大小与指标的单位有关。
    马氏距离:优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关:
由标准化数据和中心化数据(即原始数据和均值之差)计算出的两点之间的马氏距离相同,马氏距离可以排除变量之间的相关性的干扰。
缺点:马氏距离建立在总体样本的基础上,否则最终两个样本的马氏距离不同:在计算马氏距离的过程中,要求总体样本数大于样本的维数,否则得到的总体样本协方差矩阵逆矩阵不存在,二维样本在其所处的平面内共线,协方差矩阵逆矩阵也不存在,由此可知协方差矩阵对马氏距离计算的重要性导致了马氏距离的不稳定。在很大程度上,马氏距离夸大了变化微小变量的作用。
2、聚类分析计算步骤:
(1)分析所需要研究的问题,确定聚类分析所需要的多元变量
(2)选择对样本聚类还是对指标聚类
(3)选择合适的聚类方法
热再生(4)选择所需的输出结果
开关量信号3、模糊聚类分析计算步骤:
(1)对原始数据进行变换
(2)打包流水线计算模糊相似矩阵
减速机测试台(3)建立模糊等价矩阵
(4)进行聚类
4、模糊聚类的基本概念:
    (1)特征函数
        A(x)为A的特征函数
    (2)隶属函数 若一个矩阵元素取之于[0,1]范围,称该矩阵为模糊矩阵
    (3)模糊聚类的运算法则
  i=1,2,··· j=1,2,··· -max  -min
5、主成分分析的基本思想:
    通过对原始变量相关矩阵或协方差矩阵内部结构关系等研究,利用原始变量的线性组合形成几个综合指标(主成分),在保留原始变量主要信息的前提下起到降维和简化问题的作用,使得在研究复杂问题时更容易抓住主要矛盾。利用主成分分析得到的主成分与原始变量之间如下基本关系:
(1)每一个主成分都是个原始变量的线性组合
(2)主成分的数目大大少于原始变量的数目
(3)主成分保留了原始变量绝大多数信息
(4)各主成分之间互不相关
6、主成分分析步骤:
(1)根据研究问题选取初始分析变量
防潮密闭门(2)根据初始变量特性判断由协方差阵求主成分还是相关阵求主成分
(3)求协方差阵或相关阵的特征根与相应标准特征向量
(4)判断是否存在明显的多重共线性,若存在,回到第一步
(5)得到主成分的表达式并确定主成分个数,选取主成分
(6)结合主成分对研究问题进行分析并深入研究
7、因子分析的基本思想:
根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量见的相关性则较低,每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就称公共因子。对于所研究的某一具体问题,原始变量可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。因子分析不仅可以用来研究变量之间的相关关系,为R型因子分析,还可以用来研究样本之间的相关关系,为Q型因子分析。
8、因子分析的步骤
(1)根据研究问题选取原始变量
(2)对原始变量进行标准化并求相关阵,分析变量之间的相关性
(3)求解初始公共因子及因子载荷矩阵
矩阵干扰(4)因子旋转
(5)因子得分
(6)根据因子得分值进行进一步分析
9、主成分分析和因子分析的区别
(1)因子分析把展示在我们面前的诸多变量看成由对每一个变量都有作用的一些公共因子和一些仅对某一变量有作用的特殊因子线性组合而成。因此,我们的目的就是要从数据中探查能对变量其解释作用的公共因子和特殊因子,以及公共因子和特殊因子组合系数。主成分分析则简单一点,它只是从空间生成的角度寻能解释诸多变量绝大部分变异的几组彼此不大相关的新变量(主成分)。
(2)因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。
(3)主成分分析中不需要有一些专门假设(assumptions)因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子之间不相关,共同因子和特殊因子之间也不相关。 
(4)提取主因子的方法不仅只有主成分法,还有极大似然法等,基于这些不同算法得到的
结果一般也不同。而主成分只能用主成分法提取。
(5)主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一时,主成分一般是固定的;而因子分析中因子不是固定的,可以旋转得到不同的因子。 
(6)在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。 
(7)和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。所以这中区分不是绝对的。 

本文发布于:2024-09-22 03:56:21,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/332738.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:变量   因子   成分   矩阵   分析   距离
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议