相关性分析——精选推荐

相关性分析
简单相关分析的基本步骤如下:
统计-r(相关系数)与R^2的区别
r与R^2没有关系,就如同标准差与标准误差没有关系⼀样。
1.相关系数r(correlation coefficient)是⼀个评价两个变量线性相关度的指标
齐奥赛斯库评价两个变量线性相关度的指标。在线性拟合中可以通过拟合结果和实测值的相关系数来反应线性相关度。但是如果本来就⽤的⾮线性拟合(多项式、曲线),那这个指标对于评估拟合没有任何意义。
拟合结果和实测结果线性相关度
相关系数(r)定义:变量之间线性相关的度量,分三种,spearman, pearson, kendall。大禹治水玉山
不稳定的特里罗安*协⽅差:两个变量变化是同⽅向的还是异⽅向的。X⾼Y也⾼,协⽅差就是正,相反,则是负。*为什么要除标准差:标准化。即消除了X和Y⾃⾝变化的影响,只讨论两者之间关系。*因此,相关系数是⼀种特殊的协⽅差。
评价拟合好坏的指标。这⾥的拟合可以是线性的,也可以是⾮线性的。即使线性的也2.决定系数R^2(Coefficient of determination)是⼀个评价拟合好坏的指标
不⼀定要⽤最⼩⼆乘法来拟合。两个变量变化是同⽅向的还是异⽅向的,X⾼Y也⾼,协⽅差就是正,相反,则是负。
longshe
定义:对模型进⾏线性回归后,评价回归模型系数拟合优度。
公式:R^2=SSR/SST=1-SSE/SST
SST (total sum of squares):总平⽅和;SSR (regression sum of squares):回归平⽅和;SSE (error sum of squares) :残差平⽅和。生活与命运
解释:残差(residual):实际值与观察值之间的差异
在⼀组数据中,采⽤平均值做基线模型(图中⿊线)我们的模型(蓝线)都与这个⿊线⽐较,来判断模型的好坏
氰乙酸乙酯
结论:R^2=81%,因变量Y的81%变化由我们的⾃变量X来解释。
R^2 的缺陷:当我们⼈为的向系统中添加过多的⾃变量,SSE会减少,从⽽R^2变⼤。

本文发布于:2024-09-22 15:24:56,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/485484.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:拟合   变量   评价   指标   模型
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议