统计知识决定系数R⽅、调整后的R⽅、F值指标的意义:
个体工商户税收定期定额征收管理办法
⼀、R2
也称拟合优度、决定系数:反应回归模型拟合数据的优良程度 先说结论:R2越接近 1 ,拟合效果越好
电影黑名单
回归:所有实际数值点向均值回归,认为均值含有所有点最⼤的信息量
实际信息:点的实际值减去均值认为是这个点的实际信息(蓝⾊条),可以拆分成下⾯两部分
血淋巴
误差信息:实际值减线上的点的值,这是未拟合出来的信息(黄⾊条)
拟合出的信息:拟合出来的线上的点减均值(红⾊条)
对于⼀个模型来说:误差信息越短,拟合出的信息越长,拟合效果越好。
拟合优度涉及的三个指标
潘神的迷宫好看吗1. SST:总体平⽅和,它的⼤⼩描述了数据集中的数的分散程度
2. SSE:残差平⽅和
3. SSR:回归平⽅和,拟合数据的分散情况
⼆、调整后的 R2
在样本容量⼀定的情况下,增加解释变量必定使得⾃由度减少
阿尔法氨基酸⽬的:在模型的复杂程度和衡量模型的优良程度上取⼀个平衡
让模型趋于简单(模型复杂之后会使预测受到⼀定限制:过拟合)
郑州 大学 所以注意!多元统计要⽤调整后的R2来衡量
具体操作:将残差平⽅和与总离差平⽅和分别除以各⾃的⾃由度,以剔除变量个数对拟合优度的影响
三、F 值
先说结论:F 值越⼤,模型整体显著性⽔平越⾼
意义:所估计回归的总显著性的⼀个度量,也是调整后的R⽅的⼀个显著性检验
即:验证模型整体显著性⽔平的指标:F值越⼤越拒绝 0 假设
检验模型中的参数β们是否显著不为 0
由于 SSR 是解释变量 X 的联合体对被解释变量 Y 的线性作⽤的结果,考虑SSR/SSE的⽐值:
如果这个⽐值较⼤,可认为总体存在线性关系; 反之总体上可能不存在线性关系。
F值与调整后的R⽅呈同向变化
当调整后的R⽅为 0 时,F = 0;
调整后的R⽅越⼤,F值越⼤;
当调整后的R⽅为1 时,F值为正⽆穷。