fisher线性判别_判别分析——Fisher判别与Bayes判别实例操作

fisher线性判别_判别分析——Fisher判别与Bayes判别实例操
通过之前的推送,我们已经学习到Fisher判别(canonical discriminant)和Bayes判别均⽤于判别指标为定量资料的判别。前者是寻合
先验概率适的投影⽅向,使投影所得的综合指标类内差异极⼩化、类间差异极⼤化,
使投影所得的综合指标类内差异极⼩化、类间差异极⼤化,达到判别⽬的,多⽤于两类判别;后者也是在考虑先验概率的基础上,建⽴各类的线性函数,以概率作为判据,多类判别常⽤此⽅法。
的基础上,建⽴各类的线性函数,以概率作为判据
本期内容我们将在SPSS上实践操作Fisher判别和Bayes判别,以下是我们本期使⽤的案例:
为研究某些⼼电图指标对区分健康⼈、主动脉硬化症患者和冠⼼病患者3类⼈,收集23名诊断明确的研究对象的⼼电图资料,试作判别分析。
(注:在SPSSSS学堂主页,回复20190902即可获得案例数据哦)
操作过程
1.数据格式:总共23个观察单位,6个变量。在6个变量中,5个数值变量(指标)分别为x1、x2、x3、x4、x5,1个分类变量category,分别赋值为1=健康⼈、2=主动脉硬化、3=冠⼼病。
2.过程
(1)从菜单内选择 分析 → 分类 → 判别式(D)。
(2)判别分析主对话框
category选⼊分组变量并定义范围:最⼩值为,最⼤值为2,点击 继续 (如前述1=健康⼈、2=主动脉硬化、3=冠⼼病)。
①将category选⼊分组变量并定义范围
②将指标x1、x2、x3、x4、x5选⼊⾃变量。
逐步判别法,通过
③⾃变量纳⼊⽅法有⼀起输⼊⾃变量和使⽤步进法(逐步法)两个选项,前者将所有⾃变量纳⼊判别函数,后者是逐步判别法,通过Wilks统计量再纳⼊或剔除变量,本例选择 ⼀起输⼊⾃变量 。
Wilks统计量再纳⼊或剔除变量
(3)统计对话框
①描述对话框:勾选 平均值 和 单变量ANOVA。
费希尔 和 未标准化。
②函数系数:勾选 费希尔 和 未标准化
费希尔函数系数对应的是贝叶斯判别函数系数,未标准化函数系数对应的是Fisher判别(典则判别)函数系数,根据输注意:此处的费希尔函数系数对应的是贝叶斯判别函数系数,未标准化函数系数对应的是Fisher判别(典则判别)函数系数
出结果我们可以根据之前学习的基本原理将⼆者分辨出来。
③点击 继续 。
(4)分类对话框
①先验概率:⽤于贝叶斯判别,本例先验⽆知,故选择等概率,即 所有组相等;若样本较⼤且⽆选择偏倚可选择样本频率,即 根据组⼤⼩计算。
②显⽰:本例勾选 个案结果 和 摘要表。留⼀分析即⼑切法,是值得推荐的误判概率的估计⽅法。
③图:勾选 合并组,即各类共同输出在同⼀幅散点图中。
④点击 继续。
青春的起点击 继续 。
天下文学(6)判别主对话框:点击 确定。
输出结果
离岸流
1.产⽣新变量:Dis_1为判别结果,Dis1_1和Dis2_1为Fisher判别(典则判别)函数值(综合指标),Dis1_2、Dis2_2、Dis3_2为深圳潮汕商会会长吴开松
Bayes判别中属于各类的后验概率。
2.基本统计量:按原分类给出的基本统计量。
3.各⾃变量的⽅差分析:
(1)在威尔克Lambda统计量⼀列,越接近0说明组间差异越显著,越接近1,组间差异越不显著。
(2)在显著性⼀列中,除了x1在三组间⽆显著性差异(P=0.203)外,其余变量在三组间均有统计学差异。
4.Fisher(典则)判别函数
根据典则判别函数系数可列出典则函数如下:
D1=-13.788+0.292x1-0.025x2-0.053x3+2.452x4+0.783x5
D2=0.010-0.111x1-0.016x2+0.138x3-0.188x4+0.488x5
根据上述函数计算出的函数值D1和D2,即新变量中的Dis1_1和Dis2_1,结合判别分可以制定判别规则(结合判别8.分类图),即:
D1≥0:判为第1类;
D1<0且D2<0:判为第2类;
D1<0且D2≥0:判为第3类。
中国行政区划改革
5.各分类的先验概率:我们选择了等概率,故各分类的先验概率均为1/3。
6.Bayes判别函数夏新功放
表格的备注为Fisher线性函数,容易混淆视听,请⼩伙伴们注意,这是以各分类的概率⼤⼩作为判据的,肯定的是每个分类概率的函数,不是Fisher判别。
根据Bayes判别系数表可列出Bayes判别函数如下:
原分类(1)Y1=-366.979+7.455x1-0.478x2+0.266x3+101.358x4+29.598x5
原分类(2)Y2=-335.715+6.859x1-0.411x2+0.297x3+95.875x4+27.488x5
原分类(3)Y3=-339.229+6.729x1-0.447x2+0.536x3+96.139x4+28.573x5
将每个案例的各变量代⼊以上判别函数,可以获得3个函数值,将案例判别为函数值最⼤的⼀类;将函数值进⼀步计算后可获得3个后验概率,即新变量中的Dis1_2、Dis2_2、Dis3_2,将案例判给后验概率最⼤的⼀类;两种判别规则结果是完全⼀致的。
7.判别符合率表:将所有案例的观察值代⼊判别函数后形成的判别结果,将判别结果与原分类对照可得到判别符合率,本例正确率为
91.3%。

本文发布于:2024-09-22 01:26:07,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/33191.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:判别   函数   变量   概率   系数
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议