多元统计判别分析实验报告

判别分析(设计性实验
(Discriminant analysis)
实验原理:判别分析是判别样品所属类型的一种统计方法。判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样品的观测数目,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类。本实验要求学生应用距离判别准则(即,对任给的一次观测,若它与第i类的重心距离最近,就认为它来自第i类),对两总体和多总体情形下分别进行判别分析。实验中需注意协方差矩阵相等时,选取线性判别函数;协方差矩阵不相等时,应选取二次判别函数。
实验题目一:
为了检测潜在的血友病A携带者,下表中给出了两组数据(t11a8)
非携带者(1
被迫携带者(2
Group
x1
x2
Group
x1
x2
1
-0.0056
-0.1657
2
-0.3478
0.1151
1
-0.1698
-0.1585
2
-0.3618
-0.2008
1
-0.3469
-0.1879
2
-0.4986
-0.086
1
-0.0894
0.0064
2
-0.5015
-0.2984
1
-0.1679
0.0713
2
-0.1326
0.0097
1
-0.0836
0.0106
2
-0.6911
-0.339
1
-0.1979
-0.0005
2
-0.3608
0.1237
1
留几本书在窗台 阅读答案-0.0762
0.0392
2
-0.4535
-0.1682
1
-0.1913
-0.2123
2
-0.3479
-0.1721
1
-0.1092
-0.119
2
-0.3539
0.0722
1
-0.5268
-0.4773
2
-0.4719
-0.1079
场景建模1
-0.0842
0.0248
2
-0.361
-0.0399
1
-0.0225
-0.058
2
-0.3226
0.167
1
0.0084
0.0782
2
-0.4319
-0.0687
1
-0.1827
-0.1138
2
-0.2734
-0.002
1
0.1237
0.214
2
-0.5573
0.0548
1
-0.4702
-0.3099
2
-0.3755
-0.1865
1
-0.1519
-0.0686
2
-0.495
-0.0153
1
0.0006
-0.1153
2
-0.5107
-0.2483
1
-0.2015
-0.0498
2
-0.1652
0.2132
1
-0.1932
-0.2293
2
-0.2447
-0.0407
1
0.1507
0.0933
2
-0.4232
-0.0998
1
-0.1259
-0.0669
2
-0.2375
0.2876
1
-0.1551
-0.1232
富兰克林罗斯福2
-0.2205
0.0046
1
-0.1952
-0.1007
2
-0.2154
挂壁式电视
-0.0219
1
0.0291
0.0442
2
-0.3447
0.0097
1
-0.228
-0.171
2
-0.254
-0.0573
1
-0.0997
-0.0733
2
-0.3778
-0.2682
1
-0.1972
-0.0607
2
-0.4046
-0.1162
1
-0.0867
-0.056
2
-0.0639
0.1569国门之盾
2
-0.3351
-0.1368
2
-0.0149
0.1539
2
-0.0312
0.14
2
-0.174
-0.0776
2
-0.1416
0.1642
2
-0.1508
0.1137
2
-0.0964
0.0531
2
-0.2642
0.0867
2
-0.0234
0.0804
2
-0.3352
0.0875
2
-0.1878
0.251
2
-0.1744
0.1892
2
-0.4055
-0.2418
2
-0.2444
0.1614
2
-0.4784
0.0282
其中x1=log10(AHF activity),x2=log10(AHF antigen)。
下表给出了五个新的观测,试对这些观测判别归类;(t11b8)
观测
x1
x2
1
-.112
-0.279
2
-.059
-0.068
3
.064
0.012
4
-.043
-0.052
5
-.050
-0.098
实验要求:
(1)分别检验两组数据是否大致满足二元正态性;
(2)分别计算两组数据的协方差矩阵,是否可以认为两者近似相等?
(3)对训练样本和新观测合并作散点图,不同的类用不同颜标识;
(4)用lda函数做判别分析,即在协方差矩阵相等的情形下作判别分析;
(5)用qda函数做判别分析,即在协方差矩阵相等的情形下作判别分析;
(6)比较方法(4)和方法(5)的误判率。
实验题目二:
某商学研究生院的招生官员利用指标――大学期间平均成绩GPA和研究生管理能力考试GMAT的成绩,将申请者分为三类:接受,不接受,待定。下表中给出了三类申请者的GPA与GMAT成绩:(t11a6)
GPA(x1
GMAT(x2
接受
GPA(x1
GMAT(x2爪形手
不接受
GPA(x1
GMAT(x2
待定
2.96
596
1
2.54
446
2
2.86
494
3
3.14
473
1
2.43
425
2
2.85
496
3
3.22
482
1
2.2
474
2
3.14
419
3
3.29
527
1
2.36
531
2
3.28
371
3
3.69
505
1
2.57
542
2
2.89
447
3
3.46
693
1
2.35
406
2
3.15
313
3
3.03
626
1
2.51
412
2
3.5
402
3
3.19
663
1
2.51
458
2
2.89
485
3
3.63
447
1
2.36
399
2
2.8
444
3
3.59
588
1
2.36
482
2
3.13
416
3
3.3
563
1
2.66
420
2
3.01
471
3
3.4
553
1
2.68
414
2
2.79
490
3
3.5
572
1
2.48
533
2
2.89
431
3
3.78
591
1
2.46
509
2
2.91
446
3
3.44
692
1
2.63
504
2
2.75
546
3
3.48
528
1
2.44
336
2
2.73
467
3
3.47
552
1
2.13
408
2
3.12
463
3
3.35
520
1
2.41
469
2
3.08
440
3
3.39
543
1
2.55
538
2
3.03
419
3
3.28
523
1
2.31
505
2
3
509
3
3.21
530
1
2.41
489
2
3.03
438
3
3.58
564
1
2.19
411
2
3.05
399
3
3.33
565
1
2.35
321
2
2.85
483
3
3.4
431
1
2.6
394
2
3.01
453
3
3.38
605
1
2.55
528
2
3.03
414
3
3.26
664
1
2.72
399
2
3.04
446
3
3.6
609
1
2.85
381
2
3.37
559
1
2.9
384
2
3.8
521
1
3.76
646
1
3.24
467
1
实验要求:
(1)对上表中的数据作散点图,不同的类用不同的颜标识;
2)用lda函数做判别分析,即在协方差矩阵相等的情形下作判别分析;
3)用qda函数做判别分析,即在协方差矩阵相等的情形下作判别分析;
(4)比较方法(2)和方法(3)的误判率;
(5)现有一新申请者的GPA为3.21,GMAT成绩为497。请将该观测在(1)的散点图中标出,并分别用方法(2)和方法(3)将其归类?你认为哪一种方法更合适?
(6)观察(1)的散点图中第三类的观测点有无异常值?若有,将该异常值剔除后再对新申请者判别归类,结果有无变化?
实验题目一分析报告:
输出结果及分析:
(1)分别检验两组数据是否大致满足二元正态性;
>data5<-read.csv("data5.csv",header=T)  #导入数据
>data5b<-read.csv("data5b.csv",header=T)  #导入数据
>group1<-read.csv("data51a.csv",header=T)  #导入数据
>group2<-read.csv("data51b.csv",header=T)  #导入数据
>group1<-group1[,-1] 
>group2<-group2[,-1]
>st(t(group1)) #利用st函数检验数据二元正态性
>st(t(group2))
w
p-value
血友病A非携带者
0.95
0.1468
血友病A携带者
0.97
0.2535
从输出结果可知,两组二元正态性检验的伴随概率分别为0.14680.2535,不拒绝原假设
(H0:满足二元正态性),说明两组数据满足二元正态性。

本文发布于:2024-09-23 20:11:37,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/33143.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   实验   判别
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议