实验报告10距离判别

实验十 距离判别
一、实验目的和要求
掌握距离判别分析的理论与方法、模型的建立与误差率估计;掌握利用判别分析的SAS 过程解决有关实际问题.
实验要求:编写程序,结果分析. 实验内容:
要求:1题必做,2,3,4题可选1-2题
1.写出几种距离公式,两总体距离判别准则;
p 维空间两点T p x x x ),,,(21 =x ,T p y y y ),,,(21 =y
1.欧氏距离    ∑=-=
p
i i i
中大博济y xmncc
d 1
2)()(y x,
2.明氏距离    m
p
i m i i y x d 11
])([)(∑=-=y x,
3.马氏距离    2李兴钢
1
1
)]()[()(y x Σy x y x,--=-T d  线性判别函数)(),(),(21x x x W W W 的估计
绝⎪⎪⎪
⎪⎪⎪⎨⎧+=--=+=+=-----)
(21)(ˆ),(ˆ)(ˆ)(21b ˆ,ˆˆ)(ˆ)(2
1b ˆ,ˆˆ)(ˆ)2()1()2()1(1)2(1)2(2
)2(12222)1(1)1(1)1(11111
x x x x x S a x x a x x S x x S a x a x x S x x S a x a x ,==-,==-,=其中T T T T T W b W b W    (5.5)    两个总体的距离判别准则
⎩⎨⎧<∈≥∈)
)(ˆ,)(ˆ)(ˆ,21221x x G x x x G x 1W W W W 若若                    (5.6) 或      ⎩
⎨⎧<∈≥∈0)(ˆ,0)(ˆ,2x G x x G x 1W W
若若
2.书上5.3  (1)
两总体之间的广义平方距离
线性判别函数 ∧
∧∧
+=j T j
j b W x a (x))
常数项)
(1)()(2
1j T j j b x
S x --=      系数向量)
(1j j x
S a -∧
=
得到两总体的马氏平方距离为537.16),(ˆ2
12=G G d 反映了两总体的分离程度 线性判别函数为
876543211
7638.3038.3573.1924.73662.51623.07327.034858.50029.93)(ˆx x x x x x x x W ++-+-+++-=x 87654321
24993.21473.69959.0806.51404.31685.02933.19719.45098.95)(ˆx x x x x x x x W ++-+--++-=x  以下结果是误判率的回带估计
以下是交叉确认估计结果:
用交叉确认法也将属于总体2G 的第17和19号样品误判为属于1G ,
其余均回判正确,误判率的回代估计为:*
2
ˆ0.07427
c p
==. 在此问距离判别分析中,西藏、上海、广东的判别结果如下:
可以看到这三个省均以100%的判别概率分到了第二类,也即城镇居民消费指标比较高的类别中,从直观上感觉可能西藏的类别划分不是很准确。以下再进一步进行Bayes 判别分析。 (2)
(一)当总体的协方差相等时: 线性判别函数结果如下:
112345678ˆ()121.49967.006  2.17890.3899  1.818  5.67040.04599.5775  1.9157W x x x x x x x x x =-++--++++212345678
ˆ()177.68028.2695  3.0690.70190.1625  4.5807  1.054413.46520.9091W x x x x x x x x x =-++-+++++同样在回代估计中结果如下:
交叉确认估计结果如下:
交叉确认法误判率估计∧*
p=2/27=0.074
c
三个待判样品的判别结果如下:
也即同(1)都属于第二类。
(二)当总体的协方差不相等时:
此时的交叉确认回判结果如下:
也即21-27号省份都应该属于第一类但误判到第二类了,此时误判率估计∧*
p=7/27=0.2592
c
在这种情况下三个样品的判别结果如下:
也即在两总体协方差矩阵不相等的情况下所有省份都属于同一类,三个待判样品也判到了第一类。显然这样的判别结果不是很合乎实际情
国统纲领况。
3.为了研究2005年全国各地区及国有控股工业企业的经营状况,数据见表1:2005经济指标:
其中:X1—工业增加率(%),X2—总资产贡献率(%),X3—资产负债率(%),X4—流动资产周转次数(次),X5—工业成本费用利用率(%),X6—全员劳动生产率(万元/人.年),X7—产品销售率(%)
(1)请用一种聚类分析方法将29个省市分为3种类型(广东、西藏除外);(2)利用距离判别建立判别函数,判定广东、西藏分别属于哪个发展类型?
表3 2005经济指标
样品
依百兰鞋业地区X1 X2 X3 X4 X5 X6 X7
序号
1 北京26.91    4.5 31.14    1.88    6.39 17.96 98.99
2 上海28 11.7 43.6    1.99 8.57 27.57 99.2
3 天津32.9 13.9 60.19    2.2 10.77 21.27 101.98
4 河北30.38 10.4 64.01    2.31    5.96 11.28 98.67
5 山西37.48 9.4 67.82    1.71    6.82 7.93 97.85
6 内蒙古43.44 9.8 64.32    2.08 7.94 16.34 98.23
7 辽宁28.76 7.5 59.33    2.15    2.78 14.19 99.86
8 吉林29.48 8.5 60.57    2.11    3.45 12.29 99.45
9 江苏24.34 11.3 59.67    2.29    4.89 15.97 99.41
10 浙江24.85 13.4 57.41    2.92    5.28 24.62 99.72
11 安徽34.54 11.2 62.83    2.18    6.15 11.77 98.89
12 福建28.87 11.9 56.16    2.38    5.74 15.38 99.49
13 江西27.21 9.7 69.38    2.01    4 8.86 99.49
14 山东36.59 15.8 60.18    2.55 10.83 18.17 99.06
15 河南31.9 10.2 65.62    2.06    5.34 8.83 98.61
16 湖北33.27 9.2 57.34    1.69 9.05 13.68 99.63
17 湖南37.13 12.7 67.23    2.07    4.24 12.71 99.52
18 广西31.64 10.8 62.91    2.09    5.88 10.42 99.69
19 海南35.44 11.7 54.23    1.97 10.95 14.26 101.3
20 重庆25.95 8.2 58.92    1.58    3.71 8.34 99.38
21 四川36.29 9.1 64.34    1.56 7.31 11.26 101.24
22 贵州36.45 9.7 66.39    1.52    5.77 9.52 99.06
23 陕西41.01 15.9 61.88    1.7 18.95 12.28 98.76
24 甘肃25.76 9.5 59.32    2.3    3.55 9.02 98.96
25 青海38.77 12.2 68.56    1.38 22.44 17 97.9
26 宁夏33.62    5.6 60.94    1.46    3.37 9 99.38
27 黑龙江50.1 35.4 54.5    2.42 39.49 19.81 97.71
28 云南44.76 20.1 47.44    1.5 13.41 22.54 100.13
29 新疆45.21 23.9 50.58    3.15 27.1 24.83 99.93
1 西藏26.51 13 53.21    2.39    6.7 24.34 98.71
2 广东55.7
3    4.7 25.48 0.97 11.8    6.31 93.68
(1)分类结果如下:

本文发布于:2024-09-21 07:58:30,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/33078.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:结果   判别   总体   距离   工业   估计   西藏
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议