数据挖掘习题

粗糙集习题:
2.一个知识库K=(U,R),其中U={x1,x2,x3,x4,x5,x6,x7,x8},一个等价关系R形成的等价类为Y1={x1,x2,x3},Y2={x3},Y3={x4,x7,x8},Y4={x5}。X={x2,x5,x7}。试求出下近似集合和上近似集合。
4.某个系统有三个识别属性,共含有6个元素,如表所示
U
A1
A2
A3
x1
重型门
1
1
3
x2
1
1
3
x3
2
1
1
x4
3
2
2
x5
3
2
1
x6
2
1
2
令R1={A1}, R2={A2}, R3={A3}, R={R1,R2,R3},求:
(1)由R1,R2,R3分别形成的等价划分。
(2)由R形成的等价划分。
(3)如果X={x1,x2,x5},求X相对于R的粗糙度。
5.某系统的对象集、条件属性和决策属性的关系如表所示。
U
A1
A2
D
x1
1
1
1
x2
节能锅1
0
2
x3
0
2
0
x4
1
2
0
x5
0
952022720
电磁线圈1
其中A1和A2是条件属性,D是决策属性,请给出这个系统的辨识矩阵。
6.根据下列决策表写出可辨识矩阵。
U
可见度(x1)
温度(x2)
湿度(x3)
是否风大(x4)
D
1
Hunny
Hot
High
False
N
2
Sunny
Hot
High
True
N
3
Overcast
Hot
High
False废气焚烧
P
4
Rain
Mild
High
False
P
5
Rain
Cool
Normal
False
P
6
Rain
Cool
Normal
True
N
分类与预测习题:
1.给定训练集为Xtrain={(xi,yi)|i=1,2,,7},其中每个训练样本xi是一个二维特征向量;yi∈{+1,-1}为xi的类标号,即训练集中的数据样本包含两个类别。现有x1=(1,0)T, x2=(0,0.6)T, x3=(0,-1)T, x4=(0,0)T, x5=(0,2)T, x6=(0,-2)T, x7=(-2,0)T,其中y1= y2= y3=+1 ,y4 =y5= y6 =y7=-1。对于未知类标号的数据样本x=(0.4,0)T,分别利用最近邻分类方法和k-近邻分类方法(k=3)对x进行分类。
2.
关联规则习题:
1.如果L2={{a,b},{a,c},{a,d},{b,c},{b,d}},则连接产生的C3和再经过修剪的L3分别分别是什么?
2.设定SUPmin=0.5,CONFmin=0.5,使用Apriori算法完成表4.8所示的数据集关联规则的挖掘。
交易号TID
顾客购买商品Items
T1
f,a,c,d,g,i,m,p
T2
a,b,c,f,l,m,o
塑料围嘴
T3
b,f,h,j,o
T4
b,c,k,s,p
T5
a,f,c,e,l,p,m,n

本文发布于:2024-09-21 20:43:12,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/171308.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:属性   数据   分类   所示   样本
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议