数据挖掘练习题

一、选择题
1、从海量数据建院附中提取有用的信息,所面临的困难有(      )
路径规划A、数据量太大,无法使用传统的数据分析工具和技术处理它们
B、数据本身不是非传统数据,不能使用传统的数据处理方法进行处理
C、在某些情况下,面临的问题不能使用己有的数据分析技术来解决
  D、数据量太大,没有足够的存储空间。
2、下列任务中,属于数据挖掘技术商务智能方面应用的是(      )教学改革设想
A、顾客分析    B、定向营销    C、商店分布    D、欺诈检测
3、在地球的气候领域,数据挖掘开发的技术可以帮助地球科学家解决以下问题
A、干旱和飓风等生态系统扰动的频度和强度与全球变暖之间有何联系
B、海洋表面温度对地表降水量和温度有何影响
C、如何准确地预测一个地区的生长季节的开始和结束
  D、
4、下列任务中,属于数据挖掘范畴的是
A、预测一位新的顾客是否会在一家百货公司消费 100美元以上。
B、使用数据库管理系统查个别的记录
C、通过因特网的搜索引擎查特定的 Web页面
D、根据性别划分公司的顾客。
5、下列任务中,属于数据挖掘范畴的是
A、根据可赢利性划分公司的顾客。
B、计算公司的总销售额。
C、按学生的标识号对库排序。
D、监视病人心率的异常变化。
让朋友圈清清爽爽6、幻想曲古筝数据预处理涉及的步骤包括
A、融合来自多个数据源的数据,
B、清洗数据以消除噪声和重复的观测值,
C、选择与当前数据挖掘任务相关的记录和特征。
D、
7、下列数据挖掘任务中,属于分类任务的是
A、预测一个Web用户是否会在网上书店买书
B、预测某股票的未来价格
C、根据检查结果判断病人是否患有某种疾病。
  D、
8、异常检测的应用包括
A、检测欺诈
B、网络攻击
C、疾病的不寻常模式
D、生态系统扰动
二、名词解释
1、交叉销售指根据顾客的兴趣推荐或显示相关商品以增加销售机会。
2、提升销售指尝试向曾经购买的顾客销售价格更高的商品。
3、数据挖掘是在大型数据存储库中,自动地发现有用信息的过程。
甲状腺鳞状细胞癌4、数据挖掘技术用来探查大型数据库,发现先前未知的有用模式。
5、数据预处理将未加工的输入数据转换成适合分析的形式。
6、关联分析:用来发现描述数据中强关联特征的模式。
7、聚类分析:用来发现紧密相关的观测值组,使得与属于不同簇的观测值相比,属于同一簇的观测值相互之间尽可能类似。
三、简答题
1、简述数据库中知识发现的过程。
数据库中知识发现的过程是将未加工的数据转换为有用信息的整个过程,如图所示。该过程包括一系列转换步骤,从数据的预处理到数据挖掘结果的后处理。
2数据挖掘算法要解决的问题
(1)算法的可伸缩
(2)高维性
(3)异种数据和复杂数据
(4)数据的所有权与分布
(5)非传统的分析
3、分布式数据挖掘算法面临的主要挑战包括:
(1)如何降低执行分布式计算所需的通信量
(2)如何有效地统一从多个资源得到的数据挖掘结果
(3)如何处理数据安全性问题
4、数据挖掘任务分为哪两类
数据挖掘任务分为下面两大类
(1)预测任务。目标是根据其他属性的值,预测特定属性的值。
(2)描述任务。其目标是导出概括数据中潜在联系的模式(相关、趋势、聚类、轨迹和异常)。
5、预测建模任务有哪两类它们的区别是什么
预测建模任务分为分类和回归两类。它们的区别在于分类用于预测离散的目标变量;回归用于预测连续的目标变量。

本文发布于:2024-09-23 03:22:59,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/68516.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   数据挖掘   任务   预测   相关   发现   属于   使用
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议