( √ )1.运用基于计算机的方法,包括新技术,从而在数据中获得有用知识的整个过程,就叫做数据挖掘。 ( √ )2.大数据往往可能蕴含着丰富的规律和知识,所以在大数据之上应用数据挖掘就成了理所当然的活动了。
( √ )3. 1989年,术语“数据库中的知识发现”正式确立,即KDD。
( √ )4.通过数据挖掘技术,可以发现许多深层的、手工无法发现的规律,帮助企业在激烈的竞争环境中,占有更多的先机。
( √ )5.一般而言,数据仓库应先行建立完成,数据发掘才能有效率的进行。
( × )6.Web数据挖掘是通过数据库中的一些属性来预测另一个属性,它在验证用户提出的假设过程中提取信息。
( × )7.与分类不同的是,回归的输出是离散的类别值,而分类的输出是连续数值。
( √ )8.近年来,随着人工智能机器学习模式识别和数据挖掘等领域中传统方法的不断发展以及各种新方法新技术的不断涌现,分类方法得到了长足的发展。
( × )9.“根据客户的消费行为,把客户分成三个类,第一个类的主要特征是……”,实际上这是一个分类问题。
( × )10.至今Apriori仍然作为聚类分析的经典算法被广泛讨论。 ( √ )11.神经网络在学习中,一般分为“有教师学习”和“无教师学习”两种。
( √ )12.早期的数据挖掘工具采用命令行界面,而且文本格式的输出也不够直观。
( × )13.k-Means聚类算法以相对距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。
( √ )14.从混淆矩阵中,可以衍生出各种评价的指标。错误发现率(False discoveryrate,FDR),表示在模型预测为正类的样本中,真正的负类的样本所占的比例。
( √ )15.层次聚类方法的基本思想是:通过某种相似性测度计算节点之间的相似性,并按相似度由高到低排序,逐步重新连接个节点。
( × )16.政府2.0、政府3.0,与政府以后的治理改革和服务型政府建设的目标是完全不一致的。
( × )17.深度学习就是指Tensorflow框架。智力七巧板
( √ )18.大数据的价值重在挖掘,目的在于从数据中获取有用知识。
( × )19.简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。
( √ )20.维是人们观察数据的特定角度,是考虑问题时的一类属性。
单项选择题
1.下列哪个选项不属于数据可视化的范畴()。 [单选题] *
A.科学可视化 |
B.图表可视化(正确答案) |
C.信息可视化 |
D.可视化分析 |
|
我还缺少什么
2.下列哪个选项不属于最为常见的六种图形()。 [单选题] *
3.下列()可视化图表通常用颜深浅表示数值大小 [单选题] *
A.柱状图 |
B.热力图(正确答案) |
C.散点图 |
D.气泡图 |
朔天运河 |
4.数据集合中出现次数最多的数值被称为() [单选题] *
sfvA.平均数 |
B.众数(正确答案) |
重庆南开中学课间操C.中位数 |
D.极差 |
|
5.()指总体中的最大值与最小值的差,反映总体标志值的差异范围。 [单选题] *
A.极差(正确答案) |
B.方差 |
C.标准差 |
D.离散系数 |
|
6.分析买家购买商品时产生流量和金额的各渠道情况需要细分() [单选题] * 7.统计时间内支付金额/支付买家数(或商品件数),衡量统计时间内每位买家的消费金额大小是()指标 [单选题] *
A.支付金额(正确答案) |
B.买家数 |
C.单价 |
D.客单价 |
|
8.平均停留时长和跳失率都是()的分析内容 [单选题] *
A.交易分析 |
B.流量分析(正确答案) |
C.访客分析 |
D.商品分析 |
|
9.商品分析中的重点商品选择可以借助( )方法 [单选题] *
A.回归分析 |
B.相关分析 |
C.漏斗分析 |
D.ABC分类(正确答案) |
|
10.ABC分类中畅销的、库存周转率高的高价值商品为() [单选题] *
>西安车辆厂