大数据复习要点

1、 简述大数据的来源与数据类型
大数据的来源非常多,如信息管理系统、网络信息系统、物联网系统、科学实验系统等,其数据类型包括结构化数据、半结构化数据和非结构化数据。
2负折射大数据产生的三个阶段
(1)被动式生成数据
(2)主动式生成数据
(3) 感知式生成数据
3大数据处理的基本流程
1.数据抽取与集成
2.数据分析
3.数据解释
李商隐咏史4、大数据的特征
  4V1O  VolumeVarietyValueVelocity海宁宏达高级中学On-Line
5、适合大数据的四层堆栈式技术架构
6大数据的整体技术和关键技术
大数据的整体技术一般包括:数据采集、数据存取、基础架构、数据处理、统计分析、数据挖掘、模型预测和结果呈现等。
大数据处理关键技术一般包括:大数据采集、大数据预处理、大数据存储及管理、开发大数据安全大数据分析及挖掘、大数据展现和应用(大数据检索、大数据可视化、大数据应用、大数据安全等)。
7新一代数据体系的分类
新一代数据体系中,将传统数据体系中没有考虑过的新数据源进行归纳与分类,可将其归纳到线上行为数据与内容数据两大类别。
8、EDC系统的定义
临床试验电子数据采集(Electric Data CaptureEDC)系统,在临床试验中的应用可以有效解决纸质CRF存在的问题。EDC是通过互联网从试验中心(Sites)直接远程收集临床试验数据的一种数据采集系统。
9、EDC系统的基本功能
数据录入、数据导出、试验设计、编辑检查、操作痕迹、系统安全、在线交流、医学编码和支持多语言。
换一种方式飞行10、EDC系统的优点
(1)提高了临床研究的效率,缩短了临床研究周期
(2)通过逻辑检查提高了数据质量
(3)对研究质量的监测更加方便启东市大江中学
11、大数据采集的数据来源
大数据的三大主要来源为商业数据、互联网数据与传感器数据。
12、网络数据采集和处理的四个主要模块
网络爬虫(Spider)、数据处理(Data Process)、URL队列(URL Queue)和数据(Data)。

本文发布于:2024-09-22 01:45:12,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/559865.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   采集   系统   应用   包括   检查   结构化
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议