大数据环境下高校数据分析研究作者:艾何洁 刘欢 刘桂香丁晓生
来源:《新教育时代·教师版》2018年第41生于一九九叉期 摘 要:近五年来,数据量呈现出爆发式增长,针对大数据的研究也层出不穷。打造网眼监控“数据中国”已成为“十三五”规划的重要组成。大数据研究已成为衡量国家竞争力的重要标志。
关键词:大数据 环境 高校数据分析
落叶是疲倦的蝴蝶 大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM4m3提出):Volume(大量)、Variety(多样)、Velocity(高速)、Value(低价值密度)、Veracity(真实性)。[1]
大数据技术的战略意义是对有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过路德宗
“加工”实现数据的“增值”。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。[2] 云计算服务,即云服务,是指可以拿来作为服务提供使用的云计算产品。包括云主机,云空间,云开发,云测试和综合类产品等。
对于云计算的服务类型来说,一般可分为三个层面,分别是:IaaS、PaaS和SaaS。这三个层次组成了云计算技术层面的整体架构,这其中可能包含了一些虚拟化的技术和应用、自动化的部署以及分布式计算等技术,这种技术架构的优势就是可以对外表现出非常优秀的并行计算能力以及大规模的伸缩性和灵活性等特点。