数据分析之描述性分析

数据分析之描述性分析
SPSS的模块按功能可以分为三部分:描述性分析、推断性分析、探索性分析。
1.描述性分析主要是对所收集的数据进⾏分析,得出反映客观现象的各种数量特征的⼀种分析⽅法,它包括数据的集中趋势分析、数据离散程度分析、数据的频数分布分析等,描述性分析是对数据进⼀步分析的基础。
2.推断性分析是研究如何根据样本数据来推断总体样本数量特征,它是在对样本数据进⾏描述统计分析的基础上,对研究总体的数量特征做出推断。常见的分析⽅法有假设检验、相关分析、回归分析、时间序列分析等⽅法。
卑南族3.探索性分析主要是通过⼀些分析⽅法从⼤量的数据中发现未知且有价值信息的过程,它不受研究假设和分析模型的限制,尽可能地寻变量之间的关联性。常见的分析⽅法有聚类分析、因⼦分析、对应分析等⽅法。
⽂/黄成甲
频率分析
频率分析主要通过频数分布表、条形图和直⽅图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征,以便我们队数据的分布特征形成初步的认识,才能发现隐含在数据背后的信息,为后续数据分析提供⽅向和依据。
频率分析包括分类变量的频率分析和连续变量的频率分析。在SPSS⾥都采⽤频率表来做频率分析。对于连续变量数据的分析,描述的统计量包括百分位值、集中趋势、离散趋势和数据分布特征。
1.百分位值
百分位值主要⽤于对连续变量数据离散程度的测量,常⽤的百分位值是四分位数。它是将变量中的数据从⼩到⼤排序后,⽤三个数据点将数据分为四等份,与这三个点相对应的数值称为四分位数。由于是等分整个数据,这三个数据点分别位于数据的25%(第⼀四分位数)、50%(第⼆四分位数,也就是常⽤的中位数)和75%(第三四分位数)的位置。
2.集中趋势
集中趋势反映了数据向其中⼼值聚集的程度,是对数据⼀般⽔平的概括性度量,主要通过平均值、中位数和众数来表⽰。
集中趋势主要统计量
3.离散趋势新型磁选机
离散趋势反映了数据远离中⼼值的程度,是衡量集中趋势值对整个数据的代表程度。数据的离散度越⼤,说明集中趋势值的代表性越低;反之,数据的离散程度越接近于0,说明集中趋势值的代表性越⾼。数据的离散程度主要通过范围、标准差和⽅差来表⽰。
离散趋势主要统计量
4.分布特征
对于连续变量,在样本量较⼤的情况下,研究若你有会提出假设,认为数据应当服从某种分布,每种分布都可以采⽤⼀系列的指标来描述数据离散分布的程度。在图形的显⽰上,对于分类数据,如果需要了解数据分布,则可以选择条形图;如果需要了解数据结构,则选择饼图;⽽对于连续数据,选择直⽅图。
条形图和直⽅图的区别:
(1)条形图⽤于展⽰分类数据,直⽅图⽤于展⽰连续数据;
(2)条形图是⽤条形的长度表⽰各类别频数的多少,直⽅图是⽤⾯积表⽰各组频数的多少,矩形的⾼度表⽰每⼀组的频数或频率,宽度表⽰各组的组距;
(3)直⽅图分组数据具有连续性,所以直⽅图的各矩形通常是连续排列的,⽽条形图表⽰分类数据,则是分开排列;
描述分析
描述分析与频率分析的不同之处在于:
(1)描述分析提供的统计量仅适⽤于连续变量,频率分析既可⽤于分析连续变量,也可⽤于分析分类变量;
(2)描述分析⽆相应统计图绘制输出,并且提供计算的统计量也相对较少。
但在描述性分析⾥可以进⾏Z标准化。
交叉表分析
交叉表⽰⼀种⾏列交叉的分类汇总表格,⾏和列上⾄少各有⼀个分类变量,⾏和列的交叉处可以对数据进⾏多种汇总计算,如求和、平均值、计数等。交叉表分析是⽤于分析两个或两个以上分类变量之间的关联关系,以交叉表格的形式进⾏分类变量间关系的对⽐分析。它的原理是从数据的不同⾓度综合进⾏分组细分,以进⼀步了解数据的构成、分布特征,它是描述分析常⽤⽅法之⼀。类似于EXcel的数据透视表。
频率分析、描述分析都是对单个变量进⾏分析,交叉表可以对多个变量在不同取值情况下的数据分布情况进⾏分析。从⽽进⼀步分析变量之间的相互影响和关系。
多选题定义橙书包公益项目
应收账款周转率
在SPSS⾥,多选题也称为多重响应集,意为使⽤多个变量记录答案,其中每个个案可以给出多个答案。
多选题数据录⼊的⽅式有两种:⼆分法和多重分类法。
(1)⼆分法:把每⼀个相应选项定义为⼀个变量,每⼀个变量值均做这样的定义——“0”代表未选,“1”代表选中,即对于被调查者选中的选项录⼊1,对未选的选项录⼊0。
(2)多重分类法:事先定义录⼊的数值,⽐如1,2,3,4,5分别代表选项A、B、C、D、E,并且根据多选题限选的项数确定应录⼊的变量个数。例如限选3项,那么需要设⽴3个变量,如果调查者在该题选ACD,则在3个变量下分别录⼊1、3、4。
在通常情况下,如果多选题没有限定选项个数,并且选项个数不多时,可以采⽤⼆分法录⼊。如果对选项的个数加以限定,则改⽤多重分类法进⾏录⼊。
抗氧化性数据报表制作
常见的表格类型有叠加表、交叉表和嵌套表。
(1)叠加表
同⼀张表中有多个同类变量的描述分析结果,可以简单地理解为对每个变量分别做同样的分析,然后将结果拼接在⼀起。
叠加表⽰意图
(2)交叉表
它是⼀种⾏列交叉的分类汇总表格,⾏和列上⾄少各有⼀个分类变量,⾏和列的交叉处可以对数据进⾏多种汇总计算,如计数、百分⽐、求和、平均值等。
交叉表⽰意图
(3)嵌套表
它是指多个变量放置在同⼀个表格维度中,也就是说,分析维度是由两个及以上变量的各种类别组合⽽成的。嵌套表主要应⽤在需要展现较多的统计指标时,能够使结果更为美观和紧凑。
嵌套表⽰意图
三打白骨精教学设计

本文发布于:2024-09-22 07:04:31,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/90490.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   分析   变量   趋势   离散   描述   频率   程度
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议