首页 > 学术百科

现代心理与教育统计学复习资料

现代⼼理与教育统计学复习资料

第⼀章⼼理与教育统计学基础知识

1、数据类型

称名数据

计数数据离散型数据

顺序数据全国土壤污染状况调查公报

等距数据

测量数据连续型数据

⽐率数据

2、变量、随机变量、观测值

变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们⽤⼀个量表⽰这个指标的观察结果时，这个指标是⼀个变量。

⽤来表⽰随机现象的变量，称为随机变量。⼀般⽤⼤写的Ｘ或Ｙ表⽰随机变量。

随机变量所取得的值，称为观测值。⼀个随机变量可以有许多个观测值。

３、总体、个体和样本

需要研究的同质对象的全体，称为总体。

安乐死论文每⼀个具体研究对象，称为⼀个个体。

从总体中抽出的⽤以推测总体的部分对象的集合称为样本。

样本中包含的个体数，称为样本的容量n。

⼀般把容量n ≥30的样本称为⼤样本；⽽n ＜30的样本称为⼩样本。

5、统计误差

误差是测得值与真值之间的差值。

测得值＝真值＋误差

统计误差归纳起来可分为两类：测量误差与抽样误差。

由于使⽤的仪器、测量⽅法、读数⽅法等问题造成的测得值与真值之间的误差，称为测量误差。

由于随机抽样造成的样本统计量与总体参数间的差别，称为抽样误差厦门px项目事件

第⼆章统计图表

⼀、数据的整理

在进⾏整理时，如果没有充⾜的理由证明某数据是由实验中的过失造成的，就不能轻易将其排除。对于个别极端数据是否该剔除，应遵循三个标准差法则。

⼆、次数分布表

（⼀）简单次（频）数分布表

（⼆）相对次数分布表

将次数分布表中各组的实际次数转化为相对次数，即⽤频数⽐率（f ／N ）或百分⽐（）来表⽰次数，就可以制成相对次数分布表

（三）累加次数分布表（四）双列次数分布表

双列次数分布表⼜称相关次数分布表，是对有联系的两列变量⽤同⼀个表表⽰其次数分布。

所谓有联系的两列变量，⼀般是指同⼀组被试中每个被试两种⼼理能⼒的分数或两种⼼理特点的指标，或同⼀组被试在两种实验条件下获得的结果。三、次数分布图

使⼀组数据特征更加直观和概括,⽽且还可以对数据的分布情况和变动趋势作粗略的分析。

简单次（频）数分布图——直⽅图、次数多边形图累加次数分布图——累加直⽅图、累加曲线（⼀）简单次数分布图－－直⽅图（⼆）简单次数分布图－次数多边图

次数分布多边形图（frequency polygon ）是⼀种表⽰连续性随机变量次数分布的线形图，属于次数分布图。凡是等距分组的可以⽤直⽅图表⽰的数据，都可⽤次数多边图来表⽰。

绘制⽅法：以各分组区间的组中值为横坐标，以各组的频数为纵坐标，描点；将各点以直线连接即构成多边图形。

（三）累加次数分布图—累加直⽅图（四）累加次数分布图——累加曲线四、其他统计图表

条形图：⽤直条的长短来表⽰统计项⽬数值⼤⼩的图形，主要是⽤来⽐较性质相似的间断型资料。

圆形图：是⽤于表⽰间断型资料⽐例的图形。圆形的⾯积表⽰⼀组数据的整体，圆中扇形的⾯积表⽰各组成部分所占的⽐例。各部分的⽐例⼀般⽤百分⽐表⽰。

线形图⽤来表⽰连续型资料。它能表⽰两个变量之间的函数关系；⼀种事物随另⼀种事物变化的情况；某种事物随时间推移的发展趋势等。基于线形图，既可对有关统计变量进⾏数量⽐较，⼜可分析发展的趋势。

散点图是⽤相同⼤⼩圆点的多少或梳密表⽰统计资料量⼤⼩以及变化趋势的图。

第三章集中量数

集中量数⽤来表现数据资料的典型⽔平或集中趋势（central tendency ）。常⽤的集中量包括算术平均数、加权平均数、中位数和众数等等。⼀、算术平均数

算术平均数（arithmetic average ）⼀般简称为平均数（average ）或均数、均值（mean ）。⼀般⽤Ｍ，或者⽤表⽰。算术平均数是最常⽤的集中量（⼀）算术平均数的计算公式

%100?N f X i

i n X n n X X X X ∑

=∑=+++=1211 X n X ∑=1

（⼆）算术平均数的意义

算术平均数是应⽤最普遍的⼀种集中量。它是“真值”（true score ）的最佳估计值。真值是反映某种现象的真实⽔平的分数。由于测量过程中的各种偶然因素的影响，真值往往很难得到。

在实际测量中，往往采⽤“多次测量，取平均数”的⽅法，⽤平均数去估计真值。（三）算术平均数的优缺点

优点：反应灵敏、有公式严密确定、简明易懂、适合代数运算

缺点：容易受两极端数值的影响；⼀组数据中有模糊不清的数值时⽆法计算。（四）计算和应⽤算术平均数的原则

同质性原则：算术平均数只能⽤于表⽰同类数据的集中趋势。

平均数与个体数值相结合的原则：在解释个体特征时，既要看平均数，也要结合个体的数据。

平均数与标准差、⽅差相结合原则：描述⼀组数据时既要分析其集中趋势，也要分析离散程度。⼆、中位数

原子核物理学

中位数（median ）⼜称为中数，是按顺序排列的⼀组数据中位于中间位置的数。中位数是常⽤集中量的⼀种。⼀般⽤Md 或Mdn 表⽰（⼀）中位数的计算⽅法 1、原始数据计算法

⼀组数据中⽆重复数值的情况⾸先将⼀组数据按顺序排列； 2、次数分布表计算法

公式中:Lb 为中位数所在组的精确下限

fb 为中位数所在组下限以下的累积频数 n 为数据总和

fMd 为中位数所在组的频数 i 为组距

（⼆）中位数的特点及应⽤

中位数是根据全部数据的个数来确定其位置的，意义简明，对按顺序排列的数据来讲，计算中位数也

⽐较容易。中位数不受两端极端数据的影响，但反应不灵敏，也不适合进⼀步代数运算的要求。⼀般⽤于下列情况：

1、⼀组数据中有极端数据时；

2、⼀组数据中有个别数据不确切、不清楚时；

3、资料属于等级性质时。三．众数

众数（mode ）⽤Mo 表⽰，有两种定义：

高纯度的氧化铜

理论众数是指与频数分布曲线最⾼点相对应的横坐标上的⼀点；粗略众数是⼀组数据中出现次数最多的那个数。

个数为第则为奇数若21,+n Md n 2,1

++=n

n X X Md n 则为偶数若Md b b f i f n L Md ??? ??-+=2

众数也是⼀种集中量，也可⽤来表⽰⼀组数据的集中趋势。众数的计算⽅法（观察法寻粗略众数）未分组数据中出现次数最多的数即为众数。

次数分布表中，频数最多那⼀组数据的组中值，即为众数。四、算术平均数、中位数、众数三者的关系

在正态分布中：在正偏态分布中：在负偏态分布中：五、其它集中量数（⼀）加权平均数

加权平均数是不同⽐重数据（或平均数）的平均数，⼀般⽤表⽰。其计算公式有两种：

（⼆）⼏何平均数

⼏何平均数（geometric mean ）是n 个数值连乘积的n 次⽅根，⽤或表⽰。计算公式为：

当数据的分布呈偏态时，可⽤⼏何平均数表⽰该组数据的集中趋势。⼏何平均数的变式两边取对数，得

注意：⼏何平均数计算的是平均的变化情况，如果要计算平均增长率，需要从⼏何平均数中减去基数1。

⼏何平均数的应⽤：

1.直接应⽤基本公式计算⼏何平均数

有少数极端数据，数据呈偏态分布;⼼理物理学中的等距与等⽐量表实验中.（例[3-8]P72）

2.应⽤⼏何平均数的变式计算

按⼀定⽐例变化的⼀列数据,⼀般⽤来求平均变化率如平均增长率. 例[3-9][3-10][3-11]P73 （三）调和平均数

调和平均数(harmonic mean),⽤符号MH 表⽰.也叫倒数平均数.公式为：调和平均数的应⽤

学习速度⽅⾯的问题.调和平均数在描述速度⽅⾯的集中趋势时，优于其他集中量在有关研究学习速度的实验设计中，反应指标⼀般常取两种形式;

1、⼯作量固定，记录各被试完成相同⼯作所⽤的时间.例[3-13][3-14]P76

2、学习时间⼀定，记录⼀定时间内各被试完成的⼯作量，例[3-15]

O M Md X ==O M Md X >>O

M Md X <

n X ∑?∑=g M g X n n g X X X M =2111

1123

12---==n n n n n g X X X X X X X X M ()1lg lg 1

1lg X X n M n g --=

∑=

i H X N M 1

第四章差异量数

描述数据离散程度的统计量称为差异量。差异量越⼤，表明数据越分散、不集中；

差异量越⼩，表明数据越集中，变动范围越⼩。

⼀组数据的离散程度，常常通过数据的离中趋势特点进⾏分析。⼀、全距、四分位距和百分位距（⼀）全距 R （range ）全距是⼀组数据中的最⼤值（maximum ）与该组数据中最⼩值（minimum ）之差，⼜称极差。

R ＝Xmax －Xmin

（⼆）百分位差（百分位距）

百分位差是指两个百分位数（percentile ）之差。常⽤的百分位距有两种：

⽤⼏个百分位距能较好地反映⼀组数据的差异程度。

对于任何⼀组观察值，只要任意指定⼀个位置，就可以求出这个位置的数应该是多少；----百分位数

相反，如果给出⼀个数，也可以求出它应该在哪个位置.---百分等级百分位数－－频数分布中相对于某个特定百分点的原始分数，它表明在分布中低于该分数的个案占总频数的百分⽐。

百分等级分数－－频数分布中低于特定原始分数的频数百分⽐。（三）四分位距

四分位距是第⼀个四分位数与第三个四分位数之差的⼀半，计算公式为（四）平均差

平均差（average deviation 或者 mean deviation ）是指⼀组数据中，每⼀个数据与该组数据的平均数离差的绝对值的算术平均数，通常⽤AD 或MD 表⽰。

原始数据计算公式

（五）⽅差和标准差

⽅差（⼜称为变异数、均⽅）。是表⽰⼀组数据离散程度的统计指标。⼀般样本的⽅差⽤表⽰，总体的⽅差⽤表⽰。

标准差（standard deviation ）是⽅差的算术平⽅根。⼀般样本的标准差⽤ S 表⽰，

总体的标准差⽤

表⽰。标准差和⽅差是描述数据离散程度的最常⽤的差异量。 1、样本⽅差及标准差定义公式

2、总体⽅差及标准差的定义公式

是总体σ的⽆偏估计

Q Q Q -=n X

X AD -∑=()

-∑=

()n X X S 2

-∑=()N X 22µσ-∑=()N X 2

µσ-∑=()

--∑=

n X X S 2S 2σσ

3、原始数据的⽅差与标准差计算

4、总标准差的合成

⽅差具有可加性的特点。当已知⼏个⼩组数据的⽅差或标准差时，可以计算⼏个⼩组联合在⼀起的总的⽅差或标准差。

需要注意的是，只有在应⽤同⼀种观测⼿段，测量的是同⼀种特质，只是样本不同的数据时，才能计算合成⽅差或标准差。

计算公式

公式中: 为总⽅差, 为总标准差 Si 为各⼩组标准差

ni 为各⼩组数据个数

5、⽅差和标准差的性质

⽅差是对⼀组数据中各种变异的总和的测量，具有可加性和可分解性特点。

八卦养生法标准差是⼀组数据⽅差的算术平⽅根，它不可以进⾏代数计算，但有以下特性：

如果

则如果

则 6、⽅差和标准差的意义

⽅差与标准差是表⽰⼀组数据离散程度的最好指标，是统计分析中最常⽤的差异量。标准差具备⼀个良好的差异量应具备的条件，如：反应灵敏，有公式严密确定，简明易懂，适合代数运算等等。

应⽤⽅差和标准差表⽰⼀组数据的离散程度，须注意必须是同⼀类数据（即同⼀种测量⼯具的测量结果），⽽且被⽐较样本的⽔平⽐较接近。 7、标准差的应⽤/——差异系数

差异系数（coefficient of variation ）是指标准差与其算术平均数的百分⽐，它是没有单位的相对数。常以CV 表⽰，其计算公式为：

差异系数的作⽤：⽐较不同单位资料的差异程度

⽐较单位相同⽽平均数相差较⼤的两组资料的差异程度可判断特殊差异情况

8、标准差的应⽤——标准分数

⼜称基分数或Z 分数，是以标准差为单位表⽰⼀个原始分数在团体中所处位置的相对位置量数。

离平均数有多远，即表⽰原始分数在平均数以上或以下⼏个标准差的位置，从⽽明确该分数在团体中的相对地位的量数。

标准分数从分数对平均数的相对地位、该组分数的离中趋势两个⽅⾯来表⽰原始分数的

222

∑-∑=n X n X S 2

本文发布于:2024-09-20 17:35:00，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/666706.html

上一篇：常用基本不等式

下一篇：统计学第三章知识题

标签：数据平均数次数分布称为标准差程度计算

留言与评论（共有 0 条评论）