统计学简答题及答案

统计学简答题及参考答案
1.简述描述统计学的概念、研究内容与目的。
概念:它是研究数据收集、整理和描述的统计学分支。
研究内容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。
研究目的:描述数据的特征;出数据的基本数量规律。
2.简述推断统计学的概念、研究内容与目的。
概念:它是研究如何利用样本数据来推断总体特征的统计学分支。
研究内容:参数估计和假设检验的理论与方法。
研究目的:对总体特征作出统计推断。
3.什么是总体和样本?
总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。
可分为有限总体和无限总体:
有限总体的范围能够明确确定,且元素的数目是有限的,可数的。
无限总体所包括的元素数目是无限的,不可数的。
    总体单位数可用N表示。
样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量记为n 。
4.什么是普查?它有哪些特点?
普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点:
1)危险化学品安全管理条例2011通常是一次性或周期性的
2)一般需要规定统一的标准调查时间
3)数据的规范化程度较高
4)应用范围比较狭窄。
5.什么是抽样调查?它有哪些特点?
抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。
它具有经济性好、时效性强、适应面广、准确性高等特点
6.简述统计调查方案的概念及应包括的基本内容。
答:统计调查方案就是统计调查前所制订的实施计划,是指导整个调查过程的纲领性文件是保证调查工作有计划、有组织、有系统进行的计划书
它应包括的基本内容有:
〈1〉明确调查目的;
〈2〉确定调查对象和调查单位;
〈3〉设计调查项目;
〈4〉设计调查表格和问卷;
〈5〉确定调查时间;
〈6〉组织实施调查计划;
〈7〉调查报告的撰写,等等。
7.简述统计分组的概念、原则和具体方法。
答:(1)概念
根据统计研究的目的和客观现象的内在特点,按照某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。
统计分组标志有两种:品质标志或数量标志。
(2)原则
①穷尽原则;②互斥原则。
  即“不重复、不遗漏”的原则。
(3)具体分组方法
  ①按品质标志分组
    ②按数量标志分组
(A)单项式分组与组距式分组;
(B)间断组距式分组和连续组距式分组;
应遵循“上限不在组内”原则:凡是总体中某一个单位的变量值为相邻两组的界限值,则这一个单位就归入作为下限值的那一组内。
(C)等距分组与异距分组。
8.简述组距分组的基本步骤。
(1)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的
(2)确定组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即:
        组距=(最大值 - 最小值)÷ 组数
(3)统计出各组的频数,并整理成频数分布表
9.简述算术平均数的概念及其数学性质。
答:算术平均数是指一组数据的总和,除以这组数据的项数所得的结果。它是最常用的数值平均数,分为简单算术平均数和加权算术平均数两种。
mol comfort其数学性质是:
1)算术平均数与变量值个数的乘积,等于各个变量值的总和。
  (2)各变量值与其算术平均数的离差之总和,等于零。
(3)各变量值与其算术平均数的离差平方之总和,为最小值。
10.简述均值的概念和特征。
  均值就是算术平均数,它的基本公式为:
武城二中
      算术平均数=总体标志总量/总体单位数=∑Xi/n
    其特征如下:
1)集中趋势的最常用测度值
2)一组数据的均衡点所在
3)体现了数据的必然性特征
4)易受极端值的影响
5)用于数值型数据,不能用于分类数据和顺序数据
6)可根据原始数据或者分组数据来计算,计算公式略有差异。
11.简述众数、中位数、均值的特点与应用场合。
1)众数
不受极端值影响
具有不唯一性
数据分布偏斜程度较大时应用
2)中位数
不受极端值影响
数据分布偏斜程度较大时应用
3)均值
易受极端值影响
数学性质优良
数据对称分布或接近对称分布时应用。
12.简述算术平均数、众数、中位数的概念及数量关系。
答:(1)概念
  算术平均数是指一组数据的总和除以这组数据的项数所得的结果,也称为均值, 可用表示。它是最常用的数值平均数,分为简单的和加权的算术平均数两种。
众数是指一组数据中出现频数最多、频率最高的变量值,可用 MO 表示。它是最常见、最普遍的状况,是对现象集中趋势的度量。 
中位数是指将数据由小到大排列后,位置居中的数值,可用 Me 表示。
(2)三者的数量关系是:
    在对称分布中,三者相等。即:=Me=Mo
在左偏分布中,一般有<Me<Mo
    在右偏分布中,一般有Mo<Me<
    在轻微偏态时,三者的近似数量关系为:
13.测定离散程度的变异指标有哪些?简述其主要作用。
答:常用的变异指标有:异众比率、极差、四分位差、平均差、方差和标准差、离散系数等。
  它们的主要作用为:
1.说明数据的分散程度,反映变量的稳定性、均衡性;
数据之间差异越大,表明变量的稳定性或均衡性越差。
2.衡量平均数的代表性高低;
离散程度越大,表明平均数的代表性就越低。
3.作为统计推断的重要依据。
①判别统计推断的前提条件是否成立;
②衡量推断效果好坏的重要尺度。
14.简述方差和标准差的概念及其特征。
方差是指各变量值与均值的离差平方的算术平均数,标准差则是方差的正平方根。
两者都是标志变异指标,具有以下的特征:
离散(变异)程度的测度值之一
最常用的测度值
反映了数据的分布特征
反映了各变量值与均值的平均差异
用于数值型数据,不能用于分类数据和顺序数据
可根据总体数据或者样本数据来计算,计算公式略有差异。
15.什么是离散系数?
是变异指标与其相应的均值之比
通常是用标准差与均值来对比
是对数据相对离散程度的测度
消除了数据水平高低和计量单位不同的影响
用于对不同组别数据离散程度的比较
计算公式为:
16.简述概率抽样方式的概念和特点。
是指根据一个已知的概率来抽取样本单位,也称为随机抽样。
它包括四种基本抽样方式:简单随机抽样、分层抽样、系统抽样和整抽样等。
其特点是:
按一定的概率以随机原则抽取样本;
抽取样本时,使每个单位都有一定的机会被抽中。
每个单位被抽中的概率是已知的,或是可以计算出来的;
当用样本对总体参数进行估计时,要考虑到每个样本单位被抽中的概率。
17.什么是抽样分布?
(1)是指样本统计量的概率分布,是一种理论分布
在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布
(2)随机变量是样本统计量
例如样本均值,样本比例,样本方差等
(3)结果来自容量相同的所有可能样本
(4)提供了样本统计量长远而稳定的信息,是进行抽样推断的理论基础,也是抽样推断科学性的重要依据
18.什么是中心极限定理?
龙婕物联流量卡设从均值为μ,方差为σ2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布,即N(μ,σ2/n)
19.什么是总体参数?
1)它是描述总体数量特征的概括性数字度量
2)是研究者想要了解的总体的某种数字特征值
3)人们所关心的参数主要有总体均值()、总体标准差()、总体比率(ρ)
4)它是抽样统计推断的对象
5)总体参数通常用希腊字母表示。
20.什么是样本统计量?
1)它是用来描述样本数量特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数。
2)人们所关心的样本统计量有样本均值(x血尿素)、样本标准差(s)、样本比例(p)等。
3)样本统计量通常用小写英文字母表示。
21.怎样正确理解抽样误差?
(1)抽样误差是由于抽样的随机性所带来的误差
(2)所有可能样本的统计结果与总体真实值之间的平均性差异
(3)通常是可以计算和控制的。
影响抽样误差大小的因素主要有:
样本容量的大小
总体的变异程度
抽样方式
抽样方法。
22.简述抽样推断的点估计方法。
点估计就是用样本统计量直接作为总体参数的估计值的抽样推断方法。
例如:用样本均值直接作为总体均值的估计值
又如:用两个样本均值之差直接作为总体均值之差的估计值
它没有给出估计值接近总体参数程度的信息。
点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等。
23.简述抽样推断的区间估计方法。
区间估计就是在点估计的基础上,给出总体参数估计的一个区间范围,该区间是由样本统计量加减抽样误差而得到的。
根据样本统计量的抽样分布,能够对样本统计量与总体参数的接近程度给出一个概率度量。比如,某班级的平均分数估计在7585之间,置信水平为95%
24.影响置信区间宽度的因素有哪些?
1)总体数据的离散程度,用σ2来测度
2)样本容量(n)的大小
3)置信水平 (1 -α),它影响 z 的大小
4)抽样方式
5)抽样方法
25.必要的样本容量(n)与哪些影响因素有关?
1)总体标准差(σ)或者方差( 2
2)允许误差(E)
3)可靠性系数(z或者t)
4)抽样方式
5)抽样方法
26.什么是假设检验?
假设检验是指先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计推断过程。
有参数检验和非参数检验两类方法。
它在逻辑上运用反证法,统计上依据小概率原理。
27.简述假设检验的概念及基本步骤。
答:所谓假设检验,就是事先对总体的参数或总体分布形式做出一个假设,然后利用抽取的样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否存在显著的系统性差异。所以,假设检验又被称为显著性检验。
一个完整的假设检验过程,包括以下基本步骤:
1)针对具体问题,提出假设:原假设H0、备择假设H1
2)构造适当的检验统计量Z(或者t),并根据样本数据,计算统计量的具体数值;
3)规定显著性水平α,建立检验规则;
4)做出判断。
①临界值规则:如果Z(或者t)值落在拒绝域中,就拒绝H0。否则,就接受H0
P-值规则:如果P<α,就拒绝H0;否则P>α,就接受H0
28.解释假设检验中的两类错误伯牙绝弦教学实录
类错误(弃真错误)
指原假设为真时,拒绝原假设。其发生的概率记为α,α称为显著性水平。
类错误(取伪错误)

本文发布于:2024-09-23 04:37:46,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/118311.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   总体   样本   统计   推断   抽样
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议