stata 缺失值的处理

stata 缺失值的处理
机麻    一、缺失值的定义
    缺失值的定义是指在研究中未能收集到或测量到的某类观测值。缺失值不仅降低我们比较的可靠性,而且也会影响分析的准确度,所以在实际应用中,我们需要尽量减少缺失值的发生。
    二、STATA中缺失值的处理
    (1)STATA中的missing values有以下几种:
    1. .  指示缺失值的特殊符号
    2. blank  无输入的空格
    3. negative infinity  负无穷
    4. positive infinity  正无穷
    5. system missing  系统特殊缺失值
郑博闻    (2)STATA中缺失值的处理命令
    1. tabulate 命令
    tabulate用来检验观测值是否有缺失值。例如,tabulate var1 var2, missing可以用来检验var1和var2两个变量中是否有缺失值。
    2. summarize 命令
    summarize命令可以显示缺失值的数量。例如,summarize var1, detail可以显示var1变量中的缺失值数量。
    3. list 命令漏泄同轴电缆
    list用来列出数据集中缺失值的记录号,例如list in 1/30 if var1==.可以列出var1变量的1-30记录中的缺失值情况。
    4. replace 命令
    replace命令可以用来用一个值代替所有缺失值。例如,replace var1=0 if var1==.意思是将var1变量的缺失值替换成0。
    5. recode 命令
    recode可以用来改变缺失值的属性。例如,reconde var1(0=miss)就是将var1变量的0值重新定义为缺失值。
    三、缺失值的处理方法
厚板冲裁
    (1)删除法
    根据实际情况,采用删除法可以将包括缺失值的观测值从数据库中移除,这种处理方法简单、快捷,但是它会破坏原始样本的完整性,有潜在的偏差风险,因此一般来说只能作为次要的处理方式。
乌螺    (2)补充法
    补充法主要是使用某种对该变量有某种合理推论的方法修正缺失值,本质上是将缺失的
值变为有用的值,在一定程度上避免了失去观测值的损失。有两种主要的补充法:
    (a)取代法
    取代法就是将缺失值替换成某个相应变量的平均值、中值或者众数等特殊值,这种方法不能体现原始数据的分布特征,会影响分析结果的准确性。
后窗惊魂电影    (b)填补法
    填补法是指根据某种统计学原理,基于已有数据对缺失值进行推测填补,填补出来的值反映了缺失值之间相关性,而且可以体现数据的整体分布特征。

本文发布于:2024-09-21 20:22:01,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/148343.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:缺失   变量   观测   处理   用来   数据   方法   填补
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议