首页 > 学术百科

stata命令总结

stata11常用命令

注：JB统计量对应的p大于0.05，则表明非正态，这点跟sktest和swilk检验刚好相反；

dta为数据文件；

gph为图文件；

do为程序文件；

注意stata要区别大小写；

不得用作用户变量名：

_all _n _N _skip _b _coef _cons _pi _pred _rc _weight double

float long int in if using with

命令：

读入数据一种方式

input x y

1 4

2 5.5

3 6.2

4 7.7

5 8.5

end

su/summarise/sum x 或 su/summarise/sum x,d

对分组的描述：

sort group

by group:su x

%%%%%

tabstat economy,stats(max) %返回变量economy的最大值

%%stats括号里可以是：mean，count(非缺失观测值个数)，sum(总和)，max，min，range，

%% sd，var，cv(变易系数＝标准差/均值)，skewness，kurtosis，median，p1(1％分位

%% 数，类似地有p10, p25, p50, p75, p95, p99)，iqr(interquantile range = p75 – p25)

_all　%描述全部

_N 数据库中观察值的总个数。

_n 当前观察值的位置。

_pi 圆周率π的数值。

list

gen/generate %产生数列

egen wagemax=max(wage)

clear

use

by(分组变量)

set more 1/0

count %计数

gsort　+x (升序)

gsort　-x (降序)

sort x 升序；并且其它变量顺序会跟着改变

label var y "消费" %添加标签

describe %描述数据文件的整体，包括观测总数，变量总数，生成日期，每个变量的存储类型(storage type)，标签(label)

replace x5=2*y if x!=3 %替换变量值

replace age = 25 in 107 %令第107个观测中age为25

rename y2 u %改变变量名

drop in 2 %删除全部变量的第2行

drop if x==. 删去x为缺失值的所有记录

keep if x<2 %保留小于2的数据，其余变量跟随x改变

keep in 2/10 %保留第2-10个数

keep x1-x5 　%保留数据库中介于x1和x5间的所有变量 (包括x1和x5)，其余变量删除

ci x1 x2,by(group) %算出置信区间,不过先前对group要先排序，即sort group；

%by的意思逐个进行

cii 12 3.816667 0.2710343, level(90) %已知均值，方差，计算90%的置信区间

cii 10 2 %obs=10,mean=2,以二项分布形式，计算置信区间

centile x,centile(2.5 25 50 75 97.5) %取分位数

correlate/corr x y z %相关系数

pwcorr x y,sig %给出原假设r=0的命令

%如果变量非服从正态分布，则spearman x y

regress/reg mean year %回归方程建立 reg y x,noconstant %无常数项

predict meanhat %预测拟合值

predict e,residual %得到残差

estat hettest % 异方差检验

dwstat % Durbin-Watson自相关检验

vif % 方差膨胀因子

logit y x1 x2 x3 (y取0或1，是被解释变量，x1-x3是被解释变量) %logit回归

probit y x1 x2 x3 (y取0或1，是被解释变量，x1-x3是被解释变量) %probit回归

广州市积分制入户管理办法

tobit y x1 x2 x3 (y取值在0和1之间，是被解释变量，x1-x3是被解释变量) %tobit回归

sktest e %残差正态性检验 p>0.05则接受原假设，即服从正态分布；

%% sktest是基于变量的偏度和斜度(正态分布的偏度为0，斜度为3)

swilk x %基于Shapiro-Wilk检验

%%p值越小，越倾向于拒绝零假设，也就是变量越有可能不服从正态分布

xi %生成虚拟变量

tabulat gender,summ(math) %用gender指标对math进行分类，返回两类math的mean、std、freq

tabulate=tab %gen f=int((shengao-164)/3)*3+164 组距为3

tabulate 变量名 [, generate(新变量) missing nofreq nolabel plot ]

%%%%%

generate(新变量) // 按分组变量产生哑变量

nofreq // 不显示频数

nolabel // 不显示数值标记

plot // 显示各组频数图示

missing // 包含缺失值

cell // 显示各小组的构成比(小组之和为 1)

column // 按栏显示各组之构成(各栏总计为 1)

row // 按行显示各组之构成(各行总计为 1)

%%%%%

求和，求最小？

mod(x,y) %求余数

means %返回三种平均值

di normprob(1.96)

di invnorm(0.05)

di binomial(20,5,0.5)

di invbinomial(20,5,0.5)

di tprob(10,2)

di invt(10.0.05)

di fprob(3,27,1)

di invfprob(3,27,0.05)

di chi2(3,5)

di invchi2(3,0.05)

stack x y z,into(e) %把三列合成一列

xpose,clear %矩阵转置

append using d:\0917.dta %把已打开的文件（x y z）跟0917里的（x y z）合并，是竖向合并，即观察值合并；

merge using D:\0917.dta %把已打开的文件（x y z）跟0917里的（a b）合并，是横向合并，即变量合并；

format x %9.2e %科学记数

format x %9.2f %2位小数

%产生随机数

%1 产生20个在(0，1)区间上均匀分布的随机数uniform()

set seed 100

set obs 20

gen r=uniform()

list

clear 清除内存

set seed 200 设置种子数为 200

set obs 20 设置样本量为 20

range no 1 20 建立编号 1 至 20

gen r=uniform() 产生在(0,1)均匀分布的随机数

gen group=1 设置分组变量 group 的初始值为 1病毒抗体

sort r 对随机数从小到大排序

replace group=2 in 11/20 设置最大的 10 个随机数所对应的记录

为第2组，即：最小的10个随机数所

对应的记录为第1组

sort no 按照编号排序声波测井

list 显示随机分组的结果

也可以list if group==1和list no if group==1

%2 产生10个服从正态分布N（100，6^2）的随机数invnorm(uniform())*sigma+u

clear 清除内存

set seed 200 设置种子数为 200

set obs 10 设置样本量为 10

gen x=invnorm(uniform())*6+100 产生服从 N(100，6^2)的随机数

list牡荆子

画图

注意有些图前面要加

histogram 直方图

马恒昌

line 折线图

scatter 散点图

scatter y x,c(l) s(d) b2("(a)")

graph twoway connected y x 连点图

graph bar (sum) var2,over(var1) blabel(total) %条形图

. graph bar p52 p72,by(d)

. graph bar p52 p72,over(d)

. graph bar p52 p72,by(d) stack

. graph bar p52 p72,over(d) stack

////////////数据如下

%d p52 p72

%1 163.2 27.4

%2 72.5 83.6

%3 57.2 178.2

histogram x,bin(8) norm %画直方图，加正态分数线

graph pie a b o ab if area==1,plabel(_all percent) %画饼图内经讲义

graph pie var2, over(var1) plabel(_all percent) %饼图

本文发布于:2024-09-20 15:38:33，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/614688.html

上一篇：实验一

下一篇：RDD:断点回归命令rdrobust(附rdbwselect、rdplot)及Stata实现

标签：变量显示合并检验方差正态分布假设构成

留言与评论（共有 0 条评论）