stata命令总结

stata11常用命令
注:JB统计量对应的p大于0.05,则表明非正态,这点跟sktest和swilk检验刚好相反;
dta为数据文件;
gph为图文件;
do为程序文件;
注意stata要区别大小写;
不得用作用户变量名:
_all _n _N _skip _b _coef _cons _pi _pred _rc _weight double
float long int in if using with
命令:
读入数据一种方式
input  x  y
1          4 
2        5.5 
3        6.2 
4        7.7 
5        8.5 
end
su/summarise/sum x 或 su/summarise/sum x,d
对分组的描述:
sort group
by group:su x
%%%%%
tabstat economy,stats(max)  %返回变量economy的最大值
%%stats括号里可以是:mean,count(非缺失观测值个数),sum(总和),max,min,range,
%%      sd,var,cv(变易系数=标准差/均值),skewness,kurtosis,median,p1(1%分位
%%      数,类似地有p10, p25, p50, p75, p95, p99),iqr(interquantile range = p75 – p25)
_all %描述全部
_N 数据库中观察值的总个数。
_n 当前观察值的位置。
_pi 圆周率π的数值。
list
gen/generate %产生数列
egen wagemax=max(wage)
clear
use
by(分组变量)
set more 1/0
count %计数
gsort +x  (升序)
gsort -x  (降序)
sort x    升序;并且其它变量顺序会跟着改变
label var y "消费"  %添加标签
describe %描述数据文件的整体,包括观测总数,变量总数,生成日期,每个变量的存储类型(storage type),标签(label)
replace x5=2*y if x!=3 %替换变量值
replace age = 25 in 107  %令第107个观测中age为25
rename y2 u  %改变变量名
drop in 2  %删除全部变量的第2行
drop if x==. 删去x为缺失值的所有记录
keep if x<2  %保留小于2的数据,其余变量跟随x改变
keep in 2/10  %保留第2-10个数
keep x1-x5   %保留数据库中介于x1和x5间的所有变量 (包括x1和x5),其余变量删除
ci x1 x2,by(group)  %算出置信区间,不过先前对group要先排序,即sort group;
%by的意思逐个进行
cii 12 3.816667 0.2710343, level(90)  %已知均值,方差,计算90%的置信区间
cii 10 2  %obs=10,mean=2,以二项分布形式,计算置信区间
centile x,centile(2.5 25 50 75 97.5)  %取分位数
correlate/corr x y z  %相关系数
pwcorr x y,sig  %给出原假设r=0的命令
%如果变量非服从正态分布,则spearman x y
regress/reg mean year %回归方程建立 reg y x,noconstant %无常数项
predict meanhat    %预测拟合值
predict e,residual %得到残差
estat hettest  % 异方差检验
dwstat  % Durbin-Watson自相关检验
vif      % 方差膨胀因子
logit y x1 x2 x3 (y取0或1,是被解释变量,x1-x3是被解释变量) %logit回归
probit y x1 x2 x3 (y取0或1,是被解释变量,x1-x3是被解释变量) %probit回归
广州市积分制入户管理办法
tobit y x1 x2 x3 (y取值在0和1之间,是被解释变量,x1-x3是被解释变量) %tobit回归
sktest e %残差正态性检验 p>0.05则接受原假设,即服从正态分布;
%% sktest是基于变量的偏度和斜度(正态分布的偏度为0,斜度为3)
swilk x  %基于Shapiro-Wilk检验
%%p值越小,越倾向于拒绝零假设,也就是变量越有可能不服从正态分布
xi  %生成虚拟变量
tabulat gender,summ(math)  %用gender指标对math进行分类,返回两类math的mean、std、freq
tabulate=tab %gen f=int((shengao-164)/3)*3+164 组距为3
tabulate 变量名 [, generate(新变量) missing nofreq nolabel plot ]
%%%%%
generate(新变量) // 按分组变量产生哑变量
nofreq          // 不显示频数
nolabel          // 不显示数值标记
plot            // 显示各组频数图示
missing          // 包含缺失值
cell            // 显示各小组的构成比(小组之和为 1)
column          // 按栏显示各组之构成(各栏总计为 1)
row              // 按行显示各组之构成(各行总计为 1)
%%%%%
求和,求最小?
mod(x,y) %求余数
means %返回三种平均值
di normprob(1.96)
di invnorm(0.05)
di binomial(20,5,0.5)
di invbinomial(20,5,0.5)
di tprob(10,2)
di invt(10.0.05)
di fprob(3,27,1)
di invfprob(3,27,0.05)
di chi2(3,5)
di invchi2(3,0.05)
stack x y z,into(e)  %把三列合成一列
xpose,clear          %矩阵转置
append using d:\0917.dta  %把已打开的文件(x y z)跟0917里的(x y z)合并,是竖向合并,即观察值合并;
merge using D:\0917.dta  %把已打开的文件(x y z)跟0917里的(a b)合并,是横向合并,即变量合并;
format x %9.2e  %科学记数
format x %9.2f  %2位小数
%产生随机数
%1 产生20个在(0,1)区间上均匀分布的随机数uniform()
set seed 100
set obs 20
gen r=uniform()
list
%
clear                      清除内存
set seed 200              设置种子数为 200
set obs 20                设置样本量为 20
range no 1 20              建立编号 1 至 20
gen r=uniform()            产生在(0,1)均匀分布的随机数
gen group=1                设置分组变量 group 的初始值为 1病毒抗体
sort r                    对随机数从小到大排序
replace group=2 in 11/20  设置最大的 10 个随机数所对应的记录
                              为第2组,即:最小的10个随机数所
                              对应的记录为第1组
sort no                    按照编号排序声波测井
list                      显示随机分组的结果
也可以list if group==1和list no if group==1
%2 产生10个服从正态分布N(100,6^2)的随机数invnorm(uniform())*sigma+u
clear                          清除内存
set seed 200                  设置种子数为 200
set obs 10                    设置样本量为 10
gen x=invnorm(uniform())*6+100 产生服从 N(100,6^2)的随机数
list牡荆子
 
画图
注意有些图前面要加
histogram 直方图
马恒昌
line      折线图
scatter  散点图
scatter y x,c(l) s(d) b2("(a)")
graph twoway connected y x 连点图
graph bar (sum) var2,over(var1) blabel(total) %条形图
. graph bar p52 p72,by(d) 
. graph bar p52 p72,over(d)
. graph bar p52 p72,by(d) stack
. graph bar p52 p72,over(d) stack
////////////数据如下
%d p52 p72
%1 163.2 27.4
%2 72.5 83.6
%3 57.2 178.2
histogram x,bin(8) norm  %画直方图,加正态分数线
graph pie a b o ab if area==1,plabel(_all percent) %画饼图内经讲义
graph pie var2, over(var1) plabel(_all percent)    %饼图

本文发布于:2024-09-20 15:38:33,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/614688.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:变量   显示   合并   检验   方差   正态分布   假设   构成
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议