stata命令简表3.docx
《stata命令简表3.docx》由会员分享,可在线阅读,更多相关《stata命令简表3.docx(29页珍藏版)》请在冰豆网上搜索。
![stata命令简表3.docx](https://file1.bdocx.com/fileroot1/2023-2/22/1baaf7bc-3ef6-4946-a9ba-9f4b691570ed/1baaf7bc-3ef6-4946-a9ba-9f4b691570ed1.gif)
stata命令简表3
Stata命令简表
基本命令
符号
#delimit用来改变命令结束符8
A
anova方差与协方差分析9
append合并样本数据12
B
browse用数据编辑器查看数据4
C
cd改变stata的工作路径2
Chi2相关关系检验10
ci计算指定变量的置信区间9
clear清除当前stata使用的内存数据信息3
clonevar克隆现有变量3
codebook显示指定变量的编码、取值信息4
collapse按组生成新的指定统计信息表14
compress压缩数据8
contract按组生成新的频率分布信息表14
correlate显示相关矩阵或者协方差矩阵10
cross一一交叉14
D
describe描述内存或者文件中的数据4
destring/tostring字符变量和数字变量的转换15
dir显示当前目录下的文件信息3
display显示文字或者数据运算结果3
do执行命令文件5
drop删除变量或者对象7
duplicates重复数据处理14
E
egen是generate的扩展形式16
encode/decode变量类型转换6
expand数据伸缩,根据指令吧每个数据行复制n份来取代原来的数据行14
F
foreach逐项循环命令10
format改变数据输出格式6
forvalues让特定命令在指定数字系列里重复执行11
G
generate创建新变量3
gsort升序或者降序排列数据7
H
help帮助命令5
I
if表达式17
infile/outfile将格式自由的数据读入内存/数据文本格式数据4
infix将格式固定的数据读入内存5
input从命令窗口输入数据15
Insheet/outsheet用电子数据表从外部输入原始数据/输出数据表格格式数据4
J
joinby组内交叉合并13
K
keep选择保留变量或者对象8
L
labeldata数据标签5
labelvalue数值标签6
labelvariable变量标签6
list列出指定变量的取值4
local17
log记录开关15
lookfor寻找变量名或者标签8
M
mean估计期望值9
merge横向合并数据,样本不变,增加变量个数13
move把变量移动到指定位置7
mvencode缺失值的数值编码6
N
note变量注释6
notes数据注释6
O
order重新排列变量排列顺序7
P
program创建新命令12
pwcorr显示所有pairwise相关系数10
Q
query查看运行环境参数设定15
R
recode重新定义变量中的取值3
refix批量更名8
regress线性回归10
rename变量更名8
replace变量重新赋值3
reshape长宽格式转换14
S
save保存内存数据5
set设置系统参数或者数据变量3
sort升序排列数据7
summary显示数据统计信息摘要4
T
tabstat显示连续变量的摘要统计信息8
tabulate/table列表显示定类或定序变量的统计描述9
ttest期望值比较检验9
U
use数据读入stata5
X
xi类别变量/交叉项自动生成命令16
七划
找第几个观测值17
找第几个变量17
系统变量15
八划
制图命令16
取子字符串17
十一划
常用函数15
常用概率函数16
✓cd改变stata的工作路径
⏹cd命令用来改变stata的工作路径
⏹用法
◆指定全路径:
cde:
\data
◆指定相对路径(如果当前路径已经指向e:
\那么下面命令将达到和上面全路径命令同样效果):
cddata
◆cd..返回上一级目录
✓dir显示当前目录下的文件信息
⏹显示当前目录下的文件信息
⏹用法
◆dir
✓clear清除当前stata使用的内存数据信息
⏹清除当前stata使用的内存数据信息
⏹用法
◆直接清除:
clear
◆清除后执行相关命令:
,clear
✓display显示文字或者数据运算结果
⏹display命令用来显示文字或者数据运算结果
⏹用法
◆显示文字(文字外围需要加引号):
display“asongsb”
◆显示运算结果:
display25*10
✓set设置系统参数或者数据变量
⏹set命令用来设置系统参数或者数据变量
⏹用法
◆设置系统参数:
setmemory100m
◆设置数据变量:
setobs100
✓generate创建新变量
⏹创建新变量
⏹用法
◆generate[type]newvar[:
lblname]=exp[if][in]
◆eg:
generatex=13
✓clonevar克隆现有变量
⏹克隆现有变量(包括显示格式等所有特征)
⏹用法
◆clonevarnewvar=varname[if][in]
✓replace变量重新赋值
⏹变量重新赋值
⏹用法
◆replaceoldvar=exp[if][in][,nopromote]
◆replacex=0ifx==1
◆replacex=x+1
✓recode重新定义变量中的取值
⏹重新定义变量中的取值
⏹用法
◆基本语法:
recodevarlist(rule)[(rule)...][,generate(newvar)]
◆完全语法:
recodevarlist(erule)[(erule)...][if][in][,options]
◆recodex1(1=2)(2=1),gen(nx1)
◆recodex2(12=1)(3=2)(4/7=3),gen(nx2)
◆recodex*min/0=0*2
◆recodesex(1-0“female”)(2=1“male”),label(gender)
◆在recode中1/12代表1-12;min/12代表小于等于12;12/max代表大于等于12;missing代表缺失值;nonmissing代表非缺失值
✓browse用数据编辑器查看数据
⏹用数据编辑器查看数据
⏹用法
◆browse
✓list列出指定变量的取值
⏹列出指定变量的取值
⏹用法
◆list[varlist][if][in][,options]
✓describe描述内存或者文件中的数据
⏹描述内存或者文件中的数据(样本数、变量类型等信息)
⏹用法
◆描述内存数据:
describe[varlist][,memory_options]
◆描述文件数据:
describe[varlist]usingfilename[,file_options]
✓codebook显示指定变量的编码、取值信息
⏹显示指定变量的编码、取值信息
⏹用法
◆codebookvarlist
✓summary显示数据统计信息摘要
⏹显示数据统计信息摘要(样本数、均值、标准差、最大最小值)
⏹用法
◆不能处理字符变量
◆summarize[varlist][if][in][weight][,options]
◆bycontin:
sum(gdp)【按照contin分组,然后显示每组的gdp统计信息】
✓Insheet/outsheet用电子数据表从外部输入原始数据/输出数据表格格式数据
⏹用电子数据表从外部输入原始数据/输出数据表格格式数据
⏹用法
◆原始数据必须每行一个对象,并且用分隔符分开
◆insheet[varlist]usingfilename[,options]
◆insheetusinghdr2004a.raw,comma(读入由,号作为分隔符的文本数据)
◆insheetranknationcontinhdigdpusinghdr2004a.raw
◆outsheet[varlist]usingfilename[if][in][,opt]
✓infile/outfile将格式自由的数据读入内存/数据文本格式数据
⏹将格式自由的数据读入内存/数据文本格式数据
⏹用法
◆数据组织格式可以自由,一个对象可以分散在多行,对象之间可以用自定义分隔符分开
◆Infilevarlistusingfilename
◆Infileranknationcontinhdigdpusinghdr2004b.raw(读入空格分隔的文本数据,文本中要求没有变量名所以应该在读入时指定)
◆Outfile[varlist]usingfilename[,opt]
✓infix将格式固定的数据读入内存
⏹将格式固定的数据读入内存
⏹用法
◆用infix读入的原始数据,其变量对应文件列的位置范围必须固定
◆infix[var11-4var25-9var310-12]usingfilename[if][in]
◆infixrank1-2contin3-4hdi5-10usingfilename
✓use数据读入stata
⏹数据读入stata
⏹用法
◆use[varlist][if][in]usingfilename[,clearnolabel]
◆useranknationcontinusingd:
\data\hdr2004
◆usein1/50usingd:
\data\hdr2004
◆useifcontin==3usingd:
\data\hdr2004
✓save保存内存数据
⏹保存内存数据
⏹用法
◆save[filename][,save_options]
◆options可以是replace
✓help帮助命令
⏹帮助命令,用来查看命令的使用方法
⏹用法
◆helpcmd
✓do执行命令文件
⏹执行命令文件
⏹用法
◆dofilename
✓labeldata数据标签
⏹作用
◆帮助其他用户理解数据文件
⏹用法
◆长度限制为80字节,支持中文
◆查看标签:
use或者describe命令
◆添加标签:
labeldata“标签内容”
✓notes数据注释
⏹作用
◆帮助合作者理解数据更新的时间、内容、问题等
⏹用法:
◆查看注释:
notes
◆添加注释:
notes:
注释内容
✓note变量注释
⏹用法:
◆notehdi:
byUNDP:
>.8high;>.5asmedium;<.5low
◆notegdp:
percapitagdpinUS$in2002.
✓labelvariable变量标签
⏹给变量加上标签
⏹用法
◆添加标签:
labelvariable“标签”
◆查看标签:
describe和notes命令
✓encode/decode变量类型转换(字符变量变数字变量时使用,不能用于数字字符转数字格式)
⏹字符到数字:
encode变量名,generate(新变量名)
⏹数字到字符:
decode变量名,generate(新变量名)
⏹纯数字的字符变量到数字变量:
generate新变量名=real(新变量名)
✓mvencode缺失值的数值编码
⏹mvencodevarlist[if][in],mv(mvc)
⏹mvdecode_all,mv(-1=.a\-2=.b\-3=.c\-4=.d)
⏹mvdecode与mvencode功能相反
✓labelvalue数值标签
⏹作用
◆记录取值的内容和含义
⏹用法
◆首先定义标签内容:
labeldefine标签名1“内容”2“内容”(1,2可以是任意数字)
◆然后给变量添加标签:
labelvalue变量名标签名
◆查看数值标签名:
describe命令
◆查看数值标签定义:
labellist标签名
◆修改标签定义:
labeldefine标签名1“内容”2“内容”,modify
◆添加标签定义:
labeldefine标签名4“内容”6“内容”,add
✓format改变数据输出格式
⏹改变数据输出格式
⏹用法
◆formatvarlist%fmt
◆format%fmtvarlist
◆formatgdp%9.2e
◆formatgdp%9.2f
◆formatgdp%9.2g
◆formatgdp%9.2gc
◆formatgdp%-15s
◆e科学记数法;f固定格式;g普通格式;c要求给出逗号;-左对齐;15显示前15个字符。
◆普通格式g
◆%9.0g:
显示9个字节(实际为8),小数点后有效位数根据整个数值的长短自动调整
◆%9.4g:
9个字节,小数点后有效到4位
◆固定格式f
◆%9.2f:
9个字节,小数点后必须有两位
◆科学指数e
◆%9.2e:
9个字节,小数点后两位,显示特大或特小数字
◆字符格式s
◆%9s:
9个字节,向右靠齐
◆%-9s:
9个字节,向左靠齐
✓gsort升序或者降序排列数据
⏹升序或者降序排列数据
⏹用法
◆gsort[+|-]varname(+从小到大,-从大到小排列)
◆gsot+var1–var2
✓sort升序排列数据
⏹升序排列数据
⏹用法
◆sortvarname
◆sortcontingdp(先按contin排序,在同一个contin里面按gdp排序)
✓order重新排列变量排列顺序
⏹重新排列变量排列顺序
⏹用法
◆ordervar1var5var6-var8(var1最前面,var5次之,var6到8再次之,其他依次排在后面)
✓move把变量移动到指定位置
⏹把变量移动到指定位置
⏹用法
◆movevar1var2(把var1移动到var2的位置,var2及var2之后的变量集体后移)
✓drop删除变量或者对象
⏹删除变量或者对象
⏹用法
◆删除变量:
dropvarlist
◆删除对象:
dropifexp
◆删除一堆对象:
dropinrangeifexp
✓keep选择保留变量或者对象
⏹选择保留变量或者对象
⏹用法
◆保留变量:
keepvarlist
◆保留对象:
keepifexp
◆保留一堆对象:
keepinrangeifexp
✓compress压缩数据
⏹压缩数据(通过修改存储格式)
⏹用法
◆compress[varlist]
✓#delimit用来改变命令结束符
⏹用来改变命令结束符,以使命令可以写在好几行里
⏹用法
◆#delimit只能用在.do文件中,在命令行中输入enter键总会使命令执行。
◆以下是.do文件中标准用法
●#delimit;
●cmd1
●cmd2
●#delimitcr
◆用/**/可以达到同样的效果!
✓lookfor寻找变量名或者标签
⏹寻找变量名或者标签
⏹用法
◆lookforstring[string[...]]
◆eg:
lookforstu(寻找所有名为stu的变量或者标签)
✓rename变量更名
⏹变量更名
⏹用法
◆renameold_varnamenew_varname
✓refix批量更名
⏹批量更名
⏹用法
◆renpfixold_stub[new_stub]
◆eg:
renpfixoldnew(把所有old开头的变量的开头改为new)
✓tabstat显示连续变量的摘要统计信息
⏹显示连续变量的摘要统计信息
⏹用法
◆tabstatvarlist[if][in][weight][,options]
◆通过statistics()指明统计项:
tabstatxyz,stat(meannsd)
◆通过by(var)指明按某var归类统计:
tabstatpriceweight,by(foreign)
◆tabstatageheightweight,stats(meansdrangemaxskewness)
◆tabstatage,stats(meansdrangemaxskewness)by(edu)
◆stats指出要统计的统计量
✓tabulate/table列表显示定类或定序变量的统计描述
⏹列表显示定类或定序变量的统计描述(出现频度、所占比例)
⏹用法
◆单个变量:
tabulatevarname[if][in][weight][,tabulate1_options]
◆多个变量:
tab1varlist[if][in][weight][,tab1_options]
◆分组描述:
tabmonth,sum(price)(按月“month”查看价格“price”的统计信息描述)
◆tabulateeduage这是一个连列表
◆还可以用来生成类别变量:
tabulateedug,gen(edu)
✓mean估计期望值
⏹估计期望值
⏹用法
◆默认95%的置信水平查看期望值:
meanvarlist[if][in][weight][,options]
◆指定#的置信水平查看期望值:
meanvarlist,level(#)
✓ci计算指定变量的置信区间
⏹计算指定变量的置信区间
⏹用法
◆默认95%的置信水平查看置信区间:
ci[varlist][if][in][weight][,options]
◆指定#的置信水平查看置信区间:
civarlist,level(#)
◆CI=[mean-1.96*se,mean+1.96*se]
◆civar1var2,binomiallevel(99)
✓ttest期望值比较检验
⏹期望值比较检验
⏹用法
◆单样本比较检验:
ttestvarname==#[if][in][,level(#)]
◆双样本比较检验:
ttestvarname1==varname2[if][in][,level(#)]
◆两组期望值比较检验:
ttestvarname[if][in],by(groupvar)[options1]
◆分组比较检验:
ttest连续变量,by(分组变量)
✓anova方差与协方差分析
⏹方差与协方差分析
⏹用法
◆anovavarname[term[/][term[/]...]][if][in][weight][,options](term的格式是varname[{*||}varname[...]])
◆anovaYX(Y是应变量,X是分组自变量)
◆anowaincomemaleedu
◆如果在方差分析中加进了连续性变量,形成了类别变量与连续性变量的混合形式,方差分析就成了协方差分析,分析中连续性变量需要指明。
如anowaincomemaleeduweight,continuous(weight)
✓regress线性回归
⏹线性回归
⏹用法
◆regressdepvar[indepvars][if][in][weight][,options]
◆regressYx1x2,level(99)
✓correlate显示相关矩阵或者协方差矩阵
⏹显示相关矩阵或者协方差矩阵
⏹用法
◆correlate[varlist][if][in][weight][,correlate_options]
◆这是list-wise相关系数矩阵,所有参与分析变量中包含缺失值的观测样本会被排除
✓pwcorr显示所有pairwise相关系数
⏹显示所有pairwise相关系数
⏹用法
◆pwcorr[varlist][if][in][weight][,pwcorr_options]
◆这是pair-wise相关系数矩阵,”两个”变量中包含缺失值的观测样本会被排除
✓Chi2相关关系检验
⏹相关关系检验
⏹用法
◆chi2(n,chi2)其中n是自由度,chi2是总差距
◆chi2(n,chi2)=1-chi2tail(n,var)当检验显著时两个类型变量有相关关系
✓foreach逐项循环命令
⏹逐项循环命令
⏹用法
foreachAinBeijingShanghaiTianjinChongqing{
display“City:
`A’”
}
foreachIofnumlist0(4)12{
display`i’
}
◆语法:
foreachlname{in|oflisttype}list{
commandsreferringto`lname'
}
◆允许变量:
foreachlnameinany_list{
foreachlnameoflocallmacname{
foreachlnameofglobalgmacname{
foreachlnameofvarlistvarlist{
foreachlnameofnewlistnewvarlist{
foreachlnameofnumlistnumlist{
✓forvalues让特定命令在指定数字系列里重复执行
⏹forvaluesI=1/4{
genvar`i’=10*`i’+_n
labelvariablevar`i’“Variable`i’”
}
⏹让特定命令在指定数字系列里重复执行
⏹用法:
◆forvalueslname=range{
commandsreferringto`lname'
}
◆范围可以是:
#1(#d)#2meaning#1to#2instepsof#d
#1/#2meaning#1to#2instepsof1
#1#tto#2meaning#1to#2instepsof#t-#1
#1#t:
#2meaning#1to#2instepsof#t-#1
✓program创建新命令
⏹创建新命令
◆programtprob
argsbsedf
localp=ttail(`df’,`b’/`se’)*2
display“Two-Tailedt-Probability:
`p’”
end
◆programmyinterval**这个命令用来计算置信区间
syntaxvarlist[if][in][,ci(real95