stata命令简表3.docx

上传人:b****8 文档编号:10765701 上传时间:2023-02-22 格式:DOCX 页数:29 大小:25.99KB
下载 相关 举报
stata命令简表3.docx_第1页
第1页 / 共29页
stata命令简表3.docx_第2页
第2页 / 共29页
stata命令简表3.docx_第3页
第3页 / 共29页
stata命令简表3.docx_第4页
第4页 / 共29页
stata命令简表3.docx_第5页
第5页 / 共29页
点击查看更多>>
下载资源
资源描述

stata命令简表3.docx

《stata命令简表3.docx》由会员分享,可在线阅读,更多相关《stata命令简表3.docx(29页珍藏版)》请在冰豆网上搜索。

stata命令简表3.docx

stata命令简表3

Stata命令简表

基本命令

符号

#delimit用来改变命令结束符8

anova方差与协方差分析9

append合并样本数据12

browse用数据编辑器查看数据4

cd改变stata的工作路径2

Chi2相关关系检验10

ci计算指定变量的置信区间9

clear清除当前stata使用的内存数据信息3

clonevar克隆现有变量3

codebook显示指定变量的编码、取值信息4

collapse按组生成新的指定统计信息表14

compress压缩数据8

contract按组生成新的频率分布信息表14

correlate显示相关矩阵或者协方差矩阵10

cross一一交叉14

describe描述内存或者文件中的数据4

destring/tostring字符变量和数字变量的转换15

dir显示当前目录下的文件信息3

display显示文字或者数据运算结果3

do执行命令文件5

drop删除变量或者对象7

duplicates重复数据处理14

egen是generate的扩展形式16

encode/decode变量类型转换6

expand数据伸缩,根据指令吧每个数据行复制n份来取代原来的数据行14

foreach逐项循环命令10

format改变数据输出格式6

forvalues让特定命令在指定数字系列里重复执行11

generate创建新变量3

gsort升序或者降序排列数据7

help帮助命令5

if表达式17

infile/outfile将格式自由的数据读入内存/数据文本格式数据4

infix将格式固定的数据读入内存5

input从命令窗口输入数据15

Insheet/outsheet用电子数据表从外部输入原始数据/输出数据表格格式数据4

joinby组内交叉合并13

keep选择保留变量或者对象8

labeldata数据标签5

labelvalue数值标签6

labelvariable变量标签6

list列出指定变量的取值4

local17

log记录开关15

lookfor寻找变量名或者标签8

mean估计期望值9

merge横向合并数据,样本不变,增加变量个数13

move把变量移动到指定位置7

mvencode缺失值的数值编码6

note变量注释6

notes数据注释6

order重新排列变量排列顺序7

program创建新命令12

pwcorr显示所有pairwise相关系数10

query查看运行环境参数设定15

recode重新定义变量中的取值3

refix批量更名8

regress线性回归10

rename变量更名8

replace变量重新赋值3

reshape长宽格式转换14

save保存内存数据5

set设置系统参数或者数据变量3

sort升序排列数据7

summary显示数据统计信息摘要4

tabstat显示连续变量的摘要统计信息8

tabulate/table列表显示定类或定序变量的统计描述9

ttest期望值比较检验9

use数据读入stata5

xi类别变量/交叉项自动生成命令16

七划

找第几个观测值17

找第几个变量17

系统变量15

八划

制图命令16

取子字符串17

十一划

常用函数15

常用概率函数16

✓cd改变stata的工作路径

⏹cd命令用来改变stata的工作路径

⏹用法

◆指定全路径:

cde:

\data

◆指定相对路径(如果当前路径已经指向e:

\那么下面命令将达到和上面全路径命令同样效果):

cddata

◆cd..返回上一级目录

✓dir显示当前目录下的文件信息

⏹显示当前目录下的文件信息

⏹用法

◆dir

✓clear清除当前stata使用的内存数据信息

⏹清除当前stata使用的内存数据信息

⏹用法

◆直接清除:

clear

◆清除后执行相关命令:

,clear

✓display显示文字或者数据运算结果

⏹display命令用来显示文字或者数据运算结果

⏹用法

◆显示文字(文字外围需要加引号):

display“asongsb”

◆显示运算结果:

display25*10

✓set设置系统参数或者数据变量

⏹set命令用来设置系统参数或者数据变量

⏹用法

◆设置系统参数:

setmemory100m

◆设置数据变量:

setobs100

✓generate创建新变量

⏹创建新变量

⏹用法

◆generate[type]newvar[:

lblname]=exp[if][in]

◆eg:

generatex=13

✓clonevar克隆现有变量

⏹克隆现有变量(包括显示格式等所有特征)

⏹用法

◆clonevarnewvar=varname[if][in]

✓replace变量重新赋值

⏹变量重新赋值

⏹用法

◆replaceoldvar=exp[if][in][,nopromote]

◆replacex=0ifx==1

◆replacex=x+1

✓recode重新定义变量中的取值

⏹重新定义变量中的取值

⏹用法

◆基本语法:

recodevarlist(rule)[(rule)...][,generate(newvar)]

◆完全语法:

recodevarlist(erule)[(erule)...][if][in][,options]

◆recodex1(1=2)(2=1),gen(nx1)

◆recodex2(12=1)(3=2)(4/7=3),gen(nx2)

◆recodex*min/0=0*2

◆recodesex(1-0“female”)(2=1“male”),label(gender)

◆在recode中1/12代表1-12;min/12代表小于等于12;12/max代表大于等于12;missing代表缺失值;nonmissing代表非缺失值

✓browse用数据编辑器查看数据

⏹用数据编辑器查看数据

⏹用法

◆browse

✓list列出指定变量的取值

⏹列出指定变量的取值

⏹用法

◆list[varlist][if][in][,options]

✓describe描述内存或者文件中的数据

⏹描述内存或者文件中的数据(样本数、变量类型等信息)

⏹用法

◆描述内存数据:

describe[varlist][,memory_options]

◆描述文件数据:

describe[varlist]usingfilename[,file_options]

✓codebook显示指定变量的编码、取值信息

⏹显示指定变量的编码、取值信息

⏹用法

◆codebookvarlist

✓summary显示数据统计信息摘要

⏹显示数据统计信息摘要(样本数、均值、标准差、最大最小值)

⏹用法

◆不能处理字符变量

◆summarize[varlist][if][in][weight][,options]

◆bycontin:

sum(gdp)【按照contin分组,然后显示每组的gdp统计信息】

✓Insheet/outsheet用电子数据表从外部输入原始数据/输出数据表格格式数据

⏹用电子数据表从外部输入原始数据/输出数据表格格式数据

⏹用法

◆原始数据必须每行一个对象,并且用分隔符分开

◆insheet[varlist]usingfilename[,options]

◆insheetusinghdr2004a.raw,comma(读入由,号作为分隔符的文本数据)

◆insheetranknationcontinhdigdpusinghdr2004a.raw

◆outsheet[varlist]usingfilename[if][in][,opt]

✓infile/outfile将格式自由的数据读入内存/数据文本格式数据

⏹将格式自由的数据读入内存/数据文本格式数据

⏹用法

◆数据组织格式可以自由,一个对象可以分散在多行,对象之间可以用自定义分隔符分开

◆Infilevarlistusingfilename

◆Infileranknationcontinhdigdpusinghdr2004b.raw(读入空格分隔的文本数据,文本中要求没有变量名所以应该在读入时指定)

◆Outfile[varlist]usingfilename[,opt]

✓infix将格式固定的数据读入内存

⏹将格式固定的数据读入内存

⏹用法

◆用infix读入的原始数据,其变量对应文件列的位置范围必须固定

◆infix[var11-4var25-9var310-12]usingfilename[if][in]

◆infixrank1-2contin3-4hdi5-10usingfilename

✓use数据读入stata

⏹数据读入stata

⏹用法

◆use[varlist][if][in]usingfilename[,clearnolabel]

◆useranknationcontinusingd:

\data\hdr2004

◆usein1/50usingd:

\data\hdr2004

◆useifcontin==3usingd:

\data\hdr2004

✓save保存内存数据

⏹保存内存数据

⏹用法

◆save[filename][,save_options]

◆options可以是replace

✓help帮助命令

⏹帮助命令,用来查看命令的使用方法

⏹用法

◆helpcmd

✓do执行命令文件

⏹执行命令文件

⏹用法

◆dofilename

✓labeldata数据标签

⏹作用

◆帮助其他用户理解数据文件

⏹用法

◆长度限制为80字节,支持中文

◆查看标签:

use或者describe命令

◆添加标签:

labeldata“标签内容”

✓notes数据注释

⏹作用

◆帮助合作者理解数据更新的时间、内容、问题等

⏹用法:

◆查看注释:

notes

◆添加注释:

notes:

注释内容

✓note变量注释

⏹用法:

◆notehdi:

byUNDP:

>.8high;>.5asmedium;<.5low

◆notegdp:

percapitagdpinUS$in2002.

✓labelvariable变量标签

⏹给变量加上标签

⏹用法

◆添加标签:

labelvariable“标签”

◆查看标签:

describe和notes命令

✓encode/decode变量类型转换(字符变量变数字变量时使用,不能用于数字字符转数字格式)

⏹字符到数字:

encode变量名,generate(新变量名)

⏹数字到字符:

decode变量名,generate(新变量名)

⏹纯数字的字符变量到数字变量:

generate新变量名=real(新变量名)

✓mvencode缺失值的数值编码

⏹mvencodevarlist[if][in],mv(mvc)

⏹mvdecode_all,mv(-1=.a\-2=.b\-3=.c\-4=.d)

⏹mvdecode与mvencode功能相反

✓labelvalue数值标签

⏹作用

◆记录取值的内容和含义

⏹用法

◆首先定义标签内容:

labeldefine标签名1“内容”2“内容”(1,2可以是任意数字)

◆然后给变量添加标签:

labelvalue变量名标签名

◆查看数值标签名:

describe命令

◆查看数值标签定义:

labellist标签名

◆修改标签定义:

labeldefine标签名1“内容”2“内容”,modify

◆添加标签定义:

labeldefine标签名4“内容”6“内容”,add

✓format改变数据输出格式

⏹改变数据输出格式

⏹用法

◆formatvarlist%fmt

◆format%fmtvarlist

◆formatgdp%9.2e

◆formatgdp%9.2f

◆formatgdp%9.2g

◆formatgdp%9.2gc

◆formatgdp%-15s

◆e科学记数法;f固定格式;g普通格式;c要求给出逗号;-左对齐;15显示前15个字符。

◆普通格式g

◆%9.0g:

显示9个字节(实际为8),小数点后有效位数根据整个数值的长短自动调整

◆%9.4g:

9个字节,小数点后有效到4位

◆固定格式f

◆%9.2f:

9个字节,小数点后必须有两位

◆科学指数e

◆%9.2e:

9个字节,小数点后两位,显示特大或特小数字

◆字符格式s

◆%9s:

9个字节,向右靠齐

◆%-9s:

9个字节,向左靠齐

✓gsort升序或者降序排列数据

⏹升序或者降序排列数据

⏹用法

◆gsort[+|-]varname(+从小到大,-从大到小排列)

◆gsot+var1–var2

✓sort升序排列数据

⏹升序排列数据

⏹用法

◆sortvarname

◆sortcontingdp(先按contin排序,在同一个contin里面按gdp排序)

✓order重新排列变量排列顺序

⏹重新排列变量排列顺序

⏹用法

◆ordervar1var5var6-var8(var1最前面,var5次之,var6到8再次之,其他依次排在后面)

✓move把变量移动到指定位置

⏹把变量移动到指定位置

⏹用法

◆movevar1var2(把var1移动到var2的位置,var2及var2之后的变量集体后移)

✓drop删除变量或者对象

⏹删除变量或者对象

⏹用法

◆删除变量:

dropvarlist

◆删除对象:

dropifexp

◆删除一堆对象:

dropinrangeifexp

✓keep选择保留变量或者对象

⏹选择保留变量或者对象

⏹用法

◆保留变量:

keepvarlist

◆保留对象:

keepifexp

◆保留一堆对象:

keepinrangeifexp

✓compress压缩数据

⏹压缩数据(通过修改存储格式)

⏹用法

◆compress[varlist]

✓#delimit用来改变命令结束符

⏹用来改变命令结束符,以使命令可以写在好几行里

⏹用法

◆#delimit只能用在.do文件中,在命令行中输入enter键总会使命令执行。

◆以下是.do文件中标准用法

●#delimit;

●cmd1

●cmd2

●#delimitcr

◆用/**/可以达到同样的效果!

✓lookfor寻找变量名或者标签

⏹寻找变量名或者标签

⏹用法

◆lookforstring[string[...]]

◆eg:

lookforstu(寻找所有名为stu的变量或者标签)

✓rename变量更名

⏹变量更名

⏹用法

◆renameold_varnamenew_varname

✓refix批量更名

⏹批量更名

⏹用法

◆renpfixold_stub[new_stub]

◆eg:

renpfixoldnew(把所有old开头的变量的开头改为new)

✓tabstat显示连续变量的摘要统计信息

⏹显示连续变量的摘要统计信息

⏹用法

◆tabstatvarlist[if][in][weight][,options]

◆通过statistics()指明统计项:

tabstatxyz,stat(meannsd)

◆通过by(var)指明按某var归类统计:

tabstatpriceweight,by(foreign)

◆tabstatageheightweight,stats(meansdrangemaxskewness)

◆tabstatage,stats(meansdrangemaxskewness)by(edu)

◆stats指出要统计的统计量

✓tabulate/table列表显示定类或定序变量的统计描述

⏹列表显示定类或定序变量的统计描述(出现频度、所占比例)

⏹用法

◆单个变量:

tabulatevarname[if][in][weight][,tabulate1_options]

◆多个变量:

tab1varlist[if][in][weight][,tab1_options]

◆分组描述:

tabmonth,sum(price)(按月“month”查看价格“price”的统计信息描述)

◆tabulateeduage这是一个连列表

◆还可以用来生成类别变量:

tabulateedug,gen(edu)

✓mean估计期望值

⏹估计期望值

⏹用法

◆默认95%的置信水平查看期望值:

meanvarlist[if][in][weight][,options]

◆指定#的置信水平查看期望值:

meanvarlist,level(#)

✓ci计算指定变量的置信区间

⏹计算指定变量的置信区间

⏹用法

◆默认95%的置信水平查看置信区间:

ci[varlist][if][in][weight][,options]

◆指定#的置信水平查看置信区间:

civarlist,level(#)

◆CI=[mean-1.96*se,mean+1.96*se]

◆civar1var2,binomiallevel(99)

✓ttest期望值比较检验

⏹期望值比较检验

⏹用法

◆单样本比较检验:

ttestvarname==#[if][in][,level(#)]

◆双样本比较检验:

ttestvarname1==varname2[if][in][,level(#)]

◆两组期望值比较检验:

ttestvarname[if][in],by(groupvar)[options1]

◆分组比较检验:

ttest连续变量,by(分组变量)

✓anova方差与协方差分析

⏹方差与协方差分析

⏹用法

◆anovavarname[term[/][term[/]...]][if][in][weight][,options](term的格式是varname[{*||}varname[...]])

◆anovaYX(Y是应变量,X是分组自变量)

◆anowaincomemaleedu

◆如果在方差分析中加进了连续性变量,形成了类别变量与连续性变量的混合形式,方差分析就成了协方差分析,分析中连续性变量需要指明。

如anowaincomemaleeduweight,continuous(weight)

✓regress线性回归

⏹线性回归

⏹用法

◆regressdepvar[indepvars][if][in][weight][,options]

◆regressYx1x2,level(99)

✓correlate显示相关矩阵或者协方差矩阵

⏹显示相关矩阵或者协方差矩阵

⏹用法

◆correlate[varlist][if][in][weight][,correlate_options]

◆这是list-wise相关系数矩阵,所有参与分析变量中包含缺失值的观测样本会被排除

✓pwcorr显示所有pairwise相关系数

⏹显示所有pairwise相关系数

⏹用法

◆pwcorr[varlist][if][in][weight][,pwcorr_options]

◆这是pair-wise相关系数矩阵,”两个”变量中包含缺失值的观测样本会被排除

✓Chi2相关关系检验

⏹相关关系检验

⏹用法

◆chi2(n,chi2)其中n是自由度,chi2是总差距

◆chi2(n,chi2)=1-chi2tail(n,var)当检验显著时两个类型变量有相关关系

✓foreach逐项循环命令

⏹逐项循环命令

⏹用法

foreachAinBeijingShanghaiTianjinChongqing{

display“City:

`A’”

}

foreachIofnumlist0(4)12{

display`i’

}

◆语法:

foreachlname{in|oflisttype}list{

commandsreferringto`lname'

}

◆允许变量:

foreachlnameinany_list{

foreachlnameoflocallmacname{

foreachlnameofglobalgmacname{

foreachlnameofvarlistvarlist{

foreachlnameofnewlistnewvarlist{

foreachlnameofnumlistnumlist{

✓forvalues让特定命令在指定数字系列里重复执行

⏹forvaluesI=1/4{

genvar`i’=10*`i’+_n

labelvariablevar`i’“Variable`i’”

}

⏹让特定命令在指定数字系列里重复执行

⏹用法:

◆forvalueslname=range{

commandsreferringto`lname'

}

◆范围可以是:

#1(#d)#2meaning#1to#2instepsof#d

#1/#2meaning#1to#2instepsof1

#1#tto#2meaning#1to#2instepsof#t-#1

#1#t:

#2meaning#1to#2instepsof#t-#1

✓program创建新命令

⏹创建新命令

◆programtprob

argsbsedf

localp=ttail(`df’,`b’/`se’)*2

display“Two-Tailedt-Probability:

`p’”

end

◆programmyinterval**这个命令用来计算置信区间

syntaxvarlist[if][in][,ci(real95

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 经济学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1