Stata命令Word下载.docx

资源描述

Stata命令Word下载.docx

《Stata命令Word下载.docx》由会员分享，可在线阅读，更多相关《Stata命令Word下载.docx（11页珍藏版）》请在冰豆网上搜索。

Stata命令Word下载.docx

2.tabx1,gen（x1）

产生x1的虚拟变量。

gen

fsize1=fize==1

产生虚拟变量，如果

gendate（或任一新变量名）=date（‘原变量名’，‘YMD’/'

DMY'

/..）

formdate

%td

12.删掉重复记录duplicatesdrop

13.独立样本均值差异检验

ttest

Stata语句2

*IntroductiontoStata

logusingstata_fall.txt,textreplace

*使用日志（log）。

它可以帮助我们记录stata的运行结果

clearall

setmoreoff

*关闭more选项。

如果打开该选项，那么结果分屏输出，即一次只输出一屏结果。

你按空格键后再输出下一屏，直到全部输完。

如果关闭则中间不停，一次全部输出

*cdD:

/undergraECMT/data

*进入数据所在的盘符和文件夹

logusing（文件名）.log,replace

*打开日志文件，并更新。

日志文件将记录下所有文件运行后给出的结果，如果你修改了文件内容，replace选项可以将其更新为最近运行的结果

usehttp:

//www.ats.ucla.edu/stat/data/hs0,clear

*打开数据文件

*insheetusingintro_hs0.csv,clear

*useintro_hs0,clear

*Summarizingthedata

describe

*可以告诉我们每一个变量的含义

*具体了解每一个变量的特征，我们可以用tabstat命令。

例如我们可以计算wage的均值，方差，中位数，范围，具体可以用helptabstata查询。

tabstatwage,stats（mean）

tabstatwage,stats（sdmedianrange）

*算wage的均值，方差，中位数，范围

tabstatwage,by（educ）stats（mean）

*不同教育水平的工资的均值

summarize

*总计全体，Summarize（Sum）将汇报数据的均值和方差等信息。

summarizewage

*有关工资的均值与方差

*如果需要更详尽的信息，可以进一步使用后缀detail

histogramwage

*画柱状图

scatterwageeduc

*画出两个变量之间的分布关系

graphtwowayscatterwageeduc

*直观的看到教育水平变化时工资的变化，可以用“scatter”命令或者“graphtwowayscatter”命令

graphtwowaylinewageeduc

*“graphtwoway”命令可以带别的后缀，例如“graphtwowayline”则画的是线状图。

graphmatrixwageeduc

*了解更多的变量之间的关系

graphmatrixwageeducexper

graphbar（mean）wage,over（educ）

*了解y的平均值关于x分布的柱状图。

listgender-readin1/15

*取1到15列数据列表

summarizereadmathsciencewrite

*readmathsciencewrite的均值方差啊等信息

summarizeifread>

=60

*所有read大于60的均值方差

summarizeifprgtype=="

academic"

*所有prgty1pe=="

的均值，方差

summarizeread,detail

*有关read的均值和方差，以及具体分布

*Summarizingthedatabygroup

tabprgtype

*鎬荤粨prgtype鍐呭悇缁勬儏鍐?

bysortprgtype:

summarizereadwrite

*涓嶆噦...

tabstatreadwritemath,by（prgtype）stat（nmeansd）

*Correlations

correlatewritereadscience

*modifyingthedata

orderidgender

labelvariableschtyp"

typeofschool"

*插入标签

renamegenderfemale

*重命名

genscore=read+write+math

*在分析的过程中，有些变量并没有在数据中提供，需要我们用原始数据或者回归的结果构造。

genscore2=score^2

genpass=1ifscore>

=150

*生成pass=1，当成绩过150时

*egen命令相对复杂一些，它能生成一些“gen”命令无法生成的变量。

egenwagesum=sum（wage）

*生成wagesum为每个人的工资和

egenwagemedian=median（wage）

*生成wagemedian为工资的中位数（median）

egenwagemax=max（wage）

*生成wagemax为工资的最大值

egenwagemaxeduc=max（wage）,by（educ）

*产生一个变量“wagemax”为相同教育水平里的最高工资

*replace

*我们需要替换某一变量，我们可以用的命令是“replace”

genwagehigh=1ifwage>

=10

replacewagehigh=0ifwagehigh==.

*有时候我们在生成变量时可以加上一定条件，例如如果一个样本工资超过3，我们就定义它的变量wagehigh的取值为1，否则为0。

*注意是两个等号

dropifread<

dropschtyp

*drop命令去掉过程中的暂用的变量，以方便我们浏览数据和重新定义变量

countifwage<

100

*我们可以用“keep”或“drop”命令来删除一些样本,在删除之前，我们需要了解删除带来的影响，则可以用“count”命令来了解样本取值的情况。

*Creatingdummyvariables

*可以用“sort”和“list”命令来了解数据分布的细节

sortprgtype

*排序

xi,prefix（）i.prgtype

sortwage

listwagein50/70

*工资值从小到大排列在第50到70的样本的工资值。

keepifwage<

dropifwage>

=100

*想保留工资小于100的样本，可以有上面两种命令

*Generatingvariables

egenavgscore=mean（score）

*生成avgscore为成绩的均值

egenavggroupscore=mean（score）,by（prgtype）

*生成一个avggroupscore为在相同prgtype水平下的均值

ttesty1=y2

*检验变量y1和y2的平均值是否相等

signtesty1=y2

*秩检验，检验变量y1和y2的中值是否相等。

检验y1的中值是否为5可用如下命令

ttestwrite,by（female）

correlatewageeducexpertenure

*报告变量之间的相关系数

*Regression

regwritereadfemale

*进行OLS回归

*表格中最后两行报告回归的斜率和截距的系数，相应的标准差、t值和P值，同时给出95%的置信区间。

*在表格左上方，报告了回归的总变异、解释变异和残差变异。

*表格右上方报告回归的R方和调整后的R方。

*其中F是自变量所有的系数都为0（即自变量完全没有解释力）这样一个零假设对应的F分布值。

*regressionwithdummyvariables

xi:

regwritereadfemalei.prgtype

regwritereadfemalIPTY1IPTY2

*Definingglobalvariables

globalylistwrite

globalxlistreadfemale

*usingglobalvariables

reg$ylist$xlist

*usingoutreg2

eststorem1

outreg2[m1]usingtest.doc,replace

*生成word，文件名为test.doc

displaysqrt（5）*sin（0.5）

*Stata可以充当计算器用，使用“display”命令

sscinstalloutreg2

*从命令库下载命令，此处为下载outreg2

*usinglogout

logout,save（test2）wordreplace:

sum

*将所有数据保存到word里

logclose

*关闭日志文件

exit,clear

*退出并清空内存中的数据

*补充1

*describe命令可以描述数据文件的整体，包括观测总数，变量总数，生成日期，每个变量的存储类型（storagetype），标签（label）等

summarize[varlist][weight][ifexp][inrange][,detail]

*summarize可以提供varlist指定变量（可以不止一个）的如下统计量：

Percentiles（分位数），四大最大的数和四个最小的数，Variance（方差），Std.Dev.（标准差），Skewness（偏度），Kurtosis（斜度）

tabstatvarlist[weight][ifexp][inrange][,stats（statname[...]）]

*tabstat提供[,stats（statname[...]）]指定的统计量，

*可供选择的有mean（均值），count（非缺失观测值个数），sum（总和），max（最大值）

*range（最大值－最小值），sd（标准差），var（方差），

展开阅读全文