Stata命令Word下载.docx

上传人:b****3 文档编号:15201548 上传时间:2022-10-28 格式:DOCX 页数:11 大小:74.94KB
下载 相关 举报
Stata命令Word下载.docx_第1页
第1页 / 共11页
Stata命令Word下载.docx_第2页
第2页 / 共11页
Stata命令Word下载.docx_第3页
第3页 / 共11页
Stata命令Word下载.docx_第4页
第4页 / 共11页
Stata命令Word下载.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

Stata命令Word下载.docx

《Stata命令Word下载.docx》由会员分享,可在线阅读,更多相关《Stata命令Word下载.docx(11页珍藏版)》请在冰豆网上搜索。

Stata命令Word下载.docx

2.tabx1,gen(x1) 

产生x1的虚拟变量。

gen 

fsize1=fize==1 

产生虚拟变量,如果

gendate(或任一新变量名)=date(‘原变量名’,‘YMD’/'

DMY'

/..)

formdate 

%td

12.删掉重复记录duplicatesdrop

13.独立样本均值差异检验 

ttest

Stata语句2

*IntroductiontoStata

logusingstata_fall.txt,textreplace

*使用日志(log)。

它可以帮助我们记录stata的运行结果

clearall

setmoreoff

*关闭more选项。

如果打开该选项,那么结果分屏输出,即一次只输出一屏结果。

你按空格键后再输出下一屏,直到全部输完。

如果关闭则中间不停,一次全部输出

*cdD:

/undergraECMT/data

*进入数据所在的盘符和文件夹

logusing(文件名).log,replace

*打开日志文件,并更新。

日志文件将记录下所有文件运行后给出的结果,如果你修改了文件内容,replace选项可以将其更新为最近运行的结果

usehttp:

//www.ats.ucla.edu/stat/data/hs0,clear

*打开数据文件

*

*insheetusingintro_hs0.csv,clear

*useintro_hs0,clear

*Summarizingthedata

describe

*可以告诉我们每一个变量的含义

*具体了解每一个变量的特征,我们可以用tabstat命令。

例如我们可以计算wage的均值,方差,中位数,范围,具体可以用helptabstata查询。

tabstatwage,stats(mean)

tabstatwage,stats(sdmedianrange)

*算wage的均值,方差,中位数,范围

tabstatwage,by(educ)stats(mean)

*不同教育水平的工资的均值

summarize

*总计全体,Summarize(Sum)将汇报数据的均值和方差等信息。

summarizewage

*有关工资的均值与方差

*如果需要更详尽的信息,可以进一步使用后缀detail

histogramwage

*画柱状图

scatterwageeduc

*画出两个变量之间的分布关系

graphtwowayscatterwageeduc

*直观的看到教育水平变化时工资的变化,可以用“scatter”命令或者“graphtwowayscatter”命令

graphtwowaylinewageeduc

*“graphtwoway”命令可以带别的后缀,例如“graphtwowayline”则画的是线状图。

graphmatrixwageeduc

*了解更多的变量之间的关系

graphmatrixwageeducexper

graphbar(mean)wage,over(educ)

*了解y的平均值关于x分布的柱状图。

listgender-readin1/15

*取1到15列数据列表

summarizereadmathsciencewrite

*readmathsciencewrite的均值方差啊等信息

summarizeifread>

=60

*所有read大于60的均值方差

summarizeifprgtype=="

academic"

*所有prgty1pe=="

的均值,方差

summarizeread,detail

*有关read的均值和方差,以及具体分布

*Summarizingthedatabygroup

tabprgtype

*鎬荤粨prgtype鍐呭悇缁勬儏鍐?

bysortprgtype:

summarizereadwrite

*涓嶆噦...

tabstatreadwritemath,by(prgtype)stat(nmeansd)

*Correlations

correlatewritereadscience

*modifyingthedata

orderidgender

labelvariableschtyp"

typeofschool"

*插入标签

renamegenderfemale

*重命名

genscore=read+write+math

*在分析的过程中,有些变量并没有在数据中提供,需要我们用原始数据或者回归的结果构造。

genscore2=score^2

genpass=1ifscore>

=150

*生成pass=1,当成绩过150时

*egen命令相对复杂一些,它能生成一些“gen”命令无法生成的变量。

egenwagesum=sum(wage)

*生成wagesum为每个人的工资和

egenwagemedian=median(wage)

*生成wagemedian为工资的中位数(median)

egenwagemax=max(wage)

*生成wagemax为工资的最大值

egenwagemaxeduc=max(wage),by(educ)

*产生一个变量“wagemax”为相同教育水平里的最高工资

*replace

*我们需要替换某一变量,我们可以用的命令是“replace”

genwagehigh=1ifwage>

=10

replacewagehigh=0ifwagehigh==.

*有时候我们在生成变量时可以加上一定条件,例如如果一个样本工资超过3,我们就定义它的变量wagehigh的取值为1,否则为0。

*注意是两个等号

dropifread<

40

dropschtyp

*drop命令去掉过程中的暂用的变量,以方便我们浏览数据和重新定义变量

countifwage<

100

10

*我们可以用“keep”或“drop”命令来删除一些样本,在删除之前,我们需要了解删除带来的影响,则可以用“count”命令来了解样本取值的情况。

*Creatingdummyvariables

*可以用“sort”和“list”命令来了解数据分布的细节

sortprgtype

*排序

xi,prefix()i.prgtype

sortwage

listwagein50/70

*工资值从小到大排列在第50到70的样本的工资值。

keepifwage<

dropifwage>

=100

*想保留工资小于100的样本,可以有上面两种命令

*Generatingvariables

egenavgscore=mean(score)

*生成avgscore为成绩的均值

egenavggroupscore=mean(score),by(prgtype)

*生成一个avggroupscore为在相同prgtype水平下的均值

ttesty1=y2

*检验变量y1和y2的平均值是否相等

signtesty1=y2

*秩检验,检验变量y1和y2的中值是否相等。

检验y1的中值是否为5可用如下命令

ttestwrite,by(female)

correlatewageeducexpertenure

*报告变量之间的相关系数

*Regression

regwritereadfemale

*进行OLS回归

*表格中最后两行报告回归的斜率和截距的系数,相应的标准差、t值和P值,同时给出95%的置信区间。

*在表格左上方,报告了回归的总变异、解释变异和残差变异。

*表格右上方报告回归的R方和调整后的R方。

*其中F是自变量所有的系数都为0(即自变量完全没有解释力)这样一个零假设对应的F分布值。

*regressionwithdummyvariables

xi:

regwritereadfemalei.prgtype

regwritereadfemalIPTY1IPTY2

*Definingglobalvariables

globalylistwrite

globalxlistreadfemale

*usingglobalvariables

reg$ylist$xlist

*usingoutreg2

eststorem1

outreg2[m1]usingtest.doc,replace

*生成word,文件名为test.doc

displaysqrt(5)*sin(0.5)

*Stata可以充当计算器用,使用“display”命令

sscinstalloutreg2

*从命令库下载命令,此处为下载outreg2

*usinglogout

logout,save(test2)wordreplace:

sum

*将所有数据保存到word里

logclose

*关闭日志文件

exit,clear

*退出并清空内存中的数据

*补充1

*describe命令可以描述数据文件的整体,包括观测总数,变量总数,生成日期,每个变量的存储类型(storagetype),标签(label)等

summarize[varlist][weight][ifexp][inrange][,detail]

*summarize可以提供varlist指定变量(可以不止一个)的如下统计量:

Percentiles(分位数),四大最大的数和四个最小的数,Variance(方差),Std.Dev.(标准差),Skewness(偏度),Kurtosis(斜度)

tabstatvarlist[weight][ifexp][inrange][,stats(statname[...])]

*tabstat提供[,stats(statname[...])]指定的统计量,

*可供选择的有mean(均值),count(非缺失观测值个数),sum(总和),max(最大值)

*range(最大值-最小值),sd(标准差),var(方差),

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1