1、2.tab x1,gen(x1) 产生x1的虚拟变量。genfsize1=fize=1 产生虚拟变量,如果gen date(或任一新变量名)=date(原变量名,YMD/DMY/.)form date%td12. 删掉重复记录 duplicates drop13.独立样本均值差异检验ttestStata语句2* Introduction to Statalog using stata_fall.txt, text replace*使用日志(log)。它可以帮助我们记录stata的运行结果clear allset more off*关闭more选项。如果打开该选项,那么结果分屏输出,即一次只输出
2、一屏结果。你按空格键后再输出下一屏,直到全部输完。如果关闭则中间不停,一次全部输出*cd D:/undergraECMT/data*进入数据所在的盘符和文件夹log using (文件名).log,replace *打开日志文件,并更新。日志文件将记录下所有文件运行后给出的结果,如果你修改了文件内容,replace选项可以将其更新为最近运行的结果use http:/www.ats.ucla.edu/stat/data/hs0, clear*打开数据文件*insheet using intro_hs0.csv, clear*use intro_hs0, clear*Summarizing the
3、 datadescribe*可以告诉我们每一个变量的含义*具体了解每一个变量的特征,我们可以用 tabstat 命令。例如我们可以计算 wage 的均值,方差,中位数,范围,具体可以用 help tabstata 查询。tabstat wage, stats(mean)tabstat wage, stats (sd median range)*算 wage 的均值,方差,中位数,范围tabstat wage, by (educ) stats(mean)*不同教育水平的工资的均值summarize*总计全体,Summarize(Sum)将汇报数据的均值和方差等信息。summarize wage*
4、有关工资的均值与方差*如果需要更详尽的信息,可以进一步使用后缀detailhistogram wage*画柱状图scatter wage educ*画出两个变量之间的分布关系graph twoway scatter wage educ*直观的看到教育水平变化时工资的变化,可以用 “scatter” 命令或者 “graph twoway scatter” 命令graph twoway line wage educ*“graph twoway”命令可以带别的后缀,例如 “graph twoway line” 则画的是线状图。graph matrix wage educ*了解更多的变量之间的关系gr
5、aph matrix wage educ expergraph bar (mean) wage, over (educ)*了解y的平均值关于x分布的柱状图。list gender-read in 1/15*取1到15列数据列表summarize read math science write*read math science write的均值方差啊等信息summarize if read = 60*所有read大于60的均值方差summarize if prgtype = academic*所有prgty1pe = 的均值,方差summarize read, detail*有关read的均值
6、和方差,以及具体分布*Summarizing the data by grouptab prgtype*鎬荤粨prgtype鍐呭悇缁勬儏鍐?bysort prgtype: summarize read write*涓嶆噦.tabstat read write math, by(prgtype) stat(n mean sd)*Correlationscorrelate write read science*modifying the dataorder id genderlabel variable schtyp type of school *插入标签rename gender female
7、 *重命名gen score=read+write+math*在分析的过程中,有些变量并没有在数据中提供,需要我们用原始数据或者回归的结果构造。gen score2=score2gen pass=1 if score=150*生成pass=1,当成绩过150时*egen命令相对复杂一些,它能生成一些“gen”命令无法生成的变量。egen wagesum=sum(wage)*生成wagesum 为每个人的工资和egen wagemedian=median(wage)*生成 wagemedian 为工资的中位数(median)egen wagemax=max(wage)*生成wagemax 为工资
8、的最大值egen wagemaxeduc=max (wage),by (educ)*产生一个变量“wagemax”为相同教育水平里的最高工资*replace*我们需要替换某一变量,我们可以用的命令是“replace”gen wagehigh=1 if wage=10replace wagehigh=0 if wagehigh =.*有时候我们在生成变量时可以加上一定条件,例如如果一个样本工资超过3,我们就定义它的变量wagehigh 的取值为1,否则为0。*注意是两个等号drop if read40drop schtyp*drop命令去掉过程中的暂用的变量,以方便我们浏览数据和重新定义变量co
9、unt if wage10010*我们可以用“keep”或“drop”命令来删除一些样本,在删除之前,我们需要了解删除带来的影响,则可以用“count”命令来了解样本取值的情况。*Creating dummy variables*可以用“sort”和“list”命令来了解数据分布的细节sort prgtype*排序xi, prefix() i.prgtypesort wagelist wage in 50/70*工资值从小到大排列在第50到70的样本的工资值。keep if wage=100*想保留工资小于100的样本,可以有上面两种命令*Generating variablesegen av
10、gscore=mean(score)*生成avgscore为成绩的均值egen avggroupscore=mean(score), by(prgtype)*生成一个avggroupscore为在相同prgtype水平下的均值ttest y1=y2*检验变量y1和y2的平均值是否相等signtest y1=y2*秩检验,检验变量y1和y2的中值是否相等。检验y1的中值是否为5可用如下命令ttest write, by(female)correlate wage educ exper tenure*报告变量之间的相关系数*Regressionreg write read female*进行 OL
11、S 回归*表格中最后两行报告回归的斜率和截距的系数,相应的标准差、t值和P值,同时给出95%的置信区间。*在表格左上方,报告了回归的总变异、解释变异和残差变异。*表格右上方报告回归的R方和调整后的R方。*其中F是自变量所有的系数都为0(即自变量完全没有解释力)这样一个零假设对应的F分布值。*regression with dummy variablesxi: reg write read female i.prgtypereg write read femal IPTY1 IPTY2*Defining global variablesglobal ylist writeglobal xlist
12、 read female*using global variablesreg $ylist $xlist*using outreg2est store m1outreg2 m1 using test.doc, replace*生成word,文件名为test.docdisplay sqrt(5)*sin(0.5)*Stata 可以充当计算器用,使用 “display” 命令ssc install outreg2*从命令库下载命令,此处为下载outreg2 *using logoutlogout,save(test2) word replace: sum*将所有数据保存到word里log clos
13、e*关闭日志文件exit,clear *退出并清空内存中的数据*补充1*describe命令可以描述数据文件的整体,包括观测总数,变量总数,生成日期,每个变量的存储类型(storage type),标签(label)等summarize varlist weight if exp in range ,detail*summarize可以提供varlist指定变量(可以不止一个)的如下统计量:Percentiles(分位数),四大最大的数和四个最小的数,Variance(方差),Std. Dev.(标准差),Skewness(偏度),Kurtosis(斜度)tabstat varlist weight if exp in range , stats(statname .) *tabstat提供, stats(statname .) 指定的统计量,*可供选择的有mean(均值),count(非缺失观测值个数),sum(总和),max(最大值)*range(最大值最小值),sd(标准差),var(方差),
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1