stata使用手册Word文档下载推荐.docx

上传人:b****5 文档编号:21232609 上传时间:2023-01-28 格式:DOCX 页数:14 大小:101.82KB
下载 相关 举报
stata使用手册Word文档下载推荐.docx_第1页
第1页 / 共14页
stata使用手册Word文档下载推荐.docx_第2页
第2页 / 共14页
stata使用手册Word文档下载推荐.docx_第3页
第3页 / 共14页
stata使用手册Word文档下载推荐.docx_第4页
第4页 / 共14页
stata使用手册Word文档下载推荐.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

stata使用手册Word文档下载推荐.docx

《stata使用手册Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《stata使用手册Word文档下载推荐.docx(14页珍藏版)》请在冰豆网上搜索。

stata使用手册Word文档下载推荐.docx

以上四个窗口都可以从”Fonts”去更改字体大小。

三、输入数据(Entering 

data)

3

在本小节中,我们将介绍如何把数据读进 

STATA。

但是在正式介绍之前,

我们必须先对几个一般性的指令(general 

command)有所了解,说明如下:

cd:

即 

change 

directory,简言之,告知 

数据储存的地方。

例如当

数据储存在 

槽的 

sample 

数据夹时,则必须先输入 

cd 

e:

\sample。

dir/ls:

用来显示目录的内容。

set 

memory 

#m:

设定内存的容量。

例如:

当有一笔庞大的数据要处理时,

则可设定 

100mb 

的容量,此时可输入 

setmemory

100m。

(输入指令 

可以知道内存容量的大小

以及使用情况。

matsize 

#:

设定所需的变量个数。

一般而言,不须对此部分进行设定,

除非所欲处理的资料庞大或是当执行后出现 

matsizetoo

small 

的讯息时再进行修改即可。

内建为 

40。

more 

off/on:

若欲执行结果以分页的型式呈现时,则输入 

more

on;

若欲执行结果同时呈现时,则输入 

off。

help:

求助键。

后面必须接的是指令。

说明如何使用该指令,例如:

help

regress。

search:

后面可接任何文字。

说明在何处可以找到该文字。

search 

normal 

distribution。

clear:

清除键。

用来删除所有数据。

接下来,根据数据类型或指令的不同,数据输入的方法可分成以下四种:

1、输入 

EXCEL 

数据

将 

的数据输入 

的方式还可细分成以下两种:

①将 

之前,必须先将数据存成 

csv 

文件,再利用

指令 

insheet 

来读数据。

Example:

❶当 

档的第一列有变量名称时:

\sample

dir

memory

10m

using 

sample1-1.csv

4

variable 

name

Column 

number

id

1-2

eng

3-4

math

5-6

sex

7

micro

8-9

macro

10-11

❷当 

档的第一列没有变量名称时:

gender 

id 

race 

ses 

schtyp 

prgtype 

read 

write 

science 

socst 

sample1-2.csv

②直接复制 

上的数据,再到 

选取”Window”下的”Data 

Editor”,

点选后会出现”Stata 

Editor”工作表,再到”Edit”下选取”Paste”即可贴上数据。

2、输入 

ASCII 

的数据型态

依 

ASCII的数据型态区分,将 

ASCII的数据输入 

的方式也有以

下两种:

①数据型态一:

见 

sample1-3.txt

infile 

str10 

记住文字的设定方式(str# 

name)。

②数据型态二:

sample1-4.txt

第二种的数据型态通常须要 

codebook。

如下表所示。

infix 

1-2 

eng 

3-4 

math 

5-6 

micro 

8-9 

macro 

10-11 

using

3、利用 

Do-file 

editor 

输入数据

5

insheet

(text) 

data 

created 

by 

spreadsheet

infile

unformatted 

data

infix

in 

fixed 

format

input

enter 

from 

keyboard

use

load 

Stata-format 

dataset

将数据或是指令写入 

editor,再执行即可。

将下面数

据复制并贴在 

editor(选取”Window”下的”Do-file 

editor”)上,再

选择”do 

currnet 

file”执行即可。

input 

female 

str3 

schtype 

prog 

science

socst

147 

pub 

47 

62 

53 

61

108 

34 

33 

41 

36 

36

18 

50 

49 

44 

153 

39 

31 

40 

51

59 

42 

51 

39

102 

52 

56

57 

71 

65 

72 

66 

160 

55 

136 

70 

63 

end

4、利用 

的数据型态输入

除了以上三种方法之外,还可以开启之前以 

储存的资料。

use 

sample1-6.dta

此一指令亦可用在读取网络上的数据(use 

网址)。

最后,将数据输入的相关指令整理成下表。

四、探索资料(Exploring 

为了更详细地呈现出在数据探索时所需使用的相关指令,我们利用

sample4-1 

来说明指令的用法。

首先,利用前节所提及的数据输入方法将

读进 

6

在正式分析数据之前,我们可以利用一个 

log 

档来储存之后所要执行的指

令以及所得到的结果。

指令的表示方法如下:

result4-1, 

text(log 

檔的名稱為 

result4-1)

接下来,我们可以先利用下面的指令来检视 

的数据:

count:

可得样本数。

describe:

描述数据来源以及数据大小。

list:

依序列出观察值的各个变量值。

codebook:

描述资料的详细内容。

此外,我们就可以利用 

summarize、tabulate 

和 

tabstat 

等指令得到数据

的叙述统计与基本特性。

表示如下:

summarize:

列出资料的叙述统计。

summarize 

write, 

detail

sum 

if 

read>

=60(sum 

是 

的简写)

prgtype=="

academic"

(接在 

之后的句子中

的”=”要放两个)

1/40(只列出第 

笔到第 

笔资料)

tabulate:

列出变数的次数表。

tabulate 

prgtype

race

prgtype, 

summarize(read)

race, 

summarize(write)

tabstat:

列出变量的叙述统计。

math, 

by(prgtype) 

stat(n 

mean 

sd)

sd 

p25 

p50 

p75) 

by(prgtype)

接下来,我们介绍一些用来划图的指令:

茎叶图:

stem 

write

lines

(2)

直方图:

graph 

bin(10)

hist 

count

Show 

the 

number 

of 

observations

describe

Describe 

contents 

or 

on 

disk

list

List 

values 

variables

codebook

Detailed 

log

Create 

file

summarize

Descriptive 

statistics

tabulate

One- 

&

two-way 

frequency 

tables

tabstat

Table 

descriptive 

stem

Stem-and-leaf 

plot

graph

High 

resolution 

graphs

sort

Sort 

observations 

hist

Histogram 

categorical 

variable

correlate

Correlations

箱形图:

box

sort 

prgtype(要先有这个指令才能执行下一个指令)

box 

此外,利用 

correlate 

或是 

pwcorr 

可以得到相关矩阵;

亦可利用 

划出散布图。

science, 

obs

read, 

twoway

two 

jitter

(2)(two 

twoway 

的簡稱,jitter 

是用來區分

重疊的觀察點)

jitter

(2) 

matrix 

half

现在我们可以将 

文件结束了,指令输入如下:

close

若欲检视 

档中的结果,可以输入指令:

type 

result4-1.log

或是到所储存的目录下点选。

最后,将数据探索的相关指令整理成下表。

8

pwcorr

Pairwise 

correlations

type

Display 

an 

五、修饰资料(Modifying 

在本小节中,我们亦利用 

的数据进行说明。

首先,读进数据。

读完数据后,可以为此数据取个名称,指令如下:

label 

"

School 

and 

Beyond, 

200 

cases"

现在我们可以将变量的顺序作一排列。

原先的变量顺序为

gender、id 

race…,但是我们想把顺序改成 

id、gender 

race…,则可以

下面的指令来执行:

order 

gender

在执行 

codebook 

时,我们会发现有些变量尚未加上卷标(label),为了

更清楚地表达变量所代表的意义,我们可以执行以下的指令:

The 

school 

student 

attended."

现在,我们想要产生一个新变量 

total,此变量代表 

read、write 

的总和。

指令如下:

generate 

total 

此外,若是我们想加总的分数是 

socst,而非

math,此时的指令输入如下:

replace 

另一方面,我们还可以将变量 

表示成以等级(A、B、C、D 

F)

的形式。

grade 

total

recode 

0/80=0 

80/110=1 

110/140=2 

140/170=3 

170/300=4

define 

abcdf 

F"

D"

C"

B"

A"

abcdf

9

Apply 

to 

set

order

Order 

variables 

generate

Creates 

new 

replace

Replaces 

one 

value 

with 

another 

value

recode

Recode 

Label 

values

labels 

define

Define 

for 

levels 

notes

notes 

egen

Extended 

has 

special 

functions 

that 

can 

be 

used

when 

creating 

save

Store 

dataset 

currently 

disk 

Stata 

为了记忆变量的意义为何,我们还可以利用 

note 

的方式来记录变量。

指令如

下:

race:

values 

coded 

as 

were 

recoded 

be

missing

notes(叫出 

的指令)

另外,介绍一些利用公式来产生变量的指令。

egen 

zread 

std(read)

zread

list 

1/10

rmean 

mean(read), 

by(ses)

mread 

median(read), 

by(prog)

最后,我们可以将以上的执行结果储存下来。

save 

sample5-1(存成另一個檔)

sample4-1(取代原來的 

sample4-1)

现在亦将数据修饰的相关指令整理成下表。

六、管理数据(Managing 

10

在本节中,我们将进一步介绍如何将数据作一些特殊的处理,例如:

保留

所欲分析的数据、删除多余的数据或是将两份数据结合等等。

假设我们只想针对部分的数据进行处理,而又想保留原始资料时,则有以

下两种方法可进行:

1、另存新檔:

亦即将所欲分析的部分数据储存在另一个档案中。

我们只

针对 

成绩大于或是等于 

60 

分的学生进行分析,则可利用

下面的指令来筛选。

keep 

>

60

sample6-1

当只要保留某些变量时,则利用指令 

keep。

write。

2、直接处理:

亦即在原始数据上进行分析。

承上例,指令输入如下:

preserve

drop 

<

restore

若要删除某些变量时,则利用指令 

drop。

接下来,我们介绍如何将两笔数据结合在一起。

数据的结合主要可以分为

两种,水平合并和垂直合并。

前者是指变量的增加;

后者则是指样本数的增加。

说明如下:

1、水平合并

sampleh1

append 

sampleh2

2、垂直合并:

samplev1

samplev1, 

samplev2, 

clear

 

merge 

samplev2

11

if

Keep 

condition 

is 

met

Drop 

keep

(dropping 

others)

drop

(keeping 

Append 

file 

current 

merge

Merge 

在垂直合并前要记得先 

sort。

最后,我们将数据修饰的相关指令整理成下表。

七、资料分析

透过前面几节的介绍,应该对于 

的指令和使用方法有了基本的认

识。

现在,我们开始说明如何利用 

来处现统计上的问题以及计量方面

的模型。

1、检定:

我们利用下面的例子来示范如何进行统计上的检定工作。

sample4-1:

ttest 

=60

(gender)

(gender) 

unequal

sample7-1:

before= 

after

2、回归

在执行回归分析时所使用的指令为 

sample7-2

regress 

growth 

lnrlp84 

lnemp 

oclnemp 

cr4 

lnrd 

oc

另外,当存在 

heterogeneityofvariance 

的问题时,可在后面加上

robust;

另外,若是不想放入截距项时,可在后面加上 

noconstant。

若欲得

到残差值,可输入以下指令:

predict 

residual

12

3、二元选择模型

在执行二元选择模型时所使用的程序写法与执行回归分析时相同,只是所

使用的指令不同。

在 

logit 

模型时为 

logit;

progit 

progit。

sample7-3

oc 

rlp 

emptot 

rlp2 

emptot2 

rlpemp 

lnrd

lstat

lnrd,or

probit 

dprobit 

4、Treatment 

effect 

model

原则上,STATA 

在处理计量模型时,格式上大都一致,亦即〝指令 

被解

释变量 

解释变量〞的输入型式。

我们再举一个计量模型来说明,例如:

在有关

自我选择的问题时,为了考虑内生性的情形,计量学家提出了一个 

Treatment

model,其指令的撰写如下:

treatreg 

cr4,treat(oc= 

rlp84

emptotrlp842 

lnrd)

lnrd)two

由上述可知,STATA 

在使用上真的相当方便、容易,尤其对于初学者而

言,更是一个相当值得推荐的软件包。

最后,整理一些 

的相关网站以

供参考:

http:

//www.ats.ucla.edu/stat/stata/default.htm

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工作范文 > 行政公文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1