stata使用手册Word文档下载推荐.docx

资源描述

stata使用手册Word文档下载推荐.docx

《stata使用手册Word文档下载推荐.docx》由会员分享，可在线阅读，更多相关《stata使用手册Word文档下载推荐.docx（14页珍藏版）》请在冰豆网上搜索。

stata使用手册Word文档下载推荐.docx

以上四个窗口都可以从”Fonts”去更改字体大小。

三、输入数据（Entering

data）

在本小节中，我们将介绍如何把数据读进

STATA。

但是在正式介绍之前，

我们必须先对几个一般性的指令（general

command）有所了解，说明如下：

cd：

即

change

directory，简言之，告知

数据储存的地方。

例如当

数据储存在

槽的

sample

数据夹时，则必须先输入

\sample。

dir/ls：

用来显示目录的内容。

set

memory

#m：

设定内存的容量。

例如：

当有一笔庞大的数据要处理时，

则可设定

100mb

的容量，此时可输入

setmemory

100m。

（输入指令

可以知道内存容量的大小

以及使用情况。

）

matsize

#：

设定所需的变量个数。

一般而言，不须对此部分进行设定，

除非所欲处理的资料庞大或是当执行后出现

matsizetoo

small

的讯息时再进行修改即可。

内建为

40。

off/on：

若欲执行结果以分页的型式呈现时，则输入

on；

若欲执行结果同时呈现时，则输入

off。

help：

求助键。

后面必须接的是指令。

说明如何使用该指令，例如：

help

regress。

search：

后面可接任何文字。

说明在何处可以找到该文字。

normal

distribution。

clear：

清除键。

用来删除所有数据。

接下来，根据数据类型或指令的不同，数据输入的方法可分成以下四种：

1、输入

EXCEL

数据

将

的数据输入

的方式还可细分成以下两种：

①将

之前，必须先将数据存成

csv

文件，再利用

指令

insheet

来读数据。

Example：

❶当

档的第一列有变量名称时：

\sample

dir

memory

10m

using

sample1-1.csv

variable

name

Column

number

1-2

eng

3-4

math

5-6

sex

micro

8-9

macro

10-11

❷当

档的第一列没有变量名称时：

gender

race

ses

schtyp

prgtype

read

write

science

socst

sample1-2.csv

②直接复制

上的数据，再到

选取”Window”下的”Data

Editor”，

点选后会出现”Stata

Editor”工作表，再到”Edit”下选取”Paste”即可贴上数据。

2、输入

ASCII

的数据型态

依

ASCII的数据型态区分，将

ASCII的数据输入

的方式也有以

下两种：

①数据型态一：

见

sample1-3.txt

infile

str10

记住文字的设定方式（str#

name）。

②数据型态二：

sample1-4.txt

第二种的数据型态通常须要

codebook。

如下表所示。

infix

1-2

eng

3-4

math

5-6

micro

8-9

macro

10-11

using

3、利用

Do-file

editor

输入数据

insheet

（text）

data

created

spreadsheet

infile

unformatted

data

infix

fixed

format

input

enter

from

keyboard

use

load

Stata-format

dataset

将数据或是指令写入

editor，再执行即可。

将下面数

据复制并贴在

editor（选取”Window”下的”Do-file

editor”）上，再

选择”do

currnet

file”执行即可。

input

female

str3

schtype

prog

science

socst

147

pub

108

153

102

160

136

end

4、利用

的数据型态输入

除了以上三种方法之外，还可以开启之前以

储存的资料。

use

sample1-6.dta

此一指令亦可用在读取网络上的数据（use

网址）。

最后，将数据输入的相关指令整理成下表。

四、探索资料（Exploring

为了更详细地呈现出在数据探索时所需使用的相关指令，我们利用

sample4-1

来说明指令的用法。

首先，利用前节所提及的数据输入方法将

读进

在正式分析数据之前，我们可以利用一个

log

档来储存之后所要执行的指

令以及所得到的结果。

指令的表示方法如下：

result4-1,

text（log

檔的名稱為

result4-1）

接下来，我们可以先利用下面的指令来检视

的数据：

count：

可得样本数。

describe：

描述数据来源以及数据大小。

list：

依序列出观察值的各个变量值。

codebook：

描述资料的详细内容。

此外，我们就可以利用

summarize、tabulate

和

tabstat

等指令得到数据

的叙述统计与基本特性。

表示如下：

summarize：

列出资料的叙述统计。

summarize

write,

detail

sum

read>

=60（sum

是

的简写）

prgtype=="

academic"

（接在

之后的句子中

的”=”要放两个）

1/40（只列出第

笔到第

笔资料）

tabulate：

列出变数的次数表。

tabulate

prgtype

race

prgtype,

summarize（read）

race,

summarize（write）

tabstat：

列出变量的叙述统计。

math,

by（prgtype）

stat（n

mean

sd）

p25

p50

p75）

by（prgtype）

接下来，我们介绍一些用来划图的指令：

茎叶图：

stem

write

lines

（2）

直方图：

graph

bin（10）

hist

count

Show

the

number

observations

describe

Describe

contents

disk

list

List

values

variables

codebook

Detailed

log

Create

file

summarize

Descriptive

statistics

tabulate

One-

two-way

frequency

tables

tabstat

Table

descriptive

stem

Stem-and-leaf

plot

graph

High

resolution

graphs

sort

Sort

observations

hist

Histogram

categorical

variable

correlate

Correlations

箱形图：

box

sort

prgtype（要先有这个指令才能执行下一个指令）

box

此外，利用

correlate

或是

pwcorr

可以得到相关矩阵；

亦可利用

划出散布图。

science,

obs

read,

twoway

two

jitter

（2）（two

twoway

的簡稱，jitter

是用來區分

重疊的觀察點）

jitter

（2）

matrix

half

现在我们可以将

文件结束了，指令输入如下：

若欲检视

档中的结果，可以输入指令：

type

result4-1.log

或是到所储存的目录下点选。

最后，将数据探索的相关指令整理成下表。

pwcorr

Pairwise

correlations

type

Display

五、修饰资料（Modifying

在本小节中，我们亦利用

的数据进行说明。

首先，读进数据。

读完数据后，可以为此数据取个名称，指令如下：

label

School

and

Beyond,

200

cases"

现在我们可以将变量的顺序作一排列。

原先的变量顺序为

gender、id

race…，但是我们想把顺序改成

id、gender

race…，则可以

下面的指令来执行：

order

gender

在执行

codebook

时，我们会发现有些变量尚未加上卷标（label），为了

更清楚地表达变量所代表的意义，我们可以执行以下的指令：

The

school

student

attended."

现在，我们想要产生一个新变量

total，此变量代表

read、write

的总和。

指令如下：

generate

total

此外，若是我们想加总的分数是

socst，而非

math，此时的指令输入如下：

replace

另一方面，我们还可以将变量

表示成以等级（A、B、C、D

F）

的形式。

grade

total

recode

0/80=0

80/110=1

110/140=2

140/170=3

170/300=4

define

abcdf

Apply

set

order

Order

variables

generate

Creates

new

replace

Replaces

one

value

with

another

value

recode

Recode

Label

values

labels

define

Define

for

levels

notes

egen

Extended

has

special

functions

that

can

used

when

creating

save

Store

dataset

currently

disk

Stata

为了记忆变量的意义为何，我们还可以利用

note

的方式来记录变量。

指令如

下：

race:

values

coded

were

recoded

missing

notes（叫出

的指令）

另外，介绍一些利用公式来产生变量的指令。

egen

zread

std（read）

zread

list

1/10

rmean

mean（read）,

by（ses）

mread

median（read）,

by（prog）

最后，我们可以将以上的执行结果储存下来。

save

sample5-1（存成另一個檔）

sample4-1（取代原來的

sample4-1）

现在亦将数据修饰的相关指令整理成下表。

六、管理数据（Managing

在本节中，我们将进一步介绍如何将数据作一些特殊的处理，例如：

保留

所欲分析的数据、删除多余的数据或是将两份数据结合等等。

假设我们只想针对部分的数据进行处理，而又想保留原始资料时，则有以

下两种方法可进行：

1、另存新檔：

亦即将所欲分析的部分数据储存在另一个档案中。

我们只

针对

成绩大于或是等于

分的学生进行分析，则可利用

下面的指令来筛选。

keep

sample6-1

当只要保留某些变量时，则利用指令

keep。

write。

2、直接处理：

亦即在原始数据上进行分析。

承上例，指令输入如下：

preserve

drop

restore

若要删除某些变量时，则利用指令

drop。

接下来，我们介绍如何将两笔数据结合在一起。

数据的结合主要可以分为

两种，水平合并和垂直合并。

前者是指变量的增加；

后者则是指样本数的增加。

说明如下：

1、水平合并

sampleh1

append

sampleh2

2、垂直合并：

samplev1

samplev1,

samplev2,

clear

merge

samplev2

Keep

condition

met

Drop

keep

（dropping

others）

drop

（keeping

Append

file

current

merge

Merge

在垂直合并前要记得先

sort。

最后，我们将数据修饰的相关指令整理成下表。

七、资料分析

透过前面几节的介绍，应该对于

的指令和使用方法有了基本的认

识。

现在，我们开始说明如何利用

来处现统计上的问题以及计量方面

的模型。

1、检定：

我们利用下面的例子来示范如何进行统计上的检定工作。

sample4-1：

ttest

=60

（gender）

unequal

sample7-1：

before=

after

2、回归

在执行回归分析时所使用的指令为

sample7-2

regress

growth

lnrlp84

lnemp

oclnemp

cr4

lnrd

另外，当存在

heterogeneityofvariance

的问题时，可在后面加上

robust；

另外，若是不想放入截距项时，可在后面加上

noconstant。

若欲得

到残差值，可输入以下指令：

predict

residual

3、二元选择模型

在执行二元选择模型时所使用的程序写法与执行回归分析时相同，只是所

使用的指令不同。

在

logit

模型时为

logit；

progit

progit。

sample7-3

rlp

emptot

rlp2

emptot2

rlpemp

lnrd

lstat

lnrd,or

probit

dprobit

4、Treatment

effect

model

原则上，STATA

在处理计量模型时，格式上大都一致，亦即〝指令

被解

释变量

解释变量〞的输入型式。

我们再举一个计量模型来说明，例如：

在有关

自我选择的问题时，为了考虑内生性的情形，计量学家提出了一个

Treatment

model，其指令的撰写如下：

treatreg

cr4,treat（oc=

rlp84

emptotrlp842

lnrd）

lnrd）two

由上述可知，STATA

在使用上真的相当方便、容易，尤其对于初学者而

言，更是一个相当值得推荐的软件包。

最后，整理一些

的相关网站以

供参考：

http:

//www.ats.ucla.edu/stat/stata/default.htm

展开阅读全文