ImageVerifierCode 换一换
格式:DOCX , 页数:21 ,大小:178.72KB ,
资源ID:3106886      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/3106886.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(STATA入门3数据.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

STATA入门3数据.docx

1、STATA入门3数据3数据数据文件是一个矩形的矩阵,这个矩阵的每一行都代表或对应着一个“观测单位”(比如是一个人,一个村或一个地区等等),矩阵的每一列都代表或对应着一个“变量”(比如年龄,身高、体重,月工资收入等等)。因此,数据文件矩阵中的每一个元素(case)都代表或对应着某一个“观测单位”(如张三、李四,A厂、B厂)中的某一个“变量”(比如年龄、体重,月收入等等)的变量值或观察值。3.1 打开示例数据和网络数据:use3.1.1 示例数据示例数据为STATA帮助文件中所用的数据,其后辍名为.dta,如果在STATA软件当前路径下,直接用use命令即可打开,如果不在当前路径下,则可以使用sy

2、suse命令打开。. use auto,clear /打开汽车数据auto.dta. cd d:/ /改变路径到d:/. use auto, clearfile auto.dta not found /系统提示无法找到文件,因为auto.dta不在d:/r(601);. sysuse auto,clear /无论当前路径是什么,该命令均能打开系统自带文件示例数据Auto :美国1978年汽车数据,包括产地、车名、行使里程、重量等变量Bplong血压数据Cancer药物实验生存数据Census1980年美国分州人口普查数据Citytemp美国城市气温数据Educ99gdp教育与GDP关系数据Gn

3、p96 美国1967-2002年的GNP数据Lifeexp 预期寿命数据Nlsw88 美国年轻妇女研究数据Pop2000 美国2000年人口普查数据Sp500 S&P500历史数据Uslifeexp美国预期寿命1900-1999Voter 美国1992年选举民意调查数据3.1.2 从网络获取数据上述示例数据可能没有全部下载安装于你的电脑中,因此简单地使用use和sysuse命令时,可能出现错误,如. use nlswork, clearfile nlswork.dta not found此时,如果确定该数据为示例数据,可以直接通过网络获取,其命令为:. use http:/www.stata-

4、 /从网站获取数据,或者. webuse nlswork, clear /与前一命令等价,从STATA官方数据库获取数据webuse只能从http:/www.stata-另一个网络数据较多的地方是波士登大学的数据中心,我们所用的计量经济学导论一书中所使用的全部数据都可以通过该数据中心获得。比如. use http:/fmwww.bc.edu/ec-p/data/wooldridge/CEOSAL1即打开教材中例2.3中所使用的CEO数据。use命令只能打开后辍名为“*.dta”格式的数据,.dta格式以外的数据,STATA不能直接读取,需要从外部读入,最简单而直接的办法是复制和粘贴,但有时没有

5、其他软件,比如有SAS格式或SPSS格式的数据,但没有SAS软件和SPSS软件,此时需要用STATA提供的其他命令或者使用transfer数据格式转化软件。在讨论其他输入或导入数据的方法之前,我们先来学习一点数据类型的知识。3.2数据类型STATA通常把变量划分为三类:分别是数值型,字符型和日期型3.2.1数值变量:用0、1、29及+、(正负号)与小数点“(.)”来表示。在输入数据时,逗号不能被识别,如1,024应该直接写成1024.其他示例5-55.25.2e+35.2e-2后面两个数据为科学计数法的数据,分别表示5200和0.052.其中的e相当于10,因此5.2e+3的意思是:5.2*1

6、03=5200数值型变量按其精度区分,又有五种类型,分别是:存贮类型 最小 最大 0-领域 字节-byte -127 100 +/-1 1int -32,767 32,740 +/-1 2long -2,147,483,647 2,147,483,620 +/-1 4float -1.70141173319*1038 1.70141173319*1036 +/-10-36 4double -8.9884656743*10307 8.9884656743*10307 +/-10-323 8当运算精度要求很高的时候,需要将变量设置成浮点型和双精度型。注意1和1.0000的精度是不同的,前者在(0.

7、5,1.5)区间内近似,而后者在(0.99995,1.00005)区间内近似。若多次运算反复取四舍五入,精度较低时将使计算误差迅速变大,然而,精度高时占用的内存资源较多。下面的命令有助于理解变量存贮类型变换。 clear set obs 1 obs was 0, now 1 /提示信息说,之前系统中没有观察单位,现在有了一个gen a=1 /生成一个新变量a,令a取值为1 d /*d为describ命令的略写,describ命令显示数据集的属性信息,注意观察显示结果中,a的storage type为float型,浮点型为默认类型*/Contains dataobs: 1 (观察值个数) var

8、s: 1 (变量个数) size: 8 (99.9% of memory free)(内存空间大小) storage display valuevariable name type format label variable labela float %9.0g Sorted by: (按什么分类)Note: dataset has changed since last saved(注释) compress /在不损害信息的基础上压缩,使数据占用空间尽可能小a was float, now byte /a由浮点型变为了字节型 d / 注意a的storage type现在为byte型replac

9、e a=101 /* 注意a的storage type现在自动升为int型,因为byte最大只能为100*/a was byte now int(1 real change made) replace a=100 compress d /重新变回到byte型 replace a=32741 /直接变到long型,因为int型最大只能到32740 gen double b=1 /直接生成双精度变量b recast double a /将a变成双精度变量b d /注意到a和b均为双精度型3.2.2字符串变量:字符变量通常是一些身份信息,如姓名,地名。另外,分类形迹也可以用字符变量来表示,如性别分为

10、“男”和“女”。字符串变量由字母或一些特殊的符号组成的(如地名籍贯变量,迁出地,住址,职业等等)。字符串变量也可以由数字来组成,但数字在这里仅代表一些符号而不再是数字。字符串变量通常以引号“”注标,而且引号一般不被试同为字符的一部分。注意这里的引号必须是英文输入状态下的引号。字符串最多可以达244个字符。一般用str#来表示字符的多少,如str20表示将有20个字符。一般三个中文字的姓名需要6个字符。字符型示例“String”“string” string”string ”/特殊字符串,表示空字符,缺失值。” ”/注意与空字符串的区别,含有一个空格”125.27” /”125.27”由于有双引

11、号,将被视同为字符而非数值。“$2,343.68”“I love you”“旺材是条狗”注意前四个字符串均不相同,大小写是不一样的,有无空格及空格的位置不同,都表示不同的字符串。对于”125.27”这样的数值型的字符串,可以用real()函数或者destring命令转化成数值型变量。具体操作见3.3.1。3.2.3日期型变量在STATA中,1960年1月1日被认为是第0天,因此1959年12月31日为第-1天,2001年1月25日为15000天。对日期型变量的讨论将在后面的时间序列分析部分。1999 12 10jan/10/200110jan2001. -15,000 - 01dec1918-

12、31 -01dec1959. -1 - 31dec19590 - 01jan19601 - 02jan1960. 31 - 01feb1960. 15,000 - 25jan20013.2.4缺失值没有意义的计算结果显示为”.” 如将一个字符型数据和一个数据值型数据相加没有意义,结果输出为“.”. display 2/0另一种情况是,数据中含有缺失值,STATA默认的缺失值也用“.”来表示。在有些数据文件中,缺失值不是用“.”或者空来表示的,而是用-9996等来表示,如果要将其全部替换为“.”,或者反之,将“.”替换为-9996,命令为:. mvencode age,mv(-9996). mv

13、decode age,mv(-9996)3.3数据类型转化任务:将destring1, destring2和tostring中的数据类型进行相互转化*3.3.1字符型转化成数值型:destring*destring数据中的数据全为字符型,转换为数值型webuse destring1, cleardes /*注意到所有的变量存贮类型(storage type)均为字符型str#,其中#号表示字符串长度*/Contains data from http:/www.stata-obs: 10 vars: 5 3 Mar 2005 10:15size: 240 (99.9% of memory fre

14、e) storage display valuevariable name type format label variable label id str3 %9s num str3 %9s code str4 %9s total str5 %9s income str5 %9s sum /因为所有变量为字符型,所以不能进行数值计算gen nincom=incom+10 /因字符不能进行四则运算,不能进行加法运算 *type mismatch /系统提示类型不匹配,因为income为字符型,10为数值型destring, replace /全部转换为数值型,replace表示将原来的变量(值)更新sum /注意到转换为数值型后,可以求五数概略了gen nincom=income*1.3 /转换后,可以运算,工资终于涨了30%!list nincom income*-将字符型数据转换为数值型数据:去掉字符间的空格-

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1